상관 관계는 둘 이상의 변수(예: 아이스크림 소비 및 범죄) 사이에 관계가 있음을 의미하지만 이 관계가 반드시 원인과 결과를 의미하는 것은 아닙니다. 두 변수가 상관 관계가 있다는 것은 단순히 한 변수가 변경되면 다른 변수도 변경된다는 것을 의미합니다. 상관 계수(correlation coefficient)로 알려진 통계를 계산하여 상관 관계를 측정할 수 있습니다. 상관 계수는 -1에서 +1 사이의 숫자로, 변수 간 관계의 강도와 방향을 나타냅니다. 상관 계수는 일반적으로 문자 r로 표시됩니다.
상관 계수의 숫자 부분은 관계의 강도를 나타냅니다. 숫자가 1에 가까울수록(음수 또는 양수) 변수가 더 밀접하게 관련되어 있으며 다른 변수가 변경될 때 한 변수의 변경 사항을 더 예측 가능하게 만듭니다. 숫자가 0에 가까울수록 관계가 약해지고 변수 간의 관계를 예측하기 어려워집니다. 예를 들어 상관 계수 0.9는 상관 계수 0.3보다 훨씬 더 강한 관계를 나타냅니다. 변수가 서로 전혀 관련되어 있지 않은 경우 상관 계수는 0입니다.
상관 계수의 부호(양수 또는 음수)는 관계의 방향을 나타냅니다. 양의 상관 관계는 변수가 같은 방향으로 이동한다는 것을 의미합니다. 다른 말로하면, 한 변수가 증가하면 다른 변수도 증가하고, 반대로 한 변수가 감소하면 다른 변수도 감소한다는 것을 의미합니다. 음의 상관 관계는 변수가 반대 방향으로 움직인다는 것을 의미합니다. 두 변수가 음의 상관 관계가 있는 경우 한 변수의 감소는 다른 변수의 증가와 연관되며 그 반대의 경우도 마찬가지입니다.
양의 상관 관계의 예로는 개인의 키와 체중 사이의 관계 또는 개인의 나이와 주름 수 사이의 관계가 있습니다. 누군가의 낮 동안의 피곤함과 전날 밤에 잠을 잔 시간 사이에 음의 상관관계가 존재할 것으로 예상할 수 있습니다: 피곤함이 증가함에 따라 수면의 양은 감소합니다. 음의 상관관계의 실제 사례로, 미네소타 대학의 학생 연구자들은 학생들이 5시간 미만의 수면을 취한 주당 평균 일수와 GPA 사이에 약한 음의 상관관계(r = -0.29)를 발견했습니다(Lowry, Dean, & Manders, 2010). 음의 상관 관계는 상관 관계가 없는 것과 같지 않다는 점을 명심하십시오. 예를 들어, 수면 시간과 신발 사이즈 사이에는 상관관계가 없을 것입니다.
상관 관계에는 예측 가치가 있습니다. 당신이 주요 대학의 입학 위원회에 속해 있다고 상상해 보십시오. 당신은 엄청난 수의 지원서에 직면해 있지만 지원자 풀의 작은 비율만 수용할 수 있습니다. 여러분은 누가 입회해야 할지 어떻게 결정할 수 있는가? 현재 학생의 대학 GPA를 SAT 또는 ACT와 같은 표준화된 시험의 점수와 연관시키려고 할 수 있습니다. 현재 학생들에게 가장 강한 상관 관계를 관찰함으로써 이 정보를 사용하여 대학 입학에 지원한 학생들의 상대적 성공을 예측할 수 있습니다.
상관 관계는 인과 관계를 나타내지 않습니다
.상관관계 연구는 두 변수 사이에 존재하는 관계의 강도와 방향을 발견할 수 있게 해주기 때문에 유용합니다. 그러나 상관 관계는 관계의 존재를 확립하는 것이 원인과 결과에 대해 거의 알려주지 않기 때문에 제한적입니다. 변수가 하나가 다른 하나를 일으키기 때문에 변수가 상관되는 경우가 있지만, 세 번째 변수가 실제로 관심 있는 변수의 체계적인 움직임을 일으키고 있을 수도 있습니다. 예를 들어, 부는 지능과 양의 상관관계가 있을 수 있지만, 이는 부유한 사람들이 고등 교육을 받을 수 있고 그로 인해 지능이 증가하기 때문일 가능성이 높습니다.
때때로 연구자들은 관심 있는 행동에 개입하고 조작하는 대신 현상과 더 수동적으로 상호 작용하는 것을 선택할 수 있습니다.
예를 들어, 과학자는 식물성 식단을 섭취하는 것과 수면 사이에 연관성이 있는지 알고 싶어할 수 있습니다. 이 경우, 그녀는 참가자들에게 그날 얼마나 많은 야채를 먹었는지, 그리고 나중에 몇 시간 잤는지 보고하도록 요청하여 두 가지 변수를 정량적으로 측정합니다.
이 설계는 상관 관계 연구로 알려져 있으며, 두 변수 사이에 관계가 존재하는지 여부를 조사합니다.
두 가지 일련의 측정값을 모두 수집한 후 연구자는 각 단위(이 경우 각 사람)에 대한 데이터를 각 축에 배치된 변수(일일 채소 섭취량 및 수면량)와 함께 그래프(산점도)에 시각화할 수 있습니다.
통계적으로 상관 관계는 일반적으로 r로 표시되는 상관 계수(-1에서 1 사이의 숫자로 연결의 방향, 부호 및 전체 강도, 점이 얼마나 밀접하게 정렬되는지를 나타냄)를 계산하여 결정됩니다.
여기서 상관 관계는 양수일 수 있으며, 이는 두 변수가 같은 방향으로 움직인다는 것을 의미합니다. 즉, 채소를 거의 섭취하지 않은 사람들은 잠을 덜 잤고, 더 많이 먹은 다른 사람들은 더 많이 잤습니다.
또한 상관 관계는 1에 가까운 값으로 강할 수 있으며, 이는 데이터 포인트가 개인 간에 거의 예외를 제외하고 선형으로 클러스터링됨을 나타냅니다.
연관에 더 많은 예외가 있는 경우, 데이터 포인트가 분산됨에 따라 선형 패턴이 사라질 수 있습니다: 절대값은 0에 가까워지고, 상관 관계는 약한 것으로 간주되어 존재하지 않는 것으로 간주됩니다.
이제 두 변수가 서로 반대 방향으로 이동하면 상관 관계는 음수로 간주됩니다. 즉, 사람들이 채소를 많이 먹을수록 잠을 덜 잤고 그 반대의 경우도 마찬가지였습니다. 강도는 산란이 다소 선형이라는 점을 감안할 때 상대적으로 강합니다.
중요한 것은 상관 관계가 인과 관계를 의미하지 않는다는 것입니다! 연구자들은 한 변수의 변화가 다른 변수의 변화를 어떻게 일으키는지 결정하기 위해 관찰 결과를 추적해야 합니다.
Related Videos
Research Methods
59.1K views
Research Methods
11.6K views
Research Methods
15.3K views
Research Methods
14.7K views
Research Methods
15.9K views
Research Methods
11.8K views
Research Methods
11.1K views
Research Methods
8.9K views
Research Methods
13.0K views
Research Methods
6.1K views
Research Methods
10.6K views
Research Methods
22.9K views
Research Methods
32.2K views
Research Methods
10.8K views
Research Methods
12.6K views
Research Methods
6.3K views
Research Methods
15.9K views
Research Methods
22.2K views
Research Methods
20.1K views