중심경향치(Central tendency,中心傾向値)는 통계학 및 수학에서 자료 데이터 분포의 중심을 보여주는 값으로서 자료 전체를 대표할 수 있는 값을 이르는 말이다. 대푯값이라도 한다. 중앙값만을 가리키지는 않으며 또한 중앙값으로는 중심경향치를 온전히 다룰수없기에 '중심의 집중도'라는 유의미성을 확보하기 위해서 최빈값, 중앙값, 평균 값 등을 주요하게 함께 다룸으로써 자료의 데이터 분포를 전체적인 맥락에서 중심경향성을 살펴보는것이 일반적이다. 한편 상대적인 개념으로 변산성(variability)이 있다.(위키백과)

 

위키백과에 설명은 너무 어렵다. ㅜㅜ 나름대로 쉽게 정리 해 봄

 

@ 대푯값 : 데이터의 특징이나 경향을 나타내는 지표.

  - 평균(mean)/기댓값, 중앙값(median), 최빈값(mode), 최댓값(maximum)/최솟값(minimum) 등이 있음

 

@ 최댓값(maximum)/최솟값(minimum) : 데이터에서 양 끝단에 있는 값

 - (장점) 가장 큰 수, 가장 작은 수를 알면 데이터의 범위를 알 수 있다.

 - (장점) 데이터에서 극단적인 값(벗어난 값)을 알 수 있다.

 - (장점) 데이터에서 이상치가 있는지 알 수 있다.

 - (단점) 데이터의 내용은 알 수 없다.

 - (단점) 데이터에 치우침이나 비틀어짐이 있는경우 적절한 분석이 어렵다.

 

@ 평균(mean) : 데이터가 균일하게 흩어져 있을 때 데이터의 특성을 잘 나타내는 대푯값.

 - 데이터를 전부 더하고 나서 데이터의 개수로 나눔

 - (장점) 데이터를 한마디로 요약할 때 적당

 - (단점) 데이터에 벗어난 값이나 이상치가 있을 시 크게 영향을 받는다. 

 

@ 중앙값(median) : 정렬후 가운데 위치하는 값

 - 데이터의 객수가 홀 수 인 경우 정렬 후 가운데 값, 짝 수 인 경우 가운데 두 값의 평균

 - (장점) 데이터에 치우침이나 외국이 있어도 안정된 결과를 얻을 수 있음

 - (장점) 대폿값으로 평균값을 사용할 수 없을 때 사용

 - (단점) 계산이 번거로움(정렬을 먼저 해야 함,데이터의 개수가 짝수인지 홀수 인지를 고려해아 함)

 - (단점) 데이터의 개수가 짝수일 때와 홀수일 때를 나누어 생각해야 함.

 

@ 최빈값(mode)

 - 데이터 중에서 출현 횟수가 가장 많은 값

 - (장점) 가장 자주 출현하는 값, 데이터가 가장 많은 곳, 가장 많은 데이터가 모이는 곳을 알 수 있음

 - (장점) 범주 데이터에서 사용할 수 있음(Ex. 투표 결과, 음식 주문)

 - (단점) 전체 경향을 알 수 없음.

 

다음 블로그 서비스 중지에 따라
blog.daum.net/fly_blue/ > 내가 잊지 않기 위해 > 수학, 통계학 에서 이동
첫작성 : 2022. 7. 13.

+ Recent posts