중심경향치(Central tendency,中心傾向値)는 통계학 및 수학에서 자료 데이터 분포의 중심을 보여주는 값으로서 자료 전체를 대표할 수 있는 값을 이르는 말이다. 대푯값이라도 한다. 중앙값만을 가리키지는 않으며 또한 중앙값으로는 중심경향치를 온전히 다룰수없기에 '중심의 집중도'라는 유의미성을 확보하기 위해서 최빈값, 중앙값, 평균 값 등을 주요하게 함께 다룸으로써 자료의 데이터 분포를 전체적인 맥락에서 중심경향성을 살펴보는것이 일반적이다. 한편 상대적인 개념으로 변산성(variability)이 있다.(위키백과)
위키백과에 설명은 너무 어렵다. ㅜㅜ 나름대로 쉽게 정리 해 봄
@ 대푯값 : 데이터의 특징이나 경향을 나타내는 지표.
- 평균(mean)/기댓값, 중앙값(median), 최빈값(mode), 최댓값(maximum)/최솟값(minimum) 등이 있음
@ 최댓값(maximum)/최솟값(minimum) : 데이터에서 양 끝단에 있는 값
- (장점) 가장 큰 수, 가장 작은 수를 알면 데이터의 범위를 알 수 있다.
- (장점) 데이터에서 극단적인 값(벗어난 값)을 알 수 있다.
- (장점) 데이터에서 이상치가 있는지 알 수 있다.
- (단점) 데이터의 내용은 알 수 없다.
- (단점) 데이터에 치우침이나 비틀어짐이 있는경우 적절한 분석이 어렵다.
@ 평균(mean) : 데이터가 균일하게 흩어져 있을 때 데이터의 특성을 잘 나타내는 대푯값.
- 데이터를 전부 더하고 나서 데이터의 개수로 나눔
- (장점) 데이터를 한마디로 요약할 때 적당
- (단점) 데이터에 벗어난 값이나 이상치가 있을 시 크게 영향을 받는다.
@ 중앙값(median) : 정렬후 가운데 위치하는 값
- 데이터의 객수가 홀 수 인 경우 정렬 후 가운데 값, 짝 수 인 경우 가운데 두 값의 평균
- (장점) 데이터에 치우침이나 외국이 있어도 안정된 결과를 얻을 수 있음
- (장점) 대폿값으로 평균값을 사용할 수 없을 때 사용
- (단점) 계산이 번거로움(정렬을 먼저 해야 함,데이터의 개수가 짝수인지 홀수 인지를 고려해아 함)
- (단점) 데이터의 개수가 짝수일 때와 홀수일 때를 나누어 생각해야 함.
@ 최빈값(mode)
- 데이터 중에서 출현 횟수가 가장 많은 값
- (장점) 가장 자주 출현하는 값, 데이터가 가장 많은 곳, 가장 많은 데이터가 모이는 곳을 알 수 있음
- (장점) 범주 데이터에서 사용할 수 있음(Ex. 투표 결과, 음식 주문)
- (단점) 전체 경향을 알 수 없음.
다음 블로그 서비스 중지에 따라
blog.daum.net/fly_blue/ > 내가 잊지 않기 위해 > 수학, 통계학 에서 이동
첫작성 : 2022. 7. 13.
'지식의 서고' 카테고리의 다른 글
[Book] 부자나라 임금님의 성공 독서전략 (0) | 2022.07.19 |
---|---|
[Book] 직장을 위한 전략적 책 읽기 - 목차 (0) | 2022.07.19 |
항상 좋은 이미지 감사 해요 ^^ (0) | 2022.07.19 |
[Book] 첫 통계 with 베이즈_0_읽기 시작하며 (0) | 2022.07.18 |
웹표준 교과서 (0) | 2011.01.03 |