통계 기초 계산기
평균, 중앙값, 분산, 표준편차 일괄 계산
데이터 입력
예제 데이터:
쉼표, 공백, 줄바꿈으로 구분하여 숫자를 입력하세요. 모분산/표본분산 모두 계산됩니다.
상세 분석 통계
데이터 분포
통계 지표 해석 가이드
중심 경향
- • 평균: 모든 데이터의 산술적 중심
- • 중앙값: 정렬 시 중간에 위치한 값 (이상치에 강건)
- • 최빈값: 가장 자주 나타나는 값
산포도
- • 표준편차: 데이터가 평균에서 얼마나 퍼져있는지
- • 분산: 표준편차의 제곱
- • 범위: 최댓값 - 최솟값
통계 분석 완벽 가이드 - 기술통계의 모든 것
통계학(Statistics)은 데이터를 수집, 정리, 분석하여 의미 있는 정보를 추출하는 학문입니다. 기술통계(Descriptive Statistics)는 데이터의 중심 경향과 산포도를 파악하는 가장 기본적인 분석 방법으로, 학업 성적 분석, 품질 관리, 시장 조사, 과학 연구 등 다양한 분야에서 활용됩니다.
📖 통계 계산기 사용법
📊 주요 통계량 정의 및 공식
| 통계량 | 정의 | 공식 | 특징 |
|---|---|---|---|
| 평균 (Mean) | 데이터 합 ÷ 개수 | Σx / n | 이상치에 민감 |
| 중앙값 (Median) | 정렬 후 중간값 | x[(n+1)/2] | 이상치에 강건 |
| 최빈값 (Mode) | 가장 많이 나타나는 값 | max(freq) | 범주형 데이터에 유용 |
| 분산 (Variance) | 편차 제곱의 평균 | Σ(x-μ)²/n | 단위: 원단위² |
| 표준편차 (SD) | 분산의 제곱근 | √(Σ(x-μ)²/n) | 원래 단위와 동일 |
| 범위 (Range) | 최댓값 - 최솟값 | max - min | 가장 단순한 산포도 |
🧮 모분산 vs 표본분산
모분산 (Population Variance)
σ² = Σ(x-μ)² / N
전체 모집단 데이터가 있을 때 사용 (분모: N)
표본분산 (Sample Variance)
s² = Σ(x-x̄)² / (n-1)
표본 데이터로 모집단을 추정할 때 사용 (분모: n-1, 베셀의 보정)
💡 통계의 실생활 활용
📚 교육 & 학업
- • 시험 점수: 평균, 표준편차로 성적 분포 분석
- • 등급 산출: 백분위, 표준점수(Z-score)
- • 학급 비교: 반별 평균 점수 비교
🏭 품질 관리 (QC)
- • 6 시그마: 표준편차 기반 불량률 관리
- • 관리도: 공정 이상 탐지
- • Cpk: 공정 능력 지수
💰 금융 & 투자
- • 수익률: 평균 수익률, 변동성(표준편차)
- • 샤프 비율: 위험 대비 수익
- • VaR: 최대 손실 예상액
🔬 과학 연구
- • 실험 결과: 평균 ± 표준오차
- • 신뢰구간: 95% CI
- • p-값: 통계적 유의성
📈 정규분포와 표준편차
정규분포(Normal Distribution)에서 표준편차를 기준으로 데이터가 분포하는 비율:
68.3%
μ ± 1σ 범위
95.4%
μ ± 2σ 범위
99.7%
μ ± 3σ 범위
이를 "경험적 규칙" 또는 "68-95-99.7 규칙"이라고 합니다.
❓ 자주 묻는 질문 (FAQ)
Q. 평균과 중앙값 중 언제 무엇을 사용하나요?
A. 평균은 데이터가 정규분포에 가까울 때, 중앙값은 이상치가 있거나 분포가 치우쳤을 때 더 적합합니다. 예: 소득 분포는 중앙값이 더 대표적입니다.
Q. 표준편차와 분산의 차이는?
A. 분산은 편차 제곱의 평균이고, 표준편차는 분산의 제곱근입니다. 표준편차는 원래 데이터와 같은 단위를 가져 해석이 더 쉽습니다.
Q. 변동계수(CV)는 언제 사용하나요?
A. CV = (표준편차/평균) × 100%로, 서로 다른 단위나 스케일의 데이터 산포도를 비교할 때 사용합니다. 예: 키(cm)와 몸무게(kg)의 변동성 비교
Q. 사분위수(Q1, Q3)와 IQR은 무엇인가요?
A. Q1은 하위 25%, Q3는 상위 25% 경계값입니다. IQR = Q3 - Q1로, 중앙 50% 데이터의 범위를 나타내며 이상치 탐지에 활용됩니다.
⚠️ 통계 해석 시 주의사항
- • 이상치 영향: 평균은 극단값에 크게 영향받습니다. 중앙값과 함께 확인하세요.
- • 표본 대표성: 표본이 모집단을 잘 대표하는지 확인하세요.
- • 상관 ≠ 인과: 두 변수가 상관관계가 있어도 인과관계를 의미하지 않습니다.
- • 표본 크기: 작은 표본에서 계산된 통계량은 변동이 클 수 있습니다.