-
기초 통계는 무엇일까?ML&DL&AI/기초통계 2023. 8. 3. 10:14728x90
1. 통계란
- 데이터를 요약하는 과정, 데이터를 요약해 만든 정보를 만드는 것을 뛰어넘어 데이터 속에 있는 차이를 확인하고 설명하는 것
- 과거를 담고있는 데이터와 오늘의 우리, 미지의 미래가 소통하는 언어
- 데이터 요약은 큰 틀에서
데이터의 특징을 숫자로 표한하여 그 속에서 차이를 확인하는 것이 중요
- 빅데이터란
디지털 환경에서 생성되는 수치, 문자, 이미지, 영상데이터 모두를 포함하는 대규모 데이터
2. 자료의 종류
- Data : datum(자료, 정보)의 복수형, 통계학은 자료(재료)를 이용해서 정보(요리)를 만들어내는것
- 양적 자료 : 수치로 측정이 가능한 경우
- 이산형 자료 : 수치적인 의미가 있지만, 소수점으로 표현이 불가능한 경우
- ex) 자녀 수 등등
- ex) 자녀 수 등등
- 연속형 자료 : 수치적인 의미가 있지만, 소수점으로 표현이 가능한 경우
- 키, 무게 등등
- 키, 무게 등등
- 이산형 자료 : 수치적인 의미가 있지만, 소수점으로 표현이 불가능한 경우
- 질적 자료 : 수치로 측정이 불가능한 경우
- 명목형 자료 : 범주간 순서가 없으며, 문자로 표현하는 자료
- ex) 혈액형, 직업, 성별 등등
- ex) 혈액형, 직업, 성별 등등
- 순서형 자료 : 범주간 순서가 있으며, 문자로 표현하는 자료, 사칙연산이 불가능
- ex) 선호도, 학점 등등
- 명목형 자료 : 범주간 순서가 없으며, 문자로 표현하는 자료
3. 모집단과 표본 집단의 차이점
- 모집단
- 연구 목적을 달성하기 위해 통계적으로 관찰의 대상이 되는 전체 집단을 의미
- 연구 목적을 달성하기 위해 통계적으로 관찰의 대상이 되는 전체 집단을 의미
- 표본집단
- 모집단의 부분집합
- 연구 목적에 맞게 모집단 중 일부를 선택한 집단
- 모집단을 잘 대표할 수 있는 표본을 선택해야 연구의 목적을 달성 할 수 있다.
728x90'ML&DL&AI > 기초통계' 카테고리의 다른 글
통계의 변수란 (0) 2023.08.03 분산과 사분위수(Quartile) (0) 2023.08.03 분석을 위한 데이터란? (0) 2023.08.03