ML&DL&AI
-
독립 변수와 종속 변수ML&DL&AI/통계 2024. 6. 12. 14:46
변수(Variable)와 가설(Hypothesis)현실 세계에서는 하나의 변수가 다른 변수에 영향을 미치는 경우가 많다.다음과 같은 가설을 세울 수 있다.ex) 부모의 수입(독립 변수)이 높으면, 자녀의 학업 성적(종속 변수)이 우수할까? 독립 변수(independent Variable)다른 변수에 의하여 양향을 받지 않는 변수종속 변수에 영향을 주는 변수ex) 독립 변수, 설명 변수, 예측 변수 등 종속 변수(Dependent Variable)독립 변수에 영향을 받아 변화하는 변수영향을 받는 변수ex) 종속 변수, 반응 변수, 결과 변수, 표적 변수 등 변수(Variable)와 변량(variate)변수는 독립변수 X를 의미한다.단변수(Univariable)다변수(Multivariable)독립 변수가 1..
-
표준정규분포ML&DL&AI/통계 2024. 6. 12. 14:28
1. 기본개념표준정규분포(Standard Normal Distribution) 평균이 0 이고 분산이 1인 표준화된 정규 분포 확률 변수 X가 X ~N(u, δ²)를 따를때, 다음의 공식으로 표준화를 할 수 있다. 평균이 0이고 분산이 1인 정규 분포, 즉 표준 정규 분포를 따르는 확률 변수 Z의 밀도를 계산하는 함수는 아래와 같다. 2. 표준정규분포(Standard Normal Distribution)누적 분포 함수아래 그래프에서 정규 분포의 누적 분포 함수를 확인할 수 있다. 누적 분포 함수 값 표 입력 정규화(Input Normalization)입력데이터를 정규화하여 학습 속도(training speed)를 개선할 수 있다.입력 데이터가 (1,N) 분포를 따르도록 표준화를 해야 된다.
-
연속확률분포ML&DL&AI/통계 2024. 6. 11. 17:44
1. 기본개념연속확률분포(Continuous Probability Distribution)연속확률변수는 확률 변수 X가 취할 수 있는 값이 무한한 경우를 의미합니다.연속확률분포는 이러한 연속확률변수의 확률 분포를 나타냅니다.연속확률분포에서는 특정한 값 x에 대한 정확한 확률을 구할 수 없습니다.대신, 특정한 구간 a ≤ x ≤ b 에 대한 확률로 표현됩니다. 확률밀도함수(Probability Density Function)연속확률변수가 주어진 구간 내에 포함될 확률을 출력하는 함수 2. 연속확률분포연속확률분포의 성질1. 확률 변수 X가 어떠한 구간에 속할 확률은 0과 1사이이다.2. 확률 변수 X가 값을 가질 수 있는 모든 구간의 확률을 합치면 1이다.> 단, 각 구간은 배반(서로 겹치는 게 없을 때) ..
-
이산확률분포(베르누이, 이항, 포아송)ML&DL&AI/통계 2024. 6. 11. 16:37
1. 기본 개념이산확률분포(Discrete Probability Distribution)확률변수 X가 취할 수 있는 모든 값을 셀 수 있는 경우, 이를 이산확률변수라고 한다.이산환률변수의 확률 분포를 의미 확률질량함수(Probability Mass Function)이산확률변수가 특정한 값을 가질 확률을 출력하는 함수이산 확률 분포를 표현하기 위해 사용하는 확률분포함수로 이해 2. 이산확률분포베르누이 시행(Bernoulli Trial)결과가 두 가지 중 하나로만 나오는 시행을 베르누이 시행이라고 한다.ex) 자격증 시험 > 합격 또는 불합격 동전 던지기 > 앞면 또는 뒷면 합격 또는 꽝만 있는 복권 > 당첨 혹은 꽝 베르누이 확률 변수(Bernoulli Random Variable)베르..
-
확률 변수와 확률 분포ML&DL&AI/통계 2024. 6. 11. 15:10
1. 기본 개념시행(trial)반복할 수 있으며, 매번 결과가 달라질 수 있는 실험ex) 윷을 던지는 행동 사건(event)시행에 따른 결과를 의미ex) 윳의 결과값 도, 개, 걸, 윷, 모 확률(Probability)어떠한 사건이 일어날 가능성을 수로 표현ex) 윷을 던져서 모가 나올 확률1/16 2. 확률 변수확률 변수(Random Variable)사건으로 인해 그 값이 확률적으로 정해지는 변수윷을 던지는 시행을 할때 나오는 결과가 달라 질 수 있다.확률 변수 = 윷의 결과확률 변수는 X라고 표현(확률 변수가 취하는 값은 x) 확률 함수(Probabilty Function)확률 변수에 따라 확률 값을 부여하는 함수확률 함수는 P라고 표현P(X=모) = 1/16- 확률 변수는 함수 일까?표본 공간(s..
-
확률 개요ML&DL&AI/통계 2024. 6. 10. 15:46
1. 확률(Probability)이란특정한 사건이 일어날 가능성을 수로 표현한 것확률은 0(0%)~1(100%) 사이의 실수로 표현 - 확률이 사용되는 예시연락온 전화가 1000통 중 600가 광고 홍보 전화, 400개는 일반적인 전화새로운 전화가 오는 경우 광고 홍보 전화 확률은? 60% - 기계 학습 모델의 확률적으로 이해N개의 학습 데이터로 기계학습 모델을 학습일반적으로 기계학습 모델의 출력은 %확률 2. 경우의 수경우의 수를 계산하는 방법은 순열과 조합이 존재 - 순열(Permutation)서로 다른 n개에서 r개를 중복 없이 뽑아 특정한 순서로 나열하는 것을 의미모든 순열의 수(경우의 수)는 다음의 공식으로 계산순열의 수 공식(N = r일때)nPr = n!순열의 수 공식(N != r일때)nPr..
-
ML - Text Mining 01ML&DL&AI/ML 2023. 9. 17. 13:24
1. 텍스트 마이닝이란 데이터로부터 유용한 인사이트를 발굴하는 Data Mining의 한 종류 정형 및 비정형 데이터를 자연어 처리 방식(Natural Language Processing)과 문서처리 방법을 적용하여 유용한 정보를 추출/가공하는 것을 목적으로 하는 기술 2. 자연언어(Nature language)란? 정보를 전달하는 수단 인간이 일상생활에서 사용하는 언어 특정 집단에서 사용되는 모국어의 집합 (한국어, 영어, 불어, 일본어, 중국어 등) 인공언어에 대응되는 개념 인공언어란 특정한 법칙들에 따라 적절하게 구성된 문자열들의 집합 특정 목적을 위해 인위적, 의도적으로 만든 언어 ex) 에스페란토, 형식언어(수식), 프로그래밍 언어 - 자연어처리 응용 분야 인간의 언어가 사용되는 실세계의 모든 ..
-
ML Linear Model(선형 모델)ML&DL&AI/ML 2023. 9. 3. 14:59
1. Linear Model(선형 모델) 다양한 선형 모델이 존재 회귀 분석은 예측값이 평균과 같이 일정한 값으로 돌아가려는 경향을 이용한 통계학 기법 이용 입력 특성에 대한 선형 함수를 만들어 예측을 수행 분류와 회귀에 모두 사용 가능 2. 선형 모델 예시 7시간 공부 할경우 예상 되는 시험 점수는? y = ax + b 3. 선형 모델 회귀 함수 w : 가중치(weight), 계수(coefficient) b : 절편(intercept), 편향(bias) 모델 w 파라미터 : model.coef_ 모델 b 파라미터 : model.intercept_ 4. 선형모델 MSE 5. 선형모델 MSE 평균제곱 오차 6. 경사하강법