티스토리 뷰
오늘 소개해드릴 내용은 기계학습의 가장 기초가 되는 회귀분석입니다.
회귀(regression)는 주로 연속데이터(1,2,3,4...)를 입력데이터로 받아 패턴을 분석한 후,
연속데이터로 예측된 결과값을 출력할 때 주로 사용합니다.
가장 간단한 회귀 분석의 예시로는 키로 몸무게를 예측하는 것입니다.
다음과 같은 표본이 있습니다.
키(cm) |
몸무게(kg) |
170 |
70 |
180 |
80 |
190 |
90 |
이 표본을 바탕으로 키가 185cm인 사람의 몸무게를 예측해보기 위해서는 패턴을 분석해야 합니다.
그러기 위해서는 키를 몸무게로 변환시켜주는 해를 구해야합니다.
식은 다음과 같습니다.
f(x) = y
f(170) = 70
f(180) = 80
f(190) = 90
몸무게를 예측하기 위해 주어진 정보는 키밖에 없으므로 식은 다음과 같습니다.
키 * 몸무게로 변환해주는 해 = 몸무게
170 * w1 = 70
180 * w2 = 80
190 * w3 = 90
식을 풀어보면 w1~3을 구할 수 있습니다.
w |
값 |
w1 |
0.411765 |
w2 |
0.444444 |
w3 |
0.473684 |
키가 185cm인 사람의 몸무게를 예측한다면 w1, w2, w3 중 어느 것을 적용해야 할지 모릅니다.
그래서 활용하는 것이 w1~3의 평균입니다.
(w1 + w2 + w3) / w갯수 = w평균
(0.411765 + 0.444444 + 0.473684) / 3 = 0.443298
185cm인 사람의 키는 다음과 같이 구해집니다.
키 * w = y
185*0.443298 = 82.01013(kg)
가지고 있는 표본의 패턴을 파악하여 185cm인 사람의 몸무게를 예측해본 결과, 약 82kg인 것으로 나타나는 것을 확인하실 수 있습니다.
금일 내용을 요약하면
1. 회귀(regression)는 연속된 데이터를 입력데이터로 받아 패턴을 분석한 후, 연속되는 데이터 형태로 예측 결과를 출력해준다.
2. 새로운 입력 데이터로 예측을 할 경우, 가지고 있는 표본들의 평균 w를 사용한다.
'파이썬' 카테고리의 다른 글
파이썬_주식데이터를 활용한 회귀 신경망 스터디 3.회귀 신경망 코드 (0) | 2018.12.08 |
---|---|
파이썬_주식데이터를 활용한 회귀 신경망 스터디 2.회귀분석실습 (1) | 2018.11.28 |
파이썬_konlpy_kkma(꼬꼬마) 형태소 분석기 사전 튜닝 (2) | 2018.11.18 |
파이썬_데이터_크롤링_위키피디아(wikipedia) (0) | 2018.11.04 |
[기계학습]랜덤 포레스트 (1) | 2018.04.05 |