오늘 소개해드릴 내용은 기계학습의 가장 기초가 되는 회귀분석입니다. 회귀(regression)는 주로 연속데이터(1,2,3,4...)를 입력데이터로 받아 패턴을 분석한 후, 연속데이터로 예측된 결과값을 출력할 때 주로 사용합니다. 가장 간단한 회귀 분석의 예시로는 키로 몸무게를 예측하는 것입니다. 다음과 같은 표본이 있습니다. 키(cm) 몸무게(kg) 170 70 180 80 190 90 이 표본을 바탕으로 키가 185cm인 사람의 몸무게를 예측해보기 위해서는 패턴을 분석해야 합니다. 그러기 위해서는 키를 몸무게로 변환시켜주는 해를 구해야합니다.식은 다음과 같습니다. f(x) = yf(170) = 70f(180) = 80f(190) = 90 몸무게를 예측하기 위해 주어진 정보는 키밖에 없으므로 식은 다음..
파이썬으로 한글 자연어를 처리하기 위해서는 java 기반으로 만들어진 형태소 분석기를 사용합니다.konlpy는 자바 기반의 형태소 분석기를 파이썬에서 사용할 수 있게 해주는 아주 고마운 라이브러리입니다. 제공하는 형태소 분석기는 총 5개가 있습니다.1. jhannanum(한나눔) 2. kkma(꼬꼬마)3. komoran(코모란)4. twitter(트위터)5. mecab(메캅) *konlpy 설명 : https://konlpy-ko.readthedocs.io/ko/v0.4.3/ *konlpy 분석기 별 성능 비교 : http://konlpy.org/ko/latest/morph/#comparison-between-pos-tagging-classes 형태소 분석 순서는 다음과 같습니다. 1. 형태소 분석기 호..
python3에서는 'wikipedia' 라이브러리를 제공하고 있습니다.(문서1. https://pypi.org/project/wikipedia/ 문서2. https://pypi.org/project/Wikipedia-API/) 사용방법은 다음과 같습니다. 1. wikipedia 라이브러리를 설치합니다.(cmd -> pip install wikipedia-api) 2. 코드 작성2.1 라이브러리 호출 2.2 접속할 wikipedia 설정2.3 페이지 존재여부 확인2.4 데이터 결과 확인 2.5 데이터 내리기(다운로드) 위의 순서대로 진행해보도록 하겠습니다. 2.1 라이브러리 호출 import wikipediaapi #사용할 api 호출 2.2 접속할 wikipedia 설정 wiki=wikipediaapi..