최근 기계 학습과 관련한 프로젝트를 진행하며 얻게된 지식들을 공유하고자 합니다. 먼저 최근에 사용하고 있는 랜덤 포레스트에 대해서 설명드리고자 합니다. 위키에서 쉽고(?) 자세하게 설명이 되어 있으므로 여기서는 간단히 장단점만 설명하고자 합니다. 위키 url입니다.https://ko.wikipedia.org/wiki/%EB%9E%9C%EB%8D%A4_%ED%8F%AC%EB%A0%88%EC%8A%A4%ED%8A%B8 랜덤 포레스트의 장점은 1. 딥러닝과 비교했을 때 사람이 직관적으로 이해하기 쉽습니다. 딥러닝(심층심경망)의 경우, 결국 컴퓨터에게 알아서 좋은 결과가 나오도록 튜닝해달라고 맡기는 방식이므로, 결과의 accuracy가 높다 하여도 왜 높은지 설명하기가 어렵습니다. 이는 신뢰와 관련되어 있습니다..
w2v은 N 차원의 공간에 단어들을 투사하며 만들어진다. 빔프로젝트가 벽에 이미지를 투사하는 것과 유사하다고 생각하면 된다. 즉, w2v은 N이라는 벽에 단어를 벡터값으로 표현한다고 생각하면 된다.각 단어는 소수로 표현이 되는데 이는 N차원의 공간에 단어들간의 배열관계를 의미한다. 다르면서도 연속적인 어떠한 잠재적인 공간에 단어를 투사하는 방법은 단어가 기본 상태(단어 상태)보다 흥미롭고 다양한 의미를 표현할 수 있는 미적분 특성(벡터)을 가질 것이다라는 생각이 들어있다.w2v 알고리즘의 원리는 아래와 같다. 다음과 같은 문장이 있다고 생각해보자.개가 공원에서 걸으려면 __ 가야한다.빈칸에 '밖으로' 라고 쓸 수 있고, '밖에' 라고 쓸 수도 있다. w2v 알고리즘은 이러한 아이디어에서 나왔다.빈칸을 체..
머피의 법칙 1949년 미국의 항공 엔지니어 에드워드 A. 머피는 항공기 추락에 대비한 안전장치를 개발하고 있던 미 공군의 한 프로젝트에 참여하고 있었다. MX981이라고 불리던 이 프로젝트는 급속함 감속이 일어났을 때의 관성력을 인간이 얼마나 견뎌 낼 수 있는가를 시험하는 것이었다. 이 테스트를 하기 위해서는 고속 로켓 썰매에 탄 사람의 몸에 여러 개의 센서를 부착해야 했다. 머피는 이 일을 조수에게 맡겼다. 센서를 거꾸로 부착할 가능성이 있기는 했지만, 조수가 설마 그런 실수를 하랴 생각햇다. 그런데 정말 그런 일이 벌어졌다. 조수가 모든 센서를 거꾸로 부착하는 바람에 테스트가 실패로 돌아간 것이다. 머피는 화가 나서 조수를 향해 말했다. "저 자식은 실수를 저지를 가능성이 있다 싶은 일을 하면 꼭 ..