1편에서는 S&P 500 및 KOSPI 데이터 수집, 정제, 상관 분석하는 방법을 알아봤습니다.2편에서는 삼성뿐 아니라 다른 기업들 정보를 활용하여 상관 분석을 수행하고, 관련이 있는 기업들을 추출한 후, S&P 500 Index가 올랐을 때 주식을 샀다가 팔면 이득인지 시뮬레이션을 돌려보도록 하겠습니다. 1. 함수 생성기업별로 데이터를 가져와 S&P 500 Index와 상관분석을 수행합니다. 이를 위해 1에서 전처리한 코드들을 함수로 생성하여 사용합니다.# 9. 기업 일별 주식 정보 가져오는 함수def get_company_stock(start_date, end_date, code): df = stock.get_market_ohlcv(start_date, end_date, code, "d") ..
한국은 미국에 영향을 많이 받습니다. 주식에서도 그럴까요? 미국 주식이 떨어지면 한국 주식도 떨어질까요, 아니면 관련이 없을까요. 그 궁금증을 해결하기 위해 다음과 같은 가설을 설정한 후, 분석을 진행해보았습니다. 가설1. S&P 500 index와 한국 KOSPI에 속하는 기업 주식 중 관련이 있는 주식이 존재할 것이다. 위의 가설을 입증하기 위해서 다음과 같은 순서로 분석을 진행하였습니다. 1. 회사 주식 코드 가져오기pykrx 라이브러리를 활용하여 주식 정보를 가져왔습니다. pykrx 는 naver와 krx 등의 도메인에서 주식 데이터를 쉽게 가져오는데 도움이 되는 라이브러리입니다. get_market_ticker_list 함수의 입력 인자로 날짜와 마켓이 있습니다. 리턴값으로 기..
http://www.deeplearningbook.org/contents/intro.html 1.2 Historical Trends in Deep Learning심층 학습의 역사적인 트랜드 It is easiest to understand deep learning with some historical context.몇 가지 역사적인 맥락과 함께 하는 것이 심층 학습을 이해하기 더 쉽습니다. Rather than providing a detailed history of deep learning, we identify a few key trends: 심층 학습에 대한 자세한 역사를 소개하기에 앞서 몇 가지 중요한 트랜드를 확인하겠습니다. - Deep learning has had a long and rich..
http://www.deeplearningbook.org/contents/intro.html 1.1 Who Should Read This Book? This book can be useful for a variety of readers, but we wrote it with two target audiences in mind. 이 책은 다양한 독자들에게 유용할 수 있지만, 우리는 두 청자를 타겟으로 잡고 기술하였습니다. One of these target audiences is university students (undergraduate or graduate) learning about machine learning, including those who are beginning a career in d..
http://www.deeplearningbook.org/contents/intro.html 1. Introduction(소개) Inventors have long dreamed of creating machines that think. 발명가들은 생각하는 기계를 창조해내는 꿈을 오래도록 가져왔습니다. This desire dates back to at least the time of ancient Greece. 이 열망은 적어도 고대 그리스 시대까지 돌아갑니다. The mythical fitures Pygmalion, Daedalus, and Hephaestus may all be interpreted as legendary inventors, and Galatea, Talos, and Pandora ..
http://www.deeplearningbook.org/contents/notation.html Notation(표기법) This section provides a concise reference describing the notation used throughout this book. 이번 섹션에서는 이 책 전반에 걸쳐서 사용되는 표기법을 간결한 레퍼런스로 묘사하여 제공합니다. If you are unfamiliar with any of the corresponding mathematical concepts, we describe most of these ideas in chapters 2-4. 만약에 수학적인 개념들에 대응하는 어떤 것들에 대해 익숙하지 않다면, 챕터 2~4까지에 수학적인 개념들에 ..
http://www.deeplearningbook.org/contents/acknowledgements.html Acknowledgement : 감사의 글 This book would not bave been possible without the contributions of many people. 이 책은 많은 사람들의 공헌 없이는 불가능했을 것입니다. We would like to thank those who commented on our proposal for the book and helped plan its contents and organization : Guillaume Alain, Kyunghyun Cho, Caglar Gulcehre, David Krueger, Hugo Lazvan PA..
http://www.deeplearningbook.org/ 본 프로젝트는 상기에 있는 블로그를 번역하는 것이 목표입니다. 업무에 기계 학습을 활용하고 있지만, 개념적인 부분이 부족하여 이를 보충하고자 시작하였습니다. 영어로 한 문장을 쓰고 한글로 한 문장을 쓰는 방식으로 번역을 진행할 예정이며, 잘 모르거나 부족한 지식은 검색을 통해 보충하고자 합니다. 문장을 직역하기보다는 이해할 수 있게 의역을 시도하려고 하며, 이해가 잘 안되는 내용은 구글 번역기를 사용하여 번역하고자 하였습니다. 순서는 다음과 같습니다. Deep LearningTable of ContentsAcknowledgements (2018-8월 번역 완료)Notation (2018-8월 번역 완료)1 Introduction (2018-8월 ..
스파크는 오라클에서 제공하는 언어(?)라고 합니다.실시간으로 데이터를 병렬처리하는데 유용하다고 알려져 있으며, java, scala, python 세 언어를 활용하여 사용할 수 있습니다. 세 언어 중 파이썬을 활용하여 데이터를 분석해보도록 하겠습니다.그 이유는 파이썬의 장점인 데이터 분석은 살리고 단점인 전처리 속도를 보완하기 위해서입니다. pyspark라는 모듈을 사용하여 python에서 spark를 사용할 수 있습니다. 프로젝트를 진행하면서 배우는게 가장 빠르게 습득할 수 있는거라 판단되어러닝 스파크(번개같이 빠른 데이터 분석)에 나와있는 예제를 보며 진행해보록 하겠습니다. 데이터 분석의 첫 번째 편으로 메일 스팸분류기를 만들어보도록 하겠습니다. #pyspark 불러오기from pyspark impo..
회귀 신경망 스터디의 마지막 글입니다.앞에서 배운 크롤링 + 회귀 신경망을 활용하여 주식 데이터를 가져와서 예측해보는 실습을 하도록하겠습니다.이전 글에서 작성한 코드들을 활용하여 진행하도록 하겠습니다. 1. 주식 데이터를 크롤링하고 분서에 적합한 형태로 변환하기 파이썬_주식데이터를 활용한 회귀 신경망 스터디 2.회귀분석실습(http://cromboltz.tistory.com/22?category=626018) 위의 글에서 3.3까지 진행한 결과를 활용하여 진행하도록 하겠습니다.제대로 따라오셨다면 데이터는 이렇게 되어 있을 것입니다. x(입력 데이터)와 y(예측 데이터)를 결정해줘야합니다.이전 글을 보니 변동폭으로 거래량을 예측했었군요.이번에도 똑같이 진행하도록 하겠습니다. 정규화하기입력 데이터와 예측 데..