본문 바로가기

5월11일 To-do List 1. Contens based on recommend system design 1.1) 사진기반 분류 가능여부 판단 (v)1.2) 데이터셋 만들기. ( ) 2. Should I build Ontology sets? not yet 3. type of recommend system - User, Contents, Collaborate 4. How can I visualizing this Model? 5. 내가 쓴 글들이나 목록을 통해서 책을 추천해 줄수도 있겠다. 1. Extracting 3 keywords from photo using Goolgle Vision Api 2. Classification Model using Doc2vec model 0) Doc2vec trainnig - 50000 revie.. 더보기
과거 주식 패턴을 이용한 돌팔이 수익률 예측 모델 stockpredict_0501 In [2]: import pandas as pd import numpy as np from pandas import DataFrame from pandas import Series from datetime import datetime import matplotlib.pyplot as plt %matplotlib inline In [3]: def f(x): return datetime.strptime(x,'%Y%m%d') In [4]: path = "{0}-m-00001".format("130960") print(path) try: df = pd.read_table(path,header=None) except Exception : print('no FIle') df = d.. 더보기
1일차_과거데이터 패턴화 / 현재 주식 패턴 찾기 현재 블로그 글은 막 학사를 졸업한 돌팔이 경영학과의 분투기임을 밝힙니다. 어떤 신뢰도와 수익률을 책임지지 않습니다. 1. 패턴의 유사도 개선 -> 과거데이터와 현태 패턴이 유사하다는 기준설정. 1) 상관계수 -> 단순히 증감만을 보면 현재 패턴을 수익률로 만들었기때문에 모양만 비슷하고 부호가 다른 패턴들이 찾아지는 오류가 발생2) 유클리드 유사도 추가 -> 모양뿐만 아니라 절대적 수치의 유사도 추가3) 각 포인트별 모순점 식별 -> 위 두가지 개선에도 불구하고 부호가 다른데 같은 패턴이라고 나온다. 이때 같은 선상의 점들끼리 곱해서 음수(-)가 나오는 포인트가 패턴의 1/3이라면 기각4) 모멤텀 유사도 추가 -> 끝의 모멤텀이 아예 반대면 예측의 정확도가 떨어진다고 판단하여 마지막 기울기에 대한 모멤텀.. 더보기