일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 크롤링
- DeepLearning
- 주식매매
- 재귀함수
- python
- 알고리즘
- 추천시스템
- 회귀
- 주가예측
- 코딩테스트
- 연습
- 주식연습
- 파이썬
- Linear
- 기초
- 흐름도
- 선형회귀
- 코딩
- Regression
- CLI
- 딥러닝
- 템플릿
- API
- tensorflow
- 주식
- 프로그래머스
- PyTorch
- 가격맞히기
- 게임
- 머신러닝
- Today
- Total
목록머신러닝 (4)
코딩걸음마
1. 데이터 불러오기 사용할 데이터 셋 : TMDB 5000 Movie Dataset https://www.kaggle.com/datasets/tmdb/tmdb-movie-metadata/download?datasetVersionNumber=2 Kaggle: Your Home for Data Science www.kaggle.com import pandas as pd import numpy as np movies_df = pd.read_csv('data/tmdb_5000_movies.csv') print(movies_df.shape) # 행, 열 개수 파악 movies_df.head() (4803, 20) 2. 데이터 확인 결측치 및 dtype확인 movies_df.info() RangeIndex: 48..
단순 선형회귀 분석과 다르게 다중 선형 회귀 분석은 다중공선성을 주의해야 합니다. 다중공선성(Multicollinearity) 이란? - 독립변수들이 강한 선형관계에 있을때 다중 공선성이 있다고 할수 있다. - 종속변수를 설명하기 위한 독립변수가 매우 비슷한 영역을 설명하고 있다. - 다중공선성이 있으면 잘못된 변수의 해석이나 예측의 정확도 하락의 결과를 가져올수 있다. - 독립변수들의 잔차가 강한 상관관계를 갖는경우 아래 코드로 다중공선성을 제거하는 과정을 봅시다. 1. 기초 모듈불러오기 %config InlineBackend.figure_formats = {'png', 'retina'} import numpy as np import pandas as pd import matplotlib as mpl ..
- PCA란 입력 데이터들의 공분산 행렬(covariance matrix)에 대한 고유값 분해 - 기존 데이터의 분포를 최대한 보존하면서 고차원 공간의 데이터들을 저차원 공간으로 변환하는 차원축소기법 중 하나이다. 즉, 데이터의 분산(variance)을 최대한 보존하는 축(서로 직교하는 새 기저)을 찾아 고차원 공간의 데이터를 선형 연관성이 없는 저차원 공간으로 변환하는 기법입니다. - PCA는 기존의 변수를 조합하여 서로 연관성이 없는 새로운 변수, 즉 주성분(principal component)을 만들어낸다. - 예를 들어, PC1, PC2, PC3이 기존 데이터의 분포를 잘 나타내는 순서라고 하자. 이 때, PC1, PC2, PC3이 기존 데이터의 분포를 약 90%(예시)이상 보존한다면 나머지 10..
간단한 아이디어가 갑자기 번뜩 떠올랐다. 기술적분석한 값을 input data로 두고 target으로 미래수익률을 두고 모델을 훈련시키면 좋을거 같은데? 이 간단한 생각을 적용해서 모델을 만들어 봤다. 1. 필요한 모듈 불러오기 # 우선 모듈 설치부터! # !pip install mpl_finance # !pip install matplotlib # !pip install IPython # !pip install datetime # !pip install pandas_datareader # !pip install pykrx # !pip install ta # !pip install --upgrade mplfinance #모듈 불러오기 import matplotlib.pyplot as plt import ..