목록분류 전체보기 (64)
코딩걸음마
단순 선형회귀 분석과 다르게 다중 선형 회귀 분석은 다중공선성을 주의해야 합니다. 다중공선성(Multicollinearity) 이란? - 독립변수들이 강한 선형관계에 있을때 다중 공선성이 있다고 할수 있다. - 종속변수를 설명하기 위한 독립변수가 매우 비슷한 영역을 설명하고 있다. - 다중공선성이 있으면 잘못된 변수의 해석이나 예측의 정확도 하락의 결과를 가져올수 있다. - 독립변수들의 잔차가 강한 상관관계를 갖는경우 아래 코드로 다중공선성을 제거하는 과정을 봅시다. 1. 기초 모듈불러오기 %config InlineBackend.figure_formats = {'png', 'retina'} import numpy as np import pandas as pd import matplotlib as mpl ..
- PCA란 입력 데이터들의 공분산 행렬(covariance matrix)에 대한 고유값 분해 - 기존 데이터의 분포를 최대한 보존하면서 고차원 공간의 데이터들을 저차원 공간으로 변환하는 차원축소기법 중 하나이다. 즉, 데이터의 분산(variance)을 최대한 보존하는 축(서로 직교하는 새 기저)을 찾아 고차원 공간의 데이터를 선형 연관성이 없는 저차원 공간으로 변환하는 기법입니다. - PCA는 기존의 변수를 조합하여 서로 연관성이 없는 새로운 변수, 즉 주성분(principal component)을 만들어낸다. - 예를 들어, PC1, PC2, PC3이 기존 데이터의 분포를 잘 나타내는 순서라고 하자. 이 때, PC1, PC2, PC3이 기존 데이터의 분포를 약 90%(예시)이상 보존한다면 나머지 10..
플레이어가 주식 매매를 마치면 봇이 매수매도를 결정하고 주가가 변동됩니다. 실행시키면 호가장 처럼 생긴 DataFrame이 나오는데 호가창이라고 생각하고 한번 해보시면 됩니다. 모든 매매는 시장가 매매로 처리됩니다. import random import time import pandas as pd def cur_Price_list(board_start): return Price_list[board_start:board_start + 10] def cur_bid_ask_price(board_start): return bid_ask_price_list[board_start:board_start + 10] def Ai_buy(a): #매수 봇 global status global cur_bid_ask_pric..
pykrx에는 특정기간동안 가격등락률을 조회하는 기능이 있다. 리스트를 모두 조회하여 상승률이 가장 높은 종목을 추출해보자! def top_rank(start,end,market,number): from pykrx import stock stock_info_kospi = stock.get_market_price_change_by_ticker(fromdate=start, todate=end, market=market) i=0 top_list=[] while i