일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- Linear
- 코딩
- 게임
- 선형회귀
- 코딩테스트
- tensorflow
- 딥러닝
- DeepLearning
- 회귀
- 알고리즘
- 템플릿
- 크롤링
- Regression
- CLI
- 재귀함수
- 가격맞히기
- 파이썬
- 추천시스템
- API
- 머신러닝
- 흐름도
- 연습
- 주가예측
- 프로그래머스
- python
- PyTorch
- 주식
- 주식연습
- 주식매매
- 기초
- Today
- Total
목록추천시스템 (7)
코딩걸음마
이웃기반 협업필터링 유사도계산, 아이템기반, 유저기반 -> 유사도; 자카드, 피어슨, 코사인 1. 데이터 불러오기 import os import pandas as pd import numpy as np from math import sqrt from tqdm import tqdm_notebook as tqdm from sklearn.model_selection import train_test_split from sklearn.metrics import mean_squared_error https://movielens.org/ MovieLens About MovieLens | Contact Us | Privacy Policy | Terms of Use version 4.5.3 2021.6.25.166 Al..
이웃기반 알고리즘 K-최근접 이웃(K-Nearest Neighbor, KNN)은 어떤 데이터가 주어지면 그 주변(이웃)의 데이터를 살펴본 뒤 더 많은 데이터가 포함되어 있는 범주로 분류하는 방식입니다. 어떻게 보면 클러스터링 기법과 비슷하지만 여기서 사용되는 KNN은 지도학습이다. CF-KNN은 모델이 아닌 이웃 기반 알고리즘이다. 장/단점 추천 리스트에 새로운 사용자 또는 아이템에 대해 안정적으로 예측이 가능하다. 방법이 간단하고 직관적이어서 접근이 용이하다. 속도가 느리며, 메모리가 많이 든다. 희소성(sparse matrix)으로 인한 제약이 발생한다. (유사한 이웃이 사용한 경험이 없으면 추천 불가능하다) 1. 데이터 불러오기 9천여개 영화에 대해 사용자들(600여명)이 평가한 10만여개 평점 데..
1. 데이터 불러오기 사용할 데이터 셋 : TMDB 5000 Movie Dataset https://www.kaggle.com/datasets/tmdb/tmdb-movie-metadata/download?datasetVersionNumber=2 Kaggle: Your Home for Data Science www.kaggle.com import pandas as pd import numpy as np movies_df = pd.read_csv('data/tmdb_5000_movies.csv') print(movies_df.shape) # 행, 열 개수 파악 movies_df.head() (4803, 20) 2. 데이터 확인 결측치 및 dtype확인 movies_df.info() RangeIndex: 48..