2024-02-07 넷플릭스 tf-idf 유사도 분석
넷플릭스 csv를 보고 실습을 해봄 1. 필요 라이브러리 import networkx as nx import matplotlib.pyplot as plt import pandas as pd import numpy as np import math as math import time import os from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.metrics.pairwise import linear_kernel from sklearn.cluster import MiniBatchKMeans python 가상 환경 버전은 3.9.18을 사용했다. 2. 데이터 로드 및 정제 import pandas as pd plt.style...
2024.02.07