本文共 1473 字,大约阅读时间需要 4 分钟。
将这个二维的数据简化成一维,并且损失少量的信息。
from sklearn.decomposition import PCAdef pca(): """ 主成分分析进行降维 """ pca = PCA(n_components=0.99) data = pca.fit_transform([[200,8,4,5],[600,3,0,8],[500,4,9,1]]) print(data) return Noneif __name__ == "__main__": pca()
数据如下:
# 去读四张表的数据prior = pd.read_csv("./data/instacart/order_products__prior.csv")products = pd.read_csv("./data/instacart/products.csv")orders = pd.read_csv("./data/instacart/orders.csv")aisles = pd.read_csv("./data/instacart/aisles.csv")# 合并四张表mt = pd.merge(prior, products, on=['product_id', 'product_id'])mt1 = pd.merge(mt, orders, on=['order_id', 'order_id'])mt2 = pd.merge(mt1, aisles, on=['aisle_id', 'aisle_id'])# pd.crosstab 统计用户与物品之间的次数关系(统计次数)cross = pd.crosstab(mt2['user_id'], mt2['aisle'])# PCA进行主成分分析pc = PCA(n_components=0.95)data = pc.fit_transform(cross)
转载地址:http://xsili.baihongyu.com/