统计学习方法第十五章作业：SVD矩阵分解代码实现及其在推荐的应用和矩阵压缩意义

2023-06-26 16:52:23

SVD矩阵分解

import numpy as npclass SVD:def __init__(self,x):self.x = np.array(x)def get_r_rv(self,x):x = np.array(x)s_matrix = x.T.dot(x)r_list, r_v = np.linalg.eig(s_matrix)return r_list,r_vdef get_matrix_rank(self):return np.linalg.matrix_rank(self.x)def get_V_M(self,x):r_list, r_v = self.get_r_rv(x)index_rank = np.argsort(-r_list)r_list = r_list[index_rank]r_list_ = r_list[r_list > 0]r_max = len(r_list_)V = r_v[:,index_rank]m = np.zeros((r_max,r_max))U = np.zeros((self.x.shape[0],r_max))for i in range(r_max):m[i][i] = np.sqrt(r_list_[i])U[:,i] = (np.dot(self.x, V[:, i]) / np.sqrt(r_list_[i])).TV = V[:, :r_max]return V,m,Udef svd(self,way='norm',k=None):V,m,U= self.get_V_M(self.x)if way == 'norm':return V,m,Uif way == 'truncated':r = self.get_matrix_rank()if k < r and k > 0:return V[:, :k], m[:k, :k], U[:, :k]else:return V, m, Udef main():x = np.array([[0,20,5,0,0],[10,0,0,3,0],[0,0,0,0,1],[0,0,0,1,0]])svd = SVD(x)V, m, U = svd.svd()print(V)print(m)print(U)x = np.array([[0,20,5,0,0],[10,0,0,3,0],[0,0,0,0,1],[0,0,0,1,0]])svd = SVD(x)V, m, U = svd.svd(way='truncated',k=2)print(V)print(m)print(U)if __name__ == '__main__':main()#------result--------------
[[ 0.          0.95709203  0.          0.28978415][ 0.9701425   0.          0.          0.        ][ 0.24253563  0.          0.          0.        ][ 0.          0.28978415  0.         -0.95709203][ 0.          0.          1.          0.        ]][[20.61552813  0.          0.          0.        ][ 0.         10.44429362  0.          0.        ][ 0.          0.          1.          0.        ][ 0.          0.          0.          0.95746064]][[ 1.          0.          0.          0.        ][ 0.          0.99961501  0.          0.02774569][ 0.          0.          1.          0.        ][ 0.          0.02774569  0.         -0.99961501]][[0.         0.95709203][0.9701425  0.        ][0.24253563 0.        ][0.         0.28978415][0.         0.        ]][[20.61552813  0.        ][ 0.         10.44429362]][[1.         0.        ][0.         0.99961501][0.         0.        ][0.         0.02774569]]

结果解释

所分解的矩阵是各个消费者对各个网页的URL点击次数
[[0,20,5,0,0],
[10,0,0,3,0],
[0,0,0,0,1],
[0,0,0,1,0]]

分解结果：
V:
[[ 0. 0.95709203 0. 0.28978415]
[ 0.9701425 0. 0. 0. ]
[ 0.24253563 0. 0. 0. ]
[ 0. 0.28978415 0. -0.95709203]
[ 0. 0. 1. 0. ]]
可以视作各个URL在不同特征维度上的特征值（4个维度）
如URL1的第二个特征较强，URL2的第一个特征较强

U：
[[ 1. 0. 0. 0. ]
[ 0. 0.99961501 0. 0.02774569]
[ 0. 0. 1. 0. ]
[ 0. 0.02774569 0. -0.99961501]]
可以看作用户对URL各个特征维度的偏好
如果用户1对特征1强的URL更加喜欢因此查询V表发现URL2的特征1维度强
可以解释用户1对URL2的点击高达20次之多
同理用户2对特征2偏好较强，查询V表发现URL1的特征2较强，
可以解释用户2对URL1的点击高达10次之多

m:
[[20.61552813 0. 0. 0. ]
[ 0. 10.44429362 0. 0. ]
[ 0. 0. 1. 0. ]
[ 0. 0. 0. 0.95746064]]
可以视作各个URL特征的决定性作用或重要性，可以发现URL的前两个特征的重要性明显高于其他两个特征
因此我们对SVD分解结果进行截断得到结果：
V:
[[0. 0.95709203]
[0.9701425 0. ]
[0.24253563 0. ]
[0. 0.28978415]
[0. 0. ]]

U:
[[1. 0. ]
[0. 0.99961501]
[0. 0. ]
[0. 0.02774569]]
仅通过V，U两个矩阵我们就可以获得原用户点击URL矩阵的绝大多数信息，具有较强的解释性。这也是SVD矩阵分解的压缩的性质。

但至于URL的各个特征具体是指什么，这里无法体现，仅能表示用户偏好与URL属性之间的关系，可以用于推荐算法。

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

统计学习方法第十五章作业：SVD矩阵分解 代码实现 及其在推荐的应用和矩阵压缩意义

SVD矩阵分解

结果解释

相关文章

统计学习方法第十五章作业：SVD矩阵分解代码实现及其在推荐的应用和矩阵压缩意义