LFM(转)

2023-09-01 03:46:00

1.说明
在推荐系统中有两种协同过滤的方式。

一种是基于邻域的方式，这种方式又包含了基于用户的和基于物品的，这种方式实现简单，而且效果也是非常的不错，唯一的缺点是对待稀疏矩阵的时候表现乏力。因此诞生了下面的方式。
方式二是基于模型的方式，也就是矩阵分解的方式，这种方式将推荐问题转化为了机器学习问题。
在这里插入图片描述

为了防止overfitting，添加正则项控制过拟合。

_coding:utf-8 _

author = “ricky”

import random
import math

class LFM(object):

def __init__(self, rating_data, F, alpha=0.1, lmbd=0.1, max_iter=500):""":param rating_data: rating_data是[(user,[(item,rate)]]类型:param F: 隐因子个数:param alpha: 学习率:param lmbd: 正则化:param max_iter:最大迭代次数"""self.F = Fself.P = dict()  # R=PQ^T，代码中的Q相当于博客中Q的转置self.Q = dict()self.alpha = alphaself.lmbd = lmbdself.max_iter = max_iterself.rating_data = rating_data'''随机初始化矩阵P和Q'''for user, rates in self.rating_data:self.P[user] = [random.random() / math.sqrt(self.F)for x in range(self.F)]for item, _ in rates:if item not in self.Q:self.Q[item] = [random.random() / math.sqrt(self.F)for x in range(self.F)]def train(self):"""随机梯度下降法训练参数P和Q:return: """for step in range(self.max_iter):for user, rates in self.rating_data:for item, rui in rates:hat_rui = self.predict(user, item)err_ui = rui - hat_ruifor f in range(self.F):self.P[user][f] += self.alpha * (err_ui * self.Q[item][f] - self.lmbd * self.P[user][f])self.Q[item][f] += self.alpha * (err_ui * self.P[user][f] - self.lmbd * self.Q[item][f])self.alpha *= 0.9  # 每次迭代步长要逐步缩小def predict(self, user, item):""":param user::param item::return:预测用户user对物品item的评分"""return sum(self.P[user][f] * self.Q[item][f] for f in range(self.F))

if name == ‘main’:
‘’‘用户有A B C，物品有a b c d’’’
rating_data = list()
rate_A = [(‘a’, 1.0), (‘b’, 1.0)]
rating_data.append((‘A’, rate_A))
rate_B = [(‘b’, 1.0), (‘c’, 1.0)]
rating_data.append((‘B’, rate_B))
rate_C = [(‘c’, 1.0), (‘d’, 1.0)]
rating_data.append((‘C’, rate_C))

lfm = LFM(rating_data, 2)
lfm.train()
for item in ['a', 'b', 'c', 'd']:print(item, lfm.predict('A', item)) # 计算用户A对各个物品的喜好程度

在这里插入图片描述

* coding:utf-8 *

author = “Ricky”

import random
import math

class BiasLFM(object):

def __init__(self, rating_data, F, alpha=0.1, lmbd=0.1, max_iter=500):'''rating_data是list<(user,list<(position,rate)>)>类型'''self.F = Fself.P = dict()self.Q = dict()  # 相当于博客中Q的转置self.bu = dict()self.bi = dict()self.alpha = alphaself.lmbd = lmbdself.max_iter = max_iterself.rating_data = rating_dataself.mu = 0.0'''随机初始化矩阵P和Q'''cnt = 0for user, rates in self.rating_data:self.P[user] = [random.random() / math.sqrt(self.F)for x in range(self.F)]self.bu[user] = 0cnt += len(rates)for item, rate in rates:self.mu += rateif item not in self.Q:self.Q[item] = [random.random() / math.sqrt(self.F)for x in range(self.F)]self.bi[item] = 0self.mu /= cntdef train(self):'''随机梯度下降法训练参数P和Q'''for step in range(self.max_iter):for user, rates in self.rating_data:for item, rui in rates:hat_rui = self.predict(user, item)err_ui = rui - hat_rui# 更新偏置self.bu[user] += self.alpha * (err_ui - self.lmbd * self.bu[user])self.bi[item] += self.alpha * (err_ui - self.lmbd * self.bi[item])for f in range(self.F):# 更新P、Qself.P[user][f] += self.alpha * (err_ui * self.Q[item][f] - self.lmbd * self.P[user][f])self.Q[item][f] += self.alpha * (err_ui * self.P[user][f] - self.lmbd * self.Q[item][f])self.alpha *= 0.9  # 每次迭代步长要逐步缩小def predict(self, user, item):'''预测用户user对物品item的评分'''return sum(self.P[user][f] * self.Q[item][f] for f in range(self.F)) + self.bu[user] + self.bi[item] + self.mu

lfm = BiasLFM(rating_data, 2)
lfm.train()
for item in ['a', 'b', 'c', 'd']:print(item, lfm.predict('A', item))         # 计算用户A对各个物品的喜好程度

在这里插入图片描述

coding:utf-8

author = “ricky”

import random
import math

class SVDPP(object):

def __init__(self, rating_data, F, alpha=0.1, lmbd=0.1, max_iter=500):'''rating_data是list<(user,list<(position,rate)>)>类型'''self.F = Fself.P = dict()self.Q = dict()  # 相当于博客中Q的转置self.Y = dict()self.bu = dict()self.bi = dict()self.alpha = alphaself.lmbd = lmbdself.max_iter = max_iterself.rating_data = rating_dataself.mu = 0.0'''随机初始化矩阵P、Q、Y'''cnt = 0for user, rates in self.rating_data:self.P[user] = [random.random() / math.sqrt(self.F)for x in range(self.F)]self.bu[user] = 0cnt += len(rates)for item, rate in rates:self.mu += rateif item not in self.Q:self.Q[item] = [random.random() / math.sqrt(self.F)for x in range(self.F)]if item not in self.Y:self.Y[item] = [random.random() / math.sqrt(self.F)for x in range(self.F)]self.bi[item] = 0self.mu /= cntdef train(self):'''随机梯度下降法训练参数P和Q'''for step in range(self.max_iter):for user, rates in self.rating_data:z = [0.0 for f in range(self.F)]for item, _ in rates:for f in range(self.F):z[f] += self.Y[item][f]ru = 1.0 / math.sqrt(1.0 * len(rates))s = [0.0 for f in range(self.F)]for item, rui in rates:hat_rui = self.predict(user, item, rates)err_ui = rui - hat_ruiself.bu[user] += self.alpha * (err_ui - self.lmbd * self.bu[user])self.bi[item] += self.alpha * (err_ui - self.lmbd * self.bi[item])for f in range(self.F):s[f] += self.Q[item][f] * err_uiself.P[user][f] += self.alpha * (err_ui * self.Q[item][f] - self.lmbd * self.P[user][f])self.Q[item][f] += self.alpha * (err_ui * (self.P[user][f] + z[f] * ru) - self.lmbd * self.Q[item][f])for item, _ in rates:for f in range(self.F):self.Y[item][f] += self.alpha * (s[f] * ru - self.lmbd * self.Y[item][f])self.alpha *= 0.9  # 每次迭代步长要逐步缩小def predict(self, user, item, ratedItems):'''预测用户user对物品item的评分'''z = [0.0 for f in range(self.F)]for ri, _ in ratedItems:for f in range(self.F):z[f] += self.Y[ri][f]return sum((self.P[user][f] + z[f] / math.sqrt(1.0 * len(ratedItems))) * self.Q[item][f] for f in range(self.F)) + \self.bu[user] + self.bi[item] + self.mu

lfm = SVDPP(rating_data, 2)
lfm.train()
for item in ['a', 'b', 'c', 'd']:print(item, lfm.predict('A', item, rate_A) ) # 计算用户A对各个物品的喜好程度

在这里插入图片描述
//显性反馈模型
val model1 = ALS.train(ratings, rank, numIterations, lambda)
//隐性反馈模型
val model2 = ALS.trainImplicit(ratings, rank, numIterations, lambda, alpha)

在这里插入图片描述

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

LFM(转)

_coding:utf-8 _

* coding:utf-8 *

coding:utf-8

相关文章