亲和性分析_0(python数据挖掘入门与实践-实验1)

文章目录

  • 解析
  • 思路
  • 效果
  • 代码

解析

支持度:事件发生的总次数
置信度:一定条件下,事件发生的概率

思路

第一步:
导入数据,并交由变量X维护
创建特征数组
获取特征数量

第二步:
创建字典
valid_rules:(a,b):num_i的含义
表示买商品 a 之后,又买了商品 b 的消费者数量
invalid_rules:(a,b):num_i的含义
表示买商品 a 之后,没有买了商品 b 的消费者数量
nums_occurances:(a):num_i的含义
表示买商品 a 的消费者数量

第三步:
遍历 X 每 i 行
primise表示前提,conclusion表示结论
(X [i] [primise])=(1):表示消费者 i 买features[primise]
(X [i] [primise], X [i] [conclusion])=(1,0):表示消费者 i 买features[primise]之后, 没买了features[conclusion]
(X [i] [primise], X [i] [conclusion])=(1,1):表示消费者 i 买features[primise]之后, 还买了features[conclusion]
若(X [i] [primise])=(1),则nums_occurances(primise)+1
若(X [i] [primise], X [i] [conclusion])=(1,0),则invalid_rules(primise,conclusion)+1
若(X [i] [primise], X [i] [conclusion])=(1,1),则valid_rules(primise,conclusion)+1
遍历完成

第四步:
由valid_rules定义可得
支持度=valid_rules
置信度=(1, 1)发生的次数 / ((1, 1)发生的次数+(1, 0)发生的次数)

效果

请添加图片描述

代码

#库导入
import numpy as np
from collections import defaultdict#导入数据
dataset_filename="D:/Python/Jupyter/Learning-Data-Mining-with-Python-master/Chapter 1/affinity_dataset.txt"
X=np.loadtxt(dataset_filename)
features=['bread','milk','cheese','apple','banana']
nums_feature=len(X[0])#遍历数据
valid_rules=defaultdict(int)
invalid_rules=defaultdict(int)
nums_occurances=defaultdict(int)
for sample in X:for primise in range(nums_feature):if sample[primise]==0: continuenums_occurances[primise]+=1for conclusion in range(nums_feature):if conclusion==primise: continueif sample[conclusion]==1: valid_rules[(primise,conclusion)]+=1else: invalid_rules[(primise,conclusion)]+=1#支持度
support=valid_rules
#置信度
confidence=defaultdict(float)
for primise,conclusion in valid_rules.keys():confidence[(primise,conclusion)]=valid_rules[(primise,conclusion)]/nums_occurances[primise]#结果展示
for primise,conclusion in confidence.keys():print("Rule: If a people buys {0} they will also buy {1}".format(features[primise],features[conclusion]))print("- Support: {0}".format(confidence[(primise,conclusion)]))print("- Confidence: {0}".format(support[(primise,conclusion)]))


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部