数据分析

信用卡欺诈数据的分析-ecel篇

本篇文章为大家提供了数据集分析的思路和步骤,同时也分享了自己的经验。一、背景反欺诈是一项识别服务,是对交易诈骗、网络诈骗、电话诈骗、盗卡盗号等行为的一项风险识别。其核心是通过大数据的收集、分析和处理,建立反欺诈信用评分和反欺诈模型,解决不同场景中的风险问题。国内常见的提供反欺诈服务的公司有:同盾科技,百融金服,众安保险的Xmodel,腾讯的天御借贷反欺诈AF,阿里云的云盾,

一个真实案例教你运用数据分析

数据分析是产品经理必备技能之一,本文以一个真实案例给大家提供了一些数据分析的思路,但还需大家自己多多思考,学以致用。这次我们来聊聊产品经理的必备技能,数据分析,这也是18年我获得的最大收获之一。为什么想单独拿出来聊聊,我归纳为三个原因:第一是重要,不重要的事谁会拿出来说不是;第二是网上的文章理论偏多,实际真实案例少,谁会用一大堆概念和飘在天上的话去工作;第三是对自己的复盘,

搞懂这5个问题前,PM千万别说自己懂数据

注:ACID原则即DB管理系统中的事务所要遵循的四个特性:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability)。原子性是指一个事务是不可再分的,必须作为一个整体完整执行。一致性是指无论事务执行结果如何,执行前后的数据约束规则应保持一致,不能被打破。隔离性是指两个及以上的事务并发执行时不能相互影响。持久性

续:你的 A/B 测试结果真的靠谱吗?

原文再续,书接上回,Z检验醒木拍案,AB组高下立判,但究竟是霄壤之别,还是聊胜一筹,且听本回分解~之前在《 你的A/B测试结果真的靠谱吗? 》一文中,我们分享了如何用假设检验的方法,来确定两组之间的差异是否显著,但两组之间的真实差异有多大,是否和数字表面上的差距一样呢?为此,我们需要了解另一个知识点—置信区间。知识点:置信区间在回顾知识点的时候,大家还是不要慌张,让我们循序

机器学习 | 贝叶斯算法及应用

朴素贝叶斯是基于“特征之间是独立的”这一朴素假设,应用贝叶斯定理的监督学习算法。基于条件概率的贝叶斯定律数学公式 朴素贝叶斯算法定义朴素贝叶斯(Naive Bayes,NB)是基于“特征之间是独立的”这一朴素假设,应用贝叶斯定理的监督学习算法,是一种分类算法;对应给定的样本X的特征向量x1,x2,……,xm;该样本X的类别y的概率可以由贝叶斯公式得到: 区别KNN分类算法

五个方面,聊聊大数据可视化的初体验

数据可视化常常需要通过统计图来展现,不同类型的统计图有着不同的使用场景以及使用方法。距离上一次投稿快9个月了(感谢那些给我评论的人,还有给我赏的人),那时候我刚毕业正在一家医院里工作,后来还是想要做一名产品经理。于是,在去年的中秋节我成功获得了做医疗大数据产品的工作。刚入职的时候心里特别忐忑不安,怕做不好这份工作,现在也会因为想懂而无从下手的各种技术变得焦虑。在这半年的时光

案例拆解:产品 / 运营如何训练自己的数据思维?

每个互联网岗位的JD都有一句话:对数据敏感。什么叫“对数据敏感”?可能做了三年运营,你都没看过关键数据。可能做了三年产品,公司连个数据展示平台都没有。这种情况下,是不是就没法训练自己对数据的敏感了?我们用一个案例,来描述一下,对数据敏感是什么意思,以及如何训练自己的数据思维。请听题:假设你在京东的3C品类部门工作,你发现手机销量在过去三个月中稳步下滑,你该怎么办?划重点:要

7000 字深度总结:运营必备的 15 个数据分析方法

这篇文章来自 GrowingIO 联合创始人 & 运营副总裁陈明先生,全文总结了 15 个运营必备的数据分析方法论。不论是刚刚入行的萌新,还是深耕多年的老司机,这篇深度总结,都值得你再次回顾。提起数据分析,大家往往会联想到一些密密麻麻的数字表格,或是高级的数据建模手法,再或是华丽的数据报表。其实,“ 分析 ”本身是每个人都具备的能力,比如根据股票的走势决定购买还是抛出;依照

数据中台实战(一):以 B2B 电商亿订为例,谈谈产品经理视角下的数据埋点

本文以B2B电商产品“亿订”为实例,与大家一同谈谈数据中台的数据埋点。笔者所在公司为富力环球商品贸易港,是富力集团旗下汇聚原创设计师品牌及时尚买手/采购商两大社群,通过亿订B2B电商、RFSHOWROOM、环贸快版、环贸映像、富运通、富贸通等子品牌为时尚行业提供一站式产业+渠道服务的平台。笔者所在部门为数据中台,职责就是为公司搭建数据中台,支撑各产品线数据化运营,通过数据中

增长模型下的数据体系运用(2):利用 AB 测试选择最优功能

本篇谈一个大家十分熟悉的技术——AB测试。所有有实际产品或运营经验的同学对它都不陌生,然而,在实际运用中却常常存在意识或决策上的明显错误。有四个问题,常常会存在判断上的困难:到底什么要做AB测试?什么不要做?AB测试时,我们应该如何判定什么数据是正确的观察对象?A和B本身只是两个平级的分支,那么如果想要同时测试多个因素,尤其是互相重叠的因素(无法对等分为A、B、C、D测试组