大数据

大数据告诉你:如何求职数据产品经理?

大数据这么火,想做数据PM?那数据PM如何求职?哪些公司爱招数据PM? 什么样的数据PM符合企业期望?数据PM待遇如何?……凡事预则立,不预则废,本篇先带你了解了解行情。(其实就是爬了拉勾的数据做了个分析,分析过程若有不周之处,还望指正。)一、数据来源拉勾网20170519根据“数据产品经理”关键字可以搜索到的职位。由于拉勾只展示符合搜索条件的前450个职位,为了获得更多的

数据可视化:你想知道的经典图表全在这

如何七周成为数据分析师的第四篇教程,了解写作初衷。Excel的课程告一段落,今天开始第二周的内容,数据可视化阶段。数据可视化是一个热门的概念,是分析师手中的优秀工具。好的可视化是会讲故事的,它向我们揭示了数据背后的规律。大家对可视化的使用认知或许来源于下面这张图。虽然结构清晰,但它只针对Excel图表,不够丰富。本文会结合数据分析师的使用场景展示更多的可视化案例。为方便演示

换个角度认识大数据——主数据认识

说到大数据就不得不说一下主数据,曾经公司在无数个会议上被多次提到,一群参会的吃瓜群众根本不知所云。今天我们就来分享一下我对主数据的理解。什么是主数据? 主数据就是描述企业核心业务实体的数据,比如客户、合作伙伴、员工、产品、物料单、账户等;主数据并不是历史日志数据也不是交易流水记录。一个企业的主数据包含多方面的,从不同方面分析都可以找到大量描述业务数据,例如航线、航班是对于航

我与数据分析不得不说的故事(二)

昨天看我静静地扯犊子,今天看我静静地发些“湿货”。数据分析怎么学?俗话说“台上一分钟,台下十年功”。任何人取得的任何成就都不是一蹴而就的,学习之路更应如此,那么你需要的基本功是什么呢?在我看来,首先你要有兴趣,然后再谈其它,因为兴趣是最好的老师。我假设你有兴趣,并且乐意学习,那么理论上还是有些很大程度上限制不了你的条条框框,诸如你的英文水平,数学水平,认知领悟能力等,不过只

餐饮外卖业为例 - 数据化运营操作指南

摘要: ◆ ◆ ◆ 前言 作为一个一直在数据领域里折腾的码农跨界乱入了餐饮行业,从可视化开发到真枪实弹的用可视化去做业务分析,辅助运营甚至作为公司运营决策的依据,这段经历让我更真切的体会到数据的价值。◆ ◆ ◆ 前言 作为一个一直在数据领域里折腾的码农跨界乱入了餐饮行业,从可视化开发到真枪实弹的用可视化去做业务分析,辅助运营甚至作为公司运营决策的依据,这段经历让我更真切的体

为什么说大数据杀熟是一种误解?

大数据杀熟这个词在2018年出现在我们的视野中,于是乎,很多人开始怀疑自己有没有被杀熟?而大数据真的有杀熟吗?本文主要谈谈为什么说大数据杀熟是一种误解。2018年,一个幽灵,一只名唤“不信任”的幽灵,在互联网世界的上空徘徊,而当它降落到了人间,就从它千百个身相中选出一种告于世人,名曰:  大数据杀熟。2018年2月28日,《科技日报》报道了一位网友自述被大数据“杀熟”的

12亿条出行记录背后的纽约故事

纽约出租车和轿车委员会(简称 TLC)在其网站上公开了纽约整个城市从 2009 年 1 月到 2015 年 12 月、共 12 亿条出租车出行记录(压缩前数据量大约 200GB)。这些数据详细记录了每一趟出租车上下客的时间和地理位置(精确到经纬度)、出行距离、出行费用、支付方式以及司机上报的乘客数量。出租车作为城市发展、社会变迁的见证者,其活动轨迹提供了很好的一扇窗,让我们

地产大数据真相:人口红利消失后的城市博弈

编者按:本篇报告通过互联网大数据,将全国人口流动一一展现,对于房地产行业,及创业者在城市选择有有一定参考意义。1、零和博弈——渐行渐近的城市战争内生性人口红利的趋缓 回顾我国房地产业快速发展的30年,本质是人口红利加速释放的30年,这期间我国总人口净增加了3.24亿,其中15岁至64岁的人口数量保持了12年的连续增长,人口红利的快速释放也加速了城乡的聚集,2014年人口密度

数据为王:从司法案例来看大数据

一、从司法案例来看大数据 互联网基础设施、传感器技术的进步让数据沉淀的速度大大加快,数据成了新的生产资料,给产业发展带来的影响如同20世纪初电力带来的推动。诚然,数据作为生产资料需要立法保障。但囿于立法的滞后,单靠法律也解决不了实际问题 。 前不久就有个实例---2016年6月28日,国家互联网信息办公室发布了《移动互联网应用程序信息服务管理规定》(下称《规定》),明确了什

万字长文全面解析大数据思维的十大原理

一、数据核心原理:从“流程”核心转变为“数据”核心大数据时代,计算模式也发生了转变,从“流程”核心转变为“数据”核心。Hadoop体系的分布式计算框架已经是“数据”为核心的范式。非结构化数据及分析需求,将改变IT系统的升级方式:从简单增量到架构变化。大数据下的新思维——计算模式的转变。例如:IBM将使用以数据为中心的设计,目的是降低在超级计算机之间进行大量数据交换的必要性。