数据库

如何七周成为数据分析师 09:写给新人的数据库指南

本文是《如何七周成为数据分析师》的第九篇教程,如果想要了解写作初衷,可以先行阅读七周指南。温馨提示:如果您已经熟悉数据库,大可不必再看这篇文章,或只挑选部分。我们进入第四周数据库的内容,在数据分析师的职业生涯中,数据库与SQL会是他们性价比最高的技能之一。数据库是逻辑上的概念,它是一堆互相关联的数据,放在物理实体上,是一堆写在磁盘上的文件,文件中有数据。这些最基础的数据组成

一个优秀的运营该如何做好实时数据分析?

数据驱动增长在互联网行业精细化运营的背景下, 数据分析 已成为运营的标配,大家都希望通过精细的分析来提高运营的效率。随着商品秒杀、爆款文章、产品快速迭代等运营手段不断增多,以往小时级的流量监测已经不能满足运营者的需求。我们需要对网站平台上的每一分钟、每一个访客、每一次操作都进行记录,以满足我们实时数据监测和快速决策的需要。 这种分钟级别的数据监测分析,就是我们今天要介绍的数

八宝智能:企业应用场景人工智能 Chatbot 服务平台

八宝智能以人工智能+对话式交互(Chatbot)为核心手段,汇聚企业日常所需的优质数据与服务,在微信、钉钉等各种通讯工具上,为中小企业老板与员工打造简单、便捷而优雅的企业应用场景Chatbot,助力企业降低投入成本,提升工作效率,开启全新的智能商务时代。你所创业的领域,目前现状是什么样?存在哪些痛点?现代企业会使用很多企业应用软件与APP,原本是想使用这些软件提高企业效率,

互联网数据分析能力的养成,需一份七周的提纲

写这个系列,是希望在当初知乎某一个回答的基础上,单独完善出针对互联网产品和运营们的教程。不论对数据分析或数据运营,我都希望它是一篇足够好的教材。更准确地说,这是一份七周的互联网数据分析能力养成提纲。我会按照提纲针对性的增加互联网侧的内容,比如网站分析,用户行为序列等。我也不想留于表面,而是系统性讲述。比如什么是产品埋点?在获得埋点数据后,怎么利用Python / Panda

数据科学家最常用的 10 个算法!

越来越多人加入数据科学这个行列,而数据科学家离不开算法的使用,因此出现数据科学家们最常用的一些算法。今天我们大圣众包(www.dashengzb.cn)小编根据KDnuggets调查,带大家看看这5年时间(2011年-2016年),到底哪10个算法深受数据科学家们的喜爱呢?2016年数据科学家最常使用的十大算法,它们分别是:1. Regression 回归算法2. Clus

环境数据分析和可视化

数据介绍本文基于以下数据进行分析和可视化,山东江苏空气质量数据、全国水质监测数据、全国气象数据、全国风场格点数据、山东污染企业和污染排放数据,希望能够唤醒公众对于公益环保的认识。作品内容我主要做了以下几个方面的统计、分析和可视化:空气质量、水质、污染、风、雨。可视化的工作包括使用python和R绘制静态可视化图片,以及使用D3进行交互可视化。最终成果用一张图来展示我的作品,

战略性情绪分析的5大数据来源

【编者按】每个公司都想知道客户对自身的感受。而情绪分析可以获取更具细粒度的信息,还能用于提高员工的满意度。本文作者为 Andrew C. Oliver,文章系国内 ITOM 管理平台 OneAPM 编译呈现。在世界的某个角落,有人发推特说“这家航空公司太糟糕了!”在过去,这些抱怨就被忽视了。现在,许多航空公司会充满歉意地回应(“对于您的不愉快经历,我们深感抱歉——请发私信给

【推荐】CRM 系统中商业智能(BI)的产生背景

在所有的CRM系统解决方案中,开发出加入人为思考进行的模块与步骤来提供更人性化的操作已经不是什么罕见的事情,随着互联网经济的发展,企业对数据信息运用的要求越来越高,索取的信息量也是越来越大,记录我分析客户和市场的数据已经成了企业在新发展环境主要的竞争手段。CRM系统中商业智能(BI)的产生背景纽带线CRM小编给大家分享CRM软件的商业智能产生背景。1、数据监 测 现象

如何用数据分析,搞定新媒体运营的定位和内容初始化?

最近,很多运营微信公众号、微博或头条号的小伙伴都被这样一个问题困扰着:为啥我新媒体账号有时推送的阅读量很高,有时却是极低,甚至最高值和最低值之间相差达数十倍之多。如此不稳定,这究竟是为什么呢?其实,原因很简单—因为运营者们没有很好地给自己运营的新媒体账号进行定位,也不了解他们的粉丝需要什么样的内容,只知道每天推送内容,而不知道什么样的内容是与我们公众号的自身定位相符的,只要

data pipeline 中充斥着惊人的浪费,只是选择视而不见

越来越多的公司言并称大数据,而大数据管道和存储集群的规模甚至可以是业务集群的一百倍的规模。这里有多少机器是真正在做有价值的事情,而有多少cpu cycle是白白被浪费掉了呢?data pipeline 中充斥着惊人的浪费!只是我们选择视而不见。廉不知耻地把集群规模到了xxx台做为自己的功劳。殊不知机器只是成本,集群规模只说明我们在大量浪费,不说明任何其他问题。以下是我的吐槽