关于大数据的概述

开源大数据技术基础

引言

我认为分享知识是一件幸福的事情。

大数据概念

大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程

大数据发展史

时间阶段
1887-2008大数据出现
2009-2012大数据热门
2013大数据元年
2017-2022大数据爆发

大数据特征

  • Volume
  • Variety
  • Value
  • Velocity

大数据结构

项目描述
结构化数据关系模型数据
半结构化数据非关系模型的、有基本固定结构模式的数据,例如日志文件、XML文档、JSON文档、Email等
非结构化数据没有固定模式的数据,如WORD、PDF、PPT、EXL,各种格式的图片、视频等

大数据处理流程

  1. 数据挖掘
  2. 数据清洗
  3. 数据分析
  4. 数据可视化


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部