一份全面的“数据需求分析”是怎样的?

笔者结合自己的案例,以独到的见解说明了一份全面的数据需求分析应该包括:数据描述、逻辑描述、数据词典、数据采集。

针对数据需求分析模块,我有自己的见解和分析方式。在这里拿一段以前所做的案例分享给大家,写得不好,其中也有很多欠缺之处,愿朋友们看过之后能够给出很好的批评,咱们在这里相互学习、共同进步!

一、数据描述

1.1 数据来源及流向示意图

平台数据的来源及流向关系示意见图1.1。从图中可见,平台中的数据来源主要分为了内部和外部两个大部分。

1.2 内部数据

内部数据包括项目现场的业务数据、自动化监控数据和项目知识库。
业务数据来源于项目过程管理,包括项目的筹划信息、进度数据、质量数据、安全数据、施工风险数据、供应商数据等。
自动化监控数据来源于项目智能监控设备,包括设备监控数据、施工监测数据、安全讲评台数据、用电监控数据、人员出入及定位数据、环境监测数据、视频监控数据等。
知识库初始来源于集团现有经验和知识的梳理,并在项目过程中不断补充和完善。

1.3 外部数据

外部数据包括来自既有信息系统的工程基本信息和专题信息,以及通过离线方式导入的地理信息数据及其他数据。
以上数据均在平台数据标准的约束下进入数据中心,通过中心数据库与应用系统形成数据交换,并在此基础上开发标准化数据接口,将数据共享给其他需要的外部系统。

二、逻辑描述

对数据进行逻辑描述时可把数据分为表态数据和动态数据两种。
进行描述时应把各数据元素逻辑地分成若干组,例如函数、源数据或对于其应用更为恰当的逻辑分组。给出每一数据元的名称(包括缩写和代码)、定义(或物理意义)度量单位、值域、格式和类型等有关信息。

2.1 表态(静态)数据

表态数据就是所谓的静态数据,指在运行过程中主要作为参考的数据,它们在很长的一段时间内不会变化,一般不随运行而改变。
列出所有作为控制或参考用的静态数据元素如下表所示:

2.2 内部生成数据

列出向用户或开发单位中的维护调试人员提供的内部生成数据。

2.3 动态数据

所谓动态数据,包括所有在运行中要不断或者在特定的条件下而发生变化的数据,以及在运行中要输入、输出的数据。
2.3.1 输入数据

2.3.2 输出数据

三、数据词典

对平台中所出现的各个实体的属性进行整理,使其形成数据词典,以此可以来作为后继研发过程中数据结构设计、数据库设计、数据库表结构设计的主要参考来源;并说明对数据要求的制约。逐条列出对进一步扩充或使用方面的考虑而提出的对数据要求的限制(容 量、文卷、记录和数据元的个数的最大值)。对于在设计和开发中确定是临界性的限制更要明确指出。

3.1 功能模块

表名(表名:英文名)
在这里,我用一张表来展示数据字典:

四、数据采集

4.1 要求和范围

按数据元的逻辑分组来说明数据采集的要求和范围,指明数据的采集方法,说明数据采集工作的承担者是用户还是开发者。
具体的内容包括:
输入数据的来源,例如是单个操作员、数据输入站,专业的数据输入公司或它们的一个分组。
数据输入(指把数据输入处理系统内部)所用的媒体和硬设备。如果只有指定的输入点的输入才是合法的,则必须对此加以说明。
接受者说明输出数据的接受者。
输出数据的形式和设备列出输出数据的形式和硬设备。无论接受者将接收到的数据是打印输出,还是CRT上的一组字符、一帧图形,或一声警铃,或向开关线圈提供的一个电脉冲,或常用介质如磁盘、磁带、穿孔卡片等,均应具体说明。
数据值的范围给出每一个数据元的合法值的范围。
量纲给出数字的度量单位、增量的步长、零点的定标等。在数据是非数字量的情况下,要给出每一种合法值的形式和含意。
更新和处理的频度给出预定的对输入数据的更新和处理的频度。如果数据的输入是随机的,应给出更新处理的频度的平均值,或变化情况的某种其他度量。

4.2 数据采集对象列表

4.3 输入的承担者

4.4 预处理

4.5 数据结构与程序的关系

五、结语

由于各方面的原因,这个案例只能展示一部分的内容,但都是重要的一些点,并没有缩水,朋友们可以放心浏览。
另外请路过的朋友们多多支持哈,笔者在这里先谢谢了,以后会有更多优质的文章在这个平台上进行发布,请尽请期待呦!
 
作者 @卧枕江山 。

关键字:数据分析

版权声明

本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部