数据结构入门4-2（广义表、例题）

2023-11-23 16:10:50

注

广义表的定义

广义表的存储结构

1. 头尾链表的存储结构

2. 扩展线性链表的存储结构

例题：病毒感染检测

注

本笔记参考：《数据结构（C语言版）（第2版）》

广义表的定义

||| 定义：广义表是线性表的推广，又称列表。

一般地，广义表被记作：

习惯上使用大写字母表示广义表的名称，用小写字母表示原子。

从上述表示可知，在描述一个广义表时又会用到广义表的概念，因此，广义表的定义实际上是一个递归的定义，例如：

广义表	分析
A = ( )	是一个空表，长度为 0 。
B = (e)	有一个原子e，长度为 1 。
C = (a, (b, c, d))	有两个元素，分别为原子a 和子表(b, c, d)，长度为 2 。
D = (A, B, C)	三个元素都是子表，长度为 3 。（在带入子表的值后，有 D = (( ), (e), (a, (b, c, d))) ）
E = (a, E)	是一个递归的表，长度为 2 。（相当于一个无限的广义表 E = (a, (a, (a, ...)))）

由此，可得结论：

广义表是一个多层次的结构，这种结构可以通过图像进行表示（图像来自上述例子）：
广义表可以为其他广义表所共享。例如上图中的 D = (A, B, C) ，此处不必列出子表的值，而仅需引用子表的名称；
广义表可以是一个递归的表，或者是广义表可以是其自身的一个子表。如：E = (a, E) 。

因为本身结构的复杂性，广义表的各种运算较线性表相比要更加困难，在这之中，有两个最重要的运算：

1. GetHead(LS)

作用：取表头；
返回值：非空广义表的第一个元素（一个原子\子表）。

2. GetTail(LS)

作用：取表尾；
返回值：除表头外，由其余元素构成的表（返回值一定是一个广义表）。

例如：

( ) 和 (( )) 的区别

在广义表中，( ) 和 (( )) 是不同的：

( ) ：表示空表，长度为 0 ；
(( )) ：分解可得表头和表尾均为空表( )，长度为 1 。

广义表的存储结构

由于广义表的数据元素更为复杂（原子\子表），使用顺序存储结构较难以表达，所以通常使用的是链式存储结构。常用的链式存储结构有两种：

头尾链表的存储结构；
扩展链表的存储结构。

1. 头尾链表的存储结构

根据广义表的数据元素，可以得出需要的两种结构的节点：

表结点：用以表示广义表；
原子结点：用以表示原子。

通过函数GetTail( )的定义可知：非空广义表可被分解为表头和表尾。由此可知，一对确定的表头和表尾可以唯一确定广义表。

节点的结构如下：

广义表的头尾链表存储形式如下：

#define AtomType int		// AtomType 可自定义
typedef enum
{ATOM,	//ATOM == 0：原子LIST	//LIST == 1：子表
}ElemTag;
typedef struct GLNode
{ElemTag tag;			//公共部分，用于区别原子结点和表结点union					//原子节点和表节点的联合部分{AtomType atom;		// atom 是原子结点的值域struct{struct GLNode* hp, * tp;	// ptr.hp 和 ptr.tp 分别指向表头和表尾}ptr;				// ptr 是表结点的指针域};
}*Glist;					//广义表类型

在上述这种结构的存储中存在如下的几种情况：

【分析】

除空表外（其表头指针为空），对于任何非空广义表，其表头指针均指向一个表结点。该表结点的：
- hp域指向广义表的表头（是一个原子结点/表结点）；
- tp域指向广义表的表尾（当表尾为空时，指针为空；当表尾不为空时，指针指向的必定是一个表结点）。
从上图可知，对于广义表D而言：
- 原子 a 和 e 在同一层，b、c 和 d 则比其低一层；
- B 和 C 是同一层的子表。
最高层的表结点的个数即为广义表的长度。

2. 扩展线性链表的存储结构

在这种结构中，原子结点和表结点类似，均由三个域组成：

这种存储结构可以这样表示：

例题：病毒感染检测

【要求】

给定患者的DNA序列和病毒的DNA序列，要求检测出某种病毒DNA序列是否在患者的DNA序列中出现过。

【注意】

给定的DNA序列都是由一些字母组成的字符串的序列。该问题本质上是一个字符串的模式匹配问题。

ps：病毒的DNA序列是环状的。这意味着其不同于传统的模式匹配算法，需要对传统算法进行改进。

【代码：此处使用BF算法】

下方代码使用string类进行存储操作，也可使用其他类型。

void Virus_detection()
{//利用BF算法实现病毒检测ifstream inFile("病毒感染检测输入数据.txt");	//inFile：负责读取数据ofstream outFile("病毒感染检测输出数据.txt");	//outFile：负责输出数据string ch_Virus;string ch_Person;string Vir;int num = 0;inFile >> num;					//读取待检测的任务数//默认情况下，inFile的读取直到遇到空格才会结束while (num--){inFile >> ch_Virus;ch_Virus = '#' + ch_Virus;	//读取病毒DNA序列，从下标[1]开始存放inFile >> ch_Person;ch_Person = '#' + ch_Person;//读取人的DNA序列Vir = ch_Virus;				//将病毒DNA暂存，以备输出int flag = 0;				//用来标识是否匹配，初始为0，匹配后为非0int m = ch_Virus.length();	//病毒DNA序列的长度为mint j;for (j = 1; j <= m; j++)ch_Virus += ch_Virus[j];		//将病毒字符串的长度扩大到原本的2倍ch_Virus += '\0';int i;for (i = 0; i < m; i++)		//以此取出每一个长度为m的病毒DNA环状字符串{string ch_Temp = "#";	//使用ch_Temp暂时存储for (j = 1; j < m; j++)ch_Temp += ch_Virus[i + j];ch_Temp += '\0';		//添加结束符号flag = Index_BF(ch_Person, ch_Temp, 1);		//进行模式匹配if (flag)				//匹配成功，结束循环break;}if (flag)outFile << Vir << " " << ch_Person << " " << "Yes" << endl;elseoutFile << Vir << " " << ch_Person << " " << "No" << endl;}
}

【分析】

由于病毒的DNA序列是环状的，为了取得这种DNA序列上每串可行的长度准确的字符串，可将存储病毒序列的DNA序列的字符串长度扩大到原本的两倍（即将病毒DNA序列连续存储两次）。
int j;
for (j = 1; j <= m; j++)ch_Virus += ch_Virus[j];		//将病毒字符串的长度扩大到原本的2倍

设人的DNA序列长度为 n ：

对于每一个待检测的任务而言，该算法都需要执行 m 次模式匹配。因此，使用BF算法的时间复杂度为 O(m * n) 。对于每一个待检测的任务，其时间复杂度为 O(m * m * n) 。

如果再算上待检测的任务的数量 num ，可得上述算法的时间复杂度为 O(num * m * m * n) 。

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

上一篇 > 如何使用 Python 构建温度转换器计算器
下一篇 > 计算机公共基础知识病毒,2016计算机专业知识：计算机病毒的结构及分类

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

数据结构入门4-2（广义表、例题）

注

广义表的定义

广义表的存储结构

1. 头尾链表的存储结构

2. 扩展线性链表的存储结构

例题：病毒感染检测

相关文章