串匹配问题,算法分析与设计答案

格式：doc
大小：143.56 KB
文档页数：8

下载文档原格式

《算法分析与设计》期末复习题[1]

一、选择题1．一个.java文件中可以有（）个public类。

A．一个B．两个C．多个D．零个2．一个算法应该是（）A．程序B．问题求解步骤的描述C．要满足五个基本特性D．A和C3．用计算机无法解决“打印所有素数”的问题，其原因是解决该问题的算法违背了算法特征中的（）A．唯一性B．有穷性C．有0个或多个输入D．有输出4．某校有6位学生参加学生会主席竞选，得票数依次为130，20，98，15，67，3。

若采用冒泡排序算法对其进行排序，则完成第二遍时的结果是（）A．3，15，130，20，98，67B．3，15，20，130，98，67C．3，15，20，67，130，98 D．3，15，20，67，98，1305．下列关于算法的描述，正确的是（）A．一个算法的执行步骤可以是无限的B．一个完整的算法必须有输出C．算法只能用流程图表示D．一个完整的算法至少有一个输入6．Java Application源程序的主类是指包含有（）方法的类。

A、main方法B、toString方法C、init方法D、actionPerfromed方法7．找出满足各位数字之和等于5的所有三位数可采用的算法思路是（）A．分治法B．减治法C．蛮力法D．变治法8．在编写Java Application程序时，若需要使用到标准输入输出语句，必须在程序的开头写上( )语句。

A、import java.awt.* ;B、import java.applet.Applet ;C、import java.io.* ;D、import java.awt.Graphics ;9．计算某球队平均年龄的部分算法流程图如图所示，其中：c用来记录已输入球员的人数，sum用来计算有效数据之和，d用来存储从键盘输入的球员年龄值，输入0时表示输入结束。

图中空白处理框①和②处应填入的是（）A．①sum ←sum + d B．①sum ←sum + c②c ←c + 1②c ←c + 1C．①sum ←sum + d D．①sum ←sum + c②d ←d + 1 ②d ←d + 110．报名参加冬季越野赛跑的某班5位学生的学号是：5，8，11，33，45。

数据结构(C++版)课后答案_(王红梅)第3章_特殊线性表

⑺ 栈和队列的主要区别在于（）。 A 它们的逻辑结构不一样 B 它们的存储结构不一样 C 所包含的运算不一样 D 插入、删除运算的限定不一样【解答】D
⑻ 设数组 S[n]作为两个栈 S1 和 S2 的存储空间，对任何一个栈只有当 S[n]全满时才不能进行进栈操作。为这两个栈分配空间的最佳方案是（）。 A S1 的栈底位置为 0，S2 的栈底位置为 n-1 B S1 的栈底位置为 0，S2 的栈底位置为 n/2 C S1 的栈底位置为 0，S2 的栈底位置为 n D S1 的栈底位置为 0，S2 的栈底位置为 1 【解答】A ⑼ 设有两个串 p 和 q，求 q 在 p 中首次出现的位置的运算称作（）。 A 连接 B 模式匹配 C 求子串 D 求串长【解答】B
⑷ 设计一个判别表达式中左右括号是否配对的算法，采用（）数据结构最佳 A 顺序表 B 栈 C 队列 D 链表【解答】B
⑸ 在解决计算机主机与打印机之间速度不匹配问题时通常设置一个打印缓冲区，该缓冲区应该是一个（）结构。 A 栈 B 队列 C 数组 D 线性表【解答】B
⑹ 一个队列的入队顺序是 1，2，3，4，则队列的输出顺序是（）。 A 4321 B 1234 C 1432 D 3241 【解答】B
5. 举例说明顺序队列的“假溢出”现象。【解答】假设有一个顺序队列，如图 3-6 所示，队尾指针 rear=4，队头指针 front=1，如果再有元素入队，就会产生“上溢”，此时的“上溢”又称为“假溢出”，因为队列并不是真的溢出了，存储队列的数组中还有 2 个存储单元空闲，其下标分别为 0 和 1。
⑷ 对于采用顺序存储结构的串 S，编写一个函数删除其值等于 ch 的所有字符。【解答】从后向前删除值为 ch 的所有元素，这样所有移动的元素中没有值为 ch 的元素，能减少移动元素的次数，提高算法的效率。算法如下：

支持带有通配符的字符串匹配算法

支持带有通配符的字符串匹配算法*运正佳, 李轶男, 杨晓春+【摘要】研究了查询字符串中含有通配符“*”以及“?”两种情况下的字符串匹配问题, 其中,“*”代表任意长度的字符串,“?”代表字母表中任意一个字符。

由于gram索引结构在空间大小以及查询效率上的优势, 将 gram索引结构用于带通配符的字符串匹配问题。

通过将带有通配符的查询字符串分解为若干不含通配符的查询片段, 成功地将带有通配符的复杂查询问题转化为不含通配符的简单精确子串匹配问题。

同时在片段查询过程中运用长度过滤、位置过滤以及计数过滤等方法来提高查询速度。

【期刊名称】计算机科学与探索【年(卷),期】2010(004)011【总页数】12【关键词】通配符;字符串匹配;q-gram索引1 引言传统的字符串匹配问题是在一个字符串集中找到与给定查询相匹配的结果。

与通常意义上的字符串匹配问题不同, 通配符的出现使查询过程变得更加复杂, 同时它更能满足许多应用领域的需求, 如生物序列分析、搜索引擎的文本索引、SQL查询等。

例如, 在对某公司仓库的数据库进行查询时, 若用户想搜索parts 表中所有颜色与green相关的物品, 可以输入SQL语句parts. color like “*green*”(通配符“*”表示任意长度的字符串),那么颜色是dark green、light green、greenish blue等的物品都会被作为结果返回。

带有通配符的字符串查询一般用于查出一系列具有相同组成成分的字符串。

通配符的加入可以方便地提取有相似结构的字符串。

本文主要考虑以下两种常见通配符：(1) “*”通配符：代表任意长度的字符串, 可以是空串。

(2) “?”通配符：代表字母表中的任意一个字母。

目前关于通配符的匹配问题大多都是针对在线数据搜索, 有限的基于索引的查询方法占用的存储空间较大, 而且对于通配符的定义有所限制, 不具有普遍性。

如何利用较小的索引空间来支持高效的查询, 是研究该问题面临的主要挑战。

算法设计与分析-第3章-蛮力法

哨兵
0123456789 k 10 15 24 6 12 35 40 98 55
查找方向
i
清华大学出版社
算法设计与分析
算法3.2——改进的顺序查找
int SeqSearch2(int r[ ], int n, int k) //数组r[1] ~ r[n]存放查找集合 { r[0]=k; i=n; while (r[i]!=k)
清华大学出版社
算法设计与分析
第3章蛮力法
3.1 蛮力法的设计思想 3.2 查找问题中的蛮力法 3.3 排序问题中的蛮力法 3.4 组合问题中的蛮力法 3.5 图问题中的蛮力法 3.6 几何问题中的蛮力法 3.7 实验项目——串匹配问题
清华大学出版社
算法设计与分析
3.1 蛮力法的设计思想
蛮力法的设计思想：直接基于问题的描述。例：计算an
52 37 65 不可行不可行不可行不可行不可行
清华大学出版社
算法设计与分析
对于一个具有n个元素的集合，其子集数量是2n，所以，不论生成子集的算法效率有多高，蛮力法都会导致一个Ω(2n) 的算法。
清华大学出版社
算法设计与分析
3.4.4 任务分配问题
假设有n个任务需要分配给n个人执行，每个任务只分配给一个人，每个人只分配一个任务，且第j个任务分配给第i个人的成本是C[i, j]（1≤i , j≤n），任务分配问题要求找出总成本最小的分配方案。
用蛮力法解决0/1背包问题，需要考虑给定n个物品集合的所有子集，找出所有可能的子集（总重量不超过背包容量的子集），计算每个子集的总价值，然后在他们中找到价值最大的子集。
清华大学出版社
算法设计与分析
10

《数据结构与算法(C++语言版)》第4章_串

串函数与串的类定义
• 常用的常用的C++串函数串函数 • C++的串库（string.h）中提供了许多字符串的操作函数，几个常用的C++字符串函数及其使用方法如下。 •假设已有以下定义语句：
串函数与串的类定义
• （1）串拷贝函数 • char *strcpy(char *s1, const char *s2)，将字符串s2复制到字符串数组s1中，返回s1的值。 • char *strncpy(char *s1, const char *s2, size_tn)将字符串s2中最多n个字符复制到字符串数组s1中，返回s1的值。 • 例如：
串函数与串的类定义
• （3）串比较函数 • int strcmp(const char *s1, const char *s2)，比较字符串s1和字符串s2。函数在s1等于、小于或大于s2时，分别返回0、小于0或者大于0的值。 • int strncmp(const char *s1, const char *s2, size_tn)比较字符串 s1中的n个字符和字符串s2。函数在s1等于、小于或大于s2 时，分别返回0、小于0或者大于0的值。 • 例如：
串模式匹配
• 无回溯的匹配算法 • 在上面介绍的匹配算法中，某趟匹配失败时，下一趟的匹配相当于将子串P后移1位再从头与主串中对应字符进行比较，即相当于i指示器回溯到上趟（最近失败的一趟）匹配的起点的下一个位置，这样，主串中每个字符都要与子串中的第1个字符对应一次，再向后比较。因此，主串中每个字符参加比较的次数最多可达n次（n为子串长度），因此时间复杂度为O(nm)。那么，能否使目标串中每个字符只参加一次比较呢？也就是说，能否不回溯i指示器？回答是肯定的。这个问题是由D.E.Knoth与V.R.Pratt和J.H.Morris同时解决的，所以有的文献也称这种思想的串匹配算法为KMP 算法。

数据结构第4章串

ring s, SString t)
/*若串s和t相等则返回0；若s>t则返回正数；若s<t则返回负数*/
{ int i;
for (i=0;i<s.len&&i<t.len;i++)
if (s.ch[i]!=t.ch[i]) return(s.ch[i] - t.ch[i]);
初始条件 : 串 S 存在 ,1≤pos≤StrLength(S) 且 1≤len≤StrLength(S)-pos+1
操作结果:用Sub返回串S的第pos个字符起长度为len的子串
返回主目录
（11）StrIndex(S,T,pos)
初始条件: 串S和T存在,T是非空串, 1≤pos≤StrLength(S)
return(s.len); }
返回主目录
（7）清空函数
StrClear(SString *s) /*将串s置为空串*/ {
s->len=0; }
返回主目录
（8）连接函数
(1) 连接后串长≤MAXLEN，则直接将B加在A的后面。 (2) 连接后串长>MAXLEN且LA<MAXLEN，则B 会有部分字符被舍弃。 (3) 连接后串长>MAXLEN且LA=MAXLEN，则B 的全部字符被舍弃（不需连接）。
for (i=s->len + t.len-1;i>=t.len + pos;i--)
s->ch[i]=s->ch[i-t.len];
for (i=0;i<t.len;i++) s->ch[i+pos]=t.ch[i];
s->len=s->len+t.len;

全国高校计算机能力挑战赛程序设计赛题库

全国高校计算机能力挑战赛程序设计赛题库近年来，随着计算机科学与技术在各行各业的迅速发展，计算机能力已经成为现代社会不可或缺的一部分。

而在高校中，计算机能力挑战赛已经成为一项受到广泛关注的活动，它不仅能够锻炼学生的计算机编程能力，还能够提升他们的团队合作意识和解决问题的能力。

而在这些计算机能力挑战赛中，程序设计竞赛更是备受重视。

本文将介绍全国高校计算机能力挑战赛程序设计赛题库，并对其进行分析和总结。

一、题库概况全国高校计算机能力挑战赛程序设计赛题库是一个涵盖了多个难度和类型的题目的数据库。

这些题目旨在考察选手在算法设计与实现、数据结构、程序的完整性、调试能力、团队协作等方面的能力。

题库中的题目长度和难度均有所不同，覆盖了从基础知识到高级应用的各种内容。

在题库中，还包括了历年来真实的比赛题目和模拟题目，这些题目经过了严格的筛选和验证，具有一定的权威性和可操作性。

二、题目分类全国高校计算机能力挑战赛程序设计赛题库的题目主要包括以下几个方面的内容：1. 算法思想：涵盖贪心算法、动态规划、分治算法、搜索算法、图论算法等多种算法思想，要求选手根据题目特点选择合适的算法进行实现。

2. 数据结构：包括数组、链表、栈、队列、树、图等多种数据结构的操作和运用，要求选手熟练掌握各种数据结构的特点和操作方法。

3. 程序设计：要求选手能够使用C++、Java、Python等编程语言编写程序，并进行调试和优化。

4. 实战能力：模拟比赛中的真实考察和比赛中可能会遇到的各种情况，要求选手能够在有限的时间内解决各类问题。

5. 创新能力：包含一些较为新颖的题目，要求选手在有限的条件下，发挥创造力，提出新的解决方案。

三、题目特点全国高校计算机能力挑战赛程序设计赛题库的题目具有以下几个特点：1. 难度适中：题库中的题目难度设置合理，既包括了一些基础题目，也包括了一些难度较大的高级题目，满足了不同层次选手的需求。

2. 实用性强：题目的内容贴合实际，涉及到了生活、工作、学习等多个方面，能够培养选手解决实际问题的能力。

数据结构期末考试题及答案

数据结构期末考试题及答案一、选择题（每题2分，共20分）1. 在数据结构中，线性表的顺序存储结构通常使用什么数据结构来实现？A. 链表B. 数组C. 栈D. 队列答案：B2. 以下哪个是二叉树的性质？A. 每个节点最多有两个孩子B. 每个节点最多有三个孩子C. 每个节点最多有四个孩子D. 每个节点最多有五个孩子答案：A3. 在图的遍历算法中，深度优先搜索（DFS）和广度优先搜索（BFS）的区别是什么？A. DFS使用队列，BFS使用栈B. DFS使用栈，BFS使用队列C. DFS和BFS都使用栈D. DFS和BFS都使用队列答案：B...20. 以下哪个排序算法的时间复杂度为O(n^2)？A. 冒泡排序B. 选择排序C. 插入排序D. 所有上述排序算法答案：D二、简答题（每题10分，共30分）1. 简述链表和数组的区别。

答案：链表和数组都是用来存储数据的线性数据结构。

数组是连续的内存空间，可以随机访问，但插入和删除操作效率较低；链表由一系列节点组成，每个节点包含数据部分和指向下一个节点的指针，不支持随机访问，但插入和删除操作较为高效。

2. 什么是递归？请给出一个递归算法的例子。

答案：递归是一种算法设计技术，它允许函数调用自身来解决问题。

递归通常包含基本情况和递归情况。

例如，计算阶乘的递归算法：f(n) = n * f(n-1)，其中基本情况是f(1) = 1。

...三、算法设计题（每题25分，共50分）1. 给定一个整数数组，请设计一个算法找出数组中的第k大元素。

答案：可以采用快速选择算法，类似于快速排序的划分过程，通过随机选择一个元素作为基准，将数组分为两部分，一部分包含比基准大的元素，另一部分包含比基准小的元素。

然后根据k与基准元素的位置关系，决定是继续在左侧子数组还是右侧子数组中进行查找。

2. 描述如何使用哈希表解决字符串匹配问题。

答案：哈希表可以用于实现字符串匹配的KMP算法。

首先，构建模式字符串的前缀函数，该函数用于记录模式字符串中每个位置的最长相同前缀和后缀的长度。

中国计算机应用技术大赛全国算法精英大赛题解

我国计算机应用技术大赛全国算法精英大赛是一项旨在挖掘和培养计算机算法领域人才的赛事，也是我国计算机领域最具权威性和影响力的赛事之一。

本届比赛共吸引了来自全国各地的上千名算法精英参赛，他们在比赛过程中展现出了高超的算法实力和丰富的计算机知识，为整个赛事增添了无限的精彩和激烈竞争。

通过参与本次大赛的比赛内容和过程观察，我们对比赛中的一些典型题目进行了深入分析和解题思路总结。

我们希望通过本文，向广大计算机算法爱好者和参与者们介绍一些本次大赛的精彩题目，并提供一些解题思路和算法分析，帮助大家更好地了解和掌握这些优秀的算法应用。

以下是我们对本次大赛某些典型题目的解题思路总结和分析：1. 题目一：最短路径问题这是一个典型的图论问题，要求在一个有向加权图中求解从起点到终点的最短路径。

常见的解决方法是使用Dijkstra算法或者Floyd算法，通过编程实现对图的遍历和动态规划，找出最短路径的权值和路径节点。

在实际编程过程中，需要考虑如何有效地存储图结构和权值，以及如何高效地搜索和更新最短路径信息。

2. 题目二：动态规划问题动态规划是一类重要的算法设计思想，本次比赛中也出现了相关的动态规划问题。

这类问题通常要求在满足一定约束条件下，求解某种最优解或者最大值。

动态规划算法通过状态转移和递推的方式，逐步逼近最优解。

在解决动态规划问题时，需要注意如何定义状态和状态转移方程，以及如何设计合适的算法逻辑和辅助数据结构，以实现高效的动态规划求解。

3. 题目三：字符串匹配与查找问题字符串匹配与查找是计算机算法领域中一个经典且常见的问题。

在本次比赛中，也出现了相关的字符串匹配和查找题目。

常见的解决方法包括暴力法、KMP算法、Boyer-Moore算法等。

这些方法都在字符串匹配效率、空间复杂度和实际应用场景上有不同的特点和优劣势。

在解决字符串匹配和查找问题时，需要根据具体情况选择合适的方法，并且要考虑相关算法的实现细节和优化技巧。

KMP算法的应用

01求子串在母串中所有出现的位置给定主串S和模式串T，求T串在S串中所有出现的位置，允许不同位置的T串有部分重叠。

例如：S='abababab'，T='abab'，T在S中出现的总次数就是3次（包括1、3、5三个起点位置，虽然S[1..4]与S[3..6]有部分重叠，但这是允许的）。

输入信息包括两行，第一行为S串，第二行为T串；按从小到大的顺序输出所有T串出现的位置。

样例：02求多字符串的最长公共子串（POW）给定n个字符串，求这n个字符串的最长公共子串。

例如给3个字符串：'abcb'、'bca'和'acbc'，则这三个字符串的最长公共子串即为'bc'。

输入第一行为n，下面n行即为这n个字符串。

输出它们的最长公共子串。

样例：03最长回文子串问题顺序和逆序相同的字符串便是回文串（例如‘aba‘）。

求一个字符串所有的子串中最长的回文串便是最长回文子串问题。

输入内容为一个字符串，输出它的最长回文子串。

样例：04 L-Gap子串问题（gap.pas）如果一个字串形如UVU,U非空，且V恰好有L个字符，我们就称这种UVU形式的字串是一个L-Gap串。

例如，abcbabc是1-Gap 字串，xyxyxyxyxy 既可以是一个2-Gap 字串，也可以是一个6-Gap字串,但它不是一个10-Gap字串(因为U 必须非空)。

现在的问题时，给定一个字串s和一个正整数g, 请你在s串中找出所有的g-Gap子串，并输出所有的g-Gap子串总数。

规定s串仅由小写字母组成，且其长度不超过50,000。

输入：Input第一行为一个数字t(1<=t<=10),表示测试点的个数。

以后的t行，每行有一个数字g(1<=g<=10) 和一个字串s。

输出：对于每一组数据，输出该组数据中所包含的g-Gap 子串的数目。

示例：输入：输出：2 71 bbaabaaaaa 15 abxxxxxab[注]L-Gap Substrings标准算法是二分+扩展KMP 或者后缀树我用的是ZhouYuan教我的O(n^2)加常数优化的方法UvU形式, 枚举长度U的长度L , 设数组B,如果S[i] = S[i + g + L],那么B[i]为1 , 否则B[i]为0。

一本通信息学奥赛2059

一本通信息学奥赛2059信息学奥赛是近年来备受关注的一项竞赛活动，它旨在培养学生的信息学素养和创新精神，激发他们对计算机科学的兴趣和热情。

近日，我们看到了一本通信息学奥赛2059的考题，令人过目不忘。

本文将对这些题目进行一一分析，以期帮助大家更好地了解并应对这一挑战。

1.第一道题目是关于二进制数的转换和运算。

题目要求将十进制数转换为二进制数，并进行加法和减法运算。

这是信息学奥赛中常见的知识点，考生需熟练掌握。

2.接下来是关于数学逻辑的问题。

考生需要解答一系列命题的真假性，并进行逻辑运算。

这需要灵活思维和清晰逻辑思维。

3.第三题是关于图论的问题。

考生需要通过邻接矩阵或邻接表表示图，并进行相关运算和分析。

这是信息学奥赛常见的一类题型。

4.第四道题目是动态规划的问题。

考生需要设计一个动态规划算法来解决一个实际问题。

这需要考生对动态规划算法的理解和应用。

5.第五题是关于字符串匹配的问题。

考生需要使用字符串匹配算法来解决一个实际问题。

这需要考生对字符串算法的熟悉和应用。

6.第六题是关于树结构的问题。

考生需要设计一个树的数据结构，并实现相关操作。

这是信息学奥赛的一个常见题型。

7.第七题是关于排序算法的问题。

考生需要设计一个排序算法来解决一个实际问题。

这需要考生对各种排序算法的理解和应用。

8.第八题是关于图像处理的问题。

考生需要设计一个图像处理算法来实现一定的功能。

这需要考生对图像处理的理解和应用。

9.第九题是关于数据库设计的问题。

考生需要设计一个数据库结构，并实现相关的操作。

这是信息学奥赛的一个重要题型。

10.第十题是关于网络编程的问题。

考生需要设计一个简单的网络编程程序，并实现其功能。

这需要考生对网络编程的理解和应用。

11.第十一题是关于算法分析的问题。

考生需要分析一个给定的算法的时间复杂度和空间复杂度。

这需要考生对算法分析的理解和掌握。

12.第十二题是关于线性代数的问题。

考生需要解答一系列关于矩阵和向量的问题。

数据结构教程李春葆课后答案第4章串

失败
i=4 修改 j=4 i=6 修改 j=2 i=6 修改 j=0
i=4 j=nextval[4]=0 i=6 j=nextval[2]=0 i=6 j a a b b a b c a b a a c b a c b a t： abcabaa
失败
s： a b c a a b b a b c a b a a c b a c b a 第 4 趟匹配成功 i=14 从 i=6， j=-1 开始 j=7 t： abcabaa 图 4.2 改进的 KMP 算法模式匹配的过程
返回 14-7=7
（3）从上述匹配过程看出：第 1 趟到第 4 趟的字符比较次数分别是 5、3、1、7，所以总共进行了 16 次字符比较。 7. 有两个顺序串 s1 和 s2，设计一个算法求一个顺序串 s3，该串中的字符是 s1 和 s2 中公共字符（即两个串都包含的字符）。解：扫描 s1，对于当前字符 s1.data[i]，若它在 s2 中出现，则将其加入到串 s3 中。最后返回 s3 串。对应的算法如下：
第4章串 break; i++; } i++; //跳过@字符 while (i<s.length &&flag) { e=s.data[i]; if (!Pop(st,x)) flag=false; if (e!=x) flag=false; i++; } if (!StackEmpty(st)) flag=false; DestroyStack(st); return flag; }
SqString CommChar(SqString s1,SqString s2) { SqString s3; int i,j,k=0; for (i=0;i<s1.length;i++) { for (j=0;j<s2.length;j++) if (s2.data[j]==s1.data[i]) break; if (j<s2.length) //s1.data[i]是公共字符 { s3.data[k]=s1.data[i]; k++; } } s3.length=k; return s3; }

数据结构_字符串操作原理

4.1 串类型的定义

一、串的基本概念

串(String)的定义
s＝“a1a2…an”

其中：
s为串的名字，串的值
ai(1≤i≤n)一般是字母、数学、标点符号等可屏幕显
示的字符。
串的长度n。
4.1 串类型的定义

字符串与一般的线性表的区别：

串的数据元素约束为字符集；
串的基本操作通常针对串的整体或串的一个部分进行。

3.串的某些操作（如：串的连接、串的替换等）受到限制。
4.2.2 堆分配存储表示

特点：

仍用一组连续的存储单元来存放串，但存储空间是在程序执行过程中动态分配而得。利用malloc函数合理预设串长空间。
typedef struct{ char *ch; int length; }HString;

子串和主串

eg:
A＝“This is a string” B＝“is”

特别地：

空串是任意串的子串，任意串是其自身的子串。

串的相等
二、串的抽象数据类型定义
ADT String{
数据对象：D＝{ai|ai∈CharacterSet,i＝1,2,…,n;n≥0}
数据关系：S＝{< ai-1 , ai >| ai-1， ai ∈D, i ＝ 2,…,n} 基本操作： StrAssign(&T,chars) StrLength(S) SubString(&Sub,S,pos,len) StrCopy(&T,S) Index(S,T,pos)

串的结束标志的设置

数据结构答案串学习指导

第5章串5.1 知识点分析1．串的定义串（String）是由零个或多个任意字符组成的有限序列。

一般记作：s=＂a1 a2 …a i…a n＂。

其中s 是串名，用双引号括起来的字符序列为串值，但引号本身并不属于串的内容。

a i（1<=i<=n）是一个任意字符，它称为串的元素，是构成串的基本单位，i是它在整个串中的序号；n为串的长度，表示串中所包含的字符个数。

2．几个术语（1）长度串中字符的个数，称为串的长度。

（2）空串长度为零的字符串称为空串。

（3）空格串由一个或多个连续空格组成的串称为空格串。

（4）串相等两个串相等，是指两个串的长度相等，且每个对应字符都相等。

（5）子串串中任意连续字符组成的子序列称为该串的子串。

（6）主串包含子串的串称为该子串的主串。

（7）模式匹配子串的定位运算又称为串的模式匹配，是一种求子串的第一个字符在主串中序号的运算。

被匹配的主串称为目标串，子串称为模式。

3．串的基本运算（1）求串长：LenStr(s)。

（2）串连接：ConcatStr(s1,s2) 。

（3）求子串：SubStr (s,i,len)。

（4）串比较：EqualStr (s1,s2)。

（5）子串查找：IndexStr (s,t)，找子串t在主串s中首次出现的位置（也称模式匹配）。

（6）串插入：InsStr (s,t,i)。

（7）串删除：DelStr(s,i,len)。

4．串的存储（1）定长顺序存储。

（2）链接存储。

（3）串的堆分配存储。

5.2 典型习题分析【例1】下面关于串的的叙述中，哪一个是不正确的？（）A．串是字符的有限序列B．空串是由空格构成的串C．模式匹配是串的一种重要运算D．串既可以采用顺序存储，也可以采用链式存储分析：空串是不含任何字符的串，即空串的长度是零。

空格串是由空格组成的串，其长度等于空格的个数。

答案为B。

【例2】两个串相等的充分必要条件是( )。

A．两个串长度相等B．两个串有相同字符C．两个串长度相等且有相同字符D．以上结论均不正确分析：根据串相等定义，两个串是相等是指两个串的长度相等且对应字符都相等，故A、B、C均不正确，答案为D。

计算机算法笔试题库及答案

计算机算法笔试题库及答案一、入门篇1. 数据类型和算法基础知识算法的复杂度分析、递归和迭代2. 数组和字符串数组和字符串的基本操作、常见问题及解决方法3. 链表链表数据结构的基本操作、常见问题及解决方法4. 栈和队列栈和队列的基本操作、常见问题及解决方法二、进阶篇5. 树和二叉树树和二叉树的基本操作、常见问题及解决方法6. 图图的基本概念、图的遍历算法和最短路径算法7. 排序和搜索常见排序算法和搜索算法的原理、复杂度分析和应用场景8. 动态规划动态规划算法的基本思想、应用场景和实际问题解决方法三、高级篇9. 贪心算法贪心算法的基本思想、应用场景和实际问题解决方法10. 回溯算法回溯算法的基本原理、应用场景和实际问题解决方法11. 分治算法分治算法的基本思想、应用场景和实际问题解决方法12. 数据结构的优化优化数据结构的存储方式、查询效率和空间复杂度四、应用篇13. 字符串匹配算法字符串匹配算法的原理、复杂度分析和实际应用14. 图像处理算法图像处理算法的基本原理、应用场景和实际问题解决方法15. 数据挖掘算法数据挖掘算法的基本思想、应用场景和实际问题解决方法16. 机器学习算法机器学习算法的基本原理、应用场景和实际问题解决方法五、答案篇在本部分，我们提供了题库中各个算法题目的详细答案解析，包括代码实现、复杂度分析和特殊情况处理等，并附有相应的注释和讲解。

六、总结通过学习本算法题库，读者可以系统地掌握计算机算法中的常见数据结构和经典算法，培养解决实际问题的算法思维能力。

同时，我们提供了丰富的练习题目和详细答案解析，读者可以通过多次练习和思考，逐渐提升算法分析和实现的能力。

总结起来，本算法题库不仅适用于计算机算法的笔试准备，也是学习计算机算法和数据结构的重要参考资料。

希望读者通过学习和实践，能够深入理解算法思想，掌握算法设计和分析的方法，提升解决实际问题的能力。

第4章字符串习题参考答案

第4章串习题参考答案一、基础知识题4.1 简述下列每对术语的区别：空串和空格串；串常量与串变量；主串和子串；串变量的名字和串变量的值；静态分配的顺序串与动态分配的顺序串。

【解答】不含任何字符的串称为空串，其长度为0。

仅含有空格字符的串称为空格串，其长度为串中空格字符的个数。

空格符可用来分割一般的字符，便于人们识别和阅读，但计算串长时应包括这些空格符。

空串在串处理中可作为任意串的子串。

用引号（数据结构教学中通常用单引号，而C语言中用双引号）括起来的字符序列称为串常量，串值可以变化的量称为串变量。

串中任意个连续的字符组成的子序列被称为该串的子串。

包含子串的串又被称为该子串的主串。

子串在主串中第一次出现的第一个字符的位置称子串在主串中的位置。

串变量的与其它变量一样，要用名字引用其值，串变量的名字也是标识符，串变量的值可以修改。

串的存储也有静态存储和动态存储两种。

静态存储指用一维数组，通常一个字符占用一个字节，需要静态定义串的长度，具有顺序存储结构的优缺点。

若需要在程序执行过程中，动态地改变串的长度，则可以利用标准函数malloc()和free()动态地分配或释放存储单元，提高存储资源的利用率。

在C语言中，动态分配和回收的存储单元都来自于一个被称之为“堆”的自由存储区，故该方法可称为堆分配存储。

类型定义如下所示：typedef struct{ char *str;int length;}HString;4.2设有串S=’good’，T=’I︼am︼a︼student’，R=’！’，求：（1）StringConcat(T，R) （2）SubString(T，8，7）（3）StringLength(T) （4）Index(T，’a’)（5）StringInsert(T，8，S)（6）Replace(T，SubString(T，8，7)，’teacher’)【解答】(1) StringConcat(T，R)=’I︼am︼a︼student！’(2) SubString(T，8，7）=’student’(3) StringLength(T)=14(4) Index(T，’a’)=3(5) StringInsert(T，8，S)=’I︼am︼a︼goodstudent’(6) Replace(T，SubString(T，8，7)，’teacher’)= ’I︼am︼a︼teacher’4.3若串S1=‘ABCDEFG’，S2=‘9898’，S3=‘###’，S4=‘012345’，执行concat(replace(S1，substr(S1，length(S2)，length(S3))，S3)，substr(S4，index(S2，‘8’)，length(S2))) 操作的结果是什么？【解答】concat(replace(S1,substr(S1,length(S2),length(S3)),S3),substr(S4，index(S2,‘8’),length(S2))) = concat(replace(S1,substr(S1,4,3),S3),substr(S4,2,4))= concat(replace(S1,’DEF’,S3),’1234’)= concat(‘ABC###G ’,’1234’)= ‘ABC###G1234’4.4 设S 为一个长度为n 的字符串，其中的字符各不相同，则S 中的互异的非平凡子串（非空且不同于S 本身）的个数是多少？【解答】长度为n 的字符串中互异的非平凡子串（非空且不同于S 本身）的个数计算如下：长度为1的子串有n 个，长度为2的子串有n-1个，长度为3的子串有n-2个，……，长度为n-1的子串有2个，长度为n 的子串有1个（按题意要求这个子串就是S 本身，不能计算在总数内）。

数据结构(C语言版)第4-5章习题答案

第4～5章串和数组自测卷答案一、填空题（每空1分，共20分）1. 不包含任何字符（长度为0）的串称为空串；由一个或多个空格（仅由空格符）组成的串称为空白串。

（对应严题集4.1①，简答题：简述空串和空格串的区别）2. 设S=“A;/document/Mary.doc”，则strlen(s)= 20 , “/”的字符定位的位置为3。

4. 子串的定位运算称为串的模式匹配；被匹配的主串称为目标串，子串称为模式。

5. 设目标T=”abccdcdccbaa”，模式P=“cdcc”，则第 6 次匹配成功。

6. 若n为主串长，m为子串长，则串的古典（朴素）匹配算法最坏的情况下需要比较字符的总次数为(n-m+1)*m。

7. 假设有二维数组A6×8，每个元素用相邻的6个字节存储，存储器按字节编址。

已知A的起始存储位置（基地址）为1000，则数组A的体积（存储量）为288 B ；末尾元素A57的第一个字节地址为1282 ；若按行存储时，元素A14的第一个字节地址为(8+4)×6+1000=1072 ；若按列存储时，元素A47的第一个字节地址为(6×7＋4)×6＋1000）＝1276 。

(注：数组是从0行0列还是从1行1列计算起呢？由末单元为A57可知，是从0行0列开始！)8. 〖00年计算机系考研题〗设数组a[1…60, 1…70]的基地址为2048，每个元素占2个存储单元，若以列序为主序顺序存储，则元素a[32,58]的存储地址为8950 。

答：不考虑0行0列，利用列优先公式：LOC(a ij)=LOC(a c1，c2)+[(j-c2)*(d1-c1+1)+i-c1)]*L得：LOC(a32,58)=2048+[(58-1)*(60-1+1)+32-1]]*2＝89509. 三元素组表中的每个结点对应于稀疏矩阵的一个非零元素，它包含有三个数据项，分别表示该元素的行下标、列下标和元素值。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

一、实验内容和目的
1、深刻理解并掌握蛮力算法的设计思想；
2、提高应用蛮力算法设计算法的技能；
3、理解这样一个观点:用蛮力法设计的算法，一般来说，经过适度的努
力后，都可以对算法的第一个版本进行一定程度的改良，改进其时
间性能
BF算法：
基本思想：从主串S的第一个字符开始和模式T的第一个字符进行比
较，若相等，则继续比较两者的后续字符；若不相等，则从主串S
的第二个字符开始和模式T的第一个字符进行比较，重复上述过程，若T中的字符全部比较完毕，则说明本趟匹配成功；若最后一轮匹配
的起始位置是n-m，则主串S中剩下的字符不足够匹配整个模式T，
匹配失败。

这个算法称为朴素的模式匹配算法，简称BF算法。

KMP算法：
1. 在串S和串T中分别设比较的起始下标i和j；
2. 循环直到S中所剩字符长度小于T的长度或T中所有字符均比较
完毕
2.1 如果S[i]=T[j]，则继续比较S和T的下一个字符；否则
2.2 将j向右滑动到next[j]位置，即j=next[j]；
2.3 如果j=0，则将i和j分别加1，准备下一趟比较；
2.4 如果T中所有字符均比较完毕，则返回匹配的起始下标；
否则返回0；
BM算法：
BM算法与KMP算法的主要区别是匹配操作的方向不同。

虽然BM算法
仅把匹配操作的字符比突顺序改为从右向左，但匹配发生失败时，模
式T右移的计算方法却发生了较大的变化。

设计思想：设文本串T，模式串为P。

首先将T与P进行左对齐，然
后进行从右向左比较，若是某趟比较不匹配时，BM算法就采用两条
启发式规则，即坏字符规则和好后缀规则，来计算模式串向右移动的距离，直到整个匹配过程的结束。

b=n
Y
N
Y
N
BF 算法
结束
KMP 算法
结束
a-b →a
b=-1
b 加1
结束
BM算法
二、所用仪器、材料（设备名称、型号、规格等）
Windows 7，Microsoft Visual C++ 6.0
三、实验方法、步骤
1、实现BF算法；
2、实现BF算法的改进算法:KMP算法和BM算法；
3、观察并记录运行结果。

四、实验过程原始记录(数据、图表、计算等)
源程序：
#include "stdio.h"
#include "conio.h"
#include <iostream>
//BF算法
int BF(char s[],char t[])
{
int i;
int a;
int b;
int m,n;
m=strlen(s); //主串长度
n=strlen(t); //子串长度
printf("\n*****BF*****算法\n");
for(i=0;i<m;i++)
{
b=0;
a=i;
while(s[a]==t[b]&&b!=n)
{
a++;
b++;
}
if(b==n)
{
printf("查找成功!!\n\n");
return 0;
}
}
printf("找不到%s\n\n",t);
return 0;
}
//前缀函数值,用于KMP算法
int GETNEXT(char t[],int b)
{
int NEXT[10];
NEXT[0]=-1;
int j,k;
j=0;
k=-1;
while(j<strlen(t))
{
if ((k==-1)||(t[j]==t[k]))
{
j++;
k++;
NEXT[j]=k;
}
else k=NEXT[k];
}
b=NEXT[b];
return b;
}
//KMP算法
int KMP(char s[],char t[])
{
int a=0;
int b=0;
int m,n;
m=strlen(s); //主串长度
n=strlen(t); //子串长度
printf("\n*****KMP算法*****\n");
while(a<=m-n)
{
while(s[a]==t[b]&&b!=n)
{
a++;
b++;
}
if(b==n)
{
printf("查找成功!!\n\n");
return 0;
}
b=GETNEXT(t,b);
a=a-b;
if(b==-1) b++;
}
printf("找不到%s\n\n",t);
return 0;
}
//滑动距离函数,用于BM算法
int DIST(char t[],char c)
{
int i=0,x=1;
int n;
n=strlen(t);
while(x&&i!=n-1)
{
if(t[i]==c)
x=0;
else i++;
}
if(i!=n-1)
n=n-1-i;
return n;
}
//BM算法
int BM(char s[],char t[])
{
int a=0;
int b=0;
int i,j;
printf("\n*****BM算法*****\n");
int z=0;
i=strlen(t)-1;
while(i<=strlen(s)-1)
{
j=strlen(t)-1;
while(j>=0&&s[i]==t[j])
{
j--;
i--;
}
if(j<0)
{
printf("查找成功!!\n\n");
return 0;
}
else
i=i+DIST(t,s[i]);
}
printf("找不到%s\n\n",t);
return 0;
}
void main()
{
char s[]={'\0'}; //主串S
int n=10;
char t[]={'\0'}; //模式T
printf("\n----------串匹配问题----------\n");
printf("\n输入主串S\nS=");
scanf("%s",&s);
printf("\n输入子串T\nT=");
scanf("%s",&t);
printf("主串长%d,子串长为%d\n",strlen(s),strlen(t));
BF(s,t); //BF算法
KMP(s,t); //KMP算法
BM(s,t); //BM算法
}。

串匹配问题,算法分析与设计答案

合集下载

《算法分析与设计》期末复习题[1]

数据结构(C++版)课后答案_(王红梅)第3章_特殊线性表

支持带有通配符的字符串匹配算法

算法设计与分析-第3章-蛮力法

《数据结构与算法(C++语言版)》第4章_串

数据结构第4章串

全国高校计算机能力挑战赛程序设计赛题库

数据结构期末考试题及答案

中国计算机应用技术大赛全国算法精英大赛题解

KMP算法的应用

一本通信息学奥赛2059

数据结构教程李春葆课后答案第4章串

数据结构_字符串操作原理

数据结构答案串学习指导

计算机算法笔试题库及答案

第4章字符串习题参考答案

数据结构(C语言版)第4-5章习题答案

文档推荐

最新文档

串匹配问题,算法分析与设计答案

合集下载

《算法分析与设计》期末复习题[1]

数据结构(C++版)课后答案_(王红梅)第3章_特殊线性表

支持带有通配符的字符串匹配算法

算法设计与分析-第3章-蛮力法

《数据结构与算法(C++语言版)》第4章_串

数据结构第4章 串

全国高校计算机能力挑战赛程序设计赛题库

数据结构期末考试题及答案

中国计算机应用技术大赛全国算法精英大赛题解

KMP算法的应用

一本通信息学奥赛2059

数据结构教程李春葆课后答案第4章串

数据结构_字符串操作原理

数据结构答案串学习指导

计算机算法笔试题库及答案

第4章 字符串 习题参考答案

数据结构(C语言版)第4-5章习题答案

文档推荐

最新文档

数据结构第4章串

第4章字符串习题参考答案