ac自动机和有限状态

格式：doc
大小：79.00 KB
文档页数：14

下载文档原格式

ac自动机相关的题

ac自动机相关的题
（实用版）
目录
1.AC 自动机的基本概念
2.AC 自动机的工作原理
3.AC 自动机的应用领域
4.AC 自动机的发展前景
正文
一、AC 自动机的基本概念
AC 自动机，全称为 Autoregressive Combinatorial 自动机，即自
回归组合自动机，是一种用于生成具有特定统计特性的字符串的计算模型。

AC 自动机由一个确定有限自动机和一个寄存器组成，能够接受输入字符
串并输出相应的字符串。

它广泛应用于自然语言处理、图像处理、数据压缩等领域。

二、AC 自动机的工作原理
AC 自动机的工作原理可以分为两个主要部分：确定有限自动机和寄
存器。

确定有限自动机负责接受输入字符串，并根据预先定义的规则输出对应的字符串。

寄存器则用于存储自动机当前的状态，以便在处理下一个输入时能够正确地更新输出。

三、AC 自动机的应用领域
1.自然语言处理：AC 自动机在自然语言处理领域有着广泛的应用，
例如在文本生成、机器翻译、情感分析等方面发挥着重要作用。

2.图像处理：AC 自动机可以用于图像的压缩和特征提取，从而在图
像识别、目标检测等任务中提高性能。

3.数据压缩：AC 自动机可以学习数据中的统计特性，并用于压缩和解压缩数据，提高数据传输和存储的效率。

四、AC 自动机的发展前景
随着人工智能、大数据等领域的快速发展，AC 自动机的应用前景十分广阔。

《有限状态自动机》课件

首先需要确定有限状态自动机的状态数量，这是实现自动机
的基础。
设计状态转移图
根据需求，设计状态转移图，确定各个状态之间的转移关系。
编写代码实现
根据状态转移图，使用编程语言编写代码实现有限状态自动机。
测试与调试
对实现的有限状态自动机进行测试和调试，确保其正确性和
稳定性。
有限状态自动机的应用场景
02
它由一组状态、一组输入符号和一个转换函数组成，根据输入符号的刺激，在有限个状态之间进行转换。
03
有限状态自动机可以用于描述和分析各种复杂系统的行为，如计算机硬件、电路、程序等。
有限状态自动机的分类
确定有限状态自动机（Deterministic Finite State Machine, DFSM）：在确定有限状态自动机中，对于任何输入符号，都只有一个状态转换。
01
文本处理
用于识别和提取文本中的特定模式和信息。
模式匹配
用于在大量数据中快速查找和匹配特定模式。
03
02
语法分析
在编译器和解释器设计中，用于识别和解析语法结构。
人工智能
用于构建智能系统和机器人的行为模型。
04
有限状态自动机在现实生活中的应用案例
01
02
03
交通信号控制
用于控制交通信号灯的自动切换，保障交通安全和顺畅。
故障诊断
用于识别和诊断机械设备或电子设备的故障模式。
语音识别
用于识别和分类语音信号，实现语音控制和交互。
05
总结与展望
有限状态自动机的优缺点
高效性
有限状态自动机在处理离散事件或模式匹配时非常高效。
简洁性

AC多模匹配算法

记s为状态机的当前状态，a为输入文本y的当前输入字符。树型有限自动机的一次操作循环可以定义如下： 1. 如果g(s, a) = s，，那么树型有限自动机将做一个转向动作。自动机进入状态s，而且y的下一个字符变成当前的输入字符。另外，如果output( s，)不为空，那么状态机将输出与当前输入字符位置相对应的一组关键字。 2. 如果g(s, a) = fail，状态机将询问失效函数f并且进行失效转移。如果 f(s) = s，，那么状态机将以s，作为当前状态，a为当前输入字符重复这个操作循环。
1、一种针对网络流式文本数据的匹配算法 2、改进的中文串多模式匹配算法 3、Snort入侵检测系统
О AC和QS结合的反向自动机
o 王永成等人受FW92（一种融合了BM的自动机算法），提出的相类似的结合QS的反向自动机多模式匹配算法，而且是针对纯中文的处理算法。
О Wu.Sum和Udi.manber的agrep
o 92年台湾学者吴升发明的agrep是多模式中最位著名的快速匹配算法之一，对处理大规模的多关键字匹配问题有很好的效果。
算法3：树型有限状态机。输入：一个字符串y={y1y2y3…yn}（其中yi是一个输入字符）；一台包含上述转向函数g，失效函数f和输出函数output的树型有限自动机。输出：关键字在y中出现的位置。
图5 建立树型有限自动机的算法伪代码
5. AC自动机预处理阶段：转向函数把一个由状态和输入字符组成的二元组映射成另一个状态或者一条失败消息。失效函数把一个状态映射成另一个状态。当转向函数报告失效时，失效函数就会被询问。输出状态，它们表示已经有一组关键字被发现。输出函数通过把一组关键字集（可能是空集）和每个状态相联系的方法，使得这种输出状态的概念形式化。搜索查找阶段：文本扫描开始时，初始状态置为状态机的当前状态，而输入文本y的首字符作为当前输入字符。然后，树型有限自动机通过对每个文本串的字符都做一次操作循环的方式来处理文本。

有限状态自动机

正则表达式
有限状态自动机是正则表达式处理的基础，用于匹配字符串中的特定模式。
05
有限状态自动机的优缺点
优点
简单易理解
有限状态自动机是一种简单直观的模型，其结构和行为都可以很容易地理解和描述。
01
高效处理
由于其有限的状态集合，有限状态自动机在处理某些类型的问题时非常高效。
02
03
可预测性
有限状态自动机的行为是确定性的，也就是说，给定相同的输入，有限状态自动机将始终产生相同的结果。
研究方向
并发有限状态自动机
研究并发有限状态自动机的理论、性质和算法，以及它们在并发系统中的
应用。
模糊有限状态自动机
研究模糊有限状态自动机的理论、性质和算法，以及它们在模糊系统和模
糊控制中的应用。
概率有限状态自动机
研究概率有限状态自动机的理论、性质和算法，以及它们在随机系统和不确定性处理中的应用。
03 FPGA实现
使用现场可编程门阵列（FPGA）实现有限状态自动机，通过配置逻辑门实现状态转移。
软件实现
01 编程语言实现
使用高级编程语言（如Python、Java、C）编写有限状态自动机的程序，通过编程语言语法实现状态转移。
02 脚本语言实现
使用脚本语言（如Shell脚本、Python脚本）编写有限状态自动机的程序，通过脚本语言执行状态转移。
缺点
适用范围有限
01
有限状态自动机在处理复杂问题时可能会遇到困难，因为这些
问题可能需要无限的或连续的状态。
缺乏灵活性
02
由于其有限的状态集合，有限状态自动机在处理某些问题时可
能不够灵活。
无法处理非确定性问题

有限状态自动机

25
自动机的应用
• 使用如上图所示的自动机，选择状态图上任意的路径并记录得到的单词，便可以构造合法的句子
• 同样，这个自动机也可以用来由识别用户输入的句子，检查其是否符合特定的“模式”
• 试着自己设计一个能造句的FSA，并让其他人使用你的FSA来造句
26
识别美元的自动机
27
识别派生词的自动机
• Google这样的搜索引擎公司也正是基于这一点，依靠“爬虫”（crawling）在网页链接间的探索，为我们提供索引信息
44
谷歌的PageRank算法
n
PR(a) q (1 q)
PR( pi )
i1 C( pi )
A
B
C
D
E
F
15% probability of a random jump
7
寻宝游戏
• 现在我们换一张有7座岛屿的地图，你的目标是找到从海盗岛到金银岛的路线
• 唯一的问题是，地图上并没有标出箭头，你需要自己去探索旅行的路线
• 为了达成这个目标，你可以问每座岛上的A 船或B船各驶向哪里
• 后面我们将具体解释如何进行这个游戏，从而了解自动机的构造形式
8
岛屿地图
9
寻宝游戏
17
自动机的表示
• 如果某个输入的序列（例如BBAB），能够从初始状态，经过状态转移之后，到达“终结状态”，则说明这一输入是“可接受的” （acceptable）
• 在我们的例子中，“可接受”表示这是一条正确的寻宝路线（并不一定是最短最好的），在其他自动机的应用中，接受状态可能有更具体的含义，如检查输入是否构成有效的命令序列
• 请将以下形式的卡片对折，让没有目的地信息的一面向上，这样你只能在到达某个岛屿之后，才能“询问”岛屿的每艘船的目的地——只需将卡片翻过来即可

形式语言06章有限状态自动机和有限状态语言

有限状态自动机还可以分成确定与非确定两种。非确定有限状态自动机可以转化为确定有限状态自动机。
有限状态自动机识别的语言是正则语言 RL。
有限状态自动机除了它在理论上的价值，还在数字电路设计、词法分析、文本编辑器程序等领域得到了应用。
6.1 有限状态自动机
有穷状态自动机是具有离散输入和输出的系统的一种数学模型。其主要特点有以下几个方面：
定义6-4 有限状态自动机接收的语言的定义
对于字母表∑上的有限状态自动机M，它能识别的所有串的集合，称为自动机M能识别的语言。记为L(M)。
定义6-5 扩展的状态转换函数的定义
给定FSAM，定义扩展的状态转换函数 δ*：Q×∑*→Q为：δ*（q，w）=q′
即自动机在一个状态q时，扫描串w后到达唯一确定的状态q′。
因此，对于任何输入串，有限状态自动机的任务就是要检查该输入串中是否存在子串000，一旦发现输入串包含有000，则表示输入串是个合法的句子（是属于语言中的一个串），因此，在确认输入串包含 000后，就可以逐一地读入输入串的后面的字符，并接收该输入串。
问题的关键是如何发现子串000。
由于字符是逐一读入的，当从输入串中读入一个0时，它就有可能是000子串的第1个0，就需要记住这个0；如果紧接着读入的是字符1，则刚才读入的0就不是子串000的第1个0，此时，需要重新寻找000子串的第1个0；
FSAM′=（Q，∑，δ，q0，Q-F），所以L2也是 FSL语言（右线性语言）。证毕。
注意：此时的FSAM1的δ函数的个数 = |Q| * |∑|；即
需要陷阱状态。
6.3 有限状态自动机识别语言的例子
例6-12 接收语言L={ab}的有限状态自动机

多模匹配算法

输出“ ”是和状态7相关联的输出“his”是和状态相关联的
添加第四个关键字“hers”，可以得到：添加第四个关键字“ ，可以得到：
输出“ 相关联。输出“hers”和状态相关联。 ”和状态9相关联在这里，我们能够使用已有的两条边：一条是从状态到在这里，我们能够使用已有的两条边：一条是从状态0到 1标记着的边；一条是从状态到2标记着的边。标记着h的边标记着e的边标记着的边；一条是从状态1到标记着的边。
输出“she”和状态相关联。输出“ 和状态5相关联。和状态相关联
增加第三个关键字“ ” 我们得到了下面这个图。增加第三个关键字“his”，我们得到了下面这个图。注意到当我们增加关键字“ ” 已经存在一条从状态0到意到当我们增加关键字“his”时，已经存在一条从状态到状态1标记着的边了，所以我们不必另外添加一条同样的边。标记着h的边了状态标记着的边了，所以我们不必另外添加一条同样的边。
举个例子，利用图1 举个例子，记树型有限自动机为状态机M。状态机M利用图1的函数去处理输入文本“ushers”，图4显示了M在处理文本串函数去处理输入文本“ 时产生的状态转移情况。时产生的状态转移情况。
图4 扫描“ushers”时的状态转换序列
考虑M在状态，且当前输入字符为e时的操作循环由于g(4, 时的操作循环。考虑在状态4，且当前输入字符为时的操作循环。由于在状态 e) = 5，状态机进入状态，文本指针将前进到下一个输入字，状态机进入状态5，并且输出output(5)。这个输出表明状态机已经发现输入符，并且输出。文本的第四个位置是“ 出现的结束位置。文本的第四个位置是“she”和“he”出现的结束位置。在状态和出现的结束位置 5上输入字符，状态机M在此次操作循环中将产生两次状态转上输入字符r，状态机在此次操作循环中将产生两次状态转上输入字符由于g(5, r) = fail，M进入状态 = f(5)。然后因为进入状态2 移。由于，进入状态。然后因为g(2, r) = 8，M进入状态，同时前进到下一个输入字符。在这次操作进入状态8，同时前进到下一个输入字符。，进入状态循环中没有输出产生。循环中没有输出产生。

有限状态机原理

有限状态机原理
有限状态机原理是一种计算模型，它包含一组有限个状态及其之间的转移规则。

它可以被用来描述不同对象或者系统在不同状态下的行为和变化。

有限状态机由三个主要部分组成：状态集合、转移规则和起始状态。

状态集合是有限的，每个状态代表系统的一个特定状态。

转移规则定义了状态之间的转移条件，根据当前的输入确定下一个状态。

起始状态是系统的初始状态，从这个状态开始执行转移规则。

有限状态机可以描述不同的行为和变化情况，通过根据输入选择对应的转移规则来改变状态。

在执行过程中，有限状态机会根据输入和当前状态确定下一个状态，并在转移后更新当前状态。

有限状态机可以根据实际需求进行设计和实现，可以是确定性的（每个输入对应唯一的转移规则）或者非确定性的（一个输入可以对应多个转移规则）。

有限状态机广泛应用于各个领域，例如计算机科学、计算机网络、自动化控制等。

它可以用于设计和实现各种系统和算法，如编译器、路由器、电梯控制和游戏引擎等。

总之，有限状态机原理是一种描述对象或系统不同状态和行为变化的模型，通过状态集合、转移规则和起始状态来描述系统的行为。

它在计算机科学和其他领域有着广泛的应用。

自动机原理

自动机原理
自动机原理是计算机科学中的一个重要概念，它是指一种能够自动执行特定任务的机器或程序。

自动机原理在计算机科学中有着广泛的应用，包括编译器、操作系统、网络协议等领域。

自动机原理的核心概念是状态和转移。

一个自动机可以被看作是一个状态集合和一组状态之间的转移函数。

在自动机中，每个状态代表着一个特定的状态，而转移函数则描述了在不同状态之间的转移规则。

自动机可以分为有限状态自动机和无限状态自动机两种类型。

有限状态自动机是指状态集合有限的自动机，它们通常用于处理有限的输入序列。

无限状态自动机则是指状态集合无限的自动机，它们通常用于处理无限的输入序列。

在自动机原理中，还有一个重要的概念是确定性自动机和非确定性自动机。

确定性自动机是指在任何给定的状态下，只有一种可能的转移方式。

而非确定性自动机则是指在某些状态下，有多种可能的转移方式。

非确定性自动机通常比确定性自动机更加灵活，但也更加复杂。

自动机原理在计算机科学中有着广泛的应用。

例如，在编译器中，自动机可以用来识别语法错误和生成语法树。

在操作系统中，自动机可以用来管理进程和资源。

在网络协议中，自动机可以用来处理
数据包和建立连接。

自动机原理是计算机科学中的一个重要概念，它可以帮助我们理解计算机系统中的各种自动化过程。

通过深入研究自动机原理，我们可以更好地设计和实现计算机系统，提高计算机系统的效率和可靠性。

有限自动机理论章有限状态自动机

考虑状态转换函数和产生式旳等价作用:
将状态转换函数改造为产生式
等价思绪
状态转换函数和产生式旳等价作用
δ(q, a)=q′
A→aB
接受a
产生a
状态变化
非终止符号变化
结论:DFA状态等价于文法非终止符
状态转换函数等价于产生式
构造文法旳基本思绪：
将旳DFA旳状态看成是RLG旳非终止符(开始状态就是开始符号)
对于某个句子： DFA经过状态旳变化，逐渐（自左向右）接受句子旳每个字母； RLG经过非终止符号旳变化，逐渐（自左向右）产生句子旳每个字母。
思索
DFA旳接受状态旳作用
证明
假设L是字母表∑上旳FSL，则 L=L(DFA)
DFA=（Q，∑，δ，q0，F）构造右线性文法G=(∑,Q,q0，P）其中P为：
两类有限状态自动机
接受器判断是否接受输入串；
转换器对给定输入串产生输出。
FA还能够分为
拟定旳FA----DFA Deterministic Finite state Automaton 非拟定FA---- NFA
Non-deterministic Finite state Automaton
其中δ：
δ旳表达：函数形式
δ(q0，0)=q1 δ(q0，1)=q1 δ(q1，0)= q1 δ(q1，1)= q0
δ旳表达：状态矩阵
Q∑ 0
1
q0 q1
q1
q1 q1
q0
δ旳表达:状态图形式
状态图是一种有向、有循环旳图一种节点表达一种状态；若有δ(q，x)= q′，则状态q到状态q′有一条有向边，并用字母x作标识。
第三章
有限状态自动机

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

POJ1204（AC自动机模板题）题意：给一个N行长为M的字符串，给你一些需要去匹配的字符串，从任意一个字符串开始可以有八个方向，向上为A，顺时针依次是A——H，问你去匹配的字符串在给你的N*M 字符串中的坐标是怎么样的。

代码：const maxnodes=500000;var fx:array[1..8] of char=('E','F','G','H','A','B','C','D');t:array[0..maxnodes,'A'..'Z'] of longint;f,q,w:array[0..maxnodes] of longint;e:array[0..1001,0..1001] of char;s:array[0..1001] of char;colu,line:array[0..1] of longint;done:array[0..1001] of boolean;ans:array[0..1001] of record x,y,f:longint; end;n,m,num,u,i,j,k,l,r,root,size,x,y,p,li,co,tmp,len:longint;c:char;function nx(var x,y:longint; f:longint):char;begincase f of1:dec(x);2:begin dec(x); inc(y); end;3:inc(y);4:begin inc(x); inc(y); end;5:inc(x);6:begin inc(x); dec(y); end;7:dec(y);8:begin dec(x); dec(y); end;end;if (x<1)or(x>n)or(y<1)or(y>m) then exit('!');exit(e[x,y]);end;beginreadln(n,m,num);line[0]:=1;line[1]:=n;colu[0]:=1;colu[1]:=m;for i:=1 to n dobeginfor j:=1 to m do read(e[i,j]);readln;end;root:=0;size:=0;for i:=1 to num dobeginlen:=0;while not eoln dobegininc(len);read(s[len]);end;p:=root;for j:=len downto 1 dobeginc:=s[j];if t[p][c]=0 thenbegininc(size);t[p][c]:=size;end;p:=t[p][c];end;w[p]:=i;readln;end;l:=0;r:=0;for c:='A' to 'Z' doif t[root][c]<>0 thenbegininc(r);q[r]:=t[root][c];f[q[r]]:=root;end;while l<r dobegininc(l);u:=q[l];for c:='A' to 'Z' doif t[u][c]<>0 thenbegininc(r);q[r]:=t[u][c];p:=f[u];while (p<>root)and(t[p][c]=0) do p:=f[p];f[q[r]]:=t[p][c];end;end;for k:=1 to 8 dofor li:=0 to 1 dofor co:=1 to m dobeginx:=line[li];y:=co;p:=root;c:=e[x,y];while true dobeginwhile (p<>root)and(t[p][c]=0)do p:=f[p];p:=t[p][c];tmp:=p;while tmp<>root dobeginif (w[tmp]>0)and(not done[w[tmp]]) thenbeginans[w[tmp]].x:=x;ans[w[tmp]].y:=y;ans[w[tmp]].f:=k;done[w[tmp]]:=true;end;tmp:=f[tmp];end;c:=nx(x,y,k);if c='!' then break;end;end;for k:=1 to 8 dofor co:=0 to 1 dofor li:=1 to n dobeginx:=li;y:=colu[co];p:=root;c:=e[x,y];while true dobeginwhile (p<>root)and(t[p][c]=0)do p:=f[p];p:=t[p][c];tmp:=p;while tmp<>root dobeginif (w[tmp]>0)and(not done[w[tmp]]) thenbeginans[w[tmp]].x:=x;ans[w[tmp]].y:=y;ans[w[tmp]].f:=k;done[w[tmp]]:=true;end;tmp:=f[tmp];end;c:=nx(x,y,k);if c='!' then break;end;end;for i:=1 to num do writeln(ans[i].x-1,' ',ans[i].y-1,' ',fx[ans[i].f]);end.2、密码破译【问题描述】由于最近功课过于繁忙，Tim竟然忘记了自己电脑的密码，幸运的是Tim在设计电脑密码的时候，用了一个非常特殊的方法记录下了密码。

这个方法是：Tim把密码和其它的一些假密码共同记录在了一个本子上面。

为了能够从这些字符串中找出正确的密码，Tim又在另外一个本子上面写了一个很长的字符串，而正确的密码就是在这个字符串中出现次数最多的一个密码。

例如串ababa，假若密码是abab和aba，那么正确的密码是aba，因为aba在这个字符串中出现了2次。

现在你得到了Tim的这两个本子，希望你能够编写一个程序帮助Tim找出正确的密码。

【输入】输入由两个部分组成。

其中第一部分由若干行（<=5000）组成，每一行记录了一个密码，密码的均长度小于等于255位，并且都由小写字母组成。

然后一个空行，第二部分记录了一个很长的字符串，并且以’.’结束，其中只包含了小写字母。

【输出】输出文件名为Pass.out。

输出文件由仅有一行，为一个整数，表示正确密码在字符串中出现的次数。

如果这个出现次数为0，输出“No find”。

Pass.in Pass.out ab 6abcbdcabcdabcabcabcdbdabcbabdbcabdbdbdbd.程序：program pass;typepoint=^rec;rec=recorda:array['a'..'z']of point;e:{array[0..100]of }longint;fail,f:point;end;//这个是AC的数据结构，本人喜欢用动态int=longint;//这个是个人习惯varh,p,q:point;queue:array[1..200000]of point;i,j,k,m,n:int;f:array[1..6000]of int;st:ansistring;procedure neew(var P,father:point);//新建节点varch:char;beginnew(p);p^.e:=-1;for ch:='a'to'z'do p^.a[ch]:=nil;p^.f:=father;end;procedure insert(pos:int;st:ansistring);//插入vari,l:int;beginp:=h;i:=1;l:=length(st);while(i<=l)and(p^.a[st[i]]<>nil)do beginp:=p^.a[st[i]];inc(i);end;if i>l then beginp^.e:=pos;exit;while(i<=l)do beginneew(p^.a[st[i]],p);p:=p^.a[st[i]];inc(i);end;p^.e:=pos;end;procedure build;//建立字典树beginreadln(st);n:=0;neew(h,h);while(st<>'')do begininc(n);insert(n,st);readln(st);end;end;procedure failure;//构建失败指针varch:char;i,p,q:longint;k:point;procedure failure;//构建失败指针varch:char;i,p,q:longint;k:point;beginh^.fail:=h;p:=1;q:=0;for ch:='a'to 'z'doif(h^.a[ch]<>nil)then begininc(q);queue[q]:=h^.a[ch];h^.a[ch]^.fail:=h;end;while(p<=q)do beginfor ch:='a'to 'z'do if(queue[p]^.a[ch]<>nil)then begininc(q);queue[q]:=queue[p]^.a[ch];k:=queue[p]^.fail;while(k<>h)and(k^.a[ch]=nil)do k:=k^.fail;if k^.a[ch]=nil then queue[q]^.fail:=helse queue[q]^.fail:=k^.a[ch];if(queue[q]^.fail^.e<>-1)then begink:=queue[q]^.fail;queue[q]^.e:=k^.e;end;end;inc(p);end;end;procedure main;beginp:=h;print(h);m:=length(st)-1;for i:=1 to m do beginif p^.a[st[i]]<>nil then beginp:=p^.a[st[i]];endelse beginwhile(p<>h)and(p^.a[st[i]]=nil)do p:=p^.fail;if(p^.a[st[i]]<>nil)then p:=p^.a[st[i]];end;if p^.e<>-1 then inc(f[p^.e]);end;end;beginassign(input,'pass.in');reset(input);assign(output,'pass.out');rewrite(output);build;readln(st);failure;main;j:=0;for i:=1 to n do if f[i]>j then j:=f[i];if j<>0 then write(j)else write('No find');close(input);close(output);end.Poj1625Poj2778题意和Poj1625基本类似只不过不是求具体答案而是求答案Mod 100000的值了由于舍去了高精度运算我们可以很容易的写出代码先由AC自动机构造出DFA 再在DFA上进行一遍DP方程同Pku 1625 注意求模题意：给定m个异常基因片段，在所有长度为N的DNA序列中如‘AAAAA....’,'ATTTTT....','ATCG...','CGTA...',.....中不包含异常序列的DNA个数mod 100000(十万)的值，这题题解是AC自动机和矩阵乘法，首先建立AC自动机program poj2778;type matrix=array[0..101,0..101]of int64;const mo=100000;var a:string;nodes,leng,i,j,point,m,n,top,x,tail,som,k:longint;ans:int64;b,g:matrix;son:array[0..101,0..4]of longint;off:array[0..101]of longint;code:array[0..101]of char;stack:array[0..110]of longint;comp:array[0..110]of boolean;procedure muti(a,b:matrix;var c:matrix);begin fillchar(c,sizeof(c),0);for i:=0 to nodes dofor j:=0 to nodes dobeginfor k:=0 to nodes doc[i,j]:=(a[i,k]*b[k,j]+c[i,j])mod mo;end;end;function anticode(a:char):longint;begin case a of'A':exit(1);'C':exit(2);'G':exit(3);'T':exit(4);else exit(0);end;end;beginreadln(m,n);fillchar(son,sizeof(son),$ff);for i:=1 to m dobeginreadln(a);leng:=length(a);point:=0;for j:=1 to leng dobeginif son[point,anticode(a[j])]<>-1thenpoint:=son[point,anticode(a[j])]elsebegininc(nodes);son[point,anticode(a[j])]:=nodes;code[nodes]:=a[j];point:=nodes;end;end;comp[point]:=true;end;top:=0;tail:=1;while top<tail dobegininc(top);x:=stack[top];for i:=1 to 4 doif son[x,i]<>-1thenbegininc(tail);stack[tail]:=son[x,i];if x=0 then continue;som:=off[x];repeatif son[som,i]<>-1thenbeginsom:=son[som,i];break;end;som:=off[som];until som<=0;if som=0thenif son[som,i]<>-1thensom:=son[som,i];if comp[som]then comp[son[x,i]]:=true;off[son[x,i]]:=som;end;end;top:=0;nodes:=0;while top<tail dobegininc(top);x:=stack[top];if comp[x] then continue;if x>nodes then nodes:=x;for i:=1 to 4 doif son[x,i]=-1thenbeginsom:=off[x];while (som>0)and(son[som,i]=-1) dobeginsom:=off[som];end;if (son[som,i]<>-1)and(not comp[son[som,i]])theninc(g[x,son[som,i]])elseif (som=0)and(son[som,i]=-1)theninc(g[x,0]);endelseif (son[x,i]<>-1)and(not comp[son[x,i]])theninc(g[x,son[x,i]]);end;for i:=0 to nodes dob[i,i]:=1;while (n>0) dobeginif (n and 1)>0thenmuti(b,g,b);n:=n>>1;muti(g,g,g);end;for i:=0 to nodes doans:=(ans+b[0,i])mod mo;writeln(ans);end.第二种题解：const maxn=100;maxm=50000;base=100000;var tr:array['A'..'Z']of longint;n,m,i,j,k,tt,h,t,p,root,ans:longint;s:array[1..maxn,1..4]of longint;opt:array[0..maxm,1..maxn]of longint;f,q:array[1..maxn]of longint;d:array[1..maxn]of boolean;ch:char;procedure allot(var x:longint);var i:longint;begininc(tt); x:=tt;d[x]:=false; f[x]:=0;for i:=1 to 4 dos[x][i]:=0;end;beginassign(input,'DNAS.in'); reset(input); assign(output,'DNAS2.out'); rewrite(output); tr['A']:=1; tr['C']:=2;tr['G']:=3; tr['T']:=4;readln(n,m);tt:=0; allot(root);for i:=1 to n dobeginp:=root;while not eoln dobeginread(ch);k:=tr[ch];if s[p][k]=0then allot(s[p][k]);p:=s[p][k];end;d[p]:=true;readln;end;h:=1; t:=0;f[root]:=root;for i:=1 to 4 doif s[root][i]=0then s[root][i]:=rootelse begininc(t);q[t]:=s[root][i];f[q[t]]:=root;end;while h<=t dobeginfor i:=1 to 4 dobeginp:=f[q[h]];while (p<>root)and(s[p][i]=0) dop:=f[p];if s[p][i]=0then p:=rootelse p:=s[p][i];if s[q[h]][i]=0then s[q[h]][i]:=pelse begininc(t);q[t]:=s[q[h]][i];if d[p] then d[q[t]]:=true;f[q[t]]:=p;end;end;inc(h);end;fillchar(opt,sizeof(opt),0);opt[0][root]:=1;for i:=0 to m-1 dofor j:=1 to tt dofor k:=1 to 4 dobeginn:=s[j][k];if not(d[j]) and not(d[n])then begint:=i+1;opt[t][n]:=(opt[t][n]+opt[i][j])mod base;end;end;ans:=0;for i:=1 to tt doans:=(ans+opt[m][i])mod base;writeln(ans);close(input); close(output);end.Poj3208:题意求所有合法解中排第K的解合法解是一个自然数包含子串"666"首先我们得知道求字典序排第K的问题的通用解法这类问题可以转化为求方案数然后O(kN)递推来解决先考虑最简单的方法由小到大枚举出所有方案然后得到第K个虽然时间复杂度很高但是却是我们O(kN)递推的基础首先可以用DP等方法求出指定前缀时的方案数对于每一个前缀搜索的策略是遍历这个前缀下所有的方案每枚举出一个解就让计数器+1 不断的逼近排名K的方案而有了求出的指定前缀的方案数我们就可以大步地累加计数器来逼近排名位为K的方案假设我们已经求出了前i-1位正在求第i位由字典序从小到大枚举第i位每枚举出一位我们就得到了一个长为i的前缀判断计数器加上前缀状况下的方案数是不是大于K大于就表明这一位就是当前枚举出的值否则让计数器加上方案数继续枚举这样复杂度就是O(kN)了k就是每一位可以取的值总数那么这个问题就转化为求解长度为指定前缀的串的总数通过前面几篇文章的几个问题我们知道具体走到DFA上的哪一个节点可以概括一个前缀所以建立一个DFA 包含串"666" 边为'0'-'9'的字符我们还是这样表示状态第一维关于步数第二维是节点Opt[i][j]表示走到j这个节点再走i步能包含666的方案数但是考虑到包含666这个条件比较模糊我们修改DFA 把666的词尾节点所有的边指向自己那么只要再走i步停留在词尾节点就可以了DP方程: Opt[i][j]=Sum{Opt[i-1][Next[j][k]]}初始条件: Opt[0][666词尾节点]=1这样这个问题就解决了Vars:array[1..4,0..9]of longint;opt:array[0..11,1..4]of int64;ans:array[1..11]of lngint;n,i,j,k,x,y,m,p,ca:longint;beginassign(input,'SomeDay.in');reset(input);assign(output,'SomeDay.out');rewrite(output);for i:=1 to 3 dobeginfor j:=0 to 9 dos[i][j]:=1;s[i][6]:=i+1;end;for j:=0 to 9 dos[4][j]:=4;opt[0][4]:=1;for i:=1 to 11 dofor j:=1 to 4 dofor k:=0 to 9 doopt[i][j]:=opt[i][j]+opt[i-1][s[j][k]];readln(ca);while ca>0 dobegindec(ca);readln(n);for i:=1 to 11 doif opt[i][1]>=n then break;m:=i; j:=0;n:=n-opt[i-1][1];p:=1;while i>0 dobeginif i=mthen k:=1else k:=0;for j:=k to 9 doif n>opt[i-1][s[p][j]]then n:=n-opt[i-1][s[p][j]]else break;ans[i]:=j;dec(i);p:=s[p][j];end;for i:=m downto 1 dowrite(ans[i]);writeln;end;close(input);close(output);end.Ac自动机练习题：Poj1652;poj3691;poj2825;poj3208。

ac自动机和有限状态

合集下载

ac自动机相关的题

《有限状态自动机》课件

AC多模匹配算法

有限状态自动机

有限状态自动机

形式语言06章有限状态自动机和有限状态语言

多模匹配算法

有限状态机原理

自动机原理

有限自动机理论章有限状态自动机

文档推荐

最新文档