当前位置:文档之家› 基于算法本科毕业论文2011

基于算法本科毕业论文2011

本科毕业论文(设计)题目贪心算法设计及其实际应用研究

系别信息管理系

专业计算机科学与技术

年级2007级

学号

姓名

指导教师

成绩_______________________

二〇一一年五月十五日

目录

本科毕业论文(设计)任务书 ............................................. I 文献综述 (i)

本科毕业论文(设计)开题报告 ....................................... - 1 - 正文 ................................................................... a 摘要 ................................................................... a 第1章引言 ............................................................ b 1.1研究背景............................................................ b 1.2研究内容............................................................ b 1.3研究目标............................................................ b 1.4研究意义............................................................ b 1.5 本文组织 ........................................................... c 第2章贪心算法的基本知识概述 .......................................... d 2.1 贪心算法定义 ....................................................... d 2.2 贪心算法的基本思路及实现过程 ....................................... d 2.3贪心算法的核心...................................................... d 2.4贪心算法的基本要素.................................................. e 2.5 贪心算法的理论基础 ................................................. f 2.6贪心算法存在的问题.................................................. g 第3章经典问题解决及其优缺点 .......................................... h 3.1 哈夫曼编码 ......................................................... h 3.2单源最短路径问题(Dijkstra算法) ..................................... j 3.3最小生成树问题(Prim算法、Kruskal算法) .............................. l 第4章多处最优服务次序问题 ............................................ o 4.1 问题的提出 ......................................................... o 4.2 贪心选择策略 ....................................................... o 4.3 问题的贪心选择性质 ................................................. o 4.4 问题的最优子结构性质 ............................................... o 4.5 算法结果分析 ....................................................... p

第5章删数问题 ........................................................ q 5.1 问题的提出 ......................................................... q 5.2 贪心算法策略 ....................................................... q 5.3 问题的贪心选择性质 ................................................. q 5.4 问题的最优子结构性质 ............................................... q 5.5 编码 ............................................................... r 第6章汽车加油问题 .................................................... s 6.1 问题的提出 ......................................................... s 6.2 编码分析 ........................................................... s 6.3 贪心算法策略 ....................................................... s 6.4 贪心算法正确性证明 ................................................. t 6.5 贪心算法时间复杂度分析 ............................................. t 第7章最优合并问题 .................................................... u 7.1 问题的提出 ......................................................... u 7.2 原理分析 ........................................................... u 7.3 算法时间复杂度分析 ................................................. u 第8章会场安排问题 . (v)

8.1 问题的提出 (v)

8.2 编码分析 (v)

8.3 贪心算法 (v)

8.4 最优解证明 ......................................................... w 8.5 算法时间复杂度分析 ................................................. w 第9章贪心算法的C++实现.. (x)

9.1 C++语言概述 (x)

9.2 具体实现步骤 ....................................................... y 9.3程序编码与程序调试................................................. cc 第10章总结与展望 .................................................... ee 10.1总结.............................................................. ee 10.2展望.............................................................. ee 参考文献 .............................................. 错误!未定义书签。

附录 .................................................................. ff 致谢 .................................................. 错误!未定义书签。本科毕业论文(设计)指导教师评阅表 .................... 错误!未定义书签。本科毕业论文(设计)交叉评阅表 ........................ 错误!未定义书签。本科毕业论文(设计)答辩记录 .......................... 错误!未定义书签。

本科毕业论文(设计)任务书

论文(设计)题目贪心算法设计及其实际应用研究

系别、专业信息管理系计算机科学与技术学生姓名学号

指导教师姓名开题日期2011年11月28日

文献综述

贪心算法设计及其实际应用研究

信息管理系, 402460

摘要:在求最优解问题的过程中,依据某种贪心标准,从问题的初始状态出发,直接去求每一步的最优解,通过若干次的贪心选择,最终得出整个问题的最优解,这种求解方法就是贪心算法。从贪心算法的定义可以看出,贪心法并不是从整体上考虑问题,它所做出的选择只是在某种意义上的局部最优解,而由问题自身的特性决定了该题运用贪心算法可以得到最优解。贪心算法所作的选择可以依赖于以往所作过的选择,但决不依赖于将来的选择,也不依赖于子问题的解,因此贪心算法与其它算法相比具有一定的速度优势。如果一个问题可以同时用几种方法解决,贪心算法应该是最好的选择之一。本文讲述了贪心算法的含义、基本思路及实现过程,贪心算法的核心、基本性质、特点及其存在的问题。并通过贪心算法的特点举例列出了以往研究过的几个经典问题,对于实际应用中的问题,也希望通过贪心算法的特点来解决。

关键词:贪心算法;哈夫曼编码;最小生成树;多处最优服务次序问题;删数问题

0 引言

为了满足人们对大数据量信息处理的渴望,为解决各种实际问题,计算机算法学得到了飞速的发展,线性规划、动态规划、贪心策略等一系列运筹学模型纷纷运用到计算机算法学中,产生了解决各种现实问题的有效算法。虽然设计一个好的求解算法更像是一门艺术而不像是技术 ,但仍然存在一些行之有效的、能够用于解决许多问题的算法设计方法 ,你可以使用这些方法来设计算法 ,并观察这些算法是如何工作的。一般情况下,为了获得较好的性能,必须对算法进行细致的调整。但是在某些情况下,算法经过调整之后性能仍无法达到要求,这时就必须寻求另外的方法来求解该问题。

当一个问题具有最优子结构性质和贪心选择性质时,贪心算法通常会给出一个简单、直观和高效的解法。贪心算法通过一系列的选择来得到一个问题的解。它所作的每一个选择都是在当前状态下具有某种意义的最好选择,即贪心选择;并且每次贪心选择都能将问题化简为一个更小的与原问题具有相同形式的子问题。尽管贪心算法对许多问题不能总是产生整体最优解,但对诸如最短路径问题、最小生成树问题,以及哈夫曼编码问题等具有最优子结构和贪心选择性质的问题却可以获得整体最优解。而

且所给出的算法一般比动态规划算法更加简单、直观和高效。

(1)基本知识

贪心算法的含义

贪心算法是通过一系列的选择来得到问题解的过程。贪心算法是一种能够得到某种度量意义下的最优解的分级处理方法,它总是做出在当前看来是最优的选择,也就是说贪心策略并不是从整体上加以考虑,它所做出的选择只是在某种意义上的局部最优解算法。

(2)贪心算法特点及存在的问题

1)贪心算法的特点

从全局来看,运用贪心策略解决的问题在程序的运行过程中无回溯过程,后面的每一步都是当前看似最佳的选择,这种选择依赖于已做出的选择,但不依赖于未做出的选择。

2)贪心算法存在的问题

①不能保证求得的最后解是最佳的。由于贪心策略总是采用从局部看来是最优的选择,因此并不从整体上加以考虑。

②贪心算法只能用来求某些最大或最小解的问题。例如找零钱问题要求得到最小数量,就可以采用贪心算法,但是在另外一个求解权值最小路径时采用贪心算法得到的结果并不是最佳。

③贪心算法只能确定某些问题的可行性范围。

(3)经典问题解决及其优缺点

1)哈夫曼编码

问题提出:哈夫曼编码是广泛地用于数据文件压缩的十分有效的编码方法。其压缩率通常在20%~90%之间。哈夫曼编码算法用字符在文件中出现的频率表来建立一个用0,1串表示各字符的最优表示方式。

基本原理:对每一个字符规定一个0,1串作为其代码,并要求任一字符的代码都不是其它字符代码的前缀。这种编码称为前缀码。编码的前缀性质可以使译码方法非常简单。由于任一字符的代码都不是其他字符代码的前缀,从编码文件中不断取出代表某一字符的前缀码,转换为原字符,即可逐个译出文件中的所有字符。可以用二叉树作为前缀编码的数据结构。在表示前缀码的二叉树中,树叶代表给定的字符,并将每个字符的前缀码看做是从树根到代表该字符的树叶的一条道路。代码中每一位的

0或1分别作为指示某结点到左儿子或右儿子的“路标”。

优点:哈夫曼编码是无损压缩当中最好的方法。它使用预先二进制描述来替换每个符号,长度由特殊符号出现的频率决定。常见的符号需要很少的位来表示,而不常见的符号需要很多位来表示。哈夫曼算法在改变任何符号二进制编码引起少量密集表现方面是最佳的。然而,它并不处理符号的顺序和重复或序号的序列。

缺点:①慢位流实现②相当慢的解码(比编码慢)③最大的树深度是32(编码器在任何超过32位大小的时候退出)。

2)单源最短路径

问题提出:给定带权有向图G=(V,E),其中每条边的权是非负实数。另外,还给定V中的一个顶点,称为源。现在要计算从源到所有其它各顶点的最短路长度。这里路的长度是指路上各边权之和。这个问题通常称为单源最短路径问题。

Dijkstra算法

基本思想:设置顶点集合S并不断地作贪心选择来扩充这个集合。一个顶点属于集合S当且仅当从源到该顶点的最短路径长度已知。初始时,S中仅含有源。设u是G的某一个顶点,把从源到u且中间只经过S中顶点的路称为从源到u的特殊路径,并用数组dist记录当前每个顶点所对应的最短特殊路径长度。Dijkstra算法每次从V-S中取出具有最短特殊路长度的顶点u,将u添加到S中,同时对数组dist作必要的修改。一旦S包含了所有V中顶点,数组dist就记录了从源到所有其它顶点之间的最短路径长度。

优点:Dijkstra的思想是按递增长度来产生路径,每次选出当前已经找到的最短的一条路径,它必然是一条最终的最短路径。因此每次找出当前距离数组中最小的,必然是一条最终的最短路径

缺点:对于具有n个顶点和e条边的带权有向图,如果用带权邻接矩阵表示这个图,那么Dijkstra算法的主循环体需要O(n)时间。这个循环需要执行n-1次,所以完成循环需要O(n2)时间。算法的其余部分所需要时间不超过O(n2)。

3)最小生成树

问题提出:设G=(V,E)是无向连通带权图,即一个网络。E中每条边(v,w)的权为c[v][w]。如果G的子图G’是一棵包含G的所有顶点的树,则称G’为G的生成树。生成树上各边权的总和称为该生成树的耗费。在G的所有生成树中,耗费最小的生成树称为G的最小生成树。

①Prim算法

基本思想:首先置S={1},然后,只要S是V的真子集,就作如下的贪心选择:选取满足条件i∈S,j∈v-s,且c[i][j]最小的边,将顶点j添加到S中。这个过程一直进行到S=V时为止。在这个过程中选取到的所有边恰好构成G的一棵最小生成树。

优点:该算法的特点是当前形成的集合T始终是一棵树。将T中U和TE分别看作红点和红边集,V-U看作蓝点集。算法的每一步均是在连接红、蓝点集的紫边中选择一条轻边扩充进T中。MST性质保证了此边是安全的。T从任意的根r开始,并逐渐生长直至U=V,即T包含了C中所有的顶点为止。MST性质确保此时的T是G的一棵MST。因为每次添加的边是使树中的权尽可能小,因此这是一种“贪心”的策略。

缺点:该算法的时间复杂度为O(n2)。与图中边数无关,该算法适合于稠密图。

②Kruskal算法

基本思想:首先将G的n个顶点看成n个孤立的连通分支。将所有的边按权从小到大排序。然后从第一条边开始,依边权递增的顺序查看每一条边,并按下述方法连接两个不同的连通分支:当查看到第k条边(v,w)时,如果端点v和w分别是当前两个不同的连通分支T1和T2中的顶点时,就用边(v,w)将T1和T2连接成一个连通分支,然后继续查看第k+1条边;如果端点v和w在当前的同一个连通分支中,就直接再查看第k+1条边。这个过程一直进行到只剩下一个连通分支时为止。此时,这个连通分支就是G的一棵最小生成树。

优点:当输入的连通带权图有e条边时,则将这些边依其权组成优先队列需要O(e)时间,在上述算法的while循环中,DeleteMin运算需要O(loge)时间,因此关于优先队列所作运算的时间为O(eloge)。实现UnionFind所需的时间为O(eloge)或O(elog*e)。所以Kruskal算法所需的计算时间为O(eloge)。

缺点:当e=Ω(n2)时,Kruskal算法比Prim算法差,但当e=O(n2)时,Kruskal 算法却比Prim算法好得多。Kruskal算法的时间主要取决于边数。它较适合于稀疏图。

1 本课程研究的内容

通过资料收集、实际调查分析,最终形成自己的观点和见解,拟定以下内容进行探析:

(1)基本知识

1)贪心算法的含义

2)贪心算法的基本思路及实现过程

3)贪心算法的核心

4)贪心算法的基本性质

5)贪心算法的特点

6)贪心算法存在的问题

(2)经典问题解决及其优缺点

1)哈夫曼编码

2)单源最短路径问题(Dijkstra算法)

3)最小生成树问题(Prim算法、Kruskal算法)

(3)贪心算法的实际应用

1)多处最优服务次序问题

2)删数问题

3)汽车加油问题

4)最优合并问题

5)会场安排问题

2 总结

贪心算法是很常见的算法,贪心策略是最接近人的日常思维的一种解题策略,虽然它不能保证求得的最后解一定是最佳的,但是它可以为某些问题确定一个可行性范围,因此贪心策略在各级各类信息学竞赛,尤其在对NPC类问题的求解中发挥着越来越重要的作用。对于一个问题的最优解只能用穷举法得到时,用贪心算法是寻找问题最优解的较好算法。总之,充分利用贪心算法的优势,从局部最优出发,构造贪心策略比较容易,且简单易行。

参考文献:

[1] 严蔚敏,吴伟民.数据结构(c语言版)[M].北京:清华大学出版社,1997.

[2] M.H.ALSUWAIYEL.算法设计技巧与分析[M].北京:电子工业出版社,2004.

[3] 谭浩强.C++面向对象程序设计[M].北京:清华大学出版社,2006.

[4] 常友渠.贪心算法的探讨与研究[M].重庆电力高等专科学报,第13卷,第13期,2008.9.

[5] 龚雄兴,堆与贪心算法[M],湖北襄樊学院,2003.

[6] 张洁,朱莉娟.贪心算法与动态规划的比较[M].新乡师范高等专科科学学报,第19卷,第五期,2005.9.

[7] 殷建平.关于贪心算法的正确性证明[M].江西师范大学学报(自然科学版),第22卷增刊,1998.10.

[8] 王晓东.计算机算法设计与分析(第3版)[M].北京:电子工业出版社,2007.

[9] 余祥宣,崔国华,邹海明.计算机算法基础[M].武汉:华中科技大学出版社,2000.

[10] 卢开澄.计算机算法导引—设计与分析[M].北京:清华大学出版社,2003.

[11] M.H.ALSUWAIYEL.算法设计技巧与分析[M].北京电子工业出版社(影印版),51-52.

[12] 朱洪.算法设计和分析[M].上海科学技术文献出版社,1989,162-163.

[13] 王晓东.计算算法设计与分析(第二版)[M].北京:电子工业出版社,2OO4.

[14] 王晓东.算法设计与分析[M].北京:清华大学出版社,2O04.

[15] 苏德富,钟诚.计算机算法设计与分析[M].北京:电子工业出版社,2001:60-62.

[16]URL https://www.doczj.com/doc/0918093198.html,/view/298415.htm?fr=ala0

[17]URL https://www.doczj.com/doc/0918093198.html,/forums/threads/134122.aspx

[18]URL https://www.doczj.com/doc/0918093198.html,/s/blog_5cd377280100artn.html

[19]URL https://www.doczj.com/doc/0918093198.html,/question/45158704.html?fr=ala0

[20]URL https://www.doczj.com/doc/0918093198.html,/club/showtxt.asp?id=91794

[21] MelhiM,Ipson S S,Boothw.A novel triangulation procedure for thinning hand written text[J].Pattern Recognition Letters,2001,22(10):1059-1071.

[22] Florescu D,Grunhagen A,Kossmann D.XL:A Platform for Web Services[C].Proc.of the 1st Biennial Conference on innovative Data Systems Research, 2003.

本科毕业论文(设计)开题报告

并接受学校和学院检查。

正文

贪心算法设计及其实际应用研究

信息管理系, 402460

摘要:贪心算法是指,在对问题求解时,总是做出在当前看来是最好的选择,也就是说,不从整体最优上加以考虑,他所做出的仅是在某种意义上的局部最优解。贪心算法不是对所有问题都能得到整体最优解,但对范围相当广泛的许多问题也能产生整体最优解或者是整体最优解的近似解。本文首先介绍了贪心算法的核心、特点及算法本身存在的问题,接下来介绍了前人已经研究出来的成果,包括哈夫曼编码、单源最短路径、最小生成树等。然后结合实践,研究了多处最优服务次序问题、删数问题、汽车加油问题、最优合并问题、会场安排问题等。最后用代码实现其中的两个问题,对贪心算法的具体实现方法做了详细说明。

关键字:贪心算法;哈夫曼编码;最小生成树;最优服务次序;汽车加油问题

Greedy algorithm design and its practical application

Department of Information Management, University, , Chongqing

Abstract:Greedy algorithm is that, in the problem solving, it always made in the current appears to be the best option. In other words, not the best on the whole to be considered, he made only a local optimal solution in a sense. Greedy algorithm is not a right that all problems can be the overall optimal solution, but it covers a wide range of issues that he could produce an overall optimal solution or approximate solution of the overall optimal solution. This paper describes the core of the greedy algorithm, characteristics and algorithms inherent problems, then presented the results of our predecessors has been studied out, including Huffman coding, single-source shortest path, minimum spanning tree and so on. Then with practice, study the various optimal service order issues, delete a few issues, car fuel, the optimal merger, venue arrangements and so on. At last, the code to achieve two of them on the greedy algorithm to do the concrete implementation method in detail.

Key words:greedy algorithm;Huffman coding;MST;Optimal service order;Automobile refueling

第1章引言

1.1研究背景

为了满足人们对大数据量信息处理的渴望,为解决各种实际问题,计算机算法学得到了飞速的发展,线性规划、动态规划、贪心策略等一系列运筹学模型纷纷运用到计算机算法学中,产生了解决各种现实问题的有效算法。虽然设计一个好的求解算法更像是一门艺术而不像是技术,但仍然存在一些行之有效的、能够用于解决许多问题的算法设计方法,你可以使用这些方法来设计算法,并观察这些算法是如何工作的。一般情况下,为了获得较好的性能,必须对算法进行细致的调整。但是在某些情况下,算法经过调整之后性能仍无法达到要求,这时就必须寻求另外的方法来求解该问题。

当一个问题具有最优子结构性质和贪心选择性质时,贪心算法通常会给出一个简单、直观和高效的解法。贪心算法通过一系列的选择来得到一个问题的解。它所作的每一个选择都是在当前状态下具有某种意义的最好选择,即贪心选择;并且每次贪心选择都能将问题化简为一个更小的与原问题具有相同形式的子问题。尽管贪心算法对许多问题不能总是产生整体最优解,但对诸如最短路径问题、最小生成树问题,以及哈夫曼编码问题等具有最优子结构和贪心选择性质的问题却可以获得整体最优解。而且所给出的算法一般比动态规划算法更加简单、直观和高效。

1.2研究内容

贪心算法的定义(是指从问题的初始状态出发,通过若干次的贪心选择而得出最优值(或较优解)的一种解题方法),贪心算法的基本要素(最优子结构性质、贪心选择性质)、贪心算法的思路及过程,贪心算法的核心(贪心策略)及特性(无回溯)、探讨贪心算法存在的问题。然后分析已有成果运用贪心策略的解法(哈夫曼编码、单源最短路径问题、最小生成树等),结合实际中的例子(多处最优服务次序问题、删数问题、汽车加油问题、会场安排问题、最优合并问题),对贪心算法进行分析与运用。

1.3研究目标

通过本课题的研究来探讨贪心算法理论基础以及对贪心策略在更多实例中的运用做可行的研究,为贪心算法能够运用到更多的实际中的问题作示范。

1.4研究意义

贪心算法是计算机算法策略中常用的一个,往往在需要解决一些最优性问题时,都可以应用贪心算法。贪心算法的用法特点有:一是明显的贪心,一般此类应用问题本身

就是贪心;二是贪心数据结构,如:堆,最小树;三是可证明贪心策略的贪心,这是我们最常见的;四是博弈、游戏策略,这些策略大多是贪心;五是求较优解或多次逼近最优解。通过用贪心算法求解以上问题,可以找到解决这些问题的最优算法,为其它的类似问题的解决有示范和例证作用。

1.5 本文组织

本文从如下方面进行组织:先提出贪心算法的基本知识,再从贪心算法的几个现有的成果研究探讨,然后对贪心算法中的几个经典问题进行研究,写出其中两个问题的代码,最后进行总结。

第2章贪心算法的基本知识概述

2.1 贪心算法定义

贪心算法可以简单描述为:对一组数据进行排序,找出最小值,进行处理,再找出最小值,再处理。也就是说贪心算法是一种在每一步选择中都采取在当前状态下最好或最优的选择,从而希望得到结果是最好或最优的算法。

贪心算法是一种能够得到某种度量意义下的最优解的分级处理方法,通过一系列的选择来得到一个问题的解,而它所做的每一次选择都是当前状态下某种意义的最好选择,即贪心选择。即希望通过问题的局部最优解来求出整个问题的最优解。这种策略是一种很简洁的方法,对许多问题它能产生整体最优解,但不能保证总是有效,因为它不是对所有问题都能得到整体最优解,只能说其解必然是最优解的很好近似值。

2.2 贪心算法的基本思路及实现过程

2.2.1 贪心的基本思想

用局部解构造全局解,即从问题的某一个初始解逐步逼近给定的目标,以尽可能快地求得更好的解。当某个算法中的某一步不能再继续前进时,算法停止。贪心算法思想的本质就是分治,或者说:分治是贪心的基础。每次都形成局部最优解,换一种方法说,就是每次都处理出一个最好的方案。

利用贪心策略解题,需要解决两个问题:

(1)该题是否适合于用贪心策略求解;

(2)如何选择贪心标准,以得到问题的最优/较优解。

2.2.2 贪心算法的实现过程

(1)应用同一规则F,将原问题变为一个相似的、但规模更小的子问题;

(2)从问题的某一初始解出发:

While(能朝给定目标前进一步)

求出可行解的一个解元素;

(3)由所有解元素组合成问题的一个可行解。

2.3贪心算法的核心

贪心算法的核心问题是选择能产生问题最优解的最优度量标准,即具体的贪心策略。

贪心策略是指从问题的初始状态出发,通过若干次的贪心选择而得出最优值(或较优解)的一种解题方法。其实,从“贪心策略”一词我们便可以看出,贪心策略总是做出在当前看来是最优的选择,也就是说贪心策略并不是从整体上加以考虑,它所做出的选择只是在某种意义上的局部最优解,而许多问题自身的特性决定了该题运用贪心策略可以得到最优解或较优解。

2.4贪心算法的基本要素

2.4.1贪心选择性质

所谓贪心选择性质是指所求问题的整体最优解可以通过一系列局部最优的选择,即贪心选择来达到。这是贪心算法可行的第一个基本要素,也是贪心算法与动态规划算法的主要区别。在动态规划算法中,每步所做的选择往往依赖于相关子问题的解。因而只有在解出相关子问题后,才能做出选择。而在贪心算法中,仅在当前状态下做出最好选择,即局部最优选择。然后再去解做出这个选择后产生的相应的子问题。贪心算法所做的贪心选择可以依赖于以往所做过的选择,但决不依赖于将来所做的选择,也不依赖于子问题的解。正是由于这种差别,动态规划算法通常以自底向上的方式解各子问题,而贪心算法则通常以自顶向下的方式进行,以迭代的方式做出相继的贪心选择,每做一次贪心选择就将所求问题简化为规模更小的子问题。

对于一个具体问题,要确定它是否具有贪心选择性质,必须证明每一步所做的贪心选择最终导致问题的整体最优解。首先考察问题的一个整体最优解,并证明可修改这个最优解,使其以贪心选择开始。做了贪心选择后,原问题简化为规模更小的类似子问题。然后,用数学归纳法证明,通过每一步做贪心选择,最终可得到问题的整体最优解。其中,证明贪心选择后的问题简化为规模更小的类似子问题的关键在于利用该问题的最优子结构性质。

2.4.2最优子结构性质

当一个问题的最优解包含其子问题的最优解时,称此问题具有最优子结构性质。运用贪心策略在每一次转化时都取得了最优解。问题的最优子结构性质是该问题可用贪心算法或动态规划算法求解的关键特征。贪心算法的每一次操作都对结果产生直接影响,而动态规划则不是。贪心算法对每个子问题的解决方案都做出选择,不能回退;动态规划则会根据以前的选择结果对当前进行选择,有回退功能。动态规划主要运用于二维或三维问题,而贪心一般是一维问题。

2.4.3贪心算法的特点

贪心算法的最大特点就是快,通常是线性二次式,不需要多少额外的内存。一般二次方级的存储要浪费额外的空间,而且那些空间经常得不出正解。但是,使用贪心算法时,这些空间可以帮助算法更容易实现且更快执行。如果有正确贪心性质存在,那么一定要采用。因为它容易编写,容易调试,速度极快,并且节约空间。几乎可以说,此时它是所有算法中最好的。但是应该注意,贪心算法有两大难点:

(1)如何贪心

怎样用一个小规模的解构造更大规模的解呢?总体上,这与问题本身有关。但是大部分都是有规律的。正因为贪心有如此性质,它才能比其他算法快。

具有应当采用贪心算法的问题,当“贪心序列”中的每项互异且当问题没有重叠性时,看起来总能通过贪心算法取得(近似)最优解的。或者,总有一种直觉在引导我们对一些问题采用贪心算法。其中“找零钱”这个问题就是一个例子。题中给出的硬币面值事实上具有特殊性,如果面值发生变化,可能贪心算法就不能返回最优解了。但是,值得指出的是,当一个问题具有多个最优解时,贪心算法并不能求出所有最优解。另外,我们经过实践发现,单纯的贪心算法是顺序处理问题的;而且每个结果是可以在处理完一个数据后即时输出的。

(2)贪心的正确性

要证明贪心性质的正确性,才是贪心算法的真正挑战,因为并不是每次局部最优解都会与整体最优解之间有联系,往往靠贪心算法生成的解不是最优解。这样,贪心性质的证明就成了贪心算法正确的关键。对某些问题贪心性质也许是错的,即使它在大部分数据中都是可行的,但还必须考虑到所有可能出现的特殊情况,并证明该贪心性质在这些特殊情况中仍然正确。而这样容易陷入证明不正确贪心性质的泥塘中无法自拔,因为贪心算法的适用范围并不大,而且有一部分极难证明,若是没有把握,最好不要冒险,还有其他算法会比它要保险。

2.5 贪心算法的理论基础

正如前文所说的那样,贪心策略是最接近人类认知思维的一种解题策略。但是,越是显而易见的方法往往越难以证明。下面我们就来介绍贪心策略的理论—拟阵。

“拟阵”理论是一种能够确定贪心策略何时能够产生最优解的理论,虽然这套理论还很不完善,但在求解最优化问题时发挥着越来越重要的作用。

拟阵M定义为满足下面3个条件的有序对(S,I):

(1)S是非空有限集;

(2)I是S的一类具有遗传性质的独立子集族,即若B∈I,则B是S的独立子集,且B的任意子集也都是S的独立子集。空集¢必为I的成员;

(3)I满足交换性质,即若A∈I,B∈I且|A|<|B|,则存在某一元素x∈B-A,使得A∪{x}∈I。

定理2.1 拟阵M中所有极大独立子集具有相同大小。

引理2.1 (拟阵的贪心选择性质)设M=(S,I)是具有权函数M的带权拟阵,且S 中元素依权值从大到小排列,又设x∈S是S中第一个使得{x}是独立子集元素,则存在S的最优子集A使得x∈A。

引理2.2 设M=(S,I)是拟阵。若S中元素x不是空集¢的一个可扩元素,则x也不可能是S中任一独立子集A的可扩展元素。

引理2.3 (拟阵的最优子结构性质)设x是求带权拟阵M=(S,I)的最优子集的贪心算法Greedy所选择的S中的第一个元素。那么,原问题可简化为求带权拟阵M'=(S',I')的最优子集问题,其中

S'={y|y∈S且{x,y}∈I}

I'={B|B S-{x}且B∪{x}∈I}

M'的权函数是M的权函数在S'上的限制(称M'为M关于元素x的收缩)。

定理2.4(带权拟阵贪心算法的正确性)高M=(S,I)是具有权函数W的带权拟阵,算法Greedy返回M的最优子集。

适宜于用贪心策略来求解的许多问题都可以归结为在加权拟阵中找一个具有最大权值的独立子集的问题,即给定一个加权拟阵M=(S,I),若能找出一个独立且具有最大可能权值的子集A,且A不被M中比它更大的独立子集所包含,那么A为最优子集,也是一个最大的独立子集。我们认为,针对绝大多数的信息学问题,只要它具备了“拟阵”的结构,便可用贪心策略求解。拟阵理论对于我们判断贪心策略是否适用于某一复杂问题是十分有效的。

2.6 贪心算法存在的问题

(1)不能保证求得的最后解是最佳的。由于贪心策略总是采用从局部看来是最优的选择,因此并不从整体上加以考虑;

(2)贪心算法只能用来求某些最大或最小解的问题;

(3)贪心算法只能确定某些问题的可行性范围。

相关主题
相关文档 最新文档