复杂度-线性时间选择算法复杂度分析
- 格式:doc
- 大小:59.00 KB
- 文档页数:2
算法的时间复杂度和空间复杂度-总结通常,对于一个给定的算法,我们要做两项分析。
第一是从数学上证明算法的正确性,这一步主要用到形式化证明的方法及相关推理模式,如循环不变式、数学归纳法等。
而在证明算法是正确的基础上,第二部就是分析算法的时间复杂度。
算法的时间复杂度反映了程序执行时间随输入规模增长而增长的量级,在很大程度上能很好反映出算法的优劣与否。
因此,作为程序员,掌握基本的算法时间复杂度分析方法是很有必要的。
算法执行时间需通过依据该算法编制的程序在计算机上运行时所消耗的时间来度量。
而度量一个程序的执行时间通常有两种方法。
一、事后统计的方法这种方法可行,但不是一个好的方法。
该方法有两个缺陷:一是要想对设计的算法的运行性能进行评测,必须先依据算法编制相应的程序并实际运行;二是所得时间的统计量依赖于计算机的硬件、软件等环境因素,有时容易掩盖算法本身的优势。
二、事前分析估算的方法因事后统计方法更多的依赖于计算机的硬件、软件等环境因素,有时容易掩盖算法本身的优劣。
因此人们常常采用事前分析估算的方法。
在编写程序前,依据统计方法对算法进行估算。
一个用高级语言编写的程序在计算机上运行时所消耗的时间取决于下列因素:(1). 算法采用的策略、方法;(2). 编译产生的代码质量;(3). 问题的输入规模;(4). 机器执行指令的速度。
一个算法是由控制结构(顺序、分支和循环3种)和原操作(指固有数据类型的操作)构成的,则算法时间取决于两者的综合效果。
为了便于比较同一个问题的不同算法,通常的做法是,从算法中选取一种对于所研究的问题(或算法类型)来说是基本操作的原操作,以该基本操作的重复执行的次数作为算法的时间量度。
1、时间复杂度(1)时间频度一个算法执行所耗费的时间,从理论上是不能算出来的,必须上机运行测试才能知道。
但我们不可能也没有必要对每个算法都上机测试,只需知道哪个算法花费的时间多,哪个算法花费的时间少就可以了。
并且一个算法花费的时间与算法中语句的执行次数成正比例,哪个算法中语句执行次数多,它花费时间就多。
常用算法时间复杂度在计算机科学领域中,算法是解决问题的一种方法。
算法的好坏不仅与其解决问题的准确性相关,而且和其所需的时间和空间复杂度也有关。
时间复杂度是度量算法执行所需时间的数量级,通常用大O符号表示,因此也被称为大O复杂度。
下面介绍一些常用算法的时间复杂度。
1. 常数时间复杂度(O(1))此类算法与输入规模大小无关,执行时间始终相同。
例如,访问数组的某个元素,可以通过索引直接访问,不需要循环遍历整个数组。
2. 线性时间复杂度(O(n))此类算法的执行时间与输入规模成线性关系。
例如,遍历一个数组,需要循环访问每个元素一次,时间复杂度为O(n)。
3. 对数时间复杂度(O(logn))此类算法的执行时间与输入规模成对数关系。
例如,二分查找算法,每次执行都能将待查找元素的搜索区间缩小一半,因此时间复杂度为O(logn)。
4. 平方时间复杂度(O(n^2))此类算法的执行时间与输入规模的平方成正比。
例如,嵌套循环遍历二维数组,需要执行n*n次操作,时间复杂度为O(n^2)。
5. 立方时间复杂度(O(n^3))此类算法的执行时间与输入规模的立方成正比。
例如,嵌套循环遍历三维数组,需要执行n*n*n次操作,时间复杂度为O(n^3)。
6. 指数时间复杂度(O(2^n))此类算法的执行时间随着输入规模的增加呈指数级增长。
例如,求解某些NP问题(非确定性多项式问题)的暴力搜索算法,时间复杂度为O(2^n)。
7. 阶乘时间复杂度(O(n!))此类算法的执行时间随着输入规模的增加呈阶乘级增长。
例如,通过枚举法求解某些问题,每次需要执行n!次操作,时间复杂度为O(n!)。
在实际应用中,时间复杂度是衡量算法效率的重要指标,因此开发人员需要在设计时考虑时间复杂度优化问题。
如果算法复杂度较高,可能会导致程序执行时间过长,甚至无法正常运行。
因此,开发人员需要根据具体情况来选择合适的算法,以达到更好的性能要求。
时间复杂度分析及常用算法复杂度排名随着计算机技术的不断发展,人们对于算法的效率也提出了更高的要求。
好的算法可以大大地提高程序的运行效率,而坏的算法则会导致程序运行缓慢,浪费更多的时间和资源。
因此,在实际的开发中,需要对算法的效率进行评估和分析。
其中,时间复杂度是评估算法效率的重要指标之一,接下来就让我们来探讨一下时间复杂度分析及常用算法复杂度排名。
一、时间复杂度时间复杂度,简称时间复杂度,是指在算法中用来衡量算法运行时间大小的量。
通常情况下,时间复杂度用 O(n) 来表示,其中n 表示输入数据规模的大小。
由于常数系数和低次项不会对时间复杂度的大致表示产生影响,因此,时间复杂度的精确算法往往会被简化为最高次项的时间复杂度,即 O(n)。
二、时间复杂度的分析时间复杂度可以通过算法中的循环次数来分析。
一般来说,算法中的循环分为两种情况:一种是 for 循环,一种是 while 循环。
因为 for 循环的循环次数一般是固定的,因此可以通过循环次数来估算时间复杂度;而 while 循环的循环次数取决于输入数据的大小,因此时间复杂度的分析需要基于输入数据的规模进行分析和推导。
三、时间复杂度的常见表示法在实际的算法分析中,常常用到以下几种时间复杂度表示法:常数阶 O(1)、对数阶 O(logn)、线性阶 O(n)、线性对数阶 O(nlogn)、平方阶 O(n^2)、立方阶 O(n^3)、指数阶 O(2^n) 等。
常数阶 O(1):表示算法的时间不随着输入规模的增加而增加,即不论输入数据的大小,算法的运行时间都是固定的。
例如,最好的情况下,二分查找的时间复杂度即为 O(1)。
对数阶 O(logn):表示算法的时间复杂度随着输入规模的增加而增加,但增长比较缓慢,即随着输入规模的每增加一倍,算法所需的运行时间大致增加一个常数。
例如,二分查找的时间复杂度即为 O(logn)。
线性阶 O(n):表示算法的时间复杂度随着输入规模的增加而增加,增长速度与输入规模成线性比例关系。
算法基本知识点总结一、算法的基本概念1. 算法的定义算法是用来解决特定问题的有限步骤的有序集合。
算法是一种计算方法,可以描述为一系列清晰的步骤,用来解决特定问题或执行特定任务。
2. 算法的特性(1)有穷性:算法必须在有限的步骤内结束。
(2)确定性:对于相同输入,算法应该产生相同的输出。
(3)可行性:算法必须可行,即算法中的每一步都可以通过已知的计算机能力来执行。
3. 算法的设计目标(1)正确性:算法应该能够解决给定的问题。
(2)可读性:算法应该易于理解和解释。
(3)高效性:算法应该能在合理的时间内完成任务。
二、算法的复杂度分析1. 时间复杂度算法的时间复杂度表示算法执行所需的时间长度,通常用“大O记法”表示。
时间复杂度反映了算法的运行时间与输入规模之间的关系。
常见的时间复杂度包括:(1)O(1):常数时间复杂度,表示算法的运行时间与输入规模无关。
(2)O(logn):对数时间复杂度,表示算法的运行时间与输入规模的对数成正比。
(3)O(n):线性时间复杂度,表示算法的运行时间与输入规模成正比。
(4)O(nlogn):线性对数时间复杂度,表示算法的运行时间与输入规模和对数成正比。
(5)O(n^2):平方时间复杂度,表示算法的运行时间与输入规模的平方成正比。
(6)O(2^n):指数时间复杂度,表示算法的运行时间与输入规模的指数成正比。
2. 空间复杂度算法的空间复杂度表示算法执行所需的内存空间大小。
常见的空间复杂度包括:(1)O(1):常数空间复杂度,表示算法的内存空间与输入规模无关。
(2)O(n):线性空间复杂度,表示算法的内存空间与输入规模成正比。
三、常见的算法设计思想1. 贪心算法贪心算法是一种选取当前最优解来解决问题的算法。
贪心算法的核心思想是从问题的某一初始解出发,通过一系列的局部最优选择,找到全局最优解。
2. 动态规划动态规划是一种将原问题分解成子问题来求解的方法。
动态规划通常适用于具有重叠子问题和最优子结构性质的问题。
如何计算时间复杂度和空间复杂度计算时间复杂度和空间复杂度是衡量算法效率的重要方法,可以通过对算法的代码进行分析和推算来得出。
时间复杂度描述了算法运行时间随输入规模增长而增长的趋势,通常用大O符号表示。
在计算时间复杂度时,我们需要关注算法中的循环、递归、条件分支等关键代码块。
以下是计算时间复杂度的一些常见方法:1.计算常数时间复杂度:如果一个算法的代码只包含固定数量的操作,不随输入规模变化,那么它的时间复杂度为O(1)。
例如,简单的赋值、比较和常量运算等操作。
2.计算线性时间复杂度:如果一个算法的代码中包含一个循环,该循环的迭代次数与输入规模n成正比,那么其时间复杂度为O(n)。
例如,遍历一个数组或者链表的操作。
3.计算平方时间复杂度:如果一个算法的代码中包含两个嵌套的循环,外层循环的迭代次数与输入规模n成正比,内层循环的迭代次数也与输入规模n成正比,那么其时间复杂度为O(n^2)。
例如,二重循环嵌套的矩阵操作。
4.计算指数时间复杂度:如果一个算法的代码中包含递归调用,且递归次数与输入规模n成正比,那么其时间复杂度可能是指数级别的,如O(2^n)。
例如,求解斐波那契数列的递归算法。
计算空间复杂度是用来衡量算法所需的额外存储空间随输入规模增长而增长的趋势。
以下是计算空间复杂度的一些常见方法:1.计算固定空间复杂度:如果一个算法的代码所需的额外存储空间不随输入规模变化,那么它的空间复杂度为O(1)。
例如,仅需要几个变量来存储中间计算结果的操作。
2.计算线性空间复杂度:如果一个算法的代码所需的额外存储空间随输入规模n成正比,那么它的空间复杂度为O(n)。
例如,需要创建一个数组或链表来存储输入数据的操作。
3.计算递归空间复杂度:如果一个算法中使用了递归调用,那么每个递归调用都需要创建一个新的函数调用栈帧,因此空间复杂度可能是O(n),其中n是递归的深度。
例如,递归求解二叉树问题的操作。
在进行时间复杂度和空间复杂度的计算时,可以按照以下步骤进行:1.根据算法的代码,找出其中的关键代码块,例如循环、递归等。
时间的复杂度详解时间复杂度是衡量算法运行时间的一种度量方式,用大O符号(O)来表示。
它描述了算法所需的计算步骤数随问题规模的增长率。
在计算机科学中,时间复杂度主要关注的是算法在处理大规模问题时所需的时间。
为了更好地理解时间复杂度,我们需要先了解一些基本概念。
1.基本操作在算法中,基本操作是指运算的最小单位。
它们通常是赋值、比较、运算、访问数组元素等。
基本操作的数量是衡量算法运行时间的关键。
2.渐近表示法时间复杂度使用大O符号来表示,表示算法运行时间的上界。
例如,如果一个算法的时间复杂度为O(n),意味着算法的运行时间最多是输入规模n的某个常数倍。
大O符号忽略了低阶项和常数项,只关注随问题规模增长最快的那一项。
下面我们来详细讨论几个常见的时间复杂度。
1.常数时间复杂度O(1)无论输入规模大小,常数时间复杂度的算法都具有固定的运行时间。
例如,访问数组元素或者执行一个赋值语句。
常数时间复杂度通常是最理想的情况,但在实际中很难实现。
2.线性时间复杂度O(n)线性时间复杂度表示随着输入规模n的增长,算法的运行时间也会线性增长。
例如,遍历一个数组或者链表中的所有元素。
每个元素都需要进行常数次的基本操作,所以总的时间复杂度为O(n)。
3.对数时间复杂度O(log n)对数时间复杂度通常出现在数据规模减半的情况下。
例如,在二分查找算法中,每次查找都可以将问题规模减半。
对数时间复杂度的算法是非常高效的,因为随着问题规模的增长,算法的运行时间只会以对数方式增长。
4.平方时间复杂度O(n^2)平方时间复杂度表示随着输入规模n的增长,算法的运行时间会呈平方级别增长。
例如,嵌套循环中的每次迭代都需要进行常数次的基本操作。
平方时间复杂度的算法常常效率较低,通常不适用于处理大规模问题。
5.指数时间复杂度O(2^n)指数时间复杂度表示随着输入规模n的增长,算法的运行时间呈指数级别增长。
例如,在TSP(旅行商问题)的暴力求解方法中,对于每个城市,旅行商都需要选择下一个未访问的城市,因此总的时间复杂度会呈指数级别增长。
衡量算法优劣的两个主要指标在计算机科学和数据分析领域,衡量算法优劣的指标是非常重要的。
选择正确的算法可以显著提高计算效率和准确性。
本文将介绍两个主要的衡量算法优劣的指标:时间复杂度和空间复杂度。
1. 时间复杂度时间复杂度是衡量算法执行时间随输入规模增长而增长的速率。
它用大O符号来表示,表示最坏情况下执行时间的上界。
常见的时间复杂度有:•常数时间复杂度 O(1):无论输入规模如何变化,执行时间都保持不变。
•对数时间复杂度 O(log n):随着输入规模呈指数级增长,执行时间以对数方式增加。
•线性时间复杂度 O(n):随着输入规模线性增长,执行时间也线性增加。
•线性对数时间复杂度 O(n log n):随着输入规模线性增长,但是增速比线性更快。
•平方级时间复杂度 O(n^2):随着输入规模平方级增长,执行时间也平方级增加。
•指数级时间复杂度 O(2^n):随着输入规模指数级增长,执行时间以指数方式增加。
衡量算法优劣时,我们通常关注最坏情况下的时间复杂度。
较低的时间复杂度意味着算法在处理大规模数据时更高效。
2. 空间复杂度空间复杂度是衡量算法所需内存随输入规模增长而增长的速率。
它也用大O符号来表示,表示最坏情况下所需内存的上界。
常见的空间复杂度有:•常数空间复杂度 O(1):无论输入规模如何变化,所需内存保持不变。
•线性空间复杂度 O(n):随着输入规模线性增长,所需内存也线性增加。
•平方级空间复杂度 O(n^2):随着输入规模平方级增长,所需内存也平方级增加。
与时间复杂度类似,较低的空间复杂度意味着算法在处理大规模数据时更节省内存。
3. 时间复杂度和空间复杂度之间的平衡在选择算法时,我们需要根据具体问题和应用场景综合考虑时间复杂度和空间复杂度之间的平衡。
有些情况下,我们可能更关注执行时间,而有些情况下,我们可能更关注内存消耗。
•当处理大规模数据时,通常更关注时间复杂度。
选择具有较低时间复杂度的算法可以显著提高计算效率。
算法分析与复杂性理论算法是计算机科学中的重要概念,它是解决问题的一系列步骤或指令。
但是,并不是所有的算法都一样效率高,因此我们需要进行算法分析来评估算法的性能。
同时,复杂性理论则是用来研究算法在不同规模下的复杂性和可解性。
本文将深入探讨算法分析与复杂性理论的相关概念和方法。
一、算法分析算法分析是评估算法性能的过程,我们通常关注算法的时间复杂度和空间复杂度。
1. 时间复杂度时间复杂度表示算法解决问题所需的时间资源。
在进行时间复杂度分析时,一般会考虑最坏情况下的所需时间。
常见的时间复杂度有常数时间O(1),线性时间O(n),对数时间O(log n),平方时间O(n^2)等。
2. 空间复杂度空间复杂度表示算法解决问题所需的空间资源。
与时间复杂度类似,我们通常考虑最坏情况下的所需空间。
常见的空间复杂度有常数空间O(1),线性空间O(n),对数空间O(log n),平方空间O(n^2)等。
二、复杂性理论复杂性理论是研究算法在不同规模下的复杂性和可解性的学科领域。
1. NP问题NP(Nondeterministic Polynomial)问题是指可以在多项式时间内验证解答是否正确的问题。
这意味着如果我们能够在多项式时间内找到一个解答,那么我们也可以在多项式时间内验证该解答是否正确。
然而,尚未找到高效的算法来解决NP问题。
2. P问题P(Polynomial)问题是指可以在多项式时间内解决的问题。
也就是说,存在一个算法可以在多项式时间内找到问题的解答。
3. NP完全问题NP完全问题是指既属于NP问题,又属于最难的NP问题。
如果我们能够在多项式时间内找到一个解答,那么我们可以在多项式时间内解决所有的NP问题。
目前,还没有找到高效的算法来解决NP完全问题。
三、算法优化为了提高算法的效率,我们可以进行算法优化。
常用的算法优化方法包括贪心算法、动态规划、分治法等。
1. 贪心算法贪心算法是一种每次都选择当前最优解的策略。
福州大学数学与计算机科学学院《计算机算法设计与分析》上机实验报告(1)(1)将所有的数n个以每5个划分为一组共组,将不足5个的那组忽略,然后用任意一种排序算法,因为只对5个数进行排序,所以任取一种排序法就可以了。
将每组中的元素排好序再分别取每组的中位数,得到个中位数。
(2)取这个中位数的中位数,如果是偶数,就找它的2个中位数中较大的一个作为划分基准。
(3)将全部的数划分为两个部分,小于基准的在左边,大于等于基准的放右边。
在这种情况下找出的基准x至少比个元素大。
因为在每一组中有2个元素小于本组的中位数,有个小于基准,中位数处于,即个中位数中又有个小于基准x。
因此至少有个元素小于基准x。
同理基准x也至少比个元素小。
而当n≥75时≥n/4所以按此基准划分所得的2个子数组的长度都至少缩短1/4。
通过上述说明可以证明将原问题分解为两个子问题进行求解能够更加节省求解时间。
3.查找中位数程序代码1.#include "stdafx.h"2.#include <ctime>3.#include <iostream>ing namespace std;5.6.template <class Type>7.void Swap(Type &x,Type &y);8.9.inline int Random(int x, int y);10.11.template <class Type>12.void BubbleSort(Type a[],int p,int r);13.14.template <class Type>15.int Partition(Type a[],int p,int r,Type x);16.17.template <class Type>18.Type Select(Type a[],int p,int r,int k);19.20.int main()21.{22.//初始化数组23.int a[200];24.25.//必须放在循环体外面26. srand((unsigned)time(0));27.28.for(int i=0; i<200; i++)29. {30. a[i] = Random(0,500);31. cout<<"a["<<i<<"]:"<<a[i]<<" ";32. }33. cout<<endl;34.35. cout<<"第100小的元素是"<<Select(a,0,199,100)<<endl;36.37.//重新排序,对比结果38. BubbleSort(a,0,199);39.40.for(int i=0; i<200; i++)41. {42. cout<<"a["<<i<<"]:"<<a[i]<<" ";43. }44. cout<<endl;45.}46.47.template <class Type>48.void Swap(Type &x,Type &y)49.{50. Type temp = x;51. x = y;52. y = temp;53.}54.55.inline int Random(int x, int y)56.{57.int ran_num = rand() % (y - x) + x;58.return ran_num;59.}60.61.//冒泡排序62.template <class Type>63.void BubbleSort(Type a[],int p,int r)64.{65.//记录一次遍历中是否有元素的交换66.bool exchange;67.for(int i=p; i<=r-1;i++)68. {69. exchange = false ;70.for(int j=i+1; j<=r; j++)71. {72.if(a[j]<a[j-1])73. {74. Swap(a[j],a[j-1]);75. exchange = true;76. }77. }78.//如果这次遍历没有元素的交换,那么排序结束79.if(false == exchange)80. {81.break ;82. }83. }84.}85.86.template <class Type>87.int Partition(Type a[],int p,int r,Type x)88.{89.int i = p-1,j = r + 1;90.91.while(true)92. {93.while(a[++i]<x && i<r);94.while(a[--j]>x);95.if(i>=j)96. {97.break;98. }99. Swap(a[i],a[j]);100. }101.return j;102.}103.104.105.template <class Type>106.Type Select(Type a[],int p,int r,int k)107.{108.if(r-p<75)109. {110. BubbleSort(a,p,r);111.return a[p+k-1];112. }113.//(r-p-4)/5相当于n-5114.for(int i=0; i<=(r-p-4)/5; i++)115. {116.//将元素每5个分成一组,分别排序,并将该组中位数与a[p+i]交换位置117.//使所有中位数都排列在数组最左侧,以便进一步查找中位数的中位数118. BubbleSort(a,p+5*i,p+5*i+4);119. Swap(a[p+5*i+2],a[p+i]);120. }121.//找中位数的中位数122. Type x = Select(a,p,p+(r-p-4)/5,(r-p-4)/10);123.int i = Partition(a,p,r,x);124.int j = i-p+1;125.if(k<=j)126. {127.return Select(a,p,i,k);128. }129.else130. {1.实验结果说明(找中位数结果截图)实验结果2.实验结果分析通过上面的结果图可以看出程序能够快速生成一个无序数组并找到第K小的元素。
计算机算法分析大学计算机基础知识时间复杂度计算机算法分析是大学计算机基础知识中非常重要的一部分。
在进行算法分析时,我们需要关注算法的时间复杂度。
本文将为您解析时间复杂度的概念及其在计算机算法中的应用。
一、时间复杂度的定义时间复杂度是衡量算法执行时间的一种指标,用来描述在不同规模输入下算法的执行时间与输入规模的增长关系。
通常用大O符号表示,例如O(n)、O(n^2)等。
二、常见的时间复杂度1. 常数时间复杂度:O(1)常数时间复杂度表示无论输入规模的大小,算法的执行时间都是恒定的。
这是最理想的情况,例如简单的赋值语句或常数运算。
2. 线性时间复杂度:O(n)线性时间复杂度表示算法的执行时间随着输入规模的增长呈线性关系。
例如遍历一个数组或链表的操作,需要逐个处理其中的元素。
3. 对数时间复杂度:O(logn)对数时间复杂度表示算法的执行时间随着输入规模的增长呈对数关系。
例如二分查找算法,每次将输入规模缩小一半。
4. 平均时间复杂度:O(nlogn)平均时间复杂度表示在所有可能输入情况下的平均执行时间。
例如快速排序算法,在平均情况下的时间复杂度为O(nlogn)。
5. 最坏时间复杂度:O(n^2)最坏时间复杂度表示在最不利于算法执行的情况下,算法的执行时间将达到最高。
例如冒泡排序算法,在最坏情况下的时间复杂度为O(n^2)。
6. 指数时间复杂度:O(2^n)指数时间复杂度表示算法的执行时间随着输入规模的增长呈指数关系。
例如求解旅行商问题的穷举算法。
三、选择合适的算法与优化在分析算法的时间复杂度时,我们可以选择时间复杂度较低的算法。
例如,对于需要对大量数据排序的问题,选择快速排序而不是冒泡排序。
此外,我们可以通过算法的改进和优化来降低时间复杂度。
例如,在某些情况下,通过采用空间换时间的策略,我们可以将时间复杂度由O(n^2)优化为O(nlogn)。
四、算法分析的实际应用1. 算法性能评估通过分析算法的时间复杂度,我们可以对不同算法的性能进行评估和比较,以选择最适合的算法。
算法分析线性时间选择复杂度分析
第二组:袁瑾(计科1304:201308010410),
欧阳玉峰(计科1304:201308080216),
程帆瑾(物联1302:201378010206)。
一、问题描述:
给一个线性序列,要求在一个平均时间线性的情况下进行第k小元素的选择。
二、方法一:
模仿快速排序的方法对输入序列进行递归划分,但只对划分出的子数组之一进行递归处理。
代码如下:
RandomizedSelect(a, p, r, k):
if p==r :
return a[p]
i = RandomizedPartition(a,p,r)
j = i-p+1
if k<=j :
return RandomizedSelect(a,p,i,k)
return RandomizedSelect(a,i+1,r,k-j)
三、方法一时间复杂度:
先从上边的函数说起。
其实质是模拟一个快速排序的过程。
快速排序是随机选择一个轴值,然后比轴值小的排在左边,比轴值大的排在右边。
上边的函数四个参数a,p,r,k。
a是数组的参数,p是数组开始元素的下标,r的数组结束的下标。
k是找第k小的元素。
每次划分所需要的时间是O(n),此时每个元素需要和轴值进行比较一次。
所以最好的情况是选完轴值一次快排后,左边刚好有k-1个元素,则此时轴值则是第k小元素。
而一般情况是,轴值左边有m个元素,m<k时,在右边找第k-m小的元素,m>k时,在左边找第k小的元素。
平均复杂度是O(n)。
最坏的情况是轴值每次选的都是刚好最大的元素或者最小的元素,此时时间复杂度是O(n*k)。
四.方法二:
能在线性时间内找到一个划分基准,使得按照这个基准所划分出的两个子数组长度都至少为元数组长度的 m 倍:
Select(a, p, r, k):
if r-p<MG :
sort(a[p:r])
return a[p+k-1]
for i in 0...(r-p-4)/5 :
将a[p+5*i]...a[p+5*i+4]的第3小元素与a[p+i]交换
x=Select(a,p,p+(r-p-4)/5,(r-p-4)/10)
i=Partition(a,p,r,x)
j=i-p+1
if k<=j :
return Select(a,p,i,k)
return Select(a,i+1,r,k-j)
五、算法及其复杂度分析:⌊3(n-5)/10⌋⌈n/5⌉
<1> 将所有的数n个以每5个划分为一组共⌈n/5⌉组,将不足5个的那组忽略,然后用任意一种排序算法,因为只对5个数进行排序,所以任取一种排序法就可以了。
将每组中的元素排好序再分别取每组的中位数,得到个⌈n/5⌉中位数。
<2> 取这⌈n/5⌉个中位数的中位数,如果是偶数,就找它的2个中位数中较大的一个作为划分基准。
<3> 将全部的数划分为两个部分,小于基准的在左边,大于等于基准的放右边。
在这种情况下找出的基准x至少比⌊3(n-5)/10⌋个元素大。
因为在每一组中有2个元素小于本组的中位数,有个⌊n/5-1⌋小于基准,中位数处于1/2*⌊(n/5-1⌋,即⌊n/5⌋个中位数中又有⌊n/5-10⌋个小于基准x。
因此至少有3(⌊n-5⌋/10)个元素小于基准x。
同理基准x也至少比⌊3(n-5)/ 10⌋个元素小。
而当n≧75时⌊3(n-5)/10⌋≧n/4所以按此基准划分所得的2个子数组的长度都至少缩短1/4。
在线性时间内找到一个划分基准,使得按照这个基准所划分出的两个子数组长度都至少为元数组长度的 m 倍(0 < m < 1),那么在最坏情况下用O(n)时间就可以完成选择任务。
例如,m=9/10 ,算法递归调用所产生的子数组长度至少缩短1/10。
所以,在最坏情况下,算法所需的时间为T(n)满足递归式T(n) ≦ T(9n/10)+O(n)。
由此可得T(n)=O(n)。