第10课哈希查找

格式：ppt
大小：534.50 KB
文档页数：36

下载文档原格式

/ 36

哈希表查找方法原理

哈希表查找方法原理哈希表查找方法什么是哈希表•哈希表是一种常见的数据结构，也被称为散列表。

•它可以提供快速的插入、删除和查找操作，时间复杂度在平均情况下为O(1)。

•哈希表由数组组成，每个数组元素称为桶(bucket)。

•存储数据时，通过哈希函数将数据映射到对应的桶中。

哈希函数的作用•哈希函数是哈希表的核心部分，它将数据转换为哈希值。

•哈希函数应该具备以下特点：–易于计算：计算哈希值的时间复杂度应尽量低。

–均匀分布：哈希函数应能将数据均匀地映射到不同的桶中，以避免桶的过度填充或者空闲。

–独特性：不同的输入应该得到不同的哈希值，以尽量减少冲突。

哈希冲突及解决方法•哈希冲突指两个或多个数据被哈希函数映射到同一个桶的情况。

•常见的解决哈希冲突的方法有以下几种：–链地址法(Chaining)：将相同哈希值的数据存储在同一个桶中，通过链表等数据结构来解决冲突。

–开放地址法(Open Addressing)：当发生冲突时，通过特定的规则找到下一个可用的桶来存储冲突的数据，如线性探测、二次探测等。

–再哈希法(Rehashing)：当发生冲突时，使用另一个哈希函数重新计算哈希值，并将数据存储到新的桶中。

哈希表的查找方法•哈希表的查找方法分为两步：1.根据哈希函数计算数据的哈希值，并得到对应的桶。

2.在桶中查找目标数据，如果找到则返回，否则表示数据不存在。

哈希表的查找性能•在理想情况下，哈希表的查找时间复杂度为O(1)。

•然而，由于哈希冲突的存在，查找时间可能会稍微增加。

•如果哈希函数设计得不好，导致冲突较多，可能会使查找时间复杂度接近O(n)。

•因此，选择合适的哈希函数和解决冲突的方法对于提高哈希表的查找性能非常重要。

总结•哈希表是一种高效的数据结构，适用于快速插入、删除和查找操作的场景。

•哈希函数的设计和解决冲突的方法直接影响哈希表的性能。

•在实际应用中，需要根据数据特点选择合适的哈希函数和解决冲突的方法，以提高哈希表的查找性能。

哈希表(Hash)的查找

哈希表（Hash）的查找一、哈希表相关概念1、哈希函数的基本概念哈希表又称散列表。

哈希表存储的基本思想是：以数据表中的每个记录的关键字 k为自变量，通过一种函数H(k)计算出函数值。

把这个值解释为一块连续存储空间（即数组空间）的单元地址（即下标），将该记录存储到这个单元中。

在此称该函数H为哈希函数或散列函数。

按这种方法建立的表称为哈希表或散列表。

理想情况下，哈希函数在关键字和地址之间建立了一个一一对应关系，从而使得查找只需一次计算即可完成。

由于关键字值的某种随机性，使得这种一一对应关系难以发现或构造。

因而可能会出现不同的关键字对应一个存储地址。

即k1≠k2，但H(k1)=H(k2)，这种现象称为冲突。

把这种具有不同关键字值而具有相同哈希地址的对象称“同义词”。

在大多数情况下，冲突是不能完全避免的。

这是因为所有可能的关键字的集合可能比较大，而对应的地址数则可能比较少。

对于哈希技术，主要研究两个问题：（1）如何设计哈希函数以使冲突尽可能少地发生。

（2）发生冲突后如何解决。

2、哈希函数的构造方法常见的构造方法有很多种，如直接定址法，数字分析法，平方取中法等。

接下来，我们介绍其中的几种：（1）除留余数法取关键字k被某个不大于表长m的数p除后所得余数作为哈希函数地址的方法。

即：H（k）＝k mod ｐ这种方法的关键是选择好p。

使得数据集合中的每一个关键字通过该函数转化后映射到哈希表的任意地址上的概率相等。

理论研究表明，一般取p为小于ｍ的最大质数或不包含小于20的质因素的合数。

（2）平方取中法先将关键字平方，然后取其中间几位作为散列地址。

所取位数由地址空间范围决定。

若地址空间小于所取位数值决定的范围，可通过乘以一比例因子来解决。

（3）折叠法把关键字分割成位数相等（最后一部分的位数可以不同）的几部分，然后通过折叠后将几部分进行相加，丢掉进位位，所得值即为散列地址。

散列的位数由地址空间的位数而定。

分割方法：从右至左相加方法有两种：移位叠加：将分割后的各部分低位对齐相加。

详解哈希表的查找

详解哈希表的查找哈希表和哈希函数在记录的存储位置和它的关键字之间是建立一个确定的对应关系（映射函数），使每个关键字和一个存储位置能唯一对应。

这个映射函数称为哈希函数，根据这个原则建立的表称为哈希表(Hash Table)，也叫散列表。

以上描述，如果通过数学形式来描述就是：若查找关键字为key，则其值存放在f(key) 的存储位置上。

由此，不需比较便可直接取得所查记录。

注：哈希查找与线性表查找和树表查找最大的区别在于，不用数值比较。

冲突若key1 ≠ key2 ，而f(key1) = f(key2)，这种情况称为冲突(Collision)。

根据哈希函数f(key)和处理冲突的方法将一组关键字映射到一个有限的连续的地址集（区间）上，并以关键字在地址集中的“像”作为记录在表中的存储位置，这一映射过程称为构造哈希表。

构造哈希表这个场景就像汽车找停车位，如果车位被人占了，只能找空的地方停。

构造哈希表由以上内容可知，哈希查找本身其实不费吹灰之力，问题的关键在于如何构造哈希表和处理冲突。

常见的构造哈希表的方法有 5 种：（1）直接定址法说白了，就是小学时学过的一元一次方程。

即 f(key) = a * key + b。

其中，a和b 是常数。

（2）数字分析法假设关键字是R进制数（如十进制）。

并且哈希表中可能出现的关键字都是事先知道的，则可选取关键字的若干数位组成哈希地址。

选取的原则是使得到的哈希地址尽量避免冲突，即所选数位上的数字尽可能是随机的。

（3）平方取中法取关键字平方后的中间几位为哈希地址。

通常在选定哈希函数时不一定能知道关键字的全部情况，仅取其中的几位为地址不一定合适；而一个数平方后的中间几位数和数的每一位都相关，由此得到的哈希地址随机性更大。

取的位数由表长决定。

（4）除留余数法取关键字被某个不大于哈希表表长 m 的数 p 除后所得的余数为哈希地址。

即f(key) = key % p (p ≤ m)这是一种最简单、最常用的方法，它不仅可以对关键字直接取模，也可在折叠、平方取中等运算之后取模。

哈希查找_数据结构实验报告

哈希查找_数据结构实验报告哈希查找_数据结构实验报告一：实验目的本实验旨在掌握哈希查找算法的原理和实现方法，深入了解数据结构中的哈希查找技术，并通过实际操作加深对哈希查找的理解。

二：实验原理哈希查找是一种基于哈希函数的查找技术，通过将关键字通过哈希函数映射到哈希表中的位置进行查找。

其主要原理步骤如下：1. 创建哈希表：根据需求确定哈希表的大小，在内存中分配对应大小的空间。

2. 哈希函数的选择：根据关键字的特性选择适合的哈希函数，将关键字映射到哈希表的存储位置。

3. 插入操作：将关键字通过哈希函数计算得到索引位置，如果该位置为空，则直接插入；如果该位置已存在关键字，则发生冲突，需要解决冲突。

4. 冲突解决：常见的冲突解决方法包括线性探测、二次探测和链地址法等。

5. 查找操作：通过哈希函数计算得到关键字的索引位置，进行查找操作。

如果该位置为空，则表示查找失败；如果该位置不为空，则继续比较关键字是否相等。

6. 删除操作：将关键字标记为删除状态，或将该位置置为空。

三：实验步骤本实验中，我们以哈希表实现哈希查找算法，具体步骤如下：1. 创建哈希表：- 确定哈希表的大小。

- 在内存中分配对应大小的空间。

- 将所有位置初始化为空。

2. 哈希函数的选择：- 根据关键字的特性选择适合的哈希函数。

- 哈希函数应尽量保证均匀分布，避免冲突。

3. 插入操作：- 输入待插入的关键字。

- 通过哈希函数计算得到关键字的索引位置。

- 如果该位置为空，则直接插入关键字；如果该位置不为空，则发生冲突，需要解决冲突。

4. 冲突解决：- 使用线性探测法解决冲突：- 从发生冲突的位置向后逐个查找下一个为空的位置，直到找到空位置或遍历完整个哈希表。

- 如果找到空位置，则将关键字插入该位置；如果遍历完整个哈希表仍没有空位置，则插入失败。

- 使用链地址法解决冲突：- 在每个哈希表位置上维护一个链表，将冲突的关键字插入到链表中。

5. 查找操作：- 输入待查找的关键字。

哈希查找的名词解释

哈希查找的名词解释
哈希查找（HashSearch）是一种快速检索技术，通过计算一个项目的哈希值，来快速检索该项目是否存在于数据表中。

它的原理是：数据集合中的每一个元素首先通过哈希函数映射成一个数字，然后根据这个数字对查询表进行定位，再根据查找表中的信息检索出查找的数据。

哈希查找可用于查看某个数据是否存在于某集合之中，也可以用于查看某个数据的各种相关信息。

哈希函数：
哈希函数是一种将原始数据映射成散列值的函数，它常用于实现哈希操作，即从原始数据中找到一个映射而来的数据。

根据哈希函数，相同的原始数据将会映射到相同的散列值上，由此来节省查找时间，提高查找效率。

桶：
桶（Bucket）是哈希查找的一种技术，它是把所有映射到同一散列值上的元素放在同一个桶中，以加快查找速度。

哈希查找时，先根据哈希函数计算出元素的散列值，然后根据这个散列值在桶中查找，直到找到查找元素为止。

哈希表：
哈希表（Hash Table）是一种存储数据的数据结构，它由一个固定大小的数组组成，其中每个元素都以键值对保存数据，其中键是一个数字或字符串，而值是任意类型的数据。

哈希表很容易根据键快速查找到对应的值，因此，使用哈希表可以实现快速查找操作。

查找算法的应用----哈希查找

一、实验名称：
查找算法的应用----哈希查找
二、实验目的：
1．进一步了解查找算法的用途；
2．进一步巩固哈希函数及哈希表等有关概念；
3．掌握哈希表的创建及查找的过程和方法；
4．比较哈希查找与其它查找算法的不同，体会哈希查找的优缺点。

三、实验内容：
任意给定N个元素，用除留余数法构造哈希函数，用线性探测再散列的方法建立哈希表，在哈希表中进行查找，并在屏幕上显示哈希表及查找结果。

求出等概率条件的平均查找长度，验证结果是否正确。

四、实验要求
1．哈希表中元素的类型为结构体类型。

2．输出哈希表的内容，验证其是否正确。

3．任意给定一个关键字进行查找，验证查找结果是否正确。

给定的这个关键字应有两类：存在和不存在。

4．求出等概率条件的平均查找长度。

五、实验程序代码：
完整的源程序。

六、实验数据处理及实验结果：
实验中输入的数据及执行结果
七、实验小结：
上机中出现的问题、解决方法，对所学知识的进一步理解，以后需要注意的问题等。

实验日期：年月日
交报告日期：年月日。

哈希查找

数据结构
哈希查找
一、哈希表的基本概念二、构造哈希函数的方法三、处理冲突的方法四、哈希表的查找及分析
一、哈希表的基本概念
哈希（Hash）函数：如果在关键字与数据元素的存储位置之间建立某种对应关系H，根据这种对应关系就能很快地计算出与该关键字key对应的存储位置的值H(key)，我们将关键字与存储位置之间的这种对应关系称为哈希（Hash）函数。把关键字为key的元素直接存入地址为H(key)的存储单元，当查找关键字为key的元素时，利用哈希函数计算出该元素的存储位置H(key)，从而达到按关键字直接存取元素的目的。按照这个思想建立的查找表叫做哈希表，所得到的存储位置称为哈希地址，利用哈希表进行查找的方法称为哈希查找。
根据增量序列的取值方式的不同，开放定址法又分为以下三种： ① 线性探测再散列：di为1，2，3，…，h－1，即冲突发生时，顺序查看哈希表中的下一个位置，直到找出一个空位置或查遍整个表为止。
② 二次探测再散列：di为12，－12，2，－22，3，－32，…，k，－ k2 (k≤m/2)，即冲突发生时，在表的前后位置进行跳跃式探测。
5．除留余数法
除留余数法是指取关键字被某个不大于哈希表表长m的数p除后所得余数作为哈希地址，即 H(key)＝key%p (p≤m) 例如，已知关键字序列为{23，49，70，68，50，90}，对于表长为20的哈希表，选取p＝19，计算所得的哈希地址如下表所示。
6．随机数法
选择一个随机函数为哈希函数，取关键字的随机函数值为它的哈希地址，即H(key)＝random(key) 其中，random()为随机函数。随机数法适用于关键字长度不等的情况。
三、处理冲突的方法
所谓处理冲突是指，当由关键字计算出的哈希地址出现冲突时，为该关键字对应的数据元素找到另一个“空”的哈希地址。

哈希查找的流程

哈希查找的流程Hash lookup is a fundamental algorithm used in computer science to quickly retrieve data from a large dataset. The process involves using a hash function to map data to a unique key, which is then used to store and retrieve the data efficiently.哈希查找是计算机科学中使用的基本算法，用于从大型数据集中快速检索数据。

该过程涉及使用哈希函数将数据映射到唯一键，然后使用该键来高效地存储和检索数据。

From a technical perspective, the first step in a hash lookup process is to apply a hash function to the search key. This generates a unique hash value that is used as an index to access the corresponding data in a hash table. The hash table is a data structure that stores key-value pairs and allows for constant-time retrieval of data.从技术角度来看，哈希查找过程中的第一步是对搜索键应用哈希函数。

这将生成一个唯一的哈希值，该值用作索引来访问哈希表中的相应数据。

哈希表是一种存储键值对的数据结构，可以实现数据的常数时间检索。

One of the key advantages of hash lookup is its efficiency in retrieving data, especially in large datasets. This is because the use of a hash function allows for constant-time access to data, regardless of the size of the dataset. As a result, hash lookup is commonly used in applications where quick data retrieval is crucial, such as database systems and information retrieval systems.哈希查找的一个关键优势是它在检索数据方面的效率，特别是在大型数据集中。

哈希查找算法,处理冲突常用的方法

哈希查找算法,处理冲突常用的方法摘要：一、哈希查找算法简介二、处理冲突的常用方法1.开放寻址法2.链地址法3.循环链地址法4.树状地址法三、各方法优缺点分析四、总结正文：一、哈希查找算法简介哈希查找算法是一种在有序表中进行查找的方法，通过将待查找元素的键值映射到对应的存储位置，从而实现快速查找。

哈希查找算法把关键码映射到数组的一个位置，如果该位置为空，就将该元素放入该位置；如果不为空，说明发生了冲突，需要采用一定的方法处理冲突。

二、处理冲突的常用方法1.开放寻址法开放寻址法是在哈希表中预留一部分空间来处理冲突。

当发生冲突时，查找失败，遍历预留空间，直到找到空位置存放元素。

这种方法的优点是实现简单，缺点是会增加查找的时间复杂度。

2.链地址法链地址法是在哈希表的每个位置都存放一个链表，发生冲突时，将冲突元素添加到对应位置的链表中。

这种方法的优点是充分利用了哈希表的空间，缺点是需要维护链表，时间复杂度较高。

3.循环链地址法循环链地址法是链地址法的改进版本，通过引入循环链表来解决冲突。

当链表长度超过预设阈值时，重新分配哈希表空间，并将原链表中的元素重新哈希。

这种方法的优点是避免了链表过长，缺点是需要额外的空间来存储链表指针。

4.树状地址法树状地址法是将哈希表分为多个层次，每层使用不同的处理冲突方法。

发生冲突时，根据层次遍历树结构，直到找到空位置。

这种方法的优点是层次结构更加合理，缺点是树状结构的维护成本较高。

三、各方法优缺点分析开放寻址法优点：实现简单，时间复杂度较低。

开放寻址法缺点：空间利用率不高，可能导致哈希表空间浪费。

链地址法优点：空间利用率高，适用于大规模数据处理。

链地址法缺点：需要维护链表，时间复杂度较高。

循环链地址法优点：避免了链表过长，提高了查找效率。

循环链地址法缺点：需要额外的空间存储链表指针，且重新分配哈希表空间时会影响性能。

树状地址法优点：层次结构合理，空间利用率较高。

树状地址法缺点：维护成本较高，实现复杂。

常见的查找算法（七）：哈希查找

常见的查找算法（七）：哈希查找散列表（Hash table，也叫哈希表），是根据键（Key）⽽直接访问在内存存储位置的数据结构。

也就是说，它通过计算⼀个关于键值的函数，将所需查询的数据映射到表中⼀个位置来访问记录，这加快了查找速度。

这个映射函数称做散列函数，存放记录的数组称做散列表。

散列函数的规则是：通过某种转换关系，使关键字适度的分散到指定⼤⼩的的顺序结构中，越分散，则以后查找的时间复杂度越⼩，空间复杂度越⾼。

1. 直接定址法：取关键字或关键字的某个线性函数值为散列地址。

即hash(k) = k 或 hash(k) = a · k + b，其中a、b为常数（这种散列函数叫做⾃⾝函数）2. 数字分析法：假设关键字是以r为基的数，并且哈希表中可能出现的关键字都是事先知道的，则可取关键字的若⼲数位组成哈希地址。

3. 平⽅取中法：取关键字平⽅后的中间⼏位为哈希地址。

通常在选定哈希函数时不⼀定能知道关键字的全部情况，取其中的哪⼏位也不⼀定合适，⽽⼀个数平⽅后的中间⼏位数和数的每⼀位都相关，由此使随机分布的关键字得到的哈希地址也是随机的。

取的位数由表长决定。

4. 折叠法：将关键字分割成位数相同的⼏部分（最后⼀部分的位数可以不同），然后取这⼏部分的叠加和（舍去进位）作为哈希地址。

5. 随机数法6. 除留余数法：取关键字被某个不⼤于散列表表长m的数p除后所得的余数为散列地址。

即 hash(k) = k mod p， p<=m。

不仅可以对关键字直接取模，也可在折叠法、平⽅取中法等运算之后取模。

对p的选择很重要，⼀般取素数或m，若p选择不好，容易产⽣冲突。

Hash是⼀种典型以空间换时间的算法，⽐如原来⼀个长度为100的数组，对其查找，只需要遍历且匹配相应记录即可，从空间复杂度上来看，假如数组存储的是byte类型数据，那么该数组占⽤100byte空间。

现在我们采⽤Hash算法，我们前⾯说的Hash必须有⼀个规则，约束键与存储位置的关系，那么就需要⼀个固定长度的hash表，此时，仍然是100byte的数组，假设我们需要的100byte⽤来记录键与位置的关系，那么总的空间为200byte，⽽且⽤于记录规则的表⼤⼩会根据规则，⼤⼩可能是不定的。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

(2) H(38)=38 MOD 11=5 H1=(5+1² ) MOD 11=6 H2=(5-1² ) MOD 11=4
冲突冲突不冲突
(3) H(38)=38 MOD 11=5 冲突设伪随机数序列为9，则H1=(5+9) MOD 11=3 不冲突
0 1 2 3 4 5 6 7 8 9 10 38 38 60 17 29 38

1. 开放定址法
⑴ 线性探测法将散列表T[0 …m-1]看成循环向量。当发生冲突时，从初次发生冲突的位置依次向后探测其他的地址。增量序列为：di=1, 2, 3, …, m-1 设初次发生冲突的地址是h，则依次探测T[h+1]，T[h+2]…，直到 T[m-1]时又循环到表头，再次探测T[0]，T[1]…，直到T[h-1]。探测过程终止的情况是： ◆ 探测到的地址为空：表中没有记录。若是查找则失败；若是插入则将记录写入到该地址；
哈希函数是一种映象，其设定很灵活，hash的原义为” 杂凑”,只要使任何关键字的哈希函数值都落在表长允许的范围之内即可。哈希函数“好坏”的主要评价因素有： ◆ 散列函数的构造简单； ◆ 能“均匀”地将散列表中的关键字映射到地址空间。所谓“均匀”(uniform)是指发生冲突的可能性尽可能最少。
◆ 探测到的地址有给定的关键字：若是查找则成功；若是插入则失败
◆ 直到T[h]：仍未探测到空地址或给定的关键字，散列表满。
例1 ：设散列表长为7，记录关键字组为：15, 14, 28, 26, 56, 23，散列函数：H(key)=key MOD 7，冲突处理采用线性探测法。解：H(15)=15 MOD 7=1 H(14)=14 MOD 7=0 H(28)=28 MOD 7=0 冲突 H1(28)=1 又冲突H2(28)=2 H(26)=26 MOD 7=5 H(56)=56 MOD 7=0 H2(56)=2 又冲突 H3(23)=4 所得到的hash表: 0 1 2 3 4 5 6 冲突 H1(56)=1 又冲突 H3(56)=3
分析：只取8 只取1 只取3、4 只取2、7、5 数字分布近乎随机所以：取任意两位或两位与另两位的叠加作哈希地址
9.6.2 哈希函数的构造方法
3 平方取中法
将关键字平方后取中间几位作为哈希地址。一个数平方后中间几位和数的每一位都有关，则由随机分布的关键字得到的散列地址也是随机的。散列函数所取的位数由散列表的长度决定。这种方法适于不知道全部关键字情况，是一种较为常用的方法。
1. 开放定址法
⑵ 二次探测法增量序列为：di=1²,-1²,2²,-2²,3²,„„±k² (k⌊m/2⌋) 上述例题若采用二次探测法进行冲突处理，则： H(15)=15 MOD 7=1 H(14)=14 MOD 7=0
H(28)=28 MOD 7=0 H2(28)=4 H(26)=26 MOD 7=5
冲突
H1(28)=1
又冲突
H(56)=56 MOD 7=0
H2(56)=0 又冲突二次探测法的特点 H(23)=23 MOD 7=2
冲突
冲突
H1(56)=1
又冲突 H1(23)=3
又冲突
H4(56)=2
H3(56)=4
◆ 优点：探测序列跳跃式地散列到整个表中，不易产生冲突的 “聚集”现象； ◆ 缺点：不能保证探测到散列表的所有地址。
9.6.1
基本概念
3. 冲突：对于不同的关键字ki、kj，若kikj，但 H(ki)=H(kj)的现象叫冲突(collision) 。同义词：具有相同函数值的两个不同的关键字，称为该哈希函数的同义词。哈希函数通常是一种压缩映象，所以冲突不可避免，只能尽量减少；当冲突发生时，应该有处理冲突的方法。
p的选取的分析： ◆ 选取p=2i(pm)：运算便于用移位来实现，但等于将关键字的高位忽略而仅留下低位二进制数。高位不同而低位相同的关键字是同义词。 ◆ 选取p=qf (q、f都是质因数，pm)：则所有含有q或f因子的关键字的散列地址均是q或f的倍数。 ◆ 选取p为素数或p=qf(q、f是质数且均大于20，pm)：常用的选取方法，能减少冲突出现的可能性。
H(23)=23 MOD 7=2
冲突
H1(23)=3
又冲突
14 15 28 56 23 26
线性探测法的特点 ◆ 优点：只要散列表未满，总能找到一个不冲突的散列地址 ◆ 缺点：每个产生冲突的记录被散列到离冲突最近的空地址上，从而又增加了更多的冲突机会(这种现象称为冲突的“二次聚集”)。 ⑵ 二次探测法增量序列为：di=1² ,-1² ,2² ,-2² ,3² ,……±k² (k⌊m/2⌋) 上述例题若采用二次探测法进行冲突处理，则： H(15)=15 MOD 7=1 H(14)=14 MOD 7=0
9.6.2 哈希函数的构造方法
2 数字分析法对关键字的取值进行分析，取关键字的若干位或组合作为哈希地址。适用于关键字位数比哈希地址位数大，且可能出现的关键字事先知道的情况。
例：设有80个记录，关键字为8位十进制数，
哈希地址为2位十进制数。
┇ 8 8 8 8 8 8 8 8 1 1 1 1 1 1 1 1 3 3 3 3 3 3 3 4 4 7 8 0 2 3 6 1 6 2 7 1 2 8 8 9 5 2 4 3 8 9 5 3 3 4 2 6 1 6 3 5 2 2 2 7 7 7 7 5
9.6.3 冲突处理的方法
冲突处理：当出现冲突时，为冲突元素找到另一个存储位置的过程。
常用的冲突处理方法有: 1 开放定址法: 包括线性探测\二次探测\随机探测
2 再哈希法 3 链地址法 4 建立公共溢出区
1.
开放定址法
基本思想：当冲突发生时，形成某个探测序列；按此序列逐个探测散列表中的其他地址，直到找到给定的关键字或一个空地址(开放的地址)为止，将发生冲突的记录放到该地址中。散列地址的计算公式是： Hi(key)=(H(key)+di) MOD m，i=1, 2, „, k(km-1) 其中：H(key)：哈希函数；m：散列表长度； di：第i次探测时的增量序列； Hi(key) ：经第i次探测后得到的散列地址。常用的增量序列有: 线性探测再散列和平方探测再散列
9.6.1
基本概念
设计一个散列表应包括：散列表的空间范围，即确定散列函数的值域；
1.构造合适的散列函数，使得对于所有可能的元素 (记录的关键字)，函数值均在散列表的地址空间范围内，且出现冲突的可能尽量小； 2.处理冲突的方法。即当冲突出现时如何解决。
哈希查找要学习的内容主要包括以上2点.
9.6.2 哈希函数的构造方法
例：已知一组关键字(19, 14, 23, 1, 68, 20, 84, 27, 55, 11, 10, 79) ，哈希函数为：H(key)=key MOD 13，用链地址法处理冲突。
优点：不易产生冲突的“聚集”；删除记录也很简单。
0 1 2 3 4 5 6 7 8 9 10 11 12
⋀ ⋀ ⋀ ⋀ 14 68 19 20 ⋀ 1 55 ⋀ 84 ⋀ 27 79 ⋀
本课内容
一 .理解Hash查找的思想和相关概念:
哈希函数冲突和冲突处理方法二次聚集
二.掌握哈希表的构造
根据给定的哈希函数和冲突处理方法构造哈希表求平均查找长度
9. 6 哈希(散列)查找
基本思想：在记录的存储地址和它的关键字之间建立一个确定的对应关系；这样，不经过比较，一次存取就能得到所查元素的查找方法。编号 1 例 30个地区的各民族人口统计表省、市(区) 总人口汉族北京回族 …...
2 再哈希法
构造若干个哈希函数，当发生冲突时，利用不同的哈希函数再计算下一个新哈希地址，直到不发生冲突为止。即： Hi=RHi(key) i=1, 2, …, k RHi ：一组不同的哈希函数。第一次发生冲突时，用 RH1计算，第二次发生冲突时，用RH2计算…依此类推知道得到某个Hi不再冲突为止。 ◆ 优点：不易产生冲突的“聚集”现象； ◆ 缺点：计算时间增加。
例：设关键字为0442205864，哈希地址位数为4 。两种不同的地址计算方法如下： 5864
5864
移位叠加 0224 04 6092 H(key)=6092 间界叠加
4220 04
10088
H(key)=0088
9.6.2 哈希函数的构造方法
5 除留余数法取关键字被某个不大于哈希表表长m的数p除后所得余数作哈希地址，即H(key)=key MOD p (pm) 是一种简单、常用的哈希函数构造方法。这种方法的关键是p的选取，p选的不好，容易产生同义词。
3 链地址法
方法：将所有关键字为同义词(散列地址相同)的记录存储在一个单链表中，并用一维数组存放链表的头指针。设散列表长为m，定义一个一维指针数组： RecNode *linkhash[m]，其中RecNode是结点类型，每个分量的初值为空。凡散列地址为k的记录都插入到以linkhash[k]为头指针的链表中，插入位置可以在表头或表尾或按关键字排序插入。
9.6.2 哈希函数的构造方法
6 随机数法
取关键字的随机函数值作哈希地址，即 H(key)=random(key) 当散列表中关键字长度不等时，该方法比较合适。
选取哈希函数，应考虑以下因素:
◆ 计算哈希函数所需时间； ◆ 关键字的长度； ◆ 哈希表长度（哈希地址范围）； ◆ 关键字分布情况； ◆ 记录的查找频率。
9.6.2 哈希函数的构造方法
4 折叠法将关键字分割成位数相同的几部分(最后一部分可以不同)，然后取这几部分的叠加和作为哈希地址。数位叠加有移位叠加和间界叠加两种。 ◆ 移位叠加：将分割后的几部分低位对齐相加。
◆ 间界叠加：从一端到另一端沿分割界来回折迭，然后对齐相加。

第10课哈希查找

合集下载

哈希表查找方法原理

哈希表(Hash)的查找

详解哈希表的查找

哈希查找_数据结构实验报告

哈希查找的名词解释

查找算法的应用----哈希查找

哈希查找

哈希查找的流程

哈希查找算法,处理冲突常用的方法

常见的查找算法（七）：哈希查找

文档推荐

最新文档

第10课 哈希查找

合集下载

哈希表查找方法原理

哈希表(Hash)的查找

详解哈希表的查找

哈希查找_数据结构实验报告

哈希查找的名词解释

查找算法的应用----哈希查找

哈 希 查 找

哈希查找的流程

哈希查找算法,处理冲突常用的方法

常见的查找算法（七）：哈希查找

文档推荐

最新文档

第10课哈希查找

哈希查找