Hash函数及其应用

格式：pdf
大小：100.36 KB
文档页数：7

下载文档原格式

/ 7

hash函数的应用

hash函数的应用
Hash函数是一种将数据转换成固定长度散列值的函数。

在计算机科学中，它们用于许多不同的应用程序，包括密码学，数据结构，文本和图像相似性比较，以及许多其他领域。

## 密码学
Hash函数在密码学中广泛使用。

在密码学中，Hash函数被用来创建消息摘要。

一个消息摘要是一个固定长度的数字字符串，代表了一个消息或数据块。

它通常用于确保数据完整性，以及验证消息的来源。

## 数据结构
Hash函数在数据结构中也有广泛的应用。

它们被用来实现哈希表和哈希映射。

哈希表是一种数据结构，它可以快速查找和访问存储在其中的数据。

哈希映射是一种将键值对映射到散列表中的数据结构。

## 文本和图像相似性比较
Hash函数还可以用于比较文本和图像的相似性。

在这种情况下，Hash 函数被用来计算两个文本或图像之间的差异。

这种比较通常用于搜索引擎中，以找到与查询相匹配的文本或图像。

## 总结
Hash函数是一种非常有用的工具，可以用于许多不同的应用程序。

它们在密码学，数据结构，文本和图像相似性比较等领域都有广泛的应用。

对于计算机科学学生和从事相关领域的专业人士来说，了解Hash函数的应用非常重要。

hash的原理和实际应用

Hash的原理和实际应用1. 什么是HashHash（哈希）是一种常用的数据结构，用于将数据快速地映射到一个固定大小的、唯一的哈希值上。

在计算机科学中，哈希函数把不同大小的输入映射到固定大小的输出。

2. Hash的原理Hash函数的核心思想是将输入通过特定的算法运算，转换为一个固定长度的哈希值。

这个哈希值在理想情况下应该具有以下特点：•唯一性：不同的输入应该生成不同的哈希值。

•一致性：相同的输入应该生成相同的哈希值。

•高效性：哈希计算应该快速且高效。

常见的Hash算法有MD5、SHA-1、SHA-256等。

这些算法使用不同的运算方式，以满足上述特点。

其中，MD5是一种广泛使用的哈希算法，它能够将任意长度的输入数据转换为一个128位的哈希值。

3. Hash的实际应用Hash在计算机科学和软件工程领域有着广泛的应用，下面列举了几个常见的实际应用场景：3.1 数据完整性校验在网络传输中，为了保证数据的完整性，常常使用Hash来验证数据是否被篡改。

发送方在发送数据之前计算数据的哈希值，并附加在数据中一起传输。

接收方在接收到数据后，重新计算数据的哈希值，并与接收到的哈希值进行比较。

如果哈希值不一致，说明数据可能被篡改。

3.2 密码存储在用户密码存储方面，常常使用Hash来加密和存储用户的密码。

当用户注册时，系统会使用Hash算法对用户输入的密码进行哈希运算，并将哈希值存储到数据库中。

当用户登录时，系统会将用户输入的密码进行哈希计算，并与存储的哈希值进行比较，以验证用户的身份。

3.3 唯一性校验在数据库中，为了确保数据的唯一性，常常使用Hash来生成唯一的标识符。

例如，在分布式系统中，多个节点同时接收到相同的请求时，为了避免重复处理，可以使用Hash算法对请求的关键信息进行哈希计算，得到一个唯一的标识符，通过标识符来判断是否已经处理过该请求。

3.4 数据索引在数据库和搜索引擎中，为了提高数据的检索效率，常常使用Hash来构建索引。

哈希函数的原理及应用

哈希函数的原理及应用哈希函数是将输入数据映射到固定长度的输出数据的一种函数。

它具有以下几个特点：确定性、高效、不可逆和均匀分布。

哈希函数的原理基于数学原理和位运算。

它将输入数据通过一系列操作转化为固定位数的哈希值。

哈希函数的设计要考虑尽量减小冲突的概率，即不同的输入数据得到相同的哈希值的概率尽量低。

常见的哈希函数有MD5、SHA-1和SHA-256等。

1.数据完整性验证：哈希函数常被用来验证数据在传输过程中是否被篡改。

发送方可以计算出数据的哈希值并一并发送给接收方。

接收方在接收到数据后重新计算哈希值并与发送方发送的哈希值进行比对，如果不一致则说明数据被篡改过。

2.数据加密：哈希函数是密码学中不可或缺的组成部分。

通过哈希函数，可以将明文消息转换为不可逆的哈希值，从而保护消息的机密性。

常用的密码哈希函数有MD5和SHA系列。

3.密码存储与验证：在用户注册和登录认证等场景中，哈希函数常被用来存储和验证用户密码。

通常使用带有“加盐”的哈希函数来存储用户密码，以增加密码的安全性。

4.唯一标识符生成：哈希函数可以将大范围的输入数据映射为固定长度的哈希值。

这种特性使得它可以用来生成唯一的标识符，如文件的唯一标识符、URL的短链接等。

5.数据分片与散列存储：哈希函数可以将大数据集分割成小数据块并散列存储。

这样做既能减少存储空间的占用，又能提高数据的检索效率。

例如，分布式存储系统中常用的一致性哈希算法就是通过哈希函数将数据分布到不同的节点上。

6.布隆过滤器：布隆过滤器是一种基于哈希函数的数据结构，用于快速判断一些数据是否属于集合中。

布隆过滤器通过哈希函数将元素映射到一个位向量中，并用多个不同的哈希函数来减小冲突的概率，从而提高查询效率。

总的来说，哈希函数是一种非常重要的技术，广泛应用在数据完整性验证、数据加密、标识符生成、数据存储和检索等领域。

在实际应用中，我们需要选择合适的哈希函数来满足我们的需求，并注意哈希函数的安全性和冲突概率。

python的hash函数

python的hash函数1. 概述在计算机科学中，散列函数（Hash Function）是将一个输入转换为固定长度的输出的一种函数。

Python中的哈希函数是一种将任意大小的数据映射为固定大小值的函数。

本文将深入探讨Python中的哈希函数及其应用。

2. 哈希函数的定义哈希函数是一种将输入值（称为键）映射为数字（称为哈希值或散列值）的函数。

哈希函数要满足以下条件： - 相同输入始终产生相同的输出 - 不同输入尽可能产生不同的输出 - 输出的范围应尽可能均匀分布3. Python中的哈希函数Python提供了多种哈希函数，常用的有以下几种：3.1 hash()hash()函数是Python内置的哈希函数，用于普通对象的哈希计算。

它将对象的内存地址转换成一个整数作为哈希值。

3.2 hashlib模块hashlib模块是Python标准库中的一个模块，提供了一些常用的哈希函数，包括MD5、SHA-1、SHA-256等。

使用hashlib模块可以方便地进行文件校验、密码存储等操作。

3.3 uuid模块uuid模块提供了生成全局唯一标识符（Universally Unique Identifier）的功能。

UUID是一个128位的值，可以用不同的算法生成，常见的有基于时间戳和基于随机数的生成方式。

4. 哈希函数的应用哈希函数在计算机科学和软件开发中有广泛的应用。

以下是一些常见的应用场景：4.1 数据完整性校验哈希函数可用于校验数据的完整性。

发送方可以通过对数据进行哈希计算，生成一个哈希值，并将该哈希值随数据一起发送给接收方。

接收方在接收到数据后，同样对数据进行哈希计算，并将计算得到的哈希值与发送方发送的哈希值进行比较，以判断数据是否在传输过程中被篡改。

4.2 数据加密哈希函数常用于密码学中的数据加密。

将明文通过哈希函数计算得到哈希值，可以将敏感数据存储为其哈希值，从而避免明文数据泄露。

在验证密码时，只需要对用户输入的密码进行哈希计算，然后与存储的哈希值进行比较即可，而无需存储用户的明文密码，提高了安全性。

c语言自带的hash函数

c语言自带的hash函数C语言自带的哈希函数指的是stdlib库中提供的哈希算法函数。

在C语言中，stdlib库是一个通用的标准库，提供了一系列常用的函数，其中包括很多常用的哈希算法函数。

在实际编程中，使用stdlib库中的哈希函数可以方便快捷地完成各种哈希操作。

具体来说，stdlib库中提供了两个常用的哈希函数，分别是：1. hash()2. hcreate()其中，hash()函数用于计算给定键值的哈希值，而hcreate()函数用于创建一个哈希表。

下面将逐一介绍这两个函数的详细用法和作用。

1. hash()函数hash()函数是stdlib库中提供的一个常用的哈希算法函数，用于计算给定键值的哈希值。

该函数可以用于任何数据结构的哈希表中，包括数组、字符串、结构体等等。

hash()函数的定义如下：unsigned hash(const void *key, size_t length)其中，key为输入的键值，length为键值的长度。

该函数的返回值为一个unsigned整数，表示计算出来的哈希值。

在使用hash()函数时，需要注意以下几点：（1）键值必须以一个void类型的指针的形式传递给hash()函数，并使用length 指定键值的长度。

（2）哈希值的计算结果是一个无符号整数，其取值范围为[0, 4294967295]。

（3）hash()函数使用了一个简单的算法来计算哈希值。

该算法会按位操作键值，并使用数学运算将位运算结果组合成一个哈希值。

2. hcreate()函数hcreate()函数是stdlib库中提供的一个用于创建哈希表的函数。

该函数可以用于创建任何种类的哈希表，包括使用链表或数组实现的哈希表。

关于hcreate()函数的使用，以下是一些常见的注意事项：（1）创建哈希表时，需要事先确定哈希表的大小，然后将该大小作为参数传递给hcreate()函数。

（2）hcreate()函数返回值为0时表示成功创建哈希表，否则表示创建哈希表失败。

harsh函数-概述说明以及解释

harsh函数-概述说明以及解释1.引言1.1 概述概述部分的内容可以描述一下harsh函数是什么以及它的重要性和作用。

可以参考以下内容：概述：随着计算机科学的快速发展，数据安全和隐私保护变得尤为重要。

在这个数字化时代，我们需要一种可靠的方法来保护数据的完整性和安全性。

在这方面，hash函数扮演着至关重要的角色。

Hash函数是一种常见的密码算法，主要用于将数据转换为固定长度的字符串。

它通过对任意长度的数据应用哈希算法，生成一个唯一的哈希值。

这个哈希值可以用来验证数据的完整性，检测数据的变化和确定数据的唯一性。

在hash函数的世界里，harsh函数是一种特殊类型的hash函数，它具有许多独特的特点和优势。

与传统的hash函数相比，harsh函数不仅具有更高的效率和更低的冲突率，还可以提供更好的数据安全性和隐私保护。

harsh函数的工作原理是将输入数据通过一系列复杂而精确的计算，转换为一个唯一的哈希值。

这个哈希值具有不可逆的特性，即无法通过哈希值来恢复原始数据。

这种不可逆的特性使得harsh函数成为密码学中重要的工具，广泛应用于数字签名、数据验证、身份验证等各个领域。

此外，harsh函数还具有较低的碰撞概率，即不同的输入数据生成相同哈希值的概率非常低。

这使得harsh函数在数据完整性验证等关键应用场景中更加可靠。

另外，harsh函数还具有良好的计算性能和效率，使得它能够承担大规模数据处理的任务。

总的来说，harsh函数在确保数据安全性和完整性方面发挥着重要作用。

它的独特特性使其在各个领域得到广泛应用，同时也推动了数据安全和密码学的发展。

未来，随着计算机技术的不断进步，人们对于更加高效和安全的harsh函数算法的需求也将不断增加。

1.2文章结构文章结构部分的内容可以描述整篇文章的组织架构和章节安排：在本文中，我将按照如下结构来阐述关于harsh函数的相关知识。

首先，我将在引言部分进行概述，简要介绍harsh函数的定义、背景和应用领域。

网络安全-12：Hash函数

防御
采用强hash函数和增加hash长度是防止碰撞攻击的有效方法。
彩虹表攻击
定义
彩虹表是一种预先计算好的hash 值和原始输入的映射表，用于破
解hash密码。
威胁
攻击者可以利用彩虹表来快速找到与特定hash值匹配的原始输入。
防御
采用加盐技术、增加hash长度和采用强hash函数等方法可以降低彩虹表攻击的风险。
VS
数据包过滤
在防火墙的数据包过滤规则中，可以使用 hash函数来识别和过滤恶意数据包。通过计算数据包的hash值，并与预定义的安全规则进行比较，防火墙可以快速准确地过滤掉已知的恶意数据包，从而保护网络免受攻击。
与入侵检测系统的结合
完整性检查
入侵检测系统可以使用hash函数来定期检查系统文件和关键数据的完整性。通过计算文件的 hash值并将其与存储在安全数据库中的原始hash值进行比较，可以检测到任何未经授权的修改。如果发现hash值不匹配，则可以触发警报并采取相应的措施，以防止潜在的攻击或恶意软件感
04
输出长度：128位。
SHA-
01 02 03 04
安全性：SHA-1的安全性较弱，存在碰撞攻击的可能性。
应用场景：曾被用于数字签名和身份验证，但现在已被视为不安全。算法描述：基于Merkle-Damgard结构的压缩函数，对输入进行分组
并进行一系列位操作和模运算。输出长度：160位。
SHA-2
染。
事件响应
当入侵检测系统检测到潜在的安全威胁或异常行为时，它可以触发相应的事件响应机制。通过将 hash函数与事件响应结合使用，可以快速识别和隔离受影响的系统或网络段。通过计算相关数据
段的hash值并比较，可以迅速定位和隔离潜在的恶意活动，以防止其进一步传播。

hash函数的应用原理

Hash函数的应用原理概述在计算机科学中，散列函数（也称为哈希函数）是一种将任意长度的数据映射为固定长度值（通常称为哈希值或散列值）的函数。

Hash函数的应用非常广泛，特别是在数据结构和加密算法中有很多重要的应用。

本文将讨论Hash函数的应用原理以及其在不同领域中的使用。

Hash函数的原理Hash函数的原理非常简单。

它将输入的数据作为原始素材，并对其进行处理，生成一个固定长度的哈希值。

这个哈希值是唯一的，并且当输入的数据发生改变时，哈希值也会随之改变。

Hash函数有以下几个特点： 1. 快速计算：Hash函数需要在有限的时间内生成哈希值，这要求Hash函数具有高效的计算性能。

2. 哈希碰撞概率低：Hash函数应该具备将输入数据均匀分布到哈希值空间中的能力，以降低哈希碰撞（两个不同的输入得到相同的哈希值）的概率。

3. 单向性：Hash函数是一种单向函数，也就是说，可以通过输入来计算哈希值，但无法从哈希值反推出原始的输入数据。

4.输入相同则输出一致：对于相同的输入数据，Hash函数应该始终生成相同的哈希值。

Hash函数的应用示例下面列举了一些Hash函数在不同领域中的应用示例。

数据结构1.散列表（Hash table）：Hash函数被广泛用于实现散列表。

散列表是一种高效的数据结构，它通过Hash函数将关键字映射到数组的索引位置，并在该位置存储对应的值。

数据完整性验证1.文件校验：Hash函数常被用于校验文件的完整性。

将文件的内容作为输入，生成一个哈希值，并将该哈希值与预先计算好的校验和进行比对，以验证文件是否被篡改。

密码存储1.密码加密：Hash函数可以用于对用户密码进行加密存储。

当用户设置密码时，Hash函数将密码作为输入，并生成一个哈希值。

在用户登录时，系统将用户输入的密码再次计算哈希值，与存储的哈希值进行比对，以验证密码的正确性。

数据签名1.数字签名：Hash函数在数字签名中起到重要的作用。

常用的哈希函数

常用的哈希函数1. 定义哈希函数（Hash Function）是一种将任意大小的数据映射到固定大小值的函数。

它接收输入数据，经过计算后生成一个固定长度的哈希值（也称为散列值或摘要）。

哈希函数具有以下特点：•输入数据可以是任意长度的•输出的哈希值长度固定•相同输入产生相同输出•不同输入产生不同输出•哈希值不能被逆向计算出原始输入2. 用途2.1 数据完整性校验哈希函数可以用于校验数据的完整性，确保数据在传输或存储过程中没有被篡改。

发送方在发送数据之前，通过计算数据的哈希值并将其附加到数据中。

接收方在接收到数据后，重新计算接收到数据的哈希值，并与附加的哈希值进行比较。

如果两个哈希值一致，则说明数据没有被篡改。

2.2 密码存储和验证在用户注册和登录系统时，通常需要对用户密码进行存储和验证。

为了保护用户密码，在存储时可以使用哈希函数对密码进行散列处理，并将散列后的结果存储在数据库中。

当用户登录时，系统会对用户输入的密码进行哈希处理，并与数据库中存储的散列值进行比较，以验证密码的正确性。

2.3 数据唯一标识哈希函数可以将数据映射为唯一的哈希值，用作数据的唯一标识符。

在分布式系统中，可以使用哈希函数将数据分配到不同的节点上，实现负载均衡和高效查询。

2.4 加密和数字签名哈希函数在加密和数字签名领域也有广泛应用。

例如，在数字证书中，哈希函数用于生成证书的签名，以确保证书的完整性和真实性。

在对称加密算法中，哈希函数用于生成消息认证码（MAC）来保证数据完整性。

3. 常见的哈希函数3.1 MD5（Message Digest Algorithm 5）MD5是一种广泛使用的哈希算法，它接收任意长度的输入，并输出128位（16字节）长度的哈希值。

MD5具有以下特点：•高度不可逆：无法通过已知的MD5值反推出原始输入•快速计算：对于给定输入，计算MD5值非常快速•冲突概率较高：由于固定输出长度限制，在大量数据中存在可能产生相同MD5值（冲突）的概率MD5的应用已经逐渐减少，因为其安全性较低。

单向散列算法

单向散列算法单向散列算法是一种常用的数字签名算法，它可以允许拥有证书的一方（发送者）将数据传送给没有证书的另一方（接收者），以证明数据来源的可靠性。

下面将介绍单向散列算法的概念，原理，和应用，并分析其优缺点。

一、概念单向散列算法（Hash function）是一种将任意长度的消息块变换成固定长度的输出，这种输出也称为消息摘要（Message Digest）。

其原理是，使用一个函数f（例如SHA-1），通过把一个消息块m作为输入，经过压缩运算，产生一个消息摘要H(m)。

在安全通讯中，单向散列用来验证接收方收到的消息，若消息被篡改了则摘要一定不同。

二、原理单向散列函数具有三个重要的特性：1）压缩性：单向散列函数将任意长度的消息块压缩成消息摘要的固定长度；2）安全性：单向散列算法具有抗碰撞性，即使在输入的消息块相同的情况下，消息摘要也不同；3）不可逆性：单向散列函数是不可逆的，即无法通过消息摘要推断出原始消息内容。

三、应用1）数字签名：数字签名是两个或多个实体（发送者和接收者）之间进行通信时为确保发送者为发送数据的真实性和完整性而使用的一种技术。

发送者使用单向散列函数将数据签名（signed message）和公钥（public key）一起编码生成一个消息摘要（message digest），然后用公钥编码消息摘要，最后将加密的消息摘要发送给接收者。

2）消息认证码：消息认证码是一种安全服务，可以用来认证发送者以及验证发送消息的完整性。

它的原理是使用单向散列函数将发送方的公钥和发送消息混合压缩计算出一个消息认证码，验证消息时，需要把这个消息认证码和接收消息重新进行一次压缩计算，如果得到的消息认证码和发送方一致，则说明消息未被篡改。

四、优缺点1）优点：单向散列函数具有安全性和不可逆性，可以防止对消息的篡改，又可以保证消息的真实性和完整性。

2）缺点：单向散列函数是基于探测碰撞的安全性，这意味着，只要算力足够强，任何单向散列函数都可能被破解。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

Hash 函数还有另外的含义。实际中的 Hash 函数是指把一个大范围映射到一个小范围。把大范围映射到一个小范围的目的往往是为了节省空间，使得数据容易保存。除此以外，Hash 函数往往应用于查找上。所以，在考虑使用 Hash 函数之前，需要明白它的几个限制：
1. Hash 的主要原理就是把大范围映射到小范围；所以，你输入的实际值的个数必须和小范围相当或者比它更小。不然冲突就会很多。 2. 由于 Hash 逼近单向函数；所以，你可以用它来对数据进行加密。 3. 不同的应用对 Hash 函数有着不同的要求；比如，用于加密的 Hash 函数主要考虑它和单项函数的差距，而用于查找的 Hash 函数主要考虑它映射到小范围的冲突率。
一加法 Hash
所谓的加法 Hash 就是把输入元素一个一个的加起来构成最后的结果。标准的加法 Hash 的构造如下： static int additiveHash(String key, int prime) {
int hash, i; for (hash = key.length(), i = 0; i < key.length(); i++)
public int FNVHash(byte[] data) {
int hash = (int)2166136261L; for(byte b : data)
hash = (hash * 16777619) ^ b;
if (M_SHIFT == 0) return hash;
return (hash ^ (hash >> M_SHIFT)) & M_MASK; } 复制代码以及改进的 FNV 算法： public static int FNVHash1(String data) {
对不同 hash 函数以及处理冲突的方法，计算了查找成功的平均长度以及不成功的平均长度。这些结果主要取决于装填因子，装填因子，可以将平均查找长度限定在一个范围内。
一般的说，Hash 函数可以简单的划分为如下几类：
1. 加法 Hash； 2. 位运算 Hash；
3. 乘法 Hash； 4. 除法 Hash； 5. 查表 Hash； 6. 混合 Hash；下面详细的介绍以上各种方式在实际中的运用。
直接定址法：地址集合和关键字集合大小相同
数字分析法：根据需要 hash 的关键的特点选择合适 hash 算法，尽量寻找每个关键字的不同点
平方取中法：取关键字平方之后的中间极为作为哈希地址，一个数平方之后中间几位数字与数的每一位都相关，取得位数由表长决定。比如：表长为 512,=2^9,可以取平方之后中间 9 位二进制数作为哈希地址。折叠法：关键字位数很多，而且关键字中每一位上的数字分布大致均匀的时候，可以采用折叠法得到哈希地址，除留取余法除 P 取余，可以选 P 为质数，或者不含有小于 20 的质因子的合数随机数法：通常关键字不等的时候采用此法构造哈希函数较恰当。实际工作中需要视不同的情况采用不同的 hash 函数：考虑因素：计算哈希函数所需要的时间，硬件指令等因素。关键字长度哈希表大小关键字分布情况记录查找的频率。（huffeman 树）处理冲突的方法：开放地址法：现行探测再散列只要哈希表为填满，总能找到一个不冲突的地址，二次探测再散列表长为素数时才可能保证总能找到一个不冲突的地址，随机探测再散列取决于伪随机数列再哈希法：不易发生聚集，但是增加了计算的时间链地址法；Chord 协议中，一致性 hash 有应用。
}
return (hash & 0x7FFFFFFF);
}
复制代码
虽然 Adler32 算法的应用没有 CRC32 广泛，不过，它可能是乘法 Hash 里面最有名的一个了。关于它的介绍，大家可以去看 RFC 1950 规范。
四除法 Hash
除法和乘法一样，同样具有表面上看起来的不相关性。不过，因为除法太慢，这种方式几乎找不到真正的应用。需要注意的是，我们在前面看到的 hash 的结果除以一个 prime 的目的只是为了保证结果的范围。如果你不需要它限制一个范围的话，可以使用如下的代码替代”hash%prime”： hash = hash ^ (hash>>10) ^ (hash>>20)。
int hash = 0; int i; for (i=0; i return hash; } 复制代码 jdk5.0 里面的 String 类的 hashCode()方法也使用乘法 Hash。不过，它使用的乘数是 31。推荐的乘数还有：131, 1313, 13131, 131313 等等。使用这种方式的著名 Hash 函数还有： // 32 位 FNV 算法 int M_SHIFT = 0;
应用于加密的 Hash 函数已经探讨过太多了，在作者的博客里面有更详细的介绍。所以，本文只探讨用于查找的 Hash 函数。 Hash 函数应用的主要对象是数组（比如，字符串），而其目标一般是一个 int 类型。以下我们都按照这种方式来说明。
2. 常用的 Hash 算法
有时候 hash 函数是一个压缩映像，因此不可避免会发生冲突，因此在建造 hash’函数的时候不仅要设定一个好的 hash 函数，还要设定一种处理冲突的方法，哈希造表，散列表。
hash += key.charAt(i); return (hash % prime); } 复制代码这里的 prime 是任意的质数，看得出，结果的值域为[0,prime-1]。
二位运算 Hash
这类型 Hash 函数通过利用各种位运算（常见的是移位和异或）来充分的混合输入元素。比如，标准的旋转 Hash 的构造如下： static int rotatingHash(String key, int prime) {
} else
{ hash ^= ~((hash<<11>>5));
} hash += (hash<<5> hash = key.charAt(i) + (hash<<6>>16) ? hash; hash ^= ((hash<<5>>2));
复制代码三乘法 Hash
这种类型的 Hash 函数利用了乘法的不相关性（乘法的这种性质，最有名的莫过于平方取头尾的随机数生成算法，虽然这种算法效果并不好）。比如， static int bernstein(String key) {
Hash 函数的常用算法
1.Hash 介绍
Hash 这个在实现某些功能的经常会用到的数据结构，在 java 和 c++ 里面都有相应的封装好的数据结构：C++ STL Map java 有 HashMap TreeMap。
计算理论中，没有 Hash 函数的说法，只有单向函数的说法。所谓的单向函数，是一个复杂的定义，大家可以去看计算理论或者密码学方面的数据。用“人类”的语言描述单向函数就是：如果某个函数在给定输入的时候，很容易计算出其结果来；而当给定结果的时候，很难计算出输入来，这就是单项函数。各种加密函数都可以被认为是单向函数的逼近。Hash 函数（或者成为散列函数）也可以看成是单向函数的一个逼近。即它接近于满足单向函数的定义。
final int p = 16777619; int hash = (int)2166136261L; for(int i=0;i
hash = (hash ^ data.charAt(i)) * p; hash += hash << 13; hash ^= hash >> 7; hash += hash << 3; hash ^= hash >> 17; hash += hash << 5; return hash; } 复制代码除了乘以一个固定的数，常见的还有乘以一个不断改变的数，比如：
static int RSHash(String str)
{
int b
= 378551;
int a
= 63689;
int hash = 0;
for(int i = 0; i < str.length(); i++)
{
hash = hash * a + str.charAt(i);
a
= a * b;
int hash, i;
for (hash=key.length(), i=0; i hash = (hash<<4>>28)^key.charAt(i);
return (hash % prime); } 复制代码先移位，然后再进行各种位运算是这种类型 Hash 函数的主要特点。比如，以上的那段计算 hash 的代码还可以有如下几种变形： hash = (hash<<5>>27)^key.charAt(i); hash += key.charAt(i); hash += (hash << 10); hash ^= (hash >> 6); if((i&1) == 0) { hash ^= (hash<<7>>3);