杂凑函数散列函数

合集下载

Z0第二十六讲(散列结构和散列函数)

(一) 桶
若散列表有n个逻辑地址，则将其视为具有n 个桶(Bucket)，且为每个桶编号（桶号），并令桶号与散列地址一一对应。设每个桶可存放s 个表项，称它们为同义词（散列函数值相同的关键字称为同义词）。
因此，桶是用于装载冲突项的。当欲装入某桶中的同义词个数大于桶容量时，称为溢出。
对桶的处理不同，就对应于不同的冲突处理方法。
如果是定位冲突，冲突处理是要继续查找所要找的记
录，确定记录是否在散列结构中，若是，则返回其位置，否则返回特殊标记。
26.1.4 散列函数的设计
散列函数的设计是个关键问题，也是个复杂问题。但是，散列函数设计一般没有什么严格的规则，只有一些可以遵从的原则。 (一) 设计原则：
根据散列函数的用途，设计散列函数时一般应遵循下列原则：
例如，已知各关键字如下： key1: 3 3 4 8 9 2
key2: 3 1 8 7 1 1
key3: 3 1 2 9 2 3 key4: 3 2 3 8 1 2 … 分析它们的位的结构，发现第3和第4位对关键字的敏感度较大，所以可以取这两位为散列函数值。显然，这种方法适合于关键字事先已知的情况。
散列也称杂凑或哈希(Hash)。从上面的说明看出，散列结构不是一种完整的
数据存储结构，因为它只是通过数据元素的关键
字定位记录，一般很难完整地表达数据元素间的逻辑关系，所以，一般也主要面向检索操作。显然，由于记录的定位主要基于计算，所以，一般情况下，散列方法的检索速度要比前面介绍
过的基于比较的方法高。但是，散列结构的存储
(二) 开放地址法
这种方法是，将所有的桶都设在地址空间内。每个桶大小为1个表项。一个地址，就是一个桶。在插入时，若发现冲突，在其他位置寻找空桶。有下列几种寻找空桶法。

信息安全概论(湖南大学)复习资料

信息安全概论（湖南大学）总结者：Mr.Good Temper1、信息安全的目标机密性、完整性、抗否认性、可用性2、密码理论通过加密可以保护信息的机密性；通过信息摘要可以检测信息完整性；通过数字签名可以保护信息的抗否认性。

数据加密：加密解密密钥相同的算法成为对称算法，典型的算法有DES、AES。

加、解密钥不同的算法成为非对称算法，又称为公钥算法，典型的算法有RSA、ECC等。

消息摘要：通过消息摘要，通常是单向的变换，将不定长度的信息变换为固定长度的摘要。

通过消息摘要的检测消息是否被篡改。

典型的算法有MD5、SHA3、安全理论身份认证，指验证用户身份与其所声称的身份是否一致的过程。

最常见的身份认证是口令认证。

授权和访问控制：区别在于授权侧重于前调用户拥有的权限，访问控制是对用户访问的行为进行控制。

审计追踪：审计是指对用户的行为进行记录、分析和调查。

确认操作的历史行为。

安全协议：指构建安全平台时所使用的与安全防护有关的协议。

4、安全技术指对信息系统进行安全检查和防护的技术，包括防火墙技术、漏洞扫描技术、入侵检测技术、防病毒技术。

防火墙技术：应用多的是网络层的包过滤技术和应用层的安全代理技术。

主要研究内容包括防火墙的安全策略、实现模式、强度分析。

漏洞扫描技术：是针对特定的信息网络中存在的漏洞而进行的。

主要研究包括漏洞的发现、特征分析、定位、扫描方式和协议。

入侵检测技术：指通过对网络信息流提取和分析发现非正常访问模式的技术。

内容包括：信息流提取技术、入侵特征分析技术、入侵行为模式分析技术、入侵行为关联分析技术和高速信息流快速分析技术。

防病毒技术：病毒是一种具有传染性和破坏性的计算机程序。

5、密码基本组成要素一个密码系统（体制）包括所有的可能的明文、密文、密钥、加密算法、解密算法。

加密算法的定义：对需要保密的消息进行编码的过程称为加密，编码的规则称为加密算法。

解密算法的定义：对已加密的消息明文恢复过程称为解密，解密规则称为解密算法。

单向散列函数SHA-512的优化设计

ａｄｔｅｉｄｓｒ，ｉｈａｅａａｌｂｅｉｈｎｅｎｔｎｌＩｒｅ．ｅｐｏｏｅｍｐｅｅｔｔｃｉｖｓａｔｒｕｈｕｈｔｅｃｅｓＩ６２ｂｔ，ｎｈｎｕｔｙｗｈｃｒｖｉａｌｎｔｅｉｔｒａｉａＰｍａｋｔＴｈｒｐｓｄｉｌｍｎａｉａｈｅｅｈｏｇｐｔａｘｅｄ５Ｍｉｓｏｏｎｔ／
［ｓｒｃ］ｏｅＦＧＡｉｌｎａｉｎｏｔｅｓｃｒａｈａｏｉｍ５２（ＨＡ一１１ｓｒｐｓｄＴｅｐｏｏｅｒｈｔｃｕｅｅｐｏｔｔｅｂｎｆｓＡｂｔａｔＡｎｖｌＰｍｐｅｔｔｆｈｅｕｅｈｓｌｒｈ１Ｓｍｅｏｇｔ５２ｉｐｏｏｅｈｒｐｓｄａｃｉｔｒｘｌｉｈｅｅｉｅｓｔ
ｃｌｕａｉｎｏｔｅｄｐｎｅｔａｕｓＴｅｉｌｍｅｔｔｎｈａｔｉｉｒｏａｅｌｍａｉｅｉｅｎａｉｎｒｐｓｄｂｅａａｅａａｃｌｔｆｈｒｎｅｅｄｎｌｅ．ｈｏｏｉｖｍｐｅｎａｉ ’ｃａｃｅｓｃａｅｃｍｐｒｄｔａｅｔ１】ｍｅＩｔｓｏｏｅｙｔｃｄｍｉｏＳｒｒｔｓｏｔｖｎｐｏｐｈ
ｆｃｏｌｆｎｏｍａｉｎａｄＣｍｍｕｉａｏｎｉｅｒｇＴａｊｎＰｌｔｃｎｃＵｉｅｓｙＴａｊ００ｈｏｆｒｔｎｏＩＳｏＩｏｎｃｔｎＥｇｎｅｉ．ｉｎｉｏｙｅｈｉｎｖｒｉ，ｉｎｉ３０：ｉｎｔｎＩ６
维普资讯
第３３卷第７期

信息安全概论第五章消息认证与数字签名

6
5.1.1 信息加密认证
信息加密函数分两种，一种是常规的对称密钥加密函数，另一种是公开密钥的双密钥加密函数。下图的通信双方是，用户A为发信方，用户B为接收方。用户B接收到信息后，通过解密来判决信息是否来自A，信息是否是完整的，有无窜扰。
1.对称密码体制加密：对称加密：具有机密性，可认证,不提供签名
通常b>n
24
5.2.3
MD5算法
Ron Rivest于1990年提出了一个称为MD4的散列函数。他的设计没有基于任何假设和密码体制，不久，他的一些缺点也被提出。为了增强安全性和克服MD4的缺陷， Rivest于1991年对MD4作了六点改进，并将改进后的算法称为MD5. MD5算法：将明文按512比特进行分组，即MD5中的 b=512bit，经填充后信息长度为512的倍数（包括64 比特的消息长度）。填充：首位为1，其余补0至满足要求，即填充后的比特数为512的整数倍减去64，或使得填充后的数据长度与448模512同余。
18
通过以下方式使用散列函数常提供消息认证
（1）使用对称加密算法对附加消息摘要的报文进行加密 A B: EK(M||H(M)) 提供保密、认证（2）使用对称加密方法对消息摘要加密 A B: M||EK(H(M)) 提供认证（3）使用发方的私钥对消息摘要进行加密 A B: M||EKRa(H(M)) 提供数字签名、认证（4）在（3）的基础上，使用对称加密方法进行加密 A B: EK(M||EKa(H(M)) ) 提供数字签名、认证和保密（5）假定双方共享一个秘密值S，与消息M串接，计算散列值 A B: M||(H(M||S)) 提供认证（6）假定双方共享一个秘密值S，使用散列函数，对称加密方法 A B: EK(M||H(M||S)) 提供数字签名、认证和保密19

密码学发展史

密码学发展简史学院：数学与统计学院专业：信息与计算科学学生：卢富毓学号：20101910072密码是什么？什么是密码学？信息泛指人类社会传播的一切内容。

人通过获得、识别自然界和社会的不同信息来区别不同事物，得以认识和改造世界。

而密码便是对信息进行隐藏的一种手段。

它既是一种工具又是一门艺术。

《破译者》一书说：“人类使用密码的历史几乎与使用文字的时间一样长。

”因为自从有了文字以来，人们为了某种需要总是想方设法隐藏某些信息，以起到保证信息安全的目的。

人们最早为了包通信的机密，通过一些图形或文字互相传达信息的密令。

连闯荡江湖的侠士和被压迫起义者各自有一套秘密的黑道行话和地下联络的暗语。

而在今天信息泛滥的计算机世界里，如何保护好自己的重要信息不被泄露，保护自己的通讯不被窃听等一系列与信息有关的内容中，同样需要一个较好的密码协议来完成对信息的私密化！可以看出密码学在不同的时代里有着不同的诠释。

所以密码学是一门既古老又新兴的学科。

古典密码学密码学大致可以分为五个时期：1、第一阶段从古代到1949，这一时期称为古典密码时期，密码学可以说是一门艺术，而不是一种学科。

(发展缓慢)2、第二阶段是从1949年到1976年，这一时期，由香浓发表的“保密系统的信息理论”一文产生了信息论，信息论为对称密码系统建立了理论基础，从此密码学成为一门学科。

3、第三个阶段是从1976年到1984年。

1976年Diffie和Hellman发表了《密码学新方向》一文，从而导致了密码学上的一场革命。

他们首次证明了发送端和接收端无密钥传输的保密通讯是可能的，从而开创了公钥密码学的新纪元。

4、第四个阶段是从1984年至今，1984年Goldwasser和Micali首次提出了证明安全的思想。

他们讲概率论中的东西引入到密码学，在计算复杂度理论假设下，安全性是可以证明的。

5、第五个阶段，这是我个人认为有必要写出来的——两字密码学时期：当量子计算机大量的投入使用后，可以预见好多目前主流的加密算法将不再实用，新的方案新的体系将被人们发现利用。

现代密码学第7章：散列函数

31
散列函数的使用方式
由于加密运算的速度较慢，代价较高，而且很多加密算法还受到专利保护，因此在不要求保密性的情况下，方式②和③将比其他方式更具优势。
32
2.2 散列函数应满足的条件
散列函数的目的是为需认证的数据产生一个“指纹”。为了能够实现对数据的认证，散列函数应满足以下条件： ① 函数的输入可以是任意长。 ② 函数的输出是固定长。 ③ 已知x，求H(据认证算法
数据认证算法是最为广泛使用的消息认证码中的一个，已作为FIPS Publication （FIPS PUB 113）并被ANSI作为X9.17标准。算法基于CBC模式的DES算法，其初始向量取为零向量。需被认证的数据（消息、记录、文件或程序）被分为64比特长的分组D1， D2，…，DN，其中最后一个分组不够64比特的话，可在其右边填充一些0，然后按以下过程计算数据认证码（见图2）：
16
1.2 产生MAC的函数应满足的要求假定k>n，且敌手已得到M1和MAC1，其中MAC1=CK1（M1），敌手对所有可能的密钥值Ki求MACi=CKi(M1)，直到找到某个Ki使得 MACi=MAC1。由于不同的密钥个数为2k，因此将产生2k个MAC，但其中仅有2n个不同，由于2k>2n，所以有很多密钥（平均有 2k/2n=2k-n个）都可产生出正确的MAC1，而敌手无法知道进行通信的两个用户用的是哪一个密钥，还必须按以下方式重复上述攻击：
21
1.2 产生MAC的函数应满足的要求
考虑到MAC所存在的以上攻击类型，可知它应满足以下要求，其中假定敌手知道函数C，但不知道密钥K： ① 如果敌手得到M和CK(M)，则构造一满足 CK(M′)=CK(M)的新消息M′在计算上是不可行的。 ② CK(M)在以下意义下是均匀分布的：随机选取两个消息M、M′，Pr[CK(M)=CK(M′)]=2-n，其中n为 MAC的长。 ③ 若M′是M的某个变换，即M′=f(M)，例如f为插入一个或多个比特，那么Pr[CK(M)=CK(M′)] = 2-n。

散列查找（HashSearch）

散列查找（HashSearch）散列查找法(HashSearch)散列查找法(HashSearch)的思想，它通过对元素的关键字值进⾏某种运算，直接求出元素的地址，即使⽤关键字到地址的直接转换⽅法，⽽不需要反复⽐较。

因此，散列查找法⼜叫杂凑法或散列法。

散列（Hashing）通过散列函数将要检索的项与索引（散列，散列值）关联起来，⽣成⼀种便于搜索的数据结构（散列表）。

散列的概念属于查找，采⽤直接寻址技术。

在理想情况下，查找的期望时间为O(1)。

散列函数和散列地址：在记录的存储位置p和其关键字key之间建⽴⼀个确定的对应关系H, 使 p=H(key), 称这个对应关系H 为散列函数，p为散列地址。

散列表：⼀个有限连续的地址空间，⽤以存储按散列函数计算得到相应散列地址的数据记录。

通常散列表的存储空间是⼀个⼀维数组，散列地址是数组的下标。

冲突和同义词：对不同的关键字可能得到同⼀散列地址，即key!=key2 ,⽽H(key1)=H(key2)，这种现象称为冲突。

具有相同函数值的关键字对该散列函数来说称作同义词，key1, 与key2互称为同义词。

hash函数hash函数就是把任意长的输⼊字符串变化成固定长的输出字符串的⼀种函数。

输出字符串的长度称为hash函数的位数。

哈希函数构造考虑1. 散列表的长度；关键字的长度；关键字的分布情况;2. 散列函数的计算简单，快速；3. 散列函数能将关键字集合K均匀地分布在地址集{0,1，…，m-1}上，使冲突最⼩。

哈希函数的构造⽅法1. 直接定址法取关键字或关键字的某个线性函数值为哈希地址：H(key) = key 或 H(key) = a*key + b其中a和b为常数，这种哈希函数叫做⾃⾝函数。

注意：由于直接定址所得地址集合和关键字集合的⼤⼩相同。

因此，对于不同的关键字不会发⽣冲突。

但实际中能使⽤这种哈希函数的情况很少2. 相乘取整法⾸先⽤关键字key乘上某个常数A(0 < A < 1)，并抽取出key*A的⼩数部分；然后⽤m乘以该⼩数后取整。

信息安全概论习题之名词解释

三、名词解释题：1、数字证书？答：数字证书是一种权威性的电子文文件,由权威公正的第三方机构，即CA中心签发的证书。

它以数字证书为核心的加密技术可以对网络上传输的信息进行加密和解密、数字签名和签名验证，确保网上传递信息的机密性、完整性。

2、防火墙？P181答：防火墙是置于两个网络之间的一组构件或一个系统，具有以下属性：(1)防火墙是不同网络或网络安全域之间信息流通过的唯一出入口，所有双向数据流必须经过它；(2)只有被授权的合法数据，即防火墙系统中安全策略允许的资料，才可以通过；(3)该系统应具有很高的抗攻击能力，自身能不受各种攻击的影响。

3、数字签名技术？答：4、入侵检测？P157答：入侵检测(Intrusion Detection)是对入侵行为的发觉。

它从计算机网络或或计算机系统的关键点收集信息并进行分析，从中发现网络或系统中是否有违反安全策略的行为和被攻击的迹象。

5、分组密码？P22答：分组密码是将明文消息编码后表示的数字(简称明文数字)序列x0,x1,x2,…，划分成长度为n的组x=(x0,x1,x2,…xn-1)(可看成长度为n的向量)，每组分别在密钥k=(k0,k1,k2,…kn-1)，其加密函数是E：Vn×K→Vn，Vn是n维向量空间，K为密钥空间。

6、序列密码答：序列密码也称为流密码(Stream Cipher)，它是对称密码算法的一种。

流密码对明文加解密时不进行分组，而是按位进行加解密。

流密码的基本思想是利用密钥k产生一个密钥流：z=z0z1…，并使用如下规则加密明文串x=x0x1x2…，y=y0y1y2…=ez0(x0)ez1(x1)ez2(x2)…。

密钥流由密钥流发生器f产生：zi=f(k，σi)，这里的σi是加密器中的存储元件(内存)在时刻i的状态，f是由密钥k和σi产生的函数。

7、DES？P26答：DES，Data Encryption Standard，数据加密标准，是分组长度为64比特的分组密码算法，密钥长度也是64比特，其中每8比特有一位奇偶校验位，因此有效密钥长度是56比特。

单向散列函数

单向散列函数1. 单向散列函数单向散列函数有⼀个输⼊和⼀个输出，输⼊的称为消息，输出的称为散列值。

可以获取消息的指纹，从⽽确定⽂件的“完整性”（或者叫⼀致性）。

输出的散列值长度是固定的。

2. 性质根据任意长度的消息，计算出固定长度的散列值。

能够快速计算出散列值，且具备单向性。

抗碰撞性：消息不同，散列值也不同，难以发现碰撞性。

3. 术语单向散列函数也称为摘要函数，哈希函数和杂凑函数。

4. 实际应⽤检测软件是否被篡改。

⽤于基于⼝令的加密。

使⽤单向散列函数可以构造消息认证码——共享密钥和消息混合后计算散列值。

进⾏数字签名时也会使⽤单向散列函数——对消息散列，对散列值进⾏数字签名。

伪随机数⽣成器。

⼀次性⼝令。

5. 单向散列函数 MD4：能产⽣128⽐特的散列值，但Dobbertin提出了MD4散列碰撞⽅法，MD4不再安全。

MD5：能产⽣128⽐特的散列值，MD5的强抗碰撞性已经被攻破，MD5不再安全。

SHA-1：能产⽣160⽐特的散列值，SHA-1于2005年被攻破。

SHA-2：SHA-256 散列值长度256⽐特。

SHA-384 散列值长度384⽐特。

SHA-512 散列值长度512⽐特。

RIPEMD-160：160⽐特的散列值的单向散列函数，⽐特币中使⽤该散列函数。

SHA-3：SHA-1被攻破，Keccak算法被选为SHA-3算法。

6. Keccak——被选为SHA-3的算法可以⽣成任意长度的散列值，为了兼容SHA-2，SHA-3，规定了SHA3-256，SHA3-224，SHA3-384和SHA3-512 4个版本。

采⽤了与SHA-2不同的结构，结构清晰，易于分析。

能适⽤与各种设备，也适⽤于嵌⼊式应⽤，在硬件上的实现显⽰出了很⾼的性能。

⽐其他候选算法安全性边际更⼤。

7. 散列算法的选择 MD-5：不安全，不应该再使⽤。

SHA-1：除了旧的运算，不应被⽤于新的⽤途。

散列函数的构造方法

散列函数的构造方法
散列函数的构造方法有多种，以下是一些常见的构造方法：
1. 直接定址法：根据关键字的值直接计算出其对应的散列值。

例如，若关键字为k，则散列值为h(k) = a * k + b，其中a和b为常数。

2. 除留余数法：通过取关键字的某个位数进行取余操作得到散列值。

例如，若关键字为k，则散列值为h(k) = k % m，其中m为散列表的大小。

3. 平方取中法：对关键字的平方进行一定的位数截取作为散列值。

例如，若关键字为k，则散列值为h(k) = (k^2 >> d) & ((1 << r) - 1)，其中d为位数截取的位数，r为最终所得散列值的位数。

4. 折叠法：将关键字分割成几个部分，然后将这几个部分进行叠加求和，并取其低位位数作为散列值。

例如，若关键字为k，则散列值为h(k) = k1 + k2 + ... + kn，其中k1, k2, ..., kn为关键字k的各个部分。

5. 基数转换法：将关键字按照不同进制进行转换，然后将转换后的结果作为散列值。

例如，若关键字为k，则散列值为h(k) = radix(k)，其中radix()为将关键字按照某种进制进行转换的函数。

注意，以上只是常见的构造方法之一，不同的散列函数适用于不同的应用场景，需要根据具体情况选择合适的构造方法。

此外，还可以通过调整参数和运用其他技巧来改进散列函数的性能。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

杂凑函数（散列函数）
1. 定义
杂凑函数（Hash Function），也称为散列函数，是一种将任意大小的数据映射到
固定大小的数据的函数。

它将输入数据通过一系列的计算操作，转换成一个固定长度的输出，通常称为散列值或哈希值。

杂凑函数是密码学、数据完整性校验、数据索引等领域中重要的基础工具。

2. 用途
杂凑函数有广泛的应用，主要包括以下几个方面：
2.1 数据完整性校验
杂凑函数可以用于验证数据的完整性，即通过计算数据的散列值，然后与预先保存的正确散列值进行比对，来判断数据是否被篡改。

这在网络传输、文件存储等场景中非常重要，可以有效防止数据被篡改而不被察觉。

2.2 数据唯一标识
杂凑函数可以将数据映射为唯一的散列值。

由于散列值的长度固定，可以大大减小数据的存储空间。

在数据索引、数据库中，可以使用散列值作为数据的唯一标识，提高数据的查询和存储效率。

2.3 密码学
杂凑函数在密码学中有重要的应用。

比如，密码存储时通常不会直接保存明文密码，而是将密码的散列值保存在数据库中。

当用户登录时，输入的密码经过散列计算后与数据库中的散列值进行比对，以验证用户的身份。

2.4 数据分片
杂凑函数可以将数据按照一定的规则进行分片，将大规模数据分散存储在不同的节点上。

这样可以提高数据的并行处理能力和分布式存储系统的可扩展性。

3. 工作方式
杂凑函数的工作方式主要包括两个方面：输入处理和输出生成。

3.1 输入处理
杂凑函数接受一个任意长度的输入数据，并经过一系列的计算操作将其转换为固定长度的中间结果。

常见的输入处理操作包括：
•消息扩展：将输入数据进行填充，使其长度满足计算要求。

常见的填充方式有补零、补位数等。

•消息分块：将输入数据按照固定长度进行划分，得到多个块。

每个块独立处理，可以提高计算效率。

•迭代计算：对每个数据块进行迭代计算，将当前数据块的计算结果作为下一个数据块的输入，直到处理完所有数据块。

3.2 输出生成
经过输入处理后，杂凑函数会生成一个固定长度的输出，即散列值或哈希值。

输出生成的过程通常包括以下操作：
•压缩函数：对输入数据进行压缩，将其转换为固定长度的中间结果。

•汇总函数：将所有中间结果进行汇总，得到最终的散列值。

常见的汇总方式有异或运算、加法运算等。

•输出转换：将汇总得到的散列值进行格式转换，得到最终的输出结果。

常见的转换方式有十六进制、Base64编码等。

4. 杂凑函数的要求
杂凑函数需要满足以下几个基本要求：
4.1 一致性
对于相同的输入，杂凑函数应始终生成相同的输出。

这是数据完整性校验和数据索引等应用的基础。

4.2 高效性
杂凑函数应具有高效性，即计算速度快。

尤其在密码学中，需要对大量的数据进行散列计算，因此高效性是一个重要的考量因素。

4.3 雪崩效应
杂凑函数的输出应对输入的微小变化非常敏感，即输入的任意变化都会导致输出的剧烈变化。

这样可以保证输入的微小改动能够得到明显的输出差异。

4.4 抗碰撞性
杂凑函数应具有抗碰撞性，即对于不同的输入，产生相同输出的概率非常低，理想情况下是不可能的。

这是保证数据唯一标识和密码学安全的重要要求。

5. 常见的杂凑函数
目前，常见的杂凑函数包括MD5、SHA-1、SHA-256等。

它们是公认的安全性较高的杂凑函数，广泛应用于密码学和数据完整性校验等领域。

5.1 MD5
MD5（Message Digest Algorithm 5）是一种广泛应用的杂凑函数。

它将输入数据
分为若干个512位（64字节）的块，然后对每个块进行迭代计算，最终生成一个128位（16字节）的散列值。

MD5具有较快的计算速度和较低的碰撞概率，但由于
其算法的安全性存在漏洞，已不再推荐在安全领域使用。

5.2 SHA-1
SHA-1（Secure Hash Algorithm 1）是一种广泛应用的杂凑函数。

它将输入数据分为若干个512位（64字节）的块，然后对每个块进行迭代计算，最终生成一个160位（20字节）的散列值。

SHA-1在密码学和数据完整性校验等领域有较广泛的应用，但由于其算法的安全性逐渐受到质疑，已被更安全的杂凑函数所取代。

5.3 SHA-256
SHA-256是SHA-2（Secure Hash Algorithm 2）系列中的一种杂凑函数。

它将输入数据分为若干个512位（64字节）的块，然后对每个块进行迭代计算，最终生成
一个256位（32字节）的散列值。

SHA-256具有较高的安全性和较低的碰撞概率，广泛用于密码学和数据完整性校验等领域。

总结
杂凑函数是一种将任意大小的数据映射到固定大小的数据的函数。

它在数据完整性校验、数据唯一标识、密码学和数据分片等领域有广泛的应用。

杂凑函数通过输入处理和输出生成两个步骤来工作，要求具有一致性、高效性、雪崩效应和抗碰撞性。

常见的杂凑函数包括MD5、SHA-1和SHA-256等。

在实际应用中，应根据具体需求
选择合适的杂凑函数，同时注意选择安全性较高的算法。