[原创连载]处理器走下神坛——处理器通俗讲义
cpu发展历程

任何东西从发展到壮大都会经历一个过程,CPU能够发展到今天这个规模和成就,其中的发展史更是耐人寻味。
作为电脑之“芯”的CPU也不例外,本文让我们进入时间不长却风云激荡的CPU发展历程中去。
在这个回顾的过程中,我们主要叙述了目前两大CPU巨头——Intel和AMD的产品发展历程。
一、X86时代的CPUCPU的溯源可以一直去到1971年。
在那一年,当时还处在发展阶段的INTEL公司推出了世界上第一台微处理器4004。
这不但是第一个用于计算器的4位微处理器,也是第一款个人有能力买得起的电脑处理器!4004含有2300个晶体管,功能相当有限,而且速度还很慢,被当时的蓝色巨人IBM以及大部分商业用户不屑一顾,但是它毕竟是划时代的产品,从此以后,INTEL便与微处理器结下了不解之缘。
可以这么说,CPU的历史发展历程其实也就是INTEL公司X86系列CPU的发展历程,我们就通过它来展开我们的“CPU历史之旅”。
1978年,Intel公司再次领导潮流,首次生产出16位的微处理器,并命名为i8086,同时还生产出与之相配合的数学协处理器i8087,这两种芯片使用相互兼容的指令集,但在i8087指令集中增加了一些专门用于对数、指数和三角函数等数学计算指令。
由于这些指令集应用于i8086和i8087,所以人们也这些指令集统一称之为X86指令集。
虽然以后Intel 又陆续生产出第二代、第三代等更先进和更快的新型CPU,但都仍然兼容原来的X86指令,而且Intel在后续CPU的命名上沿用了原先的X86序列,直到后来因商标注册问题,才放弃了继续用阿拉伯数字命名。
至于在后来发展壮大的其他公司,例如AMD和Cyrix等,在486以前(包括486)的CPU都是按Intel的命名方式为自己的X86系列CPU命名,但到了586时代,市场竞争越来越厉害了,由于商标注册问题,它们已经无法继续使用与Intel的X86系列相同或相似的命名,只好另外为自己的586、686兼容CPU命名了。
计算机发展趋势

在2007年,加拿大计算机公司 年 加拿大计算机公司D-Wave展示了全球 展示了全球 首台量子计算机“ 首台量子计算机“Orion(猎户座)”。虽然当时 (猎户座) 只是一台能通过量子力学解决部分问题的原型机, 只是一台能通过量子力学解决部分问题的原型机, 不过也让我们看见了量子计算机的曙光。 不过也让我们看见了量子计算机的曙光。
IBM推两款模仿人类大脑的计算机芯片 推两款模仿人类大脑的计算机芯片
8月19日消息,IBM研究人员已经制作出两款认知计算芯片的原型产 月 日消息 日消息, 研究人员已经制作出两款认知计算芯片的原型产 目前正在进行测试。 品,目前正在进行测试。IBM称,这些芯片旨在模仿人类大脑的理解、 称 这些芯片旨在模仿人类大脑的理解、 行动和认知能力。 行动和认知能力。 与传统的芯片不同, 与传统的芯片不同,这些新的认知计算芯片可通过高级算法和芯片电 路创建生物系统中的尖峰神经元与突触之间的现象,就像大脑一样。 路创建生物系统中的尖峰神经元与突触之间的现象,就像大脑一样。 研究人员称,采用这种芯片制造的系统能够通过经验学习、发现关联、 研究人员称,采用这种芯片制造的系统能够通过经验学习、发现关联、 创造假设和记忆,并且从结果中学习,模仿大脑结构和突触可塑性。 创造假设和记忆,并且从结果中学习,模仿大脑结构和突触可塑性。 IBM称,这种新的芯片使用借助神经生物学灵感制作的数字芯片电路 称 组成一个“神经突触核心” 其中包含集成的内存(复制的神经键 复制的神经键)、 组成一个“神经突触核心”,其中包含集成的内存 复制的神经键 、 计算(复制的神经元 和通信(复制的神经轴突 复制的神经元)和通信 复制的神经轴突)。 计算 复制的神经元 和通信 复制的神经轴突 。 IBM研究项目负责人 研究项目负责人Dharmendra Modha称,这些芯片是计算机从计 研究项目负责人 称 算发展到学习系统的又一个重要步骤, 算发展到学习系统的又一个重要步骤,预示着新一代计算机的开始以 及这些计算机在企业、科学和政府等行业的应用。 及这些计算机在企业、科学和政府等行业的应用。 IBM称,第一批两个神经突触计算芯片已经生产出来并且目前正在进 称 行测试。这两款芯片都是采用45纳米 纳米SOI-CMOS技术制作的并且包含 行测试。这两款芯片都是采用 纳米 技术制作的并且包含 256个神经元,一个内核包含 个神经元, 个可编程的神经键, 个神经元 一个内核包含262,144个可编程的神经键,另一个包含 个可编程的神经键 65,536个学习神经键。 个学习神经键。 个学习神经键 IBM称,这种新的芯片架构更节能并且没有固定的编程,把内存与处 称 这种新的芯片架构更节能并且没有固定的编程, 理器集成在一起,模仿大脑的事件驱动、分布式和并行处理方式。 理器集成在一起,模仿大脑的事件驱动、分布式和并行处理方式。
G80F903_V1.3CN

温度范围 -40°C ~ +85°C -40°C ~ +85°C -40°C ~ +85°C
封装 SOP20 SOP20 SOP20
G80F903S20I4 G80F903 G80F903S20I2 G80F903 G80F903S20I1 G80F903
技术咨询 立超电子科技有限公司 中国南京市和燕路251号金港大厦A幢2406室 ZIP:210028 Tel: 0086-25-83306839/83310926 Fax: 0086-25-83737785 Website:/
Rev.1.3
2/85
2011.10
G80F903
目
录
1. 特性............................................................................................................................................................................. 5 2. 概述............................................................................................................................................................................. 6 3. 方框图 .....................................................................................................................
处理器发展历程

处理器发展历程处理器是计算机的核心组件,它负责执行计算机程序,并完成各种数据处理任务。
随着计算机技术的不断发展,处理器也经历了多个阶段的发展。
本文将从诞生至今,简要介绍处理器的发展历程。
处理器的发展可以追溯到20世纪60年代。
当时,计算机处理器采用了分立电子元件构建,如晶体管、电阻和电容等。
这种处理器具有较低的工作速度和可靠性,同时占用大量的电力和空间。
然而,随着集成电路技术的发展,处理器开始采用芯片的形式制造,提高了计算机的性能和可靠性。
到了20世纪70年代,微处理器的概念出现了。
微处理器是一种将多个电子元件集成于一个芯片上的处理器。
这种设计可以大大提高处理器的性能和功能。
1971年,英特尔推出了第一款微处理器Intel 4004,它采用4位结构,主要用于计算器和小型计算机。
随后,微处理器不断升级,逐渐发展到8位、16位、32位和64位等各种结构。
1980年代是处理器发展的重要时期。
在这个时期,处理器的性能和功能得到了显著提升。
1981年,IBM推出了第一台个人计算机IBM PC,搭载了英特尔的8088微处理器。
这标志着个人计算机的普及,推动了处理器技术的发展。
此后,处理器的速度和性能不断提高,并且加入了更多的功能模块,例如浮点运算单元、多核心架构等。
进入21世纪,处理器的发展进入了多核心时代。
早期的处理器只有一个核心,而多核心处理器则可以同时并行处理多个任务。
这种设计提高了处理器的效率和响应速度,对于大型计算和多媒体处理等任务特别有效。
多核心处理器的问世,标志着计算机处理器性能的一个重大突破。
随着计算机应用场景的不断扩大,对处理器的需求也越来越高。
为了满足这些需求,处理器的发展方向逐渐趋于多样化。
例如,图形处理器(GPU)开始在计算机图形和并行计算领域崭露头角,专门用于处理图形和计算密集型任务。
同时,低功耗处理器、嵌入式处理器和云计算处理器等也得到了广泛应用。
在未来,处理器的发展将继续朝着更高性能、更低功耗和更多功能的方向发展。
企业突破技术封锁,打破国外技术垄断作文

企业突破技术封锁,打破国外技术垄断作文全文共8篇示例,供读者参考篇1不过,我们中国企业可不是那么容易被压制的!我们有着坚韧不拔的毅力和创新的智慧,一定能突破重重困难。
你想想看,我们不是已经自主研发出了很多领先的技术吗?比如说高铁、5G通讯、人工智能等等,都是我们自己的科学家和工程师通过不懈努力研发出来的。
我爸爸就在一家大公司工作,他们正在研发一种全新的芯片技术。
以前,他们用的都是国外的芯片,可是现在被那些公司封锁了,不卖给我们了。
不过,我们自己的科研人员通过钻研和创新,终于研制出了更先进的芯片!效能更高,功耗更低,真是太棒了!我妈妈也常常跟我讲,我国正在大力发展自主可控的核心技术,摆脱对外依赖。
政府给予了很多支持和资金,鼓励企业加大研发力度。
许多优秀的科学家和工程师日以继夜地努力工作,终于取得了重大突破。
你看,我们不仅在芯片、通讯、人工智能这些领域有了飞速发展,在新能源、航空航天、生物医药等高科技领域也是成绩斐然。
我们的创新实力越来越强,完全不必依赖别人的技术了。
当然啦,要完全突破重重封锁,实现技术自主可控,还有很长的路要走。
但只要我们密切团结、同心协力,就一定能够创造更多自主知识产权,打破国外技术垄断,让我们伟大的祖国更加繁荣昌盛!总之,我们要坚定信心,勇敢地面对一切困难和挑战。
只要大家都像科学家和工程师们那样,怀着一颗创新的心,我们的事业就一定能源源不断地取得新的成就!篇2【企业突破技术封锁,打破国外技术垄断】大家好!我是小明,今天我来给大家讲讲一个很酷的事情。
你们知道吗?我们国家的一些公司最近干了一件了不起的事情,他们突破了国外的技术封锁,自己研发出了先进的技术!以前啊,有很多高科技产品和关键技术都被国外的一些大公司和国家所垄断。
比如说制作手机和电脑芯片、生产光刻机等等,我们国家的企业想要使用这些技术和设备,就必须从国外购买,而且价格还特别贵。
有的时候,国外的公司甚至根本不愿意把最先进的技术卖给我们。
不可磨灭的记忆CPU发展史经典回顾

关于CPU的基础知识:CPU的常识CPU(Central Processing Unit),被称呼为中心处理器或者Microprocessor微处理器。
CPU是计算机的核心,其重要性好比心脏对于人一样。
实际上,处理器的作用和大脑更相似,因为它负责处理、运算计算机内部的所有数据,而主板芯片组则更像是心脏,它控制着数据的交换。
CPU的种类决定了你使用的操作系统和相应的软件,CPU的速度决定了你的计算机有多强大,当然越快、越新的CPU会花掉你更多的钱。
CPU从最初发展至今已经有二十多年的历史了,这期间,按照其处理信息的字长,CPU 可以分为:四位微处理器、八位微处理器、十六位微处理器、三十二位微处理器以及六十四位微处理器等等。
如今,Intel的CPU和其兼容产品统治着微型计算机——PC的大半江山,但是除了Intel 或AMD的CPU,还是你可能听说过的其他一些CPU,如HP的PA-RISC,IBM的Power4和Sun 的UltraSparc等,只是它们都是精简指令集运算(RISC)处理器,使用Unix的专利操作系统,例如IBM的AIX和Sun的Solaris等。
虽然设计方式和工作原理的过程有区别,但不同处理器依然有很多相似之处。
从外表看来,CPU常常是矩形或正方形的块状物,通过密密麻麻的众多管脚与主板相连。
不过,你看到的不过是CPU的外衣——CPU的封装。
而内部,CPU的核心是一片大小通常不到1/4英寸的薄薄的硅晶片(其英文名称为die,核心)。
在这块小小的硅片上,密布着数以百万计的晶体管,它们好像大脑的神经元,相互配合协调,完成着各种复杂的运算和操作。
左边是揭了盖可以看到核心的处理器硅能成为生产CPU核心的半导体材料主要是因为其分布的广泛性和价格便宜。
此外,硅可以形成品质极佳的大块晶体,通过切割,得到直径8英寸甚至更大而厚度不足1毫米的圆形薄片——晶片(也叫晶圆)。
一片晶片可以划分切割成许多小片,每一小片就是一块单独CPU的核心。
CPU
闪龙系列CPU的核心类型 Paris Palermo
用CPU-Z查看CPU的具体参数1
用CPU-Z查看CPU的具体参数2
第一部分为处理器的类型,其中Processor(处理器)为 AMD Athlon XP CPU;Platform(封裝)是Scoket 462插脚; Vendor String(厂商)为AMD;Family、Model、Stepping ID组成系列号, 可以用来识别CPU的型号;Name String(名称)为AMD的Athlon系列CPU。 第二部分为处理器的频率参数。其中Internal Clock即CPU的主频,可以 看到这款CPU的主频为2280.30MHz,即2.2G;System Bus即前端总线, 这款CPU的外频为350MHz,并非标准的前端总线,因此是超了外频的 CPU;System Clock即外频,即为175MHz,是超了外频的CPU; Multiplier即倍频,这款CPU的倍频为13。 第三部分为处理器的缓存情况。L1 I-Cache:L1 I-缓存,这款CPU为 64k;L1 D-Cache:L1 D-缓存,同样为64K;L2 Cache:L2快取,这 款CPU的L2缓存达到512K;L2 Speed:L2速度,和CPU的主频一样。 第四部分为处理器所支持的多媒体扩展指令集,可以看到这款CPU所支 持的指令集有MMX、MMX+、SSE、3DNOW!、3DNOW!+,但是不 支持SSE2指令。
炼沙成金:讲述Intel处理器诞生之密
炼沙成金:讲述Intel处理器诞生之密CPU:Central Processing Unit,中文译名“中央处理器”,它被称为计算机的大脑,由此可见CPU在计算机中扮演着多么重要的角色。
日前全球第一大CPU制造商英特尔就公布了一组图片,为大家生动、详细地解释了一颗CPU是如何一步一步制造出来的。
也许用一个词可以大致概括这个变化,那就是“炼沙成金”。
是Intel怎么将海滩上的沙子变成滚滚的黄金的呢?且看下文。
沙子:硅是地壳第二丰富的化学物质,脱氧后的沙子(尤其是石英)会以二氧化硅(SiO2)的形态出现,其中会包含25%左右的硅元素。
可以说沙子是半导体产品最为普通的一种原料。
硅熔炼:晶圆尺寸(大约300mm / 12英寸)。
硅在经过不同的步骤净化后,最终必须达到制造合格半导体的质量标准,达到标准的硅被称为“电子级硅(Electronic Grade Silicon)”。
电子级硅包含有十亿个硅原子,其中可能只含有一个杂质原子。
上图展示了如何净化硅、从而提炼出大结晶体,这种结晶体被称为“硅锭(Silicon Ingot)”。
单晶硅锭:硅锭可由电子级硅制造而来。
一个硅锭的重量约为100千克,硅纯度为99.9999%。
硅切割:硅锭被切割成单个的硅片,而这就是“晶圆(Wafer)”。
晶圆:晶圆经过抛光后,其表面会非常平滑,且完美无瑕。
不过英特尔是通过第三方公司购买这些晶圆的。
例如,英特尔的45纳米高K/金属栅极(High-K/Metal Gate)工艺就使用了直径为300mm(约12英寸)的晶圆。
有意思的是,英特尔原本使用的是50mm(2英寸)晶圆,而现在使用的是300mm晶圆,这就在很大程度上降低了生产成本。
涂抹光刻胶(Photo Resist):在晶圆旋转过程中要浇上蓝色的液体(如图),这有点像传统电影胶片。
在这一步中,晶圆不断旋转的目的是让光刻胶能更薄、更平。
光刻(Exposure):光刻胶在经过掩模之后必须在紫外线下进行曝光处理。
cpu是什么意思(网络用词cpu是个梗的意思)
cpu是什么意思(网络用词cpu
是个梗的意思)
由于网络的发展,慢慢地某些词语成为了网络流行语,而这个cpu也是,我真是服了,可能不少人问cpu是什么意思,可能就是在问cpu网络用语是什么意思,这里我也将cpu所知道的意思全部说一遍吧。
网络用词cpu是个梗的意思,这个梗现如今被用来指代脑子的意思,延伸为洗脑,表达句式:他在cpu你,也就是他在给你洗脑。
原本CPU在网络上也被指代为很厉害的人,现如今,因演员许娣一段采访被大家疯狂玩梗,面对记者的提问:当被男朋友说不好看时该怎么办?原本想表达的是女生在被对方PUA,一时嘴瓢说成CPU,正由于这段采访,网友竟然将PUA这个词顺势改编成CPU,对方希望在精神上能够控制你,因此在言语行为上进行打击。
发现好多优秀词语都被网友玩出花样了,世界之大,真是让我大开眼界,也可能是咱岁数大了,见到的词语太少所致,不过在我的识海里,cpu就是计算机的中央处理器,也就是计算机的大脑,它的功能主要是解释计算机指令以及处理计算机软件中的数据。
让我们不要被网络宠坏了,否则我们甚至不知道什么是对的。
如果我们在学习知识,我们必须学习正确的东西。
不要去修一些没用的东西,人家也不会给你分数。
哦,考高分可能不太好。
关于cup的其它梗我也不讲了,没啥意思,不过值得一提的“女孩说的cpu是什么梗?这个我想说说,女孩说的cpu是来源于网络用语,是英文字母的缩写,就是在夸奖你,表示你有能力,有本事,头脑聪明的意思,像电脑的处理器CPU,如果把人说成CPU,证明人家在夸奖你这个人能力很强,头脑好用,因此,别人说你是CPU就是夸奖你有本事的意思。
哈哈,这个cpu是什么意思,咱们说这么多吧,不然说得太多,咱也记不住,好了,就这样吧。
PC走下“神坛”
PC走下“神坛”
周安利
【期刊名称】《中国经济和信息化》
【年(卷),期】1999(000)031
【摘要】今年长城掀起的两次“飓风”给北京几乎前所未有的酷夏带来了一股清凉,从“飓风499”到“飓风699”,大家已经感觉到低价电脑的来临。
【总页数】1页(P19-19)
【作者】周安利
【作者单位】本刊记者
【正文语种】中文
【中图分类】F426.67
【相关文献】
1.走下神坛还是加固神坛 [J], 岳伟
2.HPC走下“神坛” [J], 张杰
3.走下神坛永驻人间——读《走下神坛的毛泽东》 [J], 张金环
4.PC走下神坛 [J], 朱敏
5.中科院计算所欲让HPC走下神坛 [J],
因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
[原创连载]处理器走下神坛——处理器通俗讲义2#·导读:处理器做为计算机、通信产品、消费电子产品等的最核心部件,支撑着整个IT、CT 产业链的发展。
想学处理器的人很多,但常常因处理器技术专业性太强、枯燥、不易看懂而放弃。
复杂的技术背后常常隐藏着简单的道理,阿木希望能用简单的语言、图画和逻辑将处理器技术一一道破。
连载1:跟着顺溜学流水线连载2:流水线的若干问题探讨连载3:处理器的流水线实例连载4:处理器的性能公式连载5:提升处理器性能的3种武器连载6:处理器的几种并行策略连载7:程序员要了解处理器连载8:指令并行的两种流派连载9:you are my super scalar连载10:相关连载11:寄存器重命名连载12:体系结构与微架构连载13:指令的相关性确定连载14:乱序连载15:为什么if语句越少越好连载16:发生跳转时的流水线处理连载17:分支预测连载18:处理器的分支预测实现连载19:分支预测算法连载20:超标量处理器结构连载21:intel处理器的取址与译码连载22:指令分派连载23:Buffer的作用连载24:处理器的执行部件连载25:投机执行连载26:指令提交连载27:VLIW结构连载28:VLIW的优势连载29:软件流水导读:流水线是处理器中最基本的一个概念,处理器也都是按照流水线的思想来设计。
遥想当年攒机的时候,听着别人说着奔三几级流水线,赛扬几级流水线,对我们这种只知道主频是多少的人来说,感觉特牛X。
那么什么是流水线?顺溜将会告诉您答案。
2009年央视有部热播大剧:《我的兄弟叫顺溜》。
剧中顺溜是一个神枪手,里面有一个场景,当鬼子来袭击部队时,顺溜向团长建议,给自己配2个人装弹,自己负责打枪。
从直观的思维来看,有人帮顺溜装弹,则顺溜有更多的时间来射杀鬼子,下面我们再更严格地从数学的角度来分析。
我们来计算一下顺溜消灭鬼子的效率,假设:1.顺溜枪法命中率100%,一枪毙命,装弹的人枪法太差,命中率几乎为02.子弹射击流程:先上膛,再射击3.上膛需要花费5秒钟4.射击需要花费5秒钟从假设可知:如果顺溜采用原始的作战方案,即一人一枪,自己打自己的,射出一颗子弹需要10秒钟,那么1分钟顺溜可以消灭6个鬼子。
我们再来看看顺溜提出的作战方案:顺溜在射击的同时,战友给另一支枪上膛,顺溜射击完后,立即拿起另一支枪射击,这样就给顺溜节省了上膛的时间,相当于顺溜5秒钟就完成一次射击,1分钟顺溜可以消灭12个鬼子。
我们用图来描述这2种作战方案:原始方案顺溜的方案从顺溜方案的图上,我们可以看到:当顺溜在打出第一发子弹的同时,第二发子弹正在上膛,当顺溜在打出第二发子弹的同时,第三发子弹正在上膛,子弹就如同流水一样,在各个环节流动,最后一次流动到了小鬼子的身上,这个过程被形象的称为流水线。
这种流水线的方案使得顺溜的射击效率提升了一倍,虽然浪费了另外的人给顺溜装弹,但是并不是每个人都是顺溜这样的神枪手,因此浪费专人上膛是完全值得的。
(2)流水线的若干问题探讨在上一节中,顺溜已经告诉了我们流水线的基本概念,顺溜将整个射击过程分成了2个步骤(术语称之为节拍),两个步骤可以并行起来执行,只是时间上进行了些许的错位,这就是流水线的本质。
这条流水线被划分成了2个节拍,也就是2级流水线,于是我们引出了流水线的第一个问题:流水线级数。
众所周知,Intel处理器的流水线级数要远高于ARM、DSP等嵌入式处理器,那么流水线级数越多,有什么好处呢?还是以顺溜来举例子,假设顺溜将射击的流水线划分成4个步骤,由于阿木不熟悉真实的射击过程,就假设为上膛1、上膛2、射击1、射击2 四步吧,由于整个过程需要10秒,那么每一个小步骤需要2.5秒。
射击的4级流水线从图我们可以看出,现在顺溜每2.5秒就可以射出一颗子弹,于是一分钟可以消灭24个敌人,射击效率提高了一倍。
如果换算成计算机的术语,那就是处理器的工作频率可以提升一倍。
现在大多数嵌入式处理器的工作频率在1G Hz 左右徘徊,Intel处理器的工作频率早已跳过了3G Hz,这和流水线的级数有密切的关系。
至于嵌入式处理器的工作频率为什么不继续提高,留待以后再说。
总而言之,在不考虑其他因素的情况下,流水线级数越多,工作效率越高。
再回到顺溜的例子,细心的读者可能会发现:顺溜并不是要求1个人给自己上膛,而是要求2个人。
从直觉来看,顺溜不仅仅是个神枪手,同时也是个快枪手,射击的速度是上膛速度的2倍。
我们再来从数学的角度严谨的分析一下,这也引出了流水线的第二个问题:流水线的效率问题。
先修改一下上一节的假设:上膛时间为10秒,射击时间为5秒。
我们再来看看射击过程:不规则的流水线从图上我们可以看出,顺溜虽然射击速度只要5秒,但是也要等到战友将子弹上完膛才有枪可以射击,因此顺溜有5秒的时间在等待,实际的射击效率是10秒杀一人。
本着能者多劳的原则,让顺溜闲着是极大的浪费,因此我们要想办法提高顺溜的杀人效率。
一种解决方法是将子弹上膛细分为2个步骤,组成3级的流水线,如下图所示:拆分耗时较长的步骤采用这种方式后,相当于有2个战友给顺溜上膛,一个做上膛1这个步骤,另一个做上膛2这个步骤,再加上顺溜,这3个人组成一个流水线,可以保证顺溜5秒杀一人。
不过,很多事情是很难进一步分拆的,例如上膛就不能分成2个步骤,那么这时候怎么办呢?我们可以采取如下的策略:配备2个战友给顺溜上膛,每个10秒内就可以有2把枪的子弹上膛了,在下一个10秒内,顺溜就可以射击2次,因此也能保证顺溜5秒杀一人。
这也就是顺溜要求给自己配2个人装弹的原因。
给耗时步骤配置多个重复单元(3)处理器的流水线实例介绍完流水线的基本知识,再来看看处理器中实际的流水线。
这里以通信产品中常见的DSP为例来进行说明。
通信过程是信息从一个地方传到另一个地方的过程,信息需要经过信源编解码和信道编解码,这2者都是信息处理的内容。
DSP(digitalsignal processor,数字信号处理器)是专门针对数字信号处理算法进行优化了的处理器,被广泛的应用在通信领域的局端(电信运营商)和终端(个人、企业用户)产品中。
TI(TexasInstruments,德州仪器)是DSP领域的绝对领导者,一家占据了超半数的份额。
TI的DSP种类繁多,根据业界通用的分类方式,一般分为通用DSP和专用DSP(例如,专用于视频编解码的DSP),在不同的细分应用场景下,又有不同的型号。
总的来看,TI DSP 的款式很多,但是内核结构却变化不大,从c64内核,到c64+内核,再到定点、浮点统一的内核,DSP的流水线结构基本没有变化。
TI DSP中所有指令的执行都可分为Fetch(取址)、Decode(译码)、Execution (执行)3个大的步骤。
如果用射击来类比,那就是:取弹、装弹、射击。
DSP指令执行步骤根据流水线的基本知识,步骤划分越细,流水线节拍越多,执行效率越高。
取址单元被分成了4个小步骤(节拍):PG(programaddress generate),程序地址产生PS(programaddress send),程序地址发送PW(programaccess ready wait),程序访问等待PR(program fetchpacket receive),程序取指包接收译码单元被分为2个小步骤:DP(instructiondispatch),指令分配DC(instructiondecode),指令译码执行单元的节拍数不定,这是因为不同指令的复杂性不一样,执行的时间也不一样。
一个节拍对应一个时钟周期(cycle),简单的指令(如加法)只需要1个cycle,乘法等复杂的指令需要2个cycle,Load/Store这些内存操作的指令需要5个cycle,分支跳转指令需要6个cycle。
因此执行阶段的流水线最多划分为6个节拍。
流水线节拍我们先假设DSP的每条指令执行只需要一个cycle,来看看DSP工作时的流水线过程:DSP流水线流水线的执行过程分为三个阶段:进流水,并行执行,出流水。
如图,到第7个周期时,流水线排满,所有的硬件单元都被使用起来,这时处理器的执行效率最高。
(4)处理器的性能公式处理器是用来执行程序的,处理器的性能也就体现在执行程序的时间上。
如果执行完程序的时间越短,则说明处理器的性能越强。
我们将处理器执行程序的时间进行分解,就会找到影响处理器性能的很多因素。
处理器性能公式这个公式从左到右有4项,第1项用时间除以程序,表示执行程序所需要的时间;第2项用指令数除以程序表示程序包含的指令的数目;第3项用周期数除以指令表示每条指令执行所需要的周期数,第4项用时间除以周期表示每个周期对应的时间。
该公式也即:程序的执行时间=程序包含的指令数×平均每条指令的执行周期数×每周期对应的时间。
从处理器性能公式可以看出,为了提高处理器的性能,就需要减少程序的执行时间,可以通过如下途径去进行:1.减少程序的指令数。
2.减少指令的执行周期数。
3.减少时钟周期时间。
(5)提升处理器性能的3种武器武器1:减少程序的指令数程序由程序员产生,经过编译器进行编译,转换成处理器可执行的指令,进入处理器中执行。
减少程序的指令数,主要得靠程序员的个人修养以及编译器的性能,不过处理器也并非什么也做不了。
Intel的处理器有一个叫做Macro-Fusion的技术,能将某些指令合成一个,如:Compare 指令后有Jump指令,Macro-Fusion就可以将这2条指令合成一条比较跳转uops(intel称为微操作)。
武器2:减少指令的执行周期数指令的平均执行周期数有一个洋名,叫做CPI(cycles perinstruction)。
此CPI不等于彼CPI(Consumer Price Index,消费者物价指数),不过大家对想要降低CPI的愿望都是这么的强烈(扯远了,打住,只谈技术,不谈政治,嘿嘿)。
当处理器的流水线结构定义好后,指令的执行周期数就固定好了。
既然不能直接减少指令的执行周期数,那就逆向思维,增加每个周期执行的指令数。
以前只有一个顺溜,那就多培养几个顺溜,一个执行单元处理一条指令,那就在处理器上多摆几个执行单元。
这就是指令级并行,也是处理器在很长一段时间内的主流设计思想。
武器3:减少每周期的时间我们很小的时候就学过周期和频率的关系:T=1/f。
数字电路以周期(cycle)为基本的执行单位,每个cycle时间越短,则电路运算速度越快,也即频率越高。
Intel、AMD等公司在多核风靡之前都极力的提高处理器工作频率,很多玩家更是热衷于超频。
集成电路制程工艺的进步和流水线优化是提高频率的主要手段,先进的制程工艺减少了信号的传输延迟,使得频率得以提升,流水线级数越深,每个周期完成的任务越少,信号的传输延迟越小,频率也得以提升。