多处理机系统介绍(翻译)

合集下载

多核CPU与多处理机分解

分的受保护的内存空间。
13121507张文杰
流水线
译码级有一些略微的修改。不同于以往处理器仅仅译码指令指针指向的指令，现今的处理器（2008-2013 年）每个时钟周期最多可以译码 4 条指令。寄存器重命名(register aliasing) 在处理器内部，这些原始的寄存器（如 AX,BX,CX,DX 等）被翻译（或者重命名）成为内部的寄存器，而这些寄存器对程序员是不可见的。寄存器和内存地址需要被映射到一个临时的地方用于指令执行。当前每个始终周期可以翻译 4 条微指令。重排序缓存(Reorder Buffer, ROB) ROB 可以存储最多 128 条微指令。在支持超线程的处理器上，ROB 同样可以重排来自两个虚拟处理器的指令。两个虚拟处理器在 ROB 中将微指令汇集到一个共享的乱序执行部件中。
13122711胡红青
两者的比较
这就像为什么我们要去公司上班而不是在家里上班一样。去公司上班（多核CPU）的话，资源共享（共享缓存），沟通方便（CPU内数据传输速度远大于总线速度）。但是如果信息技术（类比总线）上有突破性进展，否则我们还是每天要挤公车去公司上班。
13122711胡红青
形象的任务目标：你需要搬很多砖，你现在有一百支手。实际的任务目标：你有一个很大的计算任务，你有很多cpu。
13121507张文杰
02 简谈进程、线程、多机、内核、流水线
16组
13121507张文杰
专业定义
操作系统中的进程是指特定的代码序列在指定的数据集合上的一次执行活动，是指并行程序的一次执行过程，在Windows系统中就是一个EXE文件。计算机上运行的可执行文件对特定的输入数据的一个实例。进程=PCB（进程控制块）+程序段+数据

专业英语缩写翻译

ABI 应用二进制接口(Application Binary Interface)ACSI 国家信息化咨询委员会（advisory committee for state informatization）ADSL 非对称数字用户线路(Asymmetric Digital Subscriber Line)AI 人工智能（artificial intelligence）AMPS 高级移动电话系统(Advanced Mobile Phone System)API 应用程序接口(Application Programming Interface)ASIC 特定用途集成电路（Application Specific Integrated Circuit）ASTM 美国试验材料学会（American Society for Testing Material）AT&T 美国电话电报公司（American Telephone and Telegraph Company）ATM 异步传输模式(Asynchronous Transfer Mode)ATOS Origin 源讯公司Auto-ID 自动识别（Auto-ID）AWS 美国航空气象处（Air Weather Service）；BAP 基本汇编程序（Basic Assembler Program）BGA 集成电路采用有机载板的一种封装法BOINC 伯克利开放式网络计算 (Berkeley Open Infrastructure For Network Computing ) BSP 板级支持包(Board Support Package)Business Processing 业务处理流程CaaS 通信即服务(communication as a Service)CAN 控制器局域网络(Controller Area Network)CAS 中国科学院（Chinese Academy of SciencesCCTV 中国中央电视台（China Central Television）CDMA2000 电信移动通信系统CIP 预编目录（cataloging in publication）CITYNET 城市间合作网络CMU 卡内基梅隆大学（Carnegie Mellon University）CN 通信网络（Communicating Net）CPU 中央处理机（Central Processing Unit）CRA 应答验证 (challenge-response authentication)DARPA 美国国防部高级研究计划局（Defense Advanced Research Projects Agency）DARPA 研究计划署(Defense Advanced Research Projects Agency)DASH7Data mining 数据挖掘技术（即指从资料中发掘资讯或知识）DDoS 分布式拒绝服务（Distributed Denial of Service）DG INFSO 媒体总司DG INFSO/D4 欧盟委员会DGINFSO‐D4DMM 分布式内存多处理器（distributed memory multiprocessor）DNS 域名服务器（Domain Name Server）DoD 美国国防部（Department of Defense of the United States）DRAM 动态随机存取存储器（Dynamic Random Access Memory）DSL 数字用户线路(Digital Subscriber Line)DSP 数字信号处理器（Digital Signal Processor）DSS 决策支持系统（Decision Support Systems）DynDNS 动态DNSEAN 欧洲商品编码(Europ Article Number)EAS 电子防窃系统（Electronic Article Surveillance）ECMA 欧洲电脑制造商协会（European Computer Manufactures Association）EPC 电子产品代码(Electronic Product Code)EPCglobal 国际物品编码协会EAN和美国统一代码委员会（ UCC ）的一个合资公司ERP 企业资源计划（Enterprise Resource Planning）ETSI 欧洲电信标准协会（European Telecommunication Standards Institute）EU-funded CASAGRAS1 coordination 欧盟资助CASAGRAS1协调FAT 文件分配表(File Allocation Table)FP7 欧盟第七框架计划(Framework Program 7)FreeOTFE 免费实时加密FSTC 金融服务技术联盟(Financial Services Technology Consortium)FTP 文件传输协议（File Transfer Protocol）GM 通用汽车公司（General Motors）GMSA 全球移动通信系统协会(global system for mobile communications association) GPRS 通用分组无线业务（General Packet Radio Service）GPS 全球定位系统（Global Position System）GSM 全球移动通信系统（Global System for Mobile Communications）GUI-based 图形用户界面HP 惠普公司HTML5 HTML5是HTML下一个的主要修订版本，现在仍处于发展阶段HTTP 超文本传输协议（Hyper Text Transport Protocol）HTTPS 安全超文本传输协议(Hypertext Transfer Protocol Secure)I²C 两线式串行总线（Inter－Integrated Circuit）IaaS 架构即服务(Infrastructure As A Service)IATA 国际航空运输协会（International Air Transport Association）ICC 集成电路卡(integrated circuit card)ICT 集成电路计算机遥测技术（Integrated Computer Telemetry）iDA 资讯通信发展管理局(infocomm Development Authority)IEC 国际电工技术委员会（International Electrotechnical Commission）IEEE 电气与电子工程师协会（Institute of Electrical and Electronic Engineers）IETF Internet工程任务组（Internet Engineering Task Force）IMT-2000 国际移动电话系统-2000（International Mobile Telecom System-2000）IOT 物联网(Internet Of Things)IPSec 网际协议安全（Internet Protocol Security）IPSO 因特网协议安全选件（Internet protocol security option ）IPv4 IPv4，是互联网协议（Internet Protocol，IP）的第四版IR 指令寄存器（instruction register）ISA 工业标准总线(Industry Standard Architecture)ISM 美国供应管理协会（the Institute for Supply Management , ISM）ISO 国际标准化组织（International Standardization Organization）ISTAG IST咨询集团(IST advisory group)IT 信息技术(Information Technology)ITSO_LtdITU 国际电信联盟（International Telecommunication Union）KAEC 阿卜杜拉国王经济城(King Abdullah Economic City)KVM 基于内核的虚拟机（K Virtual Machine）LAN 局域网（local area network）LCD 液晶显示屏（liquid crystal display）LR-WPAN 低速率无线个人区域网络（Low Rate-Wireless Personal Area Network）LSI 大规模集成电路（Large Scale Integrated circuit）MAC 多路存取计算机（Multi-Access Computer)MAN 城域网(Metropolitan Area Network)MASDAR 马斯达尔MEMS 微电子机械系统（Micro-electromechanical Systems）METI 日本经济贸易产业省（Ministry of Economy， Trade and Industry）MIC 部门内部事务和通讯(the ministry of internal affairs and communications) MIT 麻省理工学院（Massachu-setts Institute of Technology）；MPP 大量信息并行处理机，大规模并行处理机（Massively Parallel Processor）MRI 核磁共振成像（Magnatic Resonance Imaging）；MSI 中规模集成电路（medium-scale integration）MVNO AdicaNaaS 网络即服务(Network As A Service)NASA 美国国家航空和宇宙航行局（National Aeronautics and Space Administration）NetBSD 一个免费的，具有高度移植性的UNIX-like操作系统NFC 近场通讯(Near Field Communication)NFCIPNIC 网络接口卡(Network Interface Card)NMT 北欧移动电话(Nordic Mobile Telephone)NSF （美国）国家科学基金会（National Science Foundation）NTT DoCoMo 移动通信网公司NYU 纽约大学（New York University）OLED 有机发光二极管（Organic Light Emitting Diode）ONS 国家统计局(Office For National Statistics)P2P 点对点技术（peer-to-peer）；PaaS 平台即服务(Platform As A Service)PARC 帕洛阿尔托研究中心（Palo Alto Research Center）PC 个人电脑（Personal Computer）；PCI 外部控制器接口（Peripheral Component Interconnect）PHY 物理层协议（Physical Layer）PKI 公钥基础设施（Public Key Infrastructure）POTS 普通老式电话服务(Plain Old Telephone Service)QNX 嵌入式实时操作系统（Quick Unix ）R&D 研发(Research & Development)RACO 德国雷科resPONDER 响应器RFID 无线射频识别（radio frequency identification devices）RISC 精简指令集计算机（Reduced Instruction-Set Computer）ROM 只读存储器（read only memory）RS-232 串行数据通信的接口标准RTOS 实时操作系统（Real Time Operating System）SaaS 软件即服务（Software as a Service）SAP SAP是目前全世界排名第一的ERP软件SAVVIS 维斯公司SCADA 监测控制和数据采集（supervisory control and data acquisition）SIM 用户身份识别卡（subscriber identity module）SIMD 单指令多数据(Single Instruction Multiple Data)SIMIT 中国科学院上海微系统与信息技术研究所SMP 对称多处理机（SymmetricalMulti-Processing）SOC 片上系统（System on a Chip）SPOM 自动程序单芯片微处理(Self Programmable One Chip Microprocessor)SPT 季票 (season parking ticket)SRI 斯坦福研究院(Stanford Research Institute)SSE 单指令多数据流式扩展 ( streaming SIMD extensions)SSI 小规模集成（电路）（Small Scale Integration）；SSO 单点登录（single sign-on）T2TITTACS 全接入通信系统（Total Access Communication System）TCB 可信计算基(Trusted Computing Base)TCP/IP 传输控制/网络通讯协定（Transmission Control Protocol / Internet Protocol）TD-SCDMA 即时分同步的码分多址技术（Time Division-Synchronization Code Division Multiple Access）TEDS 传感器电子数据表（Transducer Electronic Data Sheet）TLS/SSL SSL（Secure Sockets Layer，安全套接层）TPANSmitterTRON 实时操作系统核心程序（The Realtime Operating System Nucleus）U.S.Department of Defence 美国国防部UCC 统一编码委员会（uniform code council inc）UCLA 加州大学洛杉矶分校（University of California at Los Angeles）UHF 超高频（Ultra High Frequency）UML 统一建模语言（Unified Modeling Language）UNL 无处不在的网络实验室（ubiquitous networking laboratory）USAID 美国国际开发署（United States Agency for International Development）USB 通用串行总线（Universal Serial Bus）USDA 美国农业部（United States Department of Agriculture）VLSI 超大规模积体电路（Very Large Scale Integrated Circuites）VNP-VNOWAN 广域网(Wide Area Network)WCDMA 宽带码分多址移动通信系统（Wideband Code Division Multiple Access）Wi-Fi 无线上网技术WROM 一次写/读很多内存(write once/read many memory)WSN 无线传感网络(wireless sensor network)。

单片机介绍中英文

附件1：外文资料翻译译文单片机介绍单片机也被称为微控制器（Microcontroller Unit），常用英文字母的缩写MCU表示单片机，它最早是被用在工业控制领域。

单片机由芯片内仅有CPU的专用处理器发展而来。

最早的设计理念是通过将大量外围设备和CPU集成在一个芯片中，使计算机系统更小，更容易集成进复杂的而对体积要求严格的控制设备当中。

INTEL的Z80是最早按照这种思想设计出的处理器，从此以后，单片机和专用处理器的发展便分道扬镳。

早期的单片机都是8位或4位的。

其中最成功的是INTEL的8031，因为简单可靠而性能不错获得了很大的好评。

此后在8031上发展出了MCS51系列单片机系统。

基于这一系统的单片机系统直到现在还在广泛使用。

随着工业控制领域要求的提高，开始出现了16位单片机，但因为性价比不理想并未得到很广泛的应用。

90年代后随着消费电子产品大发展，单片机技术得到了巨大提高。

随着INTEL i960系列特别是后来的ARM系列的广泛应用，32位单片机迅速取代16位单片机的高端地位，并且进入主流市场。

而传统的8位单片机的性能也得到了飞速提高，处理能力比起80年代提高了数百倍。

目前，高端的32位单片机主频已经超过300MHz，性能直追90年代中期的专用处理器，而普通的型号出厂价格跌落至1美元，最高端[1]的型号也只有10美元。

当代单片机系统已经不再只在裸机环境下开发和使用，大量专用的嵌入式操作系统被广泛应用在全系列的单片机上。

而在作为掌上电脑和手机核心处理的高端单片机甚至可以直接使用专用的Windows和Linux操作系统。

单片机比专用处理器更适合应用于嵌入式系统，因此它得到了最多的应用。

事实上单片机是世界上数量最多的计算机。

现代人类生活中所用的几乎每件电子和机械产品中都会集成有单片机。

手机、电话、计算器、家用电器、电子玩具、掌上电脑以及鼠标等电脑配件中都配有1-2部单片机。

而个人电脑中也会有为数不少的单片机在工作。

CPU的英文全称Central Processing Unit

CPU专题CPU的英文全称Central Processing Unit,中文名称即中央处理单元,也称为微处理器.中央处理器（Central Processing Unit，简写为CPU）的结构，CPU是决定电脑性能的核心部件。

CPU即中央处理单元，是英文Central Processing Unit 的缩写，是整个系统的核心，也是整个系统最高的执行单位。

它负责整个系统指令的执行，数学与逻辑的运算，数据的存储与传送，以及对内对外输入与输出的控制。

在向大家介绍CPU详细的情形之前，务必要让大家弄清楚到底CPU是什么？它到底有那些重要的性能指标呢？CPU的英文全称是Central Processing Unit，我们翻译成中文也就是中央处理器。

CPU（微型机系统）从雏形出现到发壮大的今天（下文会有交代），由于制造技术的越来越现今，在其中所集成的电子元件也越来越多，上万个，甚至是上百万个微型的晶体管构成了CPU的内部结构。

那么这上百万个晶体管是如何工作的呢？看上去似乎很深奥，其实只要归纳起来稍加分析就会一目了然的，CPU的内部结构可分为控制单元，逻辑单元和存储单元三大部分。

CPU的工作原理就象一个工厂对产品的加工过程：进入工厂的原料（指令），经过物资分配部门（控制单元）的调度分配，被送往生产线（逻辑运算单元），生产出成品（处理后的数据）后，再存储在仓库（存储器）中，最后等着拿到市场上去卖（交由应用程序使用）。

CPU作为是整个微机系统的核心，它往往是各种档次微机的代名词，如往日的286、386、486，到今日的奔腾、奔腾二、K6等等，CPU的性能大致上也就反映出了它所配置的那部微机的性能，因此它的性能指标十分重要。

在这里我们向大家简单介绍一些CPU主要的性能指标：第一、主频，倍频，外频。

经常听别人说：“这个CPU的频率是多少多少。

”其实这个泛指的频率是指CPU的主频，主频也就是CPU的时钟频率，英文全称：CPU Clock Speed，简单地说也就是CPU运算时的工作频率。

Nucleus 操作系统内部参考手册介绍

Nucleus PLUS I/O 驱动器常量 cleus PLUS I/O 驱动器 C 语言结构
第一章介绍
这章描述了该手册的目的，提供了 Nucleus PLUS 内核的概述及它的结构。章节 1.1 手册的目的 1.2 关于 Nucleus PLUS 1.3 Nucleus PLUS 的结构
2.2 组件组成
软件组成部分包含文件：数据类型的定义和常量文件，外部接口文件，一个或更多的 c 和汇编文件。具体文件如下列表：文件名功能说明备注 XX_DEFS.H 定义常量和数据结构 XX_EXTR.H 定义外部接口，是按照原形函数定义的 XXD.C 定义静态和全局数据结构 XXI..C 定义组件的初始化函数 XXF.C 该文件的常量函数，提供对象的静态信息 XXC.C 包含组件的核心函数 XXCE.C 包含对核心函数错误检测的外壳函数 XXS.C 定义补充的函数 XXSE.C 定义查错函数注：xx 代表组件名的两个字母。每个组件不必每种文件类型都有。格式所有的软件代码文件都有相同的基本格式。文件的第一部分包含了标题的通用信息，作为序言调用的开端。第二部分包含了专用于内部数据声明和内部函数的说明。剩下的部分包含了文件的实际函数。序言序言的目的用于描述文件的目录。与 ATI 的自己的文件相关联，并提供了文件修订版的相关信息。一个序言格式例子，如下所示：
第二章工具约定
2.1 组件 2.2 组件组成格式序言序言之后文件其他部分 2.3 命名约定组件命名＃define 命名结构体命名 Typedef 命名结构体成员命名全局变量命名局部变量命名函数命名 2.4 缩进 2.5 注释
第三章软件概述
3.1 基本用法操作模式应用初始化包含文件 3.2 数据类型 3.3 服务调用映像

使用AI技术进行机器翻译的步骤与技巧

使用AI技术进行机器翻译的步骤与技巧随着人工智能（AI）的快速发展，机器翻译已经成为一项受到广泛关注的技术。

通过利用强大的计算能力和大数据分析，AI可以在较短时间内完成大量文本的翻译工作。

本文将介绍使用AI技术进行机器翻译的步骤与技巧。

一、收集并准备训练样本为了让AI系统学习并理解不同语言之间的关系，第一步是收集并准备足够数量和多样性的训练样本。

这些样本应该包括各种主题和领域的文章、网页内容以及其他相关文本资料。

这样做可以确保AI系统具备泛化能力，并能够应对各种实际翻译任务。

二、构建机器翻译模型在拥有足够训练数据后，下一步是构建一个机器翻译模型。

通常情况下，基于神经网络的深度学习模型被广泛应用于机器翻译领域。

这种模型可以通过多层次处理来提取输入文本中隐藏信息，进而生成目标语言的输出结果。

三、训练机器翻译模型训练机器翻译模型需要大量的计算资源和时间。

在这一过程中，AI系统会根据输入的训练样本逐步调整自己的参数，以最大程度地提高翻译准确度。

在迭代的过程中，可以使用一些优化方法来加快训练速度，例如批量梯度下降算法或Adam优化器等。

四、处理长句和复杂结构在进行机器翻译时，经常会遇到一些长句子或复杂结构。

为了提高准确性，可以采取以下策略：首先，在输入之前对句子进行分段处理，并在段落之间建立联系；其次，针对复杂结构设计特定的处理规则，例如将从句分解为简单短语进行独立翻译。

五、引入语境信息为了更好地理解输入文本并生成更准确的翻译结果，加入语境信息是非常重要的。

通过引入上下文信息或先前翻译的片段，AI系统可以更好地理解当前待翻译句子所处的语义环境，并做出相应调整。

这种技巧能够提高机器翻译的连贯性和准确度。

六、后处理和编辑尽管AI系统在机器翻译方面取得了巨大进展，但人工编辑仍然是确保最终翻译结果质量的关键环节。

在完成机器翻译后，人工编辑可以对文本进行校对，修复可能存在的语法错误或意义不符情况，并调整句子结构以提高自然度。

计算机系统的基础知识

计算机系统的基础知识有关计算机系统的基础知识本章主要内容计算机系统结构基础计算机操作系统基础1.计算机系统结构的基础计算机系统结构的基础概念主要研究软件、硬件功能分配，确定软件、硬件界面，即从机器语言程序员或编译程序设计者的角度所看到的物理系统的抽象。

计算机系统的分类Fly分类SISDSIMDMISDMIMD2.CPU结构及分类CPU的结构运算器控制器寄存器输入输出总线分类16位32位64位3.指令系统及其分类指令系统的基础概念指令系统是计算机所有指令的集合。

程序员用各种语言编写的程序都有翻译成以指令形式表示的机器语言后才能运行，所以指令系统反映了计算机的基本功能，是硬件设计人员和程序员都能看到的机器的主要属性。

分类复杂指令系统（CISC）：随着硬件成本的不断下降，软件成本的不断提高，使得人们热衷于在指令系统中增加更多的指令和复杂的指令，来提高操作系统的效率，并尽量缩短指令系统与高级语言的语义差别，以便高级语言的编译和降低软件成本，同时为了保证程序兼容，新的计算机的指令系统只能增加而不能减少，所以就使得指令系统越来越来复杂精简指令系统（RISC）：通过简化指令使计算机的结构更加简单合理，从而提高运算速度！RISC的特点及其优缺点4.存储系统的基础知识基本概念存储器主要用于存放计算机的程序和数据，存储器系统指的是存储器硬件设备以及管理该存储器的'软、硬件设备。

对存储器的基本要求是增大容量、提高速度、降低价格。

单一的存储器硬件（主存储器）难以满足要求。

所以就提出了多层次的存储体系结构（即：寄存器---Cache--主存—外存）在计算机中存放当前正在执行的程序以及被程序所使用的数据（包括运算结果）原存储器称为主存储器。

也就是我们所说的内存5.主存储器的种类按读写功能来分：是否需要定期刷新：静态：不停电情况下能长时间保留不变，速度快，但容量小，成本高动态：不停电的情况下也要定期刷新，容量大，成本低，常用在计算机系统中，常见的有：SDRAM、DDR等可读写（RAM）可擦写只读：EPRM（可擦写，用紫外线擦写）EERM（可用电擦写）FLASH（电读写，但只能以块为单位，速度快，成本低，现在最常用）可编程：ERM（通过编程一次性写入）只读：RM（制造时一次性写入）6.存储器容量的扩展位扩展：位扩展是对存储器的位数进行扩充字扩展：是对存储器的容量进行扩展位、字扩展：对位数和容量都进行扩展7.多体交叉存储为了协调存储器与CPU速度的，其工作原理是：将存储器分成几个独立的个体，这样第一次就能进行多个字的数据读写！影响多体交叉效率的因素：多体存储的模值M数据的分布情况较移指令8.Cache的基础知识基本概念在多级存储体系中，Cache处于CPU与存储器之间，其目的是使程序员能使作一个速度与CACHE相当而容量与主存相当的存储器。

通信-通信英语对照翻译

*understand the difference between telecommunications and data communications. 明白远距离通讯和数据通讯的之间的差异性telecommunications:包括了电话技术电报技术还有电视是指有距离的通讯data communications:在计算机信息系统中,数据(data)是以2进位的方式(0或1)来表示而数据通讯则是将资料以(0或1)的型式经由穿传输媒介在两个装置之间交换*be familiar with standards organizations and their duties.熟悉标准的组织和他们的责任1.ISO(国际标准组织) :发展世界性的技术协议，然后发行国际标准2.ITU-T(国际电信联盟标准化部门):制定电子通讯的标准3.ANSI(美国国家标准协会):非营利的私人组织目标在美国提供一致的标准4.IEEE(电机及电子工程师学会):世上最大的职业电机工会监视着发展与融合国际标准来计算和沟通(?)5.EIA(电子工业协会)*Understand the need for a network and distinguish between different network types. 了解网络所需和区别网络的类型.Performance reliability security我们要了解网络的是整体效率、可靠度和安全性.网络的类型::*Understand the difference between a protocol and a standard.了解protocol和standard的不同.Protocol: 在终端机或电上的软硬件界面,集允许经由通讯网路传送信号并形成通讯语言Standard: 在工程和技术上用于规定项目、材料、方式、设计或工程实践所用的标准格式.*list the component of a data communications system.列出构成数据通讯系统的要素1.message: 可被沟通的讯息,如文字,数字,图片,声音,视讯或者上述的综合体2.sender: 传送讯息的设备,如:计算机,工作站,电话,等等.3.receiver: 接收讯息的设备,如:计算机,电视,工作站,电话,等等4.medium: 传送媒介,是指讯息重传送端到接收端之间的实体路径,如:双绞线,雷射,无线电波,同轴电缆,,光纤5.protocol:协定:一种管理数据通讯的公用规则,少了它传送端和接收端可能会无法了解彼此的讯息为何~*understand the duties of the layers in the OSI model.明白OSI模型各层的任务1.实体层(Physical Layer):1.传输信息的介质规格2.将数据以实体呈现并传输的规格3.接头的规格2.链接层(Data-Link Layer):包含3项:1.同步2.侦错3.制定媒体存取的控制的方法3.网络层(Network Layer):包含2项:1.寻址2.选择传输路径4.传输层(Transport Layer)工作包含3项:1.编定序号2.控制数据流量3.侦错与错误处理.5.会议层(Session Layer)负责通讯的双方在正式开始传输前的沟通,目的在于建立莉传输时所遵循的的规则,使传输更顺畅更有效率.6.表现层(Presentation Layer):包含3项:1.内码转换2.压缩与解压缩3.加密与解密7.应用层(Application Layer)直接提供档案传输,电子邮件,网页浏览等服务给使用者.在实作上,大多化身为成套的应用程序*Understand the duties of the layers in the Internet model了解因特网模式各层的职责第四层:应用层,定义应用程序如何提供服务.第三层:传输层,负责传输过程的流量控制、错误处理、资料重送等工作.第二层:网络层,决定数据如何传送到目的地.第一层:连结层,负责对硬件的沟通.*Be able to compare the layers in the OSI and Internet model.能够比较OSI模式和因特网模式.Internet model的应用层相当于OSI model的第5、6、7三层Internet model的连结层相当于OSI model的第1、2二层Internet model的分工比较粗略,不像OSI model那么精密与周延.Internet model比较简单和有效率, OSI model适合用在学习上,容易分清各层的职责.KEY TREMSAmerican National standards Institute(ANSI): 美国国家标准协会application layer :应用层--osi模型的7层之一直接提供档案传输,电子邮件,网页浏览等服务给使用者.在实作上,大多化身为成套的应用程序ATM Forum:异步传输模式论坛(?)Bit: 位--以二进记数方法表示的一个数字。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

多处理机系统介绍随着用户计算需求的增长，多处理系统能够提供一个自然地、不断提高的升级途径。

只要核心的用户程序能够提供线程级并行，给系统添加处理器，或者将较小的系统替换为较大的、包含更多处理器的系统，都能给用户提供一个直接增加计算能力的途径。

其次，多处理机系统使系统供应商能够将单个微处理器的设计代价分摊到多种设计方案中，这些设计方案能够提供不同层次的性能和扩展能力。

最后，使用一致共享存储器的多处理机系统能够提供与分时共享的但处理机兼容的编程模式，便于用户使用以前已经存在的应用程序，也便于开发新的应用程序。

在这些系统中，硬件和操作系统软件综合起来提供给用户和程序员的功能界面，实际上是基于以下4点多处理机理想假设:完全共享存储器即系统中所有处理机对所有物理存储器的访问都是平等的。

单位延迟即所有的访存请求都能在一个周期内满足。

无竞争即一个处理机的访存不会受到另一个处理机访存的影响。

写的瞬间船舶即某个处理机写存储器导致的更新立刻对所有的处理机可见。

系统及处理机的设计者必须努力使系统尽量接近这些理想假设，从而满足用户对于性能和正确性的要求。

显然，在实现这些目标时，诸如造价以及可扩展性等因素起着重要作用，但是一个优秀的系统必须很好的满足这些假设。

完全共享存储器，单位延迟以及无竞争诸如图9.4所示，大多数提供一致存储器访问（UMA，Uniform Memory Access）的传统共享存储器多处理机系统使用一种“dancehall”的组织结构，一组存储器模块或者存储体通过交叉开关互联网络与另一组处理机连接起来，并且每个处理机通过交叉开关访问存储器的延迟是相通的。

这种方法的弊端在于交叉开关的价格，该价格会随着处理机和存储器的总数按平方增长，同时每次访存都必须穿过交叉开关，另一种方法是非一致存储访问(NUMA,Nonuniform Memory Access),许多系统供应商现在都按照这种方法构造系统，在这种方法中，处理机仍然通过一个交叉开关互联网络连接在一起，但是每个处理机有一个本地的存储器，它的访问延迟要低得多，在NUMA结构中，只有对远程存储器的访问才存在穿越交叉开关的延迟开销。

在UMA和NUMA系统中，与单处理机系统一样，都是通过cache来近似满足单位延迟的理想假设，cache能够同时满足对本地和远程存储器（NUMA）的访问，类似的，可以使用cache 对访存流量进行过滤减轻存储体之间的竞争。

因此，对于在单处理机系统中不可缺少的cache，在多处理机系统中同样非常有用，然而，cache的存在个处理存储器写操作带来了一定的困难，因为存储器写操作必须对其他处理机可见，或者传播给其他处理器机。

写操作的瞬时传播在一个分时共享的单处理机系统中，如果一个线程改写了存储器某个单元的值，该线程以及任何其他线程都会立刻查看新的值，因为这个值会存放在处理机的cache中。

遗憾的是，对于多处理机系统，不再具备这个立即可见的特性，因为对同一地址的访问可能有其他处理机发出，由于这些处理机有了自己的cache，可能包含同一cache行的私有副本，它们可能看不到其他处理机的更新。

例如，在图9.5(a)中，处理机P1向存储器地址A写入值1。

由于并没有一致性的支持，在P2的cache中，存储器地址A的副本并没有被更新，P2读取A将会得到以前的值0。

这就是经典的cache一致性问题。

要解决这一问题，系统必须提供cache 一致性协议，保证系统中所有的处理机能够察看到其他处理机的更新，这样每个处理机拥有一致的存储器视图。

实现cache一致性有两种基本的方法：更新协议和作废协议，我们将在后面的章节中简要的讨论这两个协议。

图9.5（b）和图9.5（c）分别对这两种协议进行了说明一致的共享存储器对于共享存储器的多处理机系统，一致的存储器视图很难实现。

但如果不能实现一致的视图，共享存储器程序的行为将不可预测，因为不同的处理机从存储器读到的值各不相同。

我们已经论述过，一致性问题是由于写操作不能立刻自动地传播给其他处理机的cache造成的。

有两类一致性协议可以保证写操作的结果对于其他处理机是可见的。

更新协议早期提出的多处理机系统采用一个相当直接的办法来维护cache一致性，在这些系统中，处理机的cache采用写直达策略，所有的写操作不仅写入执行写操作的处理机cache，同时也写入存储器。

这种协议如图9.5（b）所示，由于所有的处理机都连接在一条共享的总线上，这条总线还将所有的处理机与存储器相连，所以所有其他处理机可以在共享总线上监听新的值，并更新它们的数据副本（如果有这样的副本）。

这样就能够得到写直达的结果。

实际上，这种更新协议是基于广播写直达策略的，即每个处理机的每次写操作都是写直达，不仅写入存储器，还写入任何拥有这个数据副本的处理机cache。

显然，这种协议扩展性较差，仅限于数量较少的处理机，否则大量处理机的写直达流量会很快将存储器总线的可用带宽占用完。

可以对该协议进行简单的优化，对数据采取写回策略，即写操作只是将数据写入处理机的本地cache，当这一行被替换出cache时，才将结果写回存储器。

然而，在这样的协议中，任何对共享cache行（存在于任何其他处理机cache中的行）的写操作仍然需要在总线上广播，以使包含共享副本的处理机能更新它们的副本。

而且，一个远程读操作所读的行如果恰好是修改过的，那么在满足读请求之前，要将这一行先写回存储器。

遗憾的是，更新协议对于带宽的苛刻要求使得这种协议几乎消失，因此没有一个现代多处理机系统采用更新协议来维护cache一致性。

作废协议现代共享存储器多处理机系统都采用作废协议来维护cache一致性，作废协议的基本前提很简单：任何时候只允许一个处理机执行写操作（这样的协议经常称为single-writer协议）在该协议中，试图对cache中某一行写数据的处理机必须使该行成为系统中唯一有效的副本，而其他处理机cache中的副本都要作废掉（所以称为作废协议）。

该协议如图9.5（c）所示。

简单地说，处理机执行写之前，首先要检查系统中是否还存在其他副本。

如果有，处理机发出消息将其他副本作废。

然后，处理机向其私有（专用）副本中写入数据。

后续的、对同一行的写操作可以流水化，因为不需要检查是否存在其他副本。

和单处理机的协会cache一样，修改过的行知道被替换出去的时候才协会存储器。

然而，一致性协议必须记住存在这样一个修改过的副本，以防止其他处理机到存储器读取以前的值。

而且，还必须能够从处理机cache 中读出修改过的数据，以满足其他处理机对这个唯一副本的远程访问。

作废协议要求cache目录至少要为每行维护两个状态：修改（M）状态和作废（I）状态。

如果某一行处于作废状态，那么这一行的数据无效，必须从存储器中读取数据。

如果处于修改状态，处理机知道系统中没有别的副本（即本地的副本是专有副本），因此处理机能够对这一行进行读写。

注意，如果被替换出去的行处于修改状态，必须写回存储器，因为处理机可能对它进行了写操作。

简单的办法是在cache行的状态中加入一个dirty位，使得处理机能够区分哪些是处理机的专有行（通常称为E状态），哪些是专有并且修改过的行（M状态）。

Macintosh桌面系统使用的IBM/Motorola PowerPC G3处理器实现了这种作废协议。

注意，如果只有这三种状态（MEI），cache行不能同时出现在多个处理机中。

因此，需要解决这一问题，允许可读的副本能够出现在多个处理机的cache中。

多数作废协议还包括一个共享状态（S），这个状态表明，系统中可能存在多个可读的副本。

如果一个处理机要向处于S状态的cache行写数据，必须首先将这一行提升到M状态并作废其他远程的副本。

图9.6显示了一个简单的MESI一致性协议的状态表个转换图。

每一行代表4种状态（M，E，S或者I）中的一种，针对每种类型的总线事件，每一列总结了一致性控制器必须执行的动作。

引起cache行发生状态转换的事件包括本地访存（读或写）、远程访存（总线读、总线写或者总线状态生机）以及本地的cache行转换。

Cache目录或者标识阵列维护每一个cache 行的MESI状态。

注意，此时允许每个cache行在不同时刻可以具有不同的状态，并使包括私有数据的cache行保持为E状态或者M状态，而包含共享数据的行处于S状态并且可以同时存在于多个cache中。

MESI一致性协议支持single-writer并保证了一致性，同时还支持只读数据的共享，以及在发生本地写实，从专有状态（E）提升到修改状态（M）（不需要总显得状态升级消息）。

实现cache一致性维护cache一致性需要有一套记录cache行状态（即MESI）的机制，从而能够正确处理对这些行的访问。

保存一致性状态最方便的场所是在cache的标识存储器中，因为必须在cache 中对状态信息进行维护。

然而，cache行的本地一致性状态要对系统中其他处理机可见，以满足它们对这些行的访问。

因此，实现cache一致性时必须提供一种分布访问方式。

主要有两种实现方法：监听实现和目录实现。

监听实现实现一致性的最简单的方法是利用监听机制：在监听实现中，所有由一致性协议引起的片外地址事件（即作废协议中的cache失效和作废）将共享总线，这对系统中所有其他处理机都是可见的。

在规模较小的系统中，地址总线是电路共享的，当这些命令放到总线上时，每个处理机都能察看到所有其他处理机的命令。

更先进的点到点互联机制也能实现监听，它通过层次化的监听互联机制，将所有命令反映给所有的处理机。

为简单起见，我们将只讨论地址总线的机制。

在监听实现中，一致性协议规定了一个处理机是否响应总线命令以及如何响应总线命令。

例如，一个远程处理机对当前被修改过的cache行发出读请求，这将导致cache控制器将这一行从本地cache中直接传送给发出请求的处理机，也许还需要写回存储器，以这种方式请求将能够得到最新的副本。

同样，一个远程处理机对当前处于共享状态的行发出作废请求，将导致控制器更新目录表项并将这一行标记为作废。

这将防止本地处理机以后从cache中读取是小的数据。

监听实现的主要缺点在于可扩展性较差。

假设系统中每个处理机以一定的速率产生地址总线事务，可以看到，必须监听的输入地址总线事务直接和系统的处理机数目成正比。

也就是说，如果每个处理机每秒产生s0个总线事务(包括cache失效导致的读请求和对共享行写操作导致的作废请求)，系统中有n个处理机，那么每个处理机每秒必须监听ns0个事务，每次监听都要查找本地的cache目录并判断处理机是否需要作出反应（参见图9.6），对于较大的n，查找总带宽是不可接受的，同样，对于将系统中的处理机连接在一起的互联网络，其带宽可能很快就被事务流量占用完。