机器语言,汇编语言和编译器

合集下载

举例说明语言的层级关系

举例说明语言的层级关系语言的层级关系是指不同语言之间的包含关系，即上位语言包含下位语言。

在计算机科学中，语言的层级关系通常通过语言的表达能力和语法规则的复杂程度来划分。

1. 机器语言和汇编语言：机器语言是计算机能够直接执行的二进制指令，而汇编语言是机器语言的助记符表示，与具体的计算机硬件相关。

2. 高级语言和低级语言：高级语言是相对于机器语言和汇编语言而言的，它更加接近人类自然语言，能够通过编译器或解释器转化为机器语言执行。

低级语言则是直接操作计算机硬件的语言，如汇编语言。

3. 编程语言和标记语言：编程语言是用于编写计算机程序的形式化语言，如C、Python等。

标记语言则是用于描述文档结构和样式的语言，如HTML、XML等。

4. 声音语言和视觉语言：声音语言是通过声音进行交流的语言，如英语、汉语等。

视觉语言则是通过视觉符号进行交流的语言，如手语、图形符号等。

5. 自然语言和人工语言：自然语言是人类日常交流和思维的语言，如英语、汉语等。

人工语言则是专门为特定领域或目的而设计的语言，如数学符号、计算机语言等。

6. 语义语言和句法语言：语义语言是通过词汇和语法来表达意义的语言，如自然语言。

句法语言则是通过语法规则和结构来表达意义的语言，如数学符号、编程语言等。

7. 逻辑语言和描述语言：逻辑语言是用于表达逻辑思维和推理的语言，如谓词逻辑、一阶逻辑等。

描述语言则是用于描述事物特性和关系的语言，如OWL、RDF等。

8. 形式语言和自然语言：形式语言是由精确的语法规则定义的语言，如数学符号、编程语言等。

自然语言则是自然演化而来的语言，不受人为规则限制。

9. 交互语言和传播语言：交互语言是用于交流和互动的语言，如对话、聊天等。

传播语言则是用于传递信息和思想的语言，如新闻报道、广告宣传等。

10. 专业语言和通用语言：专业语言是特定领域或行业所使用的语言，如医学术语、法律术语等。

通用语言则是适用于各个领域和场景的语言，如普通话、英语等。

机器语言、汇编语言、高级语言的特点

机器语言、汇编语言、高级语言的特点随着计算机技术的发展，不同层次的编程语言应运而生。

在一定程度上，它们代表了人们对于编程语言的不同需求和对计算机在不同领域的应用的不同期望。

从最底层的机器语言，到中层的汇编语言，再到高层的高级语言，每一种编程语言在特点和使用场景上都有着不同的优势和限制。

本文将分别介绍机器语言、汇编语言和高级语言的特点。

一、机器语言机器语言也被称为二进制代码或指令集，它是计算机指令的最低层次的表示形式。

机器语言使用二进制数码来表示指令的操作码和操作数，它们在计算机中被识别为电子开关（0或1）。

机器语言是计算机硬件可以直接识别并执行的语言，它是计算机的内部语言，以二进制编码的形式编写，需要极高的技术水平，通常只有硬件设计师和系统程序员才能编写。

机器语言的特点是最接近计算机底层，执行效率极高，能够直接访问计算机的硬件资源，也精细控制硬件的操作。

它能够保证计算机的稳定性和可靠性，也可以根据硬件调整程序的性能。

但是，由于机器语言难以理解和编写，程序员需要掌握一些高度抽象的知识，所以编写程序的效率非常低，因此难以开发复杂的应用程序。

此外，不同的计算机硬件使用的机器语言有所不同，在程序移植和开发的过程中也会遇到一些困难。

二、汇编语言汇编语言是机器语言的文本表示形式。

与机器语言相比，汇编语言对程序员更加友好，使用人类可以理解的符号来代替机器代码的混乱二进制串。

程序员可以使用一些助记符和符号来表示指令和操作数，如MOV（数据传送指令）、ADD（加法指令）等等。

每个助记符都被赋予了一个不同的二进制码，通过汇编器将汇编代码转换为机器码后，计算机硬件就可以识别并执行。

汇编语言的特点是比机器语言容易理解和编写，可以优化硬件的操作，有更多的汇编指令可以使用。

同时，汇编语言可以使用宏定义，支持二次开发，便于用户自定义开发程序。

然而，与机器语言相比，汇编语言的可移植性也相对较差，需要针对不同的硬件平台进行调试。

什么是编译器

什么是编译器？编译器是一种将高级语言代码转换成机器语言的软件工具。

它是计算机科学中的一个重要概念，用于将人类可读的代码转换为计算机可执行的指令。

编译器的主要功能是将源代码（如C、C++、Java等高级语言）转换为目标代码（如汇编语言或机器语言）。

这个转换过程被称为编译。

编译器分为多个阶段，每个阶段都完成了特定的任务，最终生成可执行的目标文件。

编译器的工作流程通常包括以下几个步骤：1. 词法分析（Lexical Analysis）：将源代码分解为一个个词法单元（Token），如关键字、标识符、运算符等。

词法分析器扫描源代码，识别和分类各个词法单元。

2. 语法分析（Syntax Analysis）：将词法分析得到的词法单元组织成语法树（Parse Tree）或抽象语法树（Abstract Syntax Tree）。

语法分析器根据语法规则检查源代码的语法正确性，并生成中间表示。

3. 语义分析（Semantic Analysis）：对中间表示进行语义检查，确保源代码的语义正确性。

语义分析器会检查变量的声明和使用、类型匹配、函数调用等语义相关的问题。

4. 中间代码生成（Intermediate Code Generation）：将语法分析和语义分析得到的中间表示转化为一种中间代码，如三地址码或虚拟机代码。

中间代码是一种抽象的表示形式，比源代码更接近于机器语言。

5. 代码优化（Code Optimization）：对中间代码进行优化，以提高程序的性能和效率。

代码优化器尝试通过改变代码结构、减少计算和存储等方式来减少程序的执行时间和空间消耗。

6. 目标代码生成（Code Generation）：将优化后的中间代码转换为机器语言或特定硬件平台的汇编语言。

目标代码生成器会根据目标机器的架构和指令集生成相应的机器代码。

7. 符号表管理（Symbol Table Management）：编译器会维护一个符号表，用于存储变量、函数和其他标识符的信息。

说明高级语言、汇编语言和机器语言的差别和联系

说明高级语言、汇编语言和机器语言的差别和联系
高级语言、汇编语言和机器语言是计算机程序设计的不同层次。

它们的差别和联系如下：
差别：
1. 抽象程度的不同：高级语言对计算机硬件的抽象程度最高，其代码更接近自然语言；汇编语言对计算机硬件的抽象程度较高，其代码更接近机器语言；机器语言直接与计算机硬件交互，代码为二进制位和十六进制数字。

2. 代码可读性的不同：高级语言的代码更易于阅读和理解，汇编语言和机器语言的代码更难阅读和理解。

3. 编写难度的不同：高级语言的编写难度较低，汇编语言和机器语言编写的难度较高。

联系：
1. 存在相互转换的可能：高级语言可以通过编译器转换为汇编语言，汇编语言可以通过汇编器转换为机器语言。

2. 三者都可以用来编写计算机程序。

3. 三者都需要通过计算机中央处理器（CPU）的指令来执行程序。

计算机语言分为哪三类

计算机语言分为哪三类计算机语言是一种用于人机交流的工具，它是人类与计算机之间互相理解和沟通的桥梁。

计算机语言可以分为三类：机器语言、汇编语言和高级语言。

一、机器语言（Machine Language）机器语言是计算机可以直接执行的二进制代码。

它由0和1组成的位模式，代表不同的计算机指令和数据。

机器语言的执行速度非常快，因为它与计算机的硬件结构直接交互。

但是，机器语言非常难以理解和编写，因为它对人类来说是不直观且晦涩的。

机器语言是计算机内部运行的编码方式，它通过编码和解码方式将人类可理解的指令翻译成二进制形式。

计算机的中央处理器（CPU）可以理解和执行机器语言。

机器语言非常底层，它与计算机的硬件细节紧密相关。

每种计算机架构都有自己的机器语言。

二、汇编语言（Assembly Language）汇编语言是对机器语言的符号化表示。

它使用助记符（mnemonic）代替了二进制的位模式，使得程序的编写和阅读更容易理解。

每个助记符都对应着一条机器语言指令，与机器语言一一对应。

汇编语言的编写和阅读相对机器语言来说更加容易，因为它使用了更加可读的符号表示法。

汇编语言的编译器将汇编语言程序翻译成对应的机器语言程序，然后由计算机执行。

通过使用汇编语言，程序员可以直接控制和操作计算机的硬件资源，如寄存器、内存等。

汇编语言相对机器语言来说更加高级，但仍然比较底层。

汇编语言程序的编写需要对特定计算机架构的硬件细节有一定的了解。

三、高级语言（High-level Language）高级语言是一种比较接近人类自然语言的计算机程序设计语言，它是在机器语言和汇编语言之上的更高级的抽象。

高级语言使用英语、中文等常用语言的单词和语法结构，使得程序的编写更加简单和易懂。

高级语言将复杂的底层计算任务封装成相对简单的语句和函数，使得程序员可以更加专注于算法和逻辑的实现，而不需要过多关注底层细节。

高级语言具有跨平台特性，可以在不同的计算机和操作系统上运行。

简述编译程序的主要构成成分及各自的主要功能

简述编译程序的主要构成成分及各自的主要功能编译程序是将高级语言代码转换为机器语言代码的程序。

它主要由以下几个构成成分组成：预处理器、编译器、汇编器、链接器和加载器。

每个构成成分都有其独特的功能，下面将详细介绍。

一、预处理器预处理器是编译程序的第一个阶段，主要负责对源代码进行预处理。

它会根据源代码中的指令，进行宏替换、条件编译、头文件包含等操作，生成新的源代码文件。

这些操作可以使得源代码更加规范化和易于维护。

二、编译器编译器是编译程序的核心部分，主要负责将高级语言代码转换为汇编语言代码。

它会对源代码进行语法分析和语义分析，并生成对应的中间代码。

然后将中间代码转换为汇编语言代码，并生成目标文件。

三、汇编器汇编器是将汇编语言代码转换为机器语言代码的工具。

它会读取目标文件中的汇编码，并将其转换为机器码。

同时还会生成符号表和重定位表等辅助信息，以便后续链接操作使用。

四、链接器链接器主要负责将多个目标文件合并成一个可执行文件。

在这个过程中，它会将各个目标文件中的符号进行链接，并解决符号重定义问题。

同时还会进行地址重定位和库函数的链接等操作。

五、加载器加载器是将可执行文件加载到内存中并执行的程序。

它会将可执行文件从磁盘读取到内存中，并根据可执行文件中的指令进行相应的操作。

例如，初始化程序堆栈、分配内存空间等。

综上所述，编译程序是由预处理器、编译器、汇编器、链接器和加载器等构成成分组成的。

每个构成成分都有其独特的功能，在整个编译过程中起着不可或缺的作用。

通过这些构成成分的协同工作，我们可以将高级语言代码转换为机器语言代码，并最终实现程序的运行。

计算机语言名词解释(一)

计算机语言名词解释(一)计算机语言名词解释1. 编程语言编程语言是用来编写计算机程序的一种形式化语言。

它定义了一套规则和结构，程序员可以根据这些规则使用语言来编写代码。

常见的编程语言包括C、Java、Python等。

2. 机器语言机器语言是计算机可以直接执行的语言，它由二进制代码组成，以0和1表示指令和数据。

机器语言是编程语言中最低级别的一种，也是最接近计算机硬件的一种语言。

例子：3. 汇编语言汇编语言是用符号代表机器语言指令的低级语言。

它使用助记符和符号来表示指令，相比机器语言更接近人类的思维方式。

汇编语言还需要通过汇编器将其转换为机器语言才能被计算机执行。

例子：MOV AX, 5ADD AX, 34. 高级语言高级语言是相对于机器语言和汇编语言而言的，它更接近人类自然语言，使用更易于理解和编写的语法结构。

高级语言通常需要通过编译器或解释器将其转换成机器语言才能被计算机执行。

例子：x = 5y = x + 35. 编译编译是将高级语言代码转换为机器语言的过程。

编译器会对代码进行词法分析、语法分析、语义分析等处理，生成目标机器代码。

编译后的代码可以直接被计算机执行，执行效率较高。

6. 解释解释是将高级语言代码逐行转换成机器语言并执行的过程。

解释器会逐行解释并执行代码，无需生成目标机器代码。

解释型语言的执行速度较慢，但更加灵活，适用于快速开发和调试。

7. 数据类型数据类型是编程语言中用于定义数据的种类和操作的属性。

常见的数据类型包括整数、浮点数、字符串、布尔值等。

不同类型的数据在计算机中占据的内存空间和表示方式是不同的。

例子： - 整数类型：int x = 5 - 浮点数类型：float y = - 字符串类型：string name = “John” - 布尔类型：bool isTrue = true8. 变量变量是用来存储和表示数据的一种命名内存单元。

在程序中，可以通过给变量赋值和读取变量的值来操作数据。

汇编语言编译器

汇编语言编译器汇编大多是指汇编语言，汇编程序。

把汇编语言翻译成机器语言的过程称为汇编。

在汇编语言中，用助记符(Memoni)代替操作码，用地址符号(Symbol)或标号(Label)代替地址码。

这样用符号代替机器语言的二进制码，就把机器语言变成了汇编语言。

于是汇编语言亦称为符号语言。

用汇编语言编写的程序，机器不能直接识别，要由一种程序将汇编语言翻译成机器语言，这种起翻译作用的程序叫汇编程序，汇编程序是系统软件中语言处理的系统软件。

汇编语言是一种以处理器指令系统为基础的低级语言，采用助记符表达指令操作码，采用标识符表示指令操作数。

作为一门语言，对应于高级语言的编译器，需要一个“汇编器”来把汇编语言原文件汇编成机器可执行的代码。

常用的高级语言编译器有Microsoft公司的MASM系列和Borland公司的TASM系列编译器，还有一些小公司推出的或者免费的汇编软件包等。

MASM是Microsoft公司推出的汇编编译器。

它的版本从低到高经过了很多次的升级（微软的通病，升级补丁多如牛毛）。

每次升级除了例行的错误修正外都增加了一些新的功能，以至于到最后高版本和低版本的语法和功能相差很多，向下兼容性也不好。

低版本的MASM固然无法编译高版本的源程序，但高版本的MASM也可能无法正常编译低版本的源程序，如MASM 4.0写的源程序常常无法在MASM 6.x上编译成功。

在使用MASM系列编译器时，如果不先搞清楚特定的语法和编译选项可以在哪个版本上用，编译中就会错误连篇。

所以在这里有必要了解一下MASM各版本的演变过程。

下表列出了不同版本MASM编译器的区别。

版本简介MASM 4.00这是最先广泛使用的一个MASM版本，适用于DOS下的汇编编程。

它很精巧，但使用起来不是很智能化，需要用户自己一板一眼地写出所有的东西。

很多教科书上讲的8086汇编语法都是针对这个版本的，对程序员来说。

它只比用Debug方便一点点MASM 5.00MASM 5.00比4.00在速度上快了很多，并将段定义的伪指令简化为类似 .code与.data 之类的定义方式，同时增加了对80386处理器指令的支持，对4.00版本的兼容性很好MASM 5.10对程序员来说，这个版本最大的进步是增加了对@@标号的支持。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

(采自 beta.uasm)
6.004 – Fall 2002 10/22/0 L13 – Machine Language 14
汇编语言的例子
以RA=R3, C=1234, RC=R17 展开 ADDC 宏
以OP=0x30, RA=R3, CC=1234, RC=R17 展开 beta 的 opc 宏
参考: β 文件; 实验 #5B; C 语言讲议
6.004 – Fall 2002 10/22/0 L13 – Machine Language 1
β 机器语言: 32-bit 指令
运算: ADD, SUB, MUL, DIV 比较: CMPEQ, CMPLT, CMPLE 布尔: AND, OR, XOR 位移: SHL, SHR, SAR Ra 及 Rb 是操作区域, Rc 是目的地. R31 为 0, 不被写入指令改变
6.004 – Fall 2002
数据结构: 结构
内存:
可能翻译成:
x 组件的偏移量 y 组件的偏移量
地址: 地址: 变量为基底的地址 + 变量为基底的地址 + 常数的组件偏移量常数的组件偏移量
6.004 – Fall 2002
10/22/0
L13 – Machine Language 21
条件式
机器语言, 汇编语言, 与编译器
当我在我的程序代码中发现一堆麻烦时, 朋友和同事跟我说了一句名言, “用C来写吧”
很久很久以前,我仍记得我是如何瞧不起记忆术… 而且我知道我可以玩BSim游戏与处理一些宏好一阵子, 只要我有操作码的名字. 但是6.004课程的每一堂课都令我打颤. 新来坏消息, 我无法再读一个规格. 我无法记忆当我试着最佳化阶乘, 但在我的Beta死去的那天, 有些东西触动了我讨人厌的傲慢, 于是我唱…
How can we improve the programmability of the Beta?
6.004 – Fall 2002 10/22/0 L13 – Machine Language 2
编码二进制指令
32-bit (4-byte) ADD 指令:
OpCode
Rc
Ra
Rb
(unused)
6.004 – Fall 2002
10/22/0
L13 – Machine Language 4
编译
编译模型:
• 给定某个”不易写程序”的计算机, 称之 M1... • 找到某个”容易写程序”的语言 L2 • (也许是一个更复杂的计算机, M2); 以这个语言来写程序 • 建立一个翻译器(编译器) 可以将程序从M2语言翻译成M1语言. 可以在M1, M2, 或其它的计算机上执行. 解译 & 编译: 两种帮助加强可程序性的工具 ... • 两者都可以改变程序模型 • 两者都提供与平台(如, 处理器)无关的程序应用 • 两者都在现代计算机系统中被广泛使用!
会有如下的效果:
6.004 – Fall 2002
10/22/0
L13 – Machine Language 12
指令之汇编语言
组合 Beta 的 op 指令
组合 Beta 的 opc 指令
“.align 4” 确保指令会在字组(word)的边缘开始 “.align 4” 确保指令会在字组(word)的边缘开始 (例如 address ==00mod 4) (例如 address mod 4)
我们会重复看到旳主要的设计选项: 在编译时间或执行时间做?
6.004 – Fall 2002
10/22/0
L13 – Machine Language 6
软件: 抽象对策
第一步: 编译工具
组合器 (UASM): 机器语言的符号表示式编译器 (C): 算法的符号表示式
隐藏: 位级的表示式, 16进位地址, 二进制数值
C code: Beta assembly: Beta 汇编语言:
编译条件码区块时, 有一些小小的技巧. 举例来说, 以下的表示式:
C code:
Beta 汇编语言:
编译成:
并没有 >32 这样的指令!
6.004 – Fall 2002
10/22/0
L13 – Machine Language 22
6.004 – Fall 2002
10/22/0
L13 – Machine Language 5
解译与编译之比较
这两个强力的工具之间有一些特性上的差异...
解译
如何处理 “x+2” 何时发生哪里复杂/慢何时做决定
编译产生一个程序来计算x+2
执行前程序建构编译时间
计算 x+2
执行时程序执行执行时间
6.004 – Fall 2002
10/22/0
L13 – Machine Language 10
卷标(表示地址的符号)
卷标是表示内存地址的符号. 它们可以透过以下的特殊语法来设定: x: 是 “x = .” 的缩写
例子 -主存储器
6.004 – Fall 2002
10/22/0
L13 – Machine Language 11
(采自 beta.uasm)
6.004 – Fall 2002 10/22/0 L13 – Machine Language 16
抽象步骤 2: 高级语言
大部分的算法是以高阶的语言来表示. 例如以下的算法: 我们用了 (并将会继续在6.004课中使用) C语言. 它是一个”成熟”而且常见的系统. 较新常用的代替语言有: C++, Java, Python, 以及很多其它的. 为什么不用汇编语言而要用这个呢? • 可读性 • 简洁 • 清楚, 不会模棱两可 • 可携带 (算法经常存活地比硬件平台来得久) • 可靠 (数据型态检查, 等等)
对BETA来说, 表示 Reg[4] = Reg[2] + Reg[3] 但, 我们通常喜欢写成
ADD(R2, R3, R4) (汇编语言)
或, 再更好一点,
a = b+c; 软件达成方法: 解译, 编译
6.004 – Fall 2002 10/22/0 L13 – Machine Language 3
组合 Beta 的 branch 指令
For Example: ADDC(R15, -32768, R0) --> betaopc(0x31,15,-32768,0)
6.004 – Fall 2002 10/22/0 L13 – Machine Language 13
最后, Beta 指令
方便的宏. 因此我们不需要指定R31缓存器…
6.004 – Fall 2002
10/22/0
L13 – Machine Language 23
最佳化我们最爱的阶乘程序
聪明之处: 聪明之处: 没有… 没有… 直接了当地编译直接了当地编译
二的补码的16位常数, 表示从 –32768 到运算: ADDC, SUBC, MULC, DIVC 32767 的数字; 使用前将它延伸符号至32位. 比较: CMPEQC, CMPLTC, CMPLEC 布尔: ANDC, ORC, XORC 位移: SHLC, SHRC, SARC 分流: BNE/BT, BEQ/BF (const = 从 PCNEXT转移的字组(word)数) 跳跃: JMP (const not used) 内存存取: LD, ST (const = 从Reg[ra]偏移的字节(byte)数)
以X=0xC22304D2展开 LONG 宏以X=0xC22304D2 展开第一个 WORD 宏
计算表示式, 并以X=0xC223 展开第二个 WORD 宏计算表示式
6.004 – Fall 2002
10/22/0
L13 – Machine Language 15
找不到指令? 假造一个!
方便的宏可以用来延伸我们的组个语言:
6.004 – Fall 2002
10/22/0
L13 – Machine Language 9
符号表示之手势
我们也可以在原始文件中定义”符号”来使用:
“直线” 代表一段批注的开始…
一个变量地址另一个变数
它的后面直到行末都是被忽略的
缓存器的符号名称:
特殊变数 “.” (句点) 表示下一个将被填入的字节地址: | 组合成 100 | 符号 “five” 是 0x104 | 掠过 16 个字节
UASM 原始语言
一个 UASM 原始文件包含了, 符号表示的文字, 将被加载内存的连续字节的数值... 例如: 以下列的格式十进制(预设); 二进制 (按: 使用“0b”字头表示); 十六进制 (按: 使用“0x”字头表示); 数值也可以是运算表示式; 例如, 原始档
产生4字节的二进制输出, 每一个都表示数值23!
6.004 – Fall 2002
10/22/0
L13 – Machine Language 19
数据结构: 数组
C 原始码内存:
可能翻译成:
地址: 地址:
常数为基底的地址 + 常数为基底的地址 + 由索引计算得到的变量偏移量由索引计算得到的变量偏移量
10/22/0 L13 – Machine Language 20
循环
C 程序代码: Beta 汇编语言: 替代的 Beta 汇编语言:
把这个测试式移到循环的后面并且第一次在这里跳到那个测试式… 这样可以省一个分流指令
编译器要花上许多的时间把循环里面和周遭最佳化. - 把所有可能的计算移到循环外面 - 展开循环来减少分流指令产生的效能消耗 - 化简表式示对“循环变量”的依赖度