編譯器compiler)是一種電腦程式,它會將某種程式語言寫成的原始碼(原始語言)轉換成另一種程式語言(目標語言)。

它主要的目的是將便于人编写、阅读、维护的高级计算机语言所寫作的原始碼程式,翻译为计算机能解读、运行的低阶机器语言的程序,也就是執行檔。编译器将原始程序(source program)作为输入,翻译产生使用目标语言(target language)的等价程序。源代码一般为高阶语言(High-level language),如PascalCC++C#Java等,而目标语言则是汇编语言或目标机器的目标代码(Object code),有时也称作机器代码(Machine code)。

一个现代编译器的主要工作流程如下:

源代码(source code)→ 预处理器(preprocessor)→ 编译器(compiler)→ 汇编程序(assembler)→ 目标代码(object code)→ 链接器(linker)→ 執行檔(executables),最後打包好的檔案就可以給電腦去判讀執行了。

历史

编辑

早期的计算机软件都是用汇编语言直接编写的,这种状况持续了数年。当人们发现为不同类型的中央处理器(CPU)编写可重用软件的开销要明显高于编写编译器时,人们发明了高级编程语言。由于早期的计算机的内存很少,当大家实现编译器时,遇到了许多技术难题。

大约在20世纪50年代末期,与机器无关的编程语言被首次提出。随后,人们开发了几种实验性质的编译器。第一个编译器是由美國女性電腦科學家葛麗絲·霍普(Grace Murray Hopper)于1952年为A-0 系統编写的。但是1957年由任職於IBM的美國電腦科學家约翰·巴科斯(John Warner Backus)领导的FORTRAN則是第一個被實作出具備完整功能的编译器。1960年,COBOL成为一种较早的能在多种架构下被编译的语言。

高级语言在许多领域流行起来。由于新的编程语言支持的功能越来越多,计算机的架构越来越复杂,这使得编译器也越来越复杂。

早期的编译器是用汇编语言编写的。首个能编译自己源程序的编译器是在1962年由麻省理工学院的Hart和Levin制作的。从20世纪70年代起,实现能编译自己源程序的编译器变得越来越可行,不过还是用PascalC语言来实现编译器更加流行。制作某种语言的第一个能编译器,要么需要用其它语言来编写,要么就像Hart和Levin制作Lisp编译器那样,用解释器来运行编译器。

教学用的编译器

编辑

编译器的构造与优化是计算机专业的大学课程,[1]课程名称一般为「编译原理」或「編譯器」。通常在课程中包含了如何实现一种教学用程序语言的编译器。一个著名的例子是20世纪70年代,瑞士計算機科學家尼克劳斯·维尔特Niklaus Emil Wirth)用于讲解编译器的构造时使用的PL/0英语PL/0编译器。尽管它很简单,PL/0编译器介绍了这个领域的几个有影响的概念:

  1. 逐步求精的程序开发(也是 1971年 Wirth 的论文的标题)[2]
  2. 使用递归下降解析器
  3. 使用EBNF指定语言的语法。
  4. 代码生成器产生便携P-code
  5. 在自举问题的正式描述中使用T-diagram。

分类

编辑

编译器的一种分类方式是按照生成代码所运行的系统平台划分,这个平台称为目标平台。

有一些编译器输出的代码,将运行于与编译器所在相同类型的计算机和操作系统之上,这种编译器叫做本地编译器。输出可以运行于不同的平台之上的编译器,叫做交叉编译器。由于嵌入式系统通常没有软件开发环境,因此,为这类系统开发软件时,通常需要使用交叉编译器。

编译器所输出于虚拟机上运行之代码,编译器和编译器输出的运行平台有可能相同,也有可能不同。因此,对于这类编译器,不去区分它是本地编译器还是交叉编译器。

參考文獻

编辑
  1. ^ Chakraborty, Pinaki; Saxena, P. C.; Katti, C. P.; Pahwa, Gauri; Taneja, Shweta. A new practicum in compiler construction. Computer Applications in Engineering Education. 2014, 22 (3) [2025-03-31]. ISSN 1099-0542. doi:10.1002/cae.20566 (英语). 
  2. ^ The ACM Digital Library. (原始内容存档于2007-07-17). 

延伸阅读

编辑

参见

编辑

外部連結

编辑

📚 Artikel Terkait di Wikipedia

Mojo

Machine Learning, eine Art Python++?  Why Mojo🔥 - A language for next-generation compiler technology. docs.modular.com. Modular. 2023 [2023-09-26]. (原始内容存档于2023-05-05)

指令选择

Retargetable Compiler Code Generation. Computing Surveys. 1982, 14 (4): 573–592. ISSN 0360-0300. S2CID 2361347. doi:10.1145/356893.356897.  Lunell, H. Code Generator

代码生成

Muchnick; Muchnick and Associates. Advanced Compiler Design Implementation. Morgan Kaufmann. 15 August 1997. ISBN 978-1-55860-320-2. code generation. 

LCC (編譯器)

(原始内容存档于2022-05-11) (英语).  Fraser, Christopher W.; Hanson, David R. The lcc 4.x Code-Generation Interface (PDF). Microsoft Research. July 2001 [2011-07-05]. Technical

PyPy

Python, restricted in a way that enables easy analysis and efficient code generation", Ancona et al., 2007. Bolz, Carl; Cuni, Antonio; Fijalkowski, Maciej;

窥孔优化

现代编译器经常使用模式匹配算法来实现窥孔优化。 目标码优化器(英语:Object code optimizer) Superoptimization(英语:Superoptimization) 源到源编译器 Muchnick, Steven Stanley. Advanced Compiler Design and Implementation

.NET

CLR、編譯器平台.NET Compiler Platform(英语:.NET Compiler Platform)、採用AOT編譯技術運行最佳化的套件Core RT(.NET Core Runtime),以及跨平台的MSIL編譯器LLILC(LLVM-based MSIL Compiler)等專案。

OCaml

本机代码编译器可以在很多平台上获得,包括Unix、Microsoft Windows和Apple macOS。可移植性是通过至此主要架构的本机代码生成(英语:code generation (compiler))实现的:IA-32、X86-64(AMD64)、Power(英语:Power ISA)、RISC-V、ARM和ARM64。