编译原理报告：NFA转DFA(详解,附源代码)

编译原理实习报告

学号：******

班级：******

姓名：******

日期：2015

1.题目及需求分析 (3)

2.设计分析 (3)

3.调试分析 (7)

4.用户手册 (7)

5.测试结果 (7)

6.总结 (7)

7.源代码 (8)

题目：NFA 转换为等价的DFA 实习时间：2015.10.12

【问题描述】以定理“设L 为一个由不确定的有穷自动机接受的集合，则存在一个接受L 的确定的有穷自

动机”为理论基础，设计算法实现将不确定的有穷自动机(NFA)转换为与之等价的确定的有穷自动机(DFA)。

【基本要求】

① 确定能够表示FA 的合适的结构，以便FA 的输入和输出

② 设计的算法既要成功实现题目要求的功能，又要高效、鲁棒

③ 程序中的函数、变量等命名要规则，可读性要强(易懂) 1．需求分析

(1) 要将以状态转换图表示的NFA 转换为DFA ，首先应设计一个结构来表示FA ，以便图形式的FA 便于输入和输出。

(2) 设计合适的算法来实现NFA 的确定化，这里用子集法来构造等价的DFA 。 (3) 测试数据:课本P59例

4.8

转换前的NFA 转换后的DFA

2．设计

（1）数据结构设计

由于FA 是一个图，可想到用图的存储结构来存储FA ，但是，FA 中两个结点之间的路径可以不只一条，这让想考虑用邻接矩阵来存储的FA 处理起来有点复杂，我采用的是“结点-边-结点”式的三元组来表示FA 。FA 有多少条边就应该有多少个这样的三元组，以一个数组来存放这些三元组，那么一个FA 就可以表示出来了。

此外，由子集法的步骤可见，集合(set)这一结构应该使用，，set 结构符合我们数学的集合要求，不含相同元素，并且两个集合间还可以进行比较是否相等，十分有利于我们的程序实现。

表示FA 的结构：

集合与栈使用库里面的标准集合、栈。即包含头文件set 、stack

//Triad(三元组)：S → aB 即（S,a,B ） struct Triad{ char start; char edge; char end; };

（2）文件结构

程序不是很复杂，加之使用到的数据结构是标准库里的，文件只有一个N2D.cpp，其中有#include和#include。

（3）程序基本框架概览

struct Triad{ }; // FA的基本组成结构

int main(){

初始化工作；

determined(); //确定化

}

e_closure(){ } //求ε闭包

move(){ } //求集合的x 弧转换

determined(){ } //确定化

（4）主要函数的实现

伪代码具有简明扼要的特点，利用伪代码子来表示程序流程有利于理解和后续实现。

子集法伪代码：

s0 ←NFA的开始状态

集合T ←e-closure(s0)

把T加入到子集簇C(未标记)

while ( 集合U ←在C中找到一个未标记的集合){

标记U;

for(对于每一种输入即a、b... ...){

U ←e-closure(move(T, a))

if(U不是C的子集)

把U加入到子集簇C(未标记)

有T →aU

}

此外，求ε的传递闭包要利用栈这一数据结构做辅助，其伪代码如下：

//求e-closure(T)的伪代码

将T中的所有状态全都压入栈S、集合U

while(S非空){

t ←取栈顶元素;

for(每个从t状态能通过空串转换得到的状态s)

if(s不在U中){

把状态s加入U;

把状态s压入S;

}

return U; //集合U即为所求的ε闭包

再在伪代码的基础上来编写这些核心函数就方便多了，具体代码如下：set e_closure(set T, Triad G[], int N) //求ε的传递闭包{

set U = T; //U用来存放T中元素的ε闭包

stack S; //辅助栈

set::iterator it; //用于集合遍历的迭代器

for (it = U.begin(); it != U.end(); it++) //将U中的元素全部压栈S.push(*it);

char t;

while (!S.empty()) //栈非空

{

t = S.top(); //栈顶元素

S.pop();

for (int i=0;i

{

if (G[i].start== t && G[i].edge=='*') //找到元素的ε闭包

{

U.insert(G[i].end); //将其放入集合U

S.push(G[i].end); //将其压栈

}

return U;

}

void determined(Triad G[], int N, char* input, int n){ //确定化函数的实现cout<

bool marked[MAX_NODES]; //用于标示集合

for(int i=0; i

marked[i]=false;

set C[MAX_NODES]; //存放确定化过程中产生的集合

char s0=G[0].start;

set T0,T1;

T0.insert(s0);

T1=e_closure(T0, G, N); //始态的ε闭包

C[0]=T1;

i=0;

while(!C[i].empty() && marked[i]==false && i

for(int j=0; j

if(input[j] != '*'){

set U=e_closure(move(C[i], input[j], G, N), G, N);

if(!U.empty()) {

bool inC=false;

int k=0;

while(!C[k].empty() && k

if(U==C[k]){

inC=true;

break;

}

k++;

}

if(!inC){

k=0;

while(!C[k].empty() && k

k++;

}

C[k]=U;

}

cout<

}

i++;

}

//下面求出确定化后的终态

cout<<"终态为:";

i=0;

while(!C[i].empty()){

bool is_final_state=false;

set::iterator it;

for (it = C[i].begin(); it != C[i].end(); it++){

if(*it == '#'){

is_final_state=true;

break;

}

if(is_final_state) cout<

i++;

}

cout<

}

3．调试分析

优点分析：NFA的输入只要求输入边的条数即可开始输入组成FA的基本结构(即三元组)，而有多少引起状态转换的输入都交给程序自己去完成，这一点就显得很简洁，对于用户来说也便捷！

缺点分析：没有可视化，整个程序的输入输出是通过控制台完成的。

解决办法：可合适的使用MFC可视化编程完成(这个有余力可以考虑一下)。

4．用户手册

该程序的使用十分简单，直接按要求输入相应数据就是。

5．测试数据及测试结果

课本P59例4.8：

6．总结

优点通过这次的实习，对编译原理NFA、DFA及之间的等价转换有了更加深刻的理解，也学会了利用伪代码来设计程序，由框架到细节的实现，这种设计相当便利高效。团队成员之间交流思想取长补短也让我学到了好多思想和方法。

7.源代码

#include

using namespace std;

//Triad(三元组)：S →aB即（S,a,B）

struct Triad{

char start;

char edge;

char end;

};

set e_closure(set, Triad[], int) ;

set move(set, char, Triad[], int);

void determined(Triad [], int, char*, int);

const int MAX_NODES=20;

int main()

{

int N;

cout<<"请输入边数:"<

cin>>N;

Triad* G=new Triad[N];

cout<<"请输入正规文法(*代表ε,#代表终态,约定输入时先输入以始态开始的三元组):"<

for(int i=0; i

cin>>G[i].start>>G[i].edge>>G[i].end;

}

set Edge;

for(int j=0; j

Edge.insert(G[j].edge);

}

int n=Edge.size();

char* input=new char[n];

set::iterator it;

j=0;

for (it = Edge.begin(); it != Edge.end(); it++){

input[j]=*it;

j++;

}

determined(G, N, input, n);

return 0;

}

set e_closure(set T, Triad G[], int N) {

set U = T;

stack S;

set::iterator it;

for (it = U.begin(); it != U.end(); it++)

S.push(*it);

char t;

while (!S.empty())

{

t = S.top();

S.pop();

for (int i=0;i

{

if (G[i].start== t && G[i].edge=='*')

{

U.insert(G[i].end);

S.push(G[i].end);

}

return U;

}

set move(set I, char a, Triad G[], int N){ set U;

set::iterator it;

for (it = I.begin(); it != I.end(); it++)

for(int i=0; i

if (G[i].start== *it && G[i].edge==a)

U.insert(G[i].end);

}

return U;

}

void determined(Triad G[], int N, char* input, int n){

cout<

bool marked[MAX_NODES];

for(int i=0; i

marked[i]=false;

set C[MAX_NODES];

char s0=G[0].start;

set T0,T1;

T0.insert(s0);

T1=e_closure(T0, G, N);

C[0]=T1;

i=0;

while(!C[i].empty() && marked[i]==false && i

//下面被注释代码可用于输出图中求出来的集合

set::iterator it;

cout<

for (it = C[i].begin(); it != C[i].end(); it++)

cout<<*it<<",";

cout<

for(int j=0; j

if(input[j] != '*'){

set U=e_closure(move(C[i], input[j], G, N), G, N);

if(!U.empty()) {

bool inC=false;

int k=0;

while(!C[k].empty() && k

if(U==C[k]){

inC=true;

break;

}

k++;

}

if(!inC){

k=0;

while(!C[k].empty() && k

k++;

}

C[k]=U;

}

cout<

}

i++;

}

//下面求出确定化后的终态

cout<<"终态为:";

i=0;

while(!C[i].empty()){

bool is_final_state=false;

set::iterator it;

for (it = C[i].begin(); it != C[i].end(); it++){

if(*it == '#'){

is_final_state=true;

break;

}

if(is_final_state) cout<

i++;

}

cout<

}