要求:输入一串字符串,对其进行词法分析,并且按照(<种别>,<字符串/数字>)格式进行输出
种别编码:
符号 种别 符号 种别 符号 种别
begin 1 + 13 <= 22
if 2 - 14 > 23
then 3 * 15 >= 24
while 4 / 16 = 25
do 5 : 17 ; 26
end 6 := 18 ( 27
l(l|d)* 10 < 20 ) 28
数字① 11 <> 21 # 0
①数字的词法正规式如下:( +|-|ε ) dd*(.dd* | ε)( e ( +|-|ε ) dd*|ε)
ps:输入的字符串以“#”结尾
运行环境:VC++6.0
说明:
搜索网上的资源,大部分的“数字”部分都是dd*形式,但这次试验要求的是①形式,因而在数字部分做了很大努力。与dd*形式的不同有三个地方——ch是数字时,ch是+后接着是数字形式,ch是-后接着是数字形式。然而由于水平有限,时间较短,每个“加号”或“减号”后必须要在输入数字正负符号,否则会默认“+”“-”为正负符号而不是“加号”“减号”。希望能有简单方法解决这个
问题。
源代码:
#include
//定义I/O库所用的某些宏和变量
#include //定义字符串库函数
#include //定义数学运算符号库函数
char prog[80],token[8]; //prog:缓冲区;token:一个有意义的字符串
char ch; //ch:当前处理的字符
int syn,p,m,n,f,e;
//syn:类别;p,m,n:计数变量;f,标记数字正负;e,10的次方数
double sum; //sum,数字
char *rwtab[6]={"begin","if","then","while","do","end"};
//基本字表置初值
void main(void) //主函数
{
void scaner(void); //声明函数
p=0;
printf("\n请输入字符串:\n");
do{ //输入的字符放入缓冲区
ch=getchar();
prog[p++]=ch;
}while(ch!='#');
p=0;
do{ //分析词法并输出结果
scaner();
switch(syn)
{
case 11:printf("(%2d,%16g)\n",syn,sum);break;
case -1:printf("输入错误\n");break;
default:printf("(%2d,%16s)\n",syn,token);
}
}while(syn!=0);
}
void scaner(void)
{
for(n=0;n<8;n++) //token初始化
token[n]=NULL;
ch=prog[p++];
while(ch==' ') //如果取消空字符(目前空字符只包括空格)
ch=prog[p++];
if((ch>='a'&;&;ch<='z')||(ch>='A'&;&;ch<='Z'))
//如果ch是字母字符
{
m=0;
while((ch>='a'&;&;ch<='z')||(ch>='A'&;&;ch<='Z')||(ch>='0'&;&;ch<='9'))
//如果ch是字母字符或数字字符
{
token[m++]=ch;
ch=prog[p++]; //读下一个字符
}
token[m++]='\0';
p--;
syn=10;
for(n=0;n<6;n++)
if(strcmp(token,rwtab[n])==0)
{
syn=n+1; //给出syn值
break;
}
}
else if(ch>='0'&;&;ch<='9') //数字(1)
{
sum=0;
while(ch>='0'&;&;ch<='9')
{
sum=sum*10+ch-'0';
ch=prog[p++];
}
if(ch=='.') //有小数点
{
e=-1;
ch=prog[p++];
if(ch>='0'&;&;ch<='9')
{
while(ch>='0'&;&;ch<='9')
{
sum=sum+(ch-'0')*pow(10,e--);
ch=prog[p++];
}
}
}
if(ch=='e'||ch=='E') //有e
{
e=0,f=1;
ch=prog[p++];
if(ch=='+')
{
f=1;
ch=prog[p++];
}
else if(ch=='-')
{
f=-1;
ch=prog[p++];
}
if(ch>='0'&;&;ch<='9')
{
while(ch>='0'&;&;ch<='9')
{
e=e*10+ch-'0';
ch=prog[p++];
}
}
e=e*f;
sum=sum*pow(10,e);
}
p--;
syn=11;
}
else switch(ch)
{
case '<':
m=0;
token[m++]=ch;
ch=prog[p++];
if(ch=='>') //<>
{
syn=21;
token[m++]=ch;
}
else if(ch=='=') //<=
{
syn=22;
token[m++]=ch;
}
else //<
{
syn=20;
p--;
}
break;
case '>':
m=0;
token[m++]=ch;
ch=prog[p++];
if(ch=='=') //>=
{
syn=24;
token[m++]=ch;
}
else //>
{
syn=23;
p--;
}
break;
case ':':
m=0;
token[m++]=ch;
ch=prog