咳咳。这部分应该是序列化编译器DIY的,然而,在这样做DIY第一次使用前flex 为了练练手,对于后者的理解是有帮助。
在word 我经常看到一个字计数功能,因此,它是如何实现,当然,首先想到的是要经过整个文本换行和空格分析字符串,。但是能不能简单点了,事实上对文本做单词分析,大家都知道怎么做,难得地方可能就是代码的实现了。那么如今假设使用正則表達式来实现的话,那么一切问题就Over 了。
环境:ubuntu(当然装了flex的windows和mac也能够)
原码:
%{unsigned long chars=0;unsigned long words=0;unsigned long lines=0;%}%%[a-zA-Z]+ {words++;chars+=strlen(yytext);}[a-z\-A-z]+ {words++;chars+=strlen(yytext);}[0-9]+ {words++;chars+=strlen(yytext);}[.|,|\b| |\t|\r] {chars++;}[\n] {lines++;chars++;}%%int main(){ char filename[100]; printf("统计一个英文文件里字符、单词、行数。\n"); printf("请输入要计算的文件名称:"); scanf("%s",filename); yyin=fopen(filename,"r"); printf("開始进行统计...\n"); printf("没有定义的字符:"); yylex(); printf("\n字符数:%ld\n", chars); printf("单词数:%ld\n", words); printf("行数 :%ld\n", lines); return 1;}int yywrap(){ return 1;}那么解释第一个正则式[a-zA-Z]+ 表示一个或者多个由大写和小写字母组成的单词
[a-z\-A-z]+ 对于特殊的中间加"-"的单词
[0-9]+ 数字集合
[.|,|\b| |\t|\r] 特殊符号集合
在编写完上述代码之后,那么直接用flex 进行编译。将得到一个.c文件,接着对C文件编译生成二进制代码执行就可以。
測试文本:
my name is te-name
%%%測试结果:
统计一个英文文件里字符、单词、行数。
请输入要计算的文件名称:test.txt 開始进行统计... 没有定义的字符:%%% 字符数:20 单词数:4 行数 :2版权声明:本文博客原创文章。博客,未经同意,不得转载。