如何用C语言的正则表达式匹配到C语言中的函数实现部分的函数头部分。

C代码

int test1(int a, int b){

int a;

int b;

}

匹配到
C代码 收藏代码
int test1(int a, int b)

简单的来说,我们假定函数的原型是
返回值+若干空格+函数名+前括号+可选第一个参数+可选多个参数+后括号 组成的。其中返回值、函数名、参数类型、参数名都是标示符

这样匹配一般的代码应该没问题了。

参考:

[a-zA-Z_\-][a-zA-Z0-9_\-]*\s+[a-zA-Z_\-][a-zA-Z0-9_\-]*\s+\(([a-zA-Z_\-][a-zA-Z0-9_\-]*\s+[a-zA-Z_\-][a-zA-Z0-9_\-]*\s+(\,[a-zA-Z_\-][a-zA-Z0-9_\-]*\s+[a-zA-Z_\-][a-zA-Z0-9_\-]*\s+)*){0,1}\s+\)

但是这个肯定是不严谨的。C语言里因为有宏的存在,还有关键字,所以非常复杂,除非写一个完整的语法分析程序,否则不能搞定。
看下面的例子:

#include <stdio.h>
#define FBRK (
#define RBRK )
int TEST1 FBRK int a, int b RBRK
{
return a+b;
}
int main FBRK RBRK
{
   printf("%d", TEST1(1,2));

   return 0;
}

显然,这个程序是合法的,而且要解析它,必须理解括号的替换。

情况可能复杂,如果define写在了头文件里呢?那么还得根据头文件找到另一个文件,才能解析。