1

前言

嵌入式系统中有很多场所需要解析字符串,如解析GPS的RMC帧,解析用户通过串口输入的监控命令等。一般的做法是先接受一帧字符数据,然后用sscanf函数提取相应字段。

函数原型

int sscanf( const char *buffer, const char *format [, argument ] ... );

sscanf属于scanf函数家族一员,从输入源——字符串中读取字符并根据format给出的格式代码对它们进行转换,省略号代表可变长度的指针列表。

format字符串参数中的格式代码可以由4部分组成:% [*] [width] [h|l|L] 格式码

sscanf("...", "%4hd", &short_val)%4hd表示从字符串中提取宽度限制为4个数字的短整型。

小试身手

如接受到用户输入的一个CLI命令,读取0x0012地址的值:

rcv_buf = "$READ:0x0012"  // 从rcv_buf里面提取用户需要读取的值
fetch_num = sscanf(rcv_buf, "$READ:%x", &read_address);

如果执行成功,该函数返回值fetch_num等于1read_address==0x12,提取失败的话fetch_num==0
*sscanf函数可以提取字符串%s,单个字符%c,整型%d,%x,可以指定提取的整型的宽度,指定提取的浮点数的小数位数等等。

使用陷阱

  使用该函数尤其要注意的是:第3部分的指针参数的类型如上述的read_address的类型一定要和第2部分format格式代码中的参数的%x相匹配,在提取多个值时,一不小心,后面提取的值会把前面的全部覆盖掉。举个例子:

typedef struct
{
    char  month;
    char  day;        
    short year;
}DATE_T;

DATE_T current_date = {0};

fetch_num = sscanf("$TIME:20120228","$TIME:%4u%2u%2u",
                &current_date.year, 
                &current_date.month, &current_date.day)

按照程序员的思路,提取出来的结果应该是:
year = 2012, month=2, day = 28
但是实际结果却是
year=0, month = 2, day=28

原因就在于:%u提取的month是32位无符号整型,函数会把目的地址当作一个32位整形的地址,因此就杯具了,DATE_T结构体占用4字节,里面&current_date.month实际是指向第1个字节的地址,如果被当作指向unsigned int的地址,把月份month=0x0000 0002的值拷贝过去,前面提取的占用高2字节的year就会被覆盖掉,然后本来提取的year的值变成了0x0000

如何避免!

sscanf里的地址所在的参数类型保持和第2部分的format格式化部分一致

typedef struct
{
     unsigned int  month;
     unsigned int  day;        
     unsigned int  year;
}DATE_T;

总结

sscanf函数避免了手工操作字符串之类重复发明轮子的行为,尤其注意该函数不会验证指针参数的类型是否对应format格式代码中的正确类型。

补充

  1. format格式不同编译器处理不同:ARM可以有空格%u %d,DSP C2000编译器必须是%u%d
  2. 有些老51单片机的编译器format里不支持超过4个数值的fetch
  3. 对于=%x的format,"=0x30"与"=30"效果一样,自动剔除数字签名的0x

idenny
128 声望8 粉丝