前言
嵌入式系统中有很多场所需要解析字符串,如解析GPS的RMC帧,解析用户通过串口输入的监控命令等。一般的做法是先接受一帧字符数据,然后用sscanf函数提取相应字段。
函数原型
int sscanf( const char *buffer, const char *format [, argument ] ... );
sscanf
属于scanf
函数家族一员,从输入源——字符串中读取字符并根据format
给出的格式代码对它们进行转换,省略号代表可变长度的指针列表。
format
字符串参数中的格式代码可以由4部分组成:% [*] [width] [h|l|L]
格式码
如sscanf("...", "%4hd", &short_val)
中%4hd
表示从字符串中提取宽度限制为4个数字的短整型。
小试身手
如接受到用户输入的一个CLI命令,读取0x0012
地址的值:
rcv_buf = "$READ:0x0012" // 从rcv_buf里面提取用户需要读取的值
fetch_num = sscanf(rcv_buf, "$READ:%x", &read_address);
如果执行成功,该函数返回值fetch_num
等于1
,read_address==0x12
,提取失败的话fetch_num==0
*sscanf
函数可以提取字符串%s
,单个字符%c
,整型%d
,%x
,可以指定提取的整型的宽度,指定提取的浮点数的小数位数等等。
使用陷阱
使用该函数尤其要注意的是:第3部分的指针参数的类型如上述的read_address的类型一定要和第2部分format格式代码中的参数的%x相匹配,在提取多个值时,一不小心,后面提取的值会把前面的全部覆盖掉。举个例子:
typedef struct
{
char month;
char day;
short year;
}DATE_T;
DATE_T current_date = {0};
fetch_num = sscanf("$TIME:20120228","$TIME:%4u%2u%2u",
¤t_date.year,
¤t_date.month, ¤t_date.day)
按照程序员的思路,提取出来的结果应该是:year = 2012, month=2, day = 28
,
但是实际结果却是year=0, month = 2, day=28
原因就在于:%u
提取的month
是32位无符号整型,函数会把目的地址当作一个32位整形的地址,因此就杯具了,DATE_T
结构体占用4
字节,里面¤t_date.month
实际是指向第1个字节的地址,如果被当作指向unsigned int
的地址,把月份month=0x0000 0002
的值拷贝过去,前面提取的占用高2
字节的year
就会被覆盖掉,然后本来提取的year
的值变成了0x0000
如何避免!
sscanf
里的地址所在的参数类型保持和第2部分的format
格式化部分一致
typedef struct
{
unsigned int month;
unsigned int day;
unsigned int year;
}DATE_T;
总结
sscanf
函数避免了手工操作字符串之类重复发明轮子的行为,尤其注意该函数不会验证指针参数的类型是否对应format
格式代码中的正确类型。
补充
- format格式不同编译器处理不同:ARM可以有空格
%u %d
,DSP C2000编译器必须是%u%d
- 有些老51单片机的编译器
format
里不支持超过4个数值的fetch
!- 对于
=%x
的format,"=0x30"与"=30"效果一样,自动剔除数字签名的0x
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。