python是怎么实现过滤 #注释代码的?

今天看python核心编程看到一个问题,题意大概就是过滤一个file-like对象里“#”的注释部分,然后输出其他部分。简单情形下,另写一行的#注释比较好判断,用startwith('#')匹配应该能满足。问题在于那些写在正常业务代码之后的注释,该如何过滤之?举个例子:

if name.find(",") == -1:#Annotations
    pass

请问有没有人了解它是怎么过滤这种注释的?谢谢。

阅读 4.1k
2 个回答

讲下思路
如果不考虑字符串中的#,那么很方便,用re匹配

#[^\n]*?\n

即可
如果考虑到字符串中的#稍微复杂些,匹配:

#[^'"]*?\n

勉强能应付大多数情况

缺点是对于

'a' # 'b'

这样的语句匹配不了,因为Python的re不支持平衡组。

直接用正则匹配#到行尾不就得了。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题