<text></text>对文本内容显示不一致怎么做到的

阅读 4.1k
4 个回答

自定义的字体,规定字符实际显示出来的效果,类似font-icon之类的也是这么做的,但是这个可能是为了防盗之类的吧(猜测)。
clipboard.png

@贾顺名 所言,该文字采用了特殊的字体做渲染。字体在 font.css 文件中定义,它很可能会不定期更改。

通过查看网页源码,可以发现有多处地方都使用了混淆(xpath '//*[contains(@class, "tyc-num")]'),内容包括汉字、英文字母、数字、标点符号等。

由于渲染的字体非常工整,可采用 OCR 引擎(tesseract)自动生成各种字符的映射表,实现全自动抓取、转换信息流程。


附:识别汉字请使用 tesseract 4.0 及以上版本,数据文件选择 chi_sim(best),下载地址 https://github.com/tesseract-...

亲测可用。


请参考
《自定义字体混淆信息的自动化破解》, https://segmentfault.com/a/11...

楼上的说的有道理。

为了防止别人使用它的数据,又要保证显示效果做的特殊处理
数字都查表替换,显示内容保持一致。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题
宣传栏