用免费板的百度api翻译爬取的网页内容,但是受限于免费板的并发量,所以爬取的内容按顺序拼接字符串再提交翻译,翻译后的内容再拆分成数组。
但是遇到这么几个情况
1.有的部分内容没有翻译
2.拆分后的可能顺序错误问题
3.拆分后的可能对应数据量问题
这些原因都是拼接用的分隔符的问题导致的,换分隔符后有不同的结果
有没有人类似的用法,你们用的是什么分隔符?或者有什么方法?
用免费板的百度api翻译爬取的网页内容,但是受限于免费板的并发量,所以爬取的内容按顺序拼接字符串再提交翻译,翻译后的内容再拆分成数组。
但是遇到这么几个情况
1.有的部分内容没有翻译
2.拆分后的可能顺序错误问题
3.拆分后的可能对应数据量问题
这些原因都是拼接用的分隔符的问题导致的,换分隔符后有不同的结果
有没有人类似的用法,你们用的是什么分隔符?或者有什么方法?
2 回答5.1k 阅读✓ 已解决
2 回答1.1k 阅读✓ 已解决
4 回答973 阅读✓ 已解决
3 回答1.1k 阅读✓ 已解决
3 回答1.2k 阅读✓ 已解决
1 回答1.7k 阅读✓ 已解决
1 回答1.2k 阅读✓ 已解决
可以用长数字作为分隔符