如题,我现在通过爬取网页得到了一批网页的内容,已经存入数据库中,现在的需求是在另一个表中有300多个关键字,如果爬取的这些网页中包含这些关键字(一个或多个),就给这些网页添加标记,否则不处理,网页大约最少几万个,如果通过循环一个个遍历,感觉不合适,请高手们指教一种简捷的方法,初学python,还望多多指教,谢谢!
如题,我现在通过爬取网页得到了一批网页的内容,已经存入数据库中,现在的需求是在另一个表中有300多个关键字,如果爬取的这些网页中包含这些关键字(一个或多个),就给这些网页添加标记,否则不处理,网页大约最少几万个,如果通过循环一个个遍历,感觉不合适,请高手们指教一种简捷的方法,初学python,还望多多指教,谢谢!
2 回答5k 阅读✓ 已解决
2 回答1.1k 阅读✓ 已解决
4 回答944 阅读✓ 已解决
3 回答1.1k 阅读✓ 已解决
3 回答1.1k 阅读✓ 已解决
1 回答1.7k 阅读✓ 已解决
1 回答1.2k 阅读✓ 已解决
用ac自动机做吧,复杂度很低