大数据怎么样判断数据唯一性效率高？

我想用python对全网的网站进行扫描记录，想用mysql建个表记录每个网站的信息，数据量大后怎么能快速的判断这个网站已经记录过呢？基本表结构有：id,url,name,datetime等相关字段，url想有唯一性，是拿到url查询一下判断没有数据再插入还是怎么办？如果做了唯一性索引直接插入时会报错，谢谢，或是有没有别的有效的解决办法？

阅读 6.7k

大数据怎么样判断数据唯一性效率高？

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

如何实现一个深拷贝函数？

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

java开发发问URL匹配问题？

Python 成员变量在多个子类实例间共享，如何避免？

为何无法连接阿里云轻量应用服务器上 docker 中的 mysql ？

大数据怎么样判断数据唯一性效率高？

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

如何实现一个深拷贝函数？

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

java开发发问URL匹配问题？

Python 成员变量在多个子类实例间共享，如何避免？

为何无法连接 阿里云轻量应用服务器上 docker 中的 mysql ？

为何无法连接阿里云轻量应用服务器上 docker 中的 mysql ？