一般用什么hash方案呢?
md5嘛
还 hash
,你哪里看的文章乱写的啊 -_-
hash 之后,你自己都无法知道原来的 id
是什么啦。
如果要非可预测性的主键,成熟方案是使用 uuid 。
当然,你不怕麻烦,专门拿一列存一个 showId
,它是“非可预测值”(这个值可以是 id
的 hash ,加 salt
)。
如果ID是连续的,恶意用户的扒取工作就非常容易做了,直接按照顺序下载指定URL即可;如果是订单号就更危险了,竞对可以直接知道我们一天的单量。所以在一些应用场景下,会需要ID无规则、不规则。
对外开放的都可以爬的,靠1-10000这样爬的应该只是新新手了吧,根据你的页面的结构和页内连接一样能爬。
真的不想那么容易的被爬,你可以做一个id,在hash一套验证码,请求id的时候顺便把hash验证一下。
7 回答5.6k 阅读
6 回答7.1k 阅读✓ 已解决
2 回答2.5k 阅读✓ 已解决
4 回答2.6k 阅读
2 回答1.1k 阅读✓ 已解决
2 回答1.1k 阅读✓ 已解决
1 回答2.3k 阅读
只要公开的都有办法爬,包括含登陆验证的