主要看资源方的鉴权策略,然后再采取相应的措施破解。楼上说的“爬虫”方法只能针对“下载链接本身不鉴权,但获取下载链接需要鉴权”这种策略,就相当于有个没上锁的门,原则上任何人都能进,但是你找不到,所以你得乖乖交钱,然后人家把你头上蒙个袋子带你进门,爬虫只是可以找到这个门而已(爬虫也未必能找到,但是人可以花点时间去找到);在一般体量的算力不值钱的今天,网站通常会对所有链接都鉴权,这时候爬虫就没用了。有些资源方可能把鉴权的关键信息暴露在 APP 里或者网页里,这类关键信息通常被称为 XXX secret,通过逆向签名算法找到一个可用的 secret ,就可以自己生成鉴权信息,下载用户权限范围内的所有资源;所以更多的资源方会把 secret 放到服务器上,通过用户身份一次鉴权后,再返回资源的鉴权信息/一次性链接/限时访问链接,这种嘛……办个会员就行了。
素材解析站通常是通过爬虫技术实现的,它们会模拟用户在网页上的操作,自动访问要解析的网页,提取出其中的关键信息,如下载链接等,然后再将这些信息返回给用户。在解析VIP素材时,一些站点可能会使用一些技巧,如使用VIP账号登录获取下载链接,或者模拟VIP账号登录来获取下载链接。此外,一些站点也可能会使用一些反爬虫技术来防止被其他爬虫程序访问,例如验证码、限制IP访问频率等。
主要看资源方的鉴权策略,然后再采取相应的措施破解。
在一般体量的算力不值钱的今天,网站通常会对所有链接都鉴权,这时候爬虫就没用了。