一般有两种分页Url
第一种就是 product_list?p=${page}
第二种 product/page/${page}
我看很多网站,基本这两种是55开,尤其是csdn,好像这两种都有,到底那种比较好?
一般有两种分页Url
第一种就是 product_list?p=${page}
第二种 product/page/${page}
我看很多网站,基本这两种是55开,尤其是csdn,好像这两种都有,到底那种比较好?
都一样,只要爬虫能看到这个url就行了。因为list页面实际上权重很低,从seo的角度来看,通常我们不需要搜索引擎收录list,其作用是引导爬虫爬到所有的内容页。
因此,不要使用纯js的分页(因为爬虫不会去执行js),就算你为了效果使用了js分页,那么也应该把普通的分页放到一个隐藏的div里面给爬虫看。
只考虑google的话,都差不多。
谷歌webmaster管理里面有对动态参数设置的地方,可以额外设置页面参数的意义。所以不用纠结主流搜索引擎的问题。三流搜索引擎哪个都处理不好,可以无视。
问题在于缓存,cdn会如何考虑你的参数,这个在业内参差不齐。所以传统做法都是搞伪静态,rest风格的。
比如你是否遇到过看国内网站视频,拖动进度条之后视频就挂掉或者从头播放了?那就是因为拖动进度条时,播放器传了个参数给服务器,但链路上缓存对参数不理解,提示找不到视频(挂掉)或丢弃参数(从头播放)。
像wordpress的用户就喜欢伪静态多一点,……/title123.html
京东,segmentfault等就是rest,像本文https://segmentfault.com/q/1010000005090145
3 回答2.7k 阅读✓ 已解决
3 回答4.1k 阅读✓ 已解决
3 回答3k 阅读✓ 已解决
8 回答3.6k 阅读
4 回答2.7k 阅读✓ 已解决
2 回答2.6k 阅读✓ 已解决
3 回答2.6k 阅读✓ 已解决
动态路径,我们常见的表现方式是路径地址中经常含有“?”、“=”或者同时含有问号和等号。这种路径其实包含一种参数内容传递的意思。
比如:http://caozhui.com/catalog.asp?cate=4 就是一个动态路径。
静态路径:一般层次都比较分明,比如会有比较明确的拼音目录。http://www.xxxx.com/article/20150707/608460.shtml 这样的链接层次分明,而且里面不包含参数,蜘蛛抓取的时候会相对好些。
伪静态路径:伪静态就是用技术把动态路径变成静态路径的一种形式,伪静态路径本质上来说是静态路径。比如:http://www.xielingshao.com/index.php/post/54.html
其实对于搜索引擎来说,动态路径和静态路径的抓取其实是无差别的。除非动态路径中参数数量超过三个,蜘蛛在抓取的时候会有参数丢失,而造成页面抓取失败的情况。在大多数情况下,动态路径和静态路径对于搜索引擎来说都是一视同仁的。另外,一个网站只允许设置一种路径,要么都是动态路径,要么都是静态路径。不允许同时出现两种路径连接。如果有第二种连接一定要屏蔽了,可以用robots文件屏蔽了。