注册登录
产品
社群
使用“Bing”搜本站
使用“Google”搜本站
使用“百度”搜本站
✓
站内搜索
注册登录
问答
博客
资讯
标签
用户
活动
极客观点
项目管理
HarmonyOS
开发者社区
热门标签
javascript
前端
python
node.js
react
vue.js
php
laravel
go
人工智能
mysql
linux
ios
java
android
css
typescript
spring
程序员
ONES 研发管理
思否企业问答
安谋科技 XPU
问答
博客
资讯
标签
用户
活动
极客观点
项目管理
HarmonyOS
开发者社区
热门标签
javascript
前端
python
node.js
react
vue.js
php
laravel
go
人工智能
mysql
linux
ios
java
android
css
typescript
spring
程序员
ONES 研发管理
思否企业问答
安谋科技 XPU
使用“Bing”搜本站
使用“Google”搜本站
使用“百度”搜本站
✓
站内搜索
全部
问答
文章
博客
活动
找到约 10000 条结果
问:sphinx solr 搜索服务的问题
我数据库现在有三个表A表 和 B表 和C表 结构不同 但都有title字段 我想通过 sphinx solr 还没确定用哪个 通过搜索框 分别都查出A B C的内容 这样是否可以简单实现 之前没用过 这些 所以再做数据库逻辑的时候提前咨询1下
2017-02-12
答:测试环境被百度快照抓了 怎么去掉呢(怎么不被百度快照抓住)
先找百度提交删除申请 然后测试环境记得加 robots.txt 不给抓取,或者在 nginx 上 直接拒绝 来自蜘蛛的请求.
2017-07-03
3
答:求推荐,有没有开源的搜索引擎构架
蜘蛛的话 需要你自己搞定吧(当然也有开源的,不过可能不理想)。。 全文索引的话 可以用 xunsearch xapian coreseek
2013-06-24
1
答:七牛空间里的robot.txt和网站根目录下的robot.txt能否同时存在
可以同时存在。蜘蛛访问镜像站的时候,是访问镜像空间的robot.txt,访问源站的时候是访问源站的robot.txt。
2014-03-20
答:请问存在七牛云存储中的文件,搜索引擎不可以收录的对吧
如果Bucket是私有,肯定不会收录;如果Bucket是公有,并且Object出现在互联网上,被蜘蛛抓取到,会进行索引
2013-09-21
答:为什么单页面应用,SEO难度比较大
因为蜘蛛更喜欢静态的内容。在下不才,对seo有一点研究,欢迎来看我写的笔记,比较详细:[链接]
2018-11-01
答:服务端如何识别当前页面访问请求来自搜索引擎抓取?
你应该多关注下百度的公告,几个月前已经宣布会主动爬JS,同时也公布了如何识别百度蜘蛛。
2017-08-10
问:多个邮箱配置邮件转发会发生转发死循环吗?如果会,将如何处理?
我举个例子 Gmail邮箱A 配置收到邮箱转发到 QQ邮箱B,QQ邮箱B配置收到邮件转发到Gmail邮箱C,Gmail邮箱C配置收到邮件转发到邮箱A。
2017-07-05
答:微服务 Api gateway 中OAuth授权限制的问题
虽然图上画的后端服务之间直接关联,但感觉应该还是基于注册中心调用的,要不又成了蜘蛛网了。
2018-08-03
答:最近tcp连接数ESTABLISHED一直比较高 显示ip都是cdn的,cpu占用比较高怎么办
象是写得比较差的蜘蛛在抓你的网站,你可以看看相应的 nginx 访问日志.可以对这一 ip 段进行流量限制.
2019-01-25
答:升级bigsur,电池提示建议维修
更新:据群内成员和客服的反馈,客服说最近有不少这类反馈,工程部可能会在下次更新中处理该问题(11.2 maybe)。======和你一样的问题,17款的,电池电量跳动/不充电,返厂检测没查出任何问题,客服给免费换了电池键盘啥的又好了。VX群加了没,14天左右已经聚集了200个有同样问题的人。(换电池未必有用,群里有更换电池几...
2020-12-31
问:在路由中使用promise同步Mysql返回值,为什么没有路由判断,一启动服务就运行?
app.js是主文件,主要是一些路由信息,其中有一个路由如下,主要检查邮箱是否已经使用过,按说只有客户端get/sign-in/email这个路径后再运行里面的代码,为什么app.js一启动,下面的代码就自动运行了?
2017-06-09
1
问:日志中有很多同IP段的IP,怎么快速判断是否蜘蛛、恶意机器人?
114.250.43.82114.250.44.141114.250.44.35114.250.48.177114.250.48.18114.250.48.84114.250.49.134114.250.49.162114.250.49.2114.250.49.44114.250.49.86114.250.49.91114.250.50.110114.250.50.144114.250.50.43114.250.51.102114.250.51.105114.250.51.112114.250.51.115114.250.51.12114.250.51.125114.250.51.149...
2025-01-07
1
答:如何避免被采集网站?
cnzz统计的问题,加个谷歌统计对比下,流量差距就出来了,有10倍左右,猜测应该是百度蜘蛛之类的,识别为用户了,我的展也这样
2015-07-01
答:nginx 如何正确屏蔽 \xA3\xA9 \x09 这样的userAgent?
这个是百度蜘蛛的UserAgent吧,如果想要网站不被抓取。可以配置 robots.txt ,拒绝所有抓取;这样这些请求就不会来了,自然就不用处理。
2018-04-28
答:mysql什么场景下才需要用长连接?
应用访问db建议都是长连接,Tomcat使用连接池的方式复用连接能节省很多数据库资源消耗,避免频繁建立和删除连接造成大量的资源浪费,访问redis、搜索引擎这一类才是使用的短连接交互
2017-12-25
1
在 Google 中搜索 »
在 百度 中搜索 »
只显示我发布的