找到约 9694 条结果
  • Python网络爬虫入门:通⽤爬⾍和聚焦爬⾍
    网络爬虫也叫网络蜘蛛,如果把互联网比喻成一个蜘蛛网,那么蜘蛛就是在网上爬来爬去的蜘蛛,爬虫程序通过请求url地址,根据响应的内容进行解析采集数据, 比如:如果响应内容是html,分析dom结构,进行dom解析、或者正则匹配,如果响应内容是xml/json数据,就可以转数据对象,然后对数据进行解析。
    2020-08-13
  • 【K哥爬虫普法】百度、360八年恩怨情仇,robots 协议之战终落幕
    我国目前并未出台专门针对网络爬虫技术的法律规范,但在司法实践中,相关判决已屡见不鲜,K哥特设了“K哥爬虫普法”专栏,本栏目通过对真实案例的分析,旨在提高广大爬虫工程师的法律意识,知晓如何合法合规利用爬虫技术,警钟长鸣,做一个守法、护法、有原则的技术人员。
    2023-02-20
  • 建站不得不了解的SEO是什么?
    经常听人说SEO,到底SEO是什么意思? SEO(Search Engine Optimization),汉译为搜索引擎优化,是一种「利用搜索引擎的搜索规则让网站在搜索引擎的排名更好」的方法。所谓“针对搜索引擎作最佳化的处理”,是指为了要让网站更容易被搜索引擎接受。
    2020-09-12
  • 开发了一个google drive搜索引擎
    项目介绍[链接][链接] 是一个基于ElasticSearch的Google Drive 搜索引擎,快速,高效,关键:可直接下载开发背景由于gd现在转存受限于1.5T限制,大家都在摸索一个新的资源分享方式;本搜索引擎,可搜索,可下载,虽然不能解决收藏的需求,但是基本满足大家用文件的需求其实收藏了几个P的资源,真正用到的又有多少?包括我在内,好多...
    2020-09-29
  • 高效遍历匹配Json数据,避免嵌套循环
    工作中经常会遇到这样的需求:1.购物车列表中勾选某些,点击任意一项,前往详情页,再返回购物车依旧需要呈现勾选状态2.勾选人员后,前往别的页面,再次返回,人员依旧程勾选状态3.等等....
    2018-09-05
    18
  • 搜索引擎中相似字符串查找那些事儿
    转载一篇本人原创的微信公众号技术文章:搜索引擎中相似字符串查找那些事儿,欢迎阅读,交流探讨。
    2021-02-26
  • SegmentFault 助力台湾大学黑客马拉松
    黑客马拉松,即一伙程序猿在一定时间内共同协作编码,也就是一场以编程为操作方式的马拉松比赛,在有限的时间内将初步想法实现成型并展示出来的活动。Facebook 据说就是这样在哈佛宿舍诞生出来的。
    2015-07-15
  • 建站后搜索不到?进来看这里!各大搜索引擎收录指引!
    创建网站后,为了让网站尽快的被搜索到,可以到各大搜索引擎提交网址,以便加快收录速度。另外,优质域名的收录速度会比二级域名的高很多,所以建议在创建网站后,购买或绑定优质域名,有助于网站的收录,同时,创建网站后较好有规律的不断更新内容,也能够提高搜索引擎的关注,因为搜索引擎总是对新鲜的内容感兴趣,有...
    2021-10-21
  • NFTScan 与 Adot 达成合作伙伴,双方在多链 NFT 数据方面展开合作
    近日,NFT 数据基础设施 NFTScan 与 Web3 搜索引擎 Adot 达成合作伙伴关系,双方将在 NFT 数据层面展开合作。在 Adot 产品中,由 NFTScan 为其提供专业的多链 NFT 数据支持,为 Web3 用户带来优质的 NFT 搜索查询等相关交互功能,提升用户产品体验。
    2023-04-04
  • 程序人生:黑帽seo新手入门基础教程
    黑帽搜索引擎优化新手入门基础教程 从原理来看,使用黑帽搜索引擎优化技术做排名,与白帽搜索引擎优化是一样的。从细化的操作来看,则有很大的不同。黑帽搜索引擎优化新手入门基础教程是概述的相关黑帽搜索引擎优化技术,不是细化的操作点。 人各有志,不是黑帽就不能 […]黑帽搜索引擎优化新手入门基础教程从原理来看,...
    2018-12-03
  • 亚太地区物理服务器都有哪些?
    亚太地区很广,亚太地区服务器按国家来划分的有如下:tg @CDNJSFY1.香港物理服务器2.美国物理服务器3.日本物理服务器4.韩国物理服务器5.台湾物理服务器6.新加坡物理服务器7.柬埔寨物理服务器8.越南物理服务器9.菲律宾物理服务器按照地区来分的话我家有九家直营机房。
    2022-06-07
  • robots协议详解
    robots协议也就是robots.txt,网站通过robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。Robots协议是网站国际互联网界通行的道德规范,其目的是保护网站数据和敏感信息、确保用户个人信息和隐私不被侵犯。因其不是命令,故需要搜索引擎自觉遵守。
    2019-12-18
  • 蔻驰、纪梵希等奢侈品牌内容安全事件屡出,海外企业如何才能避免此类错误?
    环球时报在报道中指出,根据网传照片显示,一款蔻驰(Coach)T恤背面分两列印有城市和国家名称,其中北京、上海对应的国家为中国,其英文表述分别为(Beijing,China;Shanghai,China)。而香港和台湾却以“独立国家”的姿态出现。Hong Kong(香港)后面未作任何标注,Taipei(台北)对应的“国家”一栏里,写着“Taiwan(台...
    2019-08-12
  • python爬虫了解第一篇
    搜索引擎:关键字匹配提取,前提是要将所有的页面爬一遍,然后存到自己的服务器,当用户惊醒搜索的时候,根据自己的搜索内容,搜索引擎将用户搜索信息返回给用户。
    2018-05-05
  • HTML篇(001)-简述一下你对 HTML 语义化的理解?
    ②html 语义化让页面的内容结构化,结构更清晰,便于对浏览器、搜索引擎解析;即使在没有样式 CSS 情况下也以一种文档格式显示,并且是容易阅读的;
    2020-01-19
  • 微信域名防屏蔽防红,如何做到微信域名防封
    自动转向(Auto-Redirecting),也叫自动重定向。自动跳转,指当访问用户登陆到某网站时,自动将用户转向其它网页地址的一种技术。转向的网页地址可以是网站内的其它网页,也可以是其它网站。通常情况下,浏览器会收到一个网页,该页面含有自动加载一其它网页的代码。该页面有可能在服务器端被转换,这样的话,浏览器只收...
    2020-07-08
  • 使用chrome的自定义搜索引擎提高工作效率
    其中,添加新搜索引擎:可以写host或者title;关键字:就是快捷键,比如bi,然后你下次在搜索框中输入bi,就会有提示;网站:这一行最关键,提示的也很清楚了,你只需要把需要的关键词用%s填充即可,比如B站就可以这样写:http://www.bilibili.tv/search?keyword=%s
    2016-07-01