找到约 10000 条结果
  • 领英2/3用户数据泄露,包括中国,邮箱学校工作地点统统流出
    领英超5亿用户数据遭泄露。黑客将其中200万条数据公开放出当作样本,完整的数据则要价至少4位数美元。领英目前注册用户数量7.4亿,也就是说,此次泄露影响到超过三分之二的用户。泄露的信息包括姓名、性别、受教育和工作经历,邮箱及其它社交媒体链接。有些甚至含有地理定位信息,从地理位置最新更新时间来看,有可能是2...
    2021-04-09
  • SearXNG与LLM强强联合:打造用户隐私保护的智能搜索解答流程,隐私无忧,搜索无忧
    SearXNG与LLM强强联合:打造用户隐私保护的智能搜索解答流程,隐私无忧,搜索无忧SearXNG 是一个免费的互联网元搜索引擎,整合了各种搜索服务的结果。用户不会被跟踪,也不会被分析。github地址:[链接]项目地址:[链接]公共实例:[链接]功能特性自托管,可以私有化部署没有用户跟踪/没有分析可以自定义设置脚本和 cookies...
    2024-08-21
  • java读取邮件附件
    前言项目中会遇到读取邮件excel附件的信息至后台,下面分享一个java读取excel附件的方法。1、要在后台中读取邮箱附件邮箱必须开启IMAP服务,下图示例为QQ邮箱开启对应服务的设置方法(其他邮箱也可找到对应的设置):按照提示开通对应服务,需要注意的是如果邮箱使用的是授权码,则需要在后续使用时用授权码代替密码,授...
    2023-10-06
  • 喜讯!INFINI Easysearch 在墨天轮数据库排名中挺进前30!
    近日,2023 年 10 月的 墨天轮中国数据库流行度排行 火热出炉,本月共有 283 个数据库参与排名,中国数据库行业竞争日益激烈。其中,极限科技旗下软件产品 INFINI Easysearch 稳步推进,在国内整个数据库排行中进入了前 30 的行列!
    2023-11-02
  • 如何让你的搜索更高效
    先吐槽下,国内的互联网越来越不互联了,比如手机端看全文必须下载APP,有些产品(比如闲鱼)甚至没有网页端,robot.txt禁止搜索引擎抓取,把一个个APP的内容封闭起来,于是我们手机上安装的APP越来越多。
    2020-10-01
  • Mysql索引分类
    在绝大多数情况下,Mysql索引都是基于B+树的,而索引可以提高数据查询的效率。但是Mysql是如何利用B+树进行查询的呢?索引的作用只是提高查询效率吗?
    2019-11-24
  • 2024年SEO策略:如何优化您的知识库?
    如今很多人在遇到问题时都会求助于谷歌。谷歌已经成为提供解决方案不可或缺的工具。作为全球搜索引擎的巨头,拥有大量用户流量。这就是为什么确保您的产品和服务在谷歌搜索结果中排名靠前是至关重要的,如果您想获得更多的客户,SEO是一个非常关键的引流方法。
    2023-12-08
  • 用Golang写一个搜索引擎(0x02)--- 倒排索引技术
    这一篇,我们来说说搜索引擎最核心的技术,倒排索引技术,倒排索引可能需要分成几篇文章才说得完,我们先会说说倒排索引的技术原理,然后会讲讲怎么用一些数据结构和算法来实现一个倒排索引,然后会说一个索引器怎么通过文档来生成一个倒排索引。
    2016-04-11
    5
  • 让互联网收录你的网站--入口大全
    1.搜索引擎网站收录地址大全 Google网站登录口 Google新闻网站内容 bing(必应)网页提交登录入口 360搜索引擎登录入口 即刻搜索网站提交入口 盘古数据开放平台 百度搜索网站登录口 百度单个网页提交入口 简搜搜索引擎登陆口 搜狗网站收录提交入口 SOSO搜搜网站收录提交入口 雅虎中国网站登录口 网易有道搜索引擎登录口 中...
    2020-04-29
  • 论文赏析:十亿级别单机向量检索方案DiskAnn
    ”DiskANN: Fast Accurate Billion-point Nearest Neighbor Search on a Single Node“ [1]是 2019 年发表在 NeurIPS 上的论文。该文提出了一种基于磁盘的 ANN 方案,该方案可以在单个 64 G 内存和足够 SSD 的机器上对十亿级别的数据进行索引、存储和查询, 并且能够满足大规模数据 ANNS 的三个需求: 高召回、低查询时延...
    2021-07-29
    1
  • 被大厂面试官问懵B了,十亿级数据ES搜索怎么优化?
    其实 es 性能并没有你想象中那么好的。很多时候数据量大了,特别是有几亿条数据的时候,可能你会懵逼的发现,跑个搜索怎么一下 5~10s,坑爹了。第一次搜索的时候,是5~10s,后面反而就快了,可能就几百毫秒。
    2020-06-12
  • 实现自己的搜索引擎(一)
    首先需要用输入数据创建索引,对于互联网搜索引擎,输入数据是一个个由爬虫从网上抓回来的网页,经过清洗之后进行内容抽取,然后整理成统一的格式交给索引程序创建索引。 索引由以下几个基本的组成部分: 1. 倒排索引,这一部分存放"关键字"->文档的映射,一般来说会把同一个关键字对应的所有文档按照统一方法整理成...
    2014-07-03
    1
  • SEO 实战
    在互联网发达的今天,每当我们遇到不懂的问题,首先问的就是百度,但是有时候度娘给出的并不是我们想要的答案或者根本搜不到答案,怎么办呢?如果你英语不错,用英文搜索可能会有意想不到的收获哦。
    2022-04-06
  • elasticsearch学习笔记(三十一)——Elasticsearch doc value正排索引
    在我们搜索的时候,要依靠倒排索引,但是当我们排序的时候,需要依靠正排索引。通过倒排索引锁定文档document之后,看到每个document的每个field,然后进行排序,所谓的正排索引就是doc values。 对于ES而言,在建立索引的时候,一方面会建立倒排索引,以供搜索使用;一方面会建立正排索引,也就是doc values,以供排序,...
    2019-05-01
  • Elasticsearch 参考指南(介绍)
    Elasticsearch是一个高度可扩展的开源全文搜索和分析引擎,它允许你快速,近实时地存储,搜索和分析大量数据,它通常用作底层引擎/技术,为具有复杂搜索功能和要求的应用程序提供支持。
    2018-10-11
  • 智能家居必须知道的三件事?苹果HomeKit有什么不一样?
    例如一个智能家居系统,那不同系统之间产品要怎么沟通?如果想买飞利浦的智慧灯泡,于之前买的小米智能家居互通吗?能米家 APP 控制吗?答案是不行的,因为他俩语言各不相通。
    2022-05-12
  • ChatGPT搜索风暴
    搜索引擎的市场格局已经有二十年没有什么大的变化,如今,Google和微软两大巨鳄的交锋再度上演。ChatGPT风靡之时,搜索成为大型语言模型(LLM)应用之争的最大战场。在LLM技术进程方面,Google的相关大模型研发实际上与OpenAI的ChatGPT差不多齐头并进。但刚刚仓促推出的Bard显得很被动,Google官方的解释是,他们需要考...
    2023-02-17