找到约 10000 条结果
  • GPT搜索引擎原型曝光!新模型GPT4-Lite驱动,代码已上传
    OpenAI发布会前一天,员工集体发疯中……上演大型套娃行为艺术。A:我为B的兴奋感到兴奋;B:我为C的兴奋感到兴奋……Z:我为这些升级感到兴奋与此同时还有小动作不断,比如现在GPT-4的文字描述已不再是“最先进的模型”,而仅仅是“先进的”。以及被鸽掉的GPT搜索引擎,原型代码上传到ChatGPT了。黑客“光头哥”Tibor Blaho,从更...
    2024-05-13
  • 个人博客 SEO 优化(2):站内优化
    文章首发于我的博客:个人博客 SEO 优化(2):站内优化对于搜索引擎原理不清楚的可以看第一篇文章:个人博客 SEO 优化(1):搜索引擎原理介绍 SEO 优化可以分为站内优化和站外优化,而站内优化又分为:网站结构优化和网站页面优化。从 SEO 角度来看,做网站结构优化的目的在于: 提高用户体验 提高收录 更好的权重分配...
    2018-04-16
  • 热榜第四:GitHub开源代码数据集界ImageNet,推出代码搜索挑战赛
    用别人的轮子,开自己的路。在这个产品快速迭代的时代,搜索、调用别人的代码避免重复造轮子,已是开发常态。但是搜索代码这件事,并不是百度一下就能解决的。搜索引擎们往往答非所问,难以理解程序猿们的需求。现在,GitHub觉得,机器学习可以改善这个问题。不仅要让AI搜代码,还要搞出一套评估标准。于是,CodeSearchN...
    2019-09-30
  • 为rails 项目搭建elasticsearch服务
    出现类似上述信息 number 表示当前 elasticsearch 的版本号,需要注意的是 elasticsearch 现在分为 v2+ 和 v5+ 两个版本,要根据自己的版本来选择 searchkick 对应的版本是否合适
    2017-10-10
  • 火山引擎 DataLeap 构建Data Catalog系统的实践(三):关键技术与总结
    构建一个好的Data Catalog系统,需要考虑的核心产品设计和技术设计有很多。篇幅所限,本文只概要介绍技术设计中最核心重要的部分,更多细节展开可参照后续的文章。
    2023-07-14
  • C++ Actor库orca简介(二):消息通信及邮箱
    当Actor对象被构造时,orca会为其申请一个邮箱,用于消息通信。当Actor对象被析构后,orca会回收该邮箱并用于其他新申请Actor对象。orca通过索引来分配、回收邮箱。其中申请邮箱的时间复杂度为o(1),回收的实现复杂度为o(logN)。图:orca邮箱结构
    2018-11-10
  • 推荐引擎
    随着推荐引擎的出现,用户获取信息的方式从简单的目标明确的数据的搜索转换到更高级更符合人们使用习惯的信息发现。如今,随着推荐技术的不断发展,推荐引擎已经在电子商务 (E-commerce,例如 Amazon,当当网 ) 和一些基于 social 的社会化站点 ( 包括音乐,电影和图书分享,例如豆瓣,Mtime 等 ) 都取得很大的成功。这...
    2018-01-11
  • TP6验证器的使用
    一.编写一个验证器,验证:用户名(User_name),密码(password),邮箱(email),手机号码(mobile)(1)用户名:6到10个字符,不能为空,必须是字母和数字组合(也可以是汉字)(2)密码:6到10个字符,不能为空,必须是字母和数字组合(3)邮箱:必须符合邮箱格式(4)手机号码:不能为空,不能小于11位字符,不能大于11...
    2019-10-22
    1
  • [搜索引擎] Sphinx 的介绍和原理探索
    What/Sphinx是什么 定义:Sphinx是一个全文检索引擎。 特性: 索引和性能优异 易于集成SQL和XML数据源,并可使用SphinxAPI、SphinxQL或者SphinxSE搜索接口 易于通过分布式搜索进行扩展 高速的索引建立(在当代CPU上,峰值性能可达到10 ~ 15MB/秒) 高性能的搜索 (在1.2G文本,100万条文档上进行搜索,支持高达每秒150~250...
    2016-04-21
  • 搜推电商大模型及应用实践-下篇
    大模型对搜推技术产生了深远的影响,极大地推动了搜推技术的演进趋势,使得搜推更加的智能化和个性化,然而在搜推中引入大模型时同样面临一系列的挑战,例如商品知识的幻觉,复杂查询的理解,个性化商品推荐,隐私和安全等问题。本文基于这个问题背景介绍下我们的技术实践,完整文章分为上下两篇介绍:
    2025-02-18
  • 第17篇-使用Python的初学者Elasticsearch教程
    我的Elasticsearch系列文章,逐渐更新中,欢迎关注 0A.关于Elasticsearch及实例应用 00.Solr与ElasticSearch对比 01.ElasticSearch能做什么? 02.Elastic Stack功能介绍 03.如何安装与设置Elasticsearch API 04.如果通过elasticsearch的head插件建立索引_CRUD操作 05.Elasticsearch多个实例和head plugin使用介绍 06.当E...
    2020-06-19
  • MySQL索引专题一 认识索引
    想写MySQL的索引专题是源于之前自己在学习MySQL索引时痛苦的经历,你在网上搜索关于MySQL的索引的文章,大多是支离破碎,没有系统性的对知识点的罗列堆砌,文章中会说明你要如何如何做,但是很少涉及去讲为什么要这么做,哪些不能做,很难对MySQL有一个系统性的认知,学习如果没有系统性的话,就很难在实际的项目中灵活...
    2017-07-20
    9
  • 如何在千亿行规模的表中快速检索数据
    简介:背景自从五十年前关系型数据模型被发明出来后,凭借优秀的表达能力和清晰易懂的特性让其很快在数据库市场中崭露头角,迅速占领市场,成为各行各业的主流数据存储系统。在这五十年内,数据库架构、表达方式、存储结构、优化器等方面都有了长足的发展,但是索引结构的发展相对缓慢了一些,更多的发展是基于现有的索...
    2021-06-10
    1
  • git的下载配置以及和idea整合
    下载完成后傻瓜式安装安装完成后,在任意位置右键,选择Git Bash here$ git config --global user.name "your-name"$ git config --global user.email "your-email@youremail.com"
    2021-03-25
  • 火山引擎DataLeap的Catalog系统搜索实践 (二):整体架构
    火山引擎DataLeap的Catalog搜索系统使用了开源的搜索引擎Elasticsearch进行基础的文档检索(Recall阶段),因此各种资产元数据会被存放到Elasticsearch中。整个系统包括4个主要的数据流程:
    2023-06-01
  • 直播速递 | Hash Index 原理和应用精讲
    本期直播我们邀请到 KaiwuDB 高级研发工程师徐胜康,为大家分享 Hash Index 原理和应用。徐老师曾任职于 Sun Micro Systems,  Lucent 等公司,具备多年 Linux/UNIX Operating System 内核、驱动、文件系统、数据库、研发工作与技术管理经验,对分布式系统、性能优化、数据加密等领域有着深入的研究。
    2023-09-28
  • 一图解千言,从兴趣意念直达搜索目标!
    当前,图像搜索正在以更广泛的应用、更形象的体验迅速崛起,获得越来越多的市场关注,被公认为当前最具有市场潜力的应用之一,并且在电子商务、知识产权保护、服装纺织、旅游等领域逐步得到广泛应用。
    2019-03-07