降低检索系统搭建门槛,轻松实现 RAG 应用!Zilliz Cloud Pipelines 惊喜上线
Zilliz Cloud Pipelines 可以将文档、文本片段和图像等非结构化数据转换成可搜索的向量并存储在 Collection 中,帮助开发者简化工程开发,助力其实现多种场景的 RAG 应用,将复杂生产系统的搭建和维护简化成 API 调用。
2023-12-12
02-认识python爬虫
学习目的了解爬虫,爬虫起源;爬虫是什么专业术语:网络爬虫(又被称为网页蜘蛛,网络机器人)网络爬虫,是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。爬虫起源(产生背景)随着网络的迅速发展,万维网成为大量信息的载体,如何有效地提取并利用这些信息成为一个巨大的挑战;搜索引擎有Yahoo,Google,百...
2020-10-11
zTree分批异步加载方式下实现节点搜索功能
最近公司做一个项目用到zTree,zTree功能强大就不用多说了,相信用过的人都知道。 公司项目因为要展示的节点非常多,所以要求要实现搜索节点的功能,zTree确实很强大,它提供了getNodesByParamByFuzzy(key, value, parentNode)方法可根据关键字进行模糊查询得到想要的节点,极其方便。但是问题来了,因为要...
Python网络爬虫入门:通⽤爬⾍和聚焦爬⾍
网络爬虫也叫网络蜘蛛,如果把互联网比喻成一个蜘蛛网,那么蜘蛛就是在网上爬来爬去的蜘蛛,爬虫程序通过请求url地址,根据响应的内容进行解析采集数据, 比如:如果响应内容是html,分析dom结构,进行dom解析、或者正则匹配,如果响应内容是xml/json数据,就可以转数据对象,然后对数据进行解析。
2020-08-13
Easysearch Chart Admin 密码自定义
使用 Easysearch Chart 0.2.0 之前的版本(包括 0.2.0)创建出来的集群, admin 用户初始密码固定为 admin,这样的集群存在安全隐患。
2024-12-26
Python爬虫之提取Bing搜索的背景图片并设置为Windows的电脑桌面
鉴于现阶段国内的搜索引擎还用不上Google, 笔者会寻求Bing搜索来代替。在使用Bing的过程中,笔者发现Bing的背景图片真乃良心之作,十分赏心悦目,因此,笔者的脑海中萌生了一个念头:能否自己做个爬虫,可以提取Bing搜索的背景图片并设置为Windows的电脑桌面呢?Bing搜索的页面如下:
2018-09-02
惠金所登录加密学习
aHR0cHM6Ly93d3cuaGZheC5jb20vbG9naW4uaHRtbCMv逆向关键字:password输入登录信息,点击登录,抓包login,请求中password进行了加密,我们通过搜索大法进行查找,password的字段比较常见,我们可以通过搜索相邻的字段进行搜索(本次直接将password字段,下期解决剩下的字段)搜索imgToken,发现统一都要在一个js文件下
2024-05-11
es+hbase学习
Elasticsearch 是一个基于 Lucene 的 搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。
2020-11-13
好程序员大数据学习路线分享TCP和UDP学习笔记
好程序员大数据学习路线分享TCP和UDP学习笔记,TCP点对点,UDP 广播 System: System类中提供了大量的静态方法,可以获取与系统相关的信息或系统级操作,在System类的API文档中,常用的方法有: - public static long currentTimeMillis():返回以毫秒为单位的当前时间。 - public static void arraycopy(O...
2019-09-26
MongoDB & Mongoose
建立一个 MongoDB Atlas 数据库并导入连接到它所需的软件包。将 mongodb@~3.6.0 和 mongoose@~5.4.0 添加到项目的 package.json 中。 然后,在 myApp.js 文件中请求 mongoose。 创建一个 .env 文件,给它添加一个 MONGO_URI 变量。 变量的值为 MongoDB Atlas 数据库 URI。 应用单引号或双引号包裹 URI。请记住,环境变量...
2022-10-02
【Node】CommonJS 包规范与 NPM 包管理
NPM 实践了 CommonJS 包规范规范,帮助我们安装和管理依赖包,使得 Node 项目的第三方模块更加规范便捷,可以在 NPM 平台上找到所有共享的插件。
HTTP请求头referer
留言板有个来源的字段,用来获取网页的地址。测试时发现在谷歌Chrome浏览器中,可以正确获取到网址来源,然后用火狐Firefox浏览器,却无法正确获取到网址来源。因为后台使用的是PHP,留言成功之后通过JS弹出alert提示框,然后再通过location.href跳转回留言页面。
一文详解物化视图改写
预计算和缓存是计算机领域提高性能以及降低成本的最常见的手段之一。对于那些经常重复的请求,如果可以通过缓存回答,比重新计算结果或从速度较慢的数据存储中读取要快得多,消耗更少的系统资源。在数据库领域中,物化视图是预计算和缓存的自然体现。
2021-04-22
NFTScan 与 OneID 达成合作伙伴,支持多类型 DID 搜索!
近日,NFT 数据基础设施 NFTScan 与一体化数字身份解决方案 OneID 达成合作伙伴关系,双方将在 NFT 数据层面展开合作。为 Web3 用户带来优质的 NFT 搜索查询交互体验,向更安全和更有效的去中心化生态系统迈出的重要一步。
2024-01-30
ElasticSearch的match fuzzy查询参数详解
fuzzy在es中可以理解为模糊查询,搜索本身很多时候是不精确的,很多时候我们需要在用户的查询词中有部分错误的情况下也能召回正确的结果,但是计算机无法理解自然语言,因此我们只能通过一些算法替代语言理解能力实现类似的事情,前缀查询的实现比较简单但效果很难令人满意,就模糊查询而言es的fuzzy实现了一种复杂度和...
2023-01-28
1.9 神经网络结构搜索(NAS)
神经网络架构搜索(NAS)是一种自动搜索最优神经网络架构的方法。通过使用NAS,研究人员可以避免手动设计网络架构的繁琐过程,从而节省时间和精力。本教程将介绍NAS的基本概念、方法和实现步骤。
2024-02-10
单行子查询 vs 多行子查询:SQL 查询的强大工具
在数据库查询中,子查询(Subquery)是指嵌套在其他查询语句中的查询。子查询可以用来获取在主查询中需要使用的临时数据结果。根据返回结果的数量,子查询可以分为单行子查询和多行子查询。
2024-08-03