Python3 使用 websockets 调用阿里云实时语音识别(qbit)

3 月 13 日
阅读 11 分钟
358
前言技术栈 {代码...} 截至 2025.3.13,nls.NlsSpeechTranscriber 不支持异步调用使用 asyncio.run 或 loop.create_task 将异步调用转化为同步调用后文中,为保持字节流和字符串的一致性,定义了不同格式的结束符 {代码...} 材料准备从 GitHub 下载 nls 目录和 tests 目录里面的 test1.pcm 文件将 nls 目录放到 site-pac...

安装 apk 和 obb 文件(qbit)

3 月 9 日
阅读 1 分钟
330
而 OBB 是 Opaque Binary Blob 的缩写,它通常用于存储大型应用程序的额外数据或资源,比如游戏中的图形资源、音频文件等。

大语言模型榜单(qbit)

3 月 5 日
阅读 1 分钟
407
前言本文列出知名大语言模型榜单地址和编程语言榜单地址大语言模型榜单Chatbot ArenaChatbot Arena:一个针对大型语言模型(LLMs),采用众包方法进行匿名、随机化的对战的评分系统。官方地址:[链接]Hugging Face 镜像:[链接]RAG 模型榜单MMTEBMMTEB(Massive Multilingual Text Embedding Benchmark),大规模多语言文...

pyparsing 与 regex 结合表达汉字等Unicode字符(qbit)

2 月 5 日
阅读 1 分钟
468
前言技术栈 {代码...} 测试案例测试代码 {代码...} 测试输出 {代码...} 相关阅读pyparsing.Regex 官方文档使用 pyparsing 和 sympy 化简或非逻辑表达式本文出自 qbit snap

使用 pyparsing 和 sympy 化简或非逻辑表达式(qbit)

2 月 5 日
阅读 3 分钟
488
前言技术栈 {代码...} 案例测试代码 {代码...} 测试输出 {代码...} 相关阅读用 pyparsing 3.x 化简括号冗余的或非逻辑表达式本文出自 qbit snap

docker 命令备忘(qbit)

1 月 15 日
阅读 3 分钟
449
前言软件版本 {代码...} Docker Github 仓库: [链接]容器内 SHELL进入容器内 shell {代码...} 容器的拉取、查看、运行、重启搜索容器(nginx) {代码...} 新拉一个容器(nginx) {代码...} 查看本地镜像 {代码...} 运行容器 {代码...} 查看容器 {代码...} 重启容器 {代码...} 关闭容器 {代码...} 删除容器 {代码...} 删...

清理 git 仓库子目录(qbit)

1 月 13 日
阅读 1 分钟
493
前言有些历史目录并没有保留回退的必要,反而占了很多的资源,需要清理搜到到两个主流工具:BFG Repo-Cleaner 和 git filter-repogit filter-repo 被 git 官方推荐,下文用 git filter-repo 举例清理过程安装 git filter-repo {代码...} 命令行进入本地 git 仓库目录查看当前仓库的远程 URL {代码...} 移除 lib20241231 ...

Wireshark 使用笔记(qbit)

2024-12-30
阅读 1 分钟
441
前言记录 wireshark 使用案例查看 github 访问情况技术栈 {代码...} 本地 proxy 软件为 vTray {代码...} wireshark 监听 loopback,不是 以太网 或 本地连接wireshark 捕获过滤器规则 {代码...} 使用 http 代理curl 访问 github {代码...} wireshark 显示过滤器规则 {代码...} 使用 socks 代理curl 访问 github {代码......

Linux 下 kill 孙子进程(qbit)

2024-12-27
阅读 1 分钟
625
qbit 在使用 Python 的 FastAPI 框架,在 Python 脚本中用 os.system 调用了 uvicorn 启动程序,调用链条大致如下

获取 Elasticsearch 的 token_count 类型的值(qbit)

2024-12-23
阅读 4 分钟
463
前言本文对 Elasticsearch 7.17 适用,官方文档 Token count field type测试新建 mapping {代码...} 写入测试数据 {代码...} 查询 {代码...} 查询结果如下 {代码...} 案例Elasticsearch 分词匹配能否完整匹配查询 token?有且只有查询 token 的被召回。数据如下 {代码...} 检索 "A B" 或者 "B A" 时,都只应召回 doc1,...

Elasticsearch 对于分词 position 的巧妙设计(qbit)

2024-12-19
阅读 3 分钟
526
前言本文对 ES 7.17 适用需要探讨的问题 {代码...} {代码...} 以下测试均使用 ES 内置的 simple 分词器试验过程直接查看分词结果 {代码...} 可以看到分词结果 position {代码...} 新建索引并写入数据创建 my_index 索引 {代码...} 写入数据 {代码...} 查看数据 {代码...} {代码...} 分词 position查看 name.text 的分词 ...

试试 Elasticsearch 的 unsigned_long(qbit)

2024-12-12
阅读 1 分钟
582
前言本文在 Elasticsearch 7.17 下测试Elasticsearch 自 7.10 引入了 64 位无符号整数 unsigned_long,之前只有 long已知 long 的数据范围 {代码...} 已知 unsigned_long 的数据范围 {代码...} 试验创建索引 {代码...} 测试 LLL 字段,写入数据 18446744073709551615,即 2^64-1 {代码...} LLL 字段报错如下,超过了 lon...

http 压测工具(qbit)

2024-11-26
阅读 2 分钟
603
前言记录常用的 http 压测工具JmeterGitHub 地址 [链接]Apache 老牌压测工具,图形界面版ab官方地址 [链接]Apache HTTP 服务器自带的一个性能测试工具,命令行工具heyGitHub 地址 [链接]一个由 Google 工程师 Martin Heinz(rakyll)使用 Go 语言开发的HTTP压力测试工具,主要用于对 Web 服务进行压力测试,可以作为 Apa...

Windows 下启动 gradio 信息: 用提供的模式无法找到文件。(qbit)

2024-11-21
阅读 1 分钟
697
技术栈 {代码...} 启动 gradio 报如下信息 {代码...} 经排查,是因为 gradio 时调用 系统 where 命令去找 nodejs {代码...} 本文出自 qbit snap

Gradio/Streamlit 格式化 json(qbit)

2024-11-21
阅读 2 分钟
697
前言技术栈 {代码...} Gradio 格式化 json示例代码 {代码...} 格式化前截图格式化后截图Streamlit 格式化 json示例代码 {代码...} 示例截图截至 Streamlit 1.40.1,Streamlit 似乎无法复用数据框输出内容相关阅读Gradio 官方文档:[链接]Streamlit 官方文档:[链接]四种 Gradio 界面本文出自 qbit snap

Elasticsearch 查看节点状态信息(qbit)

2024-11-01
阅读 1 分钟
552
前言本文对 Elasticsearch 7.17 有效查看集群信息查看集群整体状态 {代码...} 查看节点信息查看所有节点的 热线程 {代码...} 查看单个节点的 热线程 {代码...} 查看所有节点的 线程池 {代码...} 查看单个节点的 线程池 {代码...} 查看所有节点的 task {代码...} 查看单个节点的 task {代码...} 节点 CPU 占用高<案例&...

Python AES 加密和解密(qbit)

2024-10-28
阅读 3 分钟
483
前言AES 有多种加密模式,本文选取了最常用的 CBC 模式 {代码...} 技术栈 {代码...} 示例代码导入库 {代码...} PKCS7 填充与反填充 {代码...} 生成初始化向量 {代码...} 加密/解密 {代码...} 为了便于在线验证,示例中生成初始化向量采用了随机选取数字/小写字母/大写字母的方式输出结果 {代码...} 相关阅读cryptography...

Spark 写入 Elasticsearch 报错地址被占用(qbit)

2024-10-24
阅读 3 分钟
466
技术栈 {代码...} 报错片段 {代码...} 下面 3 个是协调节点的地址 {代码...} 在 Spark 代码中调整以下写入参数,都没用 {代码...} 最后排查结果是多个索引的数据文件太多,在切换索引时,新绑定端口不够用,用 spark repartition 减少数据文件个数后问题得以解决。感觉很奇怪:看起来像是一个数据文件占用了一个端口,而...

ES 自定义分词匹配及同义词处理(qbit)

2024-10-18
阅读 4 分钟
453
前言本文对 Elasticsearch 7.17 有效,分词器使用 ik_max_word设计思路 {代码...} GetLeafTermDSL叶子节点的 term 匹配流程图示例代码 {代码...} 自定义分词搜索整体外围调用 GetLeafTermDSL流程图示例代码 {代码...} 相关阅读用 pyparsing 3.x 将与或非逻辑表达式转换为Elasticsearch查询语句本文出自 qbit snap

Python elasticsearch.helpers.async_bulk 解读(qbit)

2024-10-14
阅读 1 分钟
401
前言本文对 Elasticsearch 7.17 有效梳理 Elasticsearch Python 客户端的异步批量写入官方文档elasticsearch.helpers.async_bulk解读qbit 开始对 stats_only 和 raise_on_error 参数的用法有些迷惑下面是研究后的解读默认返回成功写入的数据条数和错误列表如果 stats_only 设置为 True,返回写入成功的条数和失败的条数r...

Python 调用 cypher 语句清空 neo4j 全部索引(qbit)

2024-09-23
阅读 2 分钟
406
技术栈 {代码...} Python 脚本 {代码...} 后记如果代码运行卡住,检查数据库地址和账号密码。本文出自 qbit snap

AWS S3 删除过期目录(转载)

2024-09-06
阅读 2 分钟
611
前言技术栈 {代码...} 对于 AWS S3 在 web 控制台点击显示版本才能展示的过期目录,直接在 web 控制台或者用普通的 aws cli 命令是删除不掉的AWS 中国区工程师为 qbit 提供了以下删除 AWS S3 过期目录的脚步代码脚本内容 {代码...} 本文出自 qbit snap

Cypher 查询包含某关键词的图(qbit)

2024-08-28
阅读 1 分钟
482
前言本文对 neo4j 5.21.0 适用项目需求是查询哪些图包含指定 keyword,已知实现上用 label 作为图的标识查询得到所有图即得到所有 label {代码...} 查询单个图是否包含 keyword方式一查询节点 {代码...} 查询边 {代码...} 方式二查询非孤立节点和边 {代码...} 查询孤立节点 {代码...} 注意孤立节点的查询方式 {代码...} ...

怎样调整 Elasticsearch 的 should 加分(qbit)

2024-08-23
阅读 3 分钟
388
前言本文对 Elasticsearch 7.17 适用Elasticsearch 权威指南说 {代码...} 以 qbit 当前认知来说,should 有两个功能 {代码...} 本文想试验,should 加分加多少,怎样控制加多少试验创建索引 {代码...} 写入测试数据 {代码...} must 查询 abstract,得到 1.47 分 {代码...} must 查询 title,得到 0.86 分must 查询 abstr...

用 NetworkX 展示 Elasticsearch 同义词文件(qbit)

2024-08-20
阅读 2 分钟
425
前言NetworkX github: [链接]Elasticsearch solr 同义词格式: [链接]技术栈 {代码...} 同义词文件qbit_synonym.txt {代码...} 代码code {代码...} 可以切换自己需要的布局 {代码...} 结果控制台打印 {代码...} 图片展示本文出自 qbit snap

AWS EC2 上启用账号密码登录(qbit)

2024-08-16
阅读 1 分钟
384
操作系统 AWS EC2 Ubuntu 22.04修改配置文件 /etc/ssh/sshd_config {代码...} 如果需要启用远程 root {代码...} 重启 sshd 服务生效 {代码...} 本文出自 qbit snap

fastapi streamingresponse 不能正常流式返回(qbit)

2024-08-16
阅读 1 分钟
995
以 fastapi 为 web 框架,使用 langchain 调用大语言模型流式返回数据给web接口调用时,流式返回不能正常工作,只能整块返回 {代码...}

ES terms 聚合结果不精确示例

2024-08-06
阅读 1 分钟
442
原文出处铭毅天下: Elasticsearch 聚合数据结果不精确,怎么破?示例

关于 Elasticsearch 同义词的困惑(qbit)

2024-08-01
阅读 5 分钟
561
前言ES 版本 7.17同义词分词器 IKES 官方文档:Token graphs,里面没有 多词vs.多词 的示例分词器组成(出自:[链接])synonym_graph 为 TokenFilter: [链接]同义词困惑查询语句 {代码...} 输出结果 {代码...} 问题为什么 联合 的 positionLength 会由 1 变成 2 ? (已知 positionLength 为默认值 1 时不显示)为什么 ...

Flink 流处理 WordCount 输出到 jsonl(qbit)

2024-06-21
阅读 8 分钟
602
前言技术栈 {代码...} 相关文档Flink DataStream API 编程指南: [链接]File Sink: [链接]示例代码 {代码...} 输出与输出输入文件内容 {代码...} 输出文件内容 {代码...} 项目配置文件 pom.xml {代码...} 本文出自 qbit snap