生物神经网络到AI

1 月 2 日
阅读 8 分钟
1.6k
1. 定义 生物神经网络是由大量神经元(Neuron)通过突触(Synapse)相互连接而成的复杂信息处理系统。它是生物体神经系统的核心结构,负责接收外界刺激、处理信息、产生反应和控制行为。

YOLO 目标检测-模型训练-指标观察

2025-12-30
阅读 10 分钟
1.5k
1. 前言前面介绍训练时通过设置 plots=True参数, 在训练后不仅有数值指标,还能有可视化的结果,方便:快速定位数据集问题(labels.jpg、train_batch*.jpg)分析模型性能(results.png、confusion_matrix.png)直观查看预测效果(val_batch*_pred.jpg)生成的文件如下: {代码...} 文件名作用是否关键args.yaml记录本次...

记 Kafka Consumer 消息阻塞(2)

2025-12-14
阅读 2 分钟
1.4k
还是继那篇文章,提出要调大 max.partition.fetch.bytes、message.max.bytes 的参数值。但是不能调太大,调太大之后,同样带来新的问题。

YOLO 目标检测-模型训练

2025-12-07
阅读 24 分钟
2.2k
介绍过 YOLO 的背景、起源等知识后,今天就将如何使用 YOLO 进行 目标检测(Object Detection)。安装就不说了,ultralytics 官网 提供多种安装方式可选择。

YOLO 的背景介绍与起源

2025-12-06
阅读 4 分钟
1.9k
前面讲解了 PaddleOCR,都是基于 OCR(Optical Character Recognition,光学字符识别) 的技术。今天介绍 YOLO,是一种目标检测(Object Detection)算法。

PaddleOCR、RapidOCR和ONNX生态

2025-11-16
阅读 18 分钟
4.5k
VL模型确实好用,但在实际使用后也有很大的缺点。NLP 模型就已经很慢了, VL模型的推理速度更慢,token 费用还是 NLP模型的好几倍。很难在实际项目中大规模使用。

记 Kafka Consumer 消息阻塞(1)

2025-11-06
阅读 7 分钟
2.6k
1. 问题描述最近在接入一个新的埋点 Kafka Topic 后,遇到一个非常隐蔽的问题:新 Topic 一直消费不到消息;在公司 MQ 平台上查看 Topic,查不到消费组的注册信息;日志平台没有任何 Error 日志。消费端的逻辑是典型的主动拉取模式,由异步线程循环执行:poll() 拉取一批消息;事务处理(读取消息、执行脚本、写入存储)...

从 ReAct 到 Multi-Agent

2025-11-02
阅读 3 分钟
2.1k
在大语言模型(LLM)的浪潮下,“Agent”成为一个炙手可热的关键词。 所谓 LLM Agent,就是让语言模型不仅能对话,还能自主决策、调用工具、执行任务。过去两年,围绕 Agent 的研究涌现了多个经典框架:ReAct、Plan-Act-Reflect、Toolformer、Multi-Agent Collaboration 等。

LLM Agent 框架设计:Multi-Agent Collaboration

2025-11-02
阅读 12 分钟
10.4k
在早期的 LLM 应用中,很多系统采用单模型单任务的方式:一个大型语言模型(如 GPT-4、Claude)接收用户请求,然后直接生成结果。 这种方式的优点是简单,但缺点也明显:

LLM Agent 设计:记忆模块

2025-10-19
阅读 4 分钟
1.9k
1. 背景为了让 LLM 不只是一次性对话,而是能自主执行任务、与外部工具交互、保持上下文状态,人们提出了 LLM Agent 概念。真实世界任务往往不是一次性完成,需要多轮交互、跨会话处理,甚至长时间跟踪任务进度。为什么单纯的 LLM 不够原生的 LLM 通常只有短期上下文窗口(context window),在会话结束后不会记住用户信...

LLM Agent 框架设计:Toolformer

2025-10-19
阅读 3 分钟
2.8k
关于 LLM Agent 框架中,如何调用外部工具,之前有介绍 ReAct、Plan-Act-Reflect 的设计方案。这次介绍一种和前面完全不同的设计:Toolformer,特点是让 LLM 自己有调用外部工具的能力。

LLM Agent 框架设计:Plan-Act-Reflect

2025-10-12
阅读 15 分钟
1.9k
Plan-Act-Reflect 框架代表了LLM应用向更高层次智能迈进的方向。它通过引入:前瞻性的规划(Plan)有条理的执行(Act)至关重要的自我修正(Reflect)使得LLM能够处理那些不确定性高、路径长、易偏离目标的复杂任务。它将LLM从一个“反应式问题解决者”提升到了一个“主动式战略管理者”的高度,是构建真正自主和可靠的AI Ag...

LLM Agent 框架设计:ReAct

2025-10-12
阅读 12 分钟
2.4k
ReAct 是一个将 Reasoning(推理) 和 Acting(行动) 相结合的范式,旨在让 LLM 与外部工具(如搜索引擎、计算器、数据库、API等)进行交互,从而更可靠、更准确地解决任务。

了解Jdk 21

2025-08-03
阅读 9 分钟
3.7k
很多公司使用的 JDK 还停留在 JDK8,JDK8、JDK11、JDK17、JDK21 都是 LTS 版本。不想升级 JDK11、JDK17 的人,大多是觉得没有特别值得更新的新特性。但就算每个版本都是小迭代,经历了这么多版本了,JDK21 相较于 JDK8,也是有不少值得升级的闪光点。

ReAct框架实现:OpenAI Function Calling

2025-08-03
阅读 125 分钟
2.9k
可以理解为,ReAct 是 LLM Agent 的一种设计框架或范式,而 OpenAI Function Calling 是基于该设计范式的具体实现。

LLM Agent 框架设计:CoT思维链

2025-08-02
阅读 4 分钟
2.5k
思维链(Chain-of-Thought, CoT)是一种通过引导模型分步推理来提升复杂问题解决能力的提示技术。与直接提问相比,CoT要求模型生成中间推理步骤,模拟人类“逐步思考”的过程,从而更准确地推导出最终答案。

AI时代了解显卡的知识

2025-07-31
阅读 7 分钟
4.8k
并行计算能力: AI的核心运算(如矩阵乘法、卷积等)需要处理海量数据,而GPU的数千个计算核心(如NVIDIA CUDA核心)擅长并行计算,比CPU(通常几个到几十个核心)更适合加速这类任务。

向量数据库 - 索引

2025-07-17
阅读 6 分钟
2.3k
1. HNSW索引 分层可导航小世界1.1. 定义HNSW(Hierarchical Navigable Small World,分层可导航小世界)的核心思想是构建一个分层图结构:分层结构:每个数据点随机分配一个层级,层级越高的数据点越少。小世界图:每层是一个“邻接图”,每个点只和部分点相连,图结构保证“短路径”导航。导航:从高层开始,逐层向下搜索,...

向量数据库 - 度量方式

2025-07-17
阅读 6 分钟
1.8k
在向量数据库中,度量方式(Metric, Distance/Similarity Metric)指的是用于衡量两个向量之间“相似度”或“距离”的数学方法。

LLM RAG 流程

2025-07-17
阅读 5 分钟
1.4k
1. 大模型知识更新的痛点大模型的知识源于预训练阶段。通过大量的无监督数据,利用下一个词预测任务来完成训练。待训练完成之后,模型便能将大量的知识压缩到自身的参数中。然而,在互联网时代,知识更新迅速,导致大模型难以实时更新所蕴含的知识。由于存在知识更新问题,当询问模型一些训练语料截止日期之后的问题时,...

Java开发搭配Groovy

2024-10-30
阅读 15 分钟
3.1k
二者总需要妥协,Groovy、Python 这类脚本性语言提供了解法。底层Java平台功能不牵扯业务,尽量封装丰富的底层组件,一些业务性的逻辑都由脚本语言实现。

了解HTTP/2协议

2024-10-28
阅读 8 分钟
2.3k
HTTP/2(2015年发布)已经发布快10年了,云原生社区的RPC框架中,gRPC 是直接基于 HTTP/2 实现。Dubbo 框架的默认协议,也从原先基于 TCP协议 的 dubbo协议,换成基于 HTTP/1.1、HTTP/2的 triple协议。

gRPC - 在 Etcd 中的应用

2024-10-26
阅读 4 分钟
1.9k
Kubernetes:Kubernetes 的 API 服务器和其他组件(如 kubelet)之间的通信使用 gRPC 来实现高效的数据传输。

gRPC - 开发 2

2024-10-26
阅读 25 分钟
2.3k
ManagedChannel 是 gRPC 中用于管理客户端和服务器之间通信的核心组件。它负责连接的创建、管理、负载均衡、流量控制等功能。以下是 ManagedChannel 的主要功能和属性。

gRPC - 介绍与开发 1

2024-10-26
阅读 22 分钟
2.1k
gRPC 是一个高性能、开源的远程过程调用(RPC)框架,由 Google 开发。它旨在提供跨语言的通信能力,适用于从移动设备到数据中心服务器的各种环境。

常见序列化方式了解

2024-10-07
阅读 10 分钟
2.3k
网络传输过程中,选择不同的传输数据的序列化方式,对性能影响很大,尤其是高并发场景中。但至于选择一个什么样的序列化方式很重要,也不能一味只考虑性能,像 Dubbo协议中就支持多种可插拔的序列化库。

Apache HttpClient及其连接池使用

2024-10-06
阅读 13 分钟
6.7k
Apache HttpClient 是 Apache Software Foundation 旗下的一个开源项目,旨在为 Java 应用程序提供高效、可靠的 HTTP 客户端功能。它是 Apache HttpComponents 项目的一部分,该项目专注于创建和维护 HTTP 协议的组件。

OkHttp及其连接池使用

2024-10-06
阅读 12 分钟
7.9k
OkHttp 是一个由 Square 公司开发的高性能 HTTP 客户端库,专门为 Java 和 Android 应用程序设计。Square 是一家知名的金融科技公司,开发了多个流行的开源项目。OkHttp 的设计初衷是为了解决 Android 平台上原生 HTTP 客户端(如 HttpURLConnection)的某些局限性,特别是在处理连接管理和缓存等方面。

dubbo框架 - dubbo协议介绍

2024-10-05
阅读 14 分钟
2.1k
主要用于两个dubbo系统之间作远程调用,特别适合高并发、小数据的互联网场景。反之,Dubbo 协议不适合传送大数据量的服务,比如传文件,传视频等,除非请求量很低。

dubbo框架 - 服务消费者流程

2024-10-04
阅读 4 分钟
1.8k
1. 前言在 Dubbo 框架中,服务消费者通过 XML 配置方式引用服务时,涉及多个模块之间的协作。不放dubbo官方的设计图了,这里同样放一张自己画的服务消费者调用图,后面的介绍也是围绕这张图来的。以下是服务消费者引用服务时,各个模块之间的源码方法调用关系的详细说明。2. 简述过程在 dubbo-config-spring 项目模块中...