汀NLP - SegmentFault 思否

字节DeerFlow开源框架：多智能体深度研究框架，实现端到端自动化研究流程

5 月 12 日

阅读 9 分钟

700

DeerFlow（Deep Exploration and Efficient Research Flow）是一个社区驱动的深度研究框架，它建立在开源社区的杰出工作基础之上。目标是将语言模型与专业工具（如网络搜索、爬虫和Python代码执行）相结合.。

掌握Multi-Agent实践(一)：使用AgentScope实践入门和Workstation上手指南

汀丶

5 月 8 日

阅读 9 分钟

362

AgentScope是通义实验室开源的multi-agent编程框架，专为开发人员设计，提供了丰富的组件, 全面的文档和广泛的兼容性。同时，AgentScope Workstation提供了在线拖拉拽编程和在线小助手(copilot)功能，帮助开发者迅速上手！支持自定义的容错控制和重试机制，以提高应用程序的稳定性,支持以中心化的方式构建分布式多智能体...

掌握Multi-Agent实践（二）：基于AgentScope构建支持@机制的群聊系统,实现定向对话机制

汀丶

5 月 8 日

阅读 10 分钟

412

Qwen3强势来袭：推理力爆表、语言超百种、智能体协作领先，引领AI开源大模型

汀丶

4 月 29 日

阅读 12 分钟

871

1.Qwen3github：[链接]文档：[链接][链接][链接]最新版本Qwen3有以下特点：全尺寸稠密与混合专家模型：0.6B, 1.7B, 4B, 8B, 14B, 32B and 30B-A3B, 235B-A22BModels LayersHeads (Q / KV)Tie EmbeddingContext LengthQwen3-0.6B2816 / 8Yes 32KQwen3-1.7B 2816 / 8Yes 32KQwen3-4B3632 / 8&nbs...

Dify Agent 驱动轻量级 MCPserver：联动 Zapier 实现智能搜索高效数据流转

汀丶

4 月 14 日

阅读 7 分钟

556

MCP Server（模型上下文协议服务器）是一种基于模型上下文协议（Model Context Protocol，简称 MCP）构建的轻量级服务程序，旨在实现大型语言模型（LLM）与外部资源之间的高效、安全连接。MCP 协议由 Anthropic 公司于 2024 年 11 月开源，其核心目标是解决 AI 应用中数据分散、接口不统一等问题，为开发者提供标准化的...

RAG分块策略：主流方法（递归、jina-seg）+前沿推荐Meta-chunking、Late chunking

汀丶

2024-12-10

阅读 43 分钟

1.3k

大多数常用的数据分块方法（chunking）都是基于规则的，采用 fixed chunk size（译者注：将数据或文本按照固定的大小进行数据分块）或 overlap of adjacent chunks（译者注：让相邻的数据块具有重叠内容，确保信息不会丢失。）等技术。对于具有多个层级结构的文档，可以使用 Langchain 提供的 RecursiveCharacterTextSp...

RAG 系统高效检索提升秘籍：如何精准选择 BGE 智源、GTE 阿里与 Jina 等的嵌入与精排模型的完美搭配

汀丶

2024-11-17

阅读 17 分钟

1.1k

Text Embedding 榜单：MTEB、C-MTEB 《MTEB: Massive Text Embedding Benchmark(海量文本嵌入基准)》判断哪些文本嵌入模型效果较好，通常需要一个评估指标来进行比较，《MTEB: Massive Text Embedding Benchmark(海量文本嵌入基准)》就是一个海量文本嵌入模型的评估基准

机器学习、基础算法、python常见面试题必知必答系列大全：（面试问题持续更新）

汀丶

2024-10-27

阅读 4 分钟

9.4k

基础算法常见面试篇1.1 过拟合和欠拟合常见面试篇一、过拟合和欠拟合是什么？二、过拟合 / 高方差（overfiting / high variance）篇2.1 过拟合是什么及检验方法？2.2 导致过拟合的原因是什么？2.3 过拟合的解决方法是什么？三、欠拟合 / 高偏差（underfiting / high bias）篇3.1 欠拟合是什么及检验方法？3.2 导致欠...

LLMs 入门实战系列大全：LLMs应用、领域大模型介绍、大模型常见面经汇总

汀丶

2024-10-27

阅读 21 分钟

1.3k

[【ChatGLM2-6B 入门】清华大学开源中文版 ChatGLM-6B 模型学习与实战]论文名称：ChatGLM2-6B: An Open Bilingual Chat LLM | 开源双语对话语言模型

高级 RAG 技术：提升生成式 AI 系统输出质量与性能鲁棒性

汀丶

2024-10-26

阅读 10 分钟

860

检索增强生成（RAG）是一种强大的技术，它将信息检索与生成式 AI 相结合，以产生更准确、上下文更丰富的响应。本文将探讨 15 种高级 RAG 技术，以提高生成式 AI 系统的输出质量和整体性能的鲁棒性。这样做使本文能够测试和识别从预检索到生成的适当优化，本文所提到的优化点大多数基于下图的流程。

RAG系统评测实践详细版：Coze及相关产品评测对比，以及下一代RAG技术

汀丶

2024-10-08

阅读 17 分钟

1.6k

RAG（检索增强生成）是一种 AI 框架，它将传统信息检索系统（例如数据库）的优势与生成式大语言模型 (LLM) 的功能结合在一起，通过将这些额外的知识与自己的语言技能相结合，AI 可以撰写更准确、更具时效性且更贴合您的具体需求的文字。

NL2SQL之DB-GPT-Hub<详解篇>:text2sql任务的微调框架和基准对比

汀丶

2024-10-08

阅读 10 分钟

1.4k

随着生成式人工智能（Artificial Intelligence Generated Content，简写为 AIGC）时代的到来，使用大规模预训练语言模型（LLM）来进行 text2sql 任务的 sql 生成也越来越常见。基于 LLM 的 text2SQL 方法通常分为两种：

RAG+Agent人工智能平台：RAGflow实现GraphRA知识库问答，打造极致多模态问答与AI编排流体验

汀丶

2024-09-20

阅读 8 分钟

5.1k

RAG+Agent人工智能平台：RAGflow实现GraphRA知识库问答，打造极致多模态问答与AI编排流体验1.RAGflow简介最近更新：2024-09-13 增加知识库问答搜索模式。2024-09-09 在 Agent 中加入医疗问诊模板。2024-08-22 支持用RAG技术实现从自然语言到SQL语句的转换。2024-08-02 支持 GraphRAG 启发于 graphrag 和思维导图。2024-0...

赋能百业：多模态处理技术与大模型架构下的AI解决方案落地实践

汀丶

2024-09-12

阅读 6 分钟

659

实际应用中，这两种方案并不是要对立存在的，像永劫无间这种游戏的场景，用户要的是低延迟，无障碍交流。并且能够触发某些动作技能。这就非常适合使用成熟的 ASR 和 TTS 技术来负责音频的处理，而 LLM 就可以专门做用户意图的理解。

FastGPT一站式解决方案[1-部署篇]：轻松实现RAG-智能问答系统

汀丶

2024-09-11

阅读 18 分钟

1.6k

FastGPT是一个功能强大的平台，专注于知识库训练和自动化工作流程的编排。它提供了一个简单易用的可视化界面，支持自动数据预处理和基于Flow模块的工作流编排。FastGPT支持创建RAG系统，提供自动化工作流程等功能，使得构建和使用RAG系统变得简单，无需编写复杂代码。

从数据洞察到智能决策：合合信息&infiniflow RAG技术的实战案例分享

汀丶

2024-09-11

阅读 6 分钟

1.4k

标题取自 LLamaIndex，这个内容最早提出于今年 2 月份 LlamaIndex 官方博客。从 22 年 chatGpt 爆火，23 年大模型尝鲜，到 24 年真正用 AI 落地业务场景，业界普遍都发现了从 MVP 到 PMF 不是那么容易的，具体的原因有非常多，在 RAG 场景下，最主要的表现是企业的数据 _“垃圾进，垃圾出”_，如何利用好企业数据是提升 RA...

专业级语义搜索优化：利用 Cohere AI、BGE Re-Ranker 及 Jina Reranker 实现精准结果重排

汀丶

2024-09-03

阅读 21 分钟

2.4k

专业级语义搜索优化：利用 Cohere AI、BGE Re-Ranker 及 Jina Reranker 实现精准结果重排1. 简介1.1 RAG在说重排工具之前，我们要先了解一下 RAG。检索增强生成（RAG）是一种新兴的 AI 技术栈，通过为大型语言模型（LLM）提供额外的 “最新知识” 来增强其能力。基本的 RAG 应用包括四个关键技术组成部分：Embedding 模型...

从海量信息中脱颖而出：Workflow智能分析解决方案，大语言模型为AI科技文章打造精准摘要评分体系(总篇章)

汀丶

2024-08-22

阅读 17 分钟

该项目整合了编程、AI、产品设计、商业科技及个人成长等多领域的精华内容，源自顶尖技术企业和社群。借助先进语言模型技术，对精选文章进行高效摘要、专业评分及多语种翻译，实现了从初步评估到深入剖析，再到传播的全面自动化流程。通过引入Workflow平台，该项目显著提升了内容处理的速度与质量，为读者带来更加便捷、...

SearXNG与LLM强强联合：打造用户隐私保护的智能搜索解答流程，隐私无忧，搜索无忧

汀丶

2024-08-21

阅读 4 分钟

2.5k

SearXNG与LLM强强联合：打造用户隐私保护的智能搜索解答流程，隐私无忧，搜索无忧SearXNG 是一个免费的互联网元搜索引擎，整合了各种搜索服务的结果。用户不会被跟踪，也不会被分析。github地址:[链接]项目地址:[链接]公共实例:[链接]功能特性自托管，可以私有化部署没有用户跟踪/没有分析可以自定义设置脚本和 cookies...

Xinference实战指南：全面解析LLM大模型部署流程，加速AI项目落地进程

汀丶

2024-08-16

阅读 27 分钟

3.6k

Xorbits Inference (Xinference) 是一个开源平台，用于简化各种 AI 模型的运行和集成。借助 Xinference，您可以使用任何开源 LLM、嵌入模型和多模态模型在云端或本地环境中运行推理，并创建强大的 AI 应用。通过 Xorbits Inference，可以轻松地一键部署你自己的模型或内置的前沿开源模型

LLM大模型部署实战指南：Ollama简化流程，OpenLLM灵活部署，LocalAI本地优化，Dify赋能应用开发

汀丶

2024-08-14

阅读 12 分钟

3.9k

以下是其主要特点和功能概述：简化部署：Ollama 目标在于简化在 Docker 容器中部署大型语言模型的过程，使得非专业用户也能方便地管理和运行这些复杂的模型。

告别卡顿，畅享GitHub：国内开发者必看的五大加速访问与下载技巧

汀丶

2024-08-13

阅读 4 分钟

本文介绍了五种加速在国内访问和下载 GitHub 的方法，包括：使用 Gitee 平台加速克隆代码、修改 hosts 文件、使用油猴脚本、通过在线镜像站点、以及使用 FastGithub 等加速工具。

无缝融入，即刻智能：Dify大模型平台，零编码集成第三方系统，42K+星标见证专属智能方案

汀丶

2024-08-12

阅读 19 分钟

2.3k

Dify，一款引领未来的开源大语言模型（LLM）应用开发平台，革新性地融合了后端即服务(Backend as a Service,BaaS）与LLMOps的精髓，为开发者铺设了一条从创意原型到高效生产的快车道。其设计旨在打破技术壁垒，让非技术背景的用户也能轻松参与至AI应用的构思与数据运营之中，共同塑造智能未来。

告别Hugging Face模型下载难题：掌握高效下载策略，畅享无缝开发体验

汀丶

2024-08-08

阅读 5 分钟

3.8k

告别Hugging Face模型下载难题：掌握高效下载策略，畅享无缝开发体验Huggingface国内开源镜像：[链接] 里面总结了很多下载的方法，下面进行一一讲解方法一：网页下载在模型主页的Files and Version中中可以获取文件的下载链接。无需登录直接点击下载，还可以复制下载链接，用其他下载工具下载。方法二：huggingface-cli(...

无缝融入，即刻智能[1]：MaxKB知识库问答系统，零编码嵌入第三方业务系统，定制专属智能方案，用户满意度飙升

汀丶

2024-08-02

阅读 10 分钟

1.2k

飞致云是中国领先的开源软件公司。飞致云旗下开源产品包括 1Panel 开源面板、JumpServer 开源堡垒机、DataEase 开源数据可视化分析工具、MeterSphere 开源测试工具、Halo 开源建站工具、MaxKB 开源知识库问答系统等，涵盖运维面板、运维审计、BI 分析、软件测试、CMS 建站、知识库问答等多个领域。飞致云旗下的开源项目...

RAG+AI工作流+Agent：LLM框架该如何选择，全面对比MaxKB、Dify、FastGPT、RagFlow

汀丶

2024-07-30

阅读 10 分钟

15.6k

MaxKB = Max Knowledge Base，是一款基于 LLM 大语言模型的开源知识库问答系统，旨在成为企业的最强大脑。它能够帮助企业高效地管理知识，并提供智能问答功能。想象一下，你有一个虚拟助手，可以回答各种关于公司内部知识的问题，无论是政策、流程，还是技术文档，MaxKB 都能快速准确地给出答案:比如公司内网如何访问、...

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

汀丶

2024-07-25

阅读 13 分钟

6.1k

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐Agent是以大模型为核心的智能体，通过与用户对话的形式，来完成各种任务，它很像一个“人”。如果和人做类比，它应该具备以下能力：Agent的各个要素各个子模块：1.对话式Agent1.1 月之暗面(Moonshot AI)-Kimi官方：[链接]Kimi 作为月之暗面科技有限...

国内大模型LLM选择以及主流大模型快速使用教程[GLM4/Qwen/Baichuan/Coze/Kimi]

汀丶

2024-07-19

阅读 13 分钟

1.2k

国内大模型LLM选择以及主流大模型快速使用教程[GLM4/Qwen/Baichuan/Coze/Kimi]0. 大模型选择司南测评结果：SuperCLue测评结果：自2023年5月以来，全球及中国国内的大模型技术均展现出了强劲的发展势头，尤其是以GPT系列为代表的海外顶尖模型，历经了从GPT3.5到GPT4、GPT4-Turbo乃至GPT4o的多次迭代飞跃，持续推动AI技术...

初识langchain：LLM大模型+Langchain实战[qwen2.1、GLM-4]+Prompt工程

汀丶

2024-07-19

阅读 26 分钟

3.3k

初识langchain：LLM大模型+Langchain实战[qwen2.1、GLM-4]+Prompt工程1.大模型基础知识大模型三大重点：算力、数据、算法，ReAct （reason推理+act行动）--思维链Langchain会把上述流程串起来，通过chain把多个算法模型串联起来Langchain的 I/O系统，负责输入输出管理【文件形式加载提示词】LangChain优势简化开发流程：...

透视开源生态，OSGraph——GitHub全域数据图谱的智能洞察工具

汀丶

2024-07-10

阅读 6 分钟

503

OSGraph (Open Source Graph) 是一个开源图谱关系洞察工具，基于GitHub开源数据全域图谱，实现开发者行为、项目社区生态的分析洞察。可以为开发者、项目Owner、开源布道师、社区运营等提供简洁直观的开源数据视图，帮助你和你的项目制作专属的开源名片、寻求契合的开发伙伴、挖掘深度的社区价值。