汀NLP - SegmentFault 思否

NL2SQL进阶系列(1)：DB-GPT-Hub、SQLcoder、Text2SQL开源应用实践详解

汀丶

2024-04-12

阅读 12 分钟

1.2k

[NL2SQL基础系列(1)：业界顶尖排行榜、权威测评数据集及LLM大模型（Spider vs BIRD）全面对比优劣分析[Text2SQL、Text2DSL]]([链接])

NL2SQL基础系列(2)：主流大模型与微调方法精选集，Text2SQL经典算法技术回顾七年发展脉络梳理

汀丶

2024-04-10

阅读 9 分钟

1.4k

Text-to-SQL（或者Text2SQL），顾名思义就是把文本转化为SQL语言，更学术一点的定义是：把数据库领域下的自然语言（Natural Language，NL）问题，转化为在关系型数据库中可以执行的结构化询语言（Structured Query Language，SQL），因此Text-to-SQL也可以被简写为NL2SQL。输入：自然语言问题，比如“查询表t_user的相关...

NL2SQL基础系列(1)：业界顶尖排行榜、权威测评数据集及LLM大模型（Spider vs BIRD）全面对比优劣分析

汀丶

2024-04-10

阅读 10 分钟

2.1k

大模型落地实战指南：从选择到训练，深度解析显卡选型、模型训练技、模型选择巧及AI未来展望—打造AI应用新篇章

汀丶

2024-03-26

阅读 6 分钟

在1950年代初期，人们开始尝试使用计算机处理自然语言文本。然而，由于当时的计算机处理能力非常有限，很难处理自然语言中的复杂语法和语义。随着技术的发展，自然语言处理领域在20世纪60年代和70年代取得了一些重要的进展。例如，1970年，美国宾夕法尼亚大学的Adele Goldberg和David Robson创建了一个名为Lunenfeld Pro...

面向中文大模型价值观的评估与对齐研究：“给AI的100瓶毒药”并解毒，守护AI纯净之心

汀丶

2024-03-25

阅读 14 分钟

983

随着Large Language Models（LLMs）的快速发展，越来越多的人开始担心它们可能带来风险。因此，围绕大模型的“安全与对齐”方向得到了极大的关注。本文和大家分享一些我们在这个方向的工作。

Prompt工程全攻略：15+Prompt框架一网打尽（BROKE、COAST、LangGPT）、学会提示词让大模型更高效

汀丶

2024-03-25

阅读 14 分钟

12.1k

[大语言模型的预训练[3]之Prompt Learning：Prompt Engineering、Answer engineering、Multi-prompt learning详情]([链接])

Prompt进阶系列5:LangGPT(提示链Prompt Chain)--提升模型鲁棒性

汀丶

2024-03-22

阅读 22 分钟

1.1k

随着对大模型的应用实践的深入，许多大模型的使用者， Prompt 创作者对大模型的应用越来越得心应手。和 Prompt 有关的各种学习资料，各种优质内容也不断涌现。关于 Prompt 的实践的不断深入，大家对 Prompt 的认知也越来越深入。但同时也发现许多朋友在 prompt 创作，使用大模型能力过程中仍然存在许多误区。

Prompt进阶系列4:LangGPT(构建高性能Prompt实践指南)--结构化Prompt

汀丶

2024-03-22

阅读 16 分钟

884

结构化的思想很普遍，结构化内容也很普遍，我们日常写作的文章，看到的书籍都在使用标题、子标题、段落、句子等语法结构。结构化 Prompt 的思想通俗点来说就是像写文章一样写 Prompt。

Prompt进阶3:LangGPT(构建高性能质量Prompt策略和技巧2)--稳定高质量文案生成器

汀丶

2024-03-13

阅读 12 分钟

919

Prompt进阶3:LangGPT(构建高性能质量Prompt策略和技巧2)--稳定高质量文案生成器1.LangGPT介绍现有 Prompt 创建方法有如下缺点：缺乏系统性：大多是细碎的规则，技巧，严重依赖个人经验缺乏灵活性：对他人分享的优质 prompt 进行调整需要直接修改 prompt 内容缺乏交互友好性：优质 prompt 的配置和使用太复杂，有时往往还...

Prompt进阶2:LangGPT(构建高性能Prompt策略和技巧)--最佳实践指南

汀丶

2024-03-13

阅读 6 分钟

912

左图右图 prompt 基本是一样的，差别只在提示工程这个词是否用中英文表达。我们看到，一词之差，回答质量天壤之别。为了获得理想的模型结果，我们需要调整设计提示词，这也就是所谓的提示工程。

Prompt进阶系列1:LangGPT(从编程语言反思LLM的结构化可复用提示设计框架)

汀丶

2024-03-08

阅读 9 分钟

836

大语言模型 (Large Language Models, LLMs) 在不同领域都表现出了优异的性能。然而，对于非AI专家来说，制定高质量的提示来引导 LLMs 是目前AI应用领域的一项重要挑战。现有的提示工程研究已经提出了一些零散的优化原则，也有些研究设计了基于经验的提示优化器。然而，这些研究缺乏结构化的设计模板，学习成本高，可复用...

结构化思维助力Prompt创作：专业化技术讲解和实践案例

汀丶

2024-03-04

阅读 13 分钟

916

对比什么技巧都不用, 直接像使用搜索引擎一样提问, 上面的技巧对于回复的效果确实有着明显提升. 在看了 N 多的所谓 “必看的 Prompt 10 大技巧” “ Prompt” 后, 发现大家都在上面这些技巧上打转. 一场机遇在 Github 上看到了 JushBJJ/Mr.-Ranedeer-AI-Tutor , 才发现原来 Prompt 还可以这样写: 原来可以在运行中调整各种...

智能咖啡厅助手：人形机器人 +融合大模型，行为驱动的智能咖啡厅机器人

汀丶

2024-03-01

阅读 6 分钟

1.2k

“机器人大模型与具身智能挑战赛”的参赛作品。的目标是结合前沿的大模型技术和具身智能技术，开发能在模拟的咖啡厅场景中承担服务员角色并自主完成各种具身任务的智能机器人。这里是的参赛作品《基于大模型和行为树和生成式具身智能体》的机器人控制端代码。

AI与人类联手，智能排序人类决策：RLHF标注工具打造协同标注新纪元，重塑AI训练体验

汀丶

2024-02-27

阅读 2 分钟

584

RLHF 标注工具是一个简单易用的，可以在大模型进行 RLHF（基于人类反馈的强化学习）标注排序的工具，旨在帮助用户在友好的图形界面中对生成式模型生成的答案进行排序标注。

医疗大模型：数据+知识双轮驱动实现医学推理、医患问答、病历自动生成、临床决策，为未来医疗服务提供全新可能性

汀丶

2024-02-23

阅读 7 分钟

1.4k

目前大多数开源的ChatLLM项目使用的是其他模型（如：ChatGPT）生成的指令数据，其不可避免的存在数据幻想的问题，数据幻想问题将严重影响LLM在实际场景中的应用和拓展。因此，本项目为了提高医疗领域的知识问答的准确性，使用如下方式构造指令数据集：

跨越千年医学对话：用AI技术解锁中医古籍知识，构建能够精准问答的智能语言模型，成就专业级古籍解读助手（LLAMA）

汀丶

2024-02-22

阅读 6 分钟

699

介绍：首先在 Ziya-LLaMA-13B-V1基线模型的基础上加入中医教材、中医各类网站数据等语料库，训练出一个具有中医知识理解力的预训练语言模型（pre-trained model），之后在此基础上通过海量的中医古籍指令对话数据及通用指令数据进行有监督微调（SFT），使得模型具备中医古籍知识问答能力。

探秘SuperCLUE-Safety：为中文大模型打造的多轮对抗安全新框架

汀丶

2024-02-21

阅读 7 分钟

1.1k

进入2023年以来，ChatGPT的成功带动了国内大模型的快速发展，从通用大模型、垂直领域大模型到Agent智能体等多领域的发展。但是生成式大模型生成内容具有一定的不可控性，输出的内容并不总是可靠、安全和负责任的。比如当用户不良诱导或恶意输入的时候，模型可能产生一些不合适的内容，甚至是价值观倾向错误的内容。这些...

Sora文生视频模型深度剖析：全网独家指南，洞悉98%关键信息，纯干货

汀丶

2024-02-20

阅读 8 分钟

2.3k

Sora文生视频模型深度剖析：全网独家指南，洞悉98%关键信息，纯干货Sora是一个以视频生成为核心的多能力模型，具备以下能力：文/图生成视频视频生成视频1分钟超长高质量视频生成视频裂变多视角生成准工业级数字孪生游戏/科幻片等特效，物理引擎能力1.Sora 与 Runway Gen2、Pika 等能力差异对比能力项OpenAl Sora其它模型...

探索AI视频生成新纪元：文生视频Sora VS RunwayML、Pika及StableVideo——谁将引领未来

汀丶

2024-02-19

阅读 10 分钟

1.1k

由于在AI生成视频的时长上成功突破到一分钟，再加上演示视频的高度逼真和高质量，Sora立刻引起了轰动。在Sora横空出世之前，Runway一直被视为AI生成视频的默认选择，尤其是自去年11月推出第二代模型以来，Runway还被称为“AI视频界的MidJourney”。第二代模型Gen-2不仅解决了第一代AI生成视频中每帧之间连贯性过低的问题，...

基于BiLSTM-CRF模型的分词、词性标注、信息抽取任务的详解，侧重模型推导细化以及LAC分词实践

汀丶

2024-02-05

阅读 19 分钟

1.2k

GRU（Gate Recurrent Unit）门控循环单元，是[循环神经网络]（RNN）的变种种，与 LSTM 类似通过门控单元解决 RNN 中不能长期记忆和反向传播中的梯度等问题。与 LSTM 相比，GRU 内部的网络架构较为简单。

英伟达系列显卡大解析B100、H200、L40S、A100、H100、V100如何选择，含架构技术和性能对比带你解决疑惑

汀丶

2024-01-29

阅读 11 分钟

4.4k

近期，AIGC领域呈现出一片繁荣景象，其背后离不开强大算力的支持。以ChatGPT为例，其高效的运行依赖于一台由微软投资建造的超级计算机。这台超级计算机配备了数万个NVIDIA A100 GPU，并利用60多个数据中心的数十万个GPU辅助，为ChatGPT提供了强大的算力支持。这种规模的算力部署不仅体现了AIGC技术的先进性，也预示着人...

知识图谱之图数据库如何选型：知识图谱存储与图数据库总结、主流图数据库对比

汀丶

2024-01-26

阅读 11 分钟

1.1k

知识图谱之图数据库如何选型：知识图谱存储与图数据库总结、主流图数据库对比（JanusGraph、HugeGraph、Neo4j、Dgraph、NebulaGraph、Tugrapg）图数据库每月排名 1.知识图谱1.1 KG简单知识点数据模型知识图谱的两种主流数据模型（数据的结构、操作和约束）:RDF 图模型和属性图模型数据模型特性数据模型特性RDF 图模型属...

搜索推荐DeepFM算法详解：算法原理、代码实现、比赛实战

汀丶

2024-01-26

阅读 14 分钟

893

1、Deepfm 的原理，DeepFM 是一个模型还是代表了一类模型，DeepFM 对 FM 做了什么样的改进，FM 的公式如何化简并求解梯度（滴滴） 2、FM、DeepFM 介绍一下（猫眼） 3、DeepFm 模型介绍一下（一点资讯） 4、DeepFM 介绍下 & FM 推导（一点资讯）

NLP国内外大模型汇总列表[文心一言、智谱、百川、星火、通义千问、盘古等等]

汀丶

2024-01-25

阅读 6 分钟

809

NLP国内外大模型汇总列表[文心一言、智谱、百川、星火、通义千问、盘古等等]中国大模型列表大全，全面收集有明确来源的大模型情况，包括机构、来源信息和分类等，随时更新。Awesome family related to LLMS includes:[链接][链接][链接]大模型相关的Awesome系列包括：大模型评测数据集：[链接]中国大模型列表：[链接]开...

QAnything本地知识库问答系统：基于检索增强生成式应用（RAG）两阶段检索、支持海量数据、跨语种问答

汀丶

2024-01-22

阅读 8 分钟

1.8k

QAnything (Question and Answer based on Anything) 是致力于支持任意格式文件或数据库的本地知识库问答系统，可断网安装使用。

深入理解TF-IDF、BM25算法与BM25变种：揭秘信息检索的核心原理与应用

汀丶

2024-01-08

阅读 12 分钟

1.4k

在信息检索, 文本挖掘和自然语言处理领域, IF-IDF 这个名字, 从它在 20 世纪 70 年代初被发明, 已名震江湖近半个世纪而不曾衰歇. 它表示的简单性, 应用的有效性, 使得它成为不同文本处理任务文本特征权重表示的首选方案. 如果要评选一个 NLP 领域最难以被忘记的公式, 我想, TF-IDF 应该是无可争议的第一和唯一. 虽然在以...

玩转字词句魔法：打造超强样本集的数据增强策略，句式变换揭秘同义句生成与回译在数据增强中的创新应用

汀丶

2023-12-18

阅读 14 分钟

752

OpenHowNet API由清华大学自然语言处理实验室（THUNLP）开发，提供方便的义原信息查询、义原树展示、基于义原的词相似度计算等功能。网站体验词语义原在线查询和展示功能。

Nougat：结合光学神经网络，引领学术PDF文档的智能解析、挖掘学术论文PDF的价值

汀丶

2023-12-13

阅读 5 分钟

986

Nougat：结合光学神经网络，引领学术PDF文档的智能解析、挖掘学术论文PDF的价值这是Nougat的官方存储库，Nougat是一种学术文档PDF解析器，可以理解LaTeX数学和表格。Project page: [链接]1.安装From pip: {代码...} From repository: {代码...} Note, on Windows: If you want to utilize a GPU, make sure you first in...

GPTs prompts灵感库：创意无限，专业级创作指南，打造吸睛之作的秘诀

汀丶

2023-12-13

阅读 12 分钟

718

GPTs prompts灵感库：创意无限，专业级创作指南，打造吸睛之作的秘诀优质prompt展示1.1 极简翻译中英文转换 {代码...} 1.2 完蛋，我被美女包围了(AI同人)哦no，我该喜欢哪个呢 {代码...} 1.3 科技文章翻译将科技文章、论文翻译成简体中文。 {代码...} {意译结果} {代码...} 1.4 游戏创建仙侠MUD {代码...} 1.5 广告文案...

聊天记录年度报告一览无余：轻松多格式导出永久保存，深度智能分析

汀丶

2023-12-12

阅读 5 分钟

916

一个用于提取微信聊天记录的工具，支持将聊天记录导出成HTML、Word、CSV文档，以实现永久保存。此外，该工具还具有对聊天记录进行分析的功能，可以生成年度聊天报告，帮助用户更好地了解和回顾与他人的沟通。是一款强大的微信聊天管理工具