英伟达推出RTX聊天，一款本地运行的AI聊天机器人 - SegmentFault 思否

英伟达推出RTX聊天，一款本地运行的AI聊天机器人

发布于 2024-02-16

NVIDIA 推出 Chat with RTX：本地化个性化聊天机器人体验

NVIDIA 推出了 Chat with RTX，这是一款允许用户构建个性化聊天机器人体验的应用程序。与许多基于云的解决方案不同，Chat with RTX 完全在本地 Windows PC 或工作站上运行，提供了更高的数据隐私和控制权。

主要功能与创新

本地化运行：
- Chat with RTX 完全在本地设备上运行，无需依赖云存储，确保用户数据的隐私和安全。
个性化训练：
- 用户可以使用自己的数据（如文档、笔记、YouTube 视频转录等）训练大型语言模型，从而创建符合个人需求和知识库的定制化聊天机器人。
技术支持：
- 应用采用了 检索增强生成（RAG）、TensorRT-LLM 和 RTX 加速 等先进技术，能够快速、准确地响应用户查询，并从个性化数据集中高效检索相关信息。
广泛的文件格式支持：
- 支持多种文件格式，包括文本、PDF、DOC/DOCX 和 XML，确保与不同类型的内容兼容。
- 还支持 YouTube 视频转录，进一步扩展训练数据的来源。
开发者工具：
- 基于开源的 TensorRT-LLM RAG 开发者参考项目，开发者可以利用 Chat with RTX 构建自定义的 RAG 应用程序，充分发挥 RTX 加速的潜力。

社区反响

开发者社区对 Chat with RTX 的反应积极。例如，Gradio（用于构建机器学习模型用户界面的工具包）在社交平台上表达了兴奋之情，并提到可以结合 NVIDIA 和 Gradio 在本地探索 RAG 技术。

使用方法

Chat with RTX 类似于一个带有 Python 实例的 Web 服务器。用户下载后，需要单独下载 Mistral 或 Llama 2 模型，然后使用用户提供的数据进行训练。

总结

Chat with RTX 是一款功能强大的本地化聊天机器人工具，特别适合注重数据隐私和个性化需求的用户。通过支持多种数据格式和先进的技术架构，它为用户和开发者提供了灵活且高效的语言模型交互体验。

NVIDIA Unveils Chat with RTX, a Locally Run AI Chatbot

https://www.infoq.com/news/2024/02/nvidia-chat-rtx-generative-ai/

阅读 8

0 条评论

评论支持部分 Markdown 语法：**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用 @ 来通知其他用户。