人工智能Momodel - SegmentFault 思否

中国首个Sora级视频大模型Vidu震撼发布

2024-04-29

阅读 1 分钟

495

北京时间2024年4月27日，在2024中关村论坛年会未来人工智能先锋论坛上，清华大学联合生数科技27日正式发布中国首个长时长、高一致性、高动态性视频大模型——Vidu。该模型采用团队原创的Diffusion与Transformer融合的架构U-ViT，支持一键生成长达16秒、分辨率高达1080P的高清视频内容。Vidu具备复杂的动态镜头生成能力，不...

值得收藏！面试必备！不容错过的30+ 大语言模型面试问题及答案

2024-04-22

阅读 10 分钟

1.3k

大语言模型（LLMs）现在在数据科学、生成式人工智能（GenAI，即一种借助机器自动产生新信息的技术）和人工智能领域越来越重要。这些复杂的算法提升了人类的技能，并在诸多行业中推动了效率和创新性的提升。近年来，大语言模型的发展飞速，在复杂数据分析和自然语言处理等任务中得到了广泛的应用。在那些由技术驱动的行业...

人工智能学习软件--「Mo卡片」APP上线了!

2024-04-19

阅读 1 分钟

309

浙江大学荣获教育部“人工智能+高等教育”案例

2024-04-19

阅读 2 分钟

574

近日，教育部高等教育司公布首批18个“人工智能+高等教育”应用场景典型案例，浙江大学计算机学院等单位合作完成的《新一代科教平台(“智海平台”)赋能知识点微课程教育》案例成功入选。

首批！18个“人工智能+高等教育”应用场景典型案例

2024-04-18

阅读 1 分钟

690

为深入贯彻落实国家关于开展“人工智能+”行动的战略部署，积极推动高等教育与人工智能技术的融合发展，利用智能技术支撑人才培养模式的创新、教学方法的改革、教育治理能力的提升，教育部高等教育司组织了首批“人工智能+高等教育”典型应用场景案例的征集和论证工作，寻找、发掘和推广在人工智能技术应用上具有代表性、前...

ColBERT——以词元级别的向量嵌入提升信息检索效果

2024-04-16

阅读 9 分钟

2k

检索增强一代（RAG）自成立以来就风靡全球。RAG 是大型语言模型（LLM）提供或生成准确和事实答案所必需的。我们通过RAG解决LLM的事实性，我们尝试为LLM提供一个与用户查询上下文相似的上下文，以便LLM将处理此上下文并生成事实正确的响应。我们通过以向量嵌入的形式表示我们的数据和用户查询并执行余弦相似性来做到...

速看！生成式人工智能时代的 10+ 新工作，有你想从事的吗？

2024-04-10

阅读 4 分钟

940

生成式人工智能一直是 21 世纪的热门话题。OpenAI 的 ChatGPT、Google Gemini、Microsoft Copilot 等工具引起了大家的关注，并引发了人工智能和自然语言处理领域的创新浪潮。GenAI时代领导者的持续发展和投资，在AI研究、软件开发、数据工程、AI伦理等领域创造了就业机会。它为寻求在技术创新前沿做出贡献的个人提供了令...

使用 LangChain 的 LangGraph 构建 AI 编码代理

2024-04-01

阅读 11 分钟

1.5k

使用 AI 编码代理的应用程序激增。随着 LLM 质量的提高和推理成本的降低，构建有能力的 AI 代理只会变得越来越容易。最重要的是，工具生态系统正在迅速发展，使得构建复杂的 AI 编码代理变得更加容易。Langchain框架一直是这方面的领导者。它拥有创建生产就绪型 AI 应用程序所需的所有工具和技术。

Suno AI：现在任何人都可以创作所有类型的音乐

2024-03-28

阅读 3 分钟

737

你有没有想过你可以把你的创造力引导到写歌上，但很难找到合适的词或旋律？由于人工智能技术的最新进步，现在有一些工具可以帮助激发你的歌曲创作灵感，并通过有用的建议指导你完成整个过程。其中一种工具是 Suno AI，这是一款 AI 歌曲创作助手，旨在让新手和经验丰富的音乐家都更容易进行歌曲创作。使用 Suno，您可以输...

谷歌人工智能提前 5 天预测河流洪水

2024-03-26

阅读 3 分钟

752

洪水对流量及网络稀疏的发展中国家的影响尤为严重，这凸显了准确预警的必要性。气候变化导致的洪灾加速发生，凸显了建立有效预警系统的紧迫性，特别是在低收入和中等收入国家，那里有90%的脆弱人口居住。根据世界银行的数据，将发展中国家的洪水预警系统升级为制定标准，平均每年可以挽救23,000人的生命。然而，挑战依然...

足球中的人工智能？利物浦足球俱乐部使用 DeepMind 的 TacticAI 进行高冲击力的角球

2024-03-22

阅读 4 分钟

875

从医疗保健到零售，从银行到物流，从娱乐到制造业，人工智能与各个领域的整合是革命性的。它的影响延伸到体育领域，颂扬了创新和优化的新时代。在主教练尤尔根·克洛普（Jürgen Klopp）的领导下，利物浦足球俱乐部通过与DeepMind合作开发TacticAI，采用了最先进的人工智能技术。这位创新的助理教练分析和优化角球战术。利...

如何使用 Gemma LLM？

2024-03-20

阅读 8 分钟

680

大型语言模型（LLM）正日益成为理解和生成人类语言的强大工具。这些模型在不同的自然语言处理任务上取得了最先进的结果，包括文本摘要、机器翻译、问答和对话生成。法学硕士甚至在更专业的领域显示出前景，如医疗保健、金融和法律。

英伟达推出 Blackwell B200 GPU，这是“世界上最强大的人工智能芯片”

2024-03-19

阅读 3 分钟

697

英伟达必备的H100 AI芯片使其成为一家价值数万亿美元的公司，其价值可能比Alphabet和亚马逊还要高，竞争对手一直在努力追赶。但也许英伟达即将扩大其领先优势——凭借新的 Blackwell B200 GPU 和 GB200“超级芯片”。英伟达首席执行官黄仁勋（Jensen Huang）在左边举起他的新GPU，右边是GTC直播中的H100。图片来源： Nvidia

Grok 的 xAI 开源基础模型，但没有任何训练代码

2024-03-18

阅读 2 分钟

572

埃隆·马斯克（Elon Musk）的xAI已经开源了Grok AI模型的基本代码，但没有任何训练代码。该公司在GitHub上将其描述为“3140亿参数的专家混合模型”。在一篇博客文章中，xAI 表示，该模型没有针对任何特定应用进行调整，例如将其用于对话。该公司指出，Grok-1是在“自定义”堆栈上训练的，但没有具体说明细节。该模型根据 Apac...

Anthropic 的 Claude AI 的提示技术

2024-03-16

阅读 4 分钟

482

像 Anthropic 的 Claude AI 这样的大型语言模型（LLM）领域在创造性文本生成、信息问答和任务自动化方面具有巨大的潜力。但是，解锁这些模型的全部功能需要有效的用户交互。这就是提示艺术发挥作用的地方。提示允许用户提供清晰、简洁的说明，指导 Claude 的响应。它是人类意图和 LLM 执行之间的桥梁，确保 Claude 利...

在 WordPress 中使用 AI 改善 SEO 的 10 种方法

2024-03-14

阅读 3 分钟

760

搜索引擎优化（SEO）是确保 WordPress 网站在数字世界中取得成功和知名度的基石。获得顶级搜索引擎排名对于吸引自然流量至关重要，因为数以百万计的网站都在争夺用户的注意力。由于人工智能（AI），SEO 技术正在发生重大变化。由于人工智能驱动的工具和算法可以改善用户体验、内容和关键字，搜索引擎的网站优化正在发...

智海Mo 平台与 Datawhale 携手浙江大学，共襄 AI+X 高校行！

2024-03-12

阅读 2 分钟

1.1k

2024年3月9日，一场以"AI+X 高校行"为主题的活动在浙江大学成功举办。本次活动由 Datawhale 与杭州市人工智能学会主办，浙江大学人工智能研究所、浙江大学控制科学与工程学院联合主办，浙江大学学生人工智能协会承办，趋动云、人民邮电出版社、OpenI 启智、智海Mo 协办。

使用 LLAMA 2 AI 制作社交媒体的实践指南

2024-03-12

阅读 8 分钟

672

在快速发展的数字时代，社交媒体是沟通和参与的重要渠道。在不断涌现的在线内容中，要想脱颖而出，就必须创造出真正吸引观众的引人入胜的作品。进入 LLAMA 2 AI——一个技术奇迹，有望重新定义社交媒体平台上的内容创作。LLAMA 2 AI 是一个富有远见的概念，通过突破性的技术进步推进自然语言处理。它使用大型语言模型和转...

Claude 3 登场：颠覆 GPT-4 的新智能时代到底强在哪里？

2024-03-12

阅读 3 分钟

1k

3月4日晚，Anthropic（著名生成式AI平台）正式在其官网发布了 Claude 3系列的多模态大模型。Claude注册网址：[链接]Claude 3 一共设置了三种不同定位的模型，根据能力从弱到强排列分别是Haiku、Sonnet、Opus；Haiku 的核心竞争力在于其惊人的速度和响应能力，是最轻便迅速的版本。在处理一篇包含 10 万个数据标记的 arXi...

LangChain：自动化大型语言模型（LLM）评估

2024-01-30

阅读 12 分钟

1.3k

大型语言模型（LLM）以其生成人类质量文本、翻译语言、总结内容和回答复杂问题的能力吸引了世界。突出的例子包括 OpenAI 的 GPT-3.5、谷歌的 Gemini、Meta 的 Llama2 等。随着 LLM 变得越来越强大和复杂，衡量基于 LLM 的应用程序性能的重要性也越来越大。评估 LLM 对于确保它们在各种 NLP 应用程序中的性能、可靠性和...

生成式 AI 如何重塑动画的景观？

2024-01-30

阅读 5 分钟

865

动画一直是一种迷人的艺术形式，通过运动的魔力将角色和故事带入生活。多年来，技术进步彻底改变了动画行业，现在，生成式人工智能正在成为中心舞台。生成式人工智能是指使用人工智能算法来创建原创和独特的内容。在动画领域，这项技术正在重塑景观，提供新的可能性并突破创造力的界限。

Solar 10.7B：将其性能与其他值得注意的 LLM 进行比较

2024-01-23

阅读 8 分钟

1.5k

Transformer 和大型语言模型在自然语言处理（NLP）领域被引入后风靡全球。自成立以来，该领域一直在快速发展，通过创新和研究使这些 LLM 更加高效。其中包括 LoRA（Low-Rank Adaption）、Flash Attention、Quantization 以及最近著名的 LLM 的合并方法。在本指南中，我们将介绍一种合并 Upstage AI 引入的 LLM （Solar...

使用 llamafiles 简化 LLM 执行

2024-01-22

阅读 8 分钟

1.3k

引言运行大型语言模型一直是一个繁琐的过程。必须下载一组第三方软件来加载这些 LLM，或者下载 Python 并通过下载大量 Pytorch 和 HuggingFace 库来创建环境。如果通过 Pythonic 方法，则必须完成编写代码才能下载和运行模型的过程。本指南将介绍运行这些 LLM 的更简单方法。

混合专家方法在大语言模型（LLM）开发中的应用是什么？

2024-01-17

阅读 2 分钟

863

介绍随着语言模型开发的不断发展，我们发布了一篇开创性的论文——Mixtral 8x7B 论文。该模型仅在一个月前发布，通过引入一种新颖的架构范式，即“混合专家”（MoE）方法，引发了人们的兴奋。与大多数语言模型（LLM）的策略不同，Mixtral 8x7B 是该领域的一个引人入胜的发展。

探索 LLM 和 BERT 在语言任务中的应用

2024-01-16

阅读 9 分钟

1.1k

在快速发展的人工智能领域，尤其是在 NLP 领域，大型语言模型（LLM）迅速改变了与技术的交互。自 2017 年开创性的“注意力就是你所需要的一切”论文以来，Transformer 架构（尤其是以 ChatGPT 为例）已成为关键。GPT-3 就是一个典型的例子，它擅长生成连贯的文本。本文探讨了如何通过预训练、微调和提示将 LLM 与 BERT ...

探索MPT-7B/30B：开源LLM技术的最新突破

2024-01-15

阅读 3 分钟

672

介绍在机器学习中开发开源库和框架已经彻底改变了我们处理和实现各种算法和模型的方式。这些开源工具提供了具有成本效益的解决方案，并促进了社区内的协作和创新。本文将介绍两个新的开源库 MPT-7B 和 MPT-30B，并探讨它们的特性、功能和应用。

印度的人工智能飞跃: 印度建造的6个LLM

2024-01-10

阅读 4 分钟

894

在大鹰科技的世界里，全球巨头通常引领着人工智能竞赛，印度正在采取一些令人兴奋的行动。一个由印度制造的大型语言模型（LLM）和人工智能工具组成的全新世界开始闪耀，每种工具都有其独特的天赋。我们来到这里是为了让这些当地英雄们成为聚光灯下的焦点，展示他们酷炫的个性和突破性的进步。

苹果秘密推出其首个开源LLM，Ferret

2024-01-09

阅读 1 分钟

720

苹果公司悄悄推出了Ferret，这是其首款开源多模式大型语言模型（LLM），这标志着其与传统秘密方法的重大背离。Ferret与哥伦比亚大学合作开发，将语言理解与图像分析在各个领域具有开创性的应用前景。这一战略举措反映了苹果致力于在快速发展的多模式人工智能领域保持领先地位。

这就是人工智能如何赋能游戏行业🎮！

2024-01-09

阅读 4 分钟

799

介绍随着人工智能（AI）技术的融合，游戏行业发生了巨大的变革。人工智能彻底改变了游戏的开发、玩和体验方式。从增强游戏玩法到影响游戏设计和故事讲述，人工智能已经成为游戏生态系统不可或缺的一部分。让我们探讨人工智能对视频游戏的影响，并深入探讨人工智能在改变游戏行业中的各个方面的作用。来源：Reddit我认为...

探索 CNN 中的逐点卷积：替换全连接层

2024-01-03

阅读 7 分钟

1.3k

卷积神经网络 ( CNN ) 一直是理解图像和模式、改变深度学习格局的关键角色。这个旅程从 Yan 介绍 LeNet 架构开始，今天，我们有一系列 CNN 可供选择。传统上，这些网络严重依赖于完全连接的层，尤其是在将事物分类为不同类别时。但是等等，空气中有变化。我们正在探索一种使用 Pointwise Convolution 的不同架构，这是一...

1

1