印度的人工智能飞跃: 印度建造的6个LLM

介绍

在大鹰科技的世界里，全球巨头通常引领着人工智能竞赛，印度正在采取一些令人兴奋的行动。一个由印度制造的大型语言模型（LLM）和人工智能工具组成的全新世界开始闪耀，每种工具都有其独特的天赋。我们来到这里是为了让这些当地英雄们成为聚光灯下的焦点，展示他们酷炫的个性和突破性的进步。

准备好冒险进入印度人工智能创造的多样性和动态世界了吗？让我们深入了解是什么让这些印度LLM和AI工具不仅智能，而且真正非凡。系好安全带——我们即将踏上一段激动人心的旅程，进入印度人工智能创新的核心！

目录
● OpenHathi公司
● 塔米尔-拉马
● 克鲁特里姆
● Indus项目
● 巴什尼语
● CoRover.ai公司

OpenHathi公司
塔米尔-拉马克鲁特里姆Indus项目巴什尼语CoRover.ai公司OpenHathi公司OpenHathi在印地语中的意思是“大象”，它不仅是一个大型的语言模型，也是印度语言在人工智能领域日益强大的象征。这个由Sarvam AI开发的7B参数模型是OpenHathi系列的第一个版本，旨在为印度市场的各种应用程序提供支持。作为第一个公开的印地语大型语言模型（LLM），OpenHathi代表了印度人工智能发展的关键时刻。

主要功能双语培训：OpenHathi在培训期间不仅利用了印地语数据，还利用了英语和兴式英语数据，增强了其跨两种语言的理解和生成能力。自定义标记：一个具有16K印地语词汇的独特句段标记器与Llama2标记器相结合，大大减少了印地语文本的标记化开销。分阶段培训：该模型经历了三个阶段的培训过程：第1阶段：使用低级适配器进行双语文本翻译，促进跨语言理解。第二阶段：使用低级适配器进行双语下一代预测，支持生成上下文软件语言。第三阶段：监督对特定任务的内部数据集进行微调，调整模型处理不同应用程序的能力。开放源代码可访问性：第二阶段之后的OpenHathi基础模型通过HuggingFace公开，允许开发人员和研究人员根据其特定需求和任务对其进行微调。跨语言潜能：OpenHathi的双语培训为跨语言翻译、信息检索和其他需要印地语和英语无缝交互的任务的潜在应用打开了大门。

塔米尔-拉马
Tamil-LLAMA是专门为泰米尔语设计的尖端大型语言模型。它由Abhinand Balachandran开发，建立在LLaMA模型的基础上，但显著增强了其处理泰米尔语文本的能力。

主要功能增强的词汇：该模型在原有的32000个标记的基础上扩展了词汇量，增加了16000个泰米尔语专用标记，使泰米尔语的处理更加精细和准确。高效培训：利用LoRA方法，Tamil-LLAMA在保持模型鲁棒性的同时实现了最佳训练效率。多种变体：有四种变体：泰米尔语LLaMA 7B、13B、7B指令和14B指令。每个变量都提供不同的参数大小和微调方法，以满足不同的需求和计算资源。使用聚焦数据集进行微调：为了进一步完善其泰米尔语理解和生成能力，该模型使用泰米尔文翻译版本的Alpaca数据集和OpenOrca数据集的子集进行了额外的培训，这些数据集是专门为泰米尔语任务选择的。开源可用性：代码、模型和数据集都是公开的，有助于泰米尔语处理的进一步研究和开发。总的来说，泰米尔语LLAMA代表着泰米尔文人工智能领域的一次重大飞跃。它结合了增强的词汇、高效的培训方法、重点微调和开放源码可访问性，使其成为研究人员、开发人员、，以及任何有兴趣在泰米尔语应用程序中利用人工智能的力量的人。

克鲁特里姆
Krutrim是Ola集团的一项雄心勃勃的计划，旨在彻底改变印度及其他地区的人工智能环境。它不仅是另一个模型，而且是一个综合模型AI计算堆栈旨在为个人、企业和研究人员提供跨领域的能力。

关键支柱AI计算基础设施：克鲁特里姆设想建立硬件和软件基础设施，为下一代人工智能应用程序提供动力。这包括高性能计算资源、专用AI加速器和高效云基础设施。AI云：Krutrim的云平台将为开发人员和研究人员提供对人工智能工具和资源的轻松访问，使他们能够在不需要大量硬件投资的情况下构建和部署人工智能应用程序。基础模型：Krutrim正在开发一套大型语言模型、语音识别系统和计算机视觉模型，专门针对印度市场及其多样的语言和文化差异而定制。这些模型将为构建各种AI应用程序提供基础。AI动力终端应用：Krutrim的最终目标是在医疗、教育、农业和金融等各个领域创建实用且有影响力的人工智能应用程序。这些应用程序将旨在满足印度及其多样化人口的具体需求。

Indus项目
Tech Mahindra刚刚推出了一个非常酷的项目，名为“印度工程”（project Indus），该项目旨在让计算机理解印地语及其多种方言！它处于语言技术开创性倡议的前沿，开发了一个由人工智能支持的纯印地语大型语言模型（LLM）。该模型以其巨大的规模而著名，包括5.39亿个参数和大量印地语及其方言的100亿个标记。该项目的雄心勃勃的目标是建立一个开放源码LLM，旨在革新语言技术并满足世界四分之一人口的需求。这项努力将创建广泛的语言库，为农村金融、零售和物流等部门带来巨大利益，从而促进印度的增长。

印度河项目的初始阶段侧重于印地语及其37种方言，为未来的扩展奠定了坚实的基础。随着时间的推移，该项目将纳入更多的语言和方言，扩大其范围和影响。Tech Mahindra的这一举措不仅仅是一项技术进步；这是朝着消除语言障碍和在全球范围内培养包容性迈出的一步。它已设置为beta测试，您可以在此处贡献：https://www.projectindus.in/en/

巴什尼语
Bhashini是印度政府的一项里程碑式倡议，它是解决印度国内数字鸿沟的有力答案。它的重点超越了简单开发大型语言模型（LLM）的范围。相反，Bhashini代表了一个全面、多方面的项目，旨在使互联网和数字服务在各种印度语言之间的访问民主化。

Bhashini涵盖了多种语言技术项目，LLM开发是其中的一个关键要素。这种整体方法超越了个别语言，寻求在技术和印度丰富的语言遗产之间建立桥梁。通过打破语言障碍，巴希尼设想了一个数字包容性不仅是一个承诺，而且是每个公民的现实生活的未来。巴希尼的核心在于坚信语言多样性不应成为数字授权的障碍。通过各种项目，它寻求将印度不同的语言与尖端技术无缝融合。这种献身精神反映了对促进更具包容性的数字环境的深刻承诺，确保全国各地的个人能够访问和利用数字世界的全部潜力。虽然仍处于测试阶段，但Bhashini应用程序标志着该项目进程中的一个重要里程碑。可在两者上下载苹果商店和Google Play商店，该应用程序提供了对巴希尼变革潜力的一瞥。随着该项目的发展和扩大，预计其影响将跨越各个领域，从教育和医疗到治理和经济发展。巴希尼在弥合数字鸿沟方面具有不可否认的潜力。其长期有效性取决于无障碍、技术发展和政府支持等因素。尽管面临挑战，Bhashini雄心勃勃的愿景为数字时代语言多样性的未来带来了希望。

CoRover.ai公司
CoRover作为人工智能行业的一家突破性企业脱颖而出，拥有世界上第一个以人为中心、提供最高投资回报率的对话式和生成式人工智能平台。该平台采用了安全、可扩展和可靠的专利申请技术，包括AI、ML、NLP、AR和VR。它的产品种类繁多，具有AI VideoBot、VoiceBot和ChatBot的多格式功能，并提供100多种语言的多语言支持，以满足超过10亿用户的需求。CoRover的一个关键功能是其视频语音商务虚拟助理，支持完整的交易流程，包括支付。

该平台通过BharatGPT进一步扩展了其功能，BharatGPT是其专有的用于文本、语音和视频的Generative AI，它还集成了使用ChatGPT的选项。CoRover的使命是彻底改变用户与系统的交互，使其像与智能人士对话一样直观。该公司的创新步伐赢得了全球领导人的赞扬，如微软的萨蒂亚·纳德拉（Satya Nadella）和印度总理纳伦德拉·莫迪（Narendra Modi），该公司与众多《财富》100强企业合作，在人工智能领域产生了重大影响。

结论
当我们在印度人工智能创新这一充满活力和鼓舞人心的领域走到旅程的尽头时，停下来，向引领这场非凡革命的杰出人才和团队鼓掌是至关重要的。从Sarvam AI与OpenHathi的创新走廊，到Tamil-LLAMA背后的创意思维，从Krutrim的Ola小组的富有远见的思想家到Indus项目的tech Mahindra的技术先驱，以及支持Bhashini的敬业官员，每一位都为这一丰富的技术和变革叙事做出了巨大贡献。虽然并非所有这些项目都是严格意义上的LLM，但由于它们对该领域的重大贡献，将它们纳入其中至关重要。他们的独特之处，从多语言能力到特定领域的专业知识，反映了对印度多方面语言景观的深刻理解。然而，这个故事正在不断地展开，可能还有一些章节尚未被讲述。如果你知道这里没有提到的其他印度LLM或类似的变革性项目，让我们一起丰富这个故事。在下面的评论中分享您的见解，让我们一起庆祝印度充满活力的人工智能景观的全谱，在这个景观中，无论大小的每一项创新都在塑造一个技术包容性和文化丰富的未来方面发挥着至关重要的作用。
文章来源：https://www.analyticsvidhya.com/blog/2023/12/llms-that-are-bu...

印度的人工智能飞跃: 印度建造的6个LLM

Momodel

引用和评论

中国首个Sora级视频大模型Vidu震撼发布

一文掌握 MCP 上下文协议：从理论到实践

AI Agent爆火后，MCP协议为什么如此重要！

AdventureX 2025 正式启动：五天四夜，120小时极限创造！一起在杭州点燃青年创新之火！

MCP 协议为何不如你想象的安全？从技术专家视角解读

🔥吐血整理 Bolt.diy 部署与应用攻略

常见的 AI 模型格式