7

AI芯片.jpeg

技术编辑:宗恩丨发自 SiFou NewOffice
SegmentFault 思否报道丨公众号:SegmentFault


随着人工智能技术的发展,数据、算力和算法三大牵动人工智能进步的关键因素愈加凸显。而这三大要素中算力和算法都离不开芯片。传统的 CPU 早已远远不能满足 AI 技术的发展需要,GPU 又因为能耗过高等问题饱受诟病,FPGA 和 ASIC 等芯片的相继推出一定程度上缓解了算力不足的问题,但 AI 芯片领域还有非常大的进步空间。

AI 芯片是什么?

AI 芯片最简单的定义就是从事人工智能算法计算的芯片,目前这些人工智能算法一般是深度学习算法,或者是一些机器视觉和机器学习算法。

它也被称为 AI 加速器或计算卡,即专门用于处理人工智能应用中的大量计算任务的模块。目前 AI 芯片主要分为 GPU、FPGA和ASIC。

AI芯片的发展历程

加州理工学院 Carver Mead 最早开始了 AI 芯片的研究,在 20世纪 80年代开始研究神经拟态系统(neuromorphic electronic systems),利用模拟电路模仿生物神经系统结构。

2007 年以前 AI技术发展对芯片还没有特别强烈的需求,通用的 CPU 芯片即可提供足够的计算能力。2007 年 ,英伟达开发出统一计算架 CUDA,研究人员透过 CUDA 可以轻松使用 C 语言开发 GPU ,使得 GPU 具有方便的编程环境可以直接编写程序。

2008 年,英伟达推出 Tegra 芯片 ,作为最早的可用于人工智能领域的 GPU ,如今已成为英伟达最重要的 AI 芯片之一 ,主要用于智能驾驶领域。

之后由于视频、游戏、图片设计制作等产业的快速发展,GPU 芯片取得迅速的发展。因为 GPU 有更多的逻辑运算单元用于处理数据,属于高并行结构,在处理图形数据和复杂算法方面比 CPU 更有优势,又因为 AI 深度学习的模型参数多、数据规模大、计算量大,此后一段时间内 GPU 代替了 CPU,成为当时 AI 芯片的主流。

进入 2010 年后,云计算广泛推广,人工智能的研究人员可以通过云计算借助大量 CPU 和 GPU 进行混合运算,事实上今天人工智能主要的计算平台还是云计算。

但人工智能业界对于计算能力的要求不断快速地提升,因此进入 2015 年后,业界开始研发针对人工智能的专用芯片,通过更好的硬件和芯片架构,在计算效率上进一步带来 10 倍的提升。

2016 年 ,Google 发表 TensorFlow 框架设计的 TPU 芯片 ,而同年 ,采用 TPU 架构的 AlphaGo 出现 ,并击败人类世界冠军棋士李世石。

2017 年 ,华为麒麟 970 成为首个手机 AI 芯片。

AI芯片的分类

AI 芯片发展方向分类:

  • 一个方向是继续延续经典的冯 · 诺依曼计算架构 ,以加速计算能力为发展目标,主要分为并行加速计算的 GPU、半定制化的 FPGA、全定制化的 ASIC。
  • 另一个方向就是颠覆传统的冯 · 诺依曼计算架构 ,采用基于类脑神经结构的神经拟态芯片来解决算力问题。

AI芯片从技术架构分类:

  • 通用性芯片(GPU):GPU(Graphics Processing Unit)是专门用来处理图形图像相关的处理器,与 CPU 相比 GPU 处理的数据类型单一,因为运算与 AI 相似以及容易组成大的集群,所以进行 AI 运算时在性能、功耗等很多方面远远优于 CPU,经常被拿来处理AI运算。
  • 半定制化芯片(FPGA):FPGA(Field Programmable Gate Array)是一直可编程的半定制芯片,其与 GPU 一样具有并行处理优势,并且也可以设计成具有多内核的形态,当然其最大的优势还是在于其可编程的特性。这也意味着用户可以根据需要的逻辑功能对电路进行快速烧录。即使是出厂后的成品FPGA的逻辑块和连接,用户无需改变硬件,就可通过升级软件来配置这些芯片来实现自定义硬件功能。
  • 全定制化芯片(ASIC):ASIC(Application-Specific Ingrated Circuit)芯片的计算能力和计算效率都直接根据特定的算法的需要进行定制的,所以其可以实现体积小、功耗低、高可靠性、保密性强、计算性能高、计算效率高等优势。所以,在其所针对的特定的应用领域,ASIC 芯片的能效表现要远超 CPU、GPU 等通用型芯片以及半定制的FPGA。
  • 类脑芯片:架构是一款模拟人脑的新型芯片编程架构,这一系统可以模拟人脑功能进行感知、行为和思考,简单来讲,就是复制人类大脑。

AI 芯片部署位置分类:

  • 云端,即数据中心,在深度学习的训练阶段需要极大的数据量和大运算量,单一处理器无法独立完成,因此训练环节只能在云端实现。
  • 终端,即手机、安防摄像头、汽车、智能家居设备、各种 IoT 设备等执行边缘计算的智能设备。终端的数量庞大,而且需求差异较大。

AI 芯片以设计理念进行分类

  • 第一类是「AI 加速芯片」,它是确定性地加速某类特定的算法或任务,从而达到目标应用领域对速度、功耗、内存占用和部署成本等方面的要求。目前,AI 加速芯片的研发有两种主要的方式:一种是利用已有的 GPU、众核处理器、DSP、FPGA 芯片来做软硬件优化;另一种是设计专用的芯片,也就是 ASIC。
  • 第二类是「智能芯片」,它让芯片像人一样能使用不同的AI算法进行学习和推导,处理包含感知、理解、分析、决策和行动的一系列任务,并且具有适应场景变化的能力。目前,面向综合、自适应能力的智能芯片研究有两类设计方法,一种是基于类脑计算的「神经拟态芯片」;另一种是基于可重构计算的「软件定义芯片」。

AI 芯片承担职能分类:

  • 训练(training)环境通常需要通过大量的数据输入,训练出一个复杂的深度神经网络模型。训练过程由于涉及海量的训练数据和复杂的深度神经网络结构,需要的计算规模非常庞大,通常需要 GPU 集群训练几天甚至数周的时间,在训练环节 GPU 目前暂时扮演着难以轻易替代的角色。
  • 推断(inference)环节指利用训练好的模型,使用新的数据去“推断”出各种结论,如视频监控设备通过后台的深度神经网络模型,判断一张抓拍到的人脸是否属于黑名单。虽然推断环节的计算量相比训练环节少,但仍然涉及大量的矩阵运算。在推断环节,除了使用 CPU 或 GPU 进行运算外, FPGA 以及 ASIC 均能发挥重大作用。

AI芯片的优势?

相对于通用芯片,AI 算法在 AI 芯片上运行的速度更快,效率更高、功耗更低,并且能够为图像识别、视觉识别、语音识别、自动驾驶等不同的 AI 算法提供更高性价比的算力支持。

GPU 比 CPU 有更多的逻辑运算单元(ALU)(图片来自网络,版权属于作者)

然而 GPU 毕竟只是图形处理器,不是专门用于 AI 深度学习的芯片,自然存在不足,比如在执行 AI 应用时,其并行结构的性能无法充分发挥,导致能耗高。

与此同时,AI 技术的应用日益增长,在教育、医疗、无人驾驶等领域都能看到 AI 的身影。然而 GPU 芯片过高的能耗无法满足产业的需求,因此取而代之的是 FPGA 芯片,和 ASIC 芯片。

如何了解一个AI芯片

那么当我们面对一个全新的 AI 芯片时,可以从以下几个方面去了解:

1、应用领域。这个 AI 芯片是属于云端还是终端。

2、架构。它是一个 SoC,还是一个专门的 NPU,不同组合意味着芯片本身的复杂度不同以及产品定位不同。

3、运行效率。AI 芯片必然是要运行 AI 算法,效率能够达到多少,不同深度模型的结构对算力的要求也不一样,对芯片本身的设计也是不一样的。

4、价格和功耗。芯片也是一种商品,必然涉及到价格问题。而功耗跟你的应用场景有关,你是用在智能设备还是用在手机,或者用在云端,这些功耗要求完全不一样。

AI芯片的发展与未来

根据 Gartner 的预测数据 ,未来 5 年内全球人工智能芯片市场规模将呈飙升趋势 ,自 2018 年的 42.7 亿美元 ,升高至 343 亿美元 ,增长已超过 7 倍,可见 AI 芯片市场有较大增长空间。

对于中国 AI 芯片市场 ,根据中国信通院的数据报告 ,中国的人工智能市场规模在 2018 年超过 300 亿人民币 ,而 2019 年后将超过 500 亿人民币。

市场年度增长率 ,将从 2017 年的 52.8%上升至 2018 年的 56.3% ,随后逐年下降 ,在 2020 年降至 42.0%。其 中 ,2017 年芯片销售额占人工智能市场规模的 22% ,约 47.7 亿人民币。

针对国产 AI 芯片的发展,中国工程院院士倪光南表示:「芯片设计门槛极高,只有极少数企业能够承受中高端芯片研发成本,这也制约了芯片领域创新。我国可以借鉴开源软件成功经验,降低创新门槛,提高企业自主能力,发展国产开源芯片。」

中国的人工智能芯片正在崛起

来自 2019 年 8 月 19 日美国发布的报告《Who Is Winning the AI Race: China, the EU or the United States?》中显示:

尽管中国在超级计算机方面与美国竞争,但它已经开始显示出它有可能快速缩短与美国在半导体领域的差距,至少在人工智能芯片方面是这样的。 在过去两年中,几家中国 AI 芯片初创企业已获得至少 1 亿美元的资金。一些专家认为,与在整个半导体市场上相比,中国在人工智能芯片市场上的竞争优势更大。

例如,为机器人开发人工智能芯片的 Horizo​​n Robotics 在 2018年 的 B 轮融资中获得了 6 亿美元的投资,该轮融资由世界领先的韩国半导体公司 SK Hynix 牵头。

同样,最初开发用于比特币采矿的芯片的比特大陆,已经开发了一种人工智能芯片,并在 2017 年至 2018 年期间获得了近 7.65 亿美元的资金。最后,Cambricon Technologies,在 2016 年开发了世界上第一台用于手机的商业深度学习处理器,在 2018 年获得了由中国政府支持的国家开发投资公司提供的 100 万美元。

此外,包括百度,腾讯,阿里巴巴和华为在内的几家中国领先的技术公司正在开发 AI 优化的集成电路,美国的大型技术公司也正在这样做。华为-特别是在设计方面表现出了非凡的实力-苹果公司是第一家制造使用 7 纳米(nm)工艺技术的智能手机处理器的公司,该技术指的是处理器中晶体管的尺寸。较小的晶体管比较大的晶体管更有效地使用功率,并增加了处理器中晶体管的潜在数量,从而使其潜在地更强大。

这些事态发展并不能保证中国短期内超越美国。毕竟,中国的进步是相对较新的,并未转化为 AI 芯片的稳定市场份额。例如,比特大陆 2018 年上半年收入的 0.1% 来自与加密无关的业务。

相比之下,数十年来,许多西方半导体公司一直在设计处理器和培养工程人才。确实,中国官方机构表示中国在 AI 芯片上竞争的最佳机会是开发专门的 AI 芯片,并且希望这些芯片对 AI 的重要性比在 Nvidia 主导下的 GPU 更为重要。

美国公司也在开发专门的 AI 芯片,例如 Google 的 Tensor 处理单元和 Luminous Computing 的光学微芯片,后者使用不同颜色的光来移动数据。尽管如此,中国资金雄厚的AI芯片初创企业的发展和芯片设计的进步表明,它有能力弥合至少与美国的差距。

给中国的建议

几家中国 AI 芯片初创公司最近获得了数亿美元的资金,华为等公司也开发了令人印象深刻的芯片设计。尽管如此,芯片开发的复杂性,中国人才的短缺以及缺乏多家全球销售排名前 15 位的中国半导体公司的情况表明,中国仍需要取得重大进展,才能在半导体领域与美国匹敌。

教育部门应与大学合作开发以教授 AI 芯片设计为重点的 AI 工程课程和学位课程。根据工业和信息化部的数据,到 2030 年,中国至少需要 40 万以上的人才才能实现其半导体行业领先的目标。

国内 AI 芯片公司及近况

  • 比特大陆:

比特大陆成立于 2013 年,在 2020 年 1 月 9 日胡润研究院发布《2019 胡润中国 500 强民营企业》中比特大陆以市值 300 亿元位列第 246 位。

比特大陆在 2015 年底开始启动造芯计划,由有着清华大学和中国科学院学术背景,以及多年从事集成电路设计工作经验的詹克团主要负责。而毕业于北京大学心理学和经济学双学位的吴忌寒则主攻比特币,

去年 10 月 29 日,吴忌寒发布全体员工内部信,宣布解除比特大陆总经理詹克团在比特大陆的一切职务。比特大陆内部的争斗被公布于世。

11 月 7 日,詹克团在朋友圈发文,称自己在因公出差、毫不知情的情况下“被更换法定代表人”,被曾经最信任的“兄弟”背后狠狠捅刀,并表示将拿起法律武器,重回比特大陆。

时间沉寂了半年之久后,5 月 8 日,詹克团在北京市海淀区政务服务中心领取法人为詹克团的北京比特大陆公司营业执照时,被一窝涌入的人群当场抢走营业执照。

  • 寒武纪

寒武纪成立于 2016 年,2020 年 1 月 9 日,胡润研究院发布《2019 胡润中国 500 强民营企业》,寒武纪科技以市值 160 亿元位列第 443 位。

5 月 7 日晚间,人工智能芯片公司寒武纪交出了对上交所首轮审核问询的答卷。

寒武纪的这份答卷涵盖发行人股权结构、业务、核心技术、财务信息、风险揭示及其他事项等 6 个方面的问题。

其中,寒武纪对“IP 授权业务 2019 年收入大幅下滑的原因”、“当前自有资金足以覆盖在研项目及募投项目资金需求的情况下,本次发行募集资金的必要性”等 20 多个问题一一作了答复。

  • 地平线

地平线成立于 2015 年 6 月,地平线作为专注于智能驾驶的 AI 芯片独角兽,近年来在芯片研发和商业落地上取得了诸多进展。

2020 年 1 月地平线 Matrix2 自动驾驶计算平台在 CES 2020 上正式发布。2020 年 3 月,搭载地平线车规级 AI 芯片征程二代的长安汽车 UNI-T 发布,计划于今年 6 月正式量产上市,届时征程二代将成为首个上车量产的国产 AI 芯片。

  • 龙加智

龙加智创立于 2017 年 7 月,由挚信资本和翊翎资本领投,是一家专注于云端芯片的 AI 初创公司,致力于研发 TPU 芯片。其核心团队来自与美国硅谷。

被美国媒体誉为 2020 年前十名顶级 AI 方案供应商,龙加智的方案提供了端到端的应用加速,而不仅仅是 AI 计算这一个环节。其灵活的编程性使其能应未来 AI 的变化。

参考报告《谁在AI竞赛中获胜:中国,欧盟还是美国?》:
https://www.datainnovation.or...

参考文章:
https://www.toutiao.com/a6669...

参考文章:
https://baijiahao.baidu.com/s...

参考文章:
http://m.elecfans.com/article...


宗恩
2.9k 声望55 粉丝

关注新科技


引用和评论

0 条评论