2025年3月25日,曦智科技正式发布全新光电混合计算卡“曦智天枢”。曦智科技创始人兼首席执行官沈亦晨博士在发布现场表示:“曦智天枢首次实现了光电混合计算在复杂商业化模型中的应用,是曦智科技光电混合算力技术在产品化和商业化进程中的重要突破。我们坚信,光电混合将会为人工智能、大语言模型、智能制造等领域带来算力革新。”
天枢是一款深度融合光芯片与电芯片各自优势特点,并采用了3D先进封装技术的可编程光电混合计算卡。该产品在光电集成度、光子矩阵规模、精度、可编程性等方面较前代产品实现了明显性能提升。天枢在支持科学计算(如伊辛算法)基础上,加强了对于ResNet50等商业算法应用的支持,在保持光计算优势的基础上,大幅提升了产品通用适配性。
曦智科技光电混合计算卡“曦智天枢”
2021年12月,曦智科技首次对外发布光电混合计算产品,成功验证了光电混合计算在特定算法下,相较于主流GPU数百倍的速度优势。今天曦智天枢的问世,代表光电混合技术已在产品实现方面取得了巨大跨越。
天枢采用非相干架构,这种设计不仅易于系统扩展,还具备出色的抗干扰能力和更高的计算精度。天枢的核心处理器由光学处理单元(OPU)和电学专用集成电路(ASIC)组成,光芯片和电芯片通过3D先进封装技术协同工作,主频速率1GHz,输出精度8bit;其中光芯片面积达到600平方毫米,较上一代芯片提升3倍;光芯片上的器件数量超四万个,器件尺寸进一步缩小,集成度显著提升;天枢最大可支持128×128矩阵规模,是上一代芯片的4倍,运算能力和灵活性双重提升;用户通过API自由配置计算矩阵系数,使天枢拥有了更强的适应性和优化空间。
光子计算是一种被动运算,运算任务在光通过光子矩阵的过程中即可完成,它颠覆了传统CMOS电子芯片的运算逻辑。光子芯片的性能提升与光子矩阵规模、主频速率和波长数量等参数相关,而不依赖晶体管的密度及芯片制程的提升。曦智科技首席技术官孟怀宇博士在发布会上首次对外提出了等效光算力(EOPP:Effective Optical Processing Power)标准。这是一个考虑了矩阵规模、输出精度、权重刷新速度等的综合算力评价方法,相比当前主流的电芯片指标计算方法,更符合光计算的原理和特点。“光电混合计算是未来的算力趋势,我们希望业界对于光子计算的算力能够拥有一个更客观的衡量标准”,孟怀宇博士表示。
为实现光电芯片间的高效集成,天枢采用光电混合3D TSV(Through Silicon Via,硅通孔)+ FlipChip(倒装芯片)封装技术。TSV的运用显著降低了光电芯片间的传输延迟,并提升了信号完整性和散热性能,同时能够节省芯片面积,为芯片设计提供更高的灵活性。孟怀宇博士表示:“曦智科技自创立之初就看到封装对于光电集成的重要性并不断努力攻克技术难关,TSV的成功落地解决了传统封装技术的瓶颈,其价值和意义是惠及整个光电混合产业的。”
在软件方面,天枢搭载了曦智光电混合计算软件栈,其算子库包含RVV(RiscV Vector)算子,电矩阵(dMAC)加速算子,光矩阵(oMAC)加速算子, 支持CV类和LLM类模型,以及non-AI算子,如Ising,LineSolver等。用户借助曦智编译器,可以灵活地运用这些算子来构建高效的应用模型。此外,平台还支持用户自定义算子,通过OpenCL C/C++语言进行编译和优化,进一步扩展了算法开发的灵活性。
曦智科技光电混合计算卡“曦智天枢”
曦智科技的软件栈与主流框架如Pytorch和ONNX深度集成,客户可以通过软件栈直接使用天枢的光矩阵和电矩阵加速单元对模型和算法进行加速和验证,也可以将模型通过曦智编译框架编译部署在端侧进行推理。通过软件栈,天枢成功运行了深度卷积神经网络模型ResNet50及AI大语言模型LlaMA 2,首次实现了光电混合计算在商业化场景中的应用。
曦智科技首席运营官王泷表示:“天枢的背后,是曦智科技硅光、数字、模拟、封装、系统、软件等团队协同的成果,我们希望有更多的开发者和生态伙伴,通过天枢和我们一起探索光电混合算力更广阔的应用场景,向着光电混合算力商业化的方向共同前行。”
曦智科技已启动下一代光电混合计算产品的研发,曦智科技创始人兼首席执行官沈亦晨博士表示:“未来产品将会进一步提升计算能力,以支持更为复杂的商业化应用场景,为人工智能、算力中心提供新型算力支撑。”
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。