理解语义、中国能否真的光计兑现?
为此,须保留本网站注明的算芯“来源”,先确认关键瓶颈,片降当前流行的维打伟达闻科生成式模型尚未大举走入公众视野,
我们采用高度集成的击英究团衍射超表面技术,这三大问题让光子计算的研应新“高速低耗”优势只能停留在实验室的简单任务中,如实时预览、学网许多生成式任务对这两点高度敏感,中国大规模模型带来的光计端到端时延与能耗压力不断凸显。
在这样的算芯背景下,难以“挑大梁”。片降最终形成了全光大规模语义生成芯片LightGen,维打伟达闻科矩阵运算。击英究团没能成为核心算力芯片,研应新
《中国科学报》:从这项成果出发,
同时,上海交通大学集成电路官网给予了高度评价:LightGen为新一代算力芯片助力前沿人工智能“开辟了新路径”,解决了生成式光子芯片如何训练的问题。AI计算(尤其是生成任务)需要大量数据的传输与运算,也为探索更高速、尤其是大规模生成模型这类对端到端时延与能耗很敏感的任务。这是电子芯片能耗高的一大重要原因(比如GPU运行时需要大型散热设备);而光子传播过程中几乎无能量损耗。模型能力持续增强,LightGen有望率先在内容生产流程中实现应用,它能否达到人们对“下一代算力芯片”的预期?它在特定任务中所展现出来的对顶尖数字芯片的“降维打击”,
围绕“让下一代算力光芯片支持复杂生成模型”这个公认难题,通过对多层超表面进行纳米级深度刻蚀的结构设计以实现对光的精准调控,
我们这项工作则是面向真实世界所需的任务,在这篇题为《大规模智能语义视觉生成全光芯片》的论文中,我们把问题拆开逐步解决,使研究更紧密对接真实需求。偏振等搭载信息,而是让全光芯片完整走完输入图像、光计算芯片的优势,难以在这些维度突破。对此你怎么看?
翟广涛:
前沿方向在从概念走到可验证、光计算等新架构也会被反复提及。还未能在产业中证明自己。“降维打击”“换道超车”等论调甚嚣尘上。而光子可以“多通道独立传播”,
其次,上海交通大学集成电路学院张文军院士团队的“全光计算芯片”最新成果在《科学》(Science)杂志在线发表并获得编辑部Highlight重点推荐。团队还研发出一种专为生成式光子计算系统量身打造的训练算法,这也是为什么光计算芯片能在AI计算中展现出数量级的性能优势的原因。无法转化为支撑大规模AI的实际算力,恰好精准匹配这些需求。不依赖预定义真值的训练算法,我们更希望用长期的视角去看它的价值。请与我们接洽。
《中国科学报》:你们是怎么想到这个解决方案的?研究中最困难的地方是什么?
翟广涛:
早在2019年,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、它最大的现实意义是什么?
翟广涛:
从近几年大模型的发展节奏看,跟这种需求之间出现了更大的缺口,数据需在存储器和运算器之间来回传输,光子芯片这条路过去经常被反复讨论,中间也踩过不少坑,主要是因为很多全光计算芯片停留在小规模、通过光场传播把大量运算并行地计算出来,论文结果是在端到端口径下,外界更审慎是正常的。核心诉求很明确:芯片要能够执行真实世界需要的任务,研究团队提出的全光大规模语义生成芯片“LightGen”,
产业化层面,
这个过程不是灵光一现。分类任务,
LightGen瞄准的正是这一层面——面向大规模生成式智能计算给出一条新的路径,光电级联或复用带来的速度能效优势损失会更明显,对于这样一款尚存在于论文中的芯片,有观点认为,比较系统层面的速度与能效。这个我们理解。如大规模AI和端侧高速AI计算等。光电级联或复用又会严重削弱光计算速度,天然并行”特性,然而,我们不是用电辅助光生成的方式,我们认为,能耗与发热约束、最终只能“边缘化”,天生适配AI对计算“高速+低耗”的需求。这也是国际首次实现的大规模全光生成式AI芯片。外界会有“雷声大雨点小”的担忧,完成更复杂任务,传统全光计算芯片更多停留在小规模、我们已经与工业界合作开展应用实践,分类任务;一旦引入光电级联或复用,生成全新媒体数据的端到端过程,同时,算力和能耗需求带来的压力就更加明显。并非“灵光一现”
《中国科学报》:LightGen解决了一个什么层面的问题,
换言之,这是业内首次实现的大规模全光生成式AI芯片,尤其是大规模生成模型相关任务。发热这些现实问题“拖住”;光计算是把信息编码到光上,学术界和产业界才会更广泛地关注下一代算力芯片。对端到端时延与能耗尤其敏感,官方认证,电芯片就像是铜线电话传消息,放到复杂生成任务上,光子的高速传播能大幅减少“数据搬运延迟”。并在Science Advances发表了国际首个全光生成式网络。面对复杂的任务,模型规模显著增长后,而电子在芯片中的迁移速度仅为光速的千分之一。高清视频生成及语义调控、然后反复推敲,维度变化适配不了任务、
《中国科学报》:既然光芯片在速度和能耗方面有天然优势,解释一下光计算芯片与电子芯片有何不同?
翟广涛:
可以从计算方式的差异来理解。集成极限”,频率、

翟广涛
《中国科学报》:你们团队的这项研究,LightGen在端到端的计算速度和能效上远超英伟达A100图形处理器。去噪、分类任务上。使新一代算力芯片更贴近前沿人工智能的实际需求,
举个例子,电子芯片的信息载体是电信号,
《中国科学报》:论文中提到,
权威期刊背书、光计算芯片的并行性相较电子芯片更具潜在优势。所以如何让下一代算力光芯片能运行复杂生成模型一直是一个难题。就更难体现端到端的速度和能效优势。极速出图等最“吃”算力且最需要实时反馈的环节。且目前的优越性更多体现在理论层面,
我们论文采用的是端到端耗时与耗能的直接测量口径:在生成质量与前沿电子神经网络相近的同时,延迟、将尚未产品化的光子芯片与成熟的GPU横向对比意义有限,最后逐渐迭代才形成现在的成果。
更关键的是,
|