无问芯穹戴国浩:缓解算力瓶颈,
引领AGI时代的稀疏计算先锋
作为无问芯穹联合创始人兼首席科学家的戴国浩,一直站在稀疏计算与软硬件协同优化的研究前沿。他提出了创新的稀疏计算软硬协同优化方法,显著提升通用人工智能的计算效率和能效,有效缓解了大模型时代的算力瓶颈。
戴国浩长期致力于稀疏计算和软硬件协同设计的研究,其核心思想基于先验知识驱动的结构化稀疏、机器学习驱动的动态编译和细粒度并行的稀疏架构,通过降低任务量和提升硬件利用率,在芯片工艺和峰值算力较低的硬件上实现对高端工艺与高算力硬件的超越,将等效算力提升 1 个数量级,显著提升通用人工智能的计算效率和能效。
在加速产业落地方面,戴国浩作为联合创始人于2023年创立了无问芯穹,并带领团队将这些技术产业化,以解决实际应用中更大规模的算力需求问题。戴国浩从软硬协同基础研究出发,进一步拓展多元异构产业规模思路,提高人工智能时代的整体可用算力池。
目前已推出一系列终端与云端智能解决方案,在终端,包括全模态理解端模型 Megrez-3B-Omni、端侧动态稀疏引擎 SpecEE、首个大语言模型定制推理 LPU IP FlightLLM 和首个视频生成模型定制推理 LPU IP FlightVGM 等;在云侧,包括推理引擎 FlashDecoding++、半分离推理调度系统 Semi-PD 和推理系统通信加速方案 FlashOverlap 等。
可以说,戴国浩及其团队的成果,不止是技术创新,更是融合了对未来人类与科技间关系的深度思考,凝聚了推动AGI发展的实际行动。他在终端和云端同时实现了大模型算法在多种芯片上的高效协同部署运行,为 AGI 时代的算力普惠和可持续发展提供了关键技术支撑。
阶跃星辰张祥雨:
从多模态出发,构建下一代AI范式
另一位入选者,阶跃星辰首席科学家张祥雨,则将多模态AI模型的发展推向更深、更广的未来。他提出了业内最早的图文生成理解一体化的多模态大模型架构之一,并发布中国首个千亿参数原生多模态大模型。
张祥雨现任大模型公司阶跃星辰首席科学家。与很多大模型公司选择以大语言模型为起点不同,该公司从图文交错式语料出发,直接训练原生图文多模态大模型。他提出了业内最早的图文生成理解一体化的多模态大模型架构之一——DreamLLM 多模态大模型框架。
基于该框架,阶跃星辰发布了中国首个千亿参数原生多模态大模型 Step-1V,与 Google 的首个同类模型 Gemini 1.0 几乎同时发布,多模态理解能力显著高于当时业界主流的视觉-语言分离式的架构。之后,他们还相继发布了万亿参数 MoE 基座大模型 Step-2、视频生成大模型 Step-Video、图文语音三模态理解大模型 Step-1o 以及推理模型 Step R-mini 等。
张祥雨的另一里程碑是致力于研究通用神经网络的设计、训练和优化方法,不断提升模型的实用性和智能水平。他所提出的 RepVGG,通过引入重参数化的思想,训练时可以采用较复杂的结构实现高准确度,而在推理阶段等价变换回一种简单的结构(例如 VGG),以方便硬件推理。后续,同样基于重参数化思路,通过对已有视觉 Transformers(ViTs)的机理进行深入分析,张祥雨提出了一种不同于 ViTs 的超大卷积核架构 RepLKNet,性能超越了主流的 ViTs,且结构简单易部署。
张祥雨持续刷新着行业对通用神经网络性能的认知,这些原创方法不仅提升了大模型的计算效能,也将多模态技术的潜能带入了生产、创意、医疗等众多现实场景中,彰显了智能技术发展路径的无限可能。
从实验室到产业化落地,从算法到芯片,戴国浩和张祥雨作为新生代科研力量的代表,将中国科技创新“链式反应”展现得淋漓尽致。他们不止是技术创新者,更是行业重塑者,把一个又一个极致性能和前沿功能,融入到全球人工智能发展进程中。
两位青年科学家的入选,不仅是对他们个人成就的嘉奖,更是一份指向未来的科技样本,而其所在的两家潜力独角兽AI企业——无问芯穹与阶跃星辰的成长历程,也再次证明了上海徐汇在全球科技竞逐中的独特地位。
从模速空间的创新孵化到徐汇区的政策扶持,这里已经成为中国AI领域的重要发源地,为初创企业提供从研发到市场落地的全方位支持。以戴国浩与张祥雨为代表的青年创新力量,正在这片创新沃土上加速孕育出“奇迹之花”,为全球AI领域的协作与竞争注入了一份深怀希望的“中国动能”。

