近日,国内AI实时推理芯片企业元川微宣布完成数亿元天使轮系列融资,估值持续攀升。本轮系列融资由东方嘉富、元禾原点、峰瑞资本、源来资本、中芯聚源、深创投等知名机构联合投资与追投,并得到浙江省科创投和杭州润苗基金的关注和支持,更获得产业投资方星宸科技(股票代码:301536)和智微智能(股票代码:001339)的持续加注。

资金将主要用于第一代LPU+架构AI推理芯片的研发与量产,为即将全面爆发的Agent(智能体)时代打造底层算力基础设施。

LPU+:为实时推理而生的原生架构

LPU(Language Processing Unit)是专为AI推理设计的非冯·诺依曼架构芯片。当前大模型推理的核心瓶颈不是算力,而是数据搬移——传统GPU/NPU依赖多级缓存(L1→L2→L3→HBM)逐级搬运数据,LPU用"硬件数据流架构"彻底替代,将数据搬移效率做到ASIC级别。

这一技术路线已获行业验证。全球首家LPU芯片公司Groq,2025年收入约5亿美元,注册开发者超200万;同年12月,英伟达以200亿美元获得Groq技术授权并引入核心团队,2026年3月GTC大会正式推出Groq 3 LPX产品。

Groq的LPU最初设计于2016年,主要面向CNN时代的推理需求。元川微的"LPU+"在保持LPU三大核心基因的基础上,针对大语言模型、多模态、MoE(混合专家模型)等新一代AI架构进行了大量底层创新——"+"代表的正是面向Agent时代的全新能力。

具体而言,元川微LPU+架构的三大基因分别是:

•大带宽:采用扁平化片上大SRAM直连计算单元,消除多级缓存层级带来的访问延迟。LPU的算力密度是GPU/NPU的2~3倍,相同算力只需1/2~1/3的芯片面积,省下的面积用于部署SRAM,相当于"免费"获得了大容量高速存储。

•确定性数据流:所有数据搬移完全ASIC化,数据在芯片内如流水线般自动流转,每个时钟周期的数据路径在编译时即已确定。

•静态调度:所有资源分配和调度在编译阶段完成("调度前置"),运行时零动态开销——没有缓存未命中,没有调度延迟,没有仲裁等待。

元川微CEO杨总指出:"很多公司可能声称在做LPU,但往往只取其中一个特征。必须三个基因同时具备,才是真正的LPU。"

提升十倍推理效能,迎接Agent算力新需求


【图1:传统计算架构VS LPU+硬流水架构】

这一架构设计释放了推理"确定性执行"的结构性优势,以极简硬件消除传统处理器的随机访问延迟,实现推理速度5~10倍提升、能效比10倍优化。同时,方案显著降低对先进制程与高端IP的依赖——在全球AI芯片供应链重构的背景下,这一特性具有重要的战略意义。

随着AI Agent爆发,算力消费主体从人类用户转向无数全天候运行的"数字员工",算力定价逻辑随之改变——市场不再只为峰值算力(Tflops)买单,而是看重完成任务的综合成本:算力的能力、算力的时间、算力的服务质量(QoS)。谁把"时延+确定性+成本"做到最优,谁就拥有定价权。

据行业预测,Agent时代推理算力占比将从当前约75%提升至90%以上。在金融高频交易、实时决策系统、交互式AI助手、具身智能、工业质检流水线等时延敏感场景中,每一毫秒的推理延迟削减都意味着直接的商业价值提升。

顶尖架构团队,兼具创新与工程落地能力

元川微CEO拥有逾20年华为全球研发体系一线实战与管理经验。他曾于2008年赴美从零组建华为处理器团队,2012年回国主导华为无线基带算法与芯片部门,带领团队在该领域做到全球领先。

团队选择LPU路线并非偶然。LPU的架构本质是"数据驱动的纯硬件流水架构",与无线通信基带处理在工程学上高度相通——数据流架构第一次大规模商用成功正是在无线通信基带领域,AI推理将是其第二个成功落地的重大场景。团队将20年积累的架构设计、互连、存储、编译器等领域的深厚经验,完整迁移至AI推理芯片的设计中。

元川微核心团队均来自顶尖芯片企业,人均15年以上经验,累计交付数十款大规模量产芯片。CEO表示:"LPU架构是典型的软件定义硬件——数据流是第一公民,数据流的管理完全由编译工具完成。其设计理念、工具链、硬件数据流架构、高密度SRAM,每一环都有很高的壁垒。我们最大的护城河,是一支完整的、有过成功经验的团队。"

目前,元川微已完成自研LPU+架构的FPGA验证,所有性能指标均达到设计预期。公司正全力推进第一代LPU+推理芯片的研发,编译器将在芯片回片前通过仿真器提前验证和优化,以达到商用标准。在商业化方面,公司已与产业投资方深度协同,形成明确的产品路标规划,同时正积极拓展云厂商、算力中心等新客户合作。从架构验证到产品落地,元川微正在加速跑完最关键的一程,让LPU+成为Agent时代的标准算力底座。

投资人观点

【东方嘉富合伙人徐晓】:

AI产业正从大模型训练的军备竞赛,迈入Agent规模化落地的全新阶段,低时延、高确定性、高性价比的实时推理算力,已然成为支撑AI产业持续爆发的核心底座,更是国产算力实现自主突围的关键赛道。元川微团队凭借二十余年芯片领域的深厚积累与大规模量产落地能力,打造的全自研LPU +原生架构,直击传统GPU/NPU数据搬移效率的核心瓶颈,在推理性能、能效比与成本控制上实现了量级突破。未来东方嘉富将持续深度赋能,全面联动产业生态资源,全力支持公司芯片的研发、量产与全场景商业化落地,助力元川微成长为国产AI实时推理芯片的领航者。

【元禾原点合伙人乐金鑫】:

我们十年前天使投资寒武纪开启了对AI时代算力基础设施的体系化投资布局,今天选择投资元川微作为端侧推理芯片落子,这是一个开启AI万亿应用市场的巨大机遇。元川微团队具备前瞻的市场洞察能力,成熟的产品化经验和扎实的技术实力;凭借独特的技术架构,其规划的系列产品在成本、效率、时延上为诸多端侧推理应用提供最优解决方案。我们将携手产业资源持续加注,加速企业成长与商业化落地,期待元川微成为词元时代的中坚力量!

【峰瑞资本合伙人杨永成】

元川微创立并获得大额天使投资之际,恰逢英伟达以200亿美金收购推理端AI LPU处理器创业公司Groq,推动了AI推理处理器领域的技术热潮。从投资视角看,随着大模型迭代与应用落地,专为推理端优化的AI处理器已进入高速发展期,在市场预判与技术布局上,元川微与英伟达等国际巨头殊途同归,彰显了团队对趋势的把握和前瞻性。元川微核心团队深耕芯片领域多年,具备深厚技术积累与产业经验。在AI推理应用即将迎来爆发式增长的关键节点,团队精准切入高效率、高实时性、高性价比的AI推理芯片赛道,正是"正确的人在正确的时机选择了正确的方向"。预祝元川微团队在AI推理芯片领域持续突破,奋勇前行。

关于元川微

元川微(ArcheFlowX)是一家专注于超低时延AI推理芯片的科技公司,基于全自研LPU+架构,致力于为Agent时代构建实时推理算力基础设施。公司成立于2025年9月,创始团队来自全球顶尖芯片企业,研发布局于上海、杭州两地。