AI能力的重要落点是物理世界。今年年初,海外科技圈对中国算力问题给予了极大关注。马斯克在一月份的播客中提到,中国在AI算力上将远超世界其他地区。二月份,OpenAI首席执行官奥特曼也表示,中国在人工智能领域的技术进步快得惊人。

2025年可以说是供给端的集结之年。摩尔线程、沐曦股份等国产GPU接连登陆资本市场,进一步加深了国产大模型的产业基础。2026年,变化向产业链下游传导,四月下旬,多款国产大模型发布了新版本。4月20日,月之暗面推出了擅长长程代码编写的Kimi K2.6模型。4月24日,DeepSeek V4发布,随后美团LongCat-2.0-Preview开放测试,两者总参数规模均突破万亿,并且都支持1M超长上下文。
值得一提的是,DeepSeek V4完成了从英伟达体系向华为昇腾平台的迁移与适配;而美团LongCat-2.0则是训练推理全程基于国产算力的万亿参数大模型,使用了5万至6万张国产算力芯片。长期以来,中国AI从业者普遍策略是采用现有成熟方案,现在国内AI企业开始尝试铺设自己的轨道。
在荒野修路,科幻作家阿瑟·克拉克的答案是让不可能本身成为前进的起点。CUDA生态经过十几年打磨已成为一个功能强大、工具完备的开发平台。迁移代码的过程意味着开发团队需要做大量底层框架的重构工作。最终DeepSeek做到了,V4发布两天后,摩根大通报告指出,V4成功适配华为昇腾芯片,验证了国产算力在前沿AI推理上的可行性;通过混合注意力架构等底层技术创新,显著降低了推理成本。DeepSeek用技术极客的方式降本增效,通过重写半个大模型的工作量完成硬核迁移。同日开放测试的美团LongCat-2.0-Preview,则直接跑在国产算力之上。
国产算力在工程层面面临多个难点。以LongCat-2.0-Preview为例,第一个难点是物理层面的。国产硬件底座的显存容量和带宽与英伟达芯片有差异,训练部署万亿参数模型时,美团团队需花更多精力调试并行策略、优化显存。第二个难点是软件生态的成熟度,针对国产芯片特性确保训练全程精确可复现,团队需要重写和优化核心算子及自研全确定性的算子。第三个难点是万卡集群稳定性,在动用5万至6万张国产算力卡的超大规模集群上,硬件故障难以避免,为此团队构建了一套完整的容错与自动恢复体系。此外,针对国产硬件特点,团队在训练框架和模型结构进行针对性设计,打破了通用框架的适配局限,提升了计算性能。
DeepSeek的算法优化降低了算力门槛,把模型价格打了下来;美团的工程实践证明了国产芯片的可行性。这些探索为国产芯片生态沉淀出工程能力和经验。梁文锋曾说:“我们不是有意成为一条鲶鱼,只是不小心成了一条鲶鱼”,如今“鲶鱼效应”已经显现,DeepSeek并不独行。
腾讯云的汤道生曾比喻称:“大模型是发动机,使用者是驾驶员”。中国算力的发展依赖整条产业链协同进步。制造端数据显示,中国芯片产量不断攀升。中芯国际、华虹半导体等企业正推进多重曝光等工艺攻关。算力端方面,华为昇腾910C等产品表明,通过极致的集群线性加速比也能跑通体量巨大的模型训练。“得生态者得天下”。行业从业者意识到这一点,寒武纪推出兼容主流框架的基础软件平台,降低开发者迁移门槛;智源人工智能研究院牵头开源系统构建统一底层接口,让上层模型可以运行在多种不同的国产芯片上。国内互联网大厂也有很多动作,百度双轨战略、字节跳动千亿投入都在为算力底座寻找更优解。据公开数据梳理,过去几年美团至少布局了21家覆盖半导体/智能硬件和通用大模型领域的相关公司,包括芯片算力层的摩尔线程、沐曦股份以及视觉芯片领域的爱芯元智等。
在技术长期跟进的同时,产业资本也在做算力的投资人和共建者,逐渐形成正向循环。北京智源人工智能研究院院长王仲远指出,当下人工智能正处于第三次浪潮重要拐点,大模型推动其从弱人工智能迈向通用人工智能,更重要的是推动机器人从1.0专用机器人时代进入2.0通用具身智能时代。一方面,众多国产厂商致力于让大模型在云端提升智慧和逻辑推理严密性;另一方面,也要让大模型“行万里路”,例如文心大模型被植入到自动驾驶决策系统中,混元大模型的工业质检方案已出现在多个流水线场景。美团的外卖、到店、酒旅业务构成了日常生活中最复杂的任务执行网络,这里有海量的真实场景。王兴明确提出要将美团App率先升级成“AI-powered App”,这意味着LongCat的训练目标不仅是回答问题,更要解决实际任务。这解释了美团为何强调打造物理世界的AI底座。从参数提升到算力跑通股票配资在线,国产大模型正在完成从“能用”到“好用”的进阶。这条路没有捷径,未来当算法、算力、资金与场景持续产生化学反应,中国AI的故事也将从“单点突破”翻到“系统进化”这一页。
元鼎证券_元鼎证券配资平台-让专业陪你看清行情、让自信陪你走进市场。提示:本文来自互联网,不代表本网站观点。