送外卖的美团,跑出万亿参数大模型,靠的是全国产算力

送外卖的美团,跑出万亿参数大模型	,靠的是全国产算力-第1张图片

  做外卖 、打车、团购的美团,在AI战场上亮出一张新牌 。

  就在最近,美团LongCat-2.0大模型正式发布 ,在业内掀起波澜。若单看技术实力,它并非比较优秀 的那个——有评价认为,在工具调用、复杂指令执行等Agent(智能体)核心能力方面 ,LongCat-2.0-Preview接近Claude Opus 4.6,落后于最新的Claude Opus 4.8。

  但在头部玩家动辄刷榜的今天,这样一款不算最优的模型 ,却获得了颇高的关注度 。原因在于——LongCat-2.0是业界首个基于国产算力完成训练 、推理全流程的万亿参数大模型。

训练、推理全程依靠国产算力

  说到国产“模芯协同 ” ,很多人会联想到DeepSeek与华为的合作。

  4月24日,DeepSeek正式对外发布DeepSeek-V4预览版,华为同步宣布昇腾超节点全系列产品及华为云已实现对DeepSeek-V4的全面支持 。

  之后 ,新的消息传来。深圳河套学院AI训练平台项目团队联合哈尔滨工业大学(深圳)、深圳市大数据研究院 、华为相关团队,在昇腾910C国产算力集群上,完成了DeepSeek-V4-Pro的全参数后训练。

  所谓后训练 ,是在预训练基座模型完成基础上做微调、对齐优化,好比建好毛坯房后再完成精装修,与打地基、盖框架的从头训练还是有很大的不同 。

  LongCat-2.0从零开始 ,用全国产算力训练万亿参数模型,覆盖预训练 、后训练到推理的全流程,证明了国产算力能独立 、完整地支撑万亿模型从0到1的全生命周期 。

  据悉 ,该模型采用MoE(混合专家)架构,总参数规模1.6万亿,每个Token激活参数约480亿 ,原生支持1M超长上下文 ,可一次处理百万字级输入,模型适配Claude Code、OpenClaw、Hermes等主流Harness(智能体工程框架)。

  今年4月底,美团曾发布LongCat-2.0-Preview版本 ,并以匿名方式接入全球最大的大模型API路由平台OpenRouter。OpenRouter数据显示,截至6月底,LongCat-2.0-Preview的总调用量已跻身全球前三 。在Hermes 、Claude Code、OpenClaw等Agent(智能体)场景下 ,LongCat-2.0-Preview的月调用量分列全球第〖One〗、 第二和第三位,在Claude Code上的调用量仅次于Claude Opus 4.8。

OpenRouter数据显示,截至6月底 ,LongCat-2.0-Preview在Claude Code上的调用量仅次于Claude Opus 4.8。

  业内人士分析,这一表现既源于该模型本身的性能,也离不开当前的定价策略——公测期输入Token促销价为0.30美元/百万Token ,且提供大额免费调用额度 。行业通用玩法是上线初期靠低价和免费额度冲榜 、攒口碑,再逐步涨价。一旦进入收费阶段,现在的成绩还能保持多久 ,才是真正面临的考题。

  但至少 ,这件事验证了一个判断:近来 国产算力卡的单卡性能虽与全球顶尖水平仍有差距,但计算正确性和精度已经可以支撑前沿模型的全流程训练 。对于激活存量国产芯片而言,这是一个重要突破。

让大模型学会“偷懒”

  大模型技术本身 ,依然是业界关注的焦点。

  根据公开消息,LongCat-2.0全程在国产算力上完成训练,峰值规模超过5万张国产算力卡 ,是迄今为止国产算力上完成的最大训练任务 。

LongCat-2.0全程在国产算力上完成训练,峰值规模超过5万张国产算力卡。

  国产算力集群究竟出自哪家?据业内人士推测,该集群大概率基于华为昇腾架构搭建。不过 ,美团方面并未对此作出明确回应 。

  另一个值得关注的维度,是模型层面的设计 。相关技术报告显示,LongCat-2.0引入零计算专家机制等设计。“零计算专家”机制关联的是大模型的经济性问题 ,当总参数突破万亿级别后,单纯堆叠参数带来的性能增益已显著放缓。一个更务实的命题是——如何让大模型用得更省、跑得更快?

  在当前主流的MoE架构下,大模型每次推理只调动一小部分“专家 ”参与计算 。这样既保留了海量知识 ,又将单次推理的计算开销控制在合理范围内。DeepSeek-V3/V〖肆〗、 Mixtral等头部模型均采用此架构。

  不过 ,该架构下每个Token激活的“专家”数量通常是固定的,无论输入文本简单或复杂,都调用同等规模的计算资源 。

  LongCat系列引入“零计算专家”机制 ,即在传统“计算专家 ”之外,设置了一类特殊的“专家”——它不做任何矩阵运算,只做一件事:把输入原样传递到下一层。

  模型会动态判断每个Token的复杂度 ,简单的Token直接分配给“零计算专家”走快速通道,复杂的Token才调动真正的“计算专家 ”深度处理。用更通俗的话说:让大模型学会在简单问题上“偷懒 ”,把算力留给真正需要深思的环节 。

AI业务的进攻

  回到一个现实问题:烧钱做大模型 ,美团到底图什么?

  在2025年3月的业绩电话会上,美团CEO王兴明确了战略定位——对AI的策略是进攻,不是防守。今年3月 ,他进一步透露,自2023年初以来,美团在资本支出和AI人才上进行了大规模投入。“除有云计算业务的企业外 ,美团在AI上的投入规模 ,大概率是国内企业里最大的,且已经坚持布局三年多 。”

  此后,美团核心本地商业(CLC)完成组织架构调整 ,正式成立AI Transformation部门,与外卖 、闪购等部门平行,由前大众点评总经理牧遥负责 ,直接向CLC CEO王莆中汇报。

  美团的野心,是成为未来本地生活需求的 “AI超级入口” 。这要求AI能精准理解用户需求并高效执行任务 。王兴多次表示,要争取把美团App率先升级成“AI-powered App ” 。

  做万亿参数大模型 ,是战略的一部分。王兴曾用一个比喻说明问题:“虽然大模型越来越聪明。但我们可以想象,就算爱因斯坦当秘书,让他订一个餐厅 ,他依然不知道那个餐厅有没有座位 。这不是智力问题,而是信息问题。”

  基于本地生活场景的复杂性,通用AI近来 还无法可靠地管理和保障现实世界中的服务体验。美团多年积累的结构性数据优势——覆盖全品类的本地服务、实时信息、海量用户评价 ,以及履约基础设施 ,恰恰可以成为大模型训练的基础 。

  这也关乎一笔“经济账”。随着业务对AI依赖加深,API调用费将成为不小的投入。通过打造“技术闭环 ”,也有助于增强业务的灵活性与安全性 。

  LongCat-2.0的价值 ,在于为美团的AI战略提供了底层能力支撑,帮助形成“基座模型+本地生活Agent+AI生态投资”的三层体系。

  下面 ,就要看AI能力到底多大程度与业务肌理融合。毕竟 ,大模型的价值从来不在于它本身有多大,而在于它最终解决了什么实际问题 。

(文章来源:上观新闻)

标签:

相关推荐

  • 西安今日限行限号吗/西安今日限行吗?限行尾数是几?

    西安今日限行限号吗/西安今日限行吗?限行尾数是几?

    西安今天限号吗?〖壹〗、周五限行0,周周日不限号。限行时间为工作日7:00-20:00,限行区域为:西安市行政区域内(含西咸新区),以西安绕城高速以内区域为中心,向南扩展至终南大道、堰渡路、三星快速干道连线(不含)以北,西汉高速以东、西柞高速以西围合区域;向北扩展至西咸北环线(不含)以南、延西高速以东、西禹高速以西围合区域。〖贰〗、西安限号不限字母。西安限...

  • 【摩托限号成都限行吗现在,摩托车限号吗成都】

    【摩托限号成都限行吗现在,摩托车限号吗成都】

    成都限号外地车能开吗成都限号时外地车在限行区域和时间内不能开,但在其他时间和区域可以正常行驶。成都限行的汽车类型包括外地燃油车等外地籍号牌汽车,本地车牌和外地车牌限行规则一视同仁。申请临时通行许可:如果你确实需要开车进城,并且符合相关条件,可以尝试申请临时通行许可。不过要注意,这个许可是有条件的,需要提前了解并准备好所需材料。租车或共享汽车:现在成都有很多...

  • 从化疫情高风险地区/从化区最新疫情

    从化疫情高风险地区/从化区最新疫情

    广州从化区关于进一步加强社会面疫情防控措施的通告〖壹〗、广州市从化区新型冠状病毒肺炎疫情防控指挥部办公室关于进一步加强社会面疫情防控措施的通告当前,我区疫情社会面传播风险持续加大,防控形势严峻复杂。为快速有效阻断疫情传播扩散风险和降低区外疫情外溢波及我区风险,切实保障广大人民群众生命安全和身体健康,现就进一步加强社会面疫情防控措施通告如下:进一步强化主动报...

  • 吉林蛟河是疫情风险地区(吉林蛟河疫情风险等级)

    吉林蛟河是疫情风险地区(吉林蛟河疫情风险等级)

    吉林市回蛟河需要隔离吗不需要。吉林市去蛟河不需要隔离的,持有48小时内核酸检测阴性证明还有“三天两检”核酸检测措施,并且还需要提前报备。吉林市一般指吉林。吉林市,别称“北国江城”,吉林省辖地级市,国家批复确定的中国重要的工业城市、吉林省重要的中心城市和新型工业基地、具有中国北方特色的旅游城市。不需要隔离。吉林市位于吉林省中部偏东,蛟河市位于吉林省东部,低风...

  • 关于江宁区属于疫情地区吗的信息

    关于江宁区属于疫情地区吗的信息

    南京属于什么风险等级〖壹〗、南京为低风险地区时一般情况:若南京处于低风险地区,且个人不属于高风险岗位人员、未被赋“红(黄)码”,同时未前往中高风险地区所在城市的其他区域,按照上海当时的防疫政策,一般不需要隔离。但需做好个人防护,抵沪后开展7天的自主健康监测,其间每天早晚两次自测体温,减少不必要的人群聚集活动,规范佩戴口罩。〖贰〗、中风险地区出行要求:南京若...

  • 疫情赤峰周边地区地图/疫情赤峰周边地区地图最新

    疫情赤峰周边地区地图/疫情赤峰周边地区地图最新

    赤峰在中国地图的中部还是西部赤峰在中国地图的东部偏北地区,具体位于内蒙古东南部。以下是关于赤峰地理位置的详细解地理位置概述赤峰市是内蒙古自治区下辖的地级市,它并不位于中国的中部或西部,而是地处内蒙古自治区的东南部。这一地理位置使得赤峰成为蒙冀辽三省区(内蒙古自治区、河北省、辽宁省)的接壤处,具有重要的区域战略地位。综上所述,赤峰在中国地图上的位置是偏东部...

  • 第三方支付再现巨额罚单:上海瀚银信息技术有限公司合计被罚没约7445万元

    第三方支付再现巨额罚单:上海瀚银信息技术有限公司合计被罚没约7445万元

      第三方支付再现巨额罚单。  中国人民银行上海市分行7月3日公布的行政处罚决定信息公示显示,因违反清算管理规定、违反商户管理规定,上海瀚银信息技术有限公司被没收违法所得65919976.99元,并处罚款853万元,合计罚没约7445万元。  同时,施某锋因对上海瀚银信息技术有限公司违反清算管理规定的违法行为负有直接责任,被处以罚款34万元。  早在2...

    2026/07/04
  • 苏州金山地区有疫情吗/苏州金山社区卫生服务中心

    苏州金山地区有疫情吗/苏州金山社区卫生服务中心

    苏州去上海金山区漕泾镇要做核酸吗?〖壹〗、苏州地区和上海市金山区均为疫情低风险地区,从苏州地区去上海金山区漕泾镇并不要做核酸检测的;但是在进入上海境时需要用手机扫描二维码后,手机显示绿色“随申码”后,才能进入上海境内。〖贰〗、漕泾镇常住人口31287人,位于金山区东南部,以化工产业和农业为主,人口增长较为缓慢。廊下镇常住人口27737人,是金山区人口最少的...

  • 山东有哪些地区解放了疫情(山东地区疫情解除了吗)

    山东有哪些地区解放了疫情(山东地区疫情解除了吗)

    烟台一菏泽客车通了吗通了。根据山东疫情防控中心显示,截至到2022年12月15日,山东疫情全面解放,所以烟台一菏泽客车通了。烟台市地处山东半岛东部,濒临黄海、渤海,与辽东半岛及日本、韩国、朝鲜隔海相望。从菏泽至烟台市,可选取汽车、火车或自驾三种交通方式,具体信息如下:汽车:菏泽总站提供发往烟台的长途汽车服务,每天一班,出发时间为08:00,车型为长途车,车...

  • 本周车是否限号限行了(本周车辆限行尾号是多少)

    本周车是否限号限行了(本周车辆限行尾号是多少)

    北京机动车尾号限行规定026年3月30日至2026年6月28日期间,北京工作日尾号限行规则为:星期一限行尾号2和7;星期二限行尾号3和8;星期三限行尾号4和9;星期四限行尾号5和0;星期五限行尾号1和6。限行时间与范围根据车辆类型区分:北京号牌车辆:限行时间为工作日7时至20时,限行范围为五环路以内道路(不含五环路)。周一:限行尾号1和6周二:限行尾号2和...

返回顶部