美团LongCat大模型官方App正式发布:支持联网搜索与语音通话
侯煜峰

11月3日消息。近日,美团正式发布LongCat大模型官方App,同步推出开源大模型LongCat-Flash-Omni,标志着美团在人工智能领域的技术布局迈入全模态实时交互新阶段。该App现已上线安卓、iOS平台及Web端,支持联网搜索、语音通话功能,视频通话等后续功能将陆续上线,用户可通过LongCat官网及App Store直接下载体验。

此次发布的LongCat-Flash-Omni基于5600亿参数的混合专家(MoE)架构,通过零计算专家机制与快速连结混合专家模型(ScMoE)技术,实现动态激活参数在186亿至313亿之间,平均约270亿参数的高效运算。该模型在保障高性能的同时,将推理能耗降低约30%,每百万输出token成本压低至0.7美元,较同类模型降低超50%,显著降低企业应用门槛。技术层面,模型采用渐进式早期多模融合训练策略,集成高效多模态感知模块与语音重建模块,实现文本、音频、视频等模态的无缝融合,支持毫秒级响应的实时音视频交互,在TerminalBench、TauBench等智能体任务测试中达到SOTA水平。

功能应用方面,App支持联网搜索与语音通话,用户可通过自然语言指令获取精准信息,或通过语音交互完成复杂任务。Web端则新增图片、文件上传功能,进一步拓展多模态交互场景。据美团技术团队介绍,该模型已应用于内部AI编程助手场景,52%的新代码由其生成,并支持多语言、复杂指令输入,输出符合工程规范的代码内容。在外部业务中,模型正加速落地本地生活、智能客服、自动驾驶等垂直场景,例如优化商品推荐算法、提升智能客服响应效率,以及为具身智能设备提供物理运动合理性建模支持。

市场定位与战略层面,美团通过开源LongCat-Flash-Omni(遵循MIT许可协议)及提供千万级算力补贴,吸引全球开发者参与模型优化,推动技术普惠。相较于OpenAI、百度等竞争对手,美团凭借在计算效率、成本控制及垂直场景适配性上的优势,寻求在中小企业市场及特定行业场景中实现突破。行业分析指出,随着“世界模型”探索的推进,LongCat-Video视频生成模型已实现分钟级长视频连贯生成,为构建物理世界数字孪生提供技术支撑,未来将深度融入自动驾驶、数字人等交互业务场景。

此次发布标志着美团在AI大模型领域的战略决心,通过技术创新与开源合作,推动大模型从实验室走向广泛产业应用,为连接“比特世界”与“原子世界”构建技术基石,开启智能交互的新篇章。