突发,Agentic新SOTA诞生!美团开源560B大模型
昨晚,美团入局大模型!开源大模型LongCat-Flash~
LongCat-Flash-Chat,这是一款non-thinking基础模型,在领先模型中表现极具竞争力,尤其在Agentic任务中表现出色,超过DeepSeek v3.1、Qwen3、Kimi K2、GPT-4.1、Claude4、Gemini2.5 Flash。其他能力效果:通用能力代码code指令遵循LongCat-Flash,这是一款拥有 560B 总参数的强大且高效的语言模型,采用了创新的专家混合(MoE)架构。该模型内置动态计算机制,根据上下文需求激活18.6B~31.3B参数(平均约 27B 亿),从而优化计算效率和性能。为了实现先进的训练和推理效率,采用了捷径连接架构,扩大了计算-通信重叠窗口,实现了每秒超过 100 个token(TPS)的高效推理。全面训练和扩展策略确保了稳定、高效的训练,而量身定制的数据策略则提升了模型性能。LongCatChat:https://longcat.aiHuggingFace:https://huggingface.co/meituan-longcatGithub:https://github.com/meituan-longcat·················END·················分享
收藏
点赞
在看
网站开发网络凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求...
请立即点击咨询我们或拨打咨询热线:13245491521 13245491521 ,我们会详细为你一一解答你心中的疑难。 项目经理在线