百灵大模型

蚂蚁集团自研的多模态AI大模型系列
所属类别:
定价模式:免费增值
出品公司:蚂蚁集团
0 0

产品介绍

百灵大模型是蚂蚁集团自研的生成式AI大模型体系,涵盖语言、推理和多模态三个方向,形成了Ling‑Ring‑Ming三条技术路线。百灵大模型基于Transformer架构的深度学习模型,通过海量高质量文本数据训练,具备强大的文本、图像、音频、视频等多模态数据处理能力,支持文本生成、理解、对话、推理等复杂任务。 百灵大模型拥有强大的通用能力与行业落地能力,已广泛应用于金融、医疗、生活服务等场景。

一、基础模型Ling系列

Ling系列模型构成了百灵大模型的基础能力,专注于语言理解与生成。

Ling-1T:万亿参数旗舰,开源新标杆

Ling-1T是百灵混合专家(MoE)架构下的万亿参数级别旗舰模型。它在超过20万亿(20T)的高质量语料上完成了深度预训练,是最新发布的、参数量达到万亿级别的开源模型。在各项权威评测中,Ling-1T均取得了优异的成绩,被认为是下一代开放模型中最易用、体验最佳的开源基础模型选择。

Ling-flash-2.0:高效通用,性价比之选

Ling-flash-2.0是Ling 2.0 MoE架构下的通用版本模型。该模型采用了稀疏的MoE架构,总参数量高达1000亿(100B),而每次处理token仅激活61亿(6.1B)参数(非词向量激活48亿)。凭借极高的性价比与全面的性能表现,它能够高效应对绝大多数语言模型应用场景。尽管配置精简,Ling-flash-2.0在多个权威评测中展现出的性能已能媲美甚至超越400亿参数级别的稠密(dense)模型及更大规模的MoE模型。

Ling-mini-2.0:小巧玲珑,性能卓绝

Ling-mini-2.0是一款基于MoE架构的小尺寸高性能大语言模型。其总参数量为160亿(16B),但每个token仅激活14亿(1.4B)参数(非词向量激活7.89亿),从而实现了极快的生成速度。得益于高效的MoE设计以及大规模、高质量的训练数据,尽管激活参数量不大,Ling-mini-2.0在下游任务中的表现依然可以媲美100亿参数以下稠密LLM及更大规模MoE模型的顶尖水平。

二、推理模型Ring系列

Ring系列模型专注于增强模型的逻辑推理和问题解决能力。

Ring-1T:全球首个万亿参数推理模型

Ring-1T是全球首个开源的万亿参数推理大模型,同时也是百灵混合专家(MoE)推理模型Ring系列中尺寸最大、推理能力最强的旗舰版本。该模型采用了icepop方法进行RLVR训练,具备卓越的自然语言推理能力。在AIME25、CodeForces、HMMT25、LiveCodeBench、ARC-AGI-v1等一系列高难度测试中,Ring-1T均取得了SOTA(State-of-the-Art)表现,多项指标位居开源模型前列。

Ring-flash-2.0:深度优化,创意无限

Ring-flash-2.0是基于Ling-flash-2.0 MoE架构深度优化的思考模型。它拥有1000亿(100B)的总参数,但在每次推理中仅激活61亿(6.1B)参数,以稀疏且高效的方式完成推理任务。该模型通过独创的icepop算法,成功解决了MoE强化学习训练中的不稳定性问题,使其复杂推理能力在长周期训练中得以持续提升。Ring-flash-2.0在数学竞赛、代码生成以及逻辑推理等多个高难度基准测试中取得了突破性进展,其性能超越了400亿参数规模以下的稠密模型,并且还拥有推理模型中较为罕见的出色创意写作能力。

Ring-mini-2.0:高速省心,推理优选

Ring-mini-2.0是基于Ling-mini-2.0 MoE架构深度优化的推理模型。它在逻辑推理、代码与数学任务方面表现卓越。此外,该模型兼具“快”(支持12.8万(128K)长上下文,高达300+ token/s的高速生成)与“省”(总参数量160亿(16B),激活14亿(1.4B)即可达到100亿参数以下稠密模型的综合推理能力)的特点,是资源有限情况下的理想推理模型选择。

三、多模态模型Ming系列

Ming系列模型将提供强大的多模态理解与生成能力,应用场景极为丰富多样。

声明:请注意,信息可能并非最新。如需获取最准确、最新的AI工具详情,请访问 百灵大模型 官方网站。

综合评分
0.0/5
0人评分
评分分布

评论记录

未查询到任何数据!

发表评论

微信扫一扫

AI工具收录模版下载