JoyAI-LLM-Flash – 京东开源的混合专家架构大模型

JoyAI-LLM-Flash 是京东开源的中型指令大模型,采用混合专家(MoE)架构,总参数量 48B,激活参数量仅 3B,支持 128K 超长上下文。模型创新性地引入 FiberPO 优化框架——首次将纤维丛理论应用于强化学习,结合 Muon 优化器进行 SFT、DPO 及 RL 训练;同时采用稠密多 Token 预测(MTP)技术,相较非 MTP 版本吞吐量提升 1.3-1.7 倍。

新闻资讯 2026-05-20 PPISO
2 0

文章摘要

JoyAI-LLM-Flash 是京东开源的中型指令大模型,采用混合专家(MoE)架构,总参数量 48B,激活参数量仅 3B,支持 128K 超长上下文。模型创新性地引入 FiberPO 优化框架——首次将纤维丛理论应用于强化学习,结合 Muon 优化器进行 SFT、DPO 及 RL 训练;同时采用稠密多 Token 预测(MTP)技术,相较非 MTP 版本吞吐量提升 1.3-1.7 倍。

特别声明

本文内容由 PPISO 编辑整理发布,仅作为工具选择、资料整理与效率实践参考。涉及第三方网站功能、价格和服务条款时,请以对应官方网站信息为准。

原文链接:http://ainav.ppiso.com/xwzx/475.html

本文标签

这篇文章暂未设置标签。

相关阅读

暂无相关阅读。

评论交流

暂无评论,欢迎留下你的看法。