文章正文

新选组

科大讯飞星火 X2-Flash 模型发布:基于华为昇腾 910B 集群训练,最大 256K 上下文_蜘蛛资讯网

尘白禁区重新开服

过亲和国产芯片的算子和分布式训练策略深度优化实现训练效率相比同规模 A800 集群从 20% 提升到 90%,解决了智能体长上下文在国产芯片训练慢的难题。在智能体强化学习训练场景,星火 X2-Flash 通过上述的算法创新 + 工程创新,大幅提升了采样推理效率,相对于非 DSA 结构的采样解码效率最高可以提升 2 倍以上。该突破,一定程度缓解了 910B 上智能体长交互场景下采样效率过低影响 RL

,阿门·汤普森被问认为球队阵容会有什么变化,他摇了摇头说:“我不回答这个问题,抱歉。”本场比赛阿门出战44分33秒,14投7中,罚球6中4,没有出手三分球,拿到18分8篮板3助攻3盖帽,正负值-26。

发布,同步开放 API。星火 X2-Flash 采用 MoE 架构,总参数 30B,最大支持 256K 上下文,宣称在智能体、代码等能力上实现了大幅提升,基于华为昇腾 910B 集群训练完成。目前,AstronClaw、Loomy 已率先接入星火 X2-Flash。科大讯飞表示,经 AstronClaw 实测,星火 X2-Flash 在深度研究报告、Skill 管理与调用、系统控制与执行等多类“养

当前文章:http://2plvxou.nuoboluo.cn/fb6/ga1f.html

发布时间:08:18:09


|