合韵网

DeepSeek上新!开源发布DeepSeek-Prover-V2-671B新模型 !

4月30日消息,今日下午,DeepSeek 在 AI 开源社区 Hugging Face 发布了一个名为 DeepSeek-Prover-V2-671B 的新模型

据介绍,DeepSeek-Prover-V2-671B 其参数量达到6710亿,使用了更高效的 safetensors 文件格式,并支持 BF16、FP8、F32 等多种计算精度,方便模型更快、更省资源地训练和部署。

在模型架构上,该模型使用了DeepSeek-V3架构,采用MoE(混合专家)模式,具有61层Transformer层,7168维隐藏层。

同时支持超长上下文,最大位置嵌入达163840,使其能处理复杂的数学证明,并且采用了FP8量化,可通过量化技术减小模型大小,提高推理效率。

有网友分析,该模型被视为 Prover-V1.5的升级版,专注于形式化定理证明,专门用于攻克数学难题,擅长自动证明定理和复杂计算,类似于 AlphaGo 在围棋中的自我对弈方式。

接下来它的性能测试表现会如何,值得期待。

DeepSeek上新!开源发布DeepSeek-Prover-V2-671B新模型 !-图1

DeepSeek上新!开源发布DeepSeek-Prover-V2-671B新模型 !-图2

DeepSeek上新!开源发布DeepSeek-Prover-V2-671B新模型 !-图3


部分文字图片来源于网络,本站仅供网络存储,主要目的在于分享信息,版权归原作者所有,无意中侵犯了您的知识产权,如有侵权请联系我们。 转载请注明出处:http://cxxpxx.com/news/6322.html

分享:
扫描分享到社交APP
上一篇
下一篇