DeepSeek-V3.2-Exp 模型正式发布并开源

DeepSeek-V3.2-Exp 模型正式发布并开源

DeepSeek-V3.2-Exp 模型今日正式发布,这是一个实验性的版本。作为迈向新一代架构的中间步骤,该模型在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。目前官方应用程序、网页端、小程序均已同步更新为 DeepSeek-V3.2-Exp模型,同时 API 大幅度降价。在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。在各领域的公开评测集上,DeepSeek-V3.2-Exp 的表现与V3.1-Terminus基本持平。

—— DeepSeek

*

发表评论 (0)
后一页 前一页