9月29日
DeepSeek公布
官方App、网页端、小步伐
均已经同步更新为
DeepSeek-V3.2-Exp
顾名思义
这是一款试验性
(Experimental)版本
用在摸索下一代架构的可能性
DeepSeek先容
患上益在新模子办事成本的
年夜幅降低
官方API价格也响应下调
于新的价格政策下
开发者挪用DeepSeek API的成本
将降低50%以上
作为迈向新一代架构的
中间步调
V3.2-Exp于此前版本基础上
引入了DeepSeek Sparse Attention
(一种稀少留意力机制)
针对于长文本的练习及推理效率
举行了摸索性的优化及验证
实现了长文本练习
及推理效率的年夜幅晋升
有媒体阐发
DeepSeek给出的旌旗灯号很明确
不仅要于架构层面摸索新路径
也要经由过程成本的降落
加快开发者的涌入
或者将鞭策DeepSeek生态
更年夜范围增加
今朝
华为云已经完成
对于DeepSeek-V3.2-Exp模子的
适配事情
最年夜可撑持
160K长序列上下文长度
寒武纪也发文称
公司已经同步实现对于深度求索公司
最新模子DeepSeek-V3.2-Exp的适配
并开源年夜模子推理引擎
vLLM-MLU源代码
DeepSeek也已经将
DeepSeek-V3.2-Exp模子
于Huggingface及
ModelScope平台上周全开源
相干论文
也已经同步公然
值患上一提的是
连日来
DeepSeek连续推进模子迭代
8月21日
公布发布DeepSeek-V3.1
9月22日
公布DeepSeek-V3.1已经更新至
DeepSeek-V3.1-Terminus版本
因Terminus于拉丁语里
是尽头、边界的意思
故其时业界预测这是否会是
V3系列的最终版本
并期待下一个发布的
将是年夜版本更新
今朝看起来这个预测其实不建立
撰文:李飞 编纂:雷渺鑫 兼顾:李政葳
参考:DeepSeek微信公家号、中国证券报、第一财经
-yp电子