当前位置:首页 → 电脑软件 → 68岁儿子笑着和98岁父亲顶嘴 → 蓝天报A v5.339.533.698580 安卓版
v2.33.7693.370947 最新版
v5.878.2085 安卓最新版
v8.672.2582 PC版
v9.3.9352.311817 安卓最新版
v4.279.2772.552072 IOS版
v1.132.4627 安卓漢化版
v4.612.9962 安卓最新版
v1.344.3064 安卓版
v4.312.3008.824104 PC版
v4.318 安卓漢化版
v8.422.4853.158566 安卓最新版
v8.680 安卓最新版
v2.902.1699.37581 安卓最新版
v2.637 IOS版
v4.201.268.385016 PC版
v3.978 安卓漢化版
v4.688 安卓最新版
v7.486.6767 IOS版
v9.381 IOS版
v5.737.4510.345276 安卓版
v8.904 安卓版
v1.791.2399.212453 安卓漢化版
v5.860 PC版
v9.985 安卓版
v7.225 安卓漢化版
v7.54.539 安卓漢化版
v7.644.8538.957088 安卓免費版
v2.25.7056.882152 安卓免費版
v6.81.5391.921247 安卓免費版
v6.117 IOS版
v6.910 安卓免費版
v9.313.5796.993627 安卓漢化版
v5.934.2007.151782 IOS版
v9.989.1621.784377 安卓免費版
v2.744.4663.415860 安卓漢化版
v5.242.6163 安卓最新版
v1.927 安卓免費版
v2.20.6411.442904 PC版
v4.817.1129.443661 PC版
v6.241 最新版
v8.762.9703 安卓最新版
v5.897.187.868125 安卓版
v2.430 PC版
v1.602.80 安卓漢化版
v9.69.1695.185439 安卓免費版
v2.260.1850.16019 安卓漢化版
v8.639.6550.6701 PC版
v5.632.3504 安卓版
v2.754.2577.579207 安卓最新版
v1.519 最新版
v3.636.6572.93917 IOS版
v7.793.2869 安卓漢化版
v4.539.8169 安卓漢化版
v2.218.6831 安卓最新版
v2.51.1614.599688 安卓免費版
v9.526.8618.173990 IOS版
v2.853.6550.43972 安卓漢化版
v8.807.3960.118827 安卓漢化版
v5.306.9819.67488 安卓漢化版
v8.288 安卓最新版
v7.727 PC版
v7.204.9565 IOS版
v3.714 PC版
v6.99 安卓免費版
v9.364.3242 安卓版
v9.109.6125.583780 安卓漢化版
v3.176 PC版
v5.922.335.120882 安卓版
v3.906.5317.753326 最新版
v1.483.4779.691867 安卓版
v1.510.9989.266196 PC版
v3.660.2026.991461 安卓漢化版
v4.640.1145.999261 IOS版
v1.696.1807.986988 PC版
v4.705.5213 安卓版
v4.952.3499.433490 安卓最新版
v5.799.336.126024 最新版
v3.192.1340 安卓版
v3.620.1721.902680 PC版
v6.545 安卓最新版
蓝天报A
被称为“价格屠夫”的DeepSeek再次挥刀降价了。
9月29日晚间,DeepSeek宣布正式发布 DeepSeek-V3.2-Exp模型,性能仍是稳步提升,但出乎意料的是,调用价格大幅降低,尤其输出价格大降75%,业界人士表示“这很难卷得过”。DeepSeek提到,在新价格政策下,开发者调用DeepSeek API的成本将降低50%以上。
具体来看,输入价格上,缓存命中时,DeepSeek-V3.2-Exp从0.5元/百万tokens降至0.2元/百万tokens,缓存未命中的价格则从4元/百万tokens降为2元/百万tokens;输出价格上,从12元/百万tokens直接降到了3元/百万tokens。
降价原因方面,DeepSeek介绍是得益于新模型服务成本的大幅降低。V3.2-Exp是一个实验性(Experimental)的版本,作为迈向新一代架构的中间步骤,在 V3.1-Terminus 的基础上这一模型引入了 DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。
简单来说,因为实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,可以实现长文本训练和推理效率的大幅提升。
DeepSeek介绍,为了严谨地评估引入稀疏注意力带来的影响,团队将 DeepSeek-V3.2-Exp 的训练设置与 V3.1-Terminus 进行了严格的对齐。在各领域的公开评测集上,DeepSeek-V3.2-Exp 的表现与 V3.1-Terminus 基本持平。
目前,DeepSeek-V3.2-Exp 模型已在Huggingface与魔搭开源,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp。API 的模型版本已经更新为 DeepSeek-V3.2-Exp,访问方式保持不变。
此外,为支持社区研究,DeepSeek 还开源了新模型研究中设计和实现的 GPU 算子,包括 TileLang 和 CUDA 两种版本。团队建议社区在进行研究性实验时,优先使用基于 TileLang 的版本,以便于调试和快速迭代。
值得一提的是,就在9月22日,DeepSeek才发布了DeepSeek-V3.1-Terminus模型,Terminus在拉丁语里是终点、界限的意思,当时业界猜测这是否会是V3系列的终极版本,并期待下一个发布的将是大版本更新,目前看起来这个猜测并不成立。
在年初海内外出圈后,DeepSeek每一次更新都成为业界瞩目的焦点,但这几个月以来DeepSeek几次更新都是小版本的迭代,新万博体育:V4和R2的呼声也越来越多。在DeepSeek这次 X平台上的官宣帖子下,就有海外网友询问“什么时候可以期待下一个V4和R2的版本”,很快有网友回复表示,结合这次发布来看近期并不会看到。
相关版本
多平台下载
查看所有0条评论>网友评论