7月上线！DeepSeek V4正式版官宣：将引入峰谷定价机制-快科技-科技改变生活

快科技6月29日消息，DeepSeek团队今日官宣，DeepSeek V4正式版计划于7月中旬正式上线，新版本将带来更多功能优化与性能提升。

与此同时，为了更合理地分配算力资源、提升服务稳定性，DeepSeek宣布正式版上线后将同步调整API定价策略，引入"峰谷定价"机制。

7月上线！DeepSeek V4正式版官宣：将引入峰谷定价机制

根据官方价格表，API在高峰时段的价格将是平时的2倍，每天的高峰时段定为上午9点至12点、下午2点至6点，其余时间均按平时价格计费，与现行的DeepSeek V4 API定价保持一致。

以高峰期时段为例，V4-Flash的API定价输入每百万token仅2元（缓存命中低至0.02元），输出每百万token为4元，V4-Pro受算力成本影响价格相对偏高，输入每百万token为6元（缓存命中1元），输出每百万token为12元。

据此前报道，DeepSeek V4预览版已于今年4月24日上线并同步开源，主打百万字超长上下文，在Agent能力、世界知识与推理性能等方面均达到国内及开源领域的领先水平。

按照模型规模，V4分为两个版本，均采用MoE混合专家架构，其中旗舰版V4-Pro总参数达1.6万亿、激活参数490亿，定位高性能，适合处理复杂任务。

轻量版V4-Flash总参数2840亿、激活参数130亿，推理开销与显存占用大幅降低，主打快捷、经济，响应更快、成本更低。

7月上线！DeepSeek V4正式版官宣：将引入峰谷定价机制

两个版本均原生支持100万token的超长上下文，并采用MIT开源协议，开发者可免费商用与二次开发。

技术层面，V4系列最大的亮点在于全新的注意力机制，它在token维度进行压缩，并结合DSA稀疏注意力方案，大幅削减了计算与显存开销。

因此V4在百万token场景下的推理计算量仅为前代V3.2的约27%，显存占用更是低至10%，长上下文处理效率显著提升，同时也更好地支撑了Agent与代码生成场景。

官方此前表示，待下半年昇腾950批量上市后，Pro版本价格还将进一步大幅下调，目前DeepSeek V4预览版可通过官网、App、API及本地部署等多种方式使用。