快科技6月29日消息,DeepSeek团队今日官宣,DeepSeek V4正式版计划于7月中旬正式上线,新版本将带来更多功能优化与性能提升。
与此同时,为了更合理地分配算力资源、提升服务稳定性,DeepSeek宣布正式版上线后将同步调整API定价策略,引入"峰谷定价"机制。

根据官方价格表,API在高峰时段的价格将是平时的2倍,每天的高峰时段定为上午9点至12点、下午2点至6点,其余时间均按平时价格计费,与现行的DeepSeek V4 API定价保持一致。
以高峰期时段为例,V4-Flash的API定价输入每百万token仅2元(缓存命中低至0.02元),输出每百万token为4元,V4-Pro受算力成本影响价格相对偏高,输入每百万token为6元(缓存命中1元),输出每百万token为12元。
据此前报道,DeepSeek V4预览版已于今年4月24日上线并同步开源,主打百万字超长上下文,在Agent能力、世界知识与推理性能等方面均达到国内及开源领域的领先水平。
按照模型规模,V4分为两个版本,均采用MoE混合专家架构,其中旗舰版V4-Pro总参数达1.6万亿、激活参数490亿,定位高性能,适合处理复杂任务。
轻量版V4-Flash总参数2840亿、激活参数130亿,推理开销与显存占用大幅降低,主打快捷、经济,响应更快、成本更低。

两个版本均原生支持100万token的超长上下文,并采用MIT开源协议,开发者可免费商用与二次开发。
技术层面,V4系列最大的亮点在于全新的注意力机制,它在token维度进行压缩,并结合DSA稀疏注意力方案,大幅削减了计算与显存开销。
因此V4在百万token场景下的推理计算量仅为前代V3.2的约27%,显存占用更是低至10%,长上下文处理效率显著提升,同时也更好地支撑了Agent与代码生成场景。
官方此前表示,待下半年昇腾950批量上市后,Pro版本价格还将进一步大幅下调,目前DeepSeek V4预览版可通过官网、App、API及本地部署等多种方式使用。

