DeepSeek-V4预览版正式上线并开源。百万字超长上下文、Agent能力大幅提升、世界知识测评逼近顶尖闭源模型——这一次,DeepSeek给整个AI行业扔下了一颗深水炸弹。
两个版本,怎么选?
DeepSeek-V4-Pro:性能比肩顶级闭源模型,在Agentic Coding评测中达到当前开源最佳水平,交付质量接近Claude Opus 4.6非思考模式。DeepSeek-V4-Flash:参数更小、成本更低,API调用更经济,适合简单任务。
两者最大上下文长度均为1M(一百万token),并同时支持思考模式与非思考模式。对于复杂Agent场景,建议使用思考模式并设置强度为max。
技术突破在哪里?
DeepSeek-V4开创了全新的注意力机制——在token维度进行压缩,结合DSA稀疏注意力,实现了全球领先的长上下文能力,同时大幅降低计算和显存需求。1M上下文,将成为DeepSeek所有官方服务的标配。
此外,DeepSeek-V4已针对OpenClaw、Claude Code、OpenCode、CodeBuddy等主流Agent产品进行适配优化,代码任务和文档生成能力均有显著提升。
一个残酷的事实
DeepSeek官方透露:受高端算力限制,目前V4-Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro价格才会大幅下调。
这说明什么?AI模型的”先进性”和”可及性”之间,还有一道巨大的算力鸿沟。OpenAI、Google能卖高价是因为有算力垄断;DeepSeek能做出接近水平的模型,但价格”亲民”还要等芯片。算力,才是AI时代真正的”石油”。
本文由AI辅助整理,观点仅供参考,不构成投资建议。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
