前沿资讯
1782544688更新
0
DeepSeek 今天开源了一个新项目,叫 DeepSpec。
这个项目解决的是一个很实际的问题:让 AI 跑得更快。
根据官方在 DeepSeek-V4 生产环境里的测试数据,Flash 模型生成速度提升 60%-85%,Pro 模型生成速度提升 57%-78%。翻译成人话就是,原来等 5 秒的回复,以后可能 1 秒就能看到。

现在就跟大家聊聊这个项目,以及它可能带来的影响。
大家用 AI 的时候,有没有遇到过这种情况:问了一个问题,要等好几秒才开始回复。
这个问题的根源在于,AI 生成内容的方式比较特殊。它不是一次性把答案全部吐出来,而是一个字一个字的往外蹦。每个新字都要把之前的内容全部重新算一遍。这就导致一个问题:AI 很强,但反应慢。 尤其是在需要快速响应的场景,比如实时对话、代码补全,这个等待就很影响体验。
那怎么让 AI 跑得更快呢?一个常见的做法是"投机解码"。
它的核心是让 AI 不是一个人在算,而是找个"助手"来帮忙。具体是这样的:助手先快速猜测接下来可能要生成的字,猜出一串候选答案来,然后主模型一次性验证这串答案。猜对了直接过关,猜错了再重来。整个过程可以并行处理,速度就上来了。这个思路本身不是全新的,学术界早就有人在研究。
DeepSeek 这次开源的 DeepSpec,就是来解决这个问题的。它的定位是一个完整的代码库,用来训练和评估"草稿模型"。简单来说,就是提供了一套工具,让开发者可以训练出能让 AI 跑得更快的辅助模型。项目包含数据准备工具、草稿模型实现、训练代码和评估脚本,一整套流程都覆盖了。
说到这,可能有朋友会问,不是已经有很多这类方案了吗?
DeepSpec 并不是从零发明了一套东西,而是把目前业界几种主流的方案都做了实现和整合。
项目目前支持三种草稿模型算法。
第一种是 DFlash,来自 DFlash 开源项目。它的设计理念是追求极致速度,采用完全并行的方式生成候选答案。好处是快,但当需要猜的 token 数量变多的时候,准确率会下降。
第二种是 Eagle3,来自 Eagle 开源算法。它采用完全顺序的方式生成候选答案,每个答案都依赖前一个。这样准确率高,但速度相对慢一些。
第三种是 DSpark,这是 DeepSeek 与北京大学联合研发的算法。

DSpark 的思路是把上面两种思路结合起来。它采用半自回归架构,用并行主干网络快速生成候选,再用轻量级顺序模块补充 token 之间的依赖关系。这样既保留了并行生成的速度优势,又解决了后面内容质量差的问题。你可以理解成:第一步是大规模海选,快速筛出一批可能对的答案。第二步是精准调优,用已知的线索来提高命中率。
这样做的好处是,同时兼顾了速度和多步推理的准确性。根据官方给出的数据,在 DeepSeek-V4 生产环境里实测,Flash 模型生成速度提升 60%-85%,Pro 模型提升 57%-78%。在吞吐量方面,根据不同场景,提升幅度可以从 51% 一直到 400% 不等。
DSpark 还有一个挺有意思的设计,叫置信度调度。它能从 Markov 头那里得到一个数字,反映模型对自己预测的确信程度。当 GPU 负载高的时候,模型可以据此少猜几个 token,把资源留给真正需要的地方。这是一种动态的负载均衡。
说了这么多技术的东西,可能有朋友要问了,这跟我有什么关系?
关系还挺大的。
第一,你可能已经在体验到了。 DeepSeek 已经在自己的 DeepSeek-V4 产品里部署了这项技术。DeepSeek-V4-Pro-DSpark 和 DeepSeek-V4-Flash-DSpark 都包含了 DSpark 加速模块。如果你是 DeepSeek 的用户,可以留意一下响应速度有没有变化。
第二,不只 DeepSeek 自己能用。 官方测试显示,DSpark 对其他开源模型同样有效,包括 Google 的 Gemma、阿里的 Qwen。这意味着其他 AI 服务的提供商也可以用这套技术来加速。以后你用这些模型的时候,也可能体验到更快的响应速度。

第三,更多实时应用变得可行。 比如 AI 辅助编程、实时语音对话这类,之前因为延迟太高体验不好,以后会越来越好用。
说白了,AI 能力再强,用起来慢、贵、卡顿,也难以真正普及。优化推理速度这件事,是 AI 大规模落地的关键一步。
那 DeepSpec 这件事怎么看呢?
我觉得关键不在于技术本身有多新,而是 DeepSeek 这次把这件事做得很完整。DSpark 论文、DeepSpec 代码仓库、DeepSeek-V4-Pro-DSpark 和 DeepSeek-V4-Flash 两个模型,全部同步开源。开发者下载改改配置就能用,不只是发一篇论文就完事了。
我比较关注的是,这类优化什么时候能用到更多产品里。毕竟官方数据和真实体验之间,还有一定距离。但不管怎么说,这是个好消息。
豫公网安备41010702003375号