℃
游戏类别:游戏工具
更新时间:2026-05-14 11:55:55
游戏评分
8.9
简体中文
DeepSeek V3.1是一款特别先进的人工智能AI软件。V3.1采用混合推理架构,一个模型同时支持思考模式与非思考模式,具有更高的思考效率。它就像一个拥有两种工作模式的超级大脑,当面对简单问题时,能以非思考模式快速给出答案。而在处理复杂问题时,可切换到思考模式,给出更具深度和逻辑的解答。通过训练优化,新模型在工具使用与智能体任务中的表现有较大提升。以往可能需要等待数秒甚至数十秒才能得到的分析结果,现在转瞬之间便呈现在眼前,大大提升了用户的使用体验和工作效率。

工具调用/智能体支持增强
编程智能体

在代码修复测评 SWE 与命令行终端环境下的复杂任务(Terminal-Bench)测试中,DeepSeek-V3.1 相比之前的 DeepSeek 系列模型有明显提高。
搜索智能体

DeepSeek-V3.1 在多项搜索评测指标上取得了较大提升。在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,DeepSeek-V3.1 性能已大幅领先 R1-0528。
思考效率提升
我们的测试结果显示,经过思维链压缩训练后,V3.1-Think 在输出 token 数减少 20%-50% 的情况下,各项任务的平均表现与 R1-0528 持平。

同时,V3.1 在非思考模式下的输出长度也得到了有效控制,相比于 DeepSeek-V3-0324 ,能够在输出长度明显减少的情况下保持相同的模型性能。
API & 模型开源
V3.1的 Base 模型在 V3 的基础上重新做了外扩训练,一共增加训练了 840B tokens。Base 模型与后训练模型均已在 Huggingface 与魔搭开源。
Base 模型:
Hugging Face:
魔搭:
后训练模型:
Hugging Face:
魔搭:
需要注意的是,DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的参数精度。另外,V3.1 对分词器及 chat template 进行了较大调整,与 DeepSeek-V3 存在明显差异。建议有部署需求的用户仔细阅读新版说明文档。
价格调整
我们将于北京时间 2025 年 9 月 6 日凌晨起,对 DeepSeek 开放平台 API 接口调用价格进行如下调整:
执行新版价格表(如下图所示,详见定价页面);
取消夜间时段优惠。

在 9 月 6 日前,所有 API 服务仍按原价格政策计费,您可继续享受当前优惠。
同时,为更好地满足用户的调用需求,我们已进一步扩容 API 服务资源,欢迎使用!
1、混合推理架构
一个模型同时支持思考模式与非思考模式。
2、更高的思考效率
相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短时间内给出答案。
3、更强的 Agent 能力
通过 Post-Training 优化,新模型在工具使用与智能体任务中的表现有较大提升。

DeepSeek:专业数据分析与知识挖掘助手
DeepSeek定位为专业场景下的数据分析和知识挖掘工具,专为技术与商业领域设计。
特点与优势:
强大的数据处理和技术文档解析能力。提供深入的知识图谱和报告生成功能。支持多领域的专业知识问答。
适用场景:
适合科研人员、企业决策者和需要深度分析的用户。?
豆包:轻松有趣的社交型助手
豆包定位为一款注重互动性和趣味性的AI助手,非常适合日常聊天和娱乐应用。
特点与优势:
响应快速,语言风格轻松幽默。擅长趣味问答、闲聊和简单信息查询。适合需要轻松交流或快速生成娱乐内容的用户。
适用场景:
适合日常生活中的娱乐需求,如调节心情或进行简单的知识探索。
总体来说,DeepSeek和豆包各有特色,因此,选择哪个更厉害取决于具体的应用场景和需求。

1、采用MoE架构。通过智能选择不同的专家模型进行计算,针对不同的任务激活相应的网络分支,实现计算资源的高效利用。
2、具有优秀的自然语言处理能力,还提供高效的代码编写辅助,满足用户在智能对话和编程支持方面的多样化需求。
3、软件得益于MoE架构和硬盘缓存技术的应用,在处理复杂任务时表现出色,计算效率高,响应快。

1、提供准确流畅的翻译服务,帮助用户轻松融入多语言环境。
2、解决理科难题,提供详细的解题思路和步骤,帮助用户抓住重点,深入理解。
3、用户可以将文献书籍、资料报告等上传给DeepSeek,APP会帮助梳理重点,快速理解。
4、根据指令自动生成创意文案,撰写各类文章和报告,快速构建内容框架,提升工作效率。
5、支持多种编程语言,快速定位问题,生成代码,提升编程效率。

1、调用模型时的并发限制是多少?是否可以提高账号的并发上限?
当前阶段,我们没有按照用户设置硬性并发上限。在系统总负载量较高时,基于系统负载和用户短时历史用量的动态限流模型可能会导致用户收到 503 或 429 错误码。
目前暂不支持针对单个账号提高并发上限,感谢您的理解。
2、为什么我感觉 API 返回比网页端慢
网页端默认使用流式输出(stream=true),即模型每输出一个字符,都会增量地显示在前端。
API 默认使用非流式输出(stream=false),即模型在所有内容输出完后,才会返回给用户。您可以通过开启 API 的 stream 模式来提升交互性。
3、为什么调用 API 时,持续返回空行?
为了保持 TCP 连接不会因超时中断,我们会在请求等待调度过程中,持续返回空行(非流式请求)或 SSE keep-alive 注释(: keep-alive,流式请求)。如果您在自己解析 响应,请注意处理这些空行或注释。
4、是否支持 LangChain?
支持。LangChain 支持 OpenAI API 接口,而 DeepSeek API 接口与 OpenAI 兼容。
DeepSeek V3.1在工具使用与智能体任务中的表现有了显著提升。新模型在面对各种复杂的智能体任务时,能够更加灵活、高效地运用工具,完成任务的质量和准确性都有了大幅提高。在智能办公场景中,它可以更好地协同各类办公软件,自动完成文档整理、数据分析等繁琐任务;在智能客服领域,能够更精准地理解用户需求,提供更贴心、高效的服务。
详细信息
精选手游MORE +
最新资讯MORE +