DeepSeek

2天前更新 81 0 0
DeepSeekDeepSeek
DeepSeek深度求索 是中国顶尖的大模型公司,以超强推理、超长上下文、极致性价比、全开源为核心标签,旗下 V3/V4 系列是腾讯元宝的主力引擎之一。

一、公司概况

  • 全称:杭州深度求索人工智能基础技术研究有限公司
  • 成立:2023 年 7 月,由幻方量化孵化
  • 定位:通用大模型 + 推理 + 代码 + 长文本 + 多模态
  • 核心标签推理强、上下文长、成本低、全开源

二、核心模型家族(2026 最新)

1. DeepSeek V3(主力通用模型)

  • 参数:67B/236B(MoE),推理仅激活部分参数
  • 上下文:32K–128K tokens
  • 优势中文理解、逻辑推理、代码生成、长文档处理极强
  • 应用:腾讯元宝、企业 API、本地部署

2. DeepSeek R1(推理专精)

  • 定位数学 / 代码 / 复杂逻辑推理专用模型
  • 特点:纯强化学习训练,思维链极长,推理接近 OpenAI o1
  • 成本:训练仅约558 万美元,API 价格仅 GPT-4 的 1/10

3. DeepSeek V4(2026 年 2 月发布,新一代旗舰)

  • 上下文100 万 + tokens(约 500 万字)
  • 编程:SWE-Bench Verified 83.7%,全球第一
  • 多模态:原生支持文本 + 图像 + 视频
  • 效率:适配国产芯片,成本仅海外顶级模型的1/40

三、核心技术优势

  • MoE 混合专家:总参数量大、推理激活少,速度快、成本低
  • 超长上下文:V4 支持百万级 token,适合法律、代码库、长文档
  • 强化学习:R1 用纯 RL 大幅提升数学 / 代码 / 逻辑能力
  • 全开源:7B/13B/67B 等权重开源,支持商用与二次开发
  • 国产算力适配:深度优化华为昇腾、海光 DCU 等,支持信创部署

四、价格与生态(2026)

  • API 定价:输入约1 元 / 百万 token,输出约16 元 / 百万 token
  • 开源:模型权重、代码开放,社区活跃
  • 入口:官网、API、腾讯元宝、第三方平台、本地部署

五、典型应用场景

  • C 端:AI 助手(如腾讯元宝)、写作、编程、长文档分析
  • 企业:金融风控、法律文书、代码开发、政务服务、智能客服
  • 开发者:本地部署、模型微调、构建行业应用

数据统计

相关导航

暂无评论

none
暂无评论...