DeepSeek：人工智能领域的破局者与革新者_AI 智能_资讯

DeepSeek：人工智能领域的破局者与革新者

2025-02-01 21:10

在全球人工智能发展浪潮中，中国杭州的初创企业——深度求索（DeepSeek），以惊人速度闯入国际视野，成为耀眼新星。它凭借卓越的大语言模型，引得国际顶尖学术期刊《Nature》连发三篇文章深度剖析，成为全球AI领域焦点。
DeepSeek成立于2023年7月17日，由幻方量化创立。成立后，它在AI领域发展迅猛。2024年1月5日，发布首个大模型DeepSeek LLM，包含670亿参数，在2万亿token数据集上训练，涵盖中英文。其在推理、编码、数学和中文理解等方面超越Llama2 70B base ，奠定了发展基础。同年5月，开源第二代MoE大模型DeepSeek - V2，性能比肩GPT - 4 Turbo，价格却只有GPT - 4的百分之一，因此收获“AI届拼多多”的名号。此后，DeepSeek持续创新，9月5日升级推出DeepSeek V2.5，12月26日上线并开源DeepSeek - V3首个版本，在知识类任务上表现突出，生成速度大幅提高。
进入2025年，DeepSeek发展更令人瞩目。1月20日，发布部分开源的“推理”模型DeepSeek - R1 。虽训练数据未公开，但其解决科学问题的能力达到与GPT - o1相近水平，标志着中国在大语言模型推理技术上取得重大突破。1月28日，DeepSeek推出Janus - Pro - 7b模型，专注图像生成领域，能根据文本提示生成图像。在“文生图”上，性能与DALL - E3以及StableDiffusion相当，为艺术创作、设计等行业带来新机遇。