AI 智能
DeepSeek:人工智能领域的破局者与革新者
2025-02-01 21:10
在全球人工智能发展浪潮中,中国杭州的初创企业——深度求索(DeepSeek),以惊人速度闯入国际视野,成为耀眼新星。它凭借卓越的大语言模型,引得国际顶尖学术期刊《Nature》连发三篇文章深度剖析,成为全球AI领域焦点。
DeepSeek成立于2023年7月17日 ,由幻方量化创立。成立后,它在AI领域发展迅猛。2024年1月5日,发布首个大模型DeepSeek LLM,包含670亿参数,在2万亿token数据集上训练,涵盖中英文。其在推理、编码、数学和中文理解等方面超越Llama2 70B base ,奠定了发展基础。同年5月,开源第二代MoE大模型DeepSeek - V2,性能比肩GPT - 4 Turbo,价格却只有GPT - 4的百分之一,因此收获“AI届拼多多”的名号。此后,DeepSeek持续创新,9月5日升级推出DeepSeek V2.5,12月26日上线并开源DeepSeek - V3首个版本,在知识类任务上表现突出,生成速度大幅提高。
进入2025年,DeepSeek发展更令人瞩目。1月20日,发布部分开源的“推理”模型DeepSeek - R1 。虽训练数据未公开,但其解决科学问题的能力达到与GPT - o1相近水平,标志着中国在大语言模型推理技术上取得重大突破。1月28日,DeepSeek推出Janus - Pro - 7b模型,专注图像生成领域,能根据文本提示生成图像。在“文生图”上,性能与DALL - E3以及StableDiffusion相当,为艺术创作、设计等行业带来新机遇。