DeepSeek：颠覆AI算力格局的开源模型与幻方量化的战略布局

author 阅读：19 2025-02-12 06:03:28 评论：0

DeepSeek的横空出世，正在重塑AI行业的竞争格局。这家由幻方量化投资的AI公司，凭借其低成本、高性能的开源模型DeepSeek-R1和Janus-Pro-7B，挑战了传统AI训练对算力的巨大需求，以及科技巨头对AI领域的垄断。DeepSeek-R1在性能上可与OpenAI的o1模型媲美，却以远低于巨头公司成本的560万美元训练完成，其创新之处在于R1-Zero方法，直接将强化学习应用于基础模型，无需依赖SFT和已标注数据，并利用数据蒸馏技术提升训练效率。Janus-Pro-7B更是参数量仅为70亿，却在多模态基准测试中超越了DALL-E 3。DeepSeek的成功，与其背后的投资方幻方量化密不可分。作为一家大型量化投资机构，幻方量化早在2019年就开始囤积GPU，为DeepSeek的研发提供了强大的算力支持。DeepSeek的开源策略，不仅降低了AI技术门槛，也对英伟达等依赖高端GPU的科技巨头构成了威胁。DeepSeek绕过CUDA，使用PTX编程方式进行优化，这使得市场对英伟达未来发展产生担忧，其股价及相关科技公司股价也因此下跌。DeepSeek的出现，暗示AI算力需求可能存在泡沫，其低成本高效能的模式，可能会改变AI初创企业的运营模式和硬件需求结构，并引发AI算力市场格局的重大变化。然而，幻方量化自身也持有大量英伟达芯片，其未来策略和DeepSeek对英伟达的影响还有待观察。