DeepSeek:颠覆AI算力格局的开源模型与幻方量化的战略布局

author 阅读:19 2025-02-12 06:03:28 评论:0

DeepSeek的横空出世,正在重塑AI行业的竞争格局。这家由幻方量化投资的AI公司,凭借其低成本、高性能的开源模型DeepSeek-R1和Janus-Pro-7B,挑战了传统AI训练对算力的巨大需求,以及科技巨头对AI领域的垄断。DeepSeek-R1在性能上可与OpenAI的o1模型媲美,却以远低于巨头公司成本的560万美元训练完成,其创新之处在于R1-Zero方法,直接将强化学习应用于基础模型,无需依赖SFT和已标注数据,并利用数据蒸馏技术提升训练效率。Janus-Pro-7B更是参数量仅为70亿,却在多模态基准测试中超越了DALL-E 3。DeepSeek的成功,与其背后的投资方幻方量化密不可分。作为一家大型量化投资机构,幻方量化早在2019年就开始囤积GPU,为DeepSeek的研发提供了强大的算力支持。DeepSeek的开源策略,不仅降低了AI技术门槛,也对英伟达等依赖高端GPU的科技巨头构成了威胁。DeepSeek绕过CUDA,使用PTX编程方式进行优化,这使得市场对英伟达未来发展产生担忧,其股价及相关科技公司股价也因此下跌。DeepSeek的出现,暗示AI算力需求可能存在泡沫,其低成本高效能的模式,可能会改变AI初创企业的运营模式和硬件需求结构,并引发AI算力市场格局的重大变化。然而,幻方量化自身也持有大量英伟达芯片,其未来策略和DeepSeek对英伟达的影响还有待观察。

可以去百度分享获取分享代码输入这里。
声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

发表评论
搜索
排行榜