DeepSeek的优势

无论是国产大模型(通义千问、文心一言、混元大模型、豆包等)还是ChatGPT都面临一些非常严重的问题,如算力消耗大训练成本高数据质量与多样性不足不足等问题。DeepSeek的出现在一定程度上面解决了这些问题。

传统的国产大模型ChatGPT均高度依赖英伟达的高性能AI芯片,如A100、H100系列。然而,高昂的价格加之国际关系的复杂性,使得国内企业在获取这些高性能芯片时面临重重限制,这无疑给国产大模型的发展之路增添了不小的挑战。

DeepSeek的出现在一定程度上打破了芯片的封锁,DeepSeek通过算法优化模型轻量化方面的创新让AI大模型不再高度依赖高性能芯片也能达到相同的效果。

DeepSeek发布了几个具有突破性的AI模型,如DeepSeek-R1和DeepSeek-V3。这些模型不仅在数学、编程和推理任务上达到了与OpenAI的o1模型相媲美的水平,而且其训练成本远低于竞争对手。例如,DeepSeek-R1的预训练费用只有557.6万美元,而相比之下,OpenAI训练ChatGPT-4的成本高达7800万至1亿美元

image-20250131224217845.png

DeepSeek的强大、便宜、开源、免费、联网和本土等优势已全面超越了OpenAI、Meta、Google等AI巨头。它的横空出世,让硅谷多位AI大佬刮目相看,无论是微软CEO还是OpenAI的投资人都公开表达,DeepSeek-R1作为开源模型在推理计算能力的出色表现。令人印象深刻的是,DeepSeek的横空出世当天导致国外科技股及相关行业股票大幅下跌,其中英伟达市值单日蒸发近6000亿美元,整个美股科技股市值蒸发高达1.2万亿美元。这一数字创下了美国股市历史上最大的单日市值蒸发纪录。


回到顶部