DeepSeek的优势

无论是国产大模型（通义千问、文心一言、混元大模型、豆包等）还是ChatGPT都面临一些非常严重的问题，如算力消耗大、训练成本高、数据质量与多样性不足不足等问题。DeepSeek的出现在一定程度上面解决了这些问题。

传统的国产大模型与ChatGPT均高度依赖英伟达的高性能AI芯片，如A100、H100系列。然而，高昂的价格加之国际关系的复杂性，使得国内企业在获取这些高性能芯片时面临重重限制，这无疑给国产大模型的发展之路增添了不小的挑战。

DeepSeek的出现在一定程度上打破了芯片的封锁，DeepSeek通过算法优化和模型轻量化方面的创新让AI大模型不再高度依赖高性能芯片也能达到相同的效果。

DeepSeek发布了几个具有突破性的AI模型，如DeepSeek-R1和DeepSeek-V3。这些模型不仅在数学、编程和推理任务上达到了与OpenAI的o1模型相媲美的水平，而且其训练成本远低于竞争对手。例如，DeepSeek-R1的预训练费用只有557.6万美元，而相比之下，OpenAI训练ChatGPT-4的成本高达7800万至1亿美元

DeepSeek的强大、便宜、开源、免费、联网和本土等优势已全面超越了OpenAI、Meta、Google等AI巨头。它的横空出世，让硅谷多位AI大佬刮目相看，无论是微软CEO还是OpenAI的投资人都公开表达，DeepSeek-R1作为开源模型在推理计算能力的出色表现。令人印象深刻的是，DeepSeek的横空出世当天导致国外科技股及相关行业股票大幅下跌，其中英伟达市值单日蒸发近6000亿美元，整个美股科技股市值蒸发高达1.2万亿美元。这一数字创下了美国股市历史上最大的单日市值蒸发纪录。