CNBC報導,中國一家鮮為人知的AI實驗室DeepSeek,在去年底推出的免費開源大型語言模型,儘管製造成本不到600萬美元、使用的晶片也就是輝達功能較低的H800晶片,但在多項測試中,其性能已超越美國最好模型,也讓美國在AI領域的領先地位遭到威脅。另據華爾街見聞25日報導,AMD宣布,已將新的DeepSeek-V3模型集成到Instinct MI300X GPU上,該模型旨在與SGLang一起實現最佳性能。DeepSeek-V3針對Al推理進行了優化。
在一次第三方基準測試中,不論從複雜的問題解決到數學與寫程式,DeepSeek模型在準確性的表現都超出Meta的 Llama 3.1、OpenAI 的 GPT-4o 和Anthropic 的 Claude Sonnet 3.5 。
此外DeepSeek在20日發布的推理模型r1, 在許多第三方測試中也優於OpenAI 最新的 o1。
微軟執行長納德拉(Satya Nadella)表示,「看到DeepSeek的新模型,無論是在開源模型的表現,還是在推理過程中的計算效率,都令人印象相當深刻。我們應該非常認真看待來自中國的發展。」
主要為OpenAI、Google 和 Meta 等主要 AI參與者提供訓練數據的Scale AI公司執行長Alexandr Wang也警告,儘管過去十年,美國在AI競賽中領先中國,但後者憑藉DeepSeek開源模式已經迅速趕上了美國。
新聞來源/ 中時新聞網
圖檔來源 / DeepSeek / OpenAI