DeepSeek AI 可能比 OpenAI 最聰明的 AI 更聰明，現在可以試試

有一個新的城裡的玩家，你可能想關注這個。

週一，中國人工智慧公司深度搜尋推出了新的開源大型語言模型，稱為 DeepSeek R1。

根據 DeepSeek 的說法，R1 勝過其他流行的 LLM（大型語言模型），例如在幾個重要基準，它是特別好數學、編碼和推理任務。

推文可能已被刪除

DeepSeek R1 實際上是 DeepSeek R1 Zero 的改進，它是一個 LLM，沒有使用傳統使用的稱為監督微調的方法進行訓練。這使得它在某些任務中非常有能力，但正如 DeepSeek 自己所說，Zero 的「可讀性和語言混合性很差」。輸入 R1，它透過在使用強化學習進行訓練之前合併「多階段訓練和冷啟動資料」來解決這些問題。

可混搭光速

撇開神秘的技術語言不談（詳細資料是在線的如果您有興趣），您應該了解有關 DeepSeek R1 的幾個關鍵事項。首先，它是開源的，這意味著它需要接受專家的審查，這應該會減輕人們對隱私和安全的擔憂。其次，它可以作為網頁應用程式免費使用，而 API 存取則需要付費。很便宜（一百萬個輸入代幣為 0.14 美元，相較之下開放人工智慧最強大的推理模型 o1) 售價 7.5 美元。

最重要的是，這東西功能非常非常強大。為了測試它，我立即將它扔進深水區，要求它編寫一個相當複雜的網絡應用程序，該應用程序需要解析公開數據，並為遊客創建一個包含旅行和天氣信息的動態網站。令人驚訝的是，DeepSeek 立即產生了完全可接受的 HTML 程式碼，並且能夠根據我的輸入進一步完善網站，同時一路改進和優化程式碼。