有一個新的城裡的玩家,你可能想關注這個。
週一,中國人工智慧公司深度搜尋推出了新的開源大型語言模型,稱為 DeepSeek R1。
根據 DeepSeek 的說法,R1 勝過其他流行的 LLM(大型語言模型),例如在幾個重要基準,它是特別好數學、編碼和推理任務。
推文可能已被刪除
DeepSeek R1 實際上是 DeepSeek R1 Zero 的改進,它是一個 LLM,沒有使用傳統使用的稱為監督微調的方法進行訓練。這使得它在某些任務中非常有能力,但正如 DeepSeek 自己所說,Zero 的「可讀性和語言混合性很差」。輸入 R1,它透過在使用強化學習進行訓練之前合併「多階段訓練和冷啟動資料」來解決這些問題。
可混搭光速
撇開神秘的技術語言不談(詳細資料是在線的如果您有興趣),您應該了解有關 DeepSeek R1 的幾個關鍵事項。首先,它是開源的,這意味著它需要接受專家的審查,這應該會減輕人們對隱私和安全的擔憂。其次,它可以作為網頁應用程式免費使用,而 API 存取則需要付費。很便宜(一百萬個輸入代幣為 0.14 美元,相較之下開放人工智慧最強大的推理模型 o1) 售價 7.5 美元。
最重要的是,這東西功能非常非常強大。為了測試它,我立即將它扔進深水區,要求它編寫一個相當複雜的網絡應用程序,該應用程序需要解析公開數據,並為遊客創建一個包含旅行和天氣信息的動態網站。令人驚訝的是,DeepSeek 立即產生了完全可接受的 HTML 程式碼,並且能夠根據我的輸入進一步完善網站,同時一路改進和優化程式碼。
我會做所有這些......明天。 圖片來源:Stan Schroeder / Mashable / DeepSeek
我還要求它在五分鐘內提高我的棋藝,它回復了一些條理清晰且非常有用的提示(我的棋藝沒有提高,只是因為我懶得真正去執行 DeepSeek 的建議) 。
然後我要求 DeepSeek 用三句話來證明它有多聰明。我的舉動很糟糕,因為我身為人類,還不夠聰明,無法驗證甚至完全理解這三個句子中的任何一個。請注意,在下面的螢幕截圖中,您可以看到 DeepSeek 在計算出答案時的“思維過程”,這可能比答案本身更令人著迷。
我們明白了,你很聰明。 圖片來源:Stan Schroeder / Mashable / DeepSeek
使用起來令人印象深刻。但作為ZDnet 指出在這一切的背景下,訓練成本比一些競爭模型低幾個數量級,而且晶片的功能不如美國人工智慧公司現有的晶片。因此,DeepSeek 表明,具有推理能力的極其聰明的人工智慧的訓練或使用成本並不一定非常昂貴。