AI專家對DeepSeek R1的評價

專家分享他們對DeepSeek的看法。 圖片來源:CFOTO / Future Publishing / Getty Images

一下子,無處不在。

它是是開源的,據稱接受了其他AI型號的成本的一小部分培訓,並且同樣好,甚至比Chatgpt好。

這種致命的組合,導致科技股滾滾,並使投資者質疑需要多少錢來開發良好的AI模型。DeepSeek工程師聲稱R1接受了2,788 GPU的培訓,費用約為600萬美元,而Openai的GPT-4則接受據說培訓成本1億美元。

DeepSeek的成本效率也挑戰了以下想法:更大的模型和更多數據會導致更好的性能。在關於DeepSeek的能力,對Openai這樣的AI公司的威脅以及對投資者驚慌失措的瘋狂對話中,很難理解正在發生的事情。但是,擁有資深經驗的人工智能專家卻具有寶貴的觀點。

DeepSeek證明了AI專家多年來一直在說什麼:更大並不好

受到貿易限制和進入NVIDIA GPU的障礙,總部位於中國的DeepSeek必須在開發和培訓R1方面具有創造力。他們只能以600萬美元的價格完成這項壯舉(從AI方面來說這不是很多錢)對投資者來說是一個啟示。

但是AI專家並不感到驚訝。 “在Google,我問他們為什麼要建立最大的型號。為什麼要提高尺寸?您要實現什麼功能?為什麼您對沒有最大的型號感到不滿意?回應我,”發表Timnit Gebru因在X上從Google召集AI偏見而聞名。

可混合的輕速速度

推文可能已被刪除

擁抱臉的氣候和AI負責人Sasha Luccioni指出,AI投資是如何穩固地建立在營銷和炒作上的。 “很瘋狂地暗示,一個(高性能)LLM能夠在不蠻力的情況下實現這一表現,而不得不使成千上萬的gpus的狗屎足以引起這一點,”盧科尼。

推文可能已被刪除

澄清為什麼DeepSeek R1如此重要

DeepSeek R1與關鍵基準測試的OpenAI O1模型相當。在數學,編碼和常識測試中,它略有超過,相等或低於O1。也就是說,還有其他模型,例如擬人化的Claude,Google Gemini和Meta的開源模型Llama,它們對普通用戶也同樣有能力。

但是R1造成如此瘋狂的原因,因為它的成本很少。 “它並不比早期的型號更聰明,只是經過更便宜的培訓,”AI研究科學家加里·馬庫斯(Gary Marcus)。

推文可能已被刪除

DeepSeek能夠建立與OpenAI模型競爭的模型的事實非常了不起。 Andrej Karpathy共同創立了Openai,發表在X上,“這是否意味著您不需要大型GPU群集用於Frontier llms?不,但是您必須確保您對擁有的東西並不浪費,這看起來像是一個很好的證明,仍然有很多東西可以通過數據和算法通過。”

推文可能已被刪除

沃頓AI教授Ethan Mollick這與它的功能無關,而與人們目前可以使用的模型有關。他說:“ DeepSeek是一個非常好的模型,但通常並不比O1或Claude更好。” “但是,由於它既是自由的又引起了很多關注,因此我認為許多使用免費的'迷你'模型的人都對2025年初的推理者AI所能做到的並且感到驚訝。”

推文可能已被刪除

為開源AI模型得分一個

DeepSeek R1突破是開源支持者的巨大勝利,他們認為將強大的AI模型的訪問民主化,確保透明度,創新和健康競爭。 “對於那些認為中國在AI中超過美國的人來說,正確的想法是'開源模型超過封閉的模型,'”Meta的AI首席科學家Yann Lecun,該科學家以自己的美洲駝模型支持開放採購。

推文可能已被刪除

計算機科學家和AI專家Andrew Ng並未明確提及R1是開源模型的重要性,但是強調了DeepSeek Disprument如何為開發人員帶來福音,因為它允許Big Tech否則可以訪問該訪問權限。

“股票市場上的'DeepSeek拋售' - 歸因於DeepSeek V3/R1破壞了技術生態系統 - 是應用程序層是一個不錯的地方,這是另一個跡象。”ng。 “競爭激烈的基礎模型層非常適合建立應用程序。”

推文可能已被刪除

Cecily是Mashable的技術記者,涵蓋了AI,Apple和新興技術趨勢。在哥倫比亞新​​聞學院獲得碩士學位之前,她花了數年的時間與不合理的集團和B實驗室的初創企業和社會影響業務合作。在此之前,她共同創立了一家針對南美,歐洲和亞洲新興企業家樞紐的初創諮詢業務。您可以在Twitter上找到她@cecily_mauran

這些新聞通訊可能包含廣告,交易或會員鏈接。通過單擊訂閱,您確認自己是16歲,並同意我們的使用條款隱私政策