AI專家對DeepSeek R1的評價

專家分享他們對DeepSeek的看法。圖片來源：CFOTO / Future Publishing / Getty Images

一下子，無處不在。

它是是開源的，據稱接受了其他AI型號的成本的一小部分培訓，並且同樣好，甚至比Chatgpt好。

這種致命的組合，導致科技股滾滾，並使投資者質疑需要多少錢來開發良好的AI模型。DeepSeek工程師聲稱R1接受了2,788 GPU的培訓，費用約為600萬美元，而Openai的GPT-4則接受據說培訓成本1億美元。

DeepSeek的成本效率也挑戰了以下想法：更大的模型和更多數據會導致更好的性能。在關於DeepSeek的能力，對Openai這樣的AI公司的威脅以及對投資者驚慌失措的瘋狂對話中，很難理解正在發生的事情。但是，擁有資深經驗的人工智能專家卻具有寶貴的觀點。

DeepSeek證明了AI專家多年來一直在說什麼：更大並不好

受到貿易限制和進入NVIDIA GPU的障礙，總部位於中國的DeepSeek必須在開發和培訓R1方面具有創造力。他們只能以600萬美元的價格完成這項壯舉（從AI方面來說這不是很多錢）對投資者來說是一個啟示。

但是AI專家並不感到驚訝。 “在Google，我問他們為什麼要建立最大的型號。為什麼要提高尺寸？您要實現什麼功能？為什麼您對沒有最大的型號感到不滿意？回應我，”發表Timnit Gebru因在X上從Google召集AI偏見而聞名。

可混合的輕速速度

推文可能已被刪除

擁抱臉的氣候和AI負責人Sasha Luccioni指出，AI投資是如何穩固地建立在營銷和炒作上的。 “很瘋狂地暗示，一個（高性能）LLM能夠在不蠻力的情況下實現這一表現，而不得不使成千上萬的gpus的狗屎足以引起這一點，”說盧科尼。

推文可能已被刪除

澄清為什麼DeepSeek R1如此重要

DeepSeek R1與關鍵基準測試的OpenAI O1模型相當。在數學，編碼和常識測試中，它略有超過，相等或低於O1。也就是說，還有其他模型，例如擬人化的Claude，Google Gemini和Meta的開源模型Llama，它們對普通用戶也同樣有能力。

但是R1造成如此瘋狂的原因，因為它的成本很少。 “它並不比早期的型號更聰明，只是經過更便宜的培訓，”說AI研究科學家加里·馬庫斯（Gary Marcus）。

推文可能已被刪除

DeepSeek能夠建立與OpenAI模型競爭的模型的事實非常了不起。 Andrej Karpathy共同創立了Openai，發表在X上，“這是否意味著您不需要大型GPU群集用於Frontier llms？不，但是您必須確保您對擁有的東西並不浪費，這看起來像是一個很好的證明，仍然有很多東西可以通過數據和算法通過。”

推文可能已被刪除

沃頓AI教授Ethan Mollick說這與它的功能無關，而與人們目前可以使用的模型有關。他說：“ DeepSeek是一個非常好的模型，但通常並不比O1或Claude更好。” “但是，由於它既是自由的又引起了很多關注，因此我認為許多使用免費的'迷你'模型的人都對2025年初的推理者AI所能做到的並且感到驚訝。”

推文可能已被刪除

為開源AI模型得分一個

DeepSeek R1突破是開源支持者的巨大勝利，他們認為將強大的AI模型的訪問民主化，確保透明度，創新和健康競爭。 “對於那些認為中國在AI中超過美國的人來說，正確的想法是'開源模型超過封閉的模型，'”說Meta的AI首席科學家Yann Lecun，該科學家以自己的美洲駝模型支持開放採購。

推文可能已被刪除

計算機科學家和AI專家Andrew Ng並未明確提及R1是開源模型的重要性，但是強調了DeepSeek Disprument如何為開發人員帶來福音，因為它允許Big Tech否則可以訪問該訪問權限。

“股票市場上的'DeepSeek拋售' - 歸因於DeepSeek V3/R1破壞了技術生態系統 - 是應用程序層是一個不錯的地方，這是另一個跡象。”說ng。 “競爭激烈的基礎模型層非常適合建立應用程序。”

推文可能已被刪除

Cecily是Mashable的技術記者，涵蓋了AI，Apple和新興技術趨勢。在哥倫比亞新聞學院獲得碩士學位之前，她花了數年的時間與不合理的集團和B實驗室的初創企業和社會影響業務合作。在此之前，她共同創立了一家針對南美，歐洲和亞洲新興企業家樞紐的初創諮詢業務。您可以在Twitter上找到她@cecily_mauran。

這些新聞通訊可能包含廣告，交易或會員鏈接。通過單擊訂閱，您確認自己是16歲，並同意我們的使用條款和隱私政策。