人工智慧領域在新年的開始,展現了爆炸性的開端!
隨著 2024 年結束,AI 巨頭 Google 和 OpenAI 發布了一系列突破性的佈告,展示了他們全新的模型。OpenAI 發起了「OpenAI 的 12 天」活動,每天發布新消息,而 Google 也做出了強烈的回應。競爭如此激烈,以至於某些發布會幾乎立即被競爭對手的公告所掩蓋,最典型的例子是 Google 突然推出了 VEO2 影片模型,旨在超越 OpenAI 期待已久的 SORA 影片模型,僅在其發布後數小時內就亮相。
但 Google 的動作不僅於此,他們還在其 AI 生態系統中,推出了一系列尖端的進展,進一步加劇了競爭:
|
透過這些發展,Google 不僅提高了創新的標準,還創建了與用戶工作流程無縫集成的工具,每個公布消息都為 AI 競賽增添了新的層次,使競爭比以往任何時候都更加激烈。
然後是 DeepSeek R1 的出現
真正的遊戲規則改變者出現在 2025 年初,來自中國的一家相對較小的初創公司,運營預算僅為 550 萬美元,推出了一個名為 DeepSeek R1 的新「思維鏈」推理 AI 模型。這個發展打破了計算資源越多模型越好的既定觀念,DeepSeek R1 的首次亮相在全球 AI 行業引起了影響,導致美國市場出現 20 億美元的動盪,主要影響了 Nvidia,但為什麼這一突破會引起如此劇烈的變化?
讓我們來分解一下:
為什麼 DeepSeek R1 是遊戲規則的改變者
- 打破成本障礙
在 DeepSeek R1 出現之前,訓練一個最先進的 AI 模型,被認為需要數十億美元的基礎設施、計算能力和能源,DeepSeek 僅用 550 萬美元,在六個月內完成了這一壯舉,成本僅為其一小部分。 - 掌握測試計算
OpenAI 的 o1 模型開創了測試時計算的概念,即模型在給出答案之前需要更多時間進行「思考」,雖然這種方法被證明是有效的,但沒有模型能像 DeepSeek R1 一樣成功地複製它,更不用說超越它了。 - 消費者吸引力
DeepSeek 不僅創建了一個強大的模型,他們還推出了自己的門戶網站和移動應用程式,直接與 OpenAI 的 ChatGPT 競爭。令人驚訝的是,截至今天,DeepSeek 的應用程式下載量,在美國市場上已超過了 ChatGPT。 - 顛覆性的 API 價格
DeepSeek 推出了一個與 OpenAI 的 API 完全兼容的 API 服務,將自己定位為直接替代品,更具顛覆性的是,他們的服務成本平均比 OpenAI 的 o1 模型低 95%。 - 使用資源的勝利
DeepSeek 不僅提供了一個新的最先進模型,還以 MIT 許可證發布,允許全世界自由使用,甚至用於商業目的。 - 開放權重和研究可及性
DeepSeek 不僅僅停留在模型本身,他們發布了模型權重、擴展的研究論文和指南,使其他人能夠輕鬆地複製他們的訓練過程。 - 優越的蒸餾模型
DeepSeek 開發了基於 Meta 的 Llama 和 Qwen 模型的蒸餾模型。這些緊湊的模型如此有效,以至於他們的 7B 參數版本甚至超越了 OpenAI 的 GPT-4o,這是 AI 發展中的一個重要里程碑。
AI 競賽的衝擊影響
DeepSeek 極大的突破,加劇了中美兩國在 AI 開發領域的競爭。此重大變革顛覆了長期以來對於計算資源、成本與創新之間關係的假設,動搖了 AI 產業的基礎,並對全球經濟產生了連鎖反應。
個人看法
DeepSeek 的成就無疑令人矚目,但仍有幾點需要深入考量。儘管 DeepSeek R1 在推理能力方面,確實高度仿效了 OpenAI 的 o1 模型,但該模型在某些情況下,錯誤地將自己識別為 OpenAI 模型的現象令人關注。這種異常情況引發了對其訓練數據來源的合理懷疑,是否包含了 OpenAI 模型的輸出內容?畢竟,第一個突破性的發現,往往是最困難且資源密集的,如果真是如此,那麼 R1 與 OpenAI o1 之間的訓練成本差異將變得更容易理解,也可能不像表面看起來那麼顯著。
市場似乎過度解讀了 AI 創新重心,從美國公司轉移到中國企業的想法。然而,實際情況更為複雜。首先,Nvidia 仍是全球 GPU 計算能力的主導提供者,在技術方面擁有明顯的競爭優勢。此外,美國政府近期頒布的新法規,將幫助美國企業在模型訓練和推理方面,取得戰略優勢,確保美國在 AI 競爭中仍佔據有利位置。
此外,OpenAI 已經宣布即將推出 o3 系列模型,其推理能力預計將遠超 o1 系列,進一步超越 DeepSeek R1,這些新進展預示著 AI 推理標準將持續提高,行業競爭仍將充滿變數。
目前,競爭才剛剛升溫。在未來幾個月中,隨著全球 AI 巨頭持續投入研發,我們預計還會看到更多革命性的技術突破。隨著技術的不斷進步,AI 產業正朝著競爭促進卓越的方向邁進,這不僅使各大企業受益,也將推動整個社會的發展。
VAI OS 在這場競爭中的角色
在 VAI OS,我們懷著興奮的心情,觀察這場 AI 競賽的發展,我們選擇的不只是與 AI 巨頭們競爭,而是專注於打造靈活、適應性且協同合作的平台。我們的核心目標,是運用這些最先進的 AI 模型,建立一個強大且多元的生態系統,來增強它們的能力。隨著新一代最尖端(SOTA) 的 AI 模型不斷出現,無論它們來自中國、美國、開源社群還是專有技術,我們的模組化架構都確保我們的智能代理(smart agents),能夠無縫整合並加以運用。
AI 產業的發展速度已經不可逆轉,而我們已經準備好隨著這股潮流前行。憑藉我們的「模型中立」(model-agnostic) 策略,VAI OS 能夠確保用戶,始終能夠使用最先進的 AI 工具與技術,無論它們來自哪一家公司。這不僅讓我們的系統具備更高的前瞻性,還與我們打造動態且持續演進的 AI 生態系統願景完美契合。隨著全球 AI 競爭的持續升溫,我們的靈活架構將與其共同成長,為用戶帶來最尖端的體驗,並由行業內最出色的科技創新所驅動。
結語
AI 產業正迎來一個令人振奮的新篇章,由前所未有的競爭和技術創新所推動。像 DeepSeek R1 這樣的突破性發展,正在以前所未有的方式,改寫 AI 的未來。我們在 Vyvo 對這段旅程充滿期待,因為每一次技術飛躍,都能讓我們的平台更加優越,進而為每位使用者帶來更好的體驗。
Hakan Kozaklı
Vyvo 集團
首席技術長