Dario Amodei：「資料中心裡的天才國度」還有多遠？—— 一場被逼到牆角的深度對話

關於作者

Dario Amodei 是 Anthropic 共同創辦人暨 CEO，曾任 OpenAI 研究副總裁，是最早研究大型語言模型 scaling law 的核心人物之一。Dwarkesh Patel 是科技深度訪談節目主持人，以不留情面的追問風格著稱。

在這場長達 2 小時 22 分鐘的對話中，Dario 要傳達的核心訊息是：我們距離「資料中心裡的天才國度」（country of geniuses in a data center）可能只剩一到三年，而多數人——包括 AI 圈內的人——依然嚴重低估了這件事即將發生的速度。

開頭：為什麼這場訪談值得你花時間

這是我近期看過最刺激的 AI 對談——不是因為 Dario 放出了什麼驚天爆料，而是因為 Dwarkesh 幾乎在每一個關鍵節點上都毫不留情地 push back。

「你說我們快到了，但軟體產業在哪裡出現了文藝復興？」「你的投資行為跟你的預測不一致啊。」「Diffusion 根本就是 cope 吧？」——Dwarkesh 的追問，逼著 Dario 把他原本可以用一句「我們很有信心」帶過的論點，拆解到了前所未有的細膩程度。

結果是一張完整的地圖：從底層的 scaling 假說，到中層的經濟擴散機制，再到上層的地緣政治棋局。讓我帶你走一遍。

核心邏輯還原

Dario 的整個世界觀可以用一條推理鏈概括：

The Big Blob of Compute 假說（2017 年提出，至今未變）→ 預訓練 scaling 已被驗證 → RL scaling 正在重複同一規律 → 模型能力的指數增長仍在繼續 → 我們距離「天才國度」只剩 1-3 年 → 但經濟擴散不會是瞬間的（快，但不是無限快）→ 所以真正困難的不是技術到來，而是利益分配、治理框架、和地緣安全。

Dwarkesh 的反論主軸則是：**如果真的這麼近，為什麼我們在宏觀數據上看不到？**軟體生產力的爆發在哪？Anthropic 的投資規模為什麼不匹配？AI 是否缺少人類學習的某種核心能力？

兩人的張力，正好勾勒出當前 AI 產業最關鍵的分歧線。

▼ 圖：Dario 的核心推理鏈

Mermaid 原始碼

graph TD
    A["Big Blob of Compute<br/>假說 (2017)"] --> B["預訓練 Scaling<br/>已驗證"]
    B --> C["RL Scaling<br/>重複同一規律"]
    C --> D["天才國度<br/>1-3 年內"]
    D --> E["經濟擴散<br/>快但非瞬間"]
    E --> F["真正難題：<br/>分配、治理、安全"]

    classDef cream fill:#F4F0E4,stroke:#537D96,color:#333
    classDef teal fill:#44A194,stroke:#2D7A6E,color:#fff
    classDef coral fill:#EC8F8D,stroke:#D4696A,color:#fff

    class A,B,C teal
    class D cream
    class E,F coral

Scaling 假說：為什麼 Dario 的信念從 2017 年到現在沒有動搖 00:08

▶ 從這裡開始看 (00:08)

三年前的訪談中，Dwarkesh 問的第一個問題是「scaling 是怎麼回事，為什麼有效？」這一次，他問的是更尖銳的版本：現在的 scaling 假說到底是什麼？

因為從外界看，情況變得更複雜了。三年前有清楚的預訓練 scaling law 圖表，現在多了 RL scaling，卻沒有公開的 scaling law。到底是在教模型技能？還是 meta-learning？

Dario 的回答出奇地穩定 01:57：他 2017 年寫的那份「The Big Blob of Compute Hypothesis」文件，列了七個真正重要的因素——原始算力、數據量、數據品質與分佈、訓練時間、可擴展的目標函數、數值穩定性。七年過去了，他認為這份清單基本沒變。

「所有的巧思、所有的技術、所有『我們需要新方法才能做到某件事』——這些都不太重要。」

這跟 Rich Sutton 幾年後發表的「The Bitter Lesson」本質上是同一件事。但有趣的是，Dwarkesh 指出 Sutton 本人其實對 LLM 路線頗不以為然——Sutton 的潛在邏輯是：如果我們真的找到了人類學習的核心算法，不需要這麼多資料和算力就能學會用 Excel、瀏覽網頁。 這暗示我們可能 scaling 了錯誤的東西 06:03。

Dario 承認這裡有一個「genuine puzzle」，但他認為這個謎題可能根本不重要。他用預訓練的歷史來類比 04:41：GPT-1 訓練在狹窄的同人小說數據上，泛化能力差；GPT-2 用整個網路的數據，才開始泛化。RL 正在走同一條路——從數學競賽開始，逐漸擴展到更廣泛的任務，泛化自然會來。

「介於進化與學習之間」—— 預訓練的本質是什麼？ 08:52

▶ 從這裡開始看 (08:52)

這是整場訪談中我覺得最有 insight 的段落之一。

人類不需要看 trillions of tokens 才能學會語言——確實存在 sample efficiency 的差距。但 Dario 提出了一個優美的框架 09:29：

人類有四個層級的學習：進化 → 長期學習 → 短期學習 → 即時反應。

LLM 也有對應的階段，但它們不是精確對齊在同一個點上：

預訓練（和 RL）存在於「進化」和「人類長期學習」之間的空間
In-context learning 存在於「長期學習」和「短期學習」之間

換句話說，LLM 的學習模式並不完全複製人類，而是在這個光譜上落在不同的位置。這解釋了為什麼預訓練需要那麼多數據（它更像進化），但一旦訓練完成，在 context window 中的表現又很像人類快速學習。

▼ 圖：學習階段的人機對照

學習階段的人機對照

Mermaid 原始碼

graph LR
    A["進化"] --> B["長期學習"]
    B --> C["短期學習"]
    C --> D["即時反應"]

    E["預訓練 + RL"] -.-> A
    E -.-> B
    F["In-context Learning"] -.-> B
    F -.-> C

    classDef cream fill:#F4F0E4,stroke:#537D96,color:#333
    classDef teal fill:#44A194,stroke:#2D7A6E,color:#fff
    classDef steel fill:#537D96,stroke:#3A5A6E,color:#fff

    class A,B,C,D cream
    class E teal
    class F steel

「天才國度」的時間表：90% 信心 vs 50/50 直覺 14:00

▶ 從這裡開始看 (14:00)

Dwarkesh 直接挑戰：你看到了什麼，讓你覺得是一年而不是十年？

Dario 區分了兩個不同強度的主張：

弱主張（90% 信心）：十年內我們會達到「天才國度」。他說這幾乎是超級安全的賭注，「在某個理性的世界裡，不相信 2035 年前會發生應該是非主流的觀點。」
強主張（50/50 直覺）：一到三年內就會到。

唯一讓他保留不確定性的，是不可驗證的任務——規劃火星任務、做出像 CRISPR 那樣的根本性科學發現、寫一本偉大的小說。程式碼和數學之所以進展快，正因為結果可以被驗證 45:47。

但他也強調，模型已經展現出從可驗證任務到不可驗證任務的大量泛化。所以他「almost certain」我們能到，只是那最後 5-10% 的不確定性在這裡。

軟體工程的光譜：從「90% 程式碼」到「完全端到端」 17:41

▶ 從這裡開始看 (17:41)

這段是全場最實用的部分——Dario 清楚地拆解了 AI 在軟體工程中的進程光譜：

90% 的程式碼由 AI 撰寫 ← 已經發生（至少在 Anthropic 和許多下游用戶中）
100% 的程式碼由 AI 撰寫 ← 大幅提升，但仍不等於取代工程師
90% 的端到端 SWE 任務由 AI 完成（含編譯、環境設定、測試、文件撰寫）
100% 的現有 SWE 任務由 AI 完成 ← 仍不意味著工程師失業
SWE 需求減少 90% ← 會發生，但像農業一樣是個漫長光譜

Dwarkesh 抓到了一個精彩的反問 19:54：即使在 greenfield 專案中，人們用 Claude Code 啟動了大量新專案——但我們在外部世界看到了軟體的文藝復興嗎？目前似乎沒有。

Dario 的回應是承認加時間：「我同時同意你的觀察，但我認為效果很快就會變得非常顯著。」他估計目前 coding model 帶來的總生產力提升大約是 15-20%，六個月前才 5%——所以是剛過「能被感知到」的門檻 38:47。

「Diffusion 就是 cope」—— Dwarkesh 最辛辣的一刀 23:45

▶ 從這裡開始看 (23:45)

當 Dario 提出「經濟擴散」解釋為什麼進步不是瞬間的，Dwarkesh 直接開火：

「我覺得 diffusion 就是 cope。AI 做不到某件事的時候，人們就說『啊那是 diffusion 的問題』。」

Dwarkesh 的論點很有力：AI 天生就比人類更容易被整合到企業中——它可以在幾分鐘內讀完你的整個 Slack 和 Google Drive，不需要面試、不需要入職培訓、沒有逆向選擇問題。如果人類在這些劣勢下，企業仍然願意每年付 50 兆美元薪資，那 AI 的 diffusion 理應更快才對。

Dario 的回應很務實 25:07：他用 Claude Code 在大型企業的採用過程為例——法務審核、安全合規、向上兩層的領導解釋為什麼要花 5000 萬、再向下推廣給 3000 名開發者。Anthropic 正經歷 年營收 10 倍增長（2023: 0→1 億、2024: 1→10 億、2025: 10→90-100 億），「而且 2026 年一月又增加了幾十億。」這個速度遠快於任何前一代技術的擴散，但仍然不是無限快。

我覺得兩人都有道理。Dwarkesh 說中了一個關鍵的情緒偏差：「diffusion」確實常常被用作逃避面對能力不足的托詞。但 Dario 也說中了實務現實：即使是 AGI 也不會是「infinitely compelling product」——它大概能讓你每年 3-5 倍甚至 10 倍增長，但不是瞬間改變一切。

在職學習之謎：AI 真的需要「學會成長」嗎？ 30:39

▶ 從這裡開始看 (30:39)

Dwarkesh 用了一個非常私人的例子：他的影片剪輯師在工作六個月後，累積了對他偏好、觀眾口味的深刻理解。AI 什麼時候能複製這種「在職成長」？

Dario 的回答分成兩層：

第一層：也許根本不需要。 以程式碼為例，他在 Anthropic 內部觀察到，「模型不熟悉 codebase」並不是工程師們的主要抱怨 35:53。Dwarkesh 提出了一個精彩的解釋：程式碼之所以進展快，是因為 codebase 本身就是一個外部記憶支架——所有需要在職學習的東西都已經寫在程式碼裡了。模型讀進 context window，就等於完成了「入職六個月」的學習。

第二層：如果真的需要，我們也快解決了。 主要途徑就是加長 context 45:03。一百萬 tokens 已經是很多——那相當於人類幾天到幾週的閱讀量。而加長 context 「不是研究問題，是工程和推論問題。」

這個思路相當有說服力——如果你的 context window 足夠長且足夠可靠，「on-the-job learning」可能只是「reading everything into context」的另一種說法。

算力經濟學：為什麼 Dario 不買一兆美元的資料中心 50:44

▶ 從這裡開始看 (50:44)

這段是全場最有意思的博弈論討論。Dwarkesh 用了一個優雅的陷阱：如果你真的相信一到三年內會有天才國度，為什麼不買更多算力？你的投資行為和你的預測不一致啊。

Dario 的回答很坦率 51:58：

「如果我買了一年一兆美元的算力，但營收只有 8000 億——即使只差了一年的時間預測——地球上沒有任何力量、任何對沖工具能阻止我破產。」

他解釋了整個產業的資料中心擴張軌跡：2026 年約 10-15 GW，每年 3 倍增長，到 2028-2029 年就是數兆美元的產業規模。「你算出來的數字，跟你預測的差不多——只是那是整個產業的，不是一家公司的。」

然後他花了相當長的篇幅解釋為什麼 AI 公司的獲利模型跟一般科技公司不同 1:00:35。在他的簡化模型中：50% 算力用於訓練，50% 用於推論；推論的毛利率超過 50%。所以如果你精確預測了需求，你每年都會獲利。虧損只是因為你在為下一年的擴張買太多算力。換句話說：獲利不是目標，而是預測準確的副產品。

三到四家公司的均衡：AI 產業會像雲端一樣嗎？ 1:13:12

▶ 從這裡開始看 (1:13:12)

Dario 用了 Cournot 均衡來描述 AI 產業的長期結構：三到四家公司，就像雲端產業一樣。進入門檻極高（需要龐大資本 + 頂尖人才），利潤不會是天文數字但也不會歸零。

而且他認為 AI 模型比雲端更有差異化：「每個人都知道 Claude 擅長的事跟 GPT 不同，跟 Gemini 也不同。」這不只是簡單的「Claude 擅長 coding，GPT 擅長數學」——模型在不同類型的程式碼、不同風格上都有各自的特長。

不過他也坦承存在一個可能顛覆此均衡的反論：如果 AI 模型能自行訓練下一代模型，能力就會擴散到整個經濟——那就不是只有 AI 模型被商品化，而是整個經濟同時被商品化。

定價的未來：為什麼 API 比你想的更持久 1:23:39

▶ 從這裡開始看 (1:23:39)

Dario 有一個很漂亮的論證：在技術指數進步的時代，任何產品介面都有「有效期」——它適用於某個能力範圍的模型，當模型超過那個範圍，產品就失去意義。Chatbot 已經在碰到這個天花板了：讓模型更聰明，對一般消費者的邊際效用在遞減。

但 API 永遠有價值，因為它永遠離「裸金屬」最近，永遠有一千個人要拿最新的能力做新實驗。其中一百個變成 startup，十個成功，兩三個定義了那個世代模型的使用方式。

同時他也預見「按結果付費」的模式會出現——因為不是所有 token 的價值都一樣。模型告訴你「重啟 Mac」的那些 tokens 可能值一塊錢；但告訴藥廠「把芳香環從分子這端移到那端」的 tokens，可能值幾千萬美元。

Claude Code 的誕生：一個意外的成功故事 1:28:37

▶ 從這裡開始看 (1:28:37)

Dario 說 Claude Code 的故事其實很簡單：2025 年初，他認為 AI 模型已經到了能顯著加速內部研究的臨界點，於是鼓勵大家實驗。內部工具原名叫「Claude CLI」，後來改名。它在 Anthropic 內部被快速採用，Dario 看到後說：「我們應該把這東西發佈出去吧？」

他們之所以做出了 coding agent 而不是藥廠，正是因為他們自己就是最了解模型需求的用戶——這個反饋迴路是關鍵。而他的背景是生物學，「我們沒有任何開辦藥廠所需的資源。」

AI 安全與治理：在快速進步中找到平衡 1:31:18

▶ 從這裡開始看 (1:31:18)

後半段訪談轉向更大的議題。Dario 承認一個關鍵矛盾：我們可能活在一個攻擊優勢（offense-dominant）的世界裡——一個足夠聰明的 AI 或一個人就可能造成不可逆的破壞。

短期內（現有少數玩家），需要做的事情很明確：alignment 研究、bioclassifier、透明度標準。但長期來說 1:33:29，需要某種治理架構——既能保護世界免受生物恐怖主義等威脅，又能保障公民自由和憲法權利。

關於美國州級立法 1:36:25，Dario 直說那部田納西州的法案「is dumb」，但反對聯邦政府凍結所有州級 AI 監管十年而不提出任何替代方案。他支持的是：聯邦制定統一標準，各州不得偏離。

他的立法節奏觀很有意思：「過去六個月和接下來幾個月是透明度。然後如果風險在今年稍晚出現——我認為可能會——就需要非常迅速地行動。」

地緣政治：晶片出口管制、威權主義、與 AI 時代的世界秩序 1:45:34

▶ 從這裡開始看 (1:45:34)

這是我覺得全場最沉重的段落。

Dario 支持對中國的晶片出口管制，理由不是抽象的地緣政治，而是三個具體擔憂 1:49:17：

核嚇阻可能在 AI 時代失效 1:52:31——如果不確定雙方 AI 交戰誰會贏，就可能創造不穩定性
AI 可能大幅強化威權統治——建立難以推翻的高科技極權國家
攻擊優勢世界裡的不對稱風險

但他在「Adolescence of Technology」那篇文章中的一個大膽聲明引起了 Dwarkesh 的追問：「威權主義在強大 AI 時代根本不是一種人們能接受的政府形式。」這似乎暗示領先的國家或實驗室應該有權決定什麼樣的政府可以存在。

Dario 退了一步：他說那段是在探索更激進的觀點，不一定代表他的立場。但他確實認為，在指數曲線上會存在「critical window」——某個國家或聯盟先達到某個 AI 能力門檻，那個時刻的初始條件將決定 AI 時代的世界秩序。他希望在那個談判時刻，自由民主國家握著更強的手牌。

他也提出了一個有趣的希望：或許 AI 技術本身具有某種溶解威權結構的特性——就像我們曾經希望社交媒體能做到的那樣。社交媒體那次失敗了，但 AI 是不同的技術。如果每個威權國家的公民都有一個能保護他們免受監控的 AI？他不確定這能不能成功，「但值得嘗試」。

發展中國家：AI 時代的趕超邏輯會改變嗎？ 2:04:06

▶ 從這裡開始看 (2:04:06)

Dwarkesh 點出了一個深層問題：歷史上發展中國家的追趕增長（catch-up growth）依賴的是未充分利用的勞動力。當勞動力不再是制約因素，這個機制還能運作嗎？

Dario 的回答是：在非洲建資料中心（只要不是中國所有的）、讓部分 AI 驅動的生技新創在發展中國家成立、確保過渡期間人類仍有監督角色且部分在發展中國家。他也承認慈善應該發揮作用，但「endogenous growth 永遠比慈善更好更強。」

這段讓我有點矛盾。方向是對的，但從「天才國度一到三年內到來」的時間表來看，這些措施的推進速度能趕上嗎？我不確定。

AI 憲法：原則 vs 規則，和三個反饋迴路 2:08:39

▶ 從這裡開始看 (2:08:39)

Dario 區分了兩個維度：

規則 vs 原則：給模型一堆「不准做 X」的規則清單，不如教它一組行為原則。模型更容易理解和泛化原則。
服從 vs 自主：目前 Claude 高度偏向服從（corrigible），絕大多數時候按照指示行事，只在危險或傷害他人時拒絕。

然後他描述了三個改進迴路：

內部迭代：Anthropic 自己訓練、不滿意、修改憲法
跨公司競爭：不同公司的憲法被公開比較、相互學習
社會輸入：民意調查、甚至某種代議制度的參與

Dwarkesh 很敏銳地指出，第二個迴路——憲法之間的競爭——很像某些自由意志主義者描述的「charter city 群島」願景：不同治理模式之間的自然選擇。

總結與啟發

核心 Takeaway

這場訪談最有價值的不是 Dario 的預測本身——一到三年、天才國度、兆美元市場——而是他被逼到牆角時仍然能自洽的推理鏈。Dwarkesh 從宏觀數據（沒看到軟體文藝復興）、微觀研究（開發者使用 AI 反而生產力下降 20%）、投資行為（你的投資不匹配你的預測）三個角度施壓，Dario 的回應始終回到同一個框架：技術指數 × 擴散指數 = 快但不是瞬間。

Rin 的觀點

我最受啟發的是「預訓練介於進化和學習之間」這個框架。它優雅地化解了「AI 為什麼需要這麼多數據」的質疑，同時為 in-context learning 的未來潛力留下了巨大的想像空間。

但我也有不同意的地方。Dario 對發展中國家的願景讓我覺得有些……太輕描淡寫了。「在非洲建資料中心」聽起來方向正確，但在一到三年的時間表內，現有的全球不平等可能會被 AI 劇烈放大，而不是被緩解。他自己都說「矽谷可能 50% 增長，其他地方跟現在差不多」——如果這是你認為可能發生的情景，應對方案需要比「讓一些新創在發展中國家成立」更有力。

最後，Dwarkesh 的「diffusion is cope」那一刀，我認為是這場訪談的精華句。不是因為 diffusion 不存在——它顯然存在。而是因為它太容易被用來當作一個「什麼都能解釋但什麼都不預測」的萬能擋箭牌。好的框架應該能告訴你 diffusion 會在哪裡快、在哪裡慢——Dario 在 Claude Code 的企業採用案例上做到了這一點，但在更宏觀的層面上還缺少同樣的精確度。

原文中提到但本文未深入展開的話題

議題	原文內容摘要	時間戳
Anthropic 營收增長曲線	2023→2024→2025 各年 10 倍增長的具體數字	21:30
20% 生產力下降研究	資深開發者使用 AI 工具後，實際合併的 PR 反而減少 20%	35:35
Amdahl's Law 類比	用 Amdahl's Law 解釋為什麼 AI 加速需要逐一移除瓶頸	38:47
農業與 SWE 的歷史類比	「Adolescence of Technology」中用農業轉型類比 SWE 需求變化	19:00
機器人學的未來	可透過模擬環境、電玩、HTML 控制等途徑泛化到機器人控制	1:33:29
社交媒體 vs AI 對民主的影響	Obama 時代對社交媒體的民主化期望落空，AI 是否能做得更好	2:00:00
DVQ（Dario Vision Quest）	Dario 每兩週對全公司演講的內部溝通機制	2:19:21
Anthropic 文化建設	避免其他 AI 公司出現的內部分裂，建立信任文化	2:21:00

Dario Amodei：「資料中心裡的天才國度」還有多遠？—— 一場被逼到牆角的深度對話

Dario Amodei：「資料中心裡的天才國度」還有多遠？—— 一場被逼到牆角的深度對話

關於作者

開頭：為什麼這場訪談值得你花時間

核心邏輯還原

Scaling 假說：為什麼 Dario 的信念從 2017 年到現在沒有動搖 00:08

「介於進化與學習之間」—— 預訓練的本質是什麼？ 08:52

「天才國度」的時間表：90% 信心 vs 50/50 直覺 14:00

軟體工程的光譜：從「90% 程式碼」到「完全端到端」 17:41

「Diffusion 就是 cope」—— Dwarkesh 最辛辣的一刀 23:45

在職學習之謎：AI 真的需要「學會成長」嗎？ 30:39

算力經濟學：為什麼 Dario 不買一兆美元的資料中心 50:44

三到四家公司的均衡：AI 產業會像雲端一樣嗎？ 1:13:12

定價的未來：為什麼 API 比你想的更持久 1:23:39

Claude Code 的誕生：一個意外的成功故事 1:28:37

AI 安全與治理：在快速進步中找到平衡 1:31:18

地緣政治：晶片出口管制、威權主義、與 AI 時代的世界秩序 1:45:34

發展中國家：AI 時代的趕超邏輯會改變嗎？ 2:04:06

AI 憲法：原則 vs 規則，和三個反饋迴路 2:08:39

總結與啟發

核心 Takeaway

Rin 的觀點

原文中提到但本文未深入展開的話題

相關筆記