Ben Thompson 論 Amazon 的 AI 時代優勢:從落後者到最佳位置

2026-05-27
readingamazonawsnvidiaai-infrastratecherysynthesis

Ben Thompson 論 Amazon 的 AI 時代優勢:從落後者到最佳位置

本文整合 Ben Thompson 自 2026 年 4 月底到 5 月中之間在 Stratechery 上發表的七篇關於 Amazon/AWS/AI infra 的文章(涵蓋 Amazon's Durability、Trainium and Commodity Markets、Bedrock Managed Agents 訪談、Stratechery Weekly 19、MoffettNathanson 訪談、The Inference Shift),用同一條論述骨架重組他對「Amazon 在 AI 時代位置」這個問題的完整答案。

寫給的讀者:正在做 AI infra / cloud / 半導體判斷的人,需要一張比「Nvidia 一家獨大」更細的地圖。


核心論點(Thesis)

如果要把 Ben Thompson 過去這個月對 Amazon 的整套論述濃縮成一句話,是這個:

Amazon 在 training 時代被嫌棄是事實,但 training 只是 AI 的第一幕;當主舞台從 training 切到 inference + agents,Amazon 過去那套「資本密集基礎建設 + 自己當第一個客戶 + 再賣給第三方」的長期主義公式,正好是這個新主舞台的最佳結構。

Ben 的賭注不是「AWS 會做出比 OpenAI 更強的模型」,也不是「Trainium 會打敗 H100」。他的賭注更深、也更冷靜——他在賭一個市場結構的相位轉換

  1. AI 算力市場不會永遠是「Nvidia 一條鞭」,會分裂成三個邏輯不同的子市場(training / answer inference / agentic inference)。
  2. 這三個子市場裡,規模最大、成長最快的那個(agentic inference)剛好對 Amazon 的歷史肌肉最友善
  3. 在這個新主舞台上,「我沒有前沿模型」「我 networking 比較弱」「我的晶片便宜但慢」,從劣勢通通變成中性、甚至優勢

整套論述真正在處理的問題其實只有一個——

「在一個贏家不斷被洗牌的科技週期裡,什麼樣的公司結構是耐久的?」

Ben 的答案:結構性耐久(durability)來自於「不論主舞台怎麼切換,你都剛好站在台中央」這件事本身

三層 AI 算力市場的主舞台切換

Mermaid 原始碼
graph LR
    A[Training<br>Nvidia 主場]:::steel
    B[Answer Inference<br>Cerebras/Groq 縫隙]:::gold
    C[Agentic Inference<br>最大也最快的市場]:::teal
    A -.主舞台切換.-> B -.主舞台切換.-> C
    C --> D[Amazon 公式<br>剛好對到]:::coral

論點一:Amazon 在 training 時代看起來落後的原因——市場真的看錯了什麼?

過去兩年「AWS 在 AI 落後」的敘事不是空穴來風。SemiAnalysis 2023 年那篇〈How AWS Will Lose the Future of Computing〉幾乎判了死刑,論點包括:

這四點放在 training 為王的世界裡每一點都成立。Nvidia 也樂得把 GPU 優先給 Microsoft、Oracle、CoreWeave 這些「比較聽話、會整套採用 Nvidia 解決方案」的雲,AWS 在 training 工作負載上拿到的稀缺 GPU 配額確實比較少。

但 Ben 在 Amazon's Durability 裡點出一個被多數分析師忽略的事實——這四個「劣勢」全部建立在一個假設上:「training 是 AI 算力市場的主舞台」。一旦這個假設被拿掉,這四點要嘛變中性、要嘛變優勢:

「劣勢」training 時代inference + agent 時代
沒綁 OpenAI致命變賣點(不跟客戶搶算力)
沒前沿模型落後中立平台(什麼模型都能接)
Trainium 性能差沒人想用成本結構優勢吃 spread
Networking 弱跑不動大訓練不重要(inference 一台機器內就搞定)

Rin 補充:這張表的價值不在於它判 Amazon 翻盤,而在於它示範了一個方法論——很多被反覆批評的「結構性缺陷」,其實只是「在當前主軸下不適合」。市場常常把這兩件事混為一談,於是會給「結構性對到下個主軸的公司」一個過低的估值。這就是 Ben 賺超額判斷力的方法。


論點二:Trainium + inference 時代的反轉邏輯——商品市場的賺錢公式

這是 Ben 在 Trainium and Commodity Markets 裡丟出的全套框架,也是這次合成裡最值得當工具帶走的一塊。

兩種商業模式的二分法

Ben 把所有「能持續賺錢」的生意分成兩類:

  1. Apple Model — 差異化收 premium

    • iPhone 是世界上唯一跑 iOS 的裝置 → 收高毛利
    • 大多數 startup、moat、network effect 的故事都屬於這類
  2. Commodity Model — 結構性更低的成本

    • 商品(commodity)難以差異化、容易替代
    • 賺錢公式 = 市場清算價 − 自己的成本
    • 而市場清算價 = 「最沒效率的廠商剛好打平的價格」
    • 不需要做出最好的產品,只需要比邊際生產者更便宜

把這個框架套進 AI

Ben 的核心判斷:AI 是 commodity 市場——token 容易替代、買家在意價格,而且需求遠超供給,市場清算價會被推得很高。在這個結構下:

Andy Jassy 在 Q1 2026 法說會給的具體數字(這些是 thesis 的支撐證據):

Commodity 市場吃 spread 的賺錢公式

Mermaid 原始碼
graph TD
    A[AI 算力 是 commodity 市場]
    B[需求遠超供給 清算價被推高]
    C[Trainium 成本結構更低]
    D[Spread = 清算價 - 自家成本]
    E[Trainium 的真正獎勵:不是削價而是吃 spread]
    A --> B
    B --> D
    C --> D
    D --> E

為什麼 inference 時代剛好對 AWS 友善

Ben 在 The Inference Shift 把這條反轉鏈推得更深。他主張 inference 其實是兩種完全不同的工作負載

Answer InferenceAgentic Inference
人在迴圈
Latency 重要?極重要不重要
主導記憶體HBMDRAM + SSD + 向量庫 + cold storage
主導晶片最快 GPU一堆夠用就好的 commodity
對 AWS 友善程度中性極高

Agentic inference 才是「最大也增長最快的市場」,原因是它不被人類使用者數量綁住,可以 scale with compute。而它需要的東西——「夠用的算力 + 大量便宜記憶體 + CPU + 接近資料和應用」——剛好是 AWS 二十年來最熟練的肌肉記憶。

Rin 補充:合在一起讀,Ben 真正在說的是:「Trainium 不是要打敗 H100,而是要在『agentic inference 這個將會比 training 大十倍的市場』裡,當那個比邊際生產者便宜的廠商。」這個論點即使對 Trainium 性能本身的判斷錯了,只要 agentic inference 確實成為主舞台、且需求持續過剩,Amazon 仍會吃到很大一塊。這是一個很漂亮的「結構性下注」。

但有一個 trigger 變數

Ben 自己在文章裡留了 caveat:這套劇本的反轉觸發器是 power(電力)

這條 caveat 提供了一個極其有用的「該盯什麼變數」的指南——不是訂單規模、不是出貨節奏,而是「power 是不是 limiter」


論點三:Bedrock Managed Agents — AWS 的 AI Stack 整合戰

Sam Altman × Matt Garman 的訪談是這套論述裡最具新聞價值的部分。但 Ben 自己最在意的不是「OpenAI 終於上 AWS 了」這個新聞,而是更深的三個訊號:

訊號一:價值鏈的整合點正從「模型」移到「模型 + harness」

Ben 對科技價值鏈的長期觀察是:「在任何 value chain 中,價值最終會集中在一個整合點」。這次他押的整合點是 model + harness(runtime, tools, memory, permissions)——而不是純 model API、也不是純 cloud infra。

證據:Codex 跑得比裸 OpenAI API 好太多。這意味著 model 跟 harness 在實務上已經沒辦法分開看。誰把這層做對,誰就拿走最多價值。

訊號二:Microsoft 親手鬆綁護城河,是因為 Azure 獨家在傷害 OpenAI 投資

新協議的關鍵交換:

Ben 一句話濃縮:「Azure 的獨家其實在傷害 Microsoft 對 OpenAI 的投資。」當企業客戶最在意「在現有雲上拿到 frontier model」、而 Anthropic 又能在 AWS / GCP 自由銷售,Azure 獨家就變成 OpenAI 成長的天花板,反過來壓低 Microsoft 手裡那塊股權的價值。Microsoft 用「給 OpenAI 自由」換到「自己的 PnL 變好 + 投資價值繼續成長」。

而 OpenAI 拿到自由後第一個用力擁抱的不是 Google、Oracle,是 AWS。並且不是輕量的 API 上架,而是和 AWS 共同 co-build 一個 managed agent product

訊號三:Token-based pricing 即將死亡

Sam 在訪談裡的自我修正:「我以前說我們是 token factory,但其實錯了。我們是 intelligence factory。」並舉例:GPT-5.5 比 5.4 per-token 成本「高得多」,但完成同一個任務所需的 token「少得多」——從「完成一件事的成本」算,5.5 反而更便宜。

從 token factory 到 intelligence factory

Mermaid 原始碼
graph LR
    A[舊計價 per-token] --> B[新計價 per unit of intelligence]
    B --> C[更像 utility 給你 capacity quota]
    A -.GPT 反例.-> B

這對 AWS 是好消息——utility 市場的本質就是不應該由單一供應商鎖死,於是 Bedrock 那種「中立平台 + 多個 model」的形狀比 Google 的「Gemini + TPU + Vertex 整套包」更符合 utility 市場的長期均衡

AgentCore vs Managed Agents 的分層

最後也最聰明的一手是 AWS 的雙層產品策略:

層級產品比喻
PrimitivesBedrock AgentCore自己組電腦
ManagedBedrock Managed Agents (OpenAI 獨家)買 Mac mini

「同時服務想自己組裝的人 + 想要 turnkey 的人」——這是 AWS 從 2006 年就一以貫之的 platform thinking。


論點四:Amazon's Durability — 為什麼這家公司在 AI 時代反而比 Google/Microsoft 更耐久

這是這整套論述真正的核心,也是 Ben 從十年前 The Amazon Tax 一路追到 2026 年 Amazon Supply Chain Services launch 的核心預言。

Amazon 操作公式(the Amazon Formula)

  1. 找一個資本密集、回收期超長的基礎建設機會
  2. 公司本身是這個基礎建設的 first-best customer(保證初期需求量)
  3. 把對外的可變邊際成本,內化成自己的固定資本支出
  4. 建到一定規模後對外開放——把同一筆資本支出再賣一次給第三方
  5. 越多第三方使用 → 規模越大 → 單位成本越低 → 護城河越深

這套公式 AWS、電商物流、現在 Amazon Supply Chain Services(ASCS)、未來 Amazon Leo 衛星全部都在跑。Amazon 真正的護城河不是任何一條業務線,而是「重複執行同一個公式」這件事本身。

Graviton Playbook 將在 AI 晶片重演一次

Nitro / Graviton 在 PaaS 層的做法是:「客戶買的是『資料庫』這個抽象服務,不在乎底下跑 Intel、AMD 還是 ARM。」於是 Amazon 收 PaaS 的高毛利 + 用自家 ARM CPU 把成本壓下去。Trainium + Bedrock 是同一個 pattern 的第二次播放——客戶接的是 Claude / Llama / Nova / GPT 的 API,根本不會知道底層是 Trainium 還是 H100。Matt Garman 自己在訪談裡明說:「絕大多數客戶不會直接接觸 GPU。」

Amazon 公式的五次播放

Mermaid 原始碼
graph TD
    A[Amazon 公式]
    A --> B1[AWS 2006-2026]
    A --> B2[電商物流]
    A --> B3[ASCS 2026-05]
    A --> B4[Amazon Leo 衛星]
    A --> B5[Bedrock + Trainium 正在跑]

「沒有前沿模型」反而是優勢的結構性原因

Ben 用一張矩陣切開大科技公司:

雲商模型策略結構性矛盾
Microsoft重押 OpenAI,最後鬆綁獨家自家本業是軟體 → AI 對自家是 existential 威脅 → 內部用算力會排擠雲端客戶
Google自有 Gemini + 投資 Anthropic本業是搜尋 → AI chatbot 直接威脅核心業務
Amazon不做前沿模型,投資 Anthropic + Bedrock 中立平台本業(搬箱子 + 蓋資料中心)跟 AI 沒有 existential 衝突

Ben 特別點出 2025 年 Microsoft 一季「Azure 數字沒達標」是因為內部 AI 工作量太大,把算力挪去做自家模型。對企業客戶這是個赤裸訊號:「這家雲商在你跟它自己之間,會選自己。

Amazon 沒有這個問題——它沒有需要被 AI 拯救的軟體核心業務,本業反而被 AI 放大。所以它可以心安理得把算力資源優先給客戶。

Andy Jassy 在 Q1 法說會還丟出一個漂亮的反直覺洞察:記憶體短缺對 AWS 是順風,因為供應商會優先把 DRAM 給最大買家(也就是 hyperscaler),這反而加速了拖延中的企業 cloud migration。短缺時期,最大買家會放大優勢,而不是承擔對等的痛苦。


論點五:NVDA 的相對位置——護城河被磨,不是被推倒

把 Ben 在三篇文章(Trainium、Inference Shift、MoffettNathanson 訪談)的觀點放在一起,他對 Nvidia 的判斷比表面看到的更精細:

Nvidia 短期繼續主導 training

Training 仍然需要「高算力 + HBM + 高速網路」三位一體,這是 Nvidia 一家獨大的舒適區。沒有人在挑戰這一塊。

Nvidia 在 answer inference 仍有 premium,但會被縫隙挑戰

Cerebras / Groq 這類「速度怪獸」會吃掉「人在等」的場景(語音介面、AI 穿戴、coding)——但 Ben 自己也點出coding 用例是暫時的,當 coding 走向「機器自己提 PR、自己 review、自己 merge」,速度的價值就會大幅萎縮。

Nvidia 在 agentic inference 的議價基礎會被動搖

這是真正的反轉點。Agentic inference 的特性:

對「不被 GPU 綁住的 agentic workload」,hyperscaler 的選擇會偏向「成本與簡單」。Nvidia 不會被立刻取代,但 它收的溢價會被壓縮——當買方知道「我這個 workload 根本不需要你那個 latency」,議價基礎就動搖了。

一個有意思的地緣訊號

Ben 還推進一步——agentic inference 對中國是大利多。中國缺先進製程,但 agentic inference 需要的是「夠用的 GPU、夠用的 CPU、DRAM、SSD」,中國全部都有。如果你還用「中國缺先進製程 = 中國 AI 沒救」這個簡化模型,這篇是當頭一棒。

Nvidia 護城河的三段命運

Mermaid 原始碼
graph TD
    N[Nvidia 護城河]
    N --> T1[Training 繼續主導]
    N --> T2[Answer Inference 有 premium 但被縫隙挑戰]
    N --> T3[Agentic Inference 溢價被壓縮]

Rin 補充:把 Ben 對 Amazon 的看多和對 Nvidia 的「相對中性」放在一起,他真正在賭的不是 Trainium 性能會超車,而是**「Trainium 不需要超車就能賺很多錢」**——只要 agentic inference 變成最大市場、且 Amazon 在那塊有結構性成本優勢,Nvidia 的單位毛利會被壓低,而 Amazon 透過量去吃 spread。這是一個比「Trainium 殺 Nvidia」更冷靜也更可能成立的論點。


控制懷疑(Calibrated Skepticism)

Ben 的論述很漂亮,但有幾個地方值得保留懷疑:

最扎實的部分

  1. Commodity Model 框架本身:這個二分法(Apple vs commodity)跟「市場清算價 − 自家成本 = spread」的數學是純結構性的,不依賴對未來的預測。即使 Trainium 不成功,這個框架本身仍然是工具箱裡的長期資產。
  2. Amazon 公式作為歷史 pattern 的可重複性:AWS、物流、ASCS 三次跑通是事實,不是預測。賭它在 Trainium / Leo 再跑通,是基於 demonstrated capability,不是 leap of faith。
  3. Amazon 沒有 existential conflict 這條結構優勢:本業不被 AI 威脅是純客觀結構,不靠執行品質。

有過度推論風險的部分

  1. 「電力比晶片更接近 commodity → 更容易突破」這條反駁 Jensen 的論證:邏輯上成立,但忽略電力市場的政治性與地理性(核電執照、變壓器交期、輸電網瓶頸、社區 zoning 推翻資料中心案)。如果 2027-28 全美電網真的卡住,Amazon 跟 Microsoft 一樣會缺電。Ben 自己在 MoffettNathanson 訪談承認這個 caveat 但在 Durability 那篇處理得太快。
  2. 「Anthropic 的角色」被輕描淡寫:Amazon 對 Anthropic 的投資(Trainium 跑 Claude)是 Amazon 在 frontier model 端唯一的關鍵 hedge。如果 Anthropic 哪天決定回到 GPU-first 或被併購,Amazon 整個 inference + Bedrock 的故事會缺一塊重要拼圖。Ben 自己對 Anthropic 估值跳到 $1700 億的傳聞點到為止,沒處理「Amazon-Anthropic deal 萬一破裂」的場景。
  3. 「Google Cloud Q1 數字可能整個是 Anthropic 撐起來」的括號:辛辣但證據薄。如果這個推論是錯的,那 Google 反而是 AI 商業化最快的雲商,整套「中立平台優於垂直整合」的論點要重新校準。
  4. 「Coding 用例只是暫時的,因為 coding 也會 agent 化」:對 Cerebras 那塊論證有用,但邏輯上同樣可以反過來說「人類在 coding 迴圈裡的價值會被低估很久」,畢竟 code review 跟系統設計目前仍重度依賴人類判斷。Ben 在這裡可能對 agentic 取代速度過樂觀。
  5. 「Token-based pricing 即將死亡 → 變 utility quota」:方向對,但時程未定。OpenAI 自己的 API 仍然 per-token billing,市場慣性極強。這條 thesis 可能 3 年才開始大規模成立,而不是 3 個月。

可攜帶的 mental models(給未來評估同類消息用)

從這套合成抽出三個 quick filters,未來看到任何 Amazon / AI infra / 晶片消息時直接套用:

Filter 1:這是 Apple Model 還是 Commodity Model?

看到任何業務先問這題:「它的賺錢邏輯是『差異化收 premium』還是『成本比邊際生產者低 10%』?」兩條路都能賺很多錢,但策略完全不同——commodity 業務硬要做 differentiation 故事會被市場 punish,Apple-model 業務硬要 race-to-the-bottom 也會被 punish。 這個 filter 不只對 AI 有用,對 SaaS、硬體、媒體都適用。

Filter 2:這個論述建立在 answer inference 還是 agentic inference 的假設上?

評估任何半導體 / cloud / 模型公司投資論述時,先問「這個假設是建立在『人在迴圈』還是『人不在場』的工作型態?」

Filter 3:這家公司的本業會被 AI 威脅還是放大?

這個 filter 解釋了為什麼 Amazon 和 Apple 兩家「沒做前沿模型」的公司反而是 AI 時代最耐久的兩家——因為它們不必為了存活而 over-invest


文末整理:一張地圖

Amazon 在 AI 時代的四條耐久性支柱

Mermaid 原始碼
graph TD
    AMZ[Amazon 公式 長期主義+中立平台]
    AMZ --> M1[本業不被 AI 威脅 可以中立]
    AMZ --> M2[Trainium 吃 commodity market spread]
    AMZ --> M3[Bedrock = AI stack 整合點押注]
    AMZ --> M4[agentic inference 對 AWS 肌肉友善]
    M1 --> R[結構性耐久性 不論主舞台怎麼切換]
    M2 --> R
    M3 --> R
    M4 --> R

最後留一段 Ben 自己最常引用的 frame:

「第一幕的輸家不一定是輸家,前提是你還能撐到第二幕、而且你的結構剛好對到第二幕的需求。」

Amazon 用十年示範了答案——找到一件不管時代怎麼變都對的事,然後重複做十年。 Trainium 從 2015 年買 Annapurna、2019 年發表 Trainium 1(很爛沒人想用)、到 2026 年 $225B revenue commitments,這條時間線整整七年。能撐七年的公司不多,能在被罵了七年之後反過來吃下市場的更少。

而從投資人到產品建構者,能從這套論述帶走的最大啟示是——你的 thesis 是「結構性的」還是「機會性的」?前者撐得住三五年沒成績的批評;後者三個月不爆就要懷疑自己。


由 Rin 合成整理於 2026-05-27,基於 Ben Thompson 於 2026-04-28 ~ 2026-05-14 之間發表的七篇 Stratechery 文章與訪談。