Ben Thompson 論 Amazon 的 AI 時代優勢：從落後者到最佳位置

本文整合 Ben Thompson 自 2026 年 4 月底到 5 月中之間在 Stratechery 上發表的七篇關於 Amazon／AWS／AI infra 的文章（涵蓋 Amazon's Durability、Trainium and Commodity Markets、Bedrock Managed Agents 訪談、Stratechery Weekly 19、MoffettNathanson 訪談、The Inference Shift），用同一條論述骨架重組他對「Amazon 在 AI 時代位置」這個問題的完整答案。

寫給的讀者：正在做 AI infra / cloud / 半導體判斷的人，需要一張比「Nvidia 一家獨大」更細的地圖。

核心論點（Thesis）

如果要把 Ben Thompson 過去這個月對 Amazon 的整套論述濃縮成一句話，是這個：

Amazon 在 training 時代被嫌棄是事實，但 training 只是 AI 的第一幕；當主舞台從 training 切到 inference + agents，Amazon 過去那套「資本密集基礎建設 + 自己當第一個客戶 + 再賣給第三方」的長期主義公式，正好是這個新主舞台的最佳結構。

Ben 的賭注不是「AWS 會做出比 OpenAI 更強的模型」，也不是「Trainium 會打敗 H100」。他的賭注更深、也更冷靜——他在賭一個市場結構的相位轉換：

AI 算力市場不會永遠是「Nvidia 一條鞭」，會分裂成三個邏輯不同的子市場（training / answer inference / agentic inference）。
這三個子市場裡，規模最大、成長最快的那個（agentic inference）剛好對 Amazon 的歷史肌肉最友善。
在這個新主舞台上，「我沒有前沿模型」「我 networking 比較弱」「我的晶片便宜但慢」，從劣勢通通變成中性、甚至優勢。

整套論述真正在處理的問題其實只有一個——

「在一個贏家不斷被洗牌的科技週期裡，什麼樣的公司結構是耐久的？」

Ben 的答案：結構性耐久（durability）來自於「不論主舞台怎麼切換，你都剛好站在台中央」這件事本身。

三層 AI 算力市場的主舞台切換

Mermaid 原始碼

graph LR
    A[Training<br>Nvidia 主場]:::steel
    B[Answer Inference<br>Cerebras/Groq 縫隙]:::gold
    C[Agentic Inference<br>最大也最快的市場]:::teal
    A -.主舞台切換.-> B -.主舞台切換.-> C
    C --> D[Amazon 公式<br>剛好對到]:::coral

論點一：Amazon 在 training 時代看起來落後的原因——市場真的看錯了什麼？

過去兩年「AWS 在 AI 落後」的敘事不是空穴來風。SemiAnalysis 2023 年那篇〈How AWS Will Lose the Future of Computing〉幾乎判了死刑，論點包括：

AWS 沒有像 Microsoft 那樣綁住 OpenAI
沒有像 Google 那樣自己擁有前沿模型（Gemini）
Trainium 1 / 2 在 benchmark 上落後 H100 兩個世代
Nitro + EFA 的網路架構不適合把上千張 GPU 串成同步訓練系統

這四點放在 training 為王的世界裡每一點都成立。Nvidia 也樂得把 GPU 優先給 Microsoft、Oracle、CoreWeave 這些「比較聽話、會整套採用 Nvidia 解決方案」的雲，AWS 在 training 工作負載上拿到的稀缺 GPU 配額確實比較少。

但 Ben 在 Amazon's Durability 裡點出一個被多數分析師忽略的事實——這四個「劣勢」全部建立在一個假設上：「training 是 AI 算力市場的主舞台」。一旦這個假設被拿掉，這四點要嘛變中性、要嘛變優勢：

「劣勢」	training 時代	inference + agent 時代
沒綁 OpenAI	致命	變賣點（不跟客戶搶算力）
沒前沿模型	落後	中立平台（什麼模型都能接）
Trainium 性能差	沒人想用	成本結構優勢吃 spread
Networking 弱	跑不動大訓練	不重要（inference 一台機器內就搞定）

Rin 補充：這張表的價值不在於它判 Amazon 翻盤，而在於它示範了一個方法論——很多被反覆批評的「結構性缺陷」，其實只是「在當前主軸下不適合」。市場常常把這兩件事混為一談，於是會給「結構性對到下個主軸的公司」一個過低的估值。這就是 Ben 賺超額判斷力的方法。

論點二：Trainium + inference 時代的反轉邏輯——商品市場的賺錢公式

這是 Ben 在 Trainium and Commodity Markets 裡丟出的全套框架，也是這次合成裡最值得當工具帶走的一塊。

兩種商業模式的二分法

Ben 把所有「能持續賺錢」的生意分成兩類：

Apple Model — 差異化收 premium
- iPhone 是世界上唯一跑 iOS 的裝置 → 收高毛利
- 大多數 startup、moat、network effect 的故事都屬於這類
Commodity Model — 結構性更低的成本
- 商品（commodity）難以差異化、容易替代
- 賺錢公式 = 市場清算價 − 自己的成本
- 而市場清算價 = 「最沒效率的廠商剛好打平的價格」
- 不需要做出最好的產品，只需要比邊際生產者更便宜

把這個框架套進 AI

Ben 的核心判斷：AI 是 commodity 市場——token 容易替代、買家在意價格，而且需求遠超供給，市場清算價會被推得很高。在這個結構下：

每一個比邊際生產者便宜的廠商，都在「市場清算價 − 自家成本」之間吃 spread
需求超過供給時，這個 spread 會被供需失衡放得更大
Trainium 的價值不在於削價競爭，而在於「在需求過剩的 commodity 市場拿走更多 spread」

Andy Jassy 在 Q1 2026 法說會給的具體數字（這些是 thesis 的支撐證據）：

AWS 營收 YoY +28%，自 2022 年以來最快
Custom chips 季增 40%，年化 run rate 已破 $20B
內部 + 外部合計年化 run rate ~$50B → 全球資料中心晶片業者前三大
Trainium revenue commitments $225B（Anthropic、OpenAI、Uber 等多年期承諾）
Trainium2 比同級 GPU 好 30% price-performance，幾乎賣光
Trainium3 比 T2 再好 30-40%，已近售罄
Trainium4 還有 18 個月才大規模供貨，已被預訂掉一大部分
Jassy 對股東的會計式承諾：規模化後 Trainium 預期每年幫 AWS 省下「幾百億 CapEx」+「幾百個基點」的營業利潤率

Commodity 市場吃 spread 的賺錢公式

Mermaid 原始碼

graph TD
    A[AI 算力 是 commodity 市場]
    B[需求遠超供給 清算價被推高]
    C[Trainium 成本結構更低]
    D[Spread = 清算價 - 自家成本]
    E[Trainium 的真正獎勵：不是削價而是吃 spread]
    A --> B
    B --> D
    C --> D
    D --> E

為什麼 inference 時代剛好對 AWS 友善

Ben 在 The Inference Shift 把這條反轉鏈推得更深。他主張 inference 其實是兩種完全不同的工作負載：

	Answer Inference	Agentic Inference
人在迴圈	是	否
Latency 重要？	極重要	不重要
主導記憶體	HBM	DRAM + SSD + 向量庫 + cold storage
主導晶片	最快 GPU	一堆夠用就好的 commodity
對 AWS 友善程度	中性	極高

Agentic inference 才是「最大也增長最快的市場」，原因是它不被人類使用者數量綁住，可以 scale with compute。而它需要的東西——「夠用的算力 + 大量便宜記憶體 + CPU + 接近資料和應用」——剛好是 AWS 二十年來最熟練的肌肉記憶。

Rin 補充：合在一起讀，Ben 真正在說的是：「Trainium 不是要打敗 H100，而是要在『agentic inference 這個將會比 training 大十倍的市場』裡，當那個比邊際生產者便宜的廠商。」這個論點即使對 Trainium 性能本身的判斷錯了，只要 agentic inference 確實成為主舞台、且需求持續過剩，Amazon 仍會吃到很大一塊。這是一個很漂亮的「結構性下注」。

但有一個 trigger 變數

Ben 自己在文章裡留了 caveat：這套劇本的反轉觸發器是 power（電力）。

如果電力是 limiter → Nvidia 的 tokens-per-watt premium 重新有理由
如果晶片才是 limiter（目前幾年） → Trainium 的成本結構優勢值更多錢

這條 caveat 提供了一個極其有用的「該盯什麼變數」的指南——不是訂單規模、不是出貨節奏，而是「power 是不是 limiter」。

論點三：Bedrock Managed Agents — AWS 的 AI Stack 整合戰

Sam Altman × Matt Garman 的訪談是這套論述裡最具新聞價值的部分。但 Ben 自己最在意的不是「OpenAI 終於上 AWS 了」這個新聞，而是更深的三個訊號：

訊號一：價值鏈的整合點正從「模型」移到「模型 + harness」

Ben 對科技價值鏈的長期觀察是：「在任何 value chain 中，價值最終會集中在一個整合點」。這次他押的整合點是 model + harness（runtime, tools, memory, permissions）——而不是純 model API、也不是純 cloud infra。

證據：Codex 跑得比裸 OpenAI API 好太多。這意味著 model 跟 harness 在實務上已經沒辦法分開看。誰把這層做對，誰就拿走最多價值。

訊號二：Microsoft 親手鬆綁護城河，是因為 Azure 獨家在傷害 OpenAI 投資

新協議的關鍵交換：

Microsoft 放棄 Azure 獨家，但仍保留 OpenAI IP licence 到 2032
OpenAI 放棄付 Microsoft 的 revenue share（直接讓 Azure PnL 變漂亮）
取消 AGI clause，協議無條件跑到 2032
Microsoft 仍享有 OpenAI 對 Azure 的 revenue share 至 2030

Ben 一句話濃縮：「Azure 的獨家其實在傷害 Microsoft 對 OpenAI 的投資。」當企業客戶最在意「在現有雲上拿到 frontier model」、而 Anthropic 又能在 AWS / GCP 自由銷售，Azure 獨家就變成 OpenAI 成長的天花板，反過來壓低 Microsoft 手裡那塊股權的價值。Microsoft 用「給 OpenAI 自由」換到「自己的 PnL 變好 + 投資價值繼續成長」。

而 OpenAI 拿到自由後第一個用力擁抱的不是 Google、Oracle，是 AWS。並且不是輕量的 API 上架，而是和 AWS 共同 co-build 一個 managed agent product。

訊號三：Token-based pricing 即將死亡

Sam 在訪談裡的自我修正：「我以前說我們是 token factory，但其實錯了。我們是 intelligence factory。」並舉例：GPT-5.5 比 5.4 per-token 成本「高得多」，但完成同一個任務所需的 token「少得多」——從「完成一件事的成本」算，5.5 反而更便宜。

從 token factory 到 intelligence factory

Mermaid 原始碼

graph LR
    A[舊計價 per-token] --> B[新計價 per unit of intelligence]
    B --> C[更像 utility 給你 capacity quota]
    A -.GPT 反例.-> B

這對 AWS 是好消息——utility 市場的本質就是不應該由單一供應商鎖死，於是 Bedrock 那種「中立平台 + 多個 model」的形狀比 Google 的「Gemini + TPU + Vertex 整套包」更符合 utility 市場的長期均衡。

AgentCore vs Managed Agents 的分層

最後也最聰明的一手是 AWS 的雙層產品策略：

層級	產品	比喻
Primitives	Bedrock AgentCore	自己組電腦
Managed	Bedrock Managed Agents (OpenAI 獨家)	買 Mac mini

「同時服務想自己組裝的人 + 想要 turnkey 的人」——這是 AWS 從 2006 年就一以貫之的 platform thinking。

論點四：Amazon's Durability — 為什麼這家公司在 AI 時代反而比 Google／Microsoft 更耐久

這是這整套論述真正的核心，也是 Ben 從十年前 The Amazon Tax 一路追到 2026 年 Amazon Supply Chain Services launch 的核心預言。

Amazon 操作公式（the Amazon Formula）

找一個資本密集、回收期超長的基礎建設機會

公司本身是這個基礎建設的 first-best customer（保證初期需求量）

把對外的可變邊際成本，內化成自己的固定資本支出

建到一定規模後對外開放——把同一筆資本支出再賣一次給第三方

越多第三方使用 → 規模越大 → 單位成本越低 → 護城河越深

這套公式 AWS、電商物流、現在 Amazon Supply Chain Services（ASCS）、未來 Amazon Leo 衛星全部都在跑。Amazon 真正的護城河不是任何一條業務線，而是「重複執行同一個公式」這件事本身。

Graviton Playbook 將在 AI 晶片重演一次

Nitro / Graviton 在 PaaS 層的做法是：「客戶買的是『資料庫』這個抽象服務，不在乎底下跑 Intel、AMD 還是 ARM。」於是 Amazon 收 PaaS 的高毛利 + 用自家 ARM CPU 把成本壓下去。Trainium + Bedrock 是同一個 pattern 的第二次播放——客戶接的是 Claude / Llama / Nova / GPT 的 API，根本不會知道底層是 Trainium 還是 H100。Matt Garman 自己在訪談裡明說：「絕大多數客戶不會直接接觸 GPU。」

Amazon 公式的五次播放

Mermaid 原始碼

graph TD
    A[Amazon 公式]
    A --> B1[AWS 2006-2026]
    A --> B2[電商物流]
    A --> B3[ASCS 2026-05]
    A --> B4[Amazon Leo 衛星]
    A --> B5[Bedrock + Trainium 正在跑]

「沒有前沿模型」反而是優勢的結構性原因

Ben 用一張矩陣切開大科技公司：

雲商	模型策略	結構性矛盾
Microsoft	重押 OpenAI，最後鬆綁獨家	自家本業是軟體 → AI 對自家是 existential 威脅 → 內部用算力會排擠雲端客戶
Google	自有 Gemini + 投資 Anthropic	本業是搜尋 → AI chatbot 直接威脅核心業務
Amazon	不做前沿模型，投資 Anthropic + Bedrock 中立平台	本業（搬箱子 + 蓋資料中心）跟 AI 沒有 existential 衝突

Ben 特別點出 2025 年 Microsoft 一季「Azure 數字沒達標」是因為內部 AI 工作量太大，把算力挪去做自家模型。對企業客戶這是個赤裸訊號：「這家雲商在你跟它自己之間，會選自己。」

Amazon 沒有這個問題——它沒有需要被 AI 拯救的軟體核心業務，本業反而被 AI 放大。所以它可以心安理得把算力資源優先給客戶。

Andy Jassy 在 Q1 法說會還丟出一個漂亮的反直覺洞察：記憶體短缺對 AWS 是順風，因為供應商會優先把 DRAM 給最大買家（也就是 hyperscaler），這反而加速了拖延中的企業 cloud migration。短缺時期，最大買家會放大優勢，而不是承擔對等的痛苦。

論點五：NVDA 的相對位置——護城河被磨，不是被推倒

把 Ben 在三篇文章（Trainium、Inference Shift、MoffettNathanson 訪談）的觀點放在一起，他對 Nvidia 的判斷比表面看到的更精細：

Nvidia 短期繼續主導 training

Training 仍然需要「高算力 + HBM + 高速網路」三位一體，這是 Nvidia 一家獨大的舒適區。沒有人在挑戰這一塊。

Nvidia 在 answer inference 仍有 premium，但會被縫隙挑戰

Cerebras / Groq 這類「速度怪獸」會吃掉「人在等」的場景（語音介面、AI 穿戴、coding）——但 Ben 自己也點出coding 用例是暫時的，當 coding 走向「機器自己提 PR、自己 review、自己 merge」，速度的價值就會大幅萎縮。

Nvidia 在 agentic inference 的議價基礎會被動搖

這是真正的反轉點。Agentic inference 的特性：

不需要極致 latency
需要的是龐大、便宜、層級式的記憶體（DRAM + SSD + 向量庫 + cold storage）
「夠用就好」的算力
CPU 速度反而比 GPU 速度更重要（因為大量 tool use）

對「不被 GPU 綁住的 agentic workload」，hyperscaler 的選擇會偏向「成本與簡單」。Nvidia 不會被立刻取代，但 它收的溢價會被壓縮——當買方知道「我這個 workload 根本不需要你那個 latency」，議價基礎就動搖了。

一個有意思的地緣訊號

Ben 還推進一步——agentic inference 對中國是大利多。中國缺先進製程，但 agentic inference 需要的是「夠用的 GPU、夠用的 CPU、DRAM、SSD」，中國全部都有。如果你還用「中國缺先進製程 = 中國 AI 沒救」這個簡化模型，這篇是當頭一棒。

Nvidia 護城河的三段命運

Mermaid 原始碼

graph TD
    N[Nvidia 護城河]
    N --> T1[Training 繼續主導]
    N --> T2[Answer Inference 有 premium 但被縫隙挑戰]
    N --> T3[Agentic Inference 溢價被壓縮]

Rin 補充：把 Ben 對 Amazon 的看多和對 Nvidia 的「相對中性」放在一起，他真正在賭的不是 Trainium 性能會超車，而是**「Trainium 不需要超車就能賺很多錢」**——只要 agentic inference 變成最大市場、且 Amazon 在那塊有結構性成本優勢，Nvidia 的單位毛利會被壓低，而 Amazon 透過量去吃 spread。這是一個比「Trainium 殺 Nvidia」更冷靜也更可能成立的論點。

控制懷疑（Calibrated Skepticism）

Ben 的論述很漂亮，但有幾個地方值得保留懷疑：

最扎實的部分

Commodity Model 框架本身：這個二分法（Apple vs commodity）跟「市場清算價 − 自家成本 = spread」的數學是純結構性的，不依賴對未來的預測。即使 Trainium 不成功，這個框架本身仍然是工具箱裡的長期資產。
Amazon 公式作為歷史 pattern 的可重複性：AWS、物流、ASCS 三次跑通是事實，不是預測。賭它在 Trainium / Leo 再跑通，是基於 demonstrated capability，不是 leap of faith。
Amazon 沒有 existential conflict 這條結構優勢：本業不被 AI 威脅是純客觀結構，不靠執行品質。

有過度推論風險的部分

「電力比晶片更接近 commodity → 更容易突破」這條反駁 Jensen 的論證：邏輯上成立，但忽略電力市場的政治性與地理性（核電執照、變壓器交期、輸電網瓶頸、社區 zoning 推翻資料中心案）。如果 2027-28 全美電網真的卡住，Amazon 跟 Microsoft 一樣會缺電。Ben 自己在 MoffettNathanson 訪談承認這個 caveat 但在 Durability 那篇處理得太快。
「Anthropic 的角色」被輕描淡寫：Amazon 對 Anthropic 的投資（Trainium 跑 Claude）是 Amazon 在 frontier model 端唯一的關鍵 hedge。如果 Anthropic 哪天決定回到 GPU-first 或被併購，Amazon 整個 inference + Bedrock 的故事會缺一塊重要拼圖。Ben 自己對 Anthropic 估值跳到 $1700 億的傳聞點到為止，沒處理「Amazon-Anthropic deal 萬一破裂」的場景。
「Google Cloud Q1 數字可能整個是 Anthropic 撐起來」的括號：辛辣但證據薄。如果這個推論是錯的，那 Google 反而是 AI 商業化最快的雲商，整套「中立平台優於垂直整合」的論點要重新校準。
「Coding 用例只是暫時的，因為 coding 也會 agent 化」：對 Cerebras 那塊論證有用，但邏輯上同樣可以反過來說「人類在 coding 迴圈裡的價值會被低估很久」，畢竟 code review 跟系統設計目前仍重度依賴人類判斷。Ben 在這裡可能對 agentic 取代速度過樂觀。
「Token-based pricing 即將死亡 → 變 utility quota」：方向對，但時程未定。OpenAI 自己的 API 仍然 per-token billing，市場慣性極強。這條 thesis 可能 3 年才開始大規模成立，而不是 3 個月。

可攜帶的 mental models（給未來評估同類消息用）

從這套合成抽出三個 quick filters，未來看到任何 Amazon / AI infra / 晶片消息時直接套用：

Filter 1：這是 Apple Model 還是 Commodity Model？

看到任何業務先問這題：「它的賺錢邏輯是『差異化收 premium』還是『成本比邊際生產者低 10%』？」兩條路都能賺很多錢，但策略完全不同——commodity 業務硬要做 differentiation 故事會被市場 punish，Apple-model 業務硬要 race-to-the-bottom 也會被 punish。 這個 filter 不只對 AI 有用，對 SaaS、硬體、媒體都適用。

Filter 2：這個論述建立在 answer inference 還是 agentic inference 的假設上？

評估任何半導體 / cloud / 模型公司投資論述時，先問「這個假設是建立在『人在迴圈』還是『人不在場』的工作型態？」

答案是 answer inference → Nvidia / HBM / Cerebras / 高階供應鏈是核心
答案是 agentic inference → 大量便宜記憶體 + CPU + 接近資料和應用是核心
如果分析師沒區分這兩種，他大概是用舊地圖看新地形

Filter 3：這家公司的本業會被 AI 威脅還是放大？

本業會被 AI existential 威脅（Google 的搜尋、Microsoft 的軟體、Meta 的 attention） → 必須瘋狂投資 frontier model，沒有選擇
本業會被 AI 放大（Amazon 的物流 + 資料中心、Apple 的硬體） → 可以選擇性參與，可以等市場成熟再下手

這個 filter 解釋了為什麼 Amazon 和 Apple 兩家「沒做前沿模型」的公司反而是 AI 時代最耐久的兩家——因為它們不必為了存活而 over-invest。

文末整理：一張地圖

Amazon 在 AI 時代的四條耐久性支柱

Mermaid 原始碼

graph TD
    AMZ[Amazon 公式 長期主義+中立平台]
    AMZ --> M1[本業不被 AI 威脅 可以中立]
    AMZ --> M2[Trainium 吃 commodity market spread]
    AMZ --> M3[Bedrock = AI stack 整合點押注]
    AMZ --> M4[agentic inference 對 AWS 肌肉友善]
    M1 --> R[結構性耐久性 不論主舞台怎麼切換]
    M2 --> R
    M3 --> R
    M4 --> R

最後留一段 Ben 自己最常引用的 frame：

「第一幕的輸家不一定是輸家，前提是你還能撐到第二幕、而且你的結構剛好對到第二幕的需求。」

Amazon 用十年示範了答案——找到一件不管時代怎麼變都對的事，然後重複做十年。 Trainium 從 2015 年買 Annapurna、2019 年發表 Trainium 1（很爛沒人想用）、到 2026 年 $225B revenue commitments，這條時間線整整七年。能撐七年的公司不多，能在被罵了七年之後反過來吃下市場的更少。

而從投資人到產品建構者，能從這套論述帶走的最大啟示是——你的 thesis 是「結構性的」還是「機會性的」？前者撐得住三五年沒成績的批評；後者三個月不爆就要懷疑自己。

由 Rin 合成整理於 2026-05-27，基於 Ben Thompson 於 2026-04-28 ~ 2026-05-14 之間發表的七篇 Stratechery 文章與訪談。