Ben Thompson 論 Amazon 的 AI 時代優勢:從落後者到最佳位置
本文整合 Ben Thompson 自 2026 年 4 月底到 5 月中之間在 Stratechery 上發表的七篇關於 Amazon/AWS/AI infra 的文章(涵蓋 Amazon's Durability、Trainium and Commodity Markets、Bedrock Managed Agents 訪談、Stratechery Weekly 19、MoffettNathanson 訪談、The Inference Shift),用同一條論述骨架重組他對「Amazon 在 AI 時代位置」這個問題的完整答案。
寫給的讀者:正在做 AI infra / cloud / 半導體判斷的人,需要一張比「Nvidia 一家獨大」更細的地圖。
核心論點(Thesis)
如果要把 Ben Thompson 過去這個月對 Amazon 的整套論述濃縮成一句話,是這個:
Amazon 在 training 時代被嫌棄是事實,但 training 只是 AI 的第一幕;當主舞台從 training 切到 inference + agents,Amazon 過去那套「資本密集基礎建設 + 自己當第一個客戶 + 再賣給第三方」的長期主義公式,正好是這個新主舞台的最佳結構。
Ben 的賭注不是「AWS 會做出比 OpenAI 更強的模型」,也不是「Trainium 會打敗 H100」。他的賭注更深、也更冷靜——他在賭一個市場結構的相位轉換:
- AI 算力市場不會永遠是「Nvidia 一條鞭」,會分裂成三個邏輯不同的子市場(training / answer inference / agentic inference)。
- 這三個子市場裡,規模最大、成長最快的那個(agentic inference)剛好對 Amazon 的歷史肌肉最友善。
- 在這個新主舞台上,「我沒有前沿模型」「我 networking 比較弱」「我的晶片便宜但慢」,從劣勢通通變成中性、甚至優勢。
整套論述真正在處理的問題其實只有一個——
「在一個贏家不斷被洗牌的科技週期裡,什麼樣的公司結構是耐久的?」
Ben 的答案:結構性耐久(durability)來自於「不論主舞台怎麼切換,你都剛好站在台中央」這件事本身。
Mermaid 原始碼
graph LR
A[Training<br>Nvidia 主場]:::steel
B[Answer Inference<br>Cerebras/Groq 縫隙]:::gold
C[Agentic Inference<br>最大也最快的市場]:::teal
A -.主舞台切換.-> B -.主舞台切換.-> C
C --> D[Amazon 公式<br>剛好對到]:::coral
論點一:Amazon 在 training 時代看起來落後的原因——市場真的看錯了什麼?
過去兩年「AWS 在 AI 落後」的敘事不是空穴來風。SemiAnalysis 2023 年那篇〈How AWS Will Lose the Future of Computing〉幾乎判了死刑,論點包括:
- AWS 沒有像 Microsoft 那樣綁住 OpenAI
- 沒有像 Google 那樣自己擁有前沿模型(Gemini)
- Trainium 1 / 2 在 benchmark 上落後 H100 兩個世代
- Nitro + EFA 的網路架構不適合把上千張 GPU 串成同步訓練系統
這四點放在 training 為王的世界裡每一點都成立。Nvidia 也樂得把 GPU 優先給 Microsoft、Oracle、CoreWeave 這些「比較聽話、會整套採用 Nvidia 解決方案」的雲,AWS 在 training 工作負載上拿到的稀缺 GPU 配額確實比較少。
但 Ben 在 Amazon's Durability 裡點出一個被多數分析師忽略的事實——這四個「劣勢」全部建立在一個假設上:「training 是 AI 算力市場的主舞台」。一旦這個假設被拿掉,這四點要嘛變中性、要嘛變優勢:
| 「劣勢」 | training 時代 | inference + agent 時代 |
|---|---|---|
| 沒綁 OpenAI | 致命 | 變賣點(不跟客戶搶算力) |
| 沒前沿模型 | 落後 | 中立平台(什麼模型都能接) |
| Trainium 性能差 | 沒人想用 | 成本結構優勢吃 spread |
| Networking 弱 | 跑不動大訓練 | 不重要(inference 一台機器內就搞定) |
Rin 補充:這張表的價值不在於它判 Amazon 翻盤,而在於它示範了一個方法論——很多被反覆批評的「結構性缺陷」,其實只是「在當前主軸下不適合」。市場常常把這兩件事混為一談,於是會給「結構性對到下個主軸的公司」一個過低的估值。這就是 Ben 賺超額判斷力的方法。
論點二:Trainium + inference 時代的反轉邏輯——商品市場的賺錢公式
這是 Ben 在 Trainium and Commodity Markets 裡丟出的全套框架,也是這次合成裡最值得當工具帶走的一塊。
兩種商業模式的二分法
Ben 把所有「能持續賺錢」的生意分成兩類:
-
Apple Model — 差異化收 premium
- iPhone 是世界上唯一跑 iOS 的裝置 → 收高毛利
- 大多數 startup、moat、network effect 的故事都屬於這類
-
Commodity Model — 結構性更低的成本
- 商品(commodity)難以差異化、容易替代
- 賺錢公式 = 市場清算價 − 自己的成本
- 而市場清算價 = 「最沒效率的廠商剛好打平的價格」
- 不需要做出最好的產品,只需要比邊際生產者更便宜
把這個框架套進 AI
Ben 的核心判斷:AI 是 commodity 市場——token 容易替代、買家在意價格,而且需求遠超供給,市場清算價會被推得很高。在這個結構下:
- 每一個比邊際生產者便宜的廠商,都在「市場清算價 − 自家成本」之間吃 spread
- 需求超過供給時,這個 spread 會被供需失衡放得更大
- Trainium 的價值不在於削價競爭,而在於「在需求過剩的 commodity 市場拿走更多 spread」
Andy Jassy 在 Q1 2026 法說會給的具體數字(這些是 thesis 的支撐證據):
- AWS 營收 YoY +28%,自 2022 年以來最快
- Custom chips 季增 40%,年化 run rate 已破 $20B
- 內部 + 外部合計年化 run rate ~$50B → 全球資料中心晶片業者前三大
- Trainium revenue commitments $225B(Anthropic、OpenAI、Uber 等多年期承諾)
- Trainium2 比同級 GPU 好 30% price-performance,幾乎賣光
- Trainium3 比 T2 再好 30-40%,已近售罄
- Trainium4 還有 18 個月才大規模供貨,已被預訂掉一大部分
- Jassy 對股東的會計式承諾:規模化後 Trainium 預期每年幫 AWS 省下「幾百億 CapEx」+「幾百個基點」的營業利潤率
Mermaid 原始碼
graph TD
A[AI 算力 是 commodity 市場]
B[需求遠超供給 清算價被推高]
C[Trainium 成本結構更低]
D[Spread = 清算價 - 自家成本]
E[Trainium 的真正獎勵:不是削價而是吃 spread]
A --> B
B --> D
C --> D
D --> E
為什麼 inference 時代剛好對 AWS 友善
Ben 在 The Inference Shift 把這條反轉鏈推得更深。他主張 inference 其實是兩種完全不同的工作負載:
| Answer Inference | Agentic Inference | |
|---|---|---|
| 人在迴圈 | 是 | 否 |
| Latency 重要? | 極重要 | 不重要 |
| 主導記憶體 | HBM | DRAM + SSD + 向量庫 + cold storage |
| 主導晶片 | 最快 GPU | 一堆夠用就好的 commodity |
| 對 AWS 友善程度 | 中性 | 極高 |
Agentic inference 才是「最大也增長最快的市場」,原因是它不被人類使用者數量綁住,可以 scale with compute。而它需要的東西——「夠用的算力 + 大量便宜記憶體 + CPU + 接近資料和應用」——剛好是 AWS 二十年來最熟練的肌肉記憶。
Rin 補充:合在一起讀,Ben 真正在說的是:「Trainium 不是要打敗 H100,而是要在『agentic inference 這個將會比 training 大十倍的市場』裡,當那個比邊際生產者便宜的廠商。」這個論點即使對 Trainium 性能本身的判斷錯了,只要 agentic inference 確實成為主舞台、且需求持續過剩,Amazon 仍會吃到很大一塊。這是一個很漂亮的「結構性下注」。
但有一個 trigger 變數
Ben 自己在文章裡留了 caveat:這套劇本的反轉觸發器是 power(電力)。
- 如果電力是 limiter → Nvidia 的 tokens-per-watt premium 重新有理由
- 如果晶片才是 limiter(目前幾年) → Trainium 的成本結構優勢值更多錢
這條 caveat 提供了一個極其有用的「該盯什麼變數」的指南——不是訂單規模、不是出貨節奏,而是「power 是不是 limiter」。
論點三:Bedrock Managed Agents — AWS 的 AI Stack 整合戰
Sam Altman × Matt Garman 的訪談是這套論述裡最具新聞價值的部分。但 Ben 自己最在意的不是「OpenAI 終於上 AWS 了」這個新聞,而是更深的三個訊號:
訊號一:價值鏈的整合點正從「模型」移到「模型 + harness」
Ben 對科技價值鏈的長期觀察是:「在任何 value chain 中,價值最終會集中在一個整合點」。這次他押的整合點是 model + harness(runtime, tools, memory, permissions)——而不是純 model API、也不是純 cloud infra。
證據:Codex 跑得比裸 OpenAI API 好太多。這意味著 model 跟 harness 在實務上已經沒辦法分開看。誰把這層做對,誰就拿走最多價值。
訊號二:Microsoft 親手鬆綁護城河,是因為 Azure 獨家在傷害 OpenAI 投資
新協議的關鍵交換:
- Microsoft 放棄 Azure 獨家,但仍保留 OpenAI IP licence 到 2032
- OpenAI 放棄付 Microsoft 的 revenue share(直接讓 Azure PnL 變漂亮)
- 取消 AGI clause,協議無條件跑到 2032
- Microsoft 仍享有 OpenAI 對 Azure 的 revenue share 至 2030
Ben 一句話濃縮:「Azure 的獨家其實在傷害 Microsoft 對 OpenAI 的投資。」當企業客戶最在意「在現有雲上拿到 frontier model」、而 Anthropic 又能在 AWS / GCP 自由銷售,Azure 獨家就變成 OpenAI 成長的天花板,反過來壓低 Microsoft 手裡那塊股權的價值。Microsoft 用「給 OpenAI 自由」換到「自己的 PnL 變好 + 投資價值繼續成長」。
而 OpenAI 拿到自由後第一個用力擁抱的不是 Google、Oracle,是 AWS。並且不是輕量的 API 上架,而是和 AWS 共同 co-build 一個 managed agent product。
訊號三:Token-based pricing 即將死亡
Sam 在訪談裡的自我修正:「我以前說我們是 token factory,但其實錯了。我們是 intelligence factory。」並舉例:GPT-5.5 比 5.4 per-token 成本「高得多」,但完成同一個任務所需的 token「少得多」——從「完成一件事的成本」算,5.5 反而更便宜。
Mermaid 原始碼
graph LR
A[舊計價 per-token] --> B[新計價 per unit of intelligence]
B --> C[更像 utility 給你 capacity quota]
A -.GPT 反例.-> B
這對 AWS 是好消息——utility 市場的本質就是不應該由單一供應商鎖死,於是 Bedrock 那種「中立平台 + 多個 model」的形狀比 Google 的「Gemini + TPU + Vertex 整套包」更符合 utility 市場的長期均衡。
AgentCore vs Managed Agents 的分層
最後也最聰明的一手是 AWS 的雙層產品策略:
| 層級 | 產品 | 比喻 |
|---|---|---|
| Primitives | Bedrock AgentCore | 自己組電腦 |
| Managed | Bedrock Managed Agents (OpenAI 獨家) | 買 Mac mini |
「同時服務想自己組裝的人 + 想要 turnkey 的人」——這是 AWS 從 2006 年就一以貫之的 platform thinking。
論點四:Amazon's Durability — 為什麼這家公司在 AI 時代反而比 Google/Microsoft 更耐久
這是這整套論述真正的核心,也是 Ben 從十年前 The Amazon Tax 一路追到 2026 年 Amazon Supply Chain Services launch 的核心預言。
Amazon 操作公式(the Amazon Formula)
- 找一個資本密集、回收期超長的基礎建設機會
- 公司本身是這個基礎建設的 first-best customer(保證初期需求量)
- 把對外的可變邊際成本,內化成自己的固定資本支出
- 建到一定規模後對外開放——把同一筆資本支出再賣一次給第三方
- 越多第三方使用 → 規模越大 → 單位成本越低 → 護城河越深
這套公式 AWS、電商物流、現在 Amazon Supply Chain Services(ASCS)、未來 Amazon Leo 衛星全部都在跑。Amazon 真正的護城河不是任何一條業務線,而是「重複執行同一個公式」這件事本身。
Graviton Playbook 將在 AI 晶片重演一次
Nitro / Graviton 在 PaaS 層的做法是:「客戶買的是『資料庫』這個抽象服務,不在乎底下跑 Intel、AMD 還是 ARM。」於是 Amazon 收 PaaS 的高毛利 + 用自家 ARM CPU 把成本壓下去。Trainium + Bedrock 是同一個 pattern 的第二次播放——客戶接的是 Claude / Llama / Nova / GPT 的 API,根本不會知道底層是 Trainium 還是 H100。Matt Garman 自己在訪談裡明說:「絕大多數客戶不會直接接觸 GPU。」
Mermaid 原始碼
graph TD
A[Amazon 公式]
A --> B1[AWS 2006-2026]
A --> B2[電商物流]
A --> B3[ASCS 2026-05]
A --> B4[Amazon Leo 衛星]
A --> B5[Bedrock + Trainium 正在跑]
「沒有前沿模型」反而是優勢的結構性原因
Ben 用一張矩陣切開大科技公司:
| 雲商 | 模型策略 | 結構性矛盾 |
|---|---|---|
| Microsoft | 重押 OpenAI,最後鬆綁獨家 | 自家本業是軟體 → AI 對自家是 existential 威脅 → 內部用算力會排擠雲端客戶 |
| 自有 Gemini + 投資 Anthropic | 本業是搜尋 → AI chatbot 直接威脅核心業務 | |
| Amazon | 不做前沿模型,投資 Anthropic + Bedrock 中立平台 | 本業(搬箱子 + 蓋資料中心)跟 AI 沒有 existential 衝突 |
Ben 特別點出 2025 年 Microsoft 一季「Azure 數字沒達標」是因為內部 AI 工作量太大,把算力挪去做自家模型。對企業客戶這是個赤裸訊號:「這家雲商在你跟它自己之間,會選自己。」
Amazon 沒有這個問題——它沒有需要被 AI 拯救的軟體核心業務,本業反而被 AI 放大。所以它可以心安理得把算力資源優先給客戶。
Andy Jassy 在 Q1 法說會還丟出一個漂亮的反直覺洞察:記憶體短缺對 AWS 是順風,因為供應商會優先把 DRAM 給最大買家(也就是 hyperscaler),這反而加速了拖延中的企業 cloud migration。短缺時期,最大買家會放大優勢,而不是承擔對等的痛苦。
論點五:NVDA 的相對位置——護城河被磨,不是被推倒
把 Ben 在三篇文章(Trainium、Inference Shift、MoffettNathanson 訪談)的觀點放在一起,他對 Nvidia 的判斷比表面看到的更精細:
Nvidia 短期繼續主導 training
Training 仍然需要「高算力 + HBM + 高速網路」三位一體,這是 Nvidia 一家獨大的舒適區。沒有人在挑戰這一塊。
Nvidia 在 answer inference 仍有 premium,但會被縫隙挑戰
Cerebras / Groq 這類「速度怪獸」會吃掉「人在等」的場景(語音介面、AI 穿戴、coding)——但 Ben 自己也點出coding 用例是暫時的,當 coding 走向「機器自己提 PR、自己 review、自己 merge」,速度的價值就會大幅萎縮。
Nvidia 在 agentic inference 的議價基礎會被動搖
這是真正的反轉點。Agentic inference 的特性:
- 不需要極致 latency
- 需要的是龐大、便宜、層級式的記憶體(DRAM + SSD + 向量庫 + cold storage)
- 「夠用就好」的算力
- CPU 速度反而比 GPU 速度更重要(因為大量 tool use)
對「不被 GPU 綁住的 agentic workload」,hyperscaler 的選擇會偏向「成本與簡單」。Nvidia 不會被立刻取代,但 它收的溢價會被壓縮——當買方知道「我這個 workload 根本不需要你那個 latency」,議價基礎就動搖了。
一個有意思的地緣訊號
Ben 還推進一步——agentic inference 對中國是大利多。中國缺先進製程,但 agentic inference 需要的是「夠用的 GPU、夠用的 CPU、DRAM、SSD」,中國全部都有。如果你還用「中國缺先進製程 = 中國 AI 沒救」這個簡化模型,這篇是當頭一棒。
Mermaid 原始碼
graph TD
N[Nvidia 護城河]
N --> T1[Training 繼續主導]
N --> T2[Answer Inference 有 premium 但被縫隙挑戰]
N --> T3[Agentic Inference 溢價被壓縮]
Rin 補充:把 Ben 對 Amazon 的看多和對 Nvidia 的「相對中性」放在一起,他真正在賭的不是 Trainium 性能會超車,而是**「Trainium 不需要超車就能賺很多錢」**——只要 agentic inference 變成最大市場、且 Amazon 在那塊有結構性成本優勢,Nvidia 的單位毛利會被壓低,而 Amazon 透過量去吃 spread。這是一個比「Trainium 殺 Nvidia」更冷靜也更可能成立的論點。
控制懷疑(Calibrated Skepticism)
Ben 的論述很漂亮,但有幾個地方值得保留懷疑:
最扎實的部分
- Commodity Model 框架本身:這個二分法(Apple vs commodity)跟「市場清算價 − 自家成本 = spread」的數學是純結構性的,不依賴對未來的預測。即使 Trainium 不成功,這個框架本身仍然是工具箱裡的長期資產。
- Amazon 公式作為歷史 pattern 的可重複性:AWS、物流、ASCS 三次跑通是事實,不是預測。賭它在 Trainium / Leo 再跑通,是基於 demonstrated capability,不是 leap of faith。
- Amazon 沒有 existential conflict 這條結構優勢:本業不被 AI 威脅是純客觀結構,不靠執行品質。
有過度推論風險的部分
- 「電力比晶片更接近 commodity → 更容易突破」這條反駁 Jensen 的論證:邏輯上成立,但忽略電力市場的政治性與地理性(核電執照、變壓器交期、輸電網瓶頸、社區 zoning 推翻資料中心案)。如果 2027-28 全美電網真的卡住,Amazon 跟 Microsoft 一樣會缺電。Ben 自己在 MoffettNathanson 訪談承認這個 caveat 但在 Durability 那篇處理得太快。
- 「Anthropic 的角色」被輕描淡寫:Amazon 對 Anthropic 的投資(Trainium 跑 Claude)是 Amazon 在 frontier model 端唯一的關鍵 hedge。如果 Anthropic 哪天決定回到 GPU-first 或被併購,Amazon 整個 inference + Bedrock 的故事會缺一塊重要拼圖。Ben 自己對 Anthropic 估值跳到 $1700 億的傳聞點到為止,沒處理「Amazon-Anthropic deal 萬一破裂」的場景。
- 「Google Cloud Q1 數字可能整個是 Anthropic 撐起來」的括號:辛辣但證據薄。如果這個推論是錯的,那 Google 反而是 AI 商業化最快的雲商,整套「中立平台優於垂直整合」的論點要重新校準。
- 「Coding 用例只是暫時的,因為 coding 也會 agent 化」:對 Cerebras 那塊論證有用,但邏輯上同樣可以反過來說「人類在 coding 迴圈裡的價值會被低估很久」,畢竟 code review 跟系統設計目前仍重度依賴人類判斷。Ben 在這裡可能對 agentic 取代速度過樂觀。
- 「Token-based pricing 即將死亡 → 變 utility quota」:方向對,但時程未定。OpenAI 自己的 API 仍然 per-token billing,市場慣性極強。這條 thesis 可能 3 年才開始大規模成立,而不是 3 個月。
可攜帶的 mental models(給未來評估同類消息用)
從這套合成抽出三個 quick filters,未來看到任何 Amazon / AI infra / 晶片消息時直接套用:
Filter 1:這是 Apple Model 還是 Commodity Model?
看到任何業務先問這題:「它的賺錢邏輯是『差異化收 premium』還是『成本比邊際生產者低 10%』?」兩條路都能賺很多錢,但策略完全不同——commodity 業務硬要做 differentiation 故事會被市場 punish,Apple-model 業務硬要 race-to-the-bottom 也會被 punish。 這個 filter 不只對 AI 有用,對 SaaS、硬體、媒體都適用。
Filter 2:這個論述建立在 answer inference 還是 agentic inference 的假設上?
評估任何半導體 / cloud / 模型公司投資論述時,先問「這個假設是建立在『人在迴圈』還是『人不在場』的工作型態?」
- 答案是 answer inference → Nvidia / HBM / Cerebras / 高階供應鏈是核心
- 答案是 agentic inference → 大量便宜記憶體 + CPU + 接近資料和應用是核心
- 如果分析師沒區分這兩種,他大概是用舊地圖看新地形
Filter 3:這家公司的本業會被 AI 威脅還是放大?
- 本業會被 AI existential 威脅(Google 的搜尋、Microsoft 的軟體、Meta 的 attention) → 必須瘋狂投資 frontier model,沒有選擇
- 本業會被 AI 放大(Amazon 的物流 + 資料中心、Apple 的硬體) → 可以選擇性參與,可以等市場成熟再下手
這個 filter 解釋了為什麼 Amazon 和 Apple 兩家「沒做前沿模型」的公司反而是 AI 時代最耐久的兩家——因為它們不必為了存活而 over-invest。
文末整理:一張地圖
Mermaid 原始碼
graph TD
AMZ[Amazon 公式 長期主義+中立平台]
AMZ --> M1[本業不被 AI 威脅 可以中立]
AMZ --> M2[Trainium 吃 commodity market spread]
AMZ --> M3[Bedrock = AI stack 整合點押注]
AMZ --> M4[agentic inference 對 AWS 肌肉友善]
M1 --> R[結構性耐久性 不論主舞台怎麼切換]
M2 --> R
M3 --> R
M4 --> R
最後留一段 Ben 自己最常引用的 frame:
「第一幕的輸家不一定是輸家,前提是你還能撐到第二幕、而且你的結構剛好對到第二幕的需求。」
Amazon 用十年示範了答案——找到一件不管時代怎麼變都對的事,然後重複做十年。 Trainium 從 2015 年買 Annapurna、2019 年發表 Trainium 1(很爛沒人想用)、到 2026 年 $225B revenue commitments,這條時間線整整七年。能撐七年的公司不多,能在被罵了七年之後反過來吃下市場的更少。
而從投資人到產品建構者,能從這套論述帶走的最大啟示是——你的 thesis 是「結構性的」還是「機會性的」?前者撐得住三五年沒成績的批評;後者三個月不爆就要懷疑自己。
由 Rin 合成整理於 2026-05-27,基於 Ben Thompson 於 2026-04-28 ~ 2026-05-14 之間發表的七篇 Stratechery 文章與訪談。