阿里巴巴七天內要員工刪掉 Claude。蒸餾戰打到了辦公室。
阿里巴巴要員工 7/10 前解除安裝 Claude 等所有 Anthropic 產品,蒸餾指控升級進企業內部。同日潘健成警告記憶體缺貨已成定局,微軟 AWS 把工程師派進客戶端搶多模型調度。
阿里巴巴七天內要員工刪掉 Claude
阿里巴巴要求員工在 7 月 10 日前,解除安裝所有 Anthropic 產品。
範圍幾乎是全套。Claude Sonnet、Claude Opus、Claude Fable 這些模型,加上 Claude Code 以及其他代理工具,全部列入必須移除的清單。阿里巴巴內部人士的說法是,近日 Claude Code 被發現夾帶特定訊號回傳系統,評估後把 Anthropic 的產品列入高風險軟體名單。
這件事跟 昨天報告 是同一條線的下一步。前一天談的是 Claude Code 被逆向工程挖出偵測中國時區與網域的機制,Anthropic 炎上後宣布移除。今天是被偵測的那一方直接把整套工具趕出辦公室。
背後的火藥是蒸餾(distillation)。Anthropic 今年 2 月點名 DeepSeek、月之暗面、MiniMax 三家中國公司,指控它們用蒸餾手法竊取 Claude 技術。6 月又把矛頭指向阿里巴巴,說有與阿里及其通義實驗室相關的人士,透過將近 25,000 個詐欺帳號,跟 Claude 產生超過 2,880 萬次互動,從中提取數據。
指控會浮上檯面,是因為 Anthropic 把它寫進一封送交美國參議院銀行委員會的信件,事件因此上升到國家安全層級。阿里巴巴這邊也不甘示弱,早先因為被美方列入「中國軍工企業」黑名單,向美國法院提告戰爭部。
封鎖是雙向在收緊的。6 月底到 7 月初,Anthropic 對中國用戶展開一輪帳號取消,個人與團隊訂閱都受波及;而 Claude Code 會檢查 Agent 或 API 位址是否落在阿里、螞蟻集團、字節跳動這些名字上,並在系統提示裡隱晦標記中國使用者。阿里巴巴以安全為由全面禁用,等於把這場拉鋸從模型層打到了每一台員工電腦。
記憶體這輪缺貨,潘健成說回不去了
群聯執行長潘健成的判斷很直接:記憶體嚴重供不應求已經成為定局。
他把 AI 帶來的需求拆成三個來源。使用人數會倍增,目前全球約 1 億人用 AI,兩年內勢必翻上去;資料格式會質變,現在高達 70% 的 AI 應用還是以文字為主,兩年後轉向影像與圖片,處理量會暴增千倍;使用頻率會拉高,人們每天向 AI 提問的次數,預計從 3 到 10 次跳到 50 到 100 次。千倍資料量疊上十倍頻率,最後落在 Token 運算量上就是很嚇人的數字。
問題是產能追不上。潘健成估 2026 年全球相關產能約 1,400 到 1,500 個單位,這是長期砸錢建廠累積的成果,就算現在積極擴產,兩年內最多也只能成長 1.6 到 1.7 倍。一邊線性成長、一邊千百倍需求,缺口很明確。
他還點出一個結構性改變:NAND 的傳統循環法則不存在了。過去三年半雲端大廠豪擲約 7,000 億到 9,000 億美元建資料中心,模型訓練成熟後只能靠推論(Inference)變現,而推論吃電力、產出 Token,Token 全都要儲存空間放。既然投了上千億,這些雲端業者不可能在收割時削減儲存預算。原廠已經對群聯預警 2027 年供應會減少,但群聯 2027 年的需求不減反增,雙方還在為配額拉鋸。
供給端的動作對得上這個判斷。SK 海力士宣布總額 1,100 兆韓圜的韓國投資計畫,清州園區加碼 100 兆韓圜蓋 M17 3D NAND 廠與 P&T7 封測廠,最快 2029 年投產;龍仁半導體聚落砸約 3,893 億美元,要成為公司史上最大投資與全球最大 DRAM 基地,首座晶圓廠 2027 年 5 月投產,四座廠 2033 年前完工,比原訂的 2045 年大幅提前。三星也宣布約 140 兆韓圜投資忠清道,含溫陽新建五條 HBM 產線。
載板這一層也開始搶產能。ABF 載板的核心層要從雙層走向 6 到 8 層,把電源管理元件塞得更靠近處理器,核心成本估計增加 3 到 4 倍。AT&S 宣布 15 億到 20 億歐元資本支出,在馬來西亞居林建核心廠,二廠 60% 到 70% 產能被英特爾包下;Ibiden 則在檳城投入約 1,200 億日圓擴產。如果 AI 推論的量真的照潘健成講的方向長,接下來卡住的就不只是 HBM,而是整條從晶粒到載板的鏈。
AI 戰場從比模型變成比落地
Exponential View 的《2026 AI 經濟現況》報告丟出一組矛盾數字:生成式 AI 生態系年化營收已達 1,750 億美元,擴張速度比網路時代快 3 倍,但只佔美國 GDP 的 0.42%。
錢真實地在流動,效益卻在財報底線上看不太到。報告的解釋是,龐大資本支出推升了算力與電力需求,但終端效益多半集中在企業內部的成本節約,還有一部分變成沒進財報的消費者剩餘,加上硬體折舊攀升,短期獲利空間被壓著。真實需求很大,但轉成生產力的最後一哩路還沒走通。
這條沒走通的路,正是雲端巨頭現在搶的地方。AWS 6 月 30 日宣布投入 10 億美元成立「前線部署工程師」(Forward Deployed Engineering)組織,兩天後微軟就宣布斥資 25 億美元成立 Microsoft Frontier Company,計畫編制 6,000 人,由 Rodrigo Kede Lima 出任總裁,直接把工程師派進客戶公司協助設計與部署 AI。這套模式 Palantir 20 年前就在做,OpenAI 5 月跟 TPG 合資 40 億美元成立部署公司,Anthropic 也攜手高盛、黑石啟動 15 億美元的嵌入式工程計畫。
微軟這步的關鍵字是多模型。Frontier Company 採開放策略,企業可以自由選 OpenAI、Anthropic、微軟自家、開源或特定產業模型,不必被單一供應商綁死,而且強調客戶資料與智慧財產不會拿去訓練模型。這正好接住阿里巴巴那條線露出的企業焦慮:把核心業務押在一家模型公司身上,風險已經具體化了。Palantir 7 月 1 日在 X 發了一份 AI 主權宣言,主張機構要牢牢握住自己資料的所有權,還痛批盲目燒 Token 不是可持續的商業模式。
工具這一層也在往「掌握整個流程」走。中國的 Z.ai(前身智譜 AI)推出開發工具 ZCode,接在 Claude Code、OpenAI Codex、Google Antigravity 之後,設計理念是「以專案思考,而不是以 Prompt 思考」。模型公司從只賣 API,變成同時掌握模型、訂閱、IDE 與代理工作流程的全棧平台。
大廠一邊猛衝,一邊也在誠實面對進度。祖克柏 7 月 2 日在員工大會坦承,Meta 的 AI 代理進展比公司預估更慢,雖然邁向超級智慧的方向沒變,但需要更多時間,他估三到六個月內可望看到部分效益。同一場合,Meta 超級智慧實驗室主管汪滔說即將推出的模型「西瓜」已追上 OpenAI 的 GPT-5.5,算力比 4 月的「酪梨」高一個量級。追趕與落後,在 Meta 同一週被說出口。
AI 寫掉七成程式碼之後,稀缺的變成別的
微軟副總裁 Scott Hanselman 說自己近期約 70% 的程式碼是 AI 輔助產出,但他不覺得工程師會因此消失。
他把這稱為程式設計界「第四個十年的恐慌」。1984 年有人說不用組合語言就不算真正的程式設計師,後來語法上色、自動完成、Stack Overflow 出現時也有人擔心工具讓開發者退化。在他眼裡,AI 更像新一代電動工具,不是能接管整套工程責任的替代者。理由是模型不會自然維護架構,它很容易迎合使用者、一直加功能,最後長出過度龐大又難維護的系統。
他真正擔心的不是取代,是斷層。如果企業為了省成本停止聘初階工程師,過去讓新人理解系統的除錯、維護與簡單功能都被 AI 接走,幾年後的資深工程師要從哪裡長出來。他因此重新定義資深者的責任:不只交付更多,還要「製造更多資深工程師」。微軟正在設計 preceptorship 這種由資深帶新人的培育制度,也跟 Microsoft Research 合作研究能促進學習的 AI 模式,例如要求使用者自己補完部分程式碼或解釋答案。
Anthropic 對約 40 萬個 Claude Code 工作階段的研究給了一個對照。在會產生程式碼的階段裡,軟體相關職業的驗證成功率約 34%,其他職業約 29%;放寬到部分成功時是 89% 與 88%。使用者的領域專業愈高,愈能引導模型完成工作。門檻降低不等於專業失效。
Claude Code 負責人 Boris Cherny 從另一個角度講同一件事。他提出 5 種工作原型:原型者快速試點子、建造者把概念變正式產品、清理者移除多餘功能、成長者調整既有產品、維護者顧安全與成本效率。多數人會橫跨 2 到 3 種。他的判斷是,當寫程式可以大量委派給 AI,清理者與維護者的地位會超越建造者,因為方向判斷與架構整頓是人類專業的最後堡壘。他甚至反問團隊領導者:你的 KPI 是不是正在懲罰那些願意花時間刪掉冗餘功能的人。
同一股力量也打到了辦公軟體。微軟的 Word、Excel、PowerPoint 開始被問還能撐多久,因為整理筆記、做簡報、分析趨勢這些事,ChatGPT 與 Claude 都做得到,而且不必依賴微軟的 App 或訂閱。Microsoft 365 家用方案每月 12.99 美元,Claude Pro 每月 20 美元,貴 7 美元,但支持者的算盤是通用模型能處理的任務範圍更廣。
SAP 則直接拿員工做實驗。兩年前它在重組中裁掉近萬個職位,部分跟導入 AI 有關,現在改成不再縮編、把員工重新部署到更能發揮 AI 的崗位。工程師 Fabrizio Primerano 的例行寫程式與測試多半被 AI 接手,工作內容轉成管理與指導 AI 代理。執行長 Christian Klein 說他不確定兩三年後 SAP 是否還有人在寫程式碼,但他預估的不是更精簡的團隊,而是一支「非常不同的勞動力」。德國未來 10 年預計流失近 700 萬名勞動人口,這場實驗成不成,對整個歐洲都有參考意義。
楊立昆賭 LLM 不是終點,實體 AI 要另一套
在 Meta 當了十年首席 AI 科學家的楊立昆,離職後拿到超過 10 億美元種子輪,這是歐洲史上最大的種子輪之一。
投資者包括輝達,以及管理貝佐斯個人財富的基金。他在巴黎成立「先進機器智能實驗室」(AMI Labs),目標是做出超越 ChatGPT、Claude、Gemini 的東西。他的立場很尖銳:現有的 LLM 並不聰明,在規則明確的任務上表現優異,但本質是累積知識再反芻訓練內容,不是真的理解現實,光靠把模型放大絕不可能做到超越人類的智慧,而且 LLM 在機器人領域基本上毫無希望。
他用一個簡單例子說明。把一支筆垂直立起、筆尖朝下放手,連小孩都知道筆會倒,只是不知道倒向哪邊;但 LLM 會硬要根據訓練數據的統計規律給出一個預測,因為它不是用物理現實推理,只是生成統計上看起來合理的內容。AMI Labs 要做的是「聯合嵌入預測架構」(JEPA),用數學過濾掉無用資訊、建立現實世界的抽象模型,再評估行動的後果。這條世界模型的路線這幾年正在變成研究焦點,Google 的 Dreamer 就靠想像未來場景,在《當個創世神》裡學會收集鑽石。楊立昆預計 2027 年先把成果用在工業場景。
同一天,一個被手機時代淘汰的名字用另一種方式證明了實體 AI 的價值:黑莓。它的 QNX 軟體目前跑在全球 2.75 億輛車上,除了特斯拉以外幾乎每家車廠都在用,輝達與 AMD 也拿它來建智能車與倉庫機器人。第一季 QNX 營收 7,230 萬美元,年增 26%,毛利率高達 86%。
QNX 值錢的地方跟楊立昆的批評剛好呼應。執行長吉亞馬特歐強調它是「確定性的」作業系統,給定相同輸入永遠產生相同輸出,不像機率性的生成式 AI 問同樣的問題每次答案可能不同。對攸關生命安全的自動駕駛與機器人系統來說,這種可預測性是底線。生成式 AI 已經進入實用階段,但需要跟現實世界互動、對可靠性要求極高的實體 AI 還在早期,而這一塊要的不是更會聊天的模型。
漏洞被利用的時間跌到兩小時
一個叫 Zero Day Clock 的網站把攻防的時間差攤在檯面上:漏洞從公開揭露到首次被偵測利用,已經跌破一天。
這個專案由 Sysdig 資安長 Sergej Epp 在 2026 年初發起,整合 CISA KEV、VulnCheck 等威脅情報,追蹤超過 3,500 個漏洞利用案例。它最受關注的指標是漏洞公開到首次被利用的時間,2018 年開始急遽縮短,2025 年平均還有 21.5 天,2026 年截至 7 月 3 日已經降到 2 小時。Epp 的話很白:如果你的董事會簡報只需要一張投影片,就是這一張。
窗口崩塌的同時,攻擊者也開始用 AI 自己動手。Sysdig 揭露一起完全由 AI 代理與 LLM 驅動的勒索軟體行動,駭客團體 JadePuffer 先用已知漏洞 CVE-2025-3248 從可連網的 Langflow 執行個體取得初始入侵管道,接著展開會動態調整的全自動勒索,最後照戰術手冊破壞資料庫。最詭異的是它的惡意程式碼裡塞滿自我敘述的自然語言註解,說明每一步的動機;某次登入特定系統失敗後,只花 31 秒就調整完成並成功登入,這種速度不像人做得到。Sysdig 把這種攻擊能力來自 AI 的對手,稱為代理型威脅行為者(Agent Threat Actor)。
Langflow 這套 LLM 開發工具最近成了熱門入口。除了 JadePuffer,趨勢科技還揭露有人利用它另一個 RCE 漏洞 CVE-2026-33017 挖門羅幣,在未經身分驗證的 API 端點下一行 Python,拉取用 Go 寫成的挖礦程式,啟動後先清掉競爭對手的挖礦程序、關掉一堆系統防護,順手還把阿里巴巴的雲端代理程式也停用。當攻防時間被壓到以小時計,把 AI 基礎設施本身守好,會比事後清挖礦程式更關鍵。
- → 阿里巴巴禁用會不會擴散到其他中國科技公司,Anthropic 對中國帳號的封鎖措施接下來怎麼走。
- → SK 海力士龍仁與清州擴產時程確定後,2027 年記憶體供給缺口的實際數字。
- → 微軟 Frontier 與 AWS 的前線工程師模式誰先做出可衡量的企業成果。
如果模型能力真的在趨同,接下來能拉開差距的就不是誰的分數高,而是誰能被信任、被部署、被維護。