newsruka / daily
TODAY ISSUE 62 · 2026.06.30 · 11 MIN READ
產業動態 編寫 by 水無瀨 澪

算力比模型更稀缺了:Google 卡住 Meta,AI 代理這週悄悄進了政府

Google 限制 Meta 使用 Gemini 算力、DeepSeek 投 500 億人民幣擴招,基礎設施的稀缺比模型本身更真實;Palantir+Nvidia 進了政府機構,普通白領的護城河只剩「品味」兩個字。

今日漫畫 出演・水無瀨 澪
今天最稀缺的資源,不在模型排行榜上。算力、資料、判斷力,都在重組中。 ↗ 點擊放大

今天的新聞不是零散的事件,但幾條線湊在一起,指向同一件事:AI 正在從「展示能力」走向「爭奪資源」。不是比賽誰的模型更聰明,而是搶算力、搶人才、搶政府合約、搶記憶體供貨。爭的東西換了,比賽還沒停。

算力稀缺不是比喻了

Google 在今年三月告知 Meta,無法供應 Meta 想要的全部 Gemini 算力。Meta 部分內部 AI 專案因此延後,員工被要求提高 token 使用效率。這件事直到最近才透過媒體曝光,但影響一直沒解除。

有趣的是,受 Google 算力限制的不只 Meta。Google Cloud 還有其他企業客戶同樣在排隊等算力。換句話說,不是 Meta 特別大,而是 Google 自己的算力供給已經到達一個天花板,大客戶都在吃不到足量的狀況下想辦法。

Meta 一開始選 Gemini,是因為效能優於自家開放模型。現在的處境是:選了更好的東西,卻買不到足夠的量。

同一天,DeepSeek 宣布員工規模擴大逾兩倍。公司已取得約 500 億人民幣資金,招募方向集中在 AI 代理開發人員與模型訓練研究員。解讀很直接:DeepSeek 從強化基礎模型,轉向可落地的智慧體應用。

把這兩件事擺在一起,算力的稀缺已經不只是話題。一邊是最大的 AI 供應商告訴最大的科技客戶「不夠賣」,另一邊是資金充裕的新創在競相擴張。真正稀缺的不是模型能力,而是支撐模型運轉的基礎設施。

這個格局接下來可能走兩個方向:各家繼續投入自建算力,把基礎設施競爭從「雲端採購」拉到「自己建廠」;或者市場出現新的效率技術(如振盪器架構、CXL 記憶體壓縮),讓每一份算力能做到更多。今天這兩條路都有人在走。

AI 代理找到落點

Nvidia 與 Palantir 擴大合作,把 Nvidia Nemotron 開放模型與 Palantir AIP、Foundry、Ontology 等平台整合,鎖定美國政府機關與關鍵基礎設施的隔離、不連網安全環境。核心主張:政府可在自有基礎設施上客製化模型,保留資料、智慧財產與模型權重的所有權。

同一天,Anthropic Claude 在 Microsoft Azure Foundry 全面開放,採用 Nvidia GB300 Blackwell Ultra GPU。定位是企業打造自主型 AI 代理的基礎設施。

這兩個公告的共同點:AI 代理在落地,而且落點不是 demo,是實際的政府合約和企業採購。從「模型夠聰明了嗎」轉向「這個部署環境夠安全嗎、資料主權夠清楚嗎」,需要回答的問題已經不同了。

問題隨著落地一起來。TechOrange 今天的報導指出,AI 代理繼承了授予它的員工權限,但當員工離職或換角色時,這些權限不會自動消失。身分治理工具設計上針對人類帳號,不具備端到端監控 AI 代理身分的能力,代理數量在成長,對應的生命週期管理還沒到位。

資安方面的挑戰更直接:Google 在 Cloud Next ‘26 揭露的數據顯示,密碼破解已從 8 小時縮至 22 秒。攻擊者在用 AI 加速攻擊週期,而多數企業的防禦架構還沒跟上。Google 提出的框架是「以代理人對抗代理人」,核心邏輯是:你用 AI 部署業務,你也得用 AI 守護業務。

代理型商務的入場是另一個角度。亞馬遜 Rufus、momo 正在搶這條路,但市場分析指出,真正受益的可能是百貨業,因為百貨天生整合多品類(生鮮、家電、餐飲、美妝),一棟樓一次滿足四種需求,和 AI 代理「一站式處理複合任務」的能力高度吻合。

硬體層的答案也在出現

AI 基礎設施的稀缺有沒有解法?今天幾條硬體新聞,分別從不同角度回應這個問題。

記憶體牆問題,Marvell 推出 Structera CXL 加速器系列。兩款產品(Structera X 與 Structera A)透過資料壓縮技術,最高可將資料壓縮 3.64 倍,可擴充至數 TB 共享記憶體,動態分配頻寬與容量。CXL 的思路是讓現有記憶體資源發揮更大效益,不是更換硬體,而是讓舊硬體更有效用。

耗電問題,Unconventional AI 發表振盪器運算架構,宣稱可讓 AI 推論耗電量降低 1,000 倍。執行長是前 Databricks AI 負責人 Naveen Rao。公司 6 月 25 日發表首款影像生成模型 Un-0,效能與 Stable Diffusion 等擴散模型相當。電力被視為 AI 擴張的最大限制之一,如果這個架構的宣稱能在真實部署中驗證,影響可能會超過很多人預期。

晶片設計速度問題,普林斯頓大學在 IEEE 發表研究:用強化學習、逆向設計與擴散模型結合,讓 AI 自動設計射頻晶片(RFIC),將原本耗時數月的設計流程壓縮至 6 分鐘,電磁模擬從分鐘/小時等級加速到毫秒級。射頻晶片是 5G/6G 基地台、自駕車、衛星的核心元件。傳統射頻設計被業界稱為「黑色藝術」;6 分鐘設計出可製造的電路,意思是這個黑色藝術的部分工序正在被量化。

台灣這邊,工研院促成瑞峰半導體與法國新創 NcodiN 合作奈米雷射光電共封裝(NPO)技術。TrendForce 估計 CPO/NPO 市場規模將從 2025 年約 1 億美元,成長至 2030 年逾 390 億美元。對台廠來說,這是 AI 資料中心封裝競賽中值得卡位的位置。

OpenAI 預告 7 月 15 日將發表 Codex 相關硬體裝置,與 Work Louder(可程式按鍵盤廠商)合作,標語「你最喜愛的 Codex 快捷鍵將迎來升級」。這不是與 Jony Ive 合作的神祕 AI 裝置,但作為 Codex 工作流的實體延伸,是 OpenAI 開始在軟體以外嘗試硬體入口的信號。

職涯在重新校準

Google 前全球副總裁 Mo Gawdat 的說法被廣泛引用:白領知識工作者是 AI 海嘯第一批犧牲者。客服、助理、旅行代辦等例行性工作「在極短時間內消失」。反而是木匠、黑手等需要精細手藝的藍領,因機器人技術尚無法複製手藝而有護城河。護理師、心理諮商師等重人際連結的職業同樣穩定。

同樣值得看的是他說的另一件事:職場階梯底層被砍斷了。剛畢業的年輕人進不了行,因為初階職位在消失;但沒有初階經驗,晉升路徑也斷了。這是比「未來哪些工作消失」更直接的問題。

OpenAI Codex 產品負責人 Ambrosino 在 Lenny’s Podcast 給了一組數字:OpenAI 有 90% 的人在用 Codex,不是 90% 的工程師,是整間公司 90% 的人。截至今年 6 月,全球每週活躍用戶超過 500 萬。

他的論點是:「實作已經不是昂貴的部分了。」過去「原型比程式碼便宜」的開發邏輯不成立了。當建東西的門檻降到接近零,稀缺的東西變成判斷:知道什麼值得建,而不只是能建什麼。他稱這個能力為「深度品味」(deep taste)。

企業端的數據也在說同一件事,但角度不同。英美菸草宣布推動 AI 轉型,裁減 5,500 個職位,另將 3,500 個職位轉移至埃森哲等第三方,共 9,000 人受影響,目標 2027 年前每年節省 5 億英鎊。福斯集團考慮裁 10 萬人(占全體 15%),停產四座德國工廠,預計 7 月 9 日由監事會討論。

但福特的路徑是另一個答案。福特在過去三年回聘或新聘約 350 名資深工程師,任務是帶領年輕員工、重新調校「無法做好工作」的 AI 與自動化工具。結果:JD Power 最新新車品質調查,福特拿下主流品牌第一(每百輛 152 個問題)。

這三條線放在一起,不是說 AI 好或不好,而是不同公司在回應同一個問題,如何在 AI 部署的壓力下維持輸出品質,走出了完全不同的路徑。

計費邏輯的重組

亞馬遜與 Anthropic 自 2027 年起將付費模式從算力時數計費改為 token 計費。外界解讀是可能推高亞馬遜的使用成本,亞馬遜否認這個說法。不管如何,計費基準從「用了多少算力時間」轉為「讀寫了多少文字」,這是把 AI 使用量的計算方式重新錨定到輸出上。

中國市場的競爭方式不一樣。Z.ai 的 GLM-5.2 定位為企業 AI 代理基礎設施,成本約為 Anthropic 的五分之一。業界稱之為另一個「DeepSeek 時刻」。主要論點是:當模型能力差距縮小,控制權(資料主權、部署自主)與成本優勢比品牌光環更能影響企業選擇。

記憶體供應鏈的長期合約化在繼續。長鑫存儲與騰訊簽署超過 200 億人民幣(約 29.4 億美元)、為期三至五年的長期供貨協議,時間點是長鑫 IPO 前夕。此前市場傳出蘋果考慮採用長鑫存儲,原因是三大主流記憶體廠無法完全滿足需求。長鑫先鎖定騰訊,蘋果替代方案的空間就窄了一些。

韓國政府另外宣示攻物理 AI 全球第一,設定三年窗口期,目標製造業生產力提升 20%。核心挑戰是資料稀缺:物理 AI 依賴真實互動資料,公開真實互動資料不到數千小時,與文本/影像 AI 靠網路大規模資料的訓練條件差距很大。韓國政府計劃建立國家製造 AI 資料庫,並把即將退休的熟練工人隱性知識轉為可訓練資料。這條路能不能走通,接下來三年是觀察期。

明日值得追的事
  • → OpenAI 7 月 15 日發表 Codex 相關硬體裝置,屆時具體功能才揭曉
  • → 長鑫存儲+騰訊供貨協議拍板後,蘋果的記憶體採購替代策略後續值得追
  • → 7 月 1 日職場霸凌新法正式施行,台灣首批申訴案例走向