Anthropic 推便宜的 Sonnet 5。被管制三週的模型同日解禁。

Anthropic 6/30 發布中階模型 Sonnet 5，效能逼近 Opus 4.8、定價更低，同日美商務部解除 Fable 與 Mythos 的出口管制。台灣光電廠圍繞 CPO 與 Micro LED 搶進資料中心光互連，Etched 與 Meta 各自從推論成本下手。

水無瀨澪用八格漫畫帶你看今天的 AI 圈：Sonnet 5 降價、光互連、推論省成本 — Anthropic 一天內又發便宜的 Sonnet 5、又拿回被管制三週的模型，今天大家都在把 AI 的成本往下壓。 ↗ 點擊放大

Anthropic 同一天做了兩件相反的事

Anthropic 6 月 30 日一天內做了兩件方向相反的事：把更貴的能力壓進更便宜的模型，同時把三週前被政府關掉的兩個模型拿回來。

先看便宜這邊。Sonnet 5 是 Claude 系列的中階模型，即日起成為免費版與 Pro 版的預設，Max、Team、Enterprise 也可選用。官方說它是史上最會做 agentic 任務的 Sonnet，能自己擬定計畫、操作瀏覽器與終端機，在無人盯著的情況下跑完多步驟工作。

能力這一代往上抬了一個級距。在 agentic 程式撰寫的 SWE-bench Pro 上，Sonnet 5 從前代 Sonnet 4.6 的 58.1% 升到 63.2%，官方說整體表現已經接近高階的 Opus 4.8。安全性也一起改：更能拒絕惡意請求、抵抗提示注入，幻覺與迎合使用者的發生率都低於前一代。

定價是這次的重點。

8 月 31 日前採介紹價，每百萬輸入 token 2 美元、輸出 10 美元
9 月起轉正式價，輸入 3 美元、輸出 15 美元
這組正式價跟前代 Sonnet 4.6 的原牌價相同，換算下來是用同樣的錢買到逼近旗艦的能力

便宜有便宜的背景。Gartner 預測今年全球 AI 支出會增加 47%，衝到 2.6 兆美元，企業收到帳單後開始重新算導入成本。供應商往成本效率靠攏，Sonnet 5 就是對這股壓力的回應。

同一天的另一件事是解禁。美國商務部解除了對 Claude Fable 5 與 Mythos 5 的出口管制，距離這兩個模型因國安考量被下令暫停，還不到三週。時間線是 6 月 12 日下達管制、6 月 26 日先允許把 Mythos 5 釋出給部分獲信任的美國組織、6 月 30 日全面解除。Anthropic 說隔天開始恢復存取。

如果企業要吃便宜的導入視窗，Sonnet 5 的介紹價只到 8 月底；過了 9 月輸入與輸出各漲一截，怎麼排導入節奏會直接反映在帳單上。

Claude Code 的系統提示被翻出來

Anthropic 另一條線上冒出來的不是新功能，是信任問題。Claude Code 被指控在系統提示裡暗藏一段偵測中國 Proxy 的邏輯。

指控起初在 Reddit 論壇流傳，之後 GitHub 出現一份驗證報告，聲稱針對 2.1.193、2.1.195、2.1.196 三個版本查證屬實。報告說 Claude Code 會檢查 ANTHROPIC_BASE_URL 這個環境變數，當路由不是 api.anthropic.com 時，就提取 Proxy 主機名稱，再檢查使用者時區是否落在上海（Asia/Shanghai）或烏魯木齊（Asia/Urumqi）。

比對的對象是一份 147 項條目的解碼清單。報告說裡面涵蓋中國大型科技公司域名、中國雲端服務區域、中國 AI 實驗室，還有一長串 Claude 轉售與 API 鏡像代理，點名的例子包括百度、阿里巴巴、螞蟻集團、字節跳動、月之暗面、MiniMax、階躍星辰。

最敏感的地方在傳送方式。報告說這些偵測結果不走另外的遙測欄位，而是被寫進系統提示裡「Today’s date」那一段夾帶出去。常在社群互動的 Anthropic 技術人員 Thariq Shihipar 出面說明這件事。

這跟昨天報告提到 Meta 禁自家工程師用 Claude Code 是不同的事，但兩件都落在同一個問題上：企業要把一個第三方編碼工具接進內部環境時，它到底在背景送了什麼。Anthropic 完整的技術說明是下一步要看的東西。

光互連把光電廠帶進資料中心

台灣光電廠這週把重心從螢幕移到資料中心的光路。

友達 7 月 1 日做了一波組織調整，最受矚目的是新設「創新研究院」，把 Micro LED、CPO 光通訊、AR 眼鏡、低軌衛星通訊天線收攏到同一個平台，由技術長廖唯倫兼院長。同時重整顯示科技、智慧移動、垂直場域三大事業。友達沒有公布這些前瞻技術的量產時程、資本支出規模或營收目標，能不能轉成實際生意還要看產品落地速度。

康寧則端出元件。它在資料中心光通訊大會展示新一代玻璃光學互連 Glass Bridge，用晶圓級離子交換玻璃光波導，在玻璃內部形成光傳輸路徑，直接把光子晶片與光纖連起來。晶片上的光波導寬度只有數百奈米、光纖核心直徑是數微米，兩者差數十倍，玻璃波導的作用就是精準對接這兩種尺寸。首款產品可支援光子晶片核心間距 30 微米以上。

Micro LED 這條路線在台灣是一場供應鏈團體戰。過去談 Micro LED 多半想到高階電視、車用顯示、AR 眼鏡，但放進 AI 資料中心後，它被當成機櫃內短距光互連的光源選項。TrendForce 認為 Micro LED 因為功耗低、訊號錯誤率低，未來有機會和 AEC、VCSEL NPO 並列，成為機櫃內三大高速傳輸方案之一。新創 Avicena 已與台積電合作生產矽光偵測器陣列，微軟完成了 Micro LED 主動式光纜的概念驗證，台積電、聯發科、富采、友達、鼎元、錼創也陸續進來。

會走到這一步是因為銅線撐不住了。工研院張世杰的說法是，到 1.6T 傳輸規格時銅線大約只能支撐 5 公尺，若提升到 3.2T 可能縮到 2 公尺以內，但機櫃內線路本身就常需要 3 到 5 公尺。大立光也在這條線上，切入 CPO 交換器裡的 FAU 光纖陣列單元鏡頭領域，把鏡頭生意從手機延伸到 AI 伺服器。

如果傳輸規格照 1.6T 往 3.2T 的時程推，銅線撐不住的距離會逼光互連從概念驗證進到機櫃裡，台廠這場團體戰誰能把光源、基板、模組、檢測串成完整方案，會是下半年的看點。

省推論成本的兩種相反解法

兩家公司這週不約而同在推論成本上動手，方法剛好相反：一個用全新硬體，一個用回收硬體。

Etched 走的是新硬體。這家 2022 年成立的 AI 晶片新創 6 月 30 日公布進度，首批 A0 晶片已在台積電 N4P 製程產出，累計簽下超過 10 億美元訂單，2025 年 12 月完成一筆未公開的 5 億美元融資後估值來到 50 億美元，成立至今募得 8 億美元。它賣的不是單顆更快的 GPU，而是把晶片、記憶體、散熱、機櫃到量產一起包辦的整套推論系統，鎖定模型訓練完成後實際生成回應的推論階段。

Etched 的投資人名單很顯眼，包括 Peter Thiel、Geoffrey Hinton、李飛飛、量化交易的 Jane Street，以及與台積電有策略合作的創投 VentureTech Alliance。共同創辦人暨執行長 Gavin Uberti 從哈佛輟學、以 Thiel fellow 身分創業，總裁是 Robert Wachen。首批機櫃級產品預計今年夏天開始向部分客戶出貨。它面對的競爭者不少：Cerebras 完成 IPO、Groq 剛募到約 6.5 億美元，亞馬遜、Google、微軟都在自研，OpenAI 也宣布了首款博通製造的客製晶片。

Meta 走的是回收硬體。它在 6 月 29 日的 ISCA 2026 發表自研 Vistara ASIC，把退役伺服器上的 DDR4 記憶體重新接進原生只支援 DDR5 的新伺服器。這顆晶片是 Meta 第一代 CXL 記憶體擴充 ASIC，實作為 CXL 2.0 Type-3、走 PCIe 5.0 x16 介面，橋接標準 DDR4 記憶體與主機處理器。

實際的 MemServer 系統裡，兩顆 Vistara 接到一顆 158 核心的 AMD EPYC Turin，本地掛 768GB 的 DDR5-6400、再透過 CXL 接上 256GB 回收來的 DDR4-2400，總容量湊到 1TB。軟體把慢的 DDR4 當成獨立分層，把較少用的冷資料丟過去，熱資料留在 DDR5。頻寬差距很明顯：本地 DDR5 約 614GB/s，DDR4 層只有約 76GB/s。

在 DDR5 供應吃緊、記憶體漲價的當下，Etched 用新硬體換效率，Meta 用舊硬體省採購。如果記憶體缺貨延續到下半年，這種把冷熱資料分層、拿舊料墊容量的做法，會有更多資料中心跟進。

記憶體示警與一連串外洩

記憶體漲價的另一面這週被中國廠商自己講出來。

中國記憶體大廠兆易創新在公告裡列了幾項風險，其中最值得留意的是週期波動。兆易創新坦言記憶體產業有明顯的週期性，近期利基型儲存產品漲價，主要是國際大廠為了因應 AI 需求把產能重心轉走，利基型市場間接受惠於供應緊張。但公司自己說目前價格已在歷史高點，高價已經開始抑制消費、工業、網通、汽車這些相對穩定的下游需求，繼續大幅上漲的趨勢撐不住，未來產能邊際增加時價格恐怕會相當幅度回落。這番話牽動的是南亞科、華邦電、旺宏這幾家台廠的市況判斷。

資安這邊是密集的多起事件，攤開來看比較清楚：

Aflac 日本分公司 6 月 30 日向美國證交會提交 8-K，攻擊者在 6 月 15 日到 25 日間多次存取系統，約 438 萬名客戶資料可能受影響，另約 23 萬人的保費轉帳帳戶資訊外洩，沒有信用卡資訊被存取
PChome 旗下拍付國際傳出外洩，勒索軟體團體 Settra 聲稱竊得 350 萬名 Pi 錢包用戶個資與 102GB 內部資料，數位產業署 7 月 1 日辦理實地行政檢查
Chrome 桌面版更新到 150，一次修補 382 項漏洞，其中 15 項屬重大等級、11 項是記憶體釋放後仍被使用的問題
WinRAR 發布 7.23 版，修補一個修復磁碟區機制的堆積溢位，以及一個能把檔案寫到解壓縮資料夾外部的符號連結漏洞

這幾起裡，Aflac 與 PChome 都是保單與支付這類高敏感資料，後續要看主管機關的檢查結果與外洩範圍確認。

Google 把生圖壓到 4 秒

生圖成本這週又被 Google 往下壓。

Google 同一天推出兩款生成式媒體模型。影像這款叫 Nano Banana 2 Lite，主打快與省：文字生圖約 4 秒，每張 1K 圖 0.034 美元，換算約新台幣 1.1 元，是這個家族裡最快最省的一款，已經對開發者開放。

另一款是影片模型 Gemini Omni Flash，把 Gemini 的多模態推理延伸到影片生成與編輯，目前以公開預覽形式在 Gemini API 與 Google AI Studio 提供，還沒進正式版，每秒影片輸出 0.10 美元。Google 的算盤是讓開發者把生圖跟成片串成一條龍。生圖降到秒級、成本壓到一塊多台幣，門檻低到這個程度時，接下來要看的是誰把它接進真正的量產工作流。

明日值得追的事

→ Sonnet 5 介紹價撐到 8/31，看企業在便宜視窗內把工作流搬過去的速度。
→ 友達、大立光的 CPO 布局要看下半年交換器放量時，訂單能不能從概念驗證變成出貨。

編者觀察

這天 Anthropic、Etched、Meta、Google 的動作方向一致，都是把 AI 的單位成本往下壓；能不能落地，還是回到誰先把便宜的能力接進真正的工作流。