Anthropic 推便宜的 Sonnet 5。被管制三週的模型同日解禁。
Anthropic 6/30 發布中階模型 Sonnet 5,效能逼近 Opus 4.8、定價更低,同日美商務部解除 Fable 與 Mythos 的出口管制。台灣光電廠圍繞 CPO 與 Micro LED 搶進資料中心光互連,Etched 與 Meta 各自從推論成本下手。
Anthropic 同一天做了兩件相反的事
Anthropic 6 月 30 日一天內做了兩件方向相反的事:把更貴的能力壓進更便宜的模型,同時把三週前被政府關掉的兩個模型拿回來。
先看便宜這邊。Sonnet 5 是 Claude 系列的中階模型,即日起成為免費版與 Pro 版的預設,Max、Team、Enterprise 也可選用。官方說它是史上最會做 agentic 任務的 Sonnet,能自己擬定計畫、操作瀏覽器與終端機,在無人盯著的情況下跑完多步驟工作。
能力這一代往上抬了一個級距。在 agentic 程式撰寫的 SWE-bench Pro 上,Sonnet 5 從前代 Sonnet 4.6 的 58.1% 升到 63.2%,官方說整體表現已經接近高階的 Opus 4.8。安全性也一起改:更能拒絕惡意請求、抵抗提示注入,幻覺與迎合使用者的發生率都低於前一代。
定價是這次的重點。
- 8 月 31 日前採介紹價,每百萬輸入 token 2 美元、輸出 10 美元
- 9 月起轉正式價,輸入 3 美元、輸出 15 美元
- 這組正式價跟前代 Sonnet 4.6 的原牌價相同,換算下來是用同樣的錢買到逼近旗艦的能力
便宜有便宜的背景。Gartner 預測今年全球 AI 支出會增加 47%,衝到 2.6 兆美元,企業收到帳單後開始重新算導入成本。供應商往成本效率靠攏,Sonnet 5 就是對這股壓力的回應。
同一天的另一件事是解禁。美國商務部解除了對 Claude Fable 5 與 Mythos 5 的出口管制,距離這兩個模型因國安考量被下令暫停,還不到三週。時間線是 6 月 12 日下達管制、6 月 26 日先允許把 Mythos 5 釋出給部分獲信任的美國組織、6 月 30 日全面解除。Anthropic 說隔天開始恢復存取。
如果企業要吃便宜的導入視窗,Sonnet 5 的介紹價只到 8 月底;過了 9 月輸入與輸出各漲一截,怎麼排導入節奏會直接反映在帳單上。
Claude Code 的系統提示被翻出來
Anthropic 另一條線上冒出來的不是新功能,是信任問題。Claude Code 被指控在系統提示裡暗藏一段偵測中國 Proxy 的邏輯。
指控起初在 Reddit 論壇流傳,之後 GitHub 出現一份驗證報告,聲稱針對 2.1.193、2.1.195、2.1.196 三個版本查證屬實。報告說 Claude Code 會檢查 ANTHROPIC_BASE_URL 這個環境變數,當路由不是 api.anthropic.com 時,就提取 Proxy 主機名稱,再檢查使用者時區是否落在上海(Asia/Shanghai)或烏魯木齊(Asia/Urumqi)。
比對的對象是一份 147 項條目的解碼清單。報告說裡面涵蓋中國大型科技公司域名、中國雲端服務區域、中國 AI 實驗室,還有一長串 Claude 轉售與 API 鏡像代理,點名的例子包括百度、阿里巴巴、螞蟻集團、字節跳動、月之暗面、MiniMax、階躍星辰。
最敏感的地方在傳送方式。報告說這些偵測結果不走另外的遙測欄位,而是被寫進系統提示裡「Today’s date」那一段夾帶出去。常在社群互動的 Anthropic 技術人員 Thariq Shihipar 出面說明這件事。
這跟 昨天報告 提到 Meta 禁自家工程師用 Claude Code 是不同的事,但兩件都落在同一個問題上:企業要把一個第三方編碼工具接進內部環境時,它到底在背景送了什麼。Anthropic 完整的技術說明是下一步要看的東西。
光互連把光電廠帶進資料中心
台灣光電廠這週把重心從螢幕移到資料中心的光路。
友達 7 月 1 日做了一波組織調整,最受矚目的是新設「創新研究院」,把 Micro LED、CPO 光通訊、AR 眼鏡、低軌衛星通訊天線收攏到同一個平台,由技術長廖唯倫兼院長。同時重整顯示科技、智慧移動、垂直場域三大事業。友達沒有公布這些前瞻技術的量產時程、資本支出規模或營收目標,能不能轉成實際生意還要看產品落地速度。
康寧則端出元件。它在資料中心光通訊大會展示新一代玻璃光學互連 Glass Bridge,用晶圓級離子交換玻璃光波導,在玻璃內部形成光傳輸路徑,直接把光子晶片與光纖連起來。晶片上的光波導寬度只有數百奈米、光纖核心直徑是數微米,兩者差數十倍,玻璃波導的作用就是精準對接這兩種尺寸。首款產品可支援光子晶片核心間距 30 微米以上。
Micro LED 這條路線在台灣是一場供應鏈團體戰。過去談 Micro LED 多半想到高階電視、車用顯示、AR 眼鏡,但放進 AI 資料中心後,它被當成機櫃內短距光互連的光源選項。TrendForce 認為 Micro LED 因為功耗低、訊號錯誤率低,未來有機會和 AEC、VCSEL NPO 並列,成為機櫃內三大高速傳輸方案之一。新創 Avicena 已與台積電合作生產矽光偵測器陣列,微軟完成了 Micro LED 主動式光纜的概念驗證,台積電、聯發科、富采、友達、鼎元、錼創也陸續進來。
會走到這一步是因為銅線撐不住了。工研院張世杰的說法是,到 1.6T 傳輸規格時銅線大約只能支撐 5 公尺,若提升到 3.2T 可能縮到 2 公尺以內,但機櫃內線路本身就常需要 3 到 5 公尺。大立光也在這條線上,切入 CPO 交換器裡的 FAU 光纖陣列單元鏡頭領域,把鏡頭生意從手機延伸到 AI 伺服器。
如果傳輸規格照 1.6T 往 3.2T 的時程推,銅線撐不住的距離會逼光互連從概念驗證進到機櫃裡,台廠這場團體戰誰能把光源、基板、模組、檢測串成完整方案,會是下半年的看點。
省推論成本的兩種相反解法
兩家公司這週不約而同在推論成本上動手,方法剛好相反:一個用全新硬體,一個用回收硬體。
Etched 走的是新硬體。這家 2022 年成立的 AI 晶片新創 6 月 30 日公布進度,首批 A0 晶片已在台積電 N4P 製程產出,累計簽下超過 10 億美元訂單,2025 年 12 月完成一筆未公開的 5 億美元融資後估值來到 50 億美元,成立至今募得 8 億美元。它賣的不是單顆更快的 GPU,而是把晶片、記憶體、散熱、機櫃到量產一起包辦的整套推論系統,鎖定模型訓練完成後實際生成回應的推論階段。
Etched 的投資人名單很顯眼,包括 Peter Thiel、Geoffrey Hinton、李飛飛、量化交易的 Jane Street,以及與台積電有策略合作的創投 VentureTech Alliance。共同創辦人暨執行長 Gavin Uberti 從哈佛輟學、以 Thiel fellow 身分創業,總裁是 Robert Wachen。首批機櫃級產品預計今年夏天開始向部分客戶出貨。它面對的競爭者不少:Cerebras 完成 IPO、Groq 剛募到約 6.5 億美元,亞馬遜、Google、微軟都在自研,OpenAI 也宣布了首款博通製造的客製晶片。
Meta 走的是回收硬體。它在 6 月 29 日的 ISCA 2026 發表自研 Vistara ASIC,把退役伺服器上的 DDR4 記憶體重新接進原生只支援 DDR5 的新伺服器。這顆晶片是 Meta 第一代 CXL 記憶體擴充 ASIC,實作為 CXL 2.0 Type-3、走 PCIe 5.0 x16 介面,橋接標準 DDR4 記憶體與主機處理器。
實際的 MemServer 系統裡,兩顆 Vistara 接到一顆 158 核心的 AMD EPYC Turin,本地掛 768GB 的 DDR5-6400、再透過 CXL 接上 256GB 回收來的 DDR4-2400,總容量湊到 1TB。軟體把慢的 DDR4 當成獨立分層,把較少用的冷資料丟過去,熱資料留在 DDR5。頻寬差距很明顯:本地 DDR5 約 614GB/s,DDR4 層只有約 76GB/s。
在 DDR5 供應吃緊、記憶體漲價的當下,Etched 用新硬體換效率,Meta 用舊硬體省採購。如果記憶體缺貨延續到下半年,這種把冷熱資料分層、拿舊料墊容量的做法,會有更多資料中心跟進。
記憶體示警與一連串外洩
記憶體漲價的另一面這週被中國廠商自己講出來。
中國記憶體大廠兆易創新在公告裡列了幾項風險,其中最值得留意的是週期波動。兆易創新坦言記憶體產業有明顯的週期性,近期利基型儲存產品漲價,主要是國際大廠為了因應 AI 需求把產能重心轉走,利基型市場間接受惠於供應緊張。但公司自己說目前價格已在歷史高點,高價已經開始抑制消費、工業、網通、汽車這些相對穩定的下游需求,繼續大幅上漲的趨勢撐不住,未來產能邊際增加時價格恐怕會相當幅度回落。這番話牽動的是南亞科、華邦電、旺宏這幾家台廠的市況判斷。
資安這邊是密集的多起事件,攤開來看比較清楚:
- Aflac 日本分公司 6 月 30 日向美國證交會提交 8-K,攻擊者在 6 月 15 日到 25 日間多次存取系統,約 438 萬名客戶資料可能受影響,另約 23 萬人的保費轉帳帳戶資訊外洩,沒有信用卡資訊被存取
- PChome 旗下拍付國際傳出外洩,勒索軟體團體 Settra 聲稱竊得 350 萬名 Pi 錢包用戶個資與 102GB 內部資料,數位產業署 7 月 1 日辦理實地行政檢查
- Chrome 桌面版更新到 150,一次修補 382 項漏洞,其中 15 項屬重大等級、11 項是記憶體釋放後仍被使用的問題
- WinRAR 發布 7.23 版,修補一個修復磁碟區機制的堆積溢位,以及一個能把檔案寫到解壓縮資料夾外部的符號連結漏洞
這幾起裡,Aflac 與 PChome 都是保單與支付這類高敏感資料,後續要看主管機關的檢查結果與外洩範圍確認。
Google 把生圖壓到 4 秒
生圖成本這週又被 Google 往下壓。
Google 同一天推出兩款生成式媒體模型。影像這款叫 Nano Banana 2 Lite,主打快與省:文字生圖約 4 秒,每張 1K 圖 0.034 美元,換算約新台幣 1.1 元,是這個家族裡最快最省的一款,已經對開發者開放。
另一款是影片模型 Gemini Omni Flash,把 Gemini 的多模態推理延伸到影片生成與編輯,目前以公開預覽形式在 Gemini API 與 Google AI Studio 提供,還沒進正式版,每秒影片輸出 0.10 美元。Google 的算盤是讓開發者把生圖跟成片串成一條龍。生圖降到秒級、成本壓到一塊多台幣,門檻低到這個程度時,接下來要看的是誰把它接進真正的量產工作流。
- → Sonnet 5 介紹價撐到 8/31,看企業在便宜視窗內把工作流搬過去的速度。
- → 友達、大立光的 CPO 布局要看下半年交換器放量時,訂單能不能從概念驗證變成出貨。
這天 Anthropic、Etched、Meta、Google 的動作方向一致,都是把 AI 的單位成本往下壓;能不能落地,還是回到誰先把便宜的能力接進真正的工作流。