newsruka / daily
ISSUE 15 · 2026.05.10 · 8 MIN READ
產業動態 編寫 by 水無瀨 澪

華邦電 Q1 毛利 53.4%:整個記憶體產能都被 AI 吸走了

華邦電 Q1 毛利率衝 53.4%、稅後淨利 101 億元、2027 年產能售完;慧榮預估 NAND 缺到 2028。同時間台積電訂單滿到 2028,蘋果在找 Intel、AMD 找三星救援,OpenAI 自研晶片受阻。AI 工具市場的勝負則由 Replit 90% 毛利示範了:客群選對才是答案。

週末重要的事都集中在 AI 算力上游的擠壓與下游的客群分歧。記憶體大廠華邦電 Q1 毛利衝 53.4% 創歷史新高、總經理陳沛銘直言 NAND 缺貨「真的無解」、2027 年產能已售完;慧榮同步喊出 DDR5 將持續缺貨、長約成趨勢。台積電先進製程訂單滿到 2028、與 Sony 啟動感測器合資,但同一時間蘋果傳跟 Intel 達成代工協議、AMD 2 奈米找三星救援、OpenAI 自研晶片卡在博通與微軟的承諾結構。

AI 工具市場的故事換了個方向。Replit 公開三層獲利邏輯(客群錯位、模型彈性、結構性安全),企業端毛利衝到 80-90%、NRR 300%;同一篇報導裡 Cursor 傳因成長停滯與 SpaceX 洽談 600 億美元收購。Arm 推 Performix 把效能分析工具直接做給 AI 代理用,Wonder 把餐飲品牌生成壓到 1 分鐘。

最後一條是本地端的硬體下放。Qwen3.6 35B A3B 配 llama.cpp MTP 在 12GB VRAM 跑出 80 tok/sec、128K context;Z-Image-Turbo 在 RTX2060 上的圖質讓 r/StableDiffusion 反覆驗證。

記憶體進入「無解」階段

華邦電 5 日法說會繳出歷史最佳成績單。Q1 毛利率達 53.4% 創新高,稅後淨利 101 億元、EPS 2.25 元。總經理陳沛銘把市場狀態講得很白:「整體記憶體需求緊得不得了」、下半年價格仍將維持高檔甚至續漲,2027 年產能已被客戶預訂一空。

公司三大產品線在這波循環裡走出不同節奏。利基型 DRAM 以 20 奈米製程為主,產品包括 DDR4、LPDDR4、DDR3,未來高雄新廠將導入 16 奈米,但策略上避開 DDR5 標準品戰場、以 LPDDR5 與 DDR4 為優先。SLC NAND Flash 則進入加速擴張階段,一年內位元成長幅度可達 80%。陳沛銘的觀察是,主要 NAND 大廠陸續退出 2D 產能(包含部分 SLC),市場出現明顯缺口;高密度需求轉 3D NAND,低密度需求轉 eMMC 與 SLC NAND。SLC NAND 毛利率明顯優於 NOR Flash,已成為公司獲利動能來源。

「現在 NAND 缺貨真的無解」,陳沛銘強調。在這狀態下,客戶對價格接受度提高,甚至出現「寧可漲價也要確保供貨」的反應。產能持續吃緊也讓 AI 排擠效應浮上檯面:「整個產能都被 AI 吸走了,排擠到非 AI 應用」。PC 市場需求衰退幅度可能達兩三成,公司因此把產能由 PC 相關應用轉向伺服器與 AI 領域。

產能布局也跟著調整。董事會通過 2027 年資本支出 73 億元,其中 50 億元投入 CUBE 客製化高頻寬記憶體(HBM)產品。今年資本支出將超過 400 億元,2027 年月產能由目前 1.5 萬片提升到 2.4 萬片,並逐步把 DRAM 產能由台中廠移轉到高雄。陳沛銘透露,過去一年的重點不是跑客戶、是跑供應商,設備交期吃緊已成擴產最大挑戰。

慧榮總座苟嘉章的觀察跟華邦電對得上:DDR5 將持續缺貨、長約逐漸成為市場常態。美光銅鑼廠也已啟動人才招募,反映客戶端對 AI 記憶體 capex 的具體拉動。SLC NAND 缺到 2028 已是供應鏈的共同預設。

接下來值得追的是長約簽訂節奏。華邦電目前長約占比仍不高,但近期已有愈來愈多客戶主動要求簽訂、甚至願意接受逐季議價,公司預計待高雄新廠設備陸續到位後再評估長約策略。如果高密度 NAND 退出潮持續、低密度需求又被 AI 推論伺服器吃下,2027 年的供應結構會比現在更緊;如果 PC 需求兩年後回補,整體市場有機會再出現一段「兩端搶料」的緊縮期。

台積電與全球晶片棋局

台積電的訂單滿到 2028,但棋局正在被周邊重畫。蘋果傳和英特爾達成晶片代工協議,外媒形容為「台積電獨家局面告終」;AMD 2 奈米 AI 晶片同一週傳出找三星救援。表面上看是客戶分散下單,背後是先進製程產能在 AI 時代被擠到極限後的合理回應:客戶開始把雞蛋分到第二個籃子裡。

OpenAI 與博通的 Nexus 晶片計畫遇到結構性卡關。博通開出條件要求微軟先承諾採購約 40% 晶片才願意出資生產,安排是微軟把晶片裝進自家資料中心、再回租給 OpenAI。微軟有了採購承諾,博通才有信心回收資金;但微軟也可能選擇不買。OpenAI 預估到 2029 年公司支出壓力達兩千億美元級,自研晶片是核心戰略,執行卻取決於微軟這個中介角色的態度。台積電在這條軸上的角色是默默的產能壓力源:Nexus 的晶片要靠台積電量產,但先進製程已經沒空檔。

日本則組起了自己的 AI 算力國家隊。軟銀攜輝達、鴻海生產 AI 伺服器,被日媒形容為「對抗三星」的新陣型。台積電同步跟 Sony 成立合資公司攻下一代感測器,產業布局從晶圓代工延伸到光學感測層。Sony 5 月初公布的 2025 年度財報顯示 PS5 累計銷售突破 9370 萬台,但本季同步揭露 PS5 受記憶體缺料拖累銷售;新合資公司被視為 Sony 在 AI 時代重新定位感測器與運算分工的動作。

這幾條動作放回時間軸:4 月台積電 4 月營收 4,107 億元創 4 月新高、年增 17.5%、前四月業績大增 29%。最大客戶輝達跟超微的訂單節奏依然強勁,AMD 找三星更像是分散風險的議價舉動而非產能轉移。蘋果跟 Intel 的協議則需要看後續產品代別與晶片量級才能判斷意義;目前還沒到「終結獨家」的程度,更接近「在最頂端製程旁邊另開一條備援」。

接下來值得觀察的是台積電 2 奈米 / A16 客戶名單與分配比重。OpenAI 的 Nexus 量產時程、Sony 合資公司的細節公布、蘋果跟 Intel 協議的具體晶片代別,都會在接下來幾個月陸續落地。如果先進製程的客戶結構真的開始重新洗牌,台積電的議價權會出現第一次像樣的測試。

AI 工具的客群錯位戰

Replit 執行長 Amjad Masad 公開公司獲利邏輯這件事,比一般財報訪談更有讀的價值。公司 2024 年營收僅 280 萬美元,現在朝 10 億美元 ARR 衝刺,整體毛利接近 50%、企業端毛利曾達 80%-90%。「我們打算保持獨立運作」,這句話的底氣來自三層結構性決定。

第一層是錯位競爭。多數 AI 寫程式工具(如 Cursor)的目標受眾是專業工程師,但這群人對價格極度敏感、對工具忠誠度低。Replit 把目光鎖定企業內部營運團隊(Ops Teams),這群人不在乎程式碼,他們要的是解決問題。Masad 的對比很具體:「工程師可能會為了 1,000 美元的帳單斤斤計較,但當一個營運經理用 Replit 省下了 10 萬美元的 SaaS 訂閱費,甚至省下 20 萬美元的人力成本時,他們絕對願意支付溢價。」

第二層是模型彈性。「向下垂直整合到自有模型,其實是一種陷阱」,Masad 直接點出產業裡常見的綁定動機:一旦公司花大錢訓練模型,就會產生只推廣自家模型的內部壓力。Replit 把自己定位為「實驗室」,核心護城河是靈活調度各家模型的隱性知識:用 Anthropic(Claude)強大的連貫性處理核心代理迴圈、用 Gemini 的高 CP 值處理設計與低成本任務、讓 OpenAI 的模型扮演嚴苛的程式碼審查員。

第三層是結構性安全。Replit 不依賴外部公開資料庫,而是把資料庫內建,採用零信任架構,每次部署都會在 Google Cloud 上創建完全隔離的專案。企業 NRR(淨收入留存率)達 300%,靠的是 Meta、Zillow 等員工先自行採用、再 bottom-up 拿企業合約。最嚴格的資安長無可挑剔。

同一篇報導對照組是 Cursor。據 Bloomberg 報導,Cursor 因受限於成長停滯,正與 SpaceX 洽談 600 億美元的收購案;The Information 也提到部分 AI 新創正承受 -23% 的毛利率。Masad 對未來的預測是「後提示時代」(Post-prompting world):傳統 IDE 已死,未來開發者不需要逐行檢查程式碼,只需給 AI 一個明確目標。

工具廠的另一條軸是把 AI 直接做進開發工作流。Arm 推出 Performix,這是為代理式 AI 設計的效能分析工具,可在運行時直接從 Arm 晶片收集記憶體頻寬、延遲、快取效率、CPU 利用率等資料,並支援嵌入自動化、AI 代理驅動的工作流程。已獲微軟、MongoDB、Redis、SAP 支持。Arm 的數據是 2025 年超大規模雲端供應商所採用 CPU 算力的 50% 來自 Arm 架構。

最戲劇化的應用例則是 Wonder Create。Wonder 執行長 Marc Lore 在 WSJ「Future of Everything」節目上演示:用 AI 提示詞 1 分鐘內生成餐廳名稱、品牌設計、菜單、定價。後場是「可程式化烹調平台」,700 種食材庫搭配輸送帶、機械手臂運作;公司最近收購自動碗盤製作機商 Spice Robotics、計劃明年推出可製作網路約 80% 醬料配方的「無限醬料機」。目前 120 間自動化廚房,明年將擴至 400 間。Wonder 從餐車起步、現在是垂直整合的外送與餐飲平台,併購包括 Grubhub、Blue Apron、與 2 月以 650 萬美元買下的 Blue Ribbon Fried Chicken。

接下來值得追的是 Replit 是否能維持獨立、Cursor 跟 SpaceX 的洽談是否真有結果。AI 工具的客群選擇正在分化成兩個方向:往專業工程師走或往非工程師走。前者壓力來自價格敏感與低忠誠度;後者壓力來自能不能解決完整問題(包括資料庫、部署、資安)。

本地 LLM 的硬體民主化

週末 r/LocalLLM 的熱度集中在 Qwen3.6 35B A3B 跨硬體性能。最關鍵的紀錄是 llama.cpp + MTP 讓 35B A3B 在 12GB VRAM 跑出 80 tok/sec、128K context;AMD 7900XT 24GB 跑 Q4_K_M 約 10 tok/sec 但會偶發系統 crash。社群同步在 RTX 3070 Mobile 8GB、5060 8GB 之類中階卡上測試各種量化(Q4_K_M、Q4_K_XL、NVFP4),把先前需要高階雲端 GPU 才能跑的 30B 級模型,搬到一般人能買得起的硬體上。

小模型的方向也走出新姿態。一位開發者訓練了 59M 參數的 GameDev 編碼模型,專做 Unity / Godot / Unreal 的具體指令(如「加 WASD 移動到 X 元件」);目標不是挑戰 frontier 通用推理,而是當作離線後備。Liquid AI 的 Maxime Labonne 拍 YouTube 影片解釋 LFM2.5-350M 如何避免 Qwen3.5-0.8B 的 doom loop,用 RL 解小模型常出現的循環失敗。chonklm.com 上線、提供 < 500M 模型在瀏覽器內直接跑的入口,下載權重後可離線使用,補上小模型 API 短缺的試用空間。

開源視覺生成的工具鏈也跟上來。Z-Image-Turbo 在 RTX2060 上生出接近寫實的人像,r/StableDiffusion 反覆驗證;Flux.2 Klein 9b 的角色一致性測試(同一參考人物丟到不同場景、座姿、表情)開始有像樣的結果,社群把焦點從「能不能生成漂亮的單張」轉到「能不能延續特定 IP」。Wan 2.2 + LTX 2.3 ID-LoRA 串接的 workflow 可以自動加音訊、延長片段,影片生成從靜態幾秒短片走到可剪輯的工作流。

ComfyUI 生態同步進入工具化階段。Sense Nova U1 進入 ComfyUI、支援 8-step LoRA 加速,但被特別標註是 RAM-heavy(建議 36GB 系統 RAM)而非 VRAM-heavy。Ultimate Detailer Workflow 在 Hugging Face 釋出,主打多人物自動遮罩:SAM3 處理自然語言遮罩、YOLO 處理偵測,並串接自動 prompt concat。SmartGallery DAM 開源、本地優先的數位資產管理器,自動索引 ComfyUI 的 workflow / prompts / models / LoRA,並提供安全的 client review portal。

把這幾條看完會發現一個共同方向:本地 AI 的可及性在過去三個月被快速拉低。30B 級語言模型在 12GB VRAM 跑出可用的 token 速度、寫實圖像生成在 RTX2060 跑出像樣的結果、影片生成從研究生玩具走到可剪輯流程;同時間有人開始訓練 59M 級的「specialist 小模型」,承認小模型的價值不是通用智能、是特定領域的低延遲後備。frontier 模型繼續往更貴的方向走(Claude Max、Cursor 的 600 億美元討論),本地端則往「夠用、可控、隱私」的方向走。

接下來值得觀察的是 specialist 小模型會不會成為新 entry point。如果 Liquid AI 的 LFM2.5 訓練方法能複製到更多應用領域、如果 chonklm.com 這類「瀏覽器即推理環境」的形式被更多人採用,本地 AI 對使用者的門檻會再降一階。

明日值得追的事
  • → 鴻海與廣達 5/14 同日公布 4 月營收與法說會,AI 伺服器訂單能見度與毛利指引會直接反映台廠 AI 算力鏈的當期讀數
  • → 鴻勁精密 5/13 法說會的封測設備需求展望,會透露先進製程客戶端 capex 的真實節奏
  • → NVDA 5/21 財報是下半年 AI 算力鏈與記憶體 capex 指引的關鍵讀數