華邦電 Q1 毛利 53.4%：整個記憶體產能都被 AI 吸走了

華邦電 Q1 毛利率衝 53.4%、稅後淨利 101 億元、2027 年產能售完；慧榮預估 NAND 缺到 2028。同時間台積電訂單滿到 2028，蘋果在找 Intel、AMD 找三星救援，OpenAI 自研晶片受阻。AI 工具市場的勝負則由 Replit 90% 毛利示範了：客群選對才是答案。

懶人包

→ 華邦電 Q1 毛利率 53.4% 創歷史新高、稅後淨利 101 億元、EPS 2.25 元；陳沛銘直言『現在 NAND 缺貨真的無解』、2027 年產能已被客戶預訂一空，公司正把 PC 應用產能轉向伺服器與 AI
→ 慧榮苟嘉章預估 DDR5 將持續缺貨、長約成趨勢；美光銅鑼廠啟動人才招募；華邦電 SLC NAND 一年內位元成長可達 80%、SLC 毛利率明顯優於 NOR Flash
→ 台積電先進製程訂單滿到 2028、與 Sony 成立合資公司攻下一代感測器；蘋果傳和英特爾達成晶片代工協議，AMD 2 奈米 AI 晶片找三星救援；OpenAI 自研晶片陷入困境、博通開出條件使微軟成關鍵；軟銀攜輝達、鴻海生產 AI 伺服器（日製國家隊）
→ Replit 鎖定『非工程師』、企業端毛利 80-90%、NRR 300%、營收朝 10 億美元 ARR 衝刺；Cursor 卻因成長停滯傳與 SpaceX 洽談 600 億美元收購；Wonder Create 用 AI 提示詞 1 分鐘生成完整餐廳品牌；Arm 推 Performix 為代理式 AI 設計效能分析工具
→ llama.cpp + MTP 讓 Qwen3.6 35B A3B 在 12GB VRAM 跑出 80 tok/sec、128K context；Z-Image-Turbo 在 RTX2060 即可生成接近寫實人像；ComfyUI 生態跟上 Sense Nova U1 的 8-step LoRA、Ultimate Detailer 用 SAM3 加 YOLO 自動遮罩

週末重要的事都集中在 AI 算力上游的擠壓與下游的客群分歧。記憶體大廠華邦電 Q1 毛利衝 53.4% 創歷史新高、總經理陳沛銘直言 NAND 缺貨「真的無解」、2027 年產能已售完；慧榮同步喊出 DDR5 將持續缺貨、長約成趨勢。台積電先進製程訂單滿到 2028、與 Sony 啟動感測器合資，但同一時間蘋果傳跟 Intel 達成代工協議、AMD 2 奈米找三星救援、OpenAI 自研晶片卡在博通與微軟的承諾結構。

AI 工具市場的故事換了個方向。Replit 公開三層獲利邏輯（客群錯位、模型彈性、結構性安全），企業端毛利衝到 80-90%、NRR 300%；同一篇報導裡 Cursor 傳因成長停滯與 SpaceX 洽談 600 億美元收購。Arm 推 Performix 把效能分析工具直接做給 AI 代理用，Wonder 把餐飲品牌生成壓到 1 分鐘。

最後一條是本地端的硬體下放。Qwen3.6 35B A3B 配 llama.cpp MTP 在 12GB VRAM 跑出 80 tok/sec、128K context；Z-Image-Turbo 在 RTX2060 上的圖質讓 r/StableDiffusion 反覆驗證。

記憶體進入「無解」階段

華邦電 5 日法說會繳出歷史最佳成績單。Q1 毛利率達 53.4% 創新高，稅後淨利 101 億元、EPS 2.25 元。總經理陳沛銘把市場狀態講得很白：「整體記憶體需求緊得不得了」、下半年價格仍將維持高檔甚至續漲，2027 年產能已被客戶預訂一空。

公司三大產品線在這波循環裡走出不同節奏。利基型 DRAM 以 20 奈米製程為主，產品包括 DDR4、LPDDR4、DDR3，未來高雄新廠將導入 16 奈米，但策略上避開 DDR5 標準品戰場、以 LPDDR5 與 DDR4 為優先。SLC NAND Flash 則進入加速擴張階段，一年內位元成長幅度可達 80%。陳沛銘的觀察是，主要 NAND 大廠陸續退出 2D 產能（包含部分 SLC），市場出現明顯缺口；高密度需求轉 3D NAND，低密度需求轉 eMMC 與 SLC NAND。SLC NAND 毛利率明顯優於 NOR Flash，已成為公司獲利動能來源。

「現在 NAND 缺貨真的無解」，陳沛銘強調。在這狀態下，客戶對價格接受度提高，甚至出現「寧可漲價也要確保供貨」的反應。產能持續吃緊也讓 AI 排擠效應浮上檯面：「整個產能都被 AI 吸走了，排擠到非 AI 應用」。PC 市場需求衰退幅度可能達兩三成，公司因此把產能由 PC 相關應用轉向伺服器與 AI 領域。

產能布局也跟著調整。董事會通過 2027 年資本支出 73 億元，其中 50 億元投入 CUBE 客製化高頻寬記憶體（HBM）產品。今年資本支出將超過 400 億元，2027 年月產能由目前 1.5 萬片提升到 2.4 萬片，並逐步把 DRAM 產能由台中廠移轉到高雄。陳沛銘透露，過去一年的重點不是跑客戶、是跑供應商，設備交期吃緊已成擴產最大挑戰。

慧榮總座苟嘉章的觀察跟華邦電對得上：DDR5 將持續缺貨、長約逐漸成為市場常態。美光銅鑼廠也已啟動人才招募，反映客戶端對 AI 記憶體 capex 的具體拉動。SLC NAND 缺到 2028 已是供應鏈的共同預設。

接下來值得追的是長約簽訂節奏。華邦電目前長約占比仍不高，但近期已有愈來愈多客戶主動要求簽訂、甚至願意接受逐季議價，公司預計待高雄新廠設備陸續到位後再評估長約策略。如果高密度 NAND 退出潮持續、低密度需求又被 AI 推論伺服器吃下，2027 年的供應結構會比現在更緊；如果 PC 需求兩年後回補，整體市場有機會再出現一段「兩端搶料」的緊縮期。

台積電與全球晶片棋局

台積電的訂單滿到 2028，但棋局正在被周邊重畫。蘋果傳和英特爾達成晶片代工協議，外媒形容為「台積電獨家局面告終」；AMD 2 奈米 AI 晶片同一週傳出找三星救援。表面上看是客戶分散下單，背後是先進製程產能在 AI 時代被擠到極限後的合理回應：客戶開始把雞蛋分到第二個籃子裡。

OpenAI 與博通的 Nexus 晶片計畫遇到結構性卡關。博通開出條件要求微軟先承諾採購約 40% 晶片才願意出資生產，安排是微軟把晶片裝進自家資料中心、再回租給 OpenAI。微軟有了採購承諾，博通才有信心回收資金；但微軟也可能選擇不買。OpenAI 預估到 2029 年公司支出壓力達兩千億美元級，自研晶片是核心戰略，執行卻取決於微軟這個中介角色的態度。台積電在這條軸上的角色是默默的產能壓力源：Nexus 的晶片要靠台積電量產，但先進製程已經沒空檔。

日本則組起了自己的 AI 算力國家隊。軟銀攜輝達、鴻海生產 AI 伺服器，被日媒形容為「對抗三星」的新陣型。台積電同步跟 Sony 成立合資公司攻下一代感測器，產業布局從晶圓代工延伸到光學感測層。Sony 5 月初公布的 2025 年度財報顯示 PS5 累計銷售突破 9370 萬台，但本季同步揭露 PS5 受記憶體缺料拖累銷售；新合資公司被視為 Sony 在 AI 時代重新定位感測器與運算分工的動作。

這幾條動作放回時間軸：4 月台積電 4 月營收 4,107 億元創 4 月新高、年增 17.5%、前四月業績大增 29%。最大客戶輝達跟超微的訂單節奏依然強勁，AMD 找三星更像是分散風險的議價舉動而非產能轉移。蘋果跟 Intel 的協議則需要看後續產品代別與晶片量級才能判斷意義；目前還沒到「終結獨家」的程度，更接近「在最頂端製程旁邊另開一條備援」。

接下來值得觀察的是台積電 2 奈米 / A16 客戶名單與分配比重。OpenAI 的 Nexus 量產時程、Sony 合資公司的細節公布、蘋果跟 Intel 協議的具體晶片代別，都會在接下來幾個月陸續落地。如果先進製程的客戶結構真的開始重新洗牌，台積電的議價權會出現第一次像樣的測試。

AI 工具的客群錯位戰

Replit 執行長 Amjad Masad 公開公司獲利邏輯這件事，比一般財報訪談更有讀的價值。公司 2024 年營收僅 280 萬美元，現在朝 10 億美元 ARR 衝刺，整體毛利接近 50%、企業端毛利曾達 80%-90%。「我們打算保持獨立運作」，這句話的底氣來自三層結構性決定。

第一層是錯位競爭。多數 AI 寫程式工具（如 Cursor）的目標受眾是專業工程師，但這群人對價格極度敏感、對工具忠誠度低。Replit 把目光鎖定企業內部營運團隊（Ops Teams），這群人不在乎程式碼，他們要的是解決問題。Masad 的對比很具體：「工程師可能會為了 1,000 美元的帳單斤斤計較，但當一個營運經理用 Replit 省下了 10 萬美元的 SaaS 訂閱費，甚至省下 20 萬美元的人力成本時，他們絕對願意支付溢價。」

第二層是模型彈性。「向下垂直整合到自有模型，其實是一種陷阱」，Masad 直接點出產業裡常見的綁定動機：一旦公司花大錢訓練模型，就會產生只推廣自家模型的內部壓力。Replit 把自己定位為「實驗室」，核心護城河是靈活調度各家模型的隱性知識：用 Anthropic（Claude）強大的連貫性處理核心代理迴圈、用 Gemini 的高 CP 值處理設計與低成本任務、讓 OpenAI 的模型扮演嚴苛的程式碼審查員。

第三層是結構性安全。Replit 不依賴外部公開資料庫，而是把資料庫內建，採用零信任架構，每次部署都會在 Google Cloud 上創建完全隔離的專案。企業 NRR（淨收入留存率）達 300%，靠的是 Meta、Zillow 等員工先自行採用、再 bottom-up 拿企業合約。最嚴格的資安長無可挑剔。

同一篇報導對照組是 Cursor。據 Bloomberg 報導，Cursor 因受限於成長停滯，正與 SpaceX 洽談 600 億美元的收購案；The Information 也提到部分 AI 新創正承受 -23% 的毛利率。Masad 對未來的預測是「後提示時代」（Post-prompting world）：傳統 IDE 已死，未來開發者不需要逐行檢查程式碼，只需給 AI 一個明確目標。

工具廠的另一條軸是把 AI 直接做進開發工作流。Arm 推出 Performix，這是為代理式 AI 設計的效能分析工具，可在運行時直接從 Arm 晶片收集記憶體頻寬、延遲、快取效率、CPU 利用率等資料，並支援嵌入自動化、AI 代理驅動的工作流程。已獲微軟、MongoDB、Redis、SAP 支持。Arm 的數據是 2025 年超大規模雲端供應商所採用 CPU 算力的 50% 來自 Arm 架構。

最戲劇化的應用例則是 Wonder Create。Wonder 執行長 Marc Lore 在 WSJ「Future of Everything」節目上演示：用 AI 提示詞 1 分鐘內生成餐廳名稱、品牌設計、菜單、定價。後場是「可程式化烹調平台」，700 種食材庫搭配輸送帶、機械手臂運作；公司最近收購自動碗盤製作機商 Spice Robotics、計劃明年推出可製作網路約 80% 醬料配方的「無限醬料機」。目前 120 間自動化廚房，明年將擴至 400 間。Wonder 從餐車起步、現在是垂直整合的外送與餐飲平台，併購包括 Grubhub、Blue Apron、與 2 月以 650 萬美元買下的 Blue Ribbon Fried Chicken。

接下來值得追的是 Replit 是否能維持獨立、Cursor 跟 SpaceX 的洽談是否真有結果。AI 工具的客群選擇正在分化成兩個方向：往專業工程師走或往非工程師走。前者壓力來自價格敏感與低忠誠度；後者壓力來自能不能解決完整問題（包括資料庫、部署、資安）。

本地 LLM 的硬體民主化

週末 r/LocalLLM 的熱度集中在 Qwen3.6 35B A3B 跨硬體性能。最關鍵的紀錄是 llama.cpp + MTP 讓 35B A3B 在 12GB VRAM 跑出 80 tok/sec、128K context；AMD 7900XT 24GB 跑 Q4_K_M 約 10 tok/sec 但會偶發系統 crash。社群同步在 RTX 3070 Mobile 8GB、5060 8GB 之類中階卡上測試各種量化（Q4_K_M、Q4_K_XL、NVFP4），把先前需要高階雲端 GPU 才能跑的 30B 級模型，搬到一般人能買得起的硬體上。

小模型的方向也走出新姿態。一位開發者訓練了 59M 參數的 GameDev 編碼模型，專做 Unity / Godot / Unreal 的具體指令（如「加 WASD 移動到 X 元件」）；目標不是挑戰 frontier 通用推理，而是當作離線後備。Liquid AI 的 Maxime Labonne 拍 YouTube 影片解釋 LFM2.5-350M 如何避免 Qwen3.5-0.8B 的 doom loop，用 RL 解小模型常出現的循環失敗。chonklm.com 上線、提供 < 500M 模型在瀏覽器內直接跑的入口，下載權重後可離線使用，補上小模型 API 短缺的試用空間。

開源視覺生成的工具鏈也跟上來。Z-Image-Turbo 在 RTX2060 上生出接近寫實的人像，r/StableDiffusion 反覆驗證；Flux.2 Klein 9b 的角色一致性測試（同一參考人物丟到不同場景、座姿、表情）開始有像樣的結果，社群把焦點從「能不能生成漂亮的單張」轉到「能不能延續特定 IP」。Wan 2.2 + LTX 2.3 ID-LoRA 串接的 workflow 可以自動加音訊、延長片段，影片生成從靜態幾秒短片走到可剪輯的工作流。

ComfyUI 生態同步進入工具化階段。Sense Nova U1 進入 ComfyUI、支援 8-step LoRA 加速，但被特別標註是 RAM-heavy（建議 36GB 系統 RAM）而非 VRAM-heavy。Ultimate Detailer Workflow 在 Hugging Face 釋出，主打多人物自動遮罩：SAM3 處理自然語言遮罩、YOLO 處理偵測，並串接自動 prompt concat。SmartGallery DAM 開源、本地優先的數位資產管理器，自動索引 ComfyUI 的 workflow / prompts / models / LoRA，並提供安全的 client review portal。

把這幾條看完會發現一個共同方向：本地 AI 的可及性在過去三個月被快速拉低。30B 級語言模型在 12GB VRAM 跑出可用的 token 速度、寫實圖像生成在 RTX2060 跑出像樣的結果、影片生成從研究生玩具走到可剪輯流程；同時間有人開始訓練 59M 級的「specialist 小模型」，承認小模型的價值不是通用智能、是特定領域的低延遲後備。frontier 模型繼續往更貴的方向走（Claude Max、Cursor 的 600 億美元討論），本地端則往「夠用、可控、隱私」的方向走。

接下來值得觀察的是 specialist 小模型會不會成為新 entry point。如果 Liquid AI 的 LFM2.5 訓練方法能複製到更多應用領域、如果 chonklm.com 這類「瀏覽器即推理環境」的形式被更多人採用，本地 AI 對使用者的門檻會再降一階。

明日值得追的事

→ 鴻海與廣達 5/14 同日公布 4 月營收與法說會，AI 伺服器訂單能見度與毛利指引會直接反映台廠 AI 算力鏈的當期讀數
→ 鴻勁精密 5/13 法說會的封測設備需求展望，會透露先進製程客戶端 capex 的真實節奏
→ NVDA 5/21 財報是下半年 AI 算力鏈與記憶體 capex 指引的關鍵讀數