Anthropic 的 Mythos 揪出 Linux 核心漏洞。卡住的修補併進主線。
一個 epoll 競態漏洞的修補停滯數月後,Anthropic 的 AI 模型 Mythos 把它找了出來,補丁併入 Linux 主線。同期 NVIDIA 開源 550B 的 Nemotron 3 Ultra,本地跑模型的討論則從能不能跑轉向怎麼跑得省。
一個 Linux 核心漏洞的修補過程裡,出現了一個過去不會有的角色。Anthropic 的一個 AI 模型,找出了人類維護者原本卡住的競態條件。
另一頭,NVIDIA 把一個 550B 的模型連權重帶訓練配方一起開源;本地跑模型的社群,話題也從能不能跑,換成了怎麼跑得省。
AI 模型翻出人類維護者卡住的核心漏洞
Linux 核心的 epoll 子系統被挖出一個本機權限提升漏洞,資安研究人員把它命名為 Bad Epoll,編號 CVE-2026-46242,CVSS 嚴重度 7.8 分。
漏洞的成因是競態條件造成的記憶體釋放後再存取(Use-After-Free)。攻擊者可以藉此把一個無特權的處理程序,提升成具有 root 權限的狀態。目前已知 Linux 桌面、伺服器與 Android 都在受影響範圍內。
影響邊界跟核心版本綁在一起。問題是在 Linux 核心 6.4 版引入的,較舊的 6.1 版不受影響。落到手機上,Pixel 10 這種核心 6.6 以上的裝置,概念驗證程式會觸發 UAF;Pixel 8 這類還停在 6.1 的裝置則沒事。
麻煩的地方在於這個漏洞很難繞。epoll 是核心提供的高效率 I/O 事件通知機制,Nginx、Redis、HAProxy 這些要同時扛大量連線的伺服器都靠它。因為 epoll 沒辦法停用,Bad Epoll 沒有簡單的緩解手段,唯一的補救就是套修補程式。
真正少見的是修補是怎麼來的。Bad Epoll 跟稍早在 5 月揭露的 CVE-2026-43074,是兩個獨立的競態條件問題,都在 2023 年 4 月被寫進 epoll 的程式碼。2026 年 2 月,韓國首爾大學電腦安全實驗室把這些問題通報給 Linux 核心安全團隊,當時維護者提出的修補原型並不是正確的解法,討論就這樣停了下來。
打破僵局的不是人。4 月初,Anthropic 的頂尖 AI 模型 Mythos 找到了其中一個 epoll 競態漏洞 CVE-2026-43074,修補程式併入 Linux 核心主線。到了 4 月底,首爾大學研究員 Jaeyoung Chung 的團隊,補上了 Mythos 漏掉的那一個,也就是 Bad Epoll,修補同樣進了主線。這回是人接手把 AI 沒抓到的那半補齊。
NVIDIA 把 550B 的 Nemotron 3 Ultra 整包開源
NVIDIA 在 6 月 4 日發布 Nemotron 3 Ultra,把權重、訓練資料和訓練配方一起放了出來。
規格攤開來看是這樣:
- 550B 參數的 MoE 架構,每個 token 實際啟用 55B
- 100 萬 token 的 context,可以一次餵進整個程式庫或數小時的逐字稿
- 官方宣稱推論吞吐量比同級開源模型 Kimi K2.6、GLM-5.1、Qwen-3.5 高,最多到約 6 倍,這個數字是 NVIDIA 自家 benchmark,得打點折扣
- 可以透過 Ollama 在本地跑,但完整 BF16 權重大約要 8 張 H100 才裝得下
它的定位講得很清楚。這是為 agentic 工作流調校的模型,針對多步驟程式、工具使用、長研究鏈,而不是拿去衝單輪聊天的分數。發文的人也特別提醒,它是一個 base model,不是 agent 框架,所以那種「Claude Code 殺手」的說法搭不上,它比較像積木而不是成品。
排名上各有各的說法。獨立評測機構 Artificial Analysis 把它列在美國開源權重模型的智慧指數第一,但如果不綁在 NVIDIA 硬體上,整體 raw benchmark 目前還是 Kimi K2.6 領先。
本地跑模型的話題,從能不能跑換成跑得省
在本地跑模型的社群裡,這幾天冒出來的東西有個共同方向。重點不再是模型能不能塞進機器,而是怎麼把它跑得更省、更好整合。
先看硬體那頭被逼到什麼程度。有人在一台只有 4GB VRAM 的 GTX 1650 筆電上,用 llama.cpp 把 Qwen3.6-35B-A3B 跑到每秒 19 個 token。做法是把 FFN 專家層丟到 CPU、用 q8_0 壓快取、盡量加大 ubatch,硬是把一個 35B 的模型塞進了本來不該跑得動的機器。
工具鏈也在往「一個檔全包」收斂。mlx-serve 是一個用 Zig 寫的原生二進位,在 Apple Silicon 上同一個連接埠同時吐出 OpenAI、Anthropic 和 Ollama 三套 API,還內建用 Virtualization.framework 開真實 Linux VM 的 agent 沙箱,順帶把 FLUX.2 影像、LTX-Video 影片、Hunyuan3D 的 3D 生成和 Qwen3-TTS 語音克隆全塞進同一個程序。另一個方向是 TensorSharp,作者不走包裝 llama.cpp 的路,直接用純 C# 從底到頂重寫整個推論引擎,CPU 後端是 100% C# 執行,再補上 CUDA、MLX、GGML 後端,一樣相容 OpenAI 與 Ollama 介面。
省錢的討論則落在路由上。有人分享用一個預訓練的分類器,把不同提示詞導向不同模型,附上實際可用的路由表,宣稱這樣做可以把 API 成本壓下最多 60%。當多數人手上的模型都跑得動之後,接下來比的就是同一個任務誰花得少。
- → 各 Linux 發行版把 Bad Epoll 修補回溯移植的進度,以及 Pixel 系列的核心安全更新何時推送。
- → Nemotron 3 Ultra 在真實 agent 任務上的表現,會不會對得起它宣稱的吞吐量數字。
- → AI 模型找核心漏洞這件事,除了 Anthropic 之外還有誰在做、進了哪些專案的主線。
如果模型能自己跑在你的機器上、還能被信任去翻核心裡的競態條件,那接下來比的就不只是它多會生成,而是它能不能被放進真正要負責的位置。