Anthropic 的 Mythos 揪出 Linux 核心漏洞。卡住的修補併進主線。

一個 epoll 競態漏洞的修補停滯數月後，Anthropic 的 AI 模型 Mythos 把它找了出來，補丁併入 Linux 主線。同期 NVIDIA 開源 550B 的 Nemotron 3 Ultra，本地跑模型的討論則從能不能跑轉向怎麼跑得省。

水無瀨澪用八格漫畫帶你看今天的 AI 圈：Anthropic 的 AI 模型 Mythos 找出 Linux 核心漏洞、NVIDIA 開源 Nemotron 3 Ultra、本地跑模型從能不能跑轉向跑得省 — AI 模型 Mythos 揪出人類維護者卡住的 Linux 核心漏洞、NVIDIA 把 550B 模型連配方一起送、有人硬把大模型塞進 4GB 筆電。能力之外，接下來比的是能不能被信任。 ↗ 點擊放大

一個 Linux 核心漏洞的修補過程裡，出現了一個過去不會有的角色。Anthropic 的一個 AI 模型，找出了人類維護者原本卡住的競態條件。

另一頭，NVIDIA 把一個 550B 的模型連權重帶訓練配方一起開源；本地跑模型的社群，話題也從能不能跑，換成了怎麼跑得省。

AI 模型翻出人類維護者卡住的核心漏洞

Linux 核心的 epoll 子系統被挖出一個本機權限提升漏洞，資安研究人員把它命名為 Bad Epoll，編號 CVE-2026-46242，CVSS 嚴重度 7.8 分。

漏洞的成因是競態條件造成的記憶體釋放後再存取（Use-After-Free）。攻擊者可以藉此把一個無特權的處理程序，提升成具有 root 權限的狀態。目前已知 Linux 桌面、伺服器與 Android 都在受影響範圍內。

影響邊界跟核心版本綁在一起。問題是在 Linux 核心 6.4 版引入的，較舊的 6.1 版不受影響。落到手機上，Pixel 10 這種核心 6.6 以上的裝置，概念驗證程式會觸發 UAF；Pixel 8 這類還停在 6.1 的裝置則沒事。

麻煩的地方在於這個漏洞很難繞。epoll 是核心提供的高效率 I/O 事件通知機制，Nginx、Redis、HAProxy 這些要同時扛大量連線的伺服器都靠它。因為 epoll 沒辦法停用，Bad Epoll 沒有簡單的緩解手段，唯一的補救就是套修補程式。

真正少見的是修補是怎麼來的。Bad Epoll 跟稍早在 5 月揭露的 CVE-2026-43074，是兩個獨立的競態條件問題，都在 2023 年 4 月被寫進 epoll 的程式碼。2026 年 2 月，韓國首爾大學電腦安全實驗室把這些問題通報給 Linux 核心安全團隊，當時維護者提出的修補原型並不是正確的解法，討論就這樣停了下來。

打破僵局的不是人。4 月初，Anthropic 的頂尖 AI 模型 Mythos 找到了其中一個 epoll 競態漏洞 CVE-2026-43074，修補程式併入 Linux 核心主線。到了 4 月底，首爾大學研究員 Jaeyoung Chung 的團隊，補上了 Mythos 漏掉的那一個，也就是 Bad Epoll，修補同樣進了主線。這回是人接手把 AI 沒抓到的那半補齊。

NVIDIA 把 550B 的 Nemotron 3 Ultra 整包開源

NVIDIA 在 6 月 4 日發布 Nemotron 3 Ultra，把權重、訓練資料和訓練配方一起放了出來。

規格攤開來看是這樣：

550B 參數的 MoE 架構，每個 token 實際啟用 55B
100 萬 token 的 context，可以一次餵進整個程式庫或數小時的逐字稿
官方宣稱推論吞吐量比同級開源模型 Kimi K2.6、GLM-5.1、Qwen-3.5 高，最多到約 6 倍，這個數字是 NVIDIA 自家 benchmark，得打點折扣
可以透過 Ollama 在本地跑，但完整 BF16 權重大約要 8 張 H100 才裝得下

它的定位講得很清楚。這是為 agentic 工作流調校的模型，針對多步驟程式、工具使用、長研究鏈，而不是拿去衝單輪聊天的分數。發文的人也特別提醒，它是一個 base model，不是 agent 框架，所以那種「Claude Code 殺手」的說法搭不上，它比較像積木而不是成品。

排名上各有各的說法。獨立評測機構 Artificial Analysis 把它列在美國開源權重模型的智慧指數第一，但如果不綁在 NVIDIA 硬體上，整體 raw benchmark 目前還是 Kimi K2.6 領先。

本地跑模型的話題，從能不能跑換成跑得省

在本地跑模型的社群裡，這幾天冒出來的東西有個共同方向。重點不再是模型能不能塞進機器，而是怎麼把它跑得更省、更好整合。

先看硬體那頭被逼到什麼程度。有人在一台只有 4GB VRAM 的 GTX 1650 筆電上，用 llama.cpp 把 Qwen3.6-35B-A3B 跑到每秒 19 個 token。做法是把 FFN 專家層丟到 CPU、用 q8_0 壓快取、盡量加大 ubatch，硬是把一個 35B 的模型塞進了本來不該跑得動的機器。

工具鏈也在往「一個檔全包」收斂。mlx-serve 是一個用 Zig 寫的原生二進位，在 Apple Silicon 上同一個連接埠同時吐出 OpenAI、Anthropic 和 Ollama 三套 API，還內建用 Virtualization.framework 開真實 Linux VM 的 agent 沙箱，順帶把 FLUX.2 影像、LTX-Video 影片、Hunyuan3D 的 3D 生成和 Qwen3-TTS 語音克隆全塞進同一個程序。另一個方向是 TensorSharp，作者不走包裝 llama.cpp 的路，直接用純 C# 從底到頂重寫整個推論引擎，CPU 後端是 100% C# 執行，再補上 CUDA、MLX、GGML 後端，一樣相容 OpenAI 與 Ollama 介面。

省錢的討論則落在路由上。有人分享用一個預訓練的分類器，把不同提示詞導向不同模型，附上實際可用的路由表，宣稱這樣做可以把 API 成本壓下最多 60%。當多數人手上的模型都跑得動之後，接下來比的就是同一個任務誰花得少。

明日值得追的事

→ 各 Linux 發行版把 Bad Epoll 修補回溯移植的進度，以及 Pixel 系列的核心安全更新何時推送。
→ Nemotron 3 Ultra 在真實 agent 任務上的表現，會不會對得起它宣稱的吞吐量數字。
→ AI 模型找核心漏洞這件事，除了 Anthropic 之外還有誰在做、進了哪些專案的主線。

編者觀察

如果模型能自己跑在你的機器上、還能被信任去翻核心裡的競態條件，那接下來比的就不只是它多會生成，而是它能不能被放進真正要負責的位置。