4B小型AIが8B超え｜サイバー防御ローカル運用

CyberSecQwen-4B開発チーム：4B特化モデル公開 — 画像: AI生成

CyberSecQwen-4BはQwenベースの4Bパラメータモデルに、MITRE／NVD由来の2021年CVE→CWEマッピングと合成Q&Aを組み合わせ、CTI-Benchとの重複を除去したデータで特化学習した成果物として公開された。学習はAMD Instinct MI300X 192GB 1枚でbf16・FlashAttention-2・LoRA（r=64）・10エポックという比較的軽量な構成で完結している。

評価では、2,500問のCTI-MCQで0.5868を記録し、Foundation-Sec-Instruct-8Bの0.4996を8.7ポイント上回った。CVE→CWEマッピング1,000件のCTI-RCMでは0.6664対0.6850と1.9ポイント下回るものの、8Bモデルの97.3%の水準を4Bで保持している。同じレシピをGemma-4-E2B-itに適用したGemma4Defense-2BでもCTI-RCMで0.9ポイント差に収束し、レシピがベースモデル非依存で機能したことが示された。

読者にとっての含意は3点に整理できる。第一に、12GB VRAMの民生GPUで動く4BモデルがCTI主要ベンチで8B専門モデルに並び、場合によっては上回るため、オンプレミスやエアギャップ環境を前提とするSOC運用の選択肢が広がる。第二に、モデル・学習コード・データセットがすべてApache 2.0で公開されており、自社の脅威情報を外に出さずに派生モデルを学習する参照実装として利用できる。第三に、MI300X 1枚で完走する学習コストが明示されたことで、社内GPU予算と効果のトレードオフを具体的な数字で議論できるようになった。

4B小型AIが8B超え｜サイバー防御ローカル運用の本文内説明図 — 図解: 4B特化モデル公開 - 前処理・軽量レシピ・12GB制約・SOC判断を一本の流れで読む

押さえるポイント

CTI-MCQ 2,500問でスコア0.5868、8B専門モデル比+8.7ポイント
CTI-RCMのCVE→CWEマッピングでは−1.9ポイント、97.3%の精度を維持
MI300X単体・LoRA r=64・10エポックで学習完結、12GB VRAMで推論可能

5W1Hでサクッと理解 誰が CyberSecQwen-4B開発チーム 
 何を 4B特化モデル公開 
 いつ 2026年5月9日 
 どこで Hugging Face 
 なぜ 防御側ローカル運用需要 
 どのように LoRAで特化学習 

何が起きたか

要点4BパラメータのサイバーセキュリティCTI特化モデル「CyberSecQwen-4B」が公開され、8Bの専門モデルFoundation-Sec-Instruct-8Bを主要ベンチマークで上回った。モデル、学習コード、データセットはApache 2.0で公開されている。

3つの視点で読む

開発現場

LoRA r=64・bf16・FlashAttention-2で10エポック、MI300X 1枚という再現しやすい構成で、4Bが8B専門モデルのCTI-MCQスコアを上回った。小型モデルでも領域特化学習とベンチ重複除去済みデータで主要指標の優位を取れることが、同一レシピをGemma-4-E2B-itに移植したGemma4Defense-2Bでも確認された。

事業判断

12GB VRAMの民生GPUでローカル動作する4Bモデルが、クラウドAPI前提の大型LLMに頼らずCTI業務を回す選択肢として成立する。Apache 2.0でモデルとレシピが揃うため、SOC・MSSP・社内脅威インテリチームは独自データで再学習した派生版を自前で持てる。

リスク・ルール

オンプレミス・エアギャップ環境で動く前提の公開物となったことで、脅威情報・CVE・内部インシデントデータを外部APIに送らずに処理できる。機微情報の域外移転や監査要件を抱える組織にとって、導入時の法務・セキュリティ審査の論点が外部送信の是非から自組織の管理運用に移る。

追い風と向かい風

追い風を受ける側

SOC・社内脅威インテリチーム民生GPUで動く4Bモデルを自前データで再学習でき、外部API依存を外した運用が現実解になった
AMD（Instinct MI300X）192GB 1枚でLoRA学習が完結する事例が公開レシピとして示され、LLM学習環境としての実績が積み上がる
Qwen・Gemmaコミュニティ同一レシピで2系統のベースに適用可能なことが示され、小型モデルの特化派生の土台として選ばれやすい

向かい風を受ける側

クラウドAPI前提のCTI特化LLM提供ローカル動作・全公開の競合が主要ベンチで並ぶ〜上回る領域が出たことで、API課金の正当化が難しくなる
Foundation-Sec-Instruct-8BCTI-MCQで4Bに+8.7ポイント差をつけられ、サイズ優位だけでは説明できない指標差が公開された