🚀 NVIDIAが次世代AIモデル「Nemotron 3 Super」を発表｜1200億パラメータ×高効率MoEでエージェントAIが加速

#news

NVIDIAが発表した「Nemotron 3 Super」は1200億パラメータの高効率MoEモデル。エージェントAIに特化し、最大5倍の推論速度を実現。技術の特徴や業界への影響を詳しく解説。

2026.05.08

AI開発の最前線を走るNVIDIAが、
新たなオープンウェイトAIモデル

👉 「Nemotron 3 Super」

を発表しました。

本モデルは、

🧠 1200億パラメータ（120B）
⚡ 有効パラメータ120億（12B）
🤖 エージェント型AI特化

という、高性能と高効率を両立した次世代モデルです。

さらに日本語を含む20言語に対応し、
オープンモデルとして公開されている点でも大きな注目を集めています。

🧠 Nemotron 3 Superとは何か？

🔧 基本スペック
🤖 特化分野
💡 エージェントAIとは？
🧩 どういう仕組み？
🚀 Latent MoEの進化
📊 メリット
🎯 効果
📊 学習データ
🧠 学習プロセス
比較対象
🔋 NVFP4フォーマット
🔓 公開内容
📈 主な用途
💸 必要スペック
⚠️ 依存構造
📊 今後の方向性
✔ 重要ポイント

🔧 基本スペック

総パラメータ数：120B
有効パラメータ：12B（MoEによる選択活性化）
コンテキスト長：最大100万トークン
対応言語：日本語・英語・中国語など20言語

🤖 特化分野

Nemotron 3 Superは特に、

👉 エージェント型AI（Agentic AI）

に最適化されています。

💡 エージェントAIとは？

従来のAI：
👉 質問に答えるだけ

エージェントAI：
👉 自律的にタスクを分解・実行

例👇

ツールを呼び出す
複数ステップ推論
状況に応じた意思決定

⚙️ 技術革新①：MoE（Mixture of Experts）で効率化

Nemotron 3 Superの中核技術が、

👉 MoE（専門家混合モデル）

です。

🧩 どういう仕組み？

複数の「専門家（エキスパート）」を用意
必要な部分だけを動かす

👉 結果：

計算量削減
高速化
高精度維持

🚀 Latent MoEの進化

今回の特徴👇

👉 同じコストで4倍のエキスパートを活用

これにより、

👉 より複雑な推論が可能に

⚡ 技術革新②：Mamba × Transformerのハイブリッド構造

Nemotron 3 Superは、

🧠 Transformer（精度重視）
⚡ Mamba（効率重視）

を融合した構造を採用しています。

📊 メリット

メモリ効率向上
長文処理性能アップ
計算コスト削減

👉 従来比で最大4倍の効率化

⏩ 技術革新③：マルチトークン予測（MTP）

通常のAI：

👉 1トークンずつ生成

Nemotron：

👉 複数トークン同時生成

🎯 効果

推論速度大幅アップ
レイテンシ低減

👉 最大5倍のスループット向上

🧪 学習規模が桁違い

📊 学習データ

総トークン数：25兆
ユニークトークン：10兆
ポストトレーニング：4000万サンプル

🧠 学習プロセス

事前学習
教師あり微調整（SFT）
強化学習（RL）

👉 エージェント用途に最適化

🏆 性能：他モデルを上回る結果

ベンチマークでは、

同規模モデルより高精度
最大7.5倍の推論速度

比較対象

GPT系オープンモデル
Qwenシリーズ

👉 特に「エージェントタスク」で強み

💻 ハードウェア最適化が鍵

Nemotron 3 Superは、

👉 NVIDIA Blackwell

向けに最適化されています。

🔋 NVFP4フォーマット

超低精度（4bit）
高速処理
省電力

👉 FP8比で最大4倍高速

🌍 オープンモデルとしての価値

Nemotron 3 Superは、

👉 完全オープンウェイト

🔓 公開内容

モデル重み
データセット
トレーニング手法

👉 開発者は自由に：

カスタマイズ
商用利用
自前インフラ運用

が可能です。

🏢 すでに企業導入が進行中

以下の企業が導入を進めています👇

Perplexity
Palantir
Siemens

📈 主な用途

ソフトウェア開発支援
サイバーセキュリティ
金融分析
AIエージェント

⚠️ 課題：GPU依存とコスト

高性能の裏には課題もあります。

💸 必要スペック

H100×1（最小）
H100×8（高精度）

👉 個人運用は困難

⚠️ 依存構造

NVIDIA GPU依存
クラウドコスト増加

👉 「オープン＝誰でも使える」ではない

🔮 AI業界のトレンド：エージェント時代へ

現在AIは、

👉 チャット → エージェント

へ進化しています。

📊 今後の方向性

自律的タスク実行
長期記憶
ツール連携

👉 Nemotronはその中心技術

📝 まとめ

Nemotron 3 Superは、

👉 効率 × 精度 × エージェント性能

を高次元で実現したモデルです。

✔ 重要ポイント

MoEで高効率化
Mamba統合で高速化
最大5倍のスループット
100万トークンの長文対応
完全オープンモデル

👉 結論：

「AIを使う時代」から
「AIが動く時代」への転換点

📚 参考・出典

NVIDIA 技術ブログ
Nemotron研究資料
AIベンチマーク評価データ
大規模言語モデル（LLM）関連論文