Persbericht NVIDIA: we onthullen Nemotron 3, een open AI-model ontwikkeld voor multi-agentsystemen

Joop Soesan
16 dec 2025
5 minuten om te lezen

Nemotron 3. Foto: Nvidia

NVIDIA heeft vandaag de NVIDIA Nemotron™ 3-familie aangekondigd, bestaande uit open modellen, data en bibliotheken die zijn ontworpen om transparante, efficiënte en gespecialiseerde agentische AI-ontwikkeling in diverse sectoren mogelijk te maken.

De Nemotron 3-modellen – in de formaten Nano, Super en Ultra – introduceren een baanbrekende hybride architectuur met een latent mengsel van experts (MoE) waarmee ontwikkelaars betrouwbare multi-agentsystemen op grote schaal kunnen bouwen en implementeren.

Naarmate organisaties overstappen van chatbots met één model naar collaboratieve AI-systemen met meerdere agenten, worden ontwikkelaars geconfronteerd met steeds grotere uitdagingen, waaronder communicatieoverhead, contextverschuiving en hoge inferentiekosten. Bovendien hebben ontwikkelaars transparantie nodig om te kunnen vertrouwen op de modellen die hun complexe workflows automatiseren. Nemotron 3 pakt deze uitdagingen direct aan en levert de prestaties en openheid die klanten nodig hebben om gespecialiseerde, agentische AI te bouwen.

"Open innovatie is de basis van de vooruitgang in AI", aldus Jensen Huang, oprichter en CEO van NVIDIA. "Met Nemotron transformeren we geavanceerde AI in een open platform dat ontwikkelaars de transparantie en efficiëntie biedt die ze nodig hebben om agentsystemen op grote schaal te bouwen."

NVIDIA Nemotron ondersteunt NVIDIA's bredere inspanningen op het gebied van soevereine AI, waarbij organisaties van Europa tot Zuid-Korea open, transparante en efficiënte modellen hanteren waarmee ze AI-systemen kunnen bouwen die zijn afgestemd op hun eigen data, regelgeving en waarden.

Pioniers zoals Accenture, Cadence, CrowdStrike, Cursor, Deloitte, EY, Oracle Cloud Infrastructure, Palantir, Perplexity, ServiceNow, Siemens, Synopsys en Zoom integreren modellen uit de Nemotron-familie om AI-workflows aan te drijven in de productie, cybersecurity, softwareontwikkeling, media, communicatie en andere sectoren.

“NVIDIA en ServiceNow geven al jaren vorm aan de toekomst van AI, en het beste moet nog komen”, aldus Bill McDermott, voorzitter en CEO van ServiceNow. “Vandaag zetten we een belangrijke stap voorwaarts om leiders in alle sectoren in staat te stellen hun strategie voor agentische AI te versnellen. De intelligente workflowautomatisering van ServiceNow in combinatie met NVIDIA Nemotron 3 zal de standaard blijven bepalen met ongeëvenaarde efficiëntie, snelheid en nauwkeurigheid.”

Naarmate multi-agent AI-systemen zich verder ontwikkelen, vertrouwen ontwikkelaars steeds meer op eigen modellen voor geavanceerde redenering, terwijl ze tegelijkertijd efficiëntere en aanpasbare open modellen gebruiken om de kosten te drukken. Door taken tussen geavanceerde modellen en Nemotron in één workflow te routeren, krijgen agents de meeste intelligentie en wordt de tokenomics geoptimaliseerd .

"Perplexity is gebouwd op het idee dat menselijke nieuwsgierigheid wordt versterkt door nauwkeurige AI die is ingebouwd in uitzonderlijke tools, zoals AI-assistenten", aldus Aravind Srinivas, CEO van Perplexity. "Met onze agentrouter kunnen we workloads doorsturen naar de best afgestemde open modellen, zoals Nemotron 3 Ultra, of gebruikmaken van toonaangevende eigen modellen wanneer taken baat hebben bij hun unieke mogelijkheden. Zo zorgen we ervoor dat onze AI-assistenten met uitzonderlijke snelheid, efficiëntie en schaalbaarheid werken."

De open Nemotron 3-modellen stellen startups in staat om sneller AI-agenten te ontwikkelen en te verbeteren, en innovatie te versnellen van prototype tot implementatie in de bedrijfsomgeving. Bedrijven uit de portfolio van General Catalyst, Mayfield en Sierra Ventures onderzoeken Nemotron 3 om AI-teamgenoten te bouwen die de samenwerking tussen mens en AI ondersteunen.

"De open modelstack van NVIDIA en het NVIDIA Inception-programma bieden startende bedrijven de modellen, tools en een kosteneffectieve infrastructuur om te experimenteren, zich te onderscheiden en snel op te schalen", aldus Navin Chaddha, managing partner bij Mayfield. "Nemotron 3 geeft oprichters een voorsprong bij het bouwen van agentische AI-applicaties en AI-teamgenoten, en helpt hen te profiteren van de enorme geïnstalleerde basis van NVIDIA."

Nemotron 3 herdefinieert multi-agent AI met efficiëntie en nauwkeurigheid.

De Nemotron 3-familie van MoE-modellen omvat drie formaten:

Nemotron 3 Nano, een klein model met 30 miljard parameters dat tot 3 miljard parameters tegelijk activeert voor gerichte, zeer efficiënte taken.
Nemotron 3 Super, een zeer nauwkeurig redeneermodel met ongeveer 100 miljard parameters en tot 10 miljard actieve parameters per token, voor multi-agent toepassingen.
Nemotron 3 Ultra, een grote redeneermachine met ongeveer 500 miljard parameters en tot 50 miljard actieve parameters per token, voor complexe AI-toepassingen.

De Nemotron 3 Nano, die vandaag beschikbaar is, is het meest kostenefficiënte model op het gebied van rekenkracht. Het is geoptimaliseerd voor taken zoals software-debugging, content-samenvatting, AI-assistent-workflows en informatie-retrieval met lage inferentiekosten. Het model maakt gebruik van een unieke hybride MoE-architectuur voor winst in efficiëntie en schaalbaarheid.

Dit ontwerp behaalt tot wel 4x hogere token-doorvoer in vergelijking met Nemotron 2 Nano en reduceert de generatie van redeneertokens met maximaal 60%, waardoor de inferentiekosten aanzienlijk lager worden. Met een contextvenster van 1 miljoen tokens onthoudt Nemotron 3 Nano meer, waardoor het nauwkeuriger is en beter in staat is om informatie te verbinden tijdens lange taken met meerdere stappen.

Artificial Analysis, een onafhankelijke organisatie die AI-modellen vergelijkt, heeft het model als het meest open en efficiënte model van dezelfde omvang beoordeeld, met een toonaangevende nauwkeurigheid.

Nemotron 3 Super blinkt uit in toepassingen die vereisen dat veel agenten samenwerken om complexe taken met een lage latentie uit te voeren. Nemotron 3 Ultra fungeert als een geavanceerde redeneermachine voor AI-workflows die diepgaand onderzoek en strategische planning vereisen.

Nemotron 3 Super en Ultra maken gebruik van NVIDIA's uiterst efficiënte 4-bits NVFP4-trainingsformaat op de NVIDIA Blackwell-architectuur, waardoor de geheugenvereisten aanzienlijk worden verlaagd en de training wordt versneld. Deze efficiëntie maakt het mogelijk om grotere modellen te trainen op bestaande infrastructuur zonder dat dit ten koste gaat van de nauwkeurigheid in vergelijking met formaten met een hogere precisie.

Met de Nemotron 3-modellenreeks kunnen ontwikkelaars het open model kiezen dat perfect aansluit op hun specifieke workloads. Het model is schaalbaar van tientallen tot honderden agents en profiteert van snellere en nauwkeurigere langetermijnanalyses voor complexe workflows.

Nieuwe open tools en data voor het aanpassen van AI-agenten.

NVIDIA heeft ook een verzameling trainingsdatasets en geavanceerde reinforcement learning-bibliotheken uitgebracht die beschikbaar zijn voor iedereen die gespecialiseerde AI-agenten bouwt.

Drie biljoen tokens aan nieuwe Nemotron- datasets voor pre-training , post-training en reinforcement learning bieden de rijke voorbeelden van redeneren, coderen en workflows met meerdere stappen die nodig zijn om zeer capabele, domeinspecifieke agents te creëren. De Nemotron Agentic Safety Dataset biedt telemetriegegevens uit de praktijk om teams te helpen de veiligheid van complexe agentsystemen te evalueren en te verbeteren.

Om de ontwikkeling te versnellen, heeft NVIDIA de open-sourcebibliotheken NeMo Gym en NeMo RL uitgebracht . Deze bieden de trainingsomgevingen en de basis voor de nabewerking van Nemotron-modellen, samen met NeMo Evaluator om de veiligheid en prestaties van modellen te valideren. Alle tools en datasets zijn nu beschikbaar op GitHub en Hugging Face.

Nemotron 3 wordt ondersteund door LM Studio , llama.cpp, SGLang en vLLM . Daarnaast integreren Prime Intellect en Unsloth de kant-en-klare trainingsomgevingen van NeMo Gym rechtstreeks in hun workflows, waardoor teams sneller en gemakkelijker toegang krijgen tot krachtige trainingen met behulp van reinforcement learning.

Ga aan de slag met NVIDIA Open Models.

Nemotron 3 Nano is vanaf vandaag beschikbaar op Hugging Face en via inferentieserviceproviders zoals Baseten , DeepInfra , Fireworks , FriendliAI , OpenRouter en Together AI .

Nemotron wordt aangeboden op AI- en data-infrastructuurplatformen voor bedrijven, waaronder Couchbase, DataRobot, H2O.ai, JFrog, Lambda en UiPath. Voor klanten in de publieke cloud zal Nemotron 3 Nano beschikbaar zijn op AWS via Amazon Bedrock (serverloos) en binnenkort ook ondersteuning bieden op Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius , Nscale en Yotta.

Nemotron 3 Nano is beschikbaar als een NVIDIA NIM™-microservice voor veilige, schaalbare implementatie overal op door NVIDIA versnelde infrastructuur, voor maximale privacy en controle.

De Nemotron 3 Super en Ultra zullen naar verwachting in de eerste helft van 2026 verkrijgbaar zijn.

Persbericht NVIDIA: we onthullen Nemotron 3, een open AI-model ontwikkeld voor multi-agentsystemen

Recente blogposts

Opmerkingen

Back to Top