Wat kost de
DGX Spark?
Een DGX Spark staat er niet gratis. Hardware-afschrijving plus stroom onder load, samen, gespreid over de maand. Schuif de aannames en zie waar je uitkomt.
02 Aannames voor je eigen situatie
Hardware / maand €0 amortisatie van de Spark
Stroom / maand €0 170W onder load
Totaal / maand €0 hardware plus stroom
03 Hoe de getallen tot stand komen
De formule
kosten/maand = (hardware ÷ amortisatie) + (W ÷ 1000 × uren × kWh-prijs)
Twee posten, meer niet. Hardware lineair afgeschreven over de gekozen periode, stroom alleen tijdens de opgegeven on-load uren. Idle-uren rekenen we niet mee.
Aannames
- Stroom rekent met 170W onder vLLM-load. Max TDP ligt rond 240W, in de praktijk zit hij lager.
- Hardware is de Founders Edition NL ex BTW. Pas aan als je 'm tweedehands kocht, belastingvoordeel hebt of via een ander kanaal aanschafte.
- Util-aanname: stroom-kosten worden alleen tijdens de opgegeven uren gerekend. 24/7 op 100% load is meestal niet realistisch.
- Niet inbegrepen: internet, koeling, ruimte, jouw tijd om het te beheren. Dit is een floor, geen volledige business-case.
Wat dit getal je niet vertelt: of lokaal goedkoper is dan een cloud-API. Daarvoor moet je ook tokens-per-seconde meenemen, en die verschillen per model. Dat rekenen we hieronder uit, met de arena-throughput erbij.
04 Lokaal versus cloud
Wat kost een token echt
Per maand kost de Spark hetzelfde, of je hem nu vol draait of niet (zie de calculator hierboven, op 8 uur per werkdag). De prijs per token hangt dus af van hoeveel je erdoorheen duwt. Hieronder de € per 1M output-tokens voor een kantoor van 10 tot 25 man, naast wat dezelfde tokens in de cloud kosten.
De eerlijke conclusie: on-prem wint niet zomaar op prijs. Mistral Small op je eigen Spark kost meer per token dan Mistral's eigen EU-API, letterlijk hetzelfde model. Tegen GPT-5 mini win je wel. Maar de echte reden voor lokaal staat niet in deze tabel: je data blijft binnen en je valt niet onder de CLOUD Act. Kies on-prem om de jurisdictie, niet om een paar cent.
| Model | Precisie | €/1M, 10 man | €/1M, 25 man (piek) |
|---|---|---|---|
| Mistral Small | EU | €0,50 elk volume | |
| GPT-5 mini | VS, CLOUD Act | €1,76 elk volume | |
| Qwen-3.5 0.8B | BF16 | €0,18 | €0,18 |
| Qwen-3.5 2B | BF16 | €0,35 | €0,22 |
| Ministral-3 3B | BF16 | €0,33 | €0,34 |
| Nemotron-3-Nano 4B | BF16 | €0,59 | €0,42 |
| Nemotron-3-Nano 30B-A3B | NVFP4 | €0,68 | €0,45 |
| Ministral-3 8B | BF16 | €0,67 | €0,54 |
| Gemma-4 26B-A4B | NVFP4 | €0,72 | €0,60 |
| Nemotron-3-Nano 30B-A3B | FP8 | €0,98 | €0,61 |
| Qwen-3.6 35B-A3B | FP8 | €0,94 | €0,74 |
| Gemma-4 26B-A4B | BF16 + MTP | €0,91 | €0,76 |
| Gemma-4 26B-A4B | BF16 | €1,33 | €0,99 |
| Nemotron-3-Nano 30B-A3B | BF16 | €1,81 | €1,06 |
| Qwen-3.6 35B-A3B | BF16 | €1,64 | €1,24 |
| Mistral-Small 3.2 24B | NVFP4 | €1,39 | €1,44 |
| Nemotron-3-Super 120B-A12B | NVFP4 | €1,90 | €1,63 |
| Qwen-3.6 27B | FP8 | €2,08 | €1,65 |
| Gemma-4 31B | BF16 | €5,95 | €2,91 |
- Aanname: een kantoor van 10 tot 25 man dat de Spark 8 uur per werkdag echt op load houdt. Bursty gebruik betekent minder tokens per maand, dus een hogere prijs per token. Deze tabel is dus de gunstigste lezing voor on-prem.
- We vergelijken op output-tokens, want dat is wat we meten (decode). De cloud rekent daar nog input-tokens (de prompts) bovenop, die hier niet meetellen. De cloud is dus in werkelijkheid duurder dan deze tabel laat zien. De 10-man-cijfers zijn direct gemeten; de 25-man-piek is afgeleid uit de totale doorvoer van de piek-run maal het output-aandeel van het scenario.
- Alleen gelijkwaardige modellen zijn eerlijk te vergelijken. Een klein model is goedkoop per token maar levert ander werk. Het zuiverste punt is Mistral Small lokaal versus Mistral Small in de cloud: hetzelfde model, andere plek.
- De runs draaiden met prefix caching uit. Aan zou de lokale throughput verbeteren, en dus de prijs verlagen.
- Cloud-prijzen zijn output-tokens. Mistral publiceert in euro's, OpenAI's GPT-5 mini is omgerekend tegen $1 = €0,88 (2026-06-26). Bron: Mistral en OpenAI. GPT-5 mini als huidige generatie, het oudere GPT-4o mini is goedkoper. Mistral Small via de API is inmiddels Small 4, wij benchmarken 3.2 lokaal.
- Energie: bij 170W is stroom maar ~9% van de maandkost, de rest is hardware-afschrijving. On-prem is dus vooral een hardware-verhaal, geen energie-verhaal. Eén miljoen output-tokens van Gemma-4 NVFP4 kost ruwweg 258 Wh, een paar cent. Schatting op die vlakke 170W, want we meten stroom niet per model.