Wat kost de
DGX Spark?

Een DGX Spark staat er niet gratis. Hardware-afschrijving plus stroom onder load, samen, gespreid over de maand. Schuif de aannames en zie waar je uitkomt.

Hardware / maand €0 amortisatie van de Spark
Stroom / maand €0 170W onder load
Totaal / maand €0 hardware plus stroom

De formule

kosten/maand = (hardware ÷ amortisatie) + (W ÷ 1000 × uren × kWh-prijs)

Twee posten, meer niet. Hardware lineair afgeschreven over de gekozen periode, stroom alleen tijdens de opgegeven on-load uren. Idle-uren rekenen we niet mee.

Aannames

  • Stroom rekent met 170W onder vLLM-load. Max TDP ligt rond 240W, in de praktijk zit hij lager.
  • Hardware is de Founders Edition NL ex BTW. Pas aan als je 'm tweedehands kocht, belastingvoordeel hebt of via een ander kanaal aanschafte.
  • Util-aanname: stroom-kosten worden alleen tijdens de opgegeven uren gerekend. 24/7 op 100% load is meestal niet realistisch.
  • Niet inbegrepen: internet, koeling, ruimte, jouw tijd om het te beheren. Dit is een floor, geen volledige business-case.
Wat dit getal je niet vertelt: of lokaal goedkoper is dan een cloud-API. Daarvoor moet je ook tokens-per-seconde meenemen, en die verschillen per model. Dat rekenen we hieronder uit, met de arena-throughput erbij.

Wat kost een token echt

Per maand kost de Spark hetzelfde, of je hem nu vol draait of niet (zie de calculator hierboven, op 8 uur per werkdag). De prijs per token hangt dus af van hoeveel je erdoorheen duwt. Hieronder de € per 1M output-tokens voor een kantoor van 10 tot 25 man, naast wat dezelfde tokens in de cloud kosten.

De eerlijke conclusie: on-prem wint niet zomaar op prijs. Mistral Small op je eigen Spark kost meer per token dan Mistral's eigen EU-API, letterlijk hetzelfde model. Tegen GPT-5 mini win je wel. Maar de echte reden voor lokaal staat niet in deze tabel: je data blijft binnen en je valt niet onder de CLOUD Act. Kies on-prem om de jurisdictie, niet om een paar cent.
Model Precisie €/1M, 10 man €/1M, 25 man (piek)
Mistral Small EU €0,50 elk volume
GPT-5 mini VS, CLOUD Act €1,76 elk volume
Qwen-3.5 0.8B BF16 €0,18 €0,18
Qwen-3.5 2B BF16 €0,35 €0,22
Ministral-3 3B BF16 €0,33 €0,34
Nemotron-3-Nano 4B BF16 €0,59 €0,42
Nemotron-3-Nano 30B-A3B NVFP4 €0,68 €0,45
Ministral-3 8B BF16 €0,67 €0,54
Gemma-4 26B-A4B NVFP4 €0,72 €0,60
Nemotron-3-Nano 30B-A3B FP8 €0,98 €0,61
Qwen-3.6 35B-A3B FP8 €0,94 €0,74
Gemma-4 26B-A4B BF16 + MTP €0,91 €0,76
Gemma-4 26B-A4B BF16 €1,33 €0,99
Nemotron-3-Nano 30B-A3B BF16 €1,81 €1,06
Qwen-3.6 35B-A3B BF16 €1,64 €1,24
Mistral-Small 3.2 24B NVFP4 €1,39 €1,44
Nemotron-3-Super 120B-A12B NVFP4 €1,90 €1,63
Qwen-3.6 27B FP8 €2,08 €1,65
Gemma-4 31B BF16 €5,95 €2,91
  • Aanname: een kantoor van 10 tot 25 man dat de Spark 8 uur per werkdag echt op load houdt. Bursty gebruik betekent minder tokens per maand, dus een hogere prijs per token. Deze tabel is dus de gunstigste lezing voor on-prem.
  • We vergelijken op output-tokens, want dat is wat we meten (decode). De cloud rekent daar nog input-tokens (de prompts) bovenop, die hier niet meetellen. De cloud is dus in werkelijkheid duurder dan deze tabel laat zien. De 10-man-cijfers zijn direct gemeten; de 25-man-piek is afgeleid uit de totale doorvoer van de piek-run maal het output-aandeel van het scenario.
  • Alleen gelijkwaardige modellen zijn eerlijk te vergelijken. Een klein model is goedkoop per token maar levert ander werk. Het zuiverste punt is Mistral Small lokaal versus Mistral Small in de cloud: hetzelfde model, andere plek.
  • De runs draaiden met prefix caching uit. Aan zou de lokale throughput verbeteren, en dus de prijs verlagen.
  • Cloud-prijzen zijn output-tokens. Mistral publiceert in euro's, OpenAI's GPT-5 mini is omgerekend tegen $1 = €0,88 (2026-06-26). Bron: Mistral en OpenAI. GPT-5 mini als huidige generatie, het oudere GPT-4o mini is goedkoper. Mistral Small via de API is inmiddels Small 4, wij benchmarken 3.2 lokaal.
  • Energie: bij 170W is stroom maar ~9% van de maandkost, de rest is hardware-afschrijving. On-prem is dus vooral een hardware-verhaal, geen energie-verhaal. Eén miljoen output-tokens van Gemma-4 NVFP4 kost ruwweg 258 Wh, een paar cent. Schatting op die vlakke 170W, want we meten stroom niet per model.
Esc