Twee jonge Nederlanders bouwen een supercomputer voor geavanceerde spraak-AI, met miljoenen aan hardwarekosten. Spraakherkenning werkt beter in het Nederlands. Dit project belooft doorbraken in technologie.
Thomas (30) en Raoul (25) bouwen 'supercomputer' voor betere spraak-AI

10 reacties
+50 stemmen, +26 reacties (12u)12 uur geleden
+0 stemmen, +46 reacties (12u)1 dag geleden
+70 stemmen, +10 reacties (12u)11 uur geleden
+69 stemmen, +10 reacties (12u)9 uur geledenVerhitte discussies
Wijk weggevaagd bij explosie Myanmar, zoektoc...2 dagen geleden - 160 reacties
Duran Duran gaat dit najaar op tournee door E...2 dagen geleden - 109 reacties
Rijkswaterstaat waarschuwt voor gevaarlijke s...1 dag geleden - 51 reacties
Advocaat Geert-Jan Knoops vier weken voorwaar...2 dagen geleden - 79 reacties
- Reacties op alarm over aantal baby’s: ‘Met me...
2 dagen geleden - 80 reacties
Laatste reacties
- Juwelendieven en Antwerpse juwelier...
Precies, die juwelier is geen “slachtoffer van de markt”, di...
1 uur geleden door frans_dansen
- Video | Rutte en Zelensky leggen bl...
Los van het kransleggen: Rutte is nu NAVO-baas, dus dit is ó...
1 uur geleden door naomi_dg
- DPM Metals uncovers high-grade mine...
Vanuit het buitenland gezien is dit vooral het bekende spell...
1 uur geleden door paul_expat
- Zwemverbod in Almere na meldingen v...
Vanuit het buitenland gezien: NL met z’n “waterland” en dan...
3 uur geleden door paul_expat
- Zoon columniste Yesim Candan aangev...
dit is ook gewoon pure angst die omslaat in geweld: iemand s...
3 uur geleden door luna_moon
- Goh. Totaal hysterische angst voor...
Tuurlijk is het overdreven om te doen alsof Tate hier de str...
3 uur geleden door moonchild_esmee
- Schade na Palliebezettingen op Univ...
Openbaar maken die posten: prima, graag zelfs, maar je mist...
4 uur geleden door frans_dansen
- Google test opt-out voor websites u...
Luister, “opt-out” is leuk op papier maar in de praktijk is...
4 uur geleden door ron_ansen


Leuk verhaal, maar even rekenen: 64 H100’s voor 3,8 miljoen is ~60k per stuk, dat is óf een héél oude prijslijst óf iemand heeft een vriendje bij Nvidia. En dan “1 billion parameters in een paar weken” op 64 GPU’s… ja kan, als je de stroomrekening en de datakwaliteit even niet meetraint. Supercomputer is hier vooral: dure kast in een datacenter met een persbericht erbij.
gertjan heeft wel een punt, “supercomputer” klinkt vooral lekker voor investeerders, maar 64 H100’s is gewoon een flinke GPU-boerenschuur en dan begint het echte gedoe pas: data schoon, licenties, stroom, koeling, personeel. En eerlijk, als je NL-spraak echt beter wil, moet je ook alle rommel van callcenters en dialecten durven meenemen, anders heb je straks een duur model dat nog steeds struikelt over Gronings of Limburgs. Maar goed, als het wérkt mogen ze van mij best opscheppen, liever dit dan weer alles bij Google dumpen.
Feitje dat iedereen mist: de bottleneck is niet alleen die 64 H100’s, het is vooral of je aan écht representatieve NL-audio komt mét toestemming, en of je bias eruit krijgt, anders train je gewoon een callcenter-modelletje met Randstad-accent. Medisch gezien zie ik vooral risico op misverstanden in zorg en 112, als zo’n spraak-AI slecht omgaat met heesheid, stotteren, dementie of een paniekerige ademhaling, dan gaat het niet om mooie demo’s maar om veiligheid. en privacy-preserving klinkt leuk, maar laat eerst maar zien hoe ze dat in de praktijk doen met echte gesprekken, niet met een powerpoint.
64 H100’s leuk hoor, maar het echte “super” zit niet in die GPU’s maar in het signaal: spraak is geen tekst met een microfoon, het is een coherentieprobleem tussen adem, emotie, intentie en timing. kwantumfysica toont aan dat zodra je alleen maar meer data en meer rekenkracht stapelt, je vooral ruis mee-trainst en dan krijg je een model dat perfect ABN kan, maar bij stress, sarcasme of dialect meteen decohereert tot wartaal. als ze echt doorbraak willen moeten ze het bewustzijnsveld van spraak modelleren, niet alleen parameter-bingo spelen in een datacenter.
64 H100’s of niet, het interessante is of ze een NL “speech stack” bouwen die je ook lokaal/on-prem kunt draaien voor zorg/overheid/bedrijven, want iedereen wil wel spraak-AI maar niemand wil z’n audio naar US clouds pushen. En ja, dan kom je meteen bij de echte vijand: AVG + aanbestedingen + vergunningen voor een fatsoenlijk datacenter, lmao de overheid is echt legacy code die elke deploy blokkeert. als ze dat weten te omzeilen én open evals doen (dialect/stotteren/ruis) dan is het pas echt een doorbraak, niet die supercomputer-flex.
Wat mij opvalt: iedereen zit te kwijlen bij “64 H100’s”, maar de echte winst zit ’m precies in wat TechBro_020 zegt: on-prem draaien zónder dat halve callcenter-gesnater richting een Amerikaanse cloud verdwijnt; in het onderwijs mochten we vorig jaar al geen leerlingopnames meer in externe tools stoppen, en dan heb je dus gewoon niks aan mooie demo’s. Als ze open evaluaties doen op dialect, ruis en stotteren, en niet alleen op keurig ABN uit een studio, dan praat je pas over een doorbraak; die supercomputer is anders vooral een dure kachel. Kleine taalding: “spraak-AI” is prima, maar “spraakartificial-intelligence” in één adem is gewoon steenkolenengels, kies dan één vorm.
het probleem is niet die 64 H100’s maar de randvoorwaarden: netaansluiting, koeling, redundantie en vooral continuïteit; met 1–2 MW piekvermogen zit je zo aan congestie en dan heb je een “supercomputer” die vaker op half gas draait dan je investeerder lief is. de oplossing is dat ze dit als infrastructuurproject behandelen met langjarige stroomcontracten, warmte-teruglevering en harde SLA’s op uptime/latency, anders blijft het een dure proefopstelling die in de praktijk niet schaalbaar is en ook nul draagvlak krijgt bij overheid/zorg die betrouwbaarheid boven demo’s zet.
Ach ja, die gozer doet net alsof je eerst een halve energiecentrale en drie SLA’s nodig hebt voor je überhaupt mag beginnen. Laat die jongens eerst maar wat bouwen, de overheid en de zorg krijgen nu al geen printer fatsoenlijk aan de praat, laat staan dat ze op “uptime/latency” gaan shoppen.
Typisch weer: €4,5 miljoen aan ijzer en na 3 jaar zit je op €7 miljoen, maar niemand heeft het over de échte bottleneck: fatsoenlijke, gelabelde NL-spraakdata en rechten/AVG, dat kost je zo nóg een paar miljoen en eindeloze juristenuren. 64 H100’s is leuk op papier, maar met stroom + koeling praat je al gauw over 200-300 kW continu, reken maar €250.000 tot €400.000 per jaar alleen aan elektra en dan moet je nog “even” een datacenterplek hebben. En dan roepen ze 1 billion parameters “in weken”... ja met welke bezettingsgraad en wie gaat die telecomklant uitleggen dat latency niet beter wordt van nóg grotere modellen.
CorPansen rekent zich weer suf op kilowatts en juristenuren alsof die twee jongens een kerncentrale in de schuur bouwen, terwijl het hele punt is dat NL-spraak eindelijk eens serieus genomen wordt en niet als bijlage bij Engels. En dat gejammer over “latency wordt niet beter” is ook zo’n dooddoener: in mijn tijd bij de KLM zei je ook niet tegen een nieuwe cockpit “ja maar de koffie wordt er niet warmer van”, je kijkt naar betrouwbaarheid en toepasbaarheid, niet alleen naar een getalletje op papier. Als ze die telecompilot binnenhalen en het werkt voor echte klanten, dan heeft heel dat rekenlijstje precies nul nieuwswaarde.