Welke spraakherkenning-motor is de beste?
Er is geen universeel beste — de keuze verandert per usecase, taal, audio-omgeving en privacy-eis. Voor real-time Nederlandstalig dictee scoort Deepgram in onze benchmarks vaak goed; voor diarization en samenvatting werkt AssemblyAI prettig; voor zorg- en overheidsklanten met EU-residency-eisen is Azure Speech regelmatig de winnaar; voor toepassingen waarbij audio echt niet mag versturen kiezen we voor on-device Apple Speech of Android SpeechRecognizer, of een self-hosted Whisper-model. Onze eerste stap is altijd een korte benchmark met jouw echte audio — niet een aanbeveling op basis van een leveranciers-folder.
Mogen we cloud-spraakherkenning gebruiken voor patiëntgegevens?
In principe wel, mits je een goede verwerkersovereenkomst hebt, audio binnen de EU blijft, sub-processors in lijn zijn met je AVG-beleid, en er een DPIA is uitgevoerd. Sommige zorginstellingen kiezen om bredere reden voor on-premise of dedicated-cloud — bijvoorbeeld bij bijzondere doelgroepen (psychiatrie, kindergeneeskunde, oncologie). We adviseren per traject wat past en werken samen met de FG van de instelling, koppelend aan de bestaande NEN 7510-controls.
Kan een spraakherkenning-app offline werken?
Ja. We bouwen offline-modus met Apple Speech (iOS), Android SpeechRecognizer (Android) of een lichter Whisper-model on-device. De nauwkeurigheid is iets minder dan cloud-STT voor lange opnames, maar in veel domeinen — korte dictee-fragmenten, voice-commando's, accessibility-bijschriften, juridisch overleg waarin audio het toestel niet mag verlaten — is dat de juiste keuze. We kunnen ook hybride werken: on-device als er geen verbinding is, cloud als die er wel is.
Hoe gaat de app om met meerdere sprekers?
Diarization is een aparte taak die bovenop spraakherkenning komt. Sommige motoren (AssemblyAI, Deepgram, Azure Speech) doen dat redelijk uit zichzelf. Voor vergaderingen, podcasts en consults bouwen we vaak een correctie-UI erbij waarin een gebruiker met één tap een mis-toegewezen spreker kan corrigeren. We meten diarization-kwaliteit apart van Word Error Rate in onze benchmarks.
Werkt spraakherkenning op vakjargon en afkortingen?
Niet uit zichzelf goed genoeg — dat is een van de redenen waarom een eigen app vaak loont in plaats van een generieke off-the-shelf-oplossing. We werken met domeinwoordenboeken (custom vocabularies) waarin we vaktermen, afkortingen, medicatienamen of juridische verwijzingen vooraf opnemen. Voor zwaardere toepassingen fine-tunen we een custom speech model in Azure Speech of trainen we een eigen Whisper-variant. Gebruikers verliezen het vertrouwen in de app als de termen waarop het in hun vak aankomt, structureel verkeerd worden weergegeven.
Hoe regelen jullie de AI Act voor onze spraakherkenning?
We doen vooraf een AI Act-classificatie: laag-risico (algemene transcriptie), beperkte transparantie-verplichting, of hoog-risico (spraakherkenning als input voor medische diagnose, juridische beslis-ondersteuning, HR-beoordelingen). Voor hoog-risico-toepassingen regelen we de verplichte risico-management-documentatie, datakwaliteits-eisen, transparantie naar de eindgebruiker en het menselijk-toezichts-mechanisme. We sluiten aan op een bestaand ISMS in plaats van iets te willen herinrichten.
Kunnen jullie koppelen aan ons EPD of DMS?
Ja. We hebben ervaring met HiX, Epic, ChipSoft, CGM en Cura aan EPD-kant, en met NetDocuments, iManage, Legalsense en SharePoint aan DMS-kant. De koppeling gaat typisch via een HL7-FHIR-interface voor zorg of een REST-API voor DMS. Voor CRM-koppeling werken we met Salesforce, HubSpot, Dynamics en Nederlandse alternatieven. Als jullie systeem exotisch of zelfgebouwd is, koppelen we tegen een eigen API — daar zijn we als bureau goed in.
Werken jullie samen met Suki, DeepScribe of Abridge?
We zien deze pakketten regelmatig in scribe-trajecten voorbijkomen. Sterke producten voor de Amerikaanse markt, maar in de Nederlandse zorgcontext met twee structurele uitdagingen: Nederlandstalige nauwkeurigheid is minder dan hun Engelstalige tegenhanger, en data-residency zit niet altijd waar Nederlandse zorginstellingen het willen hebben. Voor klanten waar het past koppelen we eraan; voor wie het niet past bouwen we de scribe-laag op maat met een EU-residente motor en NEN 7510-conforme architectuur.
Wie is eigenaar van de code, modellen en data?
Jij. We leveren de volledige source code, eigen-getrainde modellen, build-pipelines en deploy-scripts op. Audio en transcripten leven in jouw cloud of bij een hosting-partij van jouw keuze. Als je later met een ander bureau verder wilt of intern wilt overnemen, kan dat — er zit geen lock-in op de techniek. Wij verdienen aan goed werk dat blijft, niet aan klanten die vastzitten.
Wat bepaalt de kosten en doorlooptijd van zo'n app?
De grootste kostendrijvers zijn de complexiteit van het domein (algemene transcriptie versus diep geïntegreerde scribe-app), de keuze tussen cloud- en on-device modellen, het aantal sprekers en talen, en de compliance-laag die het domein vereist (een AI-Act-hoog-risico-app vraagt aanzienlijk meer documentatie en logging dan een laag-risico-notulen-app). We werken in sprints met vaste sprintbudgetten, zodat je per sprint kunt sturen op scope. Een richtgesprek geeft snel een goed beeld van de bandbreedte en realistische doorlooptijd.