Dienst · Software-ontwikkeling

Computer vision toepassingen laten maken.

Maatwerk computer vision die echt werkt in uw productieomgeving, magazijn, winkel of veld. Van object-detectie en beeldherkenning tot OCR, segmentatie en anomalie-detectie — gebouwd als een integratie in uw bestaande software, niet als losstaande proof-of-concept.

Object-detectieBeeldherkenningOCREdge & cloud

Computer vision is AI op beelden — en het werkt al jaren in productie.

Camera's zien tegenwoordig meer dan mensen kunnen bijhouden. Op een assembly-line passeert in een uur meer product dan een QA-medewerker visueel kan controleren. In een magazijn worden duizenden labels gescand. Op een bouwplaats moet altijd iemand kijken of helmen worden gedragen. Computer vision (CV) automatiseert dat soort taken — niet als magie, maar als een betrouwbaar onderdeel van uw operationele software.

Wij bouwen CV-toepassingen die direct landen in uw bestaande stack: een YOLO-model dat draait op een edge-device naast de productielijn, een OCR-pipeline die facturen leest en de regels in uw boekhouding plaatst, of een classificatie-model dat schadeclaims pre-filtert voor uw verzekeringsbackoffice. Geen losse "AI-pilot" die nooit live komt — wel een werkende koppeling met uw ERP, WMS of CRM. Voor strategische voorbereiding helpen we ook bij een bredere AI-strategie waarin CV één van de toepassingen is.

De afgelopen jaren is het gereedschap snel volwassen geworden. Pre-trained modellen als YOLO, Detectron2, Segment Anything en de Vision Transformers hebben een groot deel van het zware werk weggehaald: u hoeft geen miljoenen beelden meer te labelen, maar een paar honderd tot een paar duizend per klasse. Tegelijk zijn edge-devices krachtig genoeg geworden om diezelfde modellen lokaal te draaien — naast de productielijn, in een drone of in een slagboom-installatie. En multi-modal LLM's zoals GPT-4o-vision, Claude Vision en Gemini Vision geven u een nieuwe kortere route voor zero-shot- en few-shot-taken waar u eerder een eigen model voor zou trainen. Welke route past, hangt af van uw data, uw latency-eisen, uw privacy-context en de business case eromheen — dat is precies waar het eerste gesprek over gaat.

Drie typen computer-vision-trajecten.

Afhankelijk van wat u wilt herkennen, hoe kritisch het is en of bestaande modellen voldoen. We adviseren in het eerste gesprek welk type past.

Compact traject · vast sprintbudget

Cloud-API-integratie met een bestaand model

Voor standaard taken — algemene object-detectie, OCR op reguliere documenten, gezichts-blurring voor AVG — gebruiken we Google Vision, Azure Computer Vision, AWS Rekognition of een open-source pre-trained model. Snelle implementatie, geen eigen training-set nodig, betalen per call.

Google VisionAzure CVOCRAPI-koppeling
Middelgroot traject · vast sprintbudget

Custom-model op uw eigen data

Wanneer u iets specifieks moet herkennen — uw eigen producten, defecten die niemand anders ziet, branchespecifieke documenten — fine-tunen we een pre-trained model (YOLOv8, Detectron2, Vision Transformer) op uw beeldmateriaal. Inclusief labelling-traject, training-pipeline en inference-service.

YOLOv8/v10Fine-tuningLabel StudioPyTorch
Groter traject · vast sprintbudget

Edge-deployment of real-time video-pipeline

Voor toepassingen met lage-latency-eisen — live productie-inspectie, perimeter-bewaking, voertuig-tracking — draait het model op een edge-device (NVIDIA Jetson, Google Coral, Hailo) of in een real-time video-pipeline. We bouwen de hele stack: capture, pre-processing, inference, post-processing en dashboard.

NVIDIA JetsonCoreML / TFLiteByteTrackReal-time video

Wat u krijgt aan het einde.

Een werkend CV-systeem dat u zelf kunt onderhouden, plus alles eromheen om verder te bouwen.

  • Het getrainde model + inference-serviceEen productieklaar model (PyTorch, ONNX of CoreML) plus de service die het beelden voert en resultaten teruggeeft via REST of message-queue.
  • Integratie met uw softwareKoppeling met uw bestaande ERP, WMS, MES, CRM of camerasysteem — zodat herkende objecten, OCR-output of anomalie-flags direct in de juiste workflow landen.
  • Trainingsdata + labelsDe gelabelde dataset in een open formaat (COCO, YOLO, Pascal VOC) zodat u zelf kunt hertrainen of een ander team kan overnemen.
  • Training-pipeline + hertrain-protocolEen reproduceerbare pipeline (Weights & Biases of MLflow) zodat u bij modeldrift opnieuw kunt trainen zonder met ons te bellen.
  • Monitoring en evaluatieDashboards voor precision, recall en confusion-matrix in productie, plus drift-alerts wanneer de input-distributie verandert.
  • Documentatie en beheer-contract (optioneel)Architectuur-overzicht, AVG-/AI Act-dossier waar relevant, en doorlopend beheer voor security-patches en model-updates.

Use-cases die wij in de praktijk bouwen.

Computer vision raakt veel sectoren. Hieronder de scenario's waarin we klanten begeleiden — herkent u er één, dan praten we graag verder.

Productie

Kwaliteits- en defect-detectie

Camera's boven de assembly-line detecteren krassen, deuken, ontbrekende onderdelen of verkeerde kleur. Een YOLO- of anomalie-detectiemodel (PatchCore, PaDiM) markeert defecte units zodat ze automatisch uitgesorteerd worden voor uw QA-team het zelfs ziet.

Logistiek

Label-OCR en voorraadtelling

Pakketten en pallets door uw magazijn, labels en barcodes uit gehavende dozen, en automatische telling van vakken op stellingen. We combineren OCR (PaddleOCR, Google Vision) met object-detectie en koppelen het aan uw WMS.

Verzekering & vastgoed

Foto-schadeanalyse

Een claimant uploadt een foto, een classificatiemodel beoordeelt schadetype en ernst, en de claim wordt voorgesorteerd. Hetzelfde patroon werkt voor vastgoed-inspecties, drone-foto's en pre-acceptatie. Past goed bij custom LLM-integraties waarin tekst en beeld samen worden geanalyseerd.

Retail & agro

Shelf-monitoring en gewas-analyse

Schap-camera's herkennen out-of-stock-situaties en planogram-afwijkingen. In de agro doen we vergelijkbaar werk met drone-beelden: gewas-stress, fruit-rijpheid en aantallen vee in een weide — segmentatie op satelliet- of dronefoto.

Bouw & veiligheid

PPE- en incident-detectie

Helm-, hesje- en veiligheidsbril-detectie op bouwplaatsen, gecombineerd met perimeter-bewaking. We werken alleen aan toepassingen die ethisch en juridisch verantwoord zijn — geen biometric mass-surveillance, geen emotion-recognition, wel veiligheid in afgebakende contexten.

Mobiliteit

Kenteken- en voertuig-herkenning

ANPR voor parkeerterreinen, laadpalen of slagbomen. Voertuig-tracking voor verkeersanalyse en bezetting. Kenteken-data is persoonsgegeven onder de AVG — daar bouwen we de juiste retentie- en bewaartermijnen in.

Zorg

Medisch-beeld-analyse

Voor toepassingen rond medische beeldvorming werken we alleen via een MDR-gecertificeerd pad — vaak samen met een medisch-device-partner. Voor niet-diagnostische taken (workflow-ondersteuning, anonimisatie, beeldroutering) bouwen we zelf onder NEN 7510-eisen.

OCR & documenten

Factuur-, paspoort- en formulier-OCR

Tekst en gestructureerde data uit foto's of scans halen, met validatie tegen uw masterdata. We combineren PaddleOCR of Tesseract met multi-modal LLM's voor de moeilijke randgevallen waar regel-gebaseerde OCR vastloopt.

Nog niet zeker over een groot traject?

Test je idee eerst — werkend prototype in 1 dag

Met OneDayBuild maken we je idee in één dag tastbaar voor €950, zodat je weet of verdere ontwikkeling de investering waard is. Besluit je door te gaan met de volledige bouw? Dan verrekenen we de kosten volledig.

Bekijk OneDayBuild →

Tech-stack waarmee we werken.

Een korte rondleiding door de modellen, frameworks en deployment-targets die we in de praktijk inzetten. We kiezen per project — geen one-size-fits-all-stack.

Modellen

Detectie, segmentatie en classificatie

YOLOv8, YOLOv9 en YOLOv10 voor real-time detectie. Detectron2 en MMDetection voor zwaardere taken. Segment Anything (SAM) voor pixel-precieze grenzen. Vision Transformers (ViT, DINOv2) waar transformer-architectuur voordeel geeft.

Multi-modal LLM's

GPT-4o, Claude Vision, Gemini Vision

Voor zero-shot-taken, complexe redenering op beelden of waar tekst en beeld samen moeten worden geanalyseerd. Vaak een snelle route om te valideren of CV überhaupt waarde toevoegt voordat we een eigen model trainen.

Frameworks & tooling

PyTorch, ONNX, OpenCV

PyTorch als trainings-framework, ONNX voor cross-platform export, OpenCV voor pre- en post-processing. Tracking met SORT, ByteTrack of DeepSORT. Anomalie-detectie met PatchCore of PaDiM voor industriële inspectie.

Deployment

Cloud, edge en on-device

Cloud-GPU's voor batch en training, NVIDIA Jetson en Google Coral voor edge, CoreML en TFLite voor mobile en on-device. Inference verpakt als REST-, gRPC- of WebSocket-service, geschikt voor zowel real-time als batch.

Datalabelling & MLOps

Label Studio, CVAT, V7

Voor het labellen werken we met Label Studio, CVAT of V7. Experimenten en model-versies tracken we in Weights & Biases of MLflow. CI/CD-pipelines voor training en deployment, plus monitoring op precision, recall en drift.

Synthetic data

Stable Diffusion en 3D-renderers

Wanneer u te weinig productie-beelden hebt, genereren we synthetic data — Stable Diffusion voor variatie, of een 3D-renderer voor pixel-precieze labels. Vaak een belangrijk verschil tussen "het werkt op de demo" en "het werkt in productie".

Hoe een computer-vision-traject loopt.

1

Use-case & haalbaarheid

Een gesprek waarin we de use-case scherp krijgen: wat moet er herkend worden, hoe vaak, hoe snel, en met welke nauwkeurigheid is het waardevol? Vaak doen we een korte feasibility-scan om te bepalen of een bestaand cloud-model voldoet of dat training nodig is.

2

Data-verzameling en labelling

Vrijwel elk CV-traject staat of valt bij data. Wij helpen bij het verzamelen van representatieve beelden, kiezen het juiste labelling-platform (Label Studio, CVAT, V7) en spreken een acceptatiecriterium af voor de dataset-kwaliteit.

3

Modeltraining en evaluatie

We fine-tunen een pre-trained backbone op uw data, tracken experimenten in Weights & Biases of MLflow en valideren tegen een hold-out-set. U krijgt confusion-matrices, precision/recall-grafieken en concrete voorbeelden van wat het model wel en niet ziet — zodat u weet wat u koopt.

4

Integratie en deployment

Het model wordt verpakt als inference-service (REST, gRPC of een geconverteerd CoreML/TFLite-bestand voor edge) en gekoppeld aan uw bestaande software. We werken in sprints, leveren elke twee weken iets dat u kunt testen, en bouwen monitoring in vanaf dag één.

5

Productie en doorontwikkeling

Na livegang volgt monitoring op modeldrift, periodieke hertraining op nieuwe data en — als u dat wilt — een beheercontract waaronder we het model meegroeien met uw operatie.

Veelgestelde vragen.

Wat opdrachtgevers meestal willen weten voor we beginnen.

Hoe kan ik mijn softwareontwikkeling integreren met computer vision?
Vrijwel altijd via een aparte inference-service die uw bestaande applicatie aanroept. Uw software stuurt een beeld (of streamt frames), de service stuurt een gestructureerde response terug met objecten, bounding-boxes, confidence-scores of OCR-tekst. Voor real-time scenario's gebruiken we message-queues of WebRTC; voor batch werkt een eenvoudige REST-API. Het CV-stuk wordt zo een normaal subsysteem in uw architectuur — niet iets exotisch. We koppelen het in de praktijk al aan ERP-, WMS-, CRM- en MES-systemen en kunnen ook werken vanuit een bredere AI-agent-architectuur waarin meerdere modellen samenwerken.
Wat zijn de meest voorkomende object-detectie-toepassingen?
Object-detectie vindt objecten in een beeld plus hun positie (bounding-box). Concrete toepassingen die we vaak bouwen: defect-detectie op productielijnen, pakket- en pallet-detectie in magazijnen, helm- en PPE-detectie op bouwplaatsen, schap-monitoring in retail, voertuig- en kenteken-detectie, en dier-/plant-detectie voor agro. Wij werken meestal met YOLOv8 of YOLOv10 voor snelheid, Detectron2 voor zwaardere taken, en DETR-varianten waar transformer-architectuur voordeel geeft.
Wat is het verschil tussen beeldherkenning, classificatie en object-detectie?
Beeldherkenning is de paraplu-term. Classificatie geeft één label aan een heel beeld ("dit is een defect onderdeel"). Object-detectie vindt meerdere objecten in een beeld en geeft hun locatie ("twee krassen op deze positie, één deuk daar"). Segmentatie gaat een stap verder en geeft pixel-precieze grenzen. Welke variant u nodig heeft hangt af van de use-case: voor "is dit kapot of niet" volstaat classificatie, voor "waar zit het defect" hebt u object-detectie nodig.
Cloud-API of een eigen getraind model?
Voor standaard taken — algemene OCR, gezichts-blurring, generieke object-detectie — werken cloud-API's van Google, Azure of AWS prima en u betaalt per call. Voor specifieke domeinen (uw eigen producten, uw eigen defecten, uw eigen documenten) presteren generieke cloud-modellen vaak te slecht en is een eigen fine-tuned model nodig. We starten meestal met een cloud-API om de business case te valideren en stappen pas over op custom als de cijfers daarom vragen.
Hoeveel trainingsdata heb ik nodig?
Met pre-trained modellen volstaat vaak een paar honderd tot een paar duizend gelabelde voorbeelden per klasse. Bij goed onderscheidende klassen zelfs minder; bij subtiele verschillen of veel klassen meer. Augmentatie en synthetic data (gegenereerd met Stable Diffusion of een 3D-renderer) kunnen helpen om een kleinere dataset op te plussen. In het feasibility-gesprek geven we een onderbouwde inschatting voor uw specifieke probleem.
Edge of cloud — waar draait het model?
Cloud is eenvoudig, schaalbaar en goedkoop in onderhoud, maar voegt latency toe en stuurt beelden over het netwerk. Edge-inference op NVIDIA Jetson, Google Coral of Hailo is sneller, werkt offline, en houdt beelden lokaal — belangrijk wanneer privacy of bandbreedte een rol speelt. Voor real-time productie-inspectie kiezen we meestal edge, voor batch-analyse cloud. Een hybride opzet kan ook: edge voor inference, cloud voor monitoring en hertraining.
Hoe zit het met de AI Act en de AVG voor computer vision?
CV-toepassingen die personen identificeren of categoriseren vallen onder strenge regels. Real-time biometrische identificatie in de openbare ruimte, emotion-recognition op werkvloeren of scholen en predictive-policing zijn onder de AI Act ofwel verboden of als hoog-risico geclassificeerd. Gezichten en kentekens zijn persoonsgegevens onder de AVG en vereisen een rechtsgrondslag, retentie-beleid en vaak een DPIA. Wij doen geen biometrische identificatie of emotion-recognition zonder gedegen juridisch traject — voor PPE-detectie, defect-inspectie of voorraadtelling speelt dit niet of nauwelijks.
Wat bepaalt de kosten van een CV-traject?
De grootste kostenposten zijn datalabelling, modeltraining (vooral GPU-tijd bij grotere modellen) en integratie met uw bestaande systemen. Een cloud-API-integratie op een gestandaardiseerde taak is een compact traject; een edge-deployment met eigen training en real-time video-pipeline is een traject van meerdere sprints. We werken in vaste sprintbudgetten zodat u na elke sprint kunt herijken.
Werken jullie alleen aan ethisch verantwoorde CV?
Ja. Geen mass-surveillance, geen emotion-recognition, geen predictive-policing, geen gezichts-identificatie zonder expliciete rechtsgrondslag en DPIA. Wel: kwaliteits-inspectie, voorraadtelling, OCR, PPE-detectie, gewas-analyse, schadeanalyse op verzekeringen, en vergelijkbare functionele toepassingen. Bij twijfel doen we vooraf een AI Act-toets — past het binnen de kaders, dan bouwen we; past het niet, dan zeggen we dat eerlijk. Zie ook onze pagina over enterprise AI-implementatie waar dezelfde governance-aanpak terugkomt.

Praat met ons over jouw computer-vision-toepassing.

Een kennismaking van een half uur, vrijblijvend. We luisteren naar de use-case, vragen naar uw data en geven richting over haalbaarheid, aanpak en welke modellen passen. Past het in een breder AI-landschap, dan trekken we de lijn door naar generatieve AI-oplossingen of een bredere strategie.

Edit Content