In deze nieuwe blog leg ik je meer uit over beeldherkenning, ook wel computer vision genoemd. Computer vision maakt het mogelijk om op basis van video objecten te herkennen, te volgen en in combinatie met AI te voorspellen wat er gaat gebeuren. Denk hierbij bijvoorbeeld aan de zelfrijdende auto. Maar er is veel meer mogelijk. Er kunnen zelfs compleet nieuwe bedrijfsmodellen rondom dit concept gebouwd worden.
Computer vision: de basis.
Om computer vision te gebruiken, heb je een aantal essentials nodig. Je hebt er in ieder geval altijd een camera voor nodig die iets registreert. Denk aan camera’s in de stad, onder een drone, je webcam of een camera met een specifiek doel zoals de achteruitrijcamera in je auto. Daarna moeten die beelden geanalyseerd worden en moet hieruit nieuwe informatie gegenereerd worden. Daar komt in veel gevallen Artifical Intelligence bij kijken.
Toepassingen hiervan kennen we waarschijnlijk wel uit films en van tv. Neem bijvoorbeeld de door mijzelf bekroonde tv-serie Person of Interest. Met camerabeelden (en geluid) analyseert een supercomputer (The Machine) of er binnenkort een moord plaats gaat vinden en wie daarbij betrokken is. Deze informatie wordt gedeeld met een speciaal team dat de moord moet zien te voorkomen. Helaas weet The Machine niet van tevoren of die persoon de moordenaar is of juist vermoord gaat worden. Prachtig ingrediënt voor een spannende serie, maar veel interessanter is de ontwikkeling die de AI van The Machine doormaakt. Hij begint als een domme machine en geeft in het begin vaak de verkeerde resultaten, wat weer grote gevolgen kan hebben. Daarom wordt er vaak opnieuw gestart met het programmeren van de AI, net zo lang tot de resultaten echt kloppen.
Je moet dus veel tijd stoppen in het trainen van de AI. Hieronder zie je een plaatje van mezelf waarin hij mij als een persoon en het object dat ik vast heb als een boek herkent. De getallen erachter laten de zekerheidsmarge zien.
Dit objectherkenningsprogramma is getraind om deze, en nog vele andere objecten te herkennen. Stel dat je zelf een applicatie met objectherkenning wil bouwen, dan zijn daar ondertussen veel bedrijven voor die dat voor je aanbieden met kant-en-klare objecten erin. Ook kan je via internet complete databases met bestaande objecten gebruiken.
Computer vision in de praktijk.
Laten we beginnen met 3 leuke computer vision toepassingen die nu al in het bedrijfsleven terug te vinden zijn. 2 ervan zijn voorbeelden uit de auto-industrie en 1 wordt door de brandweer ingezet.
Omgevingsbewuste auto’s.
Moderne auto’s zijn in staat om botsingen te voorkomen. Dit doen ze door op tijd af te remmen als een voorganger plotseling op de rem trapt of er een voetganger oversteekt. De traditionele software in een auto is vooral gebaseerd op radartechnologie die continu de afstand tussen de voorganger en jezelf meet. Met computer vision hou je de omgeving in de gaten, zoals fietsers, wandelaars en verkeerslichten. Op basis hiervan kan het gedrag van je voorligger voorspellen. Ook stelt computer vision de auto in staat om naar de bestuurder te kijken en te detecteren of diegene moe is of op de telefoon bezig is. Dit zorgt voor extra veiligheid. Als de auto vervolgens ook in staat is in te grijpen, zou deelnemen aan het verkeer nog veel veiliger worden. Deze oplossing is belangrijk voor autofabrikanten, maar je kan het natuurlijk ook in fietsen of andere voertuigen toepassen.
Autoschade registreren én herstellen.
Vroeger moest je bij autoschade een heel formulier invullen. Tegenwoordig vinden we het al heel hip als je alleen nog maar foto’s hoeft te uploaden in een app. De volgende stap is dat je met AI niet alleen de schade op de foto herkent en meteen een inschatting maakt van de kosten om het te herstellen, maar ook suggesties krijgt over wat de beste methode is om het te herstellen. Dit kan ook nuttig zijn bij aardbevingsschade of bij forensisch bewijs bij een misdaad.
Rook detecterende drones.
Vroeger moest de brandweer op wachttorens staan om rook te signaleren. Later zijn ze dit met vliegtuigen gaan doen. En tegenwoordig worden steeds vaker drones ingezet. Deze drones kunnen met hun camera’s op grote afstand detecteren of er ergens rookontwikkeling ontstaat. En vervolgens kunnen ze de brandweer informeren over de precieze locatie van die brand.
Bovenstaande 3 voorbeelden zijn allemaal verbeteringen van bestaande processen. Hetzelfde zagen we al eerder bij de voice assistenten, verbeteringen die de volgende stap zijn in een lange rij van innovaties. Wat hier wel opvalt, is dat de ontwikkelaars van deze technologie nieuwe leveranciers zijn voor hun afnemers en daarmee vooral disruptief werken op hun traditionele leveranciers.
Wat kan ik hier als ondernemer mee?
Wat betekent deze ontwikkeling voor je bedrijf? Hoe pas je dit toe? Ik weet zeker dat er voor elk bedrijf, in elke sector wel een toepassing voor computer vision te verzinnen valt. Het kan menselijk werk aan de lopende band overnemen. Bijvoorbeeld bij het egaliseren van de bodem, voordat de straatmakerrobot de klinkers erin legt. Of in het magazijn waar automatisch de voorraad geteld kan worden.
Wat betekent het voor je eigen dienstverlening naar je klanten? Je moet als ondernemer nadenken over hoe je je product of dienst met computer vision kan verbeteren. Laat ik eens binnen de context van Odido kijken.
Inspecterende drones.
Een belangrijk onderdeel van onze dienstverlening is natuurlijk ons mobiele netwerk. De antennes hangen op grote hoogte in masten en staan boven op gebouwen. Onderhoud en inspectie is daarmee gevaarlijk werk – we zetten hier vaak alpinisten voor in. Met een drone die automatisch afwijkingen constateert en doorgeeft, zou het leven van onze onderhoudsleverancier een stuk makkelijker zijn. Dit kan je dan ook eenvoudig toepassen op alle inspectietaken op hoogte, op zee of andere moeilijk te bereiken locaties. Het enige dat je moet doen is de AI goed trainen op afwijkingen die vervolgens automatisch herkend worden.
Lijntechnologie: van het voetbalveld naar de snelweg.
Odido is de trotse hoofdsponsor van FC Utrecht en sport is natuurlijk een mooie bron van data-analyse. Je kent de voorbeelden van de lijntechnologie uit het tennis of voetbal. Die bepaalt of een bal op, voor of over de lijn is. Maar je visualiseert er ook supersnel data mee, zoals hoe hard een schot was of hoeveel afstand de bal heeft afgelegd. Als je dat zou toepassen in het verkeer, meet je eenvoudig de snelheid van auto’s of de afstand tussen auto’s of een combinatie van die 2. Daarmee spoor je snel onveilig gedrag op, maar je kan ook automatisch de snelwegborden inzetten. In de tuinbouw kan je in rozensorteermachines bepalen wat de maximale sorteersnelheid is, zonder dat de bloem afbreekt.
Zonder scannen je boodschappen doen.
Wij verkopen onze producten niet alleen online, maar je kan ook nog fysieke winkels bezoeken. We verkopen geen pindakaas of flesjes cola, maar met computer vision is het mogelijk om bezoekers zonder scanner hun boodschappen te laten doen. Doordat alle artikelen in de supermarkt herkend worden en ze een bekende plek hebben, herkent de computer dat je de boodschappen in je karretje stopt. Het stuurt daarna een update naar het lijstje in je supermarktapp. Bij de kassa scan je eenvoudig je telefoon en reken je af. Als je dit concept verder zou toepassen bij de klassieke automatiek, dan kan je een frikandel of eierbal in elk laatje leggen. Want de computer herkent wat de klant pakt. Ook werkt dit niet alleen in supermarkten, maar in alle zelfbedieningsretail zoals bouwmarkten en tuincentra. Buiten de retail zou het kunnen werken in buffetrestaurants om te kijken hoeveel je nou eigenlijk opeet. Een andere toepassing kan zijn op een afvalsorteercentrum, waarbij je afval herkend wordt, het gewicht ervan inschat en je op basis daarvan moet afrekenen.
De gevaren van computer vision.
Met computer vision herken je dus makkelijk objecten, maar er is nog meer mogelijk. Je kan ook mensen herkennen en zelfs hun gedrag ermee vaststellen. Je slimme deurbel herkent tegenwoordig wie er voor de deur staat en of dat iemand is die je kent, of dat het toch die bezorger van DHL is. Je kan bewegingen tracken, maar ook afwijkingen van bepaald gedrag herkennen. De mogelijkheden zijn eindeloos en daar ligt ook een deel van het gevaar. Net als bij elke andere AI, bepaalt de ontwikkelaar eerst de parameters waarnaar gekeken wordt. Vervolgens is het aan de gebruiker hoe hij met die informatie omgaat.
Zo hingen er bij de Universiteit van Leiden camera’s. Die camera’s telden studenten die binnenkwamen en zich in een collegezaal bevonden. Maar de studenten dachten dat de camera’s meer konden, namelijk het herkennen van het geslacht en of iemand wel of niet een mondkapje droeg. In principe zou de achterliggende AI dat kunnen, maar het is aan de gebruiker om te bepalen wat hij daadwerkelijk inzet. Maar wanneer je er personen mee gaat bekijken, speelt privacy een enorme rol en is het heel lastig om uit een conflict te blijven.
Hoewel veel toepassingen in deze technologie gaan over gezichtsherkenning, heb ik het in deze blog niet over het herkennen van mensen of menselijk gedrag gehad, maar over objecten. Die zijn over het algemeen neutraal in hun mening en kennen een lagere ethische standaard.
Conclusie
Computer vision maakt het dus mogelijk om op basis van video objecten te herkennen, te tracken en in combinatie met AI te voorspellen wat er gaat gebeuren. Veel van deze oplossingen zullen als eerste worden ingezet om bestaande processen zoals schade-afhandeling of automatisch remmen verder te verbeteren. Als bestaande leverancier van dit soort oplossingen moet je alert zijn op andere partijen die dit verder ontwikkelen. Of je moet er zelf mee aan de slag gaan. Hetzelfde patroon zagen we al eerder bij de voiceassistenten en is eigenlijk van toepassing op alle nieuwe technologische innovaties.
Het maakt ook nieuwe bedrijfsmodellen mogelijk, zoals echte onbemande retail, hybride verticale bedrijfsmodellen zoals een drone inclusief herkenning van rook, verkeersdrukte of magazijnvoorraad.
Je zou kunnen zeggen dat een camera met computer vision eigenlijk een hele sterke programmeerbare flexibele sensor is. En net als met andere sensoren kan je er heel veel informatie en inzichten mee verzamelen. Het wordt pas echt interessant als je die informatie omzet tot actie. Dus een drone die ook kan blussen, een auto die automatisch kan remmen of een doelpunt dat automatisch wordt afgekeurd als de bal toch echt over de zijlijn is geweest. Om snel dat soort besluiten te nemen, moeten die camera’s een snelle verbinding hebben met een cloud. Bij Odido hebben we een 5G-netwerk om dat mogelijk te maken.