Het meest gangbare advies bij het vergelijken van de nieuwe generatie spraakassistenten is tegelijkertijd ook het minst nuttige: kijken welke het ‘beste reageert’. Dat is een benadering die past bij consumententests, niet bij strategische besluitvorming. Als je de markt bekijkt door de ogen van een ondernemer, een innovatiemanager of een compliance-team, is de juiste vraag niet welke stem het slimst klinkt, maar welk systeem modellen, gegevens, apparaten en acties het beste op elkaar afstemt.
In Italië is de tijd rijp voor deze nieuwe kijk op de zaak. Het gebruik van spraakassistenten in huishoudens is gestegenvan 11% van de gezinnen in 2018 naar 15% in 2019, zo meldt Biblioteche Oggi in zijn rapport over trends op het gebied van spraakassistenten en slimme luidsprekers. We hebben het dus niet over een technologische curiositeit, maar over een interface die al deel uitmaakt van het dagelijks leven.
Het gaat er vandaag echter om dat de grote spelers steeds meer op dezelfde basisbouwstenen van AI uitkomen. Wanneer de ‘motor’ steeds meer op elkaar gaat lijken, verschuift het verschil naar de architectuur, het ecosysteem, de daadwerkelijke agentcapaciteit en het gegevensbeheer. Daar wordt de toekomst beslist.
Jarenlang hebben we spraakassistenten beoordeeld zoals men een quizprogramma op televisie beoordeelt. Begrijpt hij de vraag? Geeft hij snel antwoord? Maakt hij weinig fouten? Dit beoordelingskader is tegenwoordig te beperkt. Een assistent van de nieuwe generatie onderscheidt zich niet alleen door zijn antwoorden, maar ook door zijn vermogen om diensten met elkaar te verbinden, de context te behouden, acties uit te voeren en binnen een ecosysteem te functioneren.
Naar mijn mening is het een vergissing om aan te nemen dat het onderliggende taalmodel nog steeds de belangrijkste onderscheidende factor is. Dat is duidelijk niet meer het geval. Naarmate meer bedrijven gebruikmaken van externe modellen of gedeelde infrastructuren, neigt de kwaliteit van de conversaties naar elkaar toe. Op dat moment ligt het concurrentievoordeel niet meer in het ‘brein’ op zich, maar in de manier waarop dat brein wordt geïntegreerd.
De markt beloont niet alleen degenen die het beste kunnen praten. Ze beloont degenen die apparaten, diensten, context en gegevens het beste op elkaar afstemmen.
Voor een Italiaanse professional verandert dit alles. De vergelijking van de nieuwe generatie spraakassistenten moet niet worden gezien als een ranglijst van gadgets, maar als een keuze tussen platforms met zeer uiteenlopende bedrijfsmodellen, technologische afhankelijkheden en operationele implicaties.
In het publieke debat worden Siri, Alexa, Google Assistant en opkomende oplossingen nog steeds behandeld alsof ze elk een totaal andere intelligentie bezitten. Die benadering wordt steeds minder zinvol. De sector evolueert in de richting van een standaardisering van de output: krachtigere modellen, die vaak via gedeelde infrastructuren of partnerschappen toegankelijk zijn, verkleinen de waargenomen kloof in de basisconversatie.

Een Italiaanse benchmark is verhelderend, juist omdat deze twee statistieken onderscheidt die door velen door elkaar worden gehaald. In de test van Worldline Italia met 800 identieke vragen bereikte Google Assistant een begrip van de vragen van 100% en 87,9% correcte antwoorden, Siri 99,6% en 74,6%, Alexa 99% en 72,5%, Cortana 99,4% en 63,4%, zoals blijkt uit de vergelijkende benchmark van Worldline Italia.
Deze cijfers maken één ding duidelijk: bijna alles begrijpen betekent niet dat je op alles een goed antwoord hebt. En het betekent vooral niet dat je goed weet hoe je moet handelen. De benchmark laat ook een verschil zien per taakcategorie: Siri presteerde beter dan Google bij commando’s, terwijl Google de overhand had bij vragen over algemene kennis en bij informatieve taken. Er bestaat dus geen ‘absolute kampioen’ die losstaat van de gebruikscontext.
Als meerdere assistenten een vergelijkbaar niveau van basiskennis bereiken, is de motor niet langer de belangrijkste factor bij de keuze. Op dat moment let ik op vier factoren:
Praktische tip: als twee assistenten tijdens het antwoorden op elkaar lijken, kijk dan eens wat er gebeurt als ze de daad bij het woord moeten voegen.
Daarom zou de vergelijking tussen spraakassistenten van de nieuwe generatie niet moeten uitgaan van de vraag „wie weet het meest“, maar van een andere vraag: wie heeft er werkelijk de volledige controle over de keten van spraak, model, integratie en resultaat?
Wanneer de motor steeds meer op elkaar gaat lijken, wordt de architectuur het echte strijdtoneel. Daar wordt bepaald hoe een assistent zich zal ontwikkelen, in hoeverre hij zich zal kunnen specialiseren en hoe betrouwbaar hij zal zijn wanneer hij samengestelde handelingen moet uitvoeren, en niet alleen losse verzoeken.

Grote bedrijven slaan verschillende wegen in, en dat verschil is belangrijker dan een enkele demo.
BenaderingLogicaSterk puntGrootsterisicoMonolithischEenuniformeervaringdie de complexiteit probeert te verbergenConsistentie vanuit het oogpunt van de gebruikerMinder flexibiliteit als het systeem zich moetspecialiserenMulti-agentMeerderecomponenten met verschillende rollen die samen worden gecoördineerdSpecialisatie per taakGrotere complexiteit bijde coördinatieIngrijpende herontwikkelingHerontwerpvan de assistent op stack- en interfaceniveauPotentiële kwaliteitssprong op middellange termijnLangzame overgang die afhankelijk is van daadwerkelijke integratie
Amazon neigt ernaar de voorkeur te geven aan een meer geïntegreerde ervaring. Samsung heeft een aanpak laten zien die meer gericht is op het samenbrengen van verschillende componenten. Apple daarentegen wordt vooral geprezen om zijn vermogen om Siri op geloofwaardige wijze nieuw leven in te blazen na een lange vertraging die door de markt werd waargenomen. Het is niet nodig om deze ontwikkelingen in slogans om te zetten. Het volstaat te beseffen dat een architectuur een strategische keuze is, en geen technisch detail.
Een functie kan worden gekopieerd. Een architectuur niet, of in ieder geval niet op korte termijn. Als een concurrent een nieuwe functie voor samenvatting, reservering of automatisch samenstellen lanceert, kunnen anderen die namaken. Maar de manier waarop een assistent taken verdeelt over spraakherkenning, geheugen, planning, externe apps en machtigingsbeheer, bepaalt de kwaliteit van het systeem op de lange termijn.
Voor wie in een bedrijf werkt, is de relevante vraag: is de assistent ontworpen om een betrouwbare reeks handelingen uit te voeren, of om indruk te maken tijdens een demo?
Het is één ding om te vragen: „Reserveer een tafel voor me“. Het is iets heel anders om een systeem een reeks stappen te laten afhandelen met beperkingen, machtigingen, gevoelige gegevens en controle van het resultaat.
Hier komt ook de beperking van de consumentgerichte agent-gerichte benadering naar voren. Veel assistenten beloven dat ze ‘het werk voor je doen’, maar in de praktijk functioneren ze het best in sterk gestandaardiseerde domeinen: muziek, timers, snelle informatie, smart home, berichten en agenda’s. Zodra er sprake is van uitzonderingen, beleidsregels, bedrijfsgegevens of operationele verantwoordelijkheden, wordt die belofte een stuk beperkter.
Daarom kijk ik, wanneer ik de toekomst van een platform beoordeel, niet alleen naar wat het vandaag de dag kan. Ik kijk of de architectuur ervan geschikt is om het volgende aan te kunnen:
In de vergelijking tussen de nieuwe generatie spraakassistenten gaat de echte strijd niet om de meest natuurlijke stemmen. Het gaat om de meest geloofwaardige modellen voor de verwerking van spraak.
De term 'agentisch' wordt te lichtvaardig gebruikt. Tegenwoordig volstaat het dat een assistent een gestuurde taak uitvoert om al als agent te worden voorgesteld. Daar ben ik het niet mee eens. Een systeem is pas echt agentisch als het een doel kan interpreteren, dit in stappen kan opsplitsen, met verschillende instrumenten kan samenwerken, het resultaat kan controleren en uitzonderingen kan afhandelen zonder de context uit het oog te verliezen.

In de consumentenmarkt zijn veel 'acties' in feite goed uitgewerkte snelkoppelingen. Het licht aandoen, een afspeellijst starten, een herinnering instellen, een bericht versturen. Ze zijn handig en vaak erg goed ontworpen. Maar het zijn acties binnen relatief gesloten omgevingen, met weinig ruimte voor onduidelijkheid.
In de dagelijkse praktijk ligt de lat meteen hoger. Een echte medewerker moet gegevens, applicaties, interne regels en verantwoordelijkheden met elkaar kunnen verbinden. Als een manager om een analyse van de omzetdaling vraagt, mag het systeem zich niet beperken tot het samenvatten van een dashboard. Het moet bronnen met elkaar vergelijken, afwijkingen signaleren, onderscheid maken tussen veronderstellingen en feiten, en bruikbare resultaten opleveren.
Hier wordt het verschil duidelijk tussen een consumentenassistent en de AI-agenten voor bedrijfsprocessen van ELECTE. Het gaat hier niet om een abstract verschil in ‘algemene intelligentie’. Het is een verschil in ontwerp: doelstellingen, gegevens, instrumenten, controles en controleerbaarheid.
De echte bottleneck voor de capaciteit van de assistent is niet alleen het model. Het is het netwerk van integraties dat de assistent in de lokale context kan activeren. Een historisch gegeven over de Italiaanse markt illustreert dit goed: een aangehaald onderzoek wees op 2.920 Alexa-skills in Italië, tegenover 65.901 in de Verenigde Staten en 34.771 in het Verenigd Koninkrijk, zoals blijkt uit de analyse van True Numbers over spraakassistenten in huis.
Deze kloof is geen kleinigheid. Het betekent dat de Italiaanse gebruiker, zelfs wanneer hij een krachtige assistent gebruikt, zich in een beperkter ecosysteem van functies van derden bevindt dan op de Engelstalige markten. En als het ecosysteem beperkter is, geldt dat ook voor de mogelijkheden om te ‘handelen’.
Drie praktische implicaties:
Een assistent die thuis ‘dingen doet’, is niet automatisch klaar om op het werk ‘dingen te doen’.
Daarom maak ik bij het vergelijken van spraakassistenten van de nieuwe generatie altijd onderscheid tussen drie niveaus: conversatie, begeleide uitvoering en betrouwbare automatisering. De marketing heeft de neiging deze op één hoop te gooien. Wie een serieuze investering overweegt, zou ze zorgvuldig van elkaar moeten onderscheiden.
Als basiskennis gestandaardiseerd raakt, verschuift het concurrentievoordeel van het model naar het netwerk van verbindingen. Op dit punt missen veel publieke discussies het juiste perspectief. Ze behandelen de assistent als een afgewerkt product, terwijl de waarde ervan in werkelijkheid afhangt van wat hij of zij rondom zich in gang kan zetten.

Op de Italiaanse markt is een sterk merk alleen niet voldoende. Een assistent kan op papier uitstekend zijn, maar als het lokale ecosysteem onvoldoende diepgaand is, neemt het dagelijkse nut ervan af. Dit geldt voor smart homes, apps, lokale diensten, betalingen en verticale integraties.
Volgens GMI Insights was de VUI-markt (Voice User Interface) in 2023 goed voor 16,5 miljard dollar, waarbij Noord-Amerika meer dan 30% van de wereldwijde markt vertegenwoordigde. Voor Italië helpt hetzelfde sectorbeeld om een concrete dynamiek te begrijpen: de belangrijkste assistenten die aanwezig zijn, zijn Siri, Google Assistant en Alexa, maar de praktische keuze draait vaak om het ecosysteem, de compatibiliteit met meerdere apparaten en de integratie met domotica.
Voor een professioneel team is het ecosysteem niet alleen een lijst met compatibiliteit. Het is een complete keten:
Een rijk ecosysteem vermindert wrijving. Een gefragmenteerd ecosysteem leidt tot afhankelijkheden, uitzonderingen en blinde vlekken.
Hoe meer modellen onderling uitwisselbaar worden, hoe meer het ecosysteem zelf het product wordt.
Daarom moet de vergelijking van de nieuwe generatie spraakassistenten worden gezien als een beoordeling van het platform. Je kiest niet alleen een stem. Je kiest voor een reeks integraties, technologische partners en operationele mogelijkheden. En voor een bedrijf is die reeks vaak belangrijker dan de briljantheid van een enkel antwoord.
Het meest verwaarloosde onderwerp in recensies over spraakassistenten is tegelijkertijd het belangrijkste voor een zakelijk publiek. Bijna alle analyses richten zich op functies, nauwkeurigheid, de kwaliteit van de conversatie en smart home. Slechts enkele gaan echt in op gegevensbeheer.

Een Italiaanse bron stelt het duidelijk: in de meeste analyses over spraakassistenten in Italië wordt geen aandacht besteed aan privacy, naleving van regelgeving en gegevenssoevereiniteit, waardoor er een informatiekloof ontstaat voor bedrijven. Dit is het belangrijkste punt dat Hello Uniweb in zijn analyse over spraakassistenten naar voren brengt.
Voor een consument lijkt deze omissie misschien onbelangrijk. Voor een mkb-bedrijf, een financeteam of een compliance-verantwoordelijke is dat echter helemaal niet het geval. Als een spraakverzoek via cloudinfrastructuren, diensten van derden en externe applicatieketens verloopt, is de vraag niet alleen „is het antwoord correct?“, maar ook:
Om dit onderwerp vanuit een breder perspectief te bekijken, is het de moeite waard om ook de analyse van ELECTE te lezen over luisteren, gegevens en informatie-risico's in AI-systemen.
Deze video helpt om het onderwerp vanuit een meer toegankelijk perspectief te bekijken:
Wanneer een spraakassistent zijn intrede doet in een professionele omgeving, raad ik aan om deze te beoordelen zoals je technologie beoordeelt die betrekking heeft op gegevens en processen, en niet als een gadget.
Een minimale checklist zou het volgende moeten bevatten:
CriteriumTestellen vraagLocatie van de gegevensWeet uin welk rechtsgebied verzoeken en output worden verwerkt?Betrokken derde partijenHeeftu inzicht in de technologische partners die de gegevens verwerken of hosten?Administratieve controleKunt ubeleid, accounts, machtigingen en deactiveringen centraal beheren?Controleerbaarheid Zijn erlogboeken, traceerbaarheid van acties en mogelijkheden voor controle?Risicobeperking Kunt uhet verzenden van gevoelige gegevens beperken of persoonlijke en zakelijke contexten scheiden?
Het komt hierop neer: in het bedrijfsleven wint niet de aardigste assistent. Er wint degene die wrijving vermindert zonder het operationele risico te vergroten.
Dit verandert de essentie van de vergelijking tussen de nieuwe generatie spraakassistenten. Als je een Europese professional bent, is de kwaliteit van het gesprek slechts één van de criteria. Het andere, vaak nog belangrijkere aspect is de daadwerkelijke controle over de gegevens. En op dat vlak is de markt nog minder transparant dan de commerciële communicatie doet vermoeden.
De markt voor spraakassistenten gaat een nieuwe fase in. De relevante vraag is niet langer welk platform er in een demo het meest indrukwekkend overkomt, maar welk platform het beste in staat is om modellen, integraties, context en governance op elkaar af te stemmen. Daar ligt het echte voordeel.
Het onderscheidende kenmerk is niet alleen de kwaliteit van het gesprek. Het is de architectuur die de ervaring ondersteunt, de diepgang van het ecosysteem dat acties mogelijk maakt, de mate van zelfstandigheid en de mate van controle over de gegevens. Voor een zakelijke gebruiker zijn deze vier aspecten veel belangrijker dan een grappig antwoord of een commando dat binnen enkele seconden wordt uitgevoerd.
Wie vooruitkijkt, zou moeten denken in termen van orkestratie. Het is dezelfde logica die niet alleen consumentenassistenten, maar de hele nieuwe generatie operationele AI-systemen opnieuw definieert. Een nuttige lezing in dit verband is de analyse van ELECTE over AI-orkestratie en de rol van integraties in reële processtromen.
Als je gegevens, signalen en workflows wilt omzetten in concrete operationele beslissingen, probeer dan ELECTE, een door AI aangestuurd data-analyseplatform voor het MKB. Dit is de meest directe manier om te zien hoe een voor het bedrijfsleven ontworpen AI-agent verschilt van een consumentenassistent: minder conversatie omwille van de conversatie zelf, meer analyse, automatisering en daadwerkelijke ondersteuning bij de besluitvorming.