Spraakassistenten van de nieuwe generatie: waarom de architectuur belangrijker is dan het antwoord

Spraakassistenten van de nieuwe generatie: waarom de architectuur belangrijker is dan het antwoord

Bedrijf

De vergelijking van de nieuwe generatie spraakassistenten: Alexa+, Siri, Gemini. Ontdek waarom het ecosysteem en de architectuur belangrijker zijn dan het AI-model.

Fabio Lauria, CEO en oprichter van ELECTE

CEO en oprichter van ELECTE

Dit artikel samenvatten met AI

Het meest gangbare advies bij het vergelijken van de nieuwe generatie spraakassistenten is tegelijkertijd ook het minst nuttige: kijken welke het ‘beste reageert’. Dat is een benadering die past bij consumententests, niet bij strategische besluitvorming. Als je de markt bekijkt door de ogen van een ondernemer, een innovatiemanager of een compliance-team, is de juiste vraag niet welke stem het slimst klinkt, maar welk systeem modellen, gegevens, apparaten en acties het beste op elkaar afstemt.

In Italië is de tijd rijp voor deze nieuwe kijk op de zaak. Het gebruik van spraakassistenten in huishoudens is gestegenvan 11% van de gezinnen in 2018 naar 15% in 2019, zo meldt Biblioteche Oggi in zijn rapport over trends op het gebied van spraakassistenten en slimme luidsprekers. We hebben het dus niet over een technologische curiositeit, maar over een interface die al deel uitmaakt van het dagelijks leven.

Het gaat er vandaag echter om dat de grote spelers steeds meer op dezelfde basisbouwstenen van AI uitkomen. Wanneer de ‘motor’ steeds meer op elkaar gaat lijken, verschuift het verschil naar de architectuur, het ecosysteem, de daadwerkelijke agentcapaciteit en het gegevensbeheer. Daar wordt de toekomst beslist.

Index

Conclusie: kies de orchestrator, niet alleen de stem

Inleiding: de verkeerde vraag die iedereen zich stelt

Jarenlang hebben we spraakassistenten beoordeeld zoals men een quizprogramma op televisie beoordeelt. Begrijpt hij de vraag? Geeft hij snel antwoord? Maakt hij weinig fouten? Dit beoordelingskader is tegenwoordig te beperkt. Een assistent van de nieuwe generatie onderscheidt zich niet alleen door zijn antwoorden, maar ook door zijn vermogen om diensten met elkaar te verbinden, de context te behouden, acties uit te voeren en binnen een ecosysteem te functioneren.

Naar mijn mening is het een vergissing om aan te nemen dat het onderliggende taalmodel nog steeds de belangrijkste onderscheidende factor is. Dat is duidelijk niet meer het geval. Naarmate meer bedrijven gebruikmaken van externe modellen of gedeelde infrastructuren, neigt de kwaliteit van de conversaties naar elkaar toe. Op dat moment ligt het concurrentievoordeel niet meer in het ‘brein’ op zich, maar in de manier waarop dat brein wordt geïntegreerd.

De markt beloont niet alleen degenen die het beste kunnen praten. Ze beloont degenen die apparaten, diensten, context en gegevens het beste op elkaar afstemmen.

Voor een Italiaanse professional verandert dit alles. De vergelijking van de nieuwe generatie spraakassistenten moet niet worden gezien als een ranglijst van gadgets, maar als een keuze tussen platforms met zeer uiteenlopende bedrijfsmodellen, technologische afhankelijkheden en operationele implicaties.

Verder dan de AI-motor: de grote technologische convergentie

In het publieke debat worden Siri, Alexa, Google Assistant en opkomende oplossingen nog steeds behandeld alsof ze elk een totaal andere intelligentie bezitten. Die benadering wordt steeds minder zinvol. De sector evolueert in de richting van een standaardisering van de output: krachtigere modellen, die vaak via gedeelde infrastructuren of partnerschappen toegankelijk zijn, verkleinen de waargenomen kloof in de basisconversatie.

Schematische weergave van de convergentie tussen spraakassistenten van de nieuwe generatie en externe kunstmatige-intelligentiemodellen.

Begrijpen is niet genoeg

Een Italiaanse benchmark is verhelderend, juist omdat deze twee statistieken onderscheidt die door velen door elkaar worden gehaald. In de test van Worldline Italia met 800 identieke vragen bereikte Google Assistant een begrip van de vragen van 100% en 87,9% correcte antwoorden, Siri 99,6% en 74,6%, Alexa 99% en 72,5%, Cortana 99,4% en 63,4%, zoals blijkt uit de vergelijkende benchmark van Worldline Italia.

Deze cijfers maken één ding duidelijk: bijna alles begrijpen betekent niet dat je op alles een goed antwoord hebt. En het betekent vooral niet dat je goed weet hoe je moet handelen. De benchmark laat ook een verschil zien per taakcategorie: Siri presteerde beter dan Google bij commando’s, terwijl Google de overhand had bij vragen over algemene kennis en bij informatieve taken. Er bestaat dus geen ‘absolute kampioen’ die losstaat van de gebruikscontext.

Waar verschuift de waarde naartoe?

Als meerdere assistenten een vergelijkbaar niveau van basiskennis bereiken, is de motor niet langer de belangrijkste factor bij de keuze. Op dat moment let ik op vier factoren:

Modellering. Een assistent kan gebruikmaken van een of meer AI-systemen, maar het is van belang wie bepaalt wanneer wat wordt ingezet.
Toepassingsgebied. De waarde neemt toe wanneer de assistent niet alleen spreekt, maar ook diensten, opslagruimte, apps en automatiseringen activeert.
De gebruikerservaring staat voorop. Een consistente interface, geïntegreerd in smartphones, luidsprekers, auto’s of smart homes, is belangrijker dan een iets beter antwoord.
Afhankelijkheid van derden. Hoe meer het systeem op externe partijen steunt, hoe belangrijker governance en betrouwbaarheid worden.

Praktische tip: als twee assistenten tijdens het antwoorden op elkaar lijken, kijk dan eens wat er gebeurt als ze de daad bij het woord moeten voegen.

Daarom zou de vergelijking tussen spraakassistenten van de nieuwe generatie niet moeten uitgaan van de vraag „wie weet het meest“, maar van een andere vraag: wie heeft er werkelijk de volledige controle over de keten van spraak, model, integratie en resultaat?

Architectuur in vergelijking: de echte strijd om de toekomst

Wanneer de motor steeds meer op elkaar gaat lijken, wordt de architectuur het echte strijdtoneel. Daar wordt bepaald hoe een assistent zich zal ontwikkelen, in hoeverre hij zich zal kunnen specialiseren en hoe betrouwbaar hij zal zijn wanneer hij samengestelde handelingen moet uitvoeren, en niet alleen losse verzoeken.

Vergelijkende tabel waarin de technologische architecturen van Apple, Amazon en Samsung worden vergeleken.

Drie verschillende architecturale benaderingen

Grote bedrijven slaan verschillende wegen in, en dat verschil is belangrijker dan een enkele demo.

BenaderingLogicaSterk puntGrootsterisicoMonolithischEenuniformeervaringdie de complexiteit probeert te verbergenConsistentie vanuit het oogpunt van de gebruikerMinder flexibiliteit als het systeem zich moetspecialiserenMulti-agentMeerderecomponenten met verschillende rollen die samen worden gecoördineerdSpecialisatie per taakGrotere complexiteit bijde coördinatieIngrijpende herontwikkelingHerontwerpvan de assistent op stack- en interfaceniveauPotentiële kwaliteitssprong op middellange termijnLangzame overgang die afhankelijk is van daadwerkelijke integratie

Amazon neigt ernaar de voorkeur te geven aan een meer geïntegreerde ervaring. Samsung heeft een aanpak laten zien die meer gericht is op het samenbrengen van verschillende componenten. Apple daarentegen wordt vooral geprezen om zijn vermogen om Siri op geloofwaardige wijze nieuw leven in te blazen na een lange vertraging die door de markt werd waargenomen. Het is niet nodig om deze ontwikkelingen in slogans om te zetten. Het volstaat te beseffen dat een architectuur een strategische keuze is, en geen technisch detail.

Waarom architectuur belangrijker is dan de lijst met functies

Een functie kan worden gekopieerd. Een architectuur niet, of in ieder geval niet op korte termijn. Als een concurrent een nieuwe functie voor samenvatting, reservering of automatisch samenstellen lanceert, kunnen anderen die namaken. Maar de manier waarop een assistent taken verdeelt over spraakherkenning, geheugen, planning, externe apps en machtigingsbeheer, bepaalt de kwaliteit van het systeem op de lange termijn.

Voor wie in een bedrijf werkt, is de relevante vraag: is de assistent ontworpen om een betrouwbare reeks handelingen uit te voeren, of om indruk te maken tijdens een demo?

Het is één ding om te vragen: „Reserveer een tafel voor me“. Het is iets heel anders om een systeem een reeks stappen te laten afhandelen met beperkingen, machtigingen, gevoelige gegevens en controle van het resultaat.

Hier komt ook de beperking van de consumentgerichte agent-gerichte benadering naar voren. Veel assistenten beloven dat ze ‘het werk voor je doen’, maar in de praktijk functioneren ze het best in sterk gestandaardiseerde domeinen: muziek, timers, snelle informatie, smart home, berichten en agenda’s. Zodra er sprake is van uitzonderingen, beleidsregels, bedrijfsgegevens of operationele verantwoordelijkheden, wordt die belofte een stuk beperkter.

Daarom kijk ik, wanneer ik de toekomst van een platform beoordeel, niet alleen naar wat het vandaag de dag kan. Ik kijk of de architectuur ervan geschikt is om het volgende aan te kunnen:

Persistent en contextueel geheugen
Meerstaps processen met bevestigingen
Doorverwijzing naar verschillende diensten
Gedetailleerd beheer van machtigingen
Toezicht op de uitvoering en mislukkingen

In de vergelijking tussen de nieuwe generatie spraakassistenten gaat de echte strijd niet om de meest natuurlijke stemmen. Het gaat om de meest geloofwaardige modellen voor de verwerking van spraak.

Van woorden naar daden: het werkelijke handelingsvermogen

De term 'agentisch' wordt te lichtvaardig gebruikt. Tegenwoordig volstaat het dat een assistent een gestuurde taak uitvoert om al als agent te worden voorgesteld. Daar ben ik het niet mee eens. Een systeem is pas echt agentisch als het een doel kan interpreteren, dit in stappen kan opsplitsen, met verschillende instrumenten kan samenwerken, het resultaat kan controleren en uitzonderingen kan afhandelen zonder de context uit het oog te verliezen.

Een slimme spraakassistent projecteert een holografische hand die de digitale thermostaat aan de muur in huis instelt.

Een assistent die taken uitvoert, is nog geen agent

In de consumentenmarkt zijn veel 'acties' in feite goed uitgewerkte snelkoppelingen. Het licht aandoen, een afspeellijst starten, een herinnering instellen, een bericht versturen. Ze zijn handig en vaak erg goed ontworpen. Maar het zijn acties binnen relatief gesloten omgevingen, met weinig ruimte voor onduidelijkheid.

In de dagelijkse praktijk ligt de lat meteen hoger. Een echte medewerker moet gegevens, applicaties, interne regels en verantwoordelijkheden met elkaar kunnen verbinden. Als een manager om een analyse van de omzetdaling vraagt, mag het systeem zich niet beperken tot het samenvatten van een dashboard. Het moet bronnen met elkaar vergelijken, afwijkingen signaleren, onderscheid maken tussen veronderstellingen en feiten, en bruikbare resultaten opleveren.

Hier wordt het verschil duidelijk tussen een consumentenassistent en de AI-agenten voor bedrijfsprocessen van ELECTE. Het gaat hier niet om een abstract verschil in ‘algemene intelligentie’. Het is een verschil in ontwerp: doelstellingen, gegevens, instrumenten, controles en controleerbaarheid.

De praktische beperking zit hem in de integraties

De echte bottleneck voor de capaciteit van de assistent is niet alleen het model. Het is het netwerk van integraties dat de assistent in de lokale context kan activeren. Een historisch gegeven over de Italiaanse markt illustreert dit goed: een aangehaald onderzoek wees op 2.920 Alexa-skills in Italië, tegenover 65.901 in de Verenigde Staten en 34.771 in het Verenigd Koninkrijk, zoals blijkt uit de analyse van True Numbers over spraakassistenten in huis.

Deze kloof is geen kleinigheid. Het betekent dat de Italiaanse gebruiker, zelfs wanneer hij een krachtige assistent gebruikt, zich in een beperkter ecosysteem van functies van derden bevindt dan op de Engelstalige markten. En als het ecosysteem beperkter is, geldt dat ook voor de mogelijkheden om te ‘handelen’.

Drie praktische implicaties:

De werking hangt af van de beschikbare verbindingen
Zonder geïntegreerde diensten blijft de assistent een goede conversatie-interface met weinig praktische toepassingen.
De lokalisatie is net zo belangrijk als het model
Een systeem dat in het Engels uitstekend functioneert, kan in de praktijk maar matig bruikbaar zijn als er geen lokale diensten, inhoud en workflows zijn die relevant zijn voor Italië.
Een echt bureau vereist procescontrole
Hoe belangrijker een activiteit is, hoe meer controles, logboeken, autorisaties en mogelijkheden voor menselijke tussenkomst er nodig zijn.

Een assistent die thuis ‘dingen doet’, is niet automatisch klaar om op het werk ‘dingen te doen’.

Daarom maak ik bij het vergelijken van spraakassistenten van de nieuwe generatie altijd onderscheid tussen drie niveaus: conversatie, begeleide uitvoering en betrouwbare automatisering. De marketing heeft de neiging deze op één hoop te gooien. Wie een serieuze investering overweegt, zou ze zorgvuldig van elkaar moeten onderscheiden.

Het ecosysteem is het echte concurrentievoordeel

Als basiskennis gestandaardiseerd raakt, verschuift het concurrentievoordeel van het model naar het netwerk van verbindingen. Op dit punt missen veel publieke discussies het juiste perspectief. Ze behandelen de assistent als een afgewerkt product, terwijl de waarde ervan in werkelijkheid afhangt van wat hij of zij rondom zich in gang kan zetten.

Grafiek die laat zien hoe de integratie van een digitaal ecosysteem de totale waarde voor de eindgebruiker verhoogt.

Lokalisatie is belangrijker dan branding

Op de Italiaanse markt is een sterk merk alleen niet voldoende. Een assistent kan op papier uitstekend zijn, maar als het lokale ecosysteem onvoldoende diepgaand is, neemt het dagelijkse nut ervan af. Dit geldt voor smart homes, apps, lokale diensten, betalingen en verticale integraties.

Volgens GMI Insights was de VUI-markt (Voice User Interface) in 2023 goed voor 16,5 miljard dollar, waarbij Noord-Amerika meer dan 30% van de wereldwijde markt vertegenwoordigde. Voor Italië helpt hetzelfde sectorbeeld om een concrete dynamiek te begrijpen: de belangrijkste assistenten die aanwezig zijn, zijn Siri, Google Assistant en Alexa, maar de praktische keuze draait vaak om het ecosysteem, de compatibiliteit met meerdere apparaten en de integratie met domotica.

Voor het bedrijf telt de volledige keten

Voor een professioneel team is het ecosysteem niet alleen een lijst met compatibiliteit. Het is een complete keten:

Invoer. Hoe wordt het verzoek ingevoerd, in welke context en met welke rechten?
Routering. Welke engine of service neemt de taak voor zijn rekening.
Uitvoering. Welke applicaties of databases worden doorzocht.
Controle. Wie controleert het resultaat, waar blijft het spoor achter, hoe wordt een fout gecorrigeerd.

Een rijk ecosysteem vermindert wrijving. Een gefragmenteerd ecosysteem leidt tot afhankelijkheden, uitzonderingen en blinde vlekken.

Hoe meer modellen onderling uitwisselbaar worden, hoe meer het ecosysteem zelf het product wordt.

Daarom moet de vergelijking van de nieuwe generatie spraakassistenten worden gezien als een beoordeling van het platform. Je kiest niet alleen een stem. Je kiest voor een reeks integraties, technologische partners en operationele mogelijkheden. En voor een bedrijf is die reeks vaak belangrijker dan de briljantheid van een enkel antwoord.

Privacy en gegevenssoevereiniteit: wie luistert er mee met je gesprekken?

Het meest verwaarloosde onderwerp in recensies over spraakassistenten is tegelijkertijd het belangrijkste voor een zakelijk publiek. Bijna alle analyses richten zich op functies, nauwkeurigheid, de kwaliteit van de conversatie en smart home. Slechts enkele gaan echt in op gegevensbeheer.

Infographic waarin de voor- en nadelen van privacy en zeggenschap over persoonsgegevens worden vergeleken.

De meest onderschatte informatiekloof

Een Italiaanse bron stelt het duidelijk: in de meeste analyses over spraakassistenten in Italië wordt geen aandacht besteed aan privacy, naleving van regelgeving en gegevenssoevereiniteit, waardoor er een informatiekloof ontstaat voor bedrijven. Dit is het belangrijkste punt dat Hello Uniweb in zijn analyse over spraakassistenten naar voren brengt.

Voor een consument lijkt deze omissie misschien onbelangrijk. Voor een mkb-bedrijf, een financeteam of een compliance-verantwoordelijke is dat echter helemaal niet het geval. Als een spraakverzoek via cloudinfrastructuren, diensten van derden en externe applicatieketens verloopt, is de vraag niet alleen „is het antwoord correct?“, maar ook:

Waar wordt de aanvraag behandeld?
Wie heeft toegang tot de metagegevens?
Welke toestemmingen zijn daadwerkelijk actief?
Hoe worden verwijdering, anonimisering en logbestanden beheerd?
Als het gebruik in overeenstemming is met het interne beleid en de AVG

Om dit onderwerp vanuit een breder perspectief te bekijken, is het de moeite waard om ook de analyse van ELECTE te lezen over luisteren, gegevens en informatie-risico's in AI-systemen.

Deze video helpt om het onderwerp vanuit een meer toegankelijk perspectief te bekijken:

Hoe het operationele risico te beoordelen

Wanneer een spraakassistent zijn intrede doet in een professionele omgeving, raad ik aan om deze te beoordelen zoals je technologie beoordeelt die betrekking heeft op gegevens en processen, en niet als een gadget.

Een minimale checklist zou het volgende moeten bevatten:

CriteriumTestellen vraagLocatie van de gegevensWeet uin welk rechtsgebied verzoeken en output worden verwerkt?Betrokken derde partijenHeeftu inzicht in de technologische partners die de gegevens verwerken of hosten?Administratieve controleKunt ubeleid, accounts, machtigingen en deactiveringen centraal beheren?Controleerbaarheid Zijn erlogboeken, traceerbaarheid van acties en mogelijkheden voor controle?Risicobeperking Kunt uhet verzenden van gevoelige gegevens beperken of persoonlijke en zakelijke contexten scheiden?

Het komt hierop neer: in het bedrijfsleven wint niet de aardigste assistent. Er wint degene die wrijving vermindert zonder het operationele risico te vergroten.

Dit verandert de essentie van de vergelijking tussen de nieuwe generatie spraakassistenten. Als je een Europese professional bent, is de kwaliteit van het gesprek slechts één van de criteria. Het andere, vaak nog belangrijkere aspect is de daadwerkelijke controle over de gegevens. En op dat vlak is de markt nog minder transparant dan de commerciële communicatie doet vermoeden.

Conclusie: kies de orchestrator, niet alleen de stem

De markt voor spraakassistenten gaat een nieuwe fase in. De relevante vraag is niet langer welk platform er in een demo het meest indrukwekkend overkomt, maar welk platform het beste in staat is om modellen, integraties, context en governance op elkaar af te stemmen. Daar ligt het echte voordeel.

Het onderscheidende kenmerk is niet alleen de kwaliteit van het gesprek. Het is de architectuur die de ervaring ondersteunt, de diepgang van het ecosysteem dat acties mogelijk maakt, de mate van zelfstandigheid en de mate van controle over de gegevens. Voor een zakelijke gebruiker zijn deze vier aspecten veel belangrijker dan een grappig antwoord of een commando dat binnen enkele seconden wordt uitgevoerd.

Wie vooruitkijkt, zou moeten denken in termen van orkestratie. Het is dezelfde logica die niet alleen consumentenassistenten, maar de hele nieuwe generatie operationele AI-systemen opnieuw definieert. Een nuttige lezing in dit verband is de analyse van ELECTE over AI-orkestratie en de rol van integraties in reële processtromen.

Als je gegevens, signalen en workflows wilt omzetten in concrete operationele beslissingen, probeer dan ELECTE, een door AI aangestuurd data-analyseplatform voor het MKB. Dit is de meest directe manier om te zien hoe een voor het bedrijfsleven ontworpen AI-agent verschilt van een consumentenassistent: minder conversatie omwille van de conversatie zelf, meer analyse, automatisering en daadwerkelijke ondersteuning bij de besluitvorming.

Hulpmiddelen voor bedrijfsgroei

Single source of truth: de gids voor het samenvoegen van gegevens

Single source of truth: de gids voor het samenvoegen van gegevens

Ontdek wat een ‘single source of truth’ (SSoT) is en waarom deze van cruciaal belang is voor uw besluitvorming. Onze gids helpt u deze te harmoniseren en er met behulp van AI optimaal gebruik van te maken.

ELECTE noteert een omzetgroei van meer dan 40% en de newsletter inmiddels meer dan 100.000 abonnees

Het op AI gebaseerde data-analyseplatform voor het MKB heeft de grens van 100.000 newsletter overschreden newsletter lanceert The ELECTE Digest; Fabio Lauria treedt toe tot de European DIGITAL SME Alliance.

Creëer een effectieve leeromgeving voor je team

Creëer een effectieve leeromgeving voor je team

Creëer een effectieve leeromgeving voor je team. Ontwerp (fysieke en digitale) ruimtes die vaardigheden versterken en het succes met behulp van gegevens meten.

Gegevensoverdraagbaarheid: praktische AVG-gids voor uw MKB-bedrijf in 2026

Gegevensoverdraagbaarheid volgens de AVG: ontdek wat het is, waarom het een kans is voor uw MKB-bedrijf en hoe u het kunt implementeren. Een praktische gids om van een verplichting een meerwaarde te maken.