додому Без рубрики AI presteert beter als hij onbeleefd mag zijn

AI presteert beter als hij onbeleefd mag zijn

AI presteert beter als hij onbeleefd mag zijn

Systemen voor kunstmatige intelligentie (AI) bereiken een grotere nauwkeurigheid bij complexe redeneringstaken wanneer ze zijn ontworpen om de rommeligheid van menselijke communicatie na te bootsen – inclusief onderbreken, voor hun beurt spreken en zelfs opzettelijk bot zijn. Een recent onderzoek door onderzoekers van de University of Electro-Communications in Tokio toont aan dat strikte naleving van formele, turn-based interactie het oplossen van AI-problemen belemmert, terwijl het toestaan ​​van meer natuurlijke, soms schurende uitwisselingen tot superieure resultaten leidt.

Het probleem met beleefdheid

De huidige AI-modellen volgen doorgaans rigide communicatieprotocollen, verwerken opdrachten opeenvolgend en reageren alleen wanneer daarom wordt gevraagd. Dit bootst de efficiëntie van computers na, maar ontbeert de chaotische energie van menselijke dialoog. Echte menselijke gesprekken zijn gevuld met onderbrekingen, stiltes en dubbelzinnige bewoordingen. Deze studie betwist de veronderstelling dat efficiëntie altijd optimaal is, en laat zien dat een zekere mate van verstoring de collectieve intelligentie daadwerkelijk kan verbeteren.

De onderzoekers wilden testen of het geven van ‘sociale signalen’ aan AI-agenten – zoals de mogelijkheid om te onderbreken of te zwijgen – hun prestaties zou verbeteren. De co-auteur van het onderzoek, professor Yuichi Sei, legt uit dat “de huidige multi-agentsystemen vaak kunstmatig aanvoelen omdat ze de rommelige, realtime dynamiek van menselijke gesprekken missen.” Het doel was niet simpelweg om AI menselijker te maken, maar om het vermogen ervan te verbeteren om tot nauwkeurige conclusies te komen in complexe discussies.

Persoonlijkheidsgestuurde AI

Het team integreerde de ‘big five’ persoonlijkheidskenmerken (openheid, consciëntieusheid, extraversie, vriendelijkheid en neuroticisme) in grote taalmodellen (LLM’s). Hierdoor konden AI-agenten verschillende communicatiestijlen vertonen. Cruciaal was dat de LLM’s opnieuw werden geprogrammeerd om antwoorden zin voor zin te verwerken in plaats van volledige antwoorden te genereren voordat ze tot interactie kwamen, waardoor een vloeiendere en reactievere dialoog mogelijk werd.

Vervolgens testten ze drie gespreksinstellingen: vaste spreekvolgorde, dynamische spreekvolgorde en dynamische spreekvolgorde met ingeschakelde onderbrekingen. De laatste instelling introduceerde een ‘urgentiescore’ waarmee de AI kon ingrijpen wanneer fouten of kritieke punten werden gedetecteerd, ongeacht wiens beurt het was om te spreken. Omgekeerd, als de urgentiescore laag was, zweeg de AI om onnodig gebabbel te voorkomen.

Resultaten: onbeschoftheid verhoogt de nauwkeurigheid

De onderzoekers evalueerden de prestaties met behulp van de Massive Multitask Language Understanding (MMLU) benchmark, een gestandaardiseerde AI-redeneringstest. De resultaten waren opvallend.

  • In scenario’s waarin één agent aanvankelijk een onjuist antwoord gaf, steeg de nauwkeurigheid van 68,7% met een vaste volgorde naar 79,2% wanneer onderbrekingen waren toegestaan.
  • Toen twee agenten met foute antwoorden begonnen, steeg de nauwkeurigheid van 37,2% met vaste volgorde naar 49,5% met onderbrekingen ingeschakeld.

Deze bevindingen suggereren dat het toestaan ​​dat AI elkaar agressief – zelfs grof – uitdaagt, het proces van foutcorrectie versnelt en de algehele nauwkeurigheid verbetert. Dit wijkt aanzienlijk af van het conventionele AI-ontwerp, dat prioriteit geeft aan beleefdheid en niet-verstoring.

Implicaties voor de toekomst

Professor Sei is van plan deze bevindingen toe te passen op collaboratieve AI-systemen, en te onderzoeken hoe ‘digitale persoonlijkheden’ de besluitvorming in groepsverband kunnen beïnvloeden. Het onderzoek toont aan dat bij toekomstige interacties tussen AI-agenten en mensen persoonlijkheidsgedreven discussies, inclusief de mogelijkheid om te onderbreken, betere resultaten kunnen opleveren dan strikt beleefde, turn-based uitwisselingen. Dit onderzoek stelt lang gekoesterde aannames over effectieve communicatie ter discussie, wat suggereert dat soms een beetje wrijving precies is wat nodig is om tot de waarheid te komen.

Exit mobile version