Hoe de opkomst van AI nieuwe kansen creëert voor computerlinguïsten
Met de opkomst van AI heeft de aandacht voor computerlinguïstiek en taalmodellen een enorme vlucht genomen. Maar machines kunnen het nog lang niet alleen af. In haar oratie bepleit hoogleraar Carole Tiberius het belang van onderzoek naar woordcombinaties. ‘We weten een heleboel, maar ook een heleboel nog niet.’
‘Als je bekijkt hoe ingewikkeld taal is, is het toch verbazingwekkend dat we elkaar zo goed kunnen begrijpen,’ vertelt Tiberius. Deze fascinatie loopt als een rode draad door haar carrière. ‘Ik ben begonnen als vertaler, omdat ik het zo bijzonder vond dat mensen elkaar ook in andere talen kunnen begrijpen. Al snel dacht ik: het zou mooi zijn als een computer dit werk kan doen, maar wat heeft de computer nodig om dat te kunnen? Zo ben ik in de computerlinguïstiek terechtgekomen.’
Kansen voor onderzoek
Het is een vakgebied op het snijpunt van informatica en taalkunde. Computerlinguïstiek kan gebruikt worden om taalkundige theorieën te toetsen, maar anno 2024 ligt het accent daar niet op. ‘Er heeft de afgelopen decennia, en zeker de afgelopen jaren, een verschuiving plaatsgevonden naar het inzetten van computersystemen die natuurlijke taal kunnen analyseren en genereren,’ vertelt Tiberius. ‘Denk bijvoorbeeld aan ChatGPT.’
‘Als iemand vandaag iets creatiefs bedenkt en zegt, kan het opgepikt worden en in de taal terechtkomen.’
Maar dat betekent niet dat computerlinguïsten nu aan het duimendraaien zijn. Integendeel, vertelt Tiberius in haar oratie. De technologische vooruitgang creëert juist kansen voor onderzoek en meer begrip. ‘Vroeger moesten we vaak speculeren omdat we geen grote tekstverzamelingen tot onze beschikking hadden, maar nu hebben we die wel én de automatische middelen om die snel te doorzoeken. Hoe betrouwbaarder we dat kunnen doen, hoe meer inzicht we krijgen in hoe taal werkt en in hoe mensen taal gebruiken.’
Taal is altijd onderhevig aan verandering. ‘We weten een heleboel, maar ook een heleboel nog niet,’ zegt Tiberius. ‘Als iemand vandaag iets creatiefs bedenkt en zegt, kan het zomaar opgepikt worden en in de taal terechtkomen. Denk maar aan ‘gate’ voor een schandaal. Dat is ontstaan met Watergate, werd daarna gebruikt voor politieke schandalen en uiteindelijk ook voor andere schandalen zoals nipplegate.’
Komt voor de bakker
Tiberius' interesse ligt bij de fraseologie; de manier waarop individuele woorden kunnen worden gecombineerd tot frasen. ‘Individuele woorden zijn vaak ambigu, maar als ze in context geplaatst worden, wordt de betekenis meestal al snel duidelijk. Denk bijvoorbeeld aan “het komt voor de bakker” of “ergens geen kaas van gegeten hebben”. Uit de vakliteratuur blijkt dat de grote taalmodellen nog moeite hebben met dit soort metaforisch en idiomatisch taalgebruik. Het is mijn droom om een woordenboek te realiseren met de normale gebruikspatronen van woorden en hun betekenissen,’ zegt Tiberius. ‘Als we dat kunnen coderen, zetten we weer een stapje in de goede richting. Het zal nooit af zijn, maar stukje bij beetje verkrijgen we zo steeds meer inzicht in onze taal.’
Tekst: Julie de Graaf
Bannerfoto: Pexels