BBC-onderzoek laat zien hoe slecht AI-chatbots omgaan met nieuws
In deze nieuwsbrief wil ik het met je hebben over:
- AI-chatbots maken continu fouten bij het samenvatten van nieuwsartikelen.
- De livestream maakt een comeback bij de NOS.
AI-chatbots maken continu fouten bij het samenvatten van nieuwsartikelen
OpenAI heeft het afgelopen jaar een heleboel deals met mediabedrijven gesloten om hun content te mogen gebruiken. Daarbij gaat het niet enkel om het gebruik van artikelen voor het trainen van GPT-modellen, maar ook om het gebruik van informatie van websites om vragen over het nieuws en andere actuele zaken te kunnen beantwoorden. Dergelijke informatie is geen onderdeel van het taalmodel, maar wordt door ChatGPT direct bij de bron opgehaald en door het taalmodel herschreven en samengevat.
Ook andere techbedrijven hebben dergelijke deals gesloten of ze maken gewoon gebruik van de content waar ze toegang toe hebben. Als je de bots van AI-bedrijven niet blokkeert, kunnen ze de inhoud van je website gebruiken om vragen te beantwoorden.
De BBC publiceerde vorige week een onderzoek (pdf) naar de kwaliteit van de antwoorden die chatbots geven op vragen over het nieuws. Kloppen de antwoorden op basis van nieuwsartikelen wel? De BBC vroeg verschillende chatbots (ChatGPT van OpenAI, Copilot van Microsoft, Gemini van Google en Perplexity) naar samenvattingen van 100 verschillende artikelen. Speciaal daarvoor gaf de Britse omroep alle AI-bedrijven tijdelijk toegang tot zijn site, terwijl men dit normaal gesproken blokkeert.
Vervolgens hebben journalisten de antwoorden van de chatbots beoordeeld en op basis daarvan hebben de onderzoekers conclusies getrokken. De belangrijkste conclusie? Met de helft van alle samenvattingen van nieuwsartikelen was iets mis.
Enkel voorbeelden van fouten die er gemaakt werden:
Gemini incorrectly said the NHS did not recommend vaping as an aid to quit smoking.
ChatGPT and Copilot said Rishi Sunak and Nicola Sturgeon were still in office even after they had left.
Perplexity misquoted BBC News in a story about the Middle East, saying Iran initially showed "restraint" and described Israel's actions as "aggressive".
Bij 19 procent van de artikelen stonden er feitelijke onjuistheden, bijvoorbeeld verkeerde getallen of data. In 13 procent klopte er iets niet in quotes die door de chatbot werden aangehaald; deze waren aangepast of stonden zelfs helemaal niet in het originele artikel van de BBC, hoewel die wel als bron werd opgevoerd. Van de vier onderzochte chatbots waren de antwoorden van Gemini degene waar het vaakst iets mis mee was.

Volgens de onderzoekers van de BBC gaan er bepaalde fundamentele dingen mis wanneer chatbots het nieuws samenvatten:
The AI assistants we tested struggled to differentiate between opinion and fact, editorialised, and often failed to include essential context. Even when each statement in a response is accurate, these types of issues can result in responses which are misleading or biased.

Het onderzoek van de BBC volgt op een publieke strijd die de Britse omroep heeft gevoerd tegen de samenvattingen van pushberichten die Apple-producten maken met behulp van generatieve AI. Doordat verschillende pushberichten werden samengevat en samengevoegd, ontstonden er zeer vreemde headlines. Apple heeft hierop deze functionaliteit uitgeschakeld.
De omroep hoopt met dit onderzoek dat AI-bedrijven hier iets mee doen of dat overheden ingrijpen. De CEO van de BBC schrijft in een verklaring:
We’d like other tech companies to hear our concerns, just as Apple did. It’s time for us to work together – the news industry, tech companies - and of course government too has a big role to play here.
There is a wider conversation to be had around regulation to ensure that in this new version of our online world, consumers can still find clarity through accurate news and information from sources they know they can trust.
Tot nu toe is er echter nog weinig reactie gekomen vanuit de bedrijven die zijn meegenomen in dit onderzoek.
De livestream maakt een comeback bij de NOS
De livestream is terug van nooit echt weggeweest bij de NOS. De omroep wil meer live gaan doen via de site en app. Waar livestreams tot nu toe vooral bestonden uit persconferenties en sportwedstrijden, denkt de omroep nu ook na over livestream-formats die juist achtergrond en duiding bieden.
Zo presenteerde verslaggever Jeroen Gortworst afgelopen woensdag een livestream van een half uur waarin hij in eensoort HD-variant van een online meeting, waarin vier correspondenten vragen van kijkers beantwoordden over de situatie rondom Oekraïne. De volledige stream is terug te kijken en het is interessant om te zien hoe de NOS bij deze online uitzending kiest voor een veel informelere toon dan op tv. Wat verder opvalt is dat er voor het insturen van vragen wordt gevraagd om ze te e-mailen. Dat is zo ongeveer het meest onhandige communicatiekanaal tijdens een live-uitzending, als je het mij vraagt. Maar goed, het is dan ook nog een experiment.
Eerder maakte de NOS het al mogelijk om in livestreams (en dan in het bijzonder die van journaals en sportuitzendingen) terug te gaan naar specifieke onderdelen. Livestreams worden voorzien van zogeheten 'Momenten' waardoor je bijvoorbeeld snel een bepaald journaalitem kunt vinden. Daarnaast heeft de NOS sinds afgelopen zomer zijn app voor smart-tv's omgebouwd tot een app die zich helemaal focust op livestreams.
De NOS lijkt daarmee vol in te zetten op live. Niet in de vorm van een 24/7-nieuwskanaal, maar door steeds meer livestreams aan te bieden op momenten dat het relevant is. En dan niet slechts als een onhandige toevoeging aan de site en app, maar als een volwaardig liveproduct.
Kort
- NPO-baas Frederieke Leeflang heeft gezorgd voor een "een werkcultuur die buitengewoon griezelig en heel erg onveilig is". Dat blijkt uit een onderzoek van Investico en het AD, waaraan tientallen (oud-)medewerkers van de NPO meewerkten. Er zijn ook meerdere officiële klachten tegen haar ingediend.
- Ondertussen werd bekend dat minister Bruins in april zijn plannen bekend zal maken voor de volgende hervorming van de publieke omroep. Volgens RTL Nieuws is het plan om de omroepen te gaan onderbrengen in vier of vijf omroephuizen waarin ze gaan samenwerken om programma's te maken, zoals eerder al door het kabinet werd geopperd.
- De Nederlandse Vereniging van Weerbedrijven heeft geen gelijk gekregen van de rechter in de zaak die het had aangespannen tegen het KNMI. Onder meer Buienradar en Weeronline vinden het oneerlijke concurrentie dat het KNMI een gratis en reclamevrije weer-app heeft gemaakt. De rechter laat het aan de regering om daarover te beslissen; het KNMI valt onder het Ministerie van Infrastructuur en Waterstaat.
- Meta dreigt Donald Trump te gebruiken in de strijd tegen de Europese regelgeving waaraan techbedrijven moeten voldoen, zoals de Digital Markets Act en de Digital Services Act.
- De algoritmes van X en TikTok hebben een sterke voorkeur voor extreem-rechtse content in aanloop naar de verkiezingen in Duitsland, blijkt uit onderzoek van Global Witness.
- De Ierse tak van Mediahuis klaagt X aan, omdat het bedrijf niks doet tegen verspreiding van advertenties met nepartikelen in de vormgeving van The Irish Independent.
- Marketingbedrijf Interpublic heeft een deal gesloten met X om namens zijn klanten advertenties in te kopen op X, het sociale netwerk van Elon Musk. Die deal zou er zijn gekomen nadat X had gehint dat de Amerikaanse overheid dwars zou kunnen gaan liggen bij de op handen zijnde fusie tussen Interpublic en concurrent Omnicom Group. Hier was toch een woord voor? Iets dat begint met een c en eindigt op 'orruptie'.
- YouTube Premium, het abonnement om reclamevrij naar YouTube te kunnen kijken, kost inmiddels €13,99 per maand. Dat is zoveel geld dat er ruimte is voor een goedkoper abonnement, waarbij je slechts een klein deel van alle video's zonder reclame kunt bekijken: podcasts en how-to-video's.
- Apple breidt Apple News+ uit met een sectie recepten uit publicaties van aangesloten uitgevers. In Nederland is het nieuwsabonnement van Apple niet beschikbaar.
- Spotify accepteert vanaf nu audioboeken die geautomatiseerd zijn voorgelezen met behulp van de text-to-speech-technologie van ElevenLabs.
- Instagram voegt nieuwe functies toe aan DM's, waaronder de mogelijkheid om gesprekken vast te pinnen in je inbox en om berichten in te plannen zodat ze op een later moment verstuurd worden.
- Facebook gaat opgenomen livestreams voortaan na 30 dagen verwijderen. Binnenkort wordt daarom het hele livestream-archief weggegooid.
- Bijna 10 procent van de omzet van Reddit is inmiddels afkomstig uit AI-contentdeals met Google en OpenAI.
- Reddit wil nog dit jaar een betaalmuur introduceren, waarbij een deel van de content op het platform (subreddits over specifieke onderwerpen) alleen nog door betalende gebruikers te bekijken is.