Het ‘eenzame banaanprobleem’

16 januari 2024

Afgelopen week verdwaalde ik in het ‘eenzame banaanprobleem’.

In juli 2023 deelde Daniel Hook, CEO van Digital Science zijn ervaringen op dit gebied op het bedrijfsblog. Het artikel biedt een gedetailleerde inkijk in Hook zijn frustratie en fascinatie met de uitdaging waar hij voor stond: het onvermogen van Midjourney, een veelgebruikte AI voor beeldgeneratie, om een afbeelding van een enkele banaan te produceren (in tegenstelling tot trossen of paren bananen). Hook beschrijft zijn pogingen om een instructie te vinden die dit mogelijk zou maken.

Hoe lastig kan het zijn om een beeldgeneratie-AI, bekend om zijn vermogen om prachtige, ingewikkelde, complexe en artistieke afbeeldingen te creëren, iets zo eenvoudigs als een enkele banaan te laten genereren? Tot Hooks verbazing bleek dit behoorlijk moeilijk te zijn.

In zijn artikel geeft Hook een uitgebreid verslag van zijn zoektocht naar complexere instructies. Hij experimenteerde met het vragen aan de AI om verschillende achtergronden of schaduwen te genereren en probeerde zelfs een onzichtbare aap een banaan te laten vasthouden, onder de aanname dat apen doorgaans slechts één banaan vasthouden – alles tevergeefs (de apen waren noch onzichtbaar, noch hielden ze slechts één banaan vast).

Het eenzame banaanprobleem suggereerde dat bananen statistisch gezien alleen in paren (of meer) verschijnen, waardoor de AI geen afbeelding van een enkele banaan kon bedenken, omdat de data dit niet toeliet.

Velen probeerden het na Hook, uitmondend in frustratie die zelfs in de opdrachten te zien was: “een foto van een enkele banaan, slechts één banaan, niet veel, ÉÉN.” Zonder succes. Het leek bijna alsof de AI actief weerstand bood tegen de poging om slechts één enkele banaan te produceren.

Hetzelfde probleem deed zich voor bij de vraag om een afbeelding van één druif.

Uiteindelijk vond Hook, min of meer toevallig, een instructie die een enkele banaan genereerde. Waarschijnlijk werd dit specifieke probleem, eenmaal bekend, aangepakt door een betere afstemming van het model. Desalniettemin bieden problemen zoals het eenzame banaanprobleem een uniek inzicht in de aard van generatieve AI.

Zoals Hook opmerkt: “Artificiële intelligentie neemt objecten niet waar zoals wij dat doen – ze begrijpen veelvoorkomende patronen. Hun realiteit is fundamenteel anders dan de onze – deze ontstaat niet in de fysieke wereld maar in een logische wereld.”

Bron: https://www.digital-science.com/tldr/article/the-lone-banana-problem-or-the-new-programming-speaking-ai/

Delen via Social Media: