Nee, ik ben wel op de hoogte, hoor. Alleen heb je het over "hoe accuraat" of "het resultaat is juist". Wat ik zeg, is dat juistheid een toevallig bijproduct is als het niet gaat over de zinnen zelf. Het kàn zijn dat je resultaat deze keer juist is. Maar dan is dat per ongeluk. Ze proberen dat "per ongeluk" zo vaak mogelijk te verkrijgen, maar dat verandert niets aan het feit dat het een bijproduct is.
Je zei dat als jij aan Claude zou vragen of hij genoeg informatie heeft om een antwoord te geven, hij dat wel zou aangeven als het niet is. Dat is niet waar. Er is in dat opzicht nog niets veranderd aan de fundamentele werking van een LLM van toen je aan hem vroeg hoeveel R'en er in Blueberry zat, en hij 3 zei, omdat even daarvoor de hype was geweest om hem te vragen hoeveel R'en er in Strawberry zaten, waarbij hij maar iets gokte. Veel mensen verbeterden hem toen naar 3, en daaruit had hij geleerd dat 3 een geprefereerd antwoord was. Niet dat hij moest leren tellen.
Opnieuw: als je de LLM wilt vergelijken met een heel goedgelovige, inhoudsloze mens die meteen aanneemt dat de lucht inderdaad geel is, ja, dan geef ik je gelijk. Op dat niveau staat een LLM. Maar we hadden het over vragen aan een expert, niet vragen aan een goedgelovige, inhoudloze mens.
Je komt bij iets fundamenteels: ja, wij gebruiken ook taal, net als LLM's. Jouw conclusie daaruit lijkt echter te zijn dat we daardoor op één of andere manier op gelijke hoogte komen. Terwijl het totaal anders is. Taal is onze manier om onze redenering tot uiting te brengen. We hebben abstracte, niet-contextgebonden beelden en ideeën achter die taal, en die kruisbestuiving tussen de twee is enorm. Echter voor LLM's is die output het énige wat er is. De lagen erachter zijn er niet.
En nee, daarmee bedoel ik niet dat je sowieso LLM's niet kunt vertrouwen omdat het "maar taalmodellen zijn". Maar wel dat je de taalmodellen moet gebruiken voor wat ze zijn en wat ze doen. En het niet is omdat hun taal op de onze lijkt, dat hun denkvermogen/denkwijze op de onze lijkt of dat juistheid ook maar enige rol speelt. Wil je het gebruiken om een juiste zin te maken? Perfect. Om een tekst samen te vatten? Meer dan waarschijnlijk prima werk. Een computertaal is ook een taal, en nog wel een heel logische, dus coderen zal ook uitstekend lukken.
Om niet te filosofisch te worden: als ik hem vraag om "brood" te vertalen naar het Frans, zal hij dat vast goed doen. Hij zal geen idee hebben van wat een brood precies is, of betekent voor mensen, maar het staat er.