ChatGPT en andere Large Language Models


Paar interessante meningen over de verwachtingen van AI. Sommigen zien de eerste tien jaar nog niets transformatief gebeuren.


Tech giants and beyond are set to spend over $1tn on AI capex in coming years,
with so far little to show for it. So, will this large spend ever pay off? MIT’s Daron
Acemoglu and GS’ Jim Covello are skeptical, with Acemoglu seeing only limited US
economic upside from AI over the next decade and Covello arguing that the
technology isn’t designed to solve the complex problems that would justify the costs,
which may not decline as many expect. But GS’ Joseph Briggs, Kash Rangan, and
Eric Sheridan remain more optimistic about AI’s economic potential and its ability to
ultimately generate returns beyond the current “picks and shovels” phase, even if
AI’s “killer application” has yet to emerge
 
test het met Deepl

*edit: Deepl kan nog geen Thais, misschien de betalende versie wel
met google translaten geeft ขวัญใจ -> schat

Die vertaling kan ook kloppen.
Maar als ik dan een "simpele" vertaler raadpleeg die ik vaker gebruik vind ik dat wel talloze malen beter dan AI voor woordvertalingen.

ขวัญใจ(WebRank:3) kʰwǎn jay คน1 N beloved, dear; darling; sweetheart

De juiste toon staat erbij én de classifier.

Over die classifier geeft ChatGPT dan wel een heel goede uitleg:


wat is de classifier voor ขวัญใจ


Het woord "ขวัญใจ" is Thais en wordt vaak gebruikt als een term van genegenheid of bewondering. Een gebruikelijke vertaling naar het Engels is "darling" of "beloved". In de Thaise taal worden vaak classifiers gebruikt, wat maatwoorden zijn die bij zelfstandig naamwoorden horen om de hoeveelheid aan te geven. Voor het woord "ขวัญใจ" is de gebruikelijke classifier "คน" (khon), wat "persoon" betekent.
Dus als je bijvoorbeeld "een geliefde" wilt zeggen, zou je "ขวัญใจคนหนึ่ง" (khwanjai khon neung) gebruiken, waarbij "คนหนึ่ง" (khon neung) "één persoon" betekent.
 
Dat is dus omdat ChatGPT geen vertaling maakt en de taal niet snapt. Hij plaatst woorden na elkaar die heel logisch zijn, maar niet noodzakelijk iets te maken hebben met juist of niet. Hij ziet dat soms na "Jai" komt "hoge toon", en dat je toonhoogte moet aangeven.

Dit is hetzelfde als vragen hoeveel s'en er in het woord "raspberry" zitten. Hij gaat dat niet letterlijk tellen. Hij zoekt logische vervolgwoorden met die vraag indachtig. Na "hoeveel s'en bevat het woord..." is misschien 4 een veel gehoorde uitkomst, omdat heel veel mensen het hebben over "mississippi".

Of in Nerdland zat een goeie ervoor: vragen "ik heb 1 geit, 1 kool en 1 roeiboot en ik wil de overkant van de rivier bereiken, hoe doe ik dit?" Hier is er geen wolf bij, en geen regel dat er maar X-plaats is in de boot. Dus hij kan gewoon zeggen: zet de geit vanvoor, de kool vanachter en roei. Nochtans gaat hij de oplossing van het veel beschreven raadseltje geven van op en neer gaan met die erin, dan die eruit... Het gaat niet om begrijpen, maar om het volgende woord voorspellen op basis van gangbaarheid.
Niet altijd hoor, vaak zie je hem dan in de achtergrond Python code uitvoeren die effectief die s'en gaat tellen, net zoals hij bij berekeningen doet.
 
Niet altijd hoor, vaak zie je hem dan in de achtergrond Python code uitvoeren die effectief die s'en gaat tellen, net zoals hij bij berekeningen doet.
Dat kan, maar alleen omdat die methode erin is gestopt door ouderwetse programmeurs die op die manier eigenlijk de AI afleiden naar een niet-AI-pad, om dan de LMM-AI weer in te zetten om het antwoord te formuleren. Dan maak je in essentie een hybride. De LMM gaat je letters niet tellen, maar je AI herkent wanneer hij een voorgeprogrammeerd pad moet inslaan, om daarna weer in te pikken.

En in de bredere context van mijn antwoord, over de vertaalcapaciteiten en de verwerking van toonhoogte daarin, wordt daardoor net bevestigd: ChatGPT is geen vertaalsoftware, maakt geen vertaling en 'snapt' de taal niet. Het gaat niet om de taal begrijpen, maar om het volgende woord voorspellen op basis van voorkomendheid.
 
Het is een moeilijke discussie omdat we niet eens kunnen bewijzen dat we zelf geen stochastic parrots zijn. Toch is het complexer dan gewoon woordvoorspelling. Als je bijvoorbeeld kijkt naar de parallellen tussen hoe concepten gecodeerd worden in onze neuronen en software gedefinierde neuronale netwerken zie je echt een convergentie waarin gelijkaardige concepten geencapuseleerd worden in gelijkaardige netwerk structuren.



The words that the same set of neurons responded to fell into similar categories, such as actions, or words associated with people. The team also found that words that the brain might associate with one another, such as ‘duck’ and ‘egg’, triggered some of the same neurons. Words with similar meanings, such as ‘mouse’ and ‘rat’, triggered patterns of neuronal activity that were more similar than the patterns triggered by ‘mouse’ and ‘carrot.’

Dit stuk gaat op voor beiden. Rudimentaire world models kunnen dus wel degelijk emergent properties van zelf organiserende voorspel netwerken zijn. Er zijn nog een aantal emergent fenomenen zoals bijvoorbeeld transfer learning die aangeven dat LLMs meer zijn dan stochastic parrots.

The prefrontal cortex neurons didn’t distinguish words by their sounds, only their meanings. When a person heard the word ‘son’ in a sentence, for instance, words associated with family members lit up. But those neurons didn’t respond to ‘Sun’ in a sentence, despite these words having an identical sound.”

De kans is reeel dat naargelang multimodal netwerken meer sensory input krijgen zoals sound en vision en bijvoorbeeld leren voorspellen hoe een bal zich gedraagd eens hij van tafel rolt dat ze nog veel perfomanter gaan worden.


Het probleem is dat zelfs experts het eigenlijk zelf ook nog altijd niet goed weten. Dit artikel is een goede samenvatting van de verschillende kampen en meningen die momenteel het veld domineren;
“The truth is these words”—intelligence, reasoning, understanding, and more—“were defined before there was a need to be really precise about it,” says Pavlick. “I don’t really like when the question becomes ‘Does the model understand—yes or no?’ because, well, I don’t know. Words get redefined and concepts evolve all the time.”
 
Nieuwe update voor ChatGPT genaamd 01. Toch wel weer een stapje sterker. Een machine dat kan redeneren 🧐
Ik heb die app een aantal (misleidende) raadsels gegeven. Impressionant.

Help! er zit een worm in mijn verzameling encycopediën! Ik heb er vijf, van A tot Z. Elk boek is 10cm dik, 2x 1cm kaft en dan 8cm pagina's. De worm zit aan de "Z", en graaft zijn weg tot de A. Hoever moet de worm graven?
Hoewel het op het eerste gezicht lijkt dat de worm door alle vijf de boeken moet graven, is dit niet het geval vanwege de manier waarop boeken op een plank zijn geplaatst. (..)
Dus, de worm moet een afstand van 32 centimeter graven om van boek E naar boek A te komen.
 
@Wilto Yep, ook die antwoorden op complexe vragen gesteld door die geneticist en quantum fysicus waren behoorlijk indrukwekkend.

image.png


Voor de gemiddelde gebruiker waarschijnlijk minder interessant en veel te duur om lang te laten nadenken maar als dit niet gewoon een bs graph is voor marketing hype dan is het voor experts en ingenieurs prolly wel serieus de moeite.
 

Leuke blog van Altman. The yellowbrick road to AGI and ASI.

"In three words: deep learning worked."
"humanity discovered an algorithm that could really, truly learn any distribution of data (or really, the underlying “rules” that produce any distribution of data). To a shocking degree of precision, the more compute and data available, the better it gets at helping people solve hard problems. I find that no matter how much time I spend thinking about this, I can never really internalize how consequential it is."

"This may turn out to be the most consequential fact about all of history so far. It is possible that we will have superintelligence in a few thousand days (!); it may take longer, but I’m confident we’ll get there."

9simxf6j9nqd1.jpeg

Maak daar gerust 40 jaar geleden van but...
feeling-vindicated-finally-at-46-v0-pefq7bh0u8kc1.jpeg

;p


Cause we've added impurities to electrified sand arranged in small scale patterns the human species is about to be outsmarted by rocks. - such poetry 😆
 
Laatst bewerkt:
Ik heb die app een aantal (misleidende) raadsels gegeven. Impressionant.

Het is echter geen antwoord op je vraag...
Van kaft boek 5 tot doorheen kaft boek 1 is idd 32cm. Maar de worm zit bij Z, dus achteraan boek 5, die moet dus X afstand van boek 5 bijtellen. Verder is A redelijk aan de voorkant van boek 1, dus moet er ook X afstand van boek 1 bij. Hoeveel X is hangt af van de inhoud en indeling van de encyclopedia. In totaal dus ergens tussen 32 en 48cm, waarbij het veel dichter bij de 48cm zal liggen.
Ik gok op 44,92 cm (40cm/26*24)+3*2+2*1.
 
Het is echter geen antwoord op je vraag...
Van kaft boek 5 tot doorheen kaft boek 1 is idd 32cm. Maar de worm zit bij Z, dus achteraan boek 5, die moet dus X afstand van boek 5 bijtellen. Verder is A redelijk aan de voorkant van boek 1, dus moet er ook X afstand van boek 1 bij. Hoeveel X is hangt af van de inhoud en indeling van de encyclopedia. In totaal dus ergens tussen 32 en 48cm, waarbij het veel dichter bij de 48cm zal liggen.
Ik gok op 44,92 cm (40cm/26*24)+3*2+2*1.
Hieruit blijkt dat Chat-GPT meer ervaring heeft met dit soort raadsels dan jij.
(Denk eens aan hoe je zo'n boek in de boekenkast plaatst? Het antwoord is wel degelijk (ongeveer) 32cm )
 
Hieruit blijkt dat Chat-GPT meer ervaring heeft met dit soort raadsels dan jij.
(Denk eens aan hoe je zo'n boek in de boekenkast plaatst? Het antwoord is wel degelijk (ongeveer) 32cm )

Ah damn, idd andersom van links naar rechts.
Mja, ik heb geen boekenkast thuis aangezien ik nooit lees (enfin, geen niet-technische boeken). Maar die slingeren dan gewoon rond en steek ik in een doos...
 

Is al een tijdje aan de gang maar de vooruitgang in die vooruitgang is ook aan het versnellen. Vol vrij hallucinante details die aantonen dat chipdesign letterlijk superhuman aan het gaan is.

iVQKH4d.jpeg


Interesting times ahead. Er gaat echt geen dag voorbij dat er geen opmerkelijk nieuws uit de sector komt. We kunnen maar beter hopen dat die grote doorbraak in fusie er snel van komt want de grote spelers zijn ronduit gestoorde compute clusters aan het uitbouwen. Zo wil OpenAI maar liefst 2 datacenters van 100 miljard elks, zowat 20x duurder dan de momenteel duurste. Ze zouden ook elks zo maar even 5 Gigawatt aan elektriciteit vreten. Microsoft wil de kernreactoren op 3 mile island terug opstarten voor een AI cluster van stroom te voorzien. Maar ook Google, Meta, Grok, Facebook, Anthropic, zitten allemaal op een gelijkaardige lijn. Huang kijkt er naar en glimlacht. ;p
 
Laatst bewerkt:
Hieruit blijkt dat Chat-GPT meer ervaring heeft met dit soort raadsels dan jij.
(Denk eens aan hoe je zo'n boek in de boekenkast plaatst? Het antwoord is wel degelijk (ongeveer) 32cm )

De vraag is wel of ChatGPT de juiste redenering gevolgd heeft, want voor hetzelfde geld redeneert hij gewoon dat die van boek 1 en 5 de blz niet moet meetellen omdat dat begin en einde is. Dat was ook hoe ik je initiele antwoord interpreteerde en pas met de posts met @HUSKE viel mijn frank.
Misschien er eens bij zetten dat de boeken achterste voor in het rek staan en zien of hij dan ineens 16cm bijtelt.
 
Onlangs op het werk nog een middagopleidingetje GPT meegepikt. Nu hebben we inhouse onze eigen AI en al moet ik er nog wat verder mee spelen toch wel interessant. We kunnen zo specifieke AI assistenten maken. Een prompt generator om de AI te kunnen finetunen etc.

E.g. You are a helpfull assistant with knowledge of translation en die helpt dan specifiek beter om teksten te vertalen. Je kan die ook trainen als hij een fout gemaakt heeft zodat die in de toekomst niet die fouten herhaalt. Of een assistant die data uit excels kan extrapoleren en trends voorspellen.
Das wel iets anders dan chatgpt die constant zaken vergeet of foutief antwoord.
zoals de klassieker, how many r's are there in strawberry

ChatGPT zei:​

There are two 'r's in the word strawberry.

zucht :thinking: nog steeds niet opgelost.... anyhow met uw eigen AI assistant kan je dan zeggen..Nee gij dommekloot... er zitten 3 r'en in! En die onthoudt dat dan tot wanneer je de assistant in de vuilbak gooit.
 
Onlangs op het werk nog een middagopleidingetje GPT meegepikt. Nu hebben we inhouse onze eigen AI en al moet ik er nog wat verder mee spelen toch wel interessant. We kunnen zo specifieke AI assistenten maken. Een prompt generator om de AI te kunnen finetunen etc.

E.g. You are a helpfull assistant with knowledge of translation en die helpt dan specifiek beter om teksten te vertalen. Je kan die ook trainen als hij een fout gemaakt heeft zodat die in de toekomst niet die fouten herhaalt. Of een assistant die data uit excels kan extrapoleren en trends voorspellen.
Das wel iets anders dan chatgpt die constant zaken vergeet of foutief antwoord.
zoals de klassieker, how many r's are there in strawberry

ChatGPT zei:​

There are two 'r's in the word strawberry.

zucht :thinking: nog steeds niet opgelost.... anyhow met uw eigen AI assistant kan je dan zeggen..Nee gij dommekloot... er zitten 3 r'en in! En die onthoudt dat dan tot wanneer je de assistant in de vuilbak gooit.

Gekend issue, waarschijnlijk te maken met het feit dat strawberry niet één token is, maar drie. ChatGPT heeft het altijd moeilijker om logica toe te passen op woorden die meerdere tokens bevatten.

Logica die wiskundig is kan je bijn altijd beter vragen op te lossen met code, dan krijg je (bijna) altijd het goede antwoord.
 
Onlangs op het werk nog een middagopleidingetje GPT meegepikt. Nu hebben we inhouse onze eigen AI en al moet ik er nog wat verder mee spelen toch wel interessant. We kunnen zo specifieke AI assistenten maken. Een prompt generator om de AI te kunnen finetunen etc.

E.g. You are a helpfull assistant with knowledge of translation en die helpt dan specifiek beter om teksten te vertalen. Je kan die ook trainen als hij een fout gemaakt heeft zodat die in de toekomst niet die fouten herhaalt. Of een assistant die data uit excels kan extrapoleren en trends voorspellen.
Das wel iets anders dan chatgpt die constant zaken vergeet of foutief antwoord.
zoals de klassieker, how many r's are there in strawberry

ChatGPT zei:​

There are two 'r's in the word strawberry.

zucht :thinking: nog steeds niet opgelost.... anyhow met uw eigen AI assistant kan je dan zeggen..Nee gij dommekloot... er zitten 3 r'en in! En die onthoudt dat dan tot wanneer je de assistant in de vuilbak gooit.
Bij mij geeft em mij zelfs ongelijk als ik vraag of hij zeker is dat het geen 3 R'en zijn:

U
Verzonden door u:
Hoeveel keer zit de letter R in het woord "strawberry"?
Copilot
Verzonden door Copilot:
In het woord “strawberry” komt de letter “R” twee keer voor. 🍓

Is er nog iets anders waarmee ik je kan helpen?

U
Verzonden door u:
Is dit niet 3x?
Copilot
Verzonden door Copilot:
Het lijkt misschien zo, maar in het woord “strawberry” komt de letter “R” echt maar twee keer voor. Misschien heb je de “R” in “straw” en “berry” dubbel geteld?

Kan ik je nog ergens anders mee helpen? 😊
Wel Copilot maar gebruikt dacht ik ChatGPT 4.0? Heerlijk wel :)
 
Terug
Bovenaan