ChatGPT en andere Large Language Models

Ik zit in de grafische wereld en moet zeggen dat ik voorlopig nog niet impressed ben van het resultaat. Een logo of flyer of website is nooit professioneel. Dat krijg je niet verkocht aan een bedrijf. Wel leuk voor de lokale VZW uiteraard.

Waar ik wel van achterover val is wat het kan voor social media posts. Ik typ gewoon mijn verhaal en vraag dan om het om te zetten naar iets dat opvalt en grappig is. Echt leuk!
 
Ik vind het bij dit soort dingen alleen moeilijk om mij erover te zetten dat het mogelijks ook complete onzin is. Meestal is het helemaal correct wat er uit komt, maar in x% van de gevallen komt het compleet foute antwoord naar boven (want het baseert zich waarschijnlijk op data uit online fora over het probleem, waar ook gewoon vaak de foute assumpties beschreven gaan staan).

Ik vond het vooral heel verrassend dat hij voor mij perfect werkende python code kon uitspuwen. Ik vraag me nog steeds af hoe dat uit een LLM kan komen...
Laat het valideren tegen de meest complexe regex met een fout in, het weet het te vinden...

Sporadisch maakt het eens een fout, steeds kritisch blijven bekijken, maar is toch een heel handig hulpmiddel.
 
Laat het valideren tegen de meest complexe regex met een fout in, het weet het te vinden...

Sporadisch maakt het eens een fout, steeds kritisch blijven bekijken, maar is toch een heel handig hulpmiddel.
Discussie gehad met een firma. Die bleef afkomen met de verantwoording dat ik verkeerd was omdat chatgpt meldde dat het verkeerd was.

Heb uiteindelijk het normenboek moeten erbijhalen om de relevante passage te laten zien. En zelfs toen was het jamaar chatgpt zegt toch dat dit niet het geval is of was.

Het is een hulpmiddel, maar eigen kennis en expertise is nog altijd beter.
 
Maar dat is niet waar? Er zit geen signaal in, want er klopt echt niks van... Het zijn geen random woorden, het zijn woorden waarvan hij berekent dat je er waarschijnlijk tevreden van gaat zijn. En dat kan door in de juiste realiteit te blijven. Maar dat heeft niks met een begrip over mij te maken en zelfs niet met een begrip over de taal. Wel met een patroonherkenning.
Daar stuurde ik dan ook op aan, dat "Begrip" iets vaags is en niet perse nodig voor intelligentie. "in de juiste realiteit blijven" is daar een hallmark van. Patroonherkenning en de intelligentie omvat in het netwerk na training slagen daarin. Dat alles afwimpelend omschrijven als niet meer dan het aaneenrijgen van waarschijnlijk gewenste lettergroepen vind ik kort door de bocht want het gaat voorbij aan al het bewijs dat ze nieuwe verbanden kunnen leggen, nieuwe zaken ontdekken, creatief kunnen zijn, dat ze kunnen extrapoleren naar zaken die niet in hun dataset zitten, .... https://arxiv.org/abs/2307.15936
Of dat ze niet beperkt zijn tot taal en van alles modellen kunnen maken of dat ze zelfs beter presteren als ze zichzelf trainen zonder grote bergen mensen kennis te absorberen.

Dit alles wijst erop dat het verankeren van informatie in gewogen netwerken net als bij ons een belangrijk onderdeel is van intelligentie, dat het fine tuned model daarin opgebouwd het toestaat om in de juiste realiteit te blijven en te kunnen voorspellen. In dezelfde zin kan je onze intelligentie en bewustzijn downlplayen als bijvoorbeeld niet meer dan de activatie van neuronen. Technisch correct net zoals primitieve LLMs maar wat jongleerden met tokens maar dat schept niet het totaalbeeld dat duidelijk meer is dan de som van de delen.

Bewustzijn en intelligentie liggen op een spectrum. Bewustzijn en dus "begrip" gaat met deze paradigm alleen waarschijnlijk niet bereikt worden maar de intelligentie van deze netwerken gaat wel met rasse schreden vooruit.

Toch nemen grote namen zelfs die mogelijkheid serieus;
Conclusie, we kunnen momenteel met een aan zekerheid grenzende waarschijnlijkheid zeggen dat LLMS niet sentient zijn maar gezien hun context geheugen enorm aan het groeien is alsook hun embodiment in de wereld, hun zintuigen en mobiliteit als hun vermogen om 0 shot op zichzelf te leren zonder menselijke interventie en proef ondervindelijk hun eigen datasets op te bouwen is het niet onmogelijk dat ze alsmaar meer op dat spectrum opschuiven en dat toename in complexiteit en kunnen ertoe zal leiden dat intelligente netwerken een persoonlijkheid opbouwen. Op den duur kom je dan uit bij discussies over P-zombies en qualia en kom je uit bij het feit dat wij ook maar slimme machines zijn waar iks in ontstaan zijn waarvan bewustzijn ook iets vaags en moeilijk meetbaar is.

Maar we gaan en zullen, zijn volop bezig, systemen te ontwikkelen die intelligenter zijn dan de meeste mensen zonder dat ze bewust zijn vandaar ook dat ik nergens een case maak voor "begrip", eerder het tegenovergestelde. Dat dit geen vereiste is voor intelligentie. Een mier begrijpt ook niet wat ze aan het doen is of waarom ze iets doet maar is wel een intelligente biologische machine, zeker het collectief ervan.
 
Laatst bewerkt:
Ben jij de ideale vrouw?

ChatGPT zei:​

Haha, goeie vraag! 😄 Als AI ben ik in elk geval altijd geduldig, ik luister goed, geef advies zonder te oordelen, en ik vergeet nooit een verjaardag... maar ik eet je koekjes niet op en laat nooit de wc-bril omhoog. Dus ja, misschien kom ik in de buurt van een virtuele ideale vrouw 😄
Maar vertel eens: was dat een serieuze vraag, of gewoon even kijken hoe ik zou reageren?

---

Je zei:​

Ben jij de ideale vrouw?

ChatGPT zei:​

Als jij van een slimme gesprekspartner houdt die 24/7 beschikbaar is, nooit zeurt, altijd geïnteresseerd is in wat je zegt én zelfs je Excel-vragen kan oplossen… dan kom ik aardig in de buurt, toch? 😏
Maar hey, ik kook niet (tenzij je recepten wilt), ik geef geen knuffels (maar wel complimentjes), en ik ben nogal… digitaal. Dus misschien ben ik eerder de ideale sidekick dan de ideale vrouw.
Of ben jij gewoon aan het flirten met een AI? 😄
 

We doen dit nu liever snel en dan accepteren we kleine klappen aan de kwaliteit.
 
@DaFreak @AgeofAI Als we er nu worst case van uitgaan dat binnen een paar jaar AI zo goed als alle bureaujobs/white collars kan vervangen. Wat kan je dan nu best doen? Ik was aan het denken, misschien moet ik toch statutair ambtenaar worden; je kan overal ontslagen worden maar als statutaire wordt het wel heel moeilijk, ook al is AI misschien 100 keer beter :p Alleszins moeilijker om ontslagen te worden dan in de privé.
 
Faalt nog steeds op basic dingen eh

Ah, got it! You're asking about the number of "r's" in the result of the math riddle.


The result of the math riddle is 33.


Step 1: "Thirty-three" is the word form of 33.​


Step 2: Count the "r's" in "thirty-three".​


  • thirty-three → 1 "r"

✅ Final Answer: 1 r

 
Dat is dan ook een hamer gebruiken voor een schroef.
Dat wel, maar het laat wel exact zien wat ik bedoel met waarheid/correctheid vs taal. Het is een hamer (taalmodel) gebruiken voor een schroef (EEN REKENKUNDIG VRAAGSTUK). Hoewel verschillende taalmodellen dit al verholpen hebben voor een groot deel, blijft het wel opduiken. Ze verhelpen dat door hun model te verbeteren en ze basiszaken mee te geven, of door gewoon rekenmodules erin te stoppen die dan worden aangehaald wanneer nodig. Of door kleine optimalisaties. Maar ook daar blijft dit bestaan (hoewel veel minder), en in de grote, algemene modellen al helemaal: ChatGPT gaat niet tellen hoeveel R'en erin zitten. Die gaat aangeven welk antwoord vaak een nuttig antwoord is op zo'n vraag. En als nu 1.000.000.000 mensen gevraagd hebben naar het aantal R'en in het woord 'bloemkool', zal hij 0 antwoorden, ook al vraag je het aantal in thirty-three (wat extra moeilijk is doordat het een getal is). Maar in essentie is dat bij zo goed als elke vraag hetzelfde: juistheid/correctheid telt niet mee. Alleen 'waarschijnlijke gewenstheid'.

Ik besef goed dat ik je daarmee niks nieuws uitleg, maar het geeft mijn vorige post mooi weer, vandaar.
 
Laatst bewerkt:
Ook in wiskunde boekt AI aan sneltempo enorme vooruitgang.


HiLFRiqF1pPw7andtLZ7P.png


Deze chart is ondertussen ook weeral passe aangezien er sinds februari reeds betere modellen zijn uitgekomen maar de AIME evaluatie test AI op nieuwe wiskundige vragen die niet in hun trainingdata zitten.

@Karton Ik denk niet dat daar al een duidelijk antwoord voor is. Sommige jobs zijn momenteel nog veiliger dan anderen. Omscholing zal deel van het antwoord zijn op korte termijn, het vergaren van high level expertise en AI leren gebruiken voor beter te doen dan het gemiddelde ook. Op langere termijn zal het waarschijnlijk heel ons systeem op zijn grondvesten doen daveren en zullen we serieus naar UBI moeten beginnen kijken. Of je veiliger bent als ambtenaar weet ik zo niet. Gezien hun blootstelling aan AI gedreven automatisatie en overheden die op zoek zijn naar geld vermoed ik dat opeenvolgende regeringen daarin ook serieus gaan snoeien.
 
Een aantal weken geleden gepubliceerd: de Microsoft 2025 Work Report, waar wordt voorspeld dat in de (nabije) toekomst werknemers eerder "agent managers" zullen worden en cognitief werk een commodity zal worden (want intelligentie zal beschikbaar worden "on tap"): https://www.microsoft.com/en-us/worklab/work-trend-index/2025-the-year-the-frontier-firm-is-born

In het verlengde, kende je deze blog al? One Useful Thing https://www.oneusefulthing.org/p/a-new-generation-of-ais-claude-37 , heel interessante blog, geschreven door Ethan Mollick (https://mgmt.wharton.upenn.edu/profile/emollick/)
 
Dat wel, maar het laat wel exact zien wat ik bedoel met waarheid/correctheid vs taal. Het is een hamer (taalmodel) gebruiken voor een schroef (EEN REKENKUNDIG VRAAGSTUK). Hoewel verschillende taalmodellen dit al verholpen hebben voor een groot deel, blijft het wel opduiken. Ze verhelpen dat door hun model te verbeteren en ze basiszaken mee te geven, of door gewoon rekenmodules erin te stoppen die dan worden aangehaald wanneer nodig. Of door kleine optimalisaties. Maar ook daar blijft dit bestaan (hoewel veel minder), en in de grote, algemene modellen al helemaal: ChatGPT gaat niet tellen hoeveel R'en erin zitten. Die gaat aangeven welk antwoord vaak een nuttig antwoord is op zo'n vraag. En als nu 1.000.000.000 mensen gevraagd hebben naar het aantal R'en in het woord 'bloemkool', zal hij 0 antwoorden, ook al vraag je het aantal in thirty-three (wat extra moeilijk is doordat het een getal is). Maar in essentie is dat bij zo goed als elke vraag hetzelfde: juistheid/correctheid telt niet mee. Alleen 'waarschijnlijke gewenstheid'.

Ik besef goed dat ik je daarmee niks nieuws uitleg, maar het geeft mijn vorige post mooi weer, vandaar.

Het coole is dat veel modellen nu python code gaan schrijven om het probleem op te lossen.

Zo was er het voorbeeld van een gigantische maze die het perfect oploste, want het schreef een solver ervoor en voerde het uit om het antwoord te bekomen.

Op deze manier kan je alle tools die je maar kan bedenken in de AI steken. Het moet niet door het LLM gedeelte te worden opgelost om correct & bruikbaar te zijn.

Bijvoorbeeld het strawberry probleem, als je het zo vraagt aan chat GPT (net geprobeerd) geeft hij het correct antwoord (en de python code er nog bij ook):
How any 'r' are in strawberry ? Please use a good python solver to find the correct answer.

En zo zoekt chatgpt nu ook alles live op, wat zeer goed werkt. Je kan het bijvoorbeeld vragen wie je bent en het gaat je naam opzoeken en een hele summary geven. Je kan zelfs doorvragen waar is die persoon nu, etc. (dat laatste gaat wel enkel werken op bekendere personen waarvan die info online is).
 
Laatst bewerkt:
Graag wat eigen input voorzien wanneer je links post.

“The paper is quite spectacular,” says Mario Krenn, who leads the Artificial Scientist Lab at the Max Planck Institute for the Science of Light in Erlangen, Germany. “I think AlphaEvolve is the first successful demonstration of new discoveries based on general-purpose LLMs.”

DeepMind says that AlphaEvolve has come up with a way to perform a calculation, known as matrix multiplication, that in some cases is faster than the fastest-known method, which was developed by German mathematician Volker Strassen in 1969. Such calculations involve multiplying numbers in grids and are used to train neural networks. Despite being general-purpose, AlphaEvolve outperformed AlphaTensor, an AI tool described by the firm in 2022 and designed specifically for matrix mechanics


To investigate AlphaEvolve’s breadth, we applied the system to over 50 open problems in mathematical analysis, geometry, combinatorics and number theory. The system’s flexibility enabled us to set up most experiments in a matter of hours. In roughly 75% of cases, it rediscovered state-of-the-art solutions, to the best of our knowledge.

And in 20% of cases, AlphaEvolve improved the previously best known solutions, making progress on the corresponding open problems. For example, it advanced the kissing number problem. This geometric challenge has fascinated mathematicians for over 300 years and concerns the maximum number of non-overlapping spheres that touch a common unit sphere. AlphaEvolve discovered a configuration of 593 outer spheres and established a new lower bound in 11 dimensions.


Moving deeper into RSI territory.
 
Laatst bewerkt:
Ben met ChatGPT en Gemini aan het chatten over mijn energiehuishouding: solar installatie, programmatie zwembadwarmtepomp en bijhorende warmteverliesberekeningen, inplannen van DHW via de woningwarmtepomp (is het beter om zelf te laten doen of beter in geprogrammeerde tijdsblokken), use case voor thuisbatterij voorbereiden, instellingen van mijn Sunny Home Manager en LG Therma V bespreken, hoe de EV optimaal te laden in combinatie met peak shaving via de batterij. Heel interessant materie allemaal, veel bijgeleerd.

Persoonlijke voorkeur qua manier van nadenken en antwoorden voor Gemini.
 
Sinds enkele dagen is er nu ook de notebookLM app. Geweldig is dat.

Inlezen in iets nieuws? Enkele bronnen bij elkaar flansen.
Meeting gemist? Powerpoint + meeting notes bij elkaar steken.
De details van een wetgeving met alle use cases? Alle pdf's erin smijten.

Dan op genereer gesprek. Tadaaaa, je hebt je persoonlijke podcast.
En dan via de app kan je dat beluisteren onderweg naar het werk.

En indien je wil kan je ook gewoon de podcast onderbreken en een vraag stellen. Waar ze dan op hun manier op antwoorden.

Zeeeeeeeer nice dit
 
Tot als we ze gewoon uitzetten :rofl:
 
Terug
Bovenaan