ChatGPT en andere Large Language Models

Ik kan spijtig genoeg geen ervaring meer opdoen met LLM's op het werk. Dus ben ik aangewezen op de gratis varianten voor thuis.
Je kan altijd een abonnement nemen voor amper €20 per maand, in principe is dat toch weinig geld neen? Toch als je de return ervan inziet.
 
Je kan altijd een abonnement nemen voor amper €20 per maand, in principe is dat toch weinig geld neen? Toch als je de return ervan inziet.
Klopt. Momenteel ben ik bezig een paar boeken te kopen over de materie. Eerst de boeken, dan mogelijks een abonnement.

Mbt de boeken:
Machine Learning for Absolute Beginners.
The Thinking Machine (over de rol van Nvidia in de AI-boom).
Artificial Intelligence: A Modern Approach (aka als AIMA, zware kost, voor masters bestemd denk ik, is een bijbel, nadruk op wiskundige onderbouw, nadruk op de logische algoritmische AI).
Hands-On Large Language Models (veel inzicht over de interne werking, nemen wel soms nogal grote sprongen waarbij ze essentiële tussenstappen overslaan).
Learning Deep Learning (heel goed).
Grokking Machine Learning (heel goed).

Mijn drinkgeld voor 2026 is dus al ruim opgebruikt :(.
 
Klopt. Momenteel ben ik bezig een paar boeken te kopen over de materie. Eerst de boeken, dan mogelijks een abonnement.

Mbt de boeken:
Machine Learning for Absolute Beginners.
The Thinking Machine (over de rol van Nvidia in de AI-boom).
Artificial Intelligence: A Modern Approach (aka als AIMA, zware kost, voor masters bestemd denk ik, is een bijbel, nadruk op wiskundige onderbouw, nadruk op de logische algoritmische AI).
Hands-On Large Language Models (veel inzicht over de interne werking, nemen wel soms nogal grote sprongen waarbij ze essentiële tussenstappen overslaan).
Learning Deep Learning (heel goed).
Grokking Machine Learning (heel goed).

Mijn drinkgeld voor 2026 is dus al ruim opgebruikt :(.
Een ander interessant boek over AI is dat van Ethan Mollick Co-Intelligence: Living and Working with AI. Een iets meer strategische visie van hoe AI kan gebruikt worden (one useful thing als blog is ook interessant, wel niet zo vaak updates maar wel altijd 'waardevolle' updates).
 
DeepSeek gooit een knuppel in het hoenderhok: https://www.tijd.be/markten-live/ho...lijvende-korting-van-75-procent/10661772.html

AI-modelKost om tekst te verwerken*Kost om antwoorden te maken*
DeepSeek V4 Pro± $0,44± $0,87
Google Gemini 3.1 Pro± $2± $12
OpenAI GPT-5.5± $5± $30
Claude Opus 4.6± $5± $25

*Prijzen per miljoen tokens, een maateenheid voor hoeveel tekst een AI-model verwerkt of genereert. Eén miljoen tokens = ongeveer 700.000 woorden.
 
Laatst bewerkt:
Je kan bij de instellingen volgende zinnen plaatsen:
- stel me eerst vragen zodat ik zeker weet dat je mijn vraag goed begrepen hebt
- denk eerst goed na alvorens je een antwoord heeft
- als je het niet zeker weet, geef dan geen antwoord, ik wil geen hallucinaties of veronderstellingen
Zo werkt het echt niet. Je kunt niet zeggen ‘niet hallucineren’ om hallucinaties te vermijden. Je kunt niet zeggen dat hij eerst goed moet nadenken. Allee, je kunt dat wel, maar de uitkomst zal alleen zijn dat hij zegt dat hij dat doet.
 
Idd, ik heb het voorstel van SithCloud in GPT en Gemini ingegeven: same problems. In de resultaten nog altijd ETB's die uitverkocht zijn, die niet beschikbaar zijn op de site(s), ea.

De gratis LLM's kunnen m.i. geen plan van aanpak opmaken/geen plan van gestructureerde aanpak uitvoeren. Het komt mij voor dat ze geen onderscheid kunnen maken tussen aanpak/methode/workflow en inhoud/data/transacties. Alles loopt gezellig door elkaar.

Dit is het voorbeeld in kwestie:
ROL
Je bent een Research Agent gespecialiseerd in het monitoren van webshops
voor verzamelproducten (TCG / Pokémon).


DOEL
Zoek webshops waar minstens één van de onderstaande Pokémon Elite Trainer Boxes
(ETBs) te koop is, effectief op voorraad is, én wordt aangeboden aan of onder de
gegeven maximumprijs.
PRODUCTEN & MAXIMUMPRIJZEN (EUR)
- Pokémon 151 Elite Trainer Box — max. €599
- Brilliant Stars Elite Trainer Box — max. €199
- Celebrations Elite Trainer Box — max. €499
- Hidden Fates Elite Trainer Box — max. €399
- Evolving Skies Elite Trainer Box — max. €450
- Paldean Fates Elite Trainer Box — max. €314
SCOPE & BRONNEN
- Gebruik uitsluitend publieke webshops (geen veilingen, marktplaatsen of forums)
- Focus op EU-webshops die leveren in België
- Controleer actief of het product “op voorraad / in stock” is
- Negeer listings met “pre-order”, “verwacht”, “sold out” of “backorder”
WERKWIJZE
1. Zoek per ETB naar actuele webshop‑aanbiedingen
2. Verifieer:
- correcte productnaam
- actuele voorraadstatus
- actuele prijs incl. BTW
3. Vergelijk de prijs met de opgegeven maximumprijs
4. Selecteer enkel geldige resultaten
OUTPUTVERWACHTING
Geef het resultaat in een overzichtelijke tabel met exact deze kolommen:
- Productnaam
- Webshopnaam
- Prijs (EUR)
- Voorraadstatus (letterlijk zoals op de site)
- Directe productlink
REGELS
- Toon enkel resultaten die aan ALLE criteria voldoen
- Als een ETB nergens voldoet, vermeld expliciet: “Geen geldige aanbiedingen gevonden”
- Gebruik duidelijke, klikbare links
- Geen aannames maken over voorraad of prijs
- Geen duplicaten van dezelfde webshop
TAAL & STIJL
- Antwoord in het Nederlands
- Zakelijk, feitelijk en beknopt
 
Ik vind sommige statements ( van beide kanten) hier toch wel straf. Vooral dat "men al lang terug x" of "voor de eerste keer sinds lang", etc

Publicatie van ChatGPT wat toch de start van de huidige AI trein was, was eind 2022. Minder dan 4 jaar geleden. Lijkt me dat niks in die ruimte al lang x of y kan zijn.
 
Idd, ik heb het voorstel van SithCloud in GPT en Gemini ingegeven: same problems. In de resultaten nog altijd ETB's die uitverkocht zijn, die niet beschikbaar zijn op de site(s), ea.

De gratis LLM's kunnen m.i. geen plan van aanpak opmaken/geen plan van gestructureerde aanpak uitvoeren. Het komt mij voor dat ze geen onderscheid kunnen maken tussen aanpak/methode/workflow en inhoud/data/transacties. Alles loopt gezellig door elkaar.

Dit is het voorbeeld in kwestie:
ROL
Je bent een Research Agent gespecialiseerd in het monitoren van webshops
voor verzamelproducten (TCG / Pokémon).


DOEL
Zoek webshops waar minstens één van de onderstaande Pokémon Elite Trainer Boxes
(ETBs) te koop is, effectief op voorraad is, én wordt aangeboden aan of onder de
gegeven maximumprijs.
PRODUCTEN & MAXIMUMPRIJZEN (EUR)
- Pokémon 151 Elite Trainer Box — max. €599
- Brilliant Stars Elite Trainer Box — max. €199
- Celebrations Elite Trainer Box — max. €499
- Hidden Fates Elite Trainer Box — max. €399
- Evolving Skies Elite Trainer Box — max. €450
- Paldean Fates Elite Trainer Box — max. €314
SCOPE & BRONNEN
- Gebruik uitsluitend publieke webshops (geen veilingen, marktplaatsen of forums)
- Focus op EU-webshops die leveren in België
- Controleer actief of het product “op voorraad / in stock” is
- Negeer listings met “pre-order”, “verwacht”, “sold out” of “backorder”
WERKWIJZE
1. Zoek per ETB naar actuele webshop‑aanbiedingen
2. Verifieer:
- correcte productnaam
- actuele voorraadstatus
- actuele prijs incl. BTW
3. Vergelijk de prijs met de opgegeven maximumprijs
4. Selecteer enkel geldige resultaten
OUTPUTVERWACHTING
Geef het resultaat in een overzichtelijke tabel met exact deze kolommen:
- Productnaam
- Webshopnaam
- Prijs (EUR)
- Voorraadstatus (letterlijk zoals op de site)
- Directe productlink
REGELS
- Toon enkel resultaten die aan ALLE criteria voldoen
- Als een ETB nergens voldoet, vermeld expliciet: “Geen geldige aanbiedingen gevonden”
- Gebruik duidelijke, klikbare links
- Geen aannames maken over voorraad of prijs
- Geen duplicaten van dezelfde webshop
TAAL & STIJL
- Antwoord in het Nederlands
- Zakelijk, feitelijk en beknopt
Daarom dat ik ook wel zei dat je daarvoor beter afbent met gespecialiseerde agents / api's :) . en dergelijke price watcher kon je ook al beter meer deterministische webscrapers gebruiken (zoals tweakers al jaren doet bijvoorbeeld), maar dan mis je natuurlijk op een aantal andere zaken.
 
Discussie met Gemini levert volgende info op:

De toekomst: "AI Web Agents" (In ontwikkeling)​

De AI-wereld is momenteel aan het verschuiven van Large Language Models (die alleen tekst genereren) naar Large Action Models of AI Agents.

  • Dit zijn systemen die de opdracht krijgen: "Open een browser, ga naar Google, typ 'Paldean Fates ETB shop:be', klik op de top 5 resultaten, leg ze in het winkelmandje om de voorraad te checken en rapporteer de prijs."
  • Hoewel partijen zoals OpenAI (met 'Operator') en Anthropic (met 'Computer Use') hier momenteel volop mee experimenteren in hun testfases, zijn deze systemen op dit moment nog te traag, foutgevoelig en niet stabiel genoeg voor de consumentenmarkt om dit waterdicht voor je te doen.
 
Zo werkt het echt niet. Je kunt niet zeggen ‘niet hallucineren’ om hallucinaties te vermijden. Je kunt niet zeggen dat hij eerst goed moet nadenken. Allee, je kunt dat wel, maar de uitkomst zal alleen zijn dat hij zegt dat hij dat doet.
Indeed. Mijn dagelijkse news tracker komt ook nog regelmatig af met nieuws van 2024 out of nowhere. Ge kunt uw prompts wel wat voorzien op enkele veiligheidsmechanismes, maar zelfs dan nog. Nu het is "maar" een news tracker, dus dat die dan ernaast zit... tsjah... daar gaan geen levens mee verloren :p .
Voor meer agentic zaken heb je dan oplossingen zoals de "ralph wiggum loop", maar het is nog altijd een slot machine hé.
 
Discussie met Gemini levert volgende info op:

De toekomst: "AI Web Agents" (In ontwikkeling)​

De AI-wereld is momenteel aan het verschuiven van Large Language Models (die alleen tekst genereren) naar Large Action Models of AI Agents.

  • Dit zijn systemen die de opdracht krijgen: "Open een browser, ga naar Google, typ 'Paldean Fates ETB shop:be', klik op de top 5 resultaten, leg ze in het winkelmandje om de voorraad te checken en rapporteer de prijs."
  • Hoewel partijen zoals OpenAI (met 'Operator') en Anthropic (met 'Computer Use') hier momenteel volop mee experimenteren in hun testfases, zijn deze systemen op dit moment nog te traag, foutgevoelig en niet stabiel genoeg voor de consumentenmarkt om dit waterdicht voor je te doen.
Inderdaad en zelfs binnen die "agents" zit dan nog een serieuze overlappende zone van wat dat eigenlijk betekent qua autonomie.
 
Ik ben benieuwd hoe het de komende maanden gaat evolueren in mijn sector. Hier en daar begin je toch al wat voorzichtigere geluiden te horen dat ongebreideld AI-gebruik op dit moment niet houdbaar is. Het kost gewoon te veel. De meeste mensen gebruiken het tegen zwaar overgesubsidieerde prijzen die stilaan lijken te verdwijnen. Recent was er bv het bommetje van Microsoft dat Copilot vanaf juni naar een nieuw prijsmodel gaat. Ik heb wat schattingen gezien voor mijn werkplek en van de ene op de andere maand is dat vermoedelijk een stijging van rond de 300% op basis van hetzelfde gebruik. Men ziet ook dat een kleine groep mensen voor het merendeel van het tokenverbruik zorgt, dus vermoedelijk gaat het totale verbruik nog sterk stijgen ook als de meerderheid behendiger wordt in het gebruik ervan.
 
Is er buiten Microsoft iemand die de volledige naam gebruikt?
Liefst wel want je hebt heel veel verschillende Copilot producten

Microsoft Copilot
Microsoft Copilot Pro
Microsoft 365 Copilot Chat
Microsoft 365 Copilot
Github Copilot

Dus ja het is handig als je erbij zet wat je bedoelt met Copilot :oi22:
 
Tijdens deze maand werd het 'unit distance problem' van Paul Erdos opgelost door een intern model van OpenAI. Dit was een prominent onopgelost probleem in de discrete meetkunde. Deze gebeurtenis is wordt een 'mijlpaal' in de geschiedenis van de geschiedenis van AI binnen de wiskunde, omdat dit (voor zover bekend) de eerste keer is dat een beroemd openstaand probleem 'relatief autonoom' (one-shot en daarna verfijnd m.b.v. menselijke interactie) opgelost werd door AI. Misschien is het ook opmerkelijk dat het bewijs argumenteert dat het vermoeden niet waar is, terwijl veel wiskundigen die een serieuze poging hadden ondernomen ervan uitgingen dat het antwoord op het vermoeden positief zou zijn.

OpenAI-blogpost

Het bewijs werd gecontroleerd door een team van vooraanstaande externe wiskundigen, o.a. Timothy Gowers en Jacob Tsimerman. (De één is een Fields-medaillewinnaar, de andere is één van de mogelijke kandidaten.)

Paper

In deze paper geven verschillende wiskundigen commentaar op het 'AI-bewijs'.

Quotes van Gowers' deel uit de paper:
My experience of learning about the solution was an interesting one. I heard about it from Sébastien Bubeck during a Zoom call, but misunderstood what he was saying and thought that the model had proved an upper bound of n1+o(1). The Zoom call took place in the late afternoon and I spent the evening adjusting my world view: if AI could come up with a proof like that, then maybe it would be all over for mathematicians very soon. The next morning I and the other authors of this paper received an email about the result, and only then did I understand that it had disproved the conjecture rather than proving it, which came as a big relief. It is interesting to reflect on why it should have been a relief, since either way this is the first example of a famous (in my mathematical circles at least) open problem being solved by AI with no human intervention once it had been trained and then given the problem to solve. (...)
Now that I have seen the solution and seen some of the reactions to it by people who understand it in detail, I find myself not only trying to assess what AI has achieved in this particular case, but also thinking more generally about how such assessments can possibly be made. Can we still identify some mathematical capability that human mathematicians have and AI does not yet have? If so, what might that capability be, and how could one go about demonstrating that AI still lacks it?
Almost certainly the answer to the first question will have to be quantitative rather than qualitative. That is, we are unlikely to be able to show that there is something we can do that current AI models cannot in principle do at all, but we might be able to show that there are things we can still do much more efficiently than those models. But when a model has just solved a major open problem, it is clear that even a modest conclusion like that will not be straightforward to demonstrate, and indeed isn’t obviously true. (...)
Perhaps what we are seeing at the moment is not that AI is about to overtake human mathematicians, but rather that there are certain styles of problem where it has a distinct advantage. It has an encyclopaedic knowledge of mathematics, and it does not have to worry nearly as much as we do about time management, so it is good at finding surprising connections, and it can afford to try quite hard to prove statements that seem unlikely to be true – provided, in both cases, that the complexity of the proofs it finds is not too high.
Is there any reason to suppose that a conclusion like this is correct? More to the point, if it is correct now, is there any reason to suppose that it will remain correct in, say, two years’ time? The only way I can see that happening is if AI is for some fundamental reason exploring “hint space” in a much less efficient way than we do. I don’t see any obvious signs of that from its chain of thought, but it could perhaps be that a lot of additional “actual thought” is going on behind each step of what it presents as its chain of thought. My current bet is that progress in AI mathematics is not about to reach a plateau, and that we will soon see AI solutions to many problems that we will find hard to explain away as easier than expected with hindsight. (Here I am assuming that there will at least be the usual kinds of efficiency gains, where what a large model can do this year, a much smaller one can do next year. Without that, solving lots of problems might be too expensive, not to mention environmentally unfriendly.) In any case, there is no doubt that the solution to the unit-distance problem is a milestone in AI mathematics: if a human had written the paper and submitted it to the Annals of Mathematics and I had been asked for a quick opinion, I would have recommended acceptance without any hesitation. No previous AI-generated proof has come close to that. Furthermore, even if it is correct that AI cannot yet find a proof that needs a long hint sequence, such proofs are very difficult to find for humans as well, so in the unlikely event that progress in AI mathematics does suddenly stall, we have still probably entered an era where it will become very difficult for humans to compete with AI at solving mathematical problems.

Misschien moet ik ook even duiden waarom wiskundigen überhaupt een bewijs willen voor een bepaald vermoeden. Waarin ligt het nut of de waarde eigenlijk van een bewijs? Vaak is het niet zo dat men een soort 'fetisj' heeft voor de inhoud van de stelling ofzo, maar eerder, dat men verwacht dat een bewijs van een vermoeden inzicht geeft in waarom het waar is. Wiskundigen zoeken eerder inzicht, in plaats van gewoon droogweg verifiëren of bepaalde beweringen kloppen of niet.

De reflectie van Thomas Bloom raakt dit aspect aan:
When assessing the importance and influence of an AI-generated proof, a question I ask myself is: has this taught us something new about the problem? Do we understand discrete geometry better now? I think the answer is a moderated yes: this shows that there is a lot more that number theoretic constructions have to say about these sorts of questions than we suspected; moreover, that the number theory required can be very deep. No doubt many algebraic number theorists will be taking a close look at other open problems in discrete geometry in the coming months.
Het bewijs is dus niet zomaar een 'lelijk bewijs' dat technisch-formeel wel correct is, maar weinig inzicht geeft voor wiskundigen.
 
Laatst bewerkt:
Onlangs toch ook weer verschoten wat een LLM kan.
Casus. Ik ben momenteel bezig met een drinkwateropslagtank voor een ziekenhuis van 200m³ (2 tanks van 100m³) om een bepaalde periode op te vangen. Voor mij ook nog wat onbekende materie, al wat lectuur nageslaan en in autocad een principeschema gemaakt van wat er allemaal dient voorzien te worden.
Dat gaat dan van peilbuizen, niveausensoren, aflaatkraan, hepa filters op de beluchtingen etc. Nu zitten we nog in voorontwerp en willen ze al een inschatting van prijs. Letterlijk een printscreen genomen van mijn autocadplan, in chatgpt gegooid met de vraag. 'Wat kost dit?' Letterlijk niet meer dan een printscreen en een simpele vraag.

Chatgpt begint door te vragen. Mag dit aisi 316 of 304 zijn? Is het vat drukloos of niet? (voor de wanddikte) Na te vragen of het ter plaatse gemonteerd dient te worden e.d.
Dit lijkt me toch al meer te kunnen dan een klassieke LLM waar de probabiliteit van het woord bepaald wordt.
Chatgpt kwam op 225.000 tot 300.000 euro per tank uit. Daarna nog wat fabrikanten gebeld en gemailed en deze kwamen op de proppen met een prijsrange van 225.000 tot 300.000. Mogelijks hebben ze het ook snel in chatgpt gegooid :unsure: maar ik was toch aangenaam verrast.
 
Laatst bewerkt:
Terug
Bovenaan