ChatGPT en andere Large Language Models

Jezus, misschien al eens bedacht dat je negatieve vooringenomenheid en bijkomend onvermogen om zelfs maar de meest voor de hand liggende statements te erkennen niet echt uitnodigt om verder met jou in discussie te gaan?

Bon, ’k zal het dan toch maar eens wat voorbeelden uitschrijven. Van vorige week:

Literatuuronderzoek: ik moet weten hoe attribuut x/y/z veranderd onder een bepaalde conditie. Rechtstreeks in de chat vragen is uiteraard om problemen vragen. Script laten schrijven om 50 meest geciteerde relevante papers + 50 meest geciteerde relevante papers van de afgelopen 3 jaar in een Excel samen met bibliografische data neer te schrijven, aangevuld met effect van attribuut x/y/z beschreven in die paper. Daarna tabel laten maken met overzicht hiervan en corresponderende referenties o.b.v. diezelfde Excel. Heb daarna de tabel manueel geverifieerd, geen enkele fout. Pakweg 2-3 dagen werk in ongeveer 2u gedaan, door de manuele verificatie.

Word tabel die een volledige pagina beslaat met experimentele resultaten laten converteren naar Latex formaat. Daar heb ik een paar jaar geleden nog eens een volledige dag over gedaan want manueel ingewikkelde tabellen construeren in Latex is een PITA, dit keer duurde het 5 minuten.

Potentiële onderzoekspartners in Wallonië zoeken over onderwerp x, bij voorkeur met toegang tot relevante onderzoeksdata. Uiterst relevante lijst weergekregen, met als uitschieter iemand die de nodige expertise had en hoofd is van een lopend project met dataverzameling waar we naar op zoek waren, inclusief link naar een obscure pagina op de gelieerde universiteit naar dat project. Weet niet of ik die zelf zou gevonden hebben.

Uitgebreide Gantt chart laten maken op basis van uitgeschreven werkpakketten en milestones. 1/2 dag werk in 10 minuten.

Paar slides laten genereren om diezelfde onderzoekspartners over ons project te vertellen.
kan er ook niet aandoen dat gij u meteen in uw gat gebeten voelt. Enkel en alleen omdat ik wat counter-onderzoek post om nuance te brengen in algemene statements.

Maar dat zijn mooie use cases die jij brengt. Merci voor de moeite om het op te sommen en goed om te zien dat ge de human in the loop houdt.

edit: ik zou ook denken dat de sketch dat ik erbij postte met de "not so fast" ook niet aanvallend bedoeld was, maar bon...
 

The startup expects a 130% revenue surge to $10.9 billion in the June quarter and its first operating profit, defying skeptics of the AI boom​

hmhm
The company disclosed the figures to investors as part of an ongoing funding round
hm
The company might not remain profitable for the full year as it plans spending increases due to its vast computing needs.
hmm
It is unclear what accounting methods Anthropic has used to book revenue and costs, as the company isn’t yet required to follow the financial-reporting requirements of a public company.
HMHMMMM........


Allee, sorry. Maar what the actual efff is dat artikel zelfs :D
 
Kom hé, boven wat @SithCloud hierboven aanhaalt, viel deze mij ook direct op:
Demand for Anthropic’s products has strained its computing resources and forced it to limit access for certain users. The company signed a string of new data-center deals in recent weeks to help it expand capacity, including with Elon Musk’s SpaceX.
vs
In the first quarter, Anthropic spent 71 cents on computing power for every dollar it made. In the current quarter, it expects to spend 56 cents per dollar, a sign that the business is becoming more efficient as it grows.
Het vette, lol. Eerst zeggen dat ze te weinig compute power hebben om hun huidige klanten van service te voorzien, dan zeggen dat ze efficiënter worden...

Zeker in combinatie met het stukje dat hierboven ook al gequote is dat ze niet denken om op jaarbasis nog winst te maken.
Da's natuurlijk heel creatief met cijfers omgaan net bij een funding round :P Voor een kwartaal de inkomsten wel meerekenen maar lopende kosten (compute power aankopen) ff uitstellen en ondertussen beperktere service aanbieden...
 
Kom hé, boven wat @SithCloud hierboven aanhaalt, viel deze mij ook direct op:

vs

Het vette, lol. Eerst zeggen dat ze te weinig compute power hebben om hun huidige klanten van service te voorzien, dan zeggen dat ze efficiënter worden...

Zeker in combinatie met het stukje dat hierboven ook al gequote is dat ze niet denken om op jaarbasis nog winst te maken.
Da's natuurlijk heel creatief met cijfers omgaan net bij een funding round :P Voor een kwartaal de inkomsten wel meerekenen maar lopende kosten (compute power aankopen) ff uitstellen en ondertussen beperktere service aanbieden...
SithCloud zijn quotes snap ik nog dat dat fishy is, maar de uwe... Ben ik niet mee? Als de efficiëntie stijgt, klopt het toch dat dat qua compute power bespaart en de klanten beter kunnen servicen?
 
SithCloud zijn quotes snap ik nog dat dat fishy is, maar de uwe... Ben ik niet mee? Als de efficiëntie stijgt, klopt het toch dat dat qua compute power bespaart en de klanten beter kunnen servicen?
Maar dat zeggen ze net niet. Ze zeggen net dat er te weinig compute power is waardoor klanten gelimiteerde toegang krijgen...
Maar ze trekken de conclusie uit de verwachte kostencijfers, die dus berekend zijn met die gelimiteerde toegang. Die conclusie klopt niet, want de lagere kost is om te beginnen geschat maar vooral niet voor dezelfde service.
 
Maar dat zeggen ze net niet. Ze zeggen net dat er te weinig compute power is waardoor klanten gelimiteerde toegang krijgen...
Maar ze trekken de conclusie uit de verwachte kostencijfers, die dus berekend zijn met die gelimiteerde toegang. Die conclusie klopt niet, want de lagere kost is om te beginnen geschat maar vooral niet voor dezelfde service.
Dat boeit toch niet dat de service (lees: limits) verlaagd? Als dat een kostenbesparing met zich meebrengt, is dat toch wel een vorm van kostenefficiëntie? Al kiezen ze ervoor dat ze zaterdag en zondag gewoon de boel afsluiten om zo 20% efficiënter te worden, kan je toch ook niet zeggen dat het geen efficiëntiewinst is?
 
Dat boeit toch niet dat de service (lees: limits) verlaagd? Als dat een kostenbesparing met zich meebrengt, is dat toch wel een vorm van kostenefficiëntie? Al kiezen ze ervoor dat ze zaterdag en zondag gewoon de boel afsluiten om zo 20% efficiënter te worden, kan je toch ook niet zeggen dat het geen efficiëntiewinst is?
Je hebt een heel vreemde definitie van efficiëntiewinst... :unsure:

efficiëntie
de efficiëntie v. (economie) De meest effectieve manier om een beoogde doelstelling te bereiken.
efficiëntiewinst
de efficiëntiewinst v. (economie) Hogere opbrengst uit gelijk blijvende middelen (in tegenstelling tot hogere opbrengst door groei).
Service verminderen is niet dezelfde beoogde doelstelling en ook niet een hogere opbrengst (met gelijk blijvende middelen) voor mij.
 
Je hebt een heel vreemde definitie van efficiëntiewinst... :unsure:



Service verminderen is niet dezelfde beoogde doelstelling en ook niet een hogere opbrengst (met gelijk blijvende middelen) voor mij.
Als uw kosten dalen en daardoor uw efficëntie stijgt, zie ik niet wat het probleem is. Jij begint dan over dat de service niet mag verminderen, hoezo niet?

Soit, jij bent wederom niet akkoord en het is zwart voor u, prima, het is zwart.
 
Je kan het natuurlijk zelf ook weer gaan spinnen of afdoen als leugens maar gezien men hier nog geen maand geleden beweerde dat deze bedrijven nooit winst zouden maken vind ik het best grappig dat ze nu reeds een eerste winstgevend kwartaal tegemoet gaan.
 
Je kan het natuurlijk zelf ook weer gaan spinnen of afdoen als leugens maar gezien men hier nog geen maand geleden beweerde dat deze bedrijven nooit winst zouden maken vind ik het best grappig dat ze nu reeds een eerste winstgevend kwartaal tegemoet gaan.

Dat is wat ze zéggen. Dat zijn daarnaast ook maar voorlopige aannames.
En met creatief boekhouden is een winstgevend kwartaal tegemoet gaan ook niet zo moeilijk.

Kom terug als ze effectief een winstgevend jaar hebben gehad.
 
Je kan het natuurlijk zelf ook weer gaan spinnen of afdoen als leugens maar gezien men hier nog geen maand geleden beweerde dat deze bedrijven nooit winst zouden maken vind ik het best grappig dat ze nu reeds een eerste winstgevend kwartaal tegemoet gaan.
Operationele winst. Wat niet hetzelfde is als netto winst en dat is zelfs geen garantie op netto winst.
Verder: Allee, dus als die mannen 1 dag winst maken, is het voor u dan op zich in orde? Als team X in sport Y een match wint in het midden van het seizoen, zijn ze daarmee toch nog niet kampioen? Lijkt me gewoon een vreemde redenering dat je hier hanteert.
 
Als uw kosten dalen en daardoor uw efficëntie stijgt, zie ik niet wat het probleem is. Jij begint dan over dat de service niet mag verminderen, hoezo niet?
Maar zie definitie efficiëntie, uw efficiëntie stijgt niet als je uw doelstelling ook verlaagt...
Soit, jij bent wederom niet akkoord en het is zwart voor u, prima, het is zwart.
Maar daar draait het niet om. Ze gaan creatief met cijfers om in hun schattingen en WSJ trekt conclusies uit schattingen en stellingen die ze er niet uit kunnen trekken.

Het belangrijkste is en blijft: eerst zien, dan geloven. Ik ga niet blind af op schattingen die waarschijnlijk opgeklopt zijn voor hun funding round. En al zeker niet af op 1 kwartaal als er letterlijk bijstaat dat er nog kosten aankomen want de contracten zijn al getekend voor meer compute power in de toekomst...
 
Dat is wat ik en anderen hier toen ook aanhaalden, dat ze nog jaren in groei modus gaan zitten en dus nog niet direct netto winst als doel voor ogen hebben maar dat als ze willen ze vandaag reeds winstgevend kunnen zijn. Er is dus wel degelijk een pad naar profitabality.

Natuurlijk doen ze dit speciaal voor die fundinground kracht bij te zetten maar het toont wel aan dat in tegendeel wat hier beweerd werd die bedrijven wel gemakkelijk winst kunnen maken. Ze worden vanzelf efficienter door de vooruitgang in hardware waar ze alsmaar meer kunnen doen voor eenzelfde operational cost. Daarnaast zullen ze ook het pad van andere techgiganten volgen en via enshittification nog meer geld uit de markt beginnen squeezen. Hun grootste kosten zitten in infrastructuur uitbouw en model ontwikkeling. Als ze vandaag op morgen beslissen de knop om te draaien en teren op wat ze hebben dan printen ze geld.
 
Voor mij is het allemaal nog wat nieuw. Ik heb de indruk dat ChatGPT en Gemini moeite hebben met een gestructureerde aanpak. Obv volgende cases:

1)Zoek mij webshops waar minstens 1 v/d volgende ETBs te koop zijn én in voorraad zijn, met de links en de prijs op de site:
Pokemon 151 Elite Trainer Box 599EUR
Brilliant Stars Elite Trainer Box 199EUR
Celebrations Elite Trainer Box 499EUR
Hidden Fates Elite Trainer Box 399EUR
Evolving Skies Elite Trainer Box 450EUR
Paldean Fates Elite Trainer Box 314EUR

Geen van beide slaagt er in dit op een gestructureerde manier aan te pakken. In de resultaten staan links in die niet werken, er staan ETBs in die niet in stock zijn ea.
Bij terugkoppeling van de fouten begint de LLM in rondjes te draaien. Dwz komt met nieuwe resultaten, nieuwe lijst ea. Slaagt er niet in een coherent beeld te behouden. Je moet echt vragen om het bij de oorspronkelijke maar dan aangepaste lijst te houden.
Resultaat: veel tijdverlies, verlies van overzicht.

2)Andere case: maak mij Powerpoint over LLM en hun werking. LLM genereert een slide-deck. Bij terugkoppeling van aanpassingen gaat het mis: het oorspronkelijke deck wordt overhoop gehaald, er gaan slides weg, er komen slides bij, de style wijzigt volledig ea.
Resultaat: veel tijdverlies, verlies van overzicht.

Ik heb zelf te weinig ervaring om de LLM in deze cases in goede banen te leiden. Ik vraag mij ook af hoe bedrijven hiermee omgaan. Een werknemer kan enerzijds veel tijd winnen maar anderzijds veel tijd verliezen bij het controleren en op punt stellen.
 
Operationele winst. Wat niet hetzelfde is als netto winst en dat is zelfs geen garantie op netto winst.
Verder: Allee, dus als die mannen 1 dag winst maken, is het voor u dan op zich in orde? Als team X in sport Y een match wint in het midden van het seizoen, zijn ze daarmee toch nog niet kampioen? Lijkt me gewoon een vreemde redenering dat je hier hanteert.
Het is wel daarover dat de discussie wat ging, ze konden enkel diensten aanleveren zijn door compute die betaald werd met VC geld dat ooit ging opraken, dat ze eigenlijk meer verlies draaiden als ze meer omzet kregen. Nu zitten ze, als die cijfers kloppen, al in een situatie waar ze reële winst maken op hun omzet.
 
Het is wel daarover dat de discussie wat ging, ze konden enkel diensten aanleveren zijn door compute die betaald werd met VC geld dat ooit ging opraken, dat ze eigenlijk meer verlies draaiden als ze meer omzet kregen. Nu zitten ze, als die cijfers kloppen, al in een situatie waar ze reële winst maken op hun omzet.
Inderdaad. Als ze kloppen. We zullen zien binnen x aantal maanden hé. Maar ik ga niet zomaar afgaan op wat gewoon een editorial puff piece is.
 
Dat is wat ik en anderen hier toen ook aanhaalden, dat ze nog jaren in groei modus gaan zitten en dus nog niet direct netto winst als doel voor ogen hebben maar dat als ze willen ze vandaag reeds winstgevend kunnen zijn. Er is dus wel degelijk een pad naar profitabality.

Natuurlijk doen ze dit speciaal voor die fundinground kracht bij te zetten maar het toont wel aan dat in tegendeel wat hier beweerd werd die bedrijven wel gemakkelijk winst kunnen maken. Ze worden vanzelf efficienter door de vooruitgang in hardware waar ze alsmaar meer kunnen doen voor eenzelfde operational cost. Daarnaast zullen ze ook het pad van andere techgiganten volgen en via enshittification nog meer geld uit de markt beginnen squeezen. Hun grootste kosten zitten in infrastructuur uitbouw en model ontwikkeling. Als ze vandaag op morgen beslissen de knop om te draaien en teren op wat ze hebben dan printen ze geld.
Wij van wc-eend...

Het is aan het gebeuren, hoor, in de industrie. De eerste stappen worden gezet om terug te trekken uit het idee dat AI zaken gaat overnemen, uit de absolute overtuiging dat hele sectoren gingen weggevaagd worden. Zelfs de meest overtuigde sectoren snappen de beperking van een LLM en gaan al naar AI-aided ipv AI-made.

Het probleem is dat er echt wel heel veel in zit. Maar niet zoveel als tot wat het wordt opgepompt. En om dat te ontkrachten, post je een artikel dat dat opnieuw allemaal oppompt. Hoe toont het aan dat ze wel gemakkelijk winst kunnen maken? Het toont dat de mogelijkheid er nog altijd is, en die is er alleen zolang we dat allemaal blijven geloven.
 
Voor mij is het allemaal nog wat nieuw. Ik heb de indruk dat ChatGPT en Gemini moeite hebben met een gestructureerde aanpak. Obv volgende cases:

1)Zoek mij webshops waar minstens 1 v/d volgende ETBs te koop zijn én in voorraad zijn, met de links en de prijs op de site:
Pokemon 151 Elite Trainer Box 599EUR
Brilliant Stars Elite Trainer Box 199EUR
Celebrations Elite Trainer Box 499EUR
Hidden Fates Elite Trainer Box 399EUR
Evolving Skies Elite Trainer Box 450EUR
Paldean Fates Elite Trainer Box 314EUR

Geen van beide slaagt er in dit op een gestructureerde manier aan te pakken. In de resultaten staan links in die niet werken, er staan ETBs in die niet in stock zijn ea.
Bij terugkoppeling van de fouten begint de LLM in rondjes te draaien. Dwz komt met nieuwe resultaten, nieuwe lijst ea. Slaagt er niet in een coherent beeld te behouden. Je moet echt vragen om het bij de oorspronkelijke maar dan aangepaste lijst te houden.
Resultaat: veel tijdverlies, verlies van overzicht.

2)Andere case: maak mij Powerpoint over LLM en hun werking. LLM genereert een slide-deck. Bij terugkoppeling van aanpassingen gaat het mis: het oorspronkelijke deck wordt overhoop gehaald, er gaan slides weg, er komen slides bij, de style wijzigt volledig ea.
Resultaat: veel tijdverlies, verlies van overzicht.

Ik heb zelf te weinig ervaring om de LLM in deze cases in goede banen te leiden. Ik vraag mij ook af hoe bedrijven hiermee omgaan. Een werknemer kan enerzijds veel tijd winnen maar anderzijds veel tijd verliezen bij het controleren en op punt stellen.
je ETB: Dat moet normaal beter kunnen. Nu ik werk al meer als een jaar niet meer met gratis modellen (ik vermoed dat jij dat wel doet?). Maar voor zoiets heb je eigenlijk een agent nodig of toch een api die meer daarvoor geschikt is. Nu als je zo'n agent lokaal draait, ook niet verbaast zijn als ge na een tijd geblokkeerd wordt :p
Uw powerpoint: het is al lang geleden dat hij nog eens een volledige powerpoint genuked heeft (daarom dat ik vermoed dat je met een gratis veresie bezig bent?). Nu ik maak ook niet wekelijks powerpoints, de laatste is ook alweer een maand geleden en toen kreeg ik een zeer barebones powerpoint die ik manueel dan verder heb afgewerkt. Ik denk niet dat ik echt zou blijven doorprompten tot ge "de ideale powerpoint" krijgt. Dan zijt ge gewoon veel te veel tijd aan het verliezen.

Ik gebruik ook gewoon heel purpose built agents met de nodige instructies en zelfs die gaan soms nog los het padje af, maar toch een pak minder.
"Win" ik daar echt tijd mee? Soms wel, soms niet. Vaak is het gewoon een nice to have of om snel wat side projects te doen.
 
De straffe claim die hier gemaakt werd was dat ze nooit winstgevend kunnen worden. @Pieterjan94 werd zelfs weggelachen toen die opperde van wel. Dat ze zelfs nu al een winstgevend kwartaal zouden boeken gaat daar toch wel stevig tegen in of niet? Ze zitten zelfs nog volop in groei modus dus als ze dan zelfs nu al zo een kwartaal kunnen voorleggen geeft dat toch duidelijk aan dat hun path to profitability helemaal niet zo onmogelijk is?
 
Terug
Bovenaan