ChatGPT en andere Large Language Models

Gemini 3 kan echt crazy snel coden. Ga er eens zelf naartoe en schrijf eens wat gedetailleerde prompts over iets dat je goed kent.
vb basic shooter video game in HTML.
Of een financiele investerings model calculator in HTML
Of voor muziek een DAW software (in html)
Of een soort van Paint of adobe (in html).

Wel op "denken" klikken in gemini, zodat je de 3 model gebruikt. De programma's die die verzint zijn vooralsnog basic, maar ik denk echt dat het leven van basic-coders geen lang leven meer beschoren is.
 
Tot Gemini 3 was voor mij steeds Claude Sonnet dat alles beter doet dan de andere modellen, maar wat is beter is dan de vraag natuurlijk.

Het vergelijk Claude met Gemini 3 heb ik nog niet gemaakt.
 
Ben aan het onderzoeken om via Azure gebruik te maken van Azure Speech om onze intake gesprekken te laten transcriberen en van daaruit via een Agent een output te krijgen in een document dat we zouden maken/trainen met bvb. to-do's, basisinformatie, etc... Iemand al ervaring mee? Was aan het kijken naar Whisper maar blijkbaar zou Azure Speech voor gesprekken waarbij het verschillende personen moet herkennen beter zijn.
Heb een eigen transcriptie workflow die ik intussen ruim een half jaar gebruik en voor mij persoonlijk werkt dit echt fantastisch voor de administratie van vele meetings. Ik neem op mijn pc op, transcribe in batch lokaal via whisper-large (openai) of parakeet (Nvidia) en zwier dit dan 1x per dag in een chatGPT-plus project met een dedicated prompt. Dit laatste is wel cruciaal, in de prompt vraag ik om de transcriptie te verbeteren op basis van een lijst met vaak voorkomende eigennamen, projectnamen, vakjargon, ... en mij de twijfelgevallen terug te koppelen ter verbetering alvorens de samenvatting gemaakt wordt. Voor een proof-of-concept kan je hier eenvoudig een transcriptie van een opname uit eigen context vragen: https://huggingface.co/nvidia/parakeet-tdt-0.6b-v3 Ongetwijfeld zijn er fully automated cloud-oplossingen of maar zelf wou ik bewust binnen mijn chatGPT-plus subscriptie blijven en niet gebruik maken van per-transcription of per-samenvatting API calls. Zelf nog niet getest maar deze man beschrijft ook hoe hij audiofiles rechtstreeks laat transcribeer en samenvatten door Gemini 3 Pro, m.a.w. transcriptie en samenvatten door eenzelfde model: https://simonwillison.net/2025/Nov/18/gemini-3/
 
Wat bedoel je? Ik snap het niet.

Ps: vandaag gebruikte ik Nano Banana om wat ideeën te krijgen voor een grafische opdracht, uiteindelijk begreep de chatbot mij niet altijd (zet het verticaal in het midden uitgelijnd, was een prompt die hij absoluut niet verstond) en ik heb het dan maar manueel gedaan in Indesign. Een mooi voorbeeld hoe je AI kan gebruiken als basis, om het dan effectief te maken in Adobe.

Ik heb het al meermaals gezien dat AI iets niet kan, bv zet alles in lettertype x -> dat lukt niet

Misschien vandaag nog is proberen. Nano Banana 2 en Pro werden zonet gedropt en in de trailer belichten ze specifiek nu de mogelijkheid om lettertype naar wens aan te passen;
Al enkele heel indrukwekkende demos zien passeren en ook die 4k en real time editing zijn behoorlijk imposant.


Google Deepmind dropt tegenwoordig weer bijna dagelijks vrij baanbrekend werk
 
Damn die Gemini 3 coding tool die in AI studio staat is geweldig. Voorlopig nog onbeperkt aantal prompts, op een halve dag echt al een advanced app geschreven ermee. Had ook al hun IDE geïnstalleerd maar daar zit je snel door je quota.
 
Damn die Gemini 3 coding tool die in AI studio staat is geweldig. Voorlopig nog onbeperkt aantal prompts, op een halve dag echt al een advanced app geschreven ermee. Had ook al hun IDE geïnstalleerd maar daar zit je snel door je quota.
Gebruik je dan AI studio om in te coden? Of wat is je workflow?

Ik gebruik sinds enkele maanden Cursor, dat nu ook gemini 3 pro als optie heeft. Volledig mindblown daardoor, maar ben wel benieuwd naar andere tools. Het gaat zo rap allemaal, het is amper bij te houden.
 
Gebruik je dan AI studio om in te coden? Of wat is je workflow?

Ik gebruik sinds enkele maanden Cursor, dat nu ook gemini 3 pro als optie heeft. Volledig mindblown daardoor, maar ben wel benieuwd naar andere tools. Het gaat zo rap allemaal, het is amper bij te houden.
Ja, was begonnen met Antigravity maar daar liep ik dus snel tegen die quota’s die er in AI studio niet zitten. Ik neem aan dat je via de api in cursor ook quota’s hebt ? Vandaag wel gemerkt dat Gemini 3 soms zomaar dingen in je design aanpast zonder dat je het gevraagd hebt dus tijdelijk terug over geschakeld naar 2.5.

Net trouwens heel makkelijk in AI studio van default gegenereerde mock data gemigreerd naar een supabase database voor CRUD actions. Niet meer lang en iedereen schrijft gewoon zijn apps zelf zoals men nu zijn eigen sla en tomaten plant.

Voor AI studio gebruikte ik Claude via terminal maar die maakt nog altijd wel wat oudbollige interfaces. En als ik ook die 20 euro per maand kan uitsparen dan ben k ook content :)

Nu, eens het framework in AI studio klaar is ben k wel van plan om ze lokaal te halen en de versioning via git te laten lopen, daar heb je toch nog altijd meer functionaliteiten.
 
Laatst bewerkt:
Afgelopen week met collega wat met chatgpt gespeeld, die agent functie gaat enkele basistaken waar we nu tijd insteken wel heel wat vergemakkelijken.
Eens zien of we al dat personeel nog nodig hebben 😁
 
Zonet eens Gemini 3 gebruikt voor data-extractie uit een PDF van ca. 50 blz'en... Doet dit geweldig. Dit is iets waar zowel ChatGPT alsook Copilot enorm veel moeite mee hebben en het gewoon niet lukt. Gemini met 1 prompt van de eerste keer feilloos de data eruit gehaald en kunnen extraheren naar een Excelsheet van 200 lijntjes.

Zeer sterk.
 
Zonet eens Gemini 3 gebruikt voor data-extractie uit een PDF van ca. 50 blz'en... Doet dit geweldig. Dit is iets waar zowel ChatGPT alsook Copilot enorm veel moeite mee hebben en het gewoon niet lukt. Gemini met 1 prompt van de eerste keer feilloos de data eruit gehaald en kunnen extraheren naar een Excelsheet van 200 lijntjes.

Zeer sterk.
En hoe ga je na of alles correct is overgenomen? Dat een rij toch is overgeslagen, of toch een verkeerde komma. Het is duidelijk dat deze fouten er altijd zullen blijven inzitten.
Ik heb nog steeds grote moeite om te begrijpen dat mensen het voor deze taken gebruiken, en er van uitgaan dat het maar zal kloppen.
 
En hoe ga je na of alles correct is overgenomen? Dat een rij toch is overgeslagen, of toch een verkeerde komma. Het is duidelijk dat deze fouten er altijd zullen blijven inzitten.
Ik heb nog steeds grote moeite om te begrijpen dat mensen het voor deze taken gebruiken, en er van uitgaan dat het maar zal kloppen.
De lijst werd verdeeld onder 16 mensen die vervolgens lijn per lijn moesten verwerken (en met ons CRM-pakket moesten cross referencen), had gevraagd om idd te melden als bepaalde info niet klopte. Was soms een fout in contractnummers doordat de PDF zelf voor dat stuk een ingescand document was en er bvb. 8B34567 stond, waarbij Gemini er 8834567 van maakte. Verder heb ik 0 fouten gemeld gekregen.
 
De lijst werd verdeeld onder 16 mensen die vervolgens lijn per lijn moesten verwerken (en met ons CRM-pakket moesten cross referencen), had gevraagd om idd te melden als bepaalde info niet klopte. Was soms een fout in contractnummers doordat de PDF zelf voor dat stuk een ingescand document was en er bvb. 8B34567 stond, waarbij Gemini er 8834567 van maakte. Verder heb ik 0 fouten gemeld gekregen.
Als ik het goed begrijp heb je de Gemini output nog eens manueel laten verwerken door 16 mensen. Goede check, die denk ik de meesten niet doen, en gewoon AI vertrouwen, wat m'n punt is.
Heb je er dan eigenlijk wel veel tijd/kost winst mee geboekt? Want je moet die AI alsnog goed babysitten.
Daarnaast, een PDF is vaak al een outputbestand, wat niet ideaal is om als data input te hebben. Nu met die LLM's lijken mensen dat ook te vergeten en structureler naar het probleem te kijken, bvb zoeken naar de echte brondata... Merci voor je insight

Ik blijf toch vrezen dat mensen door die AI corners cutten, in kwaliteiten inboeten, en de effecten pas in latere fase gaan zichtbaar zijn, en het dan moeilijk gaat zijn fouten te herstellen, want alles komt uit prompts ipv reproduceerdbare acties. I'm old

Stel, je krijgt opeens een nieuwe versie van je PDF, begin er maar aan dan met deze workflow. Uiteraard geen directe kritiek op jouw proces, ik probeer het te veralgemenen.
 
Laatst bewerkt:
Als ik het goed begrijp heb je de Gemini output nog eens manueel laten verwerken door 16 mensen. Goede check, die denk ik de meesten niet doen, en gewoon AI vertrouwen, wat m'n punt is.
Heb je er dan eigenlijk wel veel tijd/kost winst mee geboekt? Want je moet die AI alsnog goed babysitten.
Daarnaast, een PDF is vaak al een outputbestand, wat niet ideaal is om als data input te hebben. Nu met die LLM's lijken mensen dat ook te vergeten en structureler naar het probleem te kijken, bvb zoeken naar de echte brondata... Merci voor je insight

Ik blijf toch vrezen dat mensen door die AI corners cutten, in kwaliteiten inboeten, en de effecten pas in latere fase gaan zichtbaar zijn, en het dan moeilijk gaat zijn fouten te herstellen, want alles komt uit prompts ipv reproduceerdbare acties. I'm old

Stel, je krijgt opeens een nieuwe versie van je PDF, begin er maar aan dan met deze workflow. Uiteraard geen directe kritiek op jouw proces, ik probeer het te veralgemenen.
Plus daarboven komt nog dat door eigenschappen van een LLM de ene controle niks zegt over een mogelijke volgende output.
 
Terug
Bovenaan