ChatGPT en andere Large Language Models

Dit komt uit mijn link:

The 70% failure rate you found matches my experience. The root cause is that skills are prose — the LLM reads them and guesses what to do. There is no build step. No verification that the tools mentioned actually exist, that parameter types line up, that MCP servers are reachable.

I have been working on a different approach: treat SKILL.md as source code for an agent, not as a prompt for another agent. agenthatch compiles a SKILL.md through a 3-phase pipeline into a standalone AI agent. Schema validation runs at build time. If a tool signature does not match the runtime, the compilation fails. The agent never spawns with a broken spec.

The problem you described — skills that "claim to do things the bundled code cannot actually do" — is exactly what build-time validation catches.
 
Dit komt uit mijn link:

The 70% failure rate you found matches my experience. The root cause is that skills are prose — the LLM reads them and guesses what to do. There is no build step. No verification that the tools mentioned actually exist, that parameter types line up, that MCP servers are reachable.

I have been working on a different approach: treat SKILL.md as source code for an agent, not as a prompt for another agent. agenthatch compiles a SKILL.md through a 3-phase pipeline into a standalone AI agent. Schema validation runs at build time. If a tool signature does not match the runtime, the compilation fails. The agent never spawns with a broken spec.

The problem you described — skills that "claim to do things the bundled code cannot actually do" — is exactly what build-time validation catches.
Dat is gewoon een AI gegeneerde tekst die reclame maakt voor die repo, dus bijna zeker de auteur. Enfin, kan misschien enige merite hebben maar zou het wel met een grote korrel zout nemen.
 
Ben wel eens benieuwd naar de meer geavanceerde Claude-gebruikers (niet per sé Claude Code). Welke Skills gebruiken jullie het meest of hebben jullie enorm veel geholpen? Zelfgemaakte of van Github gehaald, welke doelen precies, etc?

Ben me wat aan het verdiepen in deze materie en krijg af en toe ideeën, ben eens benieuwd wat voor andere BG'ers eyeopeners zijn geweest.
Mijn workflow momenteel.

Ik start vanuit Claude Design met het maken van een volledig werkend prototype waarbij de data als .js geladen wordt.
Daarna vraag ik vanuit Claude Design of ie een handoff document wil maken met zoveel mogelijk van de functionaliteit beschreven.

Daarna gebruik ik de /grill-with-docs skill van Matt Pocock waarbij de agent door middel van een interview dieper op de requirements ingaat. Die discussie wordt dan bewaard in de context of een CONTEXT.md file.

Als mijn context window nog ruim onder de 120k zit dan gebruik ik dezelfde sessie, anders een nieuwe.

Daar start ik de /to-prd skill van dezelfde maker, die dan prd.md bestand aanmaakt met daarin het problem statement, user stories, implementatie beslissingen en testing approaches.

Daarna weer vanuit een nieuwe context /prd-to-issues waarbij hij je user stories gaat opsplitsen in issues/slices zodat je iteratief kan laten bouwen zonder gevaar voor context rot. Op een verticale manier zodat je steeds de volledige flow kan testen en niet eerst je volledige database layer, dan middleware, dan front, etc ...

Als dat klaar is laat ik een zelf geschreven Ralph Wiggum script daar iteratief over loopen met test-driven-development (/tdd skill) als basis.
 
Dat is dus de bedoeling van een forum, om mensen met andere achtergronden en ervaringen toch eens te zien wat zij doen waar jij mogelijks niet aan denkt. Alé, ander sluiten we het brutoloon-topic ineens af, want iedereen heeft andere jobs en lonen hé :)

Zal misschien zelf 1tje neerpennen. Heb nu de Skill die ik gemaakt had om PPT's te maken in de huisstijl van het bedrijf omgevormd (andere skill gemaakt) om voortaan slidedecks in HTML te maken en niet meer in PPT-formaat. Zijn veel flexibeler, kunnen op elk apparaat afgespeeld worden zonder powerpoint-plugin (enkel browser nodig) en dus kan powerpoint de deur uit. Als je "rap iets wil aanpassen" vraag je het gewoon aan Claude, die doet dat even goed en even snel om een zeer mooi eindresultaat te leveren.

Deed het prima, heb in de Skill nog een fullscreenknop laten inbouw, gevraagd dat de enterknop naar de volgende slide gaat en de backspace knop naar de vorige slide en dat een agenda/overzicht van de topics ook kan doorklikken naar de desbetreffende slide.
Wat is er mis met de links en rechts pijlen op uw toetsenbord?
Kvind het idee niet slecht, maar dan maakt ge er zoiets onintuitiefs van :D
 
Wat is er mis met de links en rechts pijlen op uw toetsenbord?
Kvind het idee niet slecht, maar dan maakt ge er zoiets onintuitiefs van :D
Links en rechts marcheert nog hé :) Maar PPT werkt met enter en backspace. Stel dat anderen de skill gaan gebruiken hoor ik het al binnen de dag 'seg, den enter werkt niet met dien HTL, powerpoint is toch vele beter ze'. Dat is alvast opgevangen.
 
Het voordeel van powerpoint vind ik toch de presentation mode waarbij je je eigen notas kan zien en de volgende slide zonder dat da zichbaar is voor uw audience. Een ander handige feature is de rehearsal zodat je kan oefenen hoe lang je presentatie zal duren. Ik gooi het nog niet zomaar de deur uit :)
 
Het voordeel van powerpoint vind ik toch de presentation mode waarbij je je eigen notas kan zien en de volgende slide zonder dat da zichbaar is voor uw audience. Een ander handige feature is de rehearsal zodat je kan oefenen hoe lang je presentatie zal duren. Ik gooi het nog niet zomaar de deur uit :)
Kzou het eigenlijk nog mogelijk zien om een popup venster te hebben met die notes, die ge dan op uw 2de monitor dragged, zoals powerpoint.

Kben nu wel aan het peinzen: draw.io is ook toch maar xml? Zou misschien nog heel schoon integreren. Vooral als ge wat vertrokken zijt de met animaties erin.
 
Allé ook eens Claude geinstalleerd met pro account en higgsfield, na talloze video's dat claude een volledige analyse maakt van uw meta ads en dergelijke :p

Heb gewoon de situatie uitgelegd aan hem en nu is hij hier al even bezig in een chrome tabblad met alles in te stellen en te verbinden. Ingelogd op mijn Wordpress account voor de live tracking van sales via meta ads te kunnen opvolgen en dergelijke.

Scary shit eigenlijk :p


edit:
Ik had dit eerder zelf al geprobeerd via META pixel / tracking om sales te tracken, maar kreeg constant errors.
En claude stootte ook op die error, nadat ik hem een screenshot van die error stuurde heeft hij het opgelost lol.

Echt gek. Heb daar zelf al uren naar zitten zoeken...
 
Laatst bewerkt:
Werkt dat nog, meta ads? Die push marketing ben ik nooit fan van geweest.

Van zodra je op Google zoekt naar iets als bv een airco, zie je dagen en weken nadien meta ads van iedereen die airco’s verkoopt :p
 
Werkt dat nog, meta ads? Die push marketing ben ik nooit fan van geweest.

Van zodra je op Google zoekt naar iets als bv een airco, zie je dagen en weken nadien meta ads van iedereen die airco’s verkoopt :p

Ik verkoop een héél erg niche product dat bijna niemand weet dat het bestaat, maar als de juiste mensen het zien kopen ze het sowieso.
Ik zie dan ook duidelijk als ik geen ads run dat ik niets verkoop en als ik ads run dat de verkopen wel rustig binnen komen.
 
Moet zeggen, het is terug veel verbeterd tov vorig jaar. Had enkele vragen over oudere industriële toestellen, vorig jaar sloeg hij de bal volledig mis, maar deze keer was hij in beide gevallen correct. bijna beter dan een zoekmachine zoals google.
 
Terug
Bovenaan