ChatGPT en andere Large Language Models

Horse · Vandaag om 08:16

Dit komt uit mijn link:

The 70% failure rate you found matches my experience. The root cause is that skills are prose — the LLM reads them and guesses what to do. There is no build step. No verification that the tools mentioned actually exist, that parameter types line up, that MCP servers are reachable.

I have been working on a different approach: treat SKILL.md as source code for an agent, not as a prompt for another agent. agenthatch compiles a SKILL.md through a 3-phase pipeline into a standalone AI agent. Schema validation runs at build time. If a tool signature does not match the runtime, the compilation fails. The agent never spawns with a broken spec.

The problem you described — skills that "claim to do things the bundled code cannot actually do" — is exactly what build-time validation catches.

Jenthe · Vandaag om 13:10

Horse zei:
Dit komt uit mijn link:

The 70% failure rate you found matches my experience. The root cause is that skills are prose — the LLM reads them and guesses what to do. There is no build step. No verification that the tools mentioned actually exist, that parameter types line up, that MCP servers are reachable.

I have been working on a different approach: treat SKILL.md as source code for an agent, not as a prompt for another agent. agenthatch compiles a SKILL.md through a 3-phase pipeline into a standalone AI agent. Schema validation runs at build time. If a tool signature does not match the runtime, the compilation fails. The agent never spawns with a broken spec.

The problem you described — skills that "claim to do things the bundled code cannot actually do" — is exactly what build-time validation catches.

Dat is gewoon een AI gegeneerde tekst die reclame maakt voor die repo, dus bijna zeker de auteur. Enfin, kan misschien enige merite hebben maar zou het wel met een grote korrel zout nemen.

Bjorn · Vandaag om 14:26

Vega zei:
Ben wel eens benieuwd naar de meer geavanceerde Claude-gebruikers (niet per sé Claude Code). Welke Skills gebruiken jullie het meest of hebben jullie enorm veel geholpen? Zelfgemaakte of van Github gehaald, welke doelen precies, etc?

Ben me wat aan het verdiepen in deze materie en krijg af en toe ideeën, ben eens benieuwd wat voor andere BG'ers eyeopeners zijn geweest.

Mijn workflow momenteel.

Ik start vanuit Claude Design met het maken van een volledig werkend prototype waarbij de data als .js geladen wordt.
Daarna vraag ik vanuit Claude Design of ie een handoff document wil maken met zoveel mogelijk van de functionaliteit beschreven.

Daarna gebruik ik de /grill-with-docs skill van Matt Pocock waarbij de agent door middel van een interview dieper op de requirements ingaat. Die discussie wordt dan bewaard in de context of een CONTEXT.md file.

Als mijn context window nog ruim onder de 120k zit dan gebruik ik dezelfde sessie, anders een nieuwe.

Daar start ik de /to-prd skill van dezelfde maker, die dan prd.md bestand aanmaakt met daarin het problem statement, user stories, implementatie beslissingen en testing approaches.

Daarna weer vanuit een nieuwe context /prd-to-issues waarbij hij je user stories gaat opsplitsen in issues/slices zodat je iteratief kan laten bouwen zonder gevaar voor context rot. Op een verticale manier zodat je steeds de volledige flow kan testen en niet eerst je volledige database layer, dan middleware, dan front, etc ...

Als dat klaar is laat ik een zelf geschreven Ralph Wiggum script daar iteratief over loopen met test-driven-development (/tdd skill) als basis.

SithCloud · Vandaag om 15:55

Vega zei:
Dat is dus de bedoeling van een forum, om mensen met andere achtergronden en ervaringen toch eens te zien wat zij doen waar jij mogelijks niet aan denkt. Alé, ander sluiten we het brutoloon-topic ineens af, want iedereen heeft andere jobs en lonen hé

Zal misschien zelf 1tje neerpennen. Heb nu de Skill die ik gemaakt had om PPT's te maken in de huisstijl van het bedrijf omgevormd (andere skill gemaakt) om voortaan slidedecks in HTML te maken en niet meer in PPT-formaat. Zijn veel flexibeler, kunnen op elk apparaat afgespeeld worden zonder powerpoint-plugin (enkel browser nodig) en dus kan powerpoint de deur uit. Als je "rap iets wil aanpassen" vraag je het gewoon aan Claude, die doet dat even goed en even snel om een zeer mooi eindresultaat te leveren.

Deed het prima, heb in de Skill nog een fullscreenknop laten inbouw, gevraagd dat de enterknop naar de volgende slide gaat en de backspace knop naar de vorige slide en dat een agenda/overzicht van de topics ook kan doorklikken naar de desbetreffende slide.

Wat is er mis met de links en rechts pijlen op uw toetsenbord?
Kvind het idee niet slecht, maar dan maakt ge er zoiets onintuitiefs van

Vega · Vandaag om 16:16

SithCloud zei:
Wat is er mis met de links en rechts pijlen op uw toetsenbord?
Kvind het idee niet slecht, maar dan maakt ge er zoiets onintuitiefs van

Links en rechts marcheert nog hé

Maar PPT werkt met enter en backspace. Stel dat anderen de skill gaan gebruiken hoor ik het al binnen de dag 'seg, den enter werkt niet met dien HTL, powerpoint is toch vele beter ze'. Dat is alvast opgevangen.

Bjorn · Vandaag om 18:59

Het voordeel van powerpoint vind ik toch de presentation mode waarbij je je eigen notas kan zien en de volgende slide zonder dat da zichbaar is voor uw audience. Een ander handige feature is de rehearsal zodat je kan oefenen hoe lang je presentatie zal duren. Ik gooi het nog niet zomaar de deur uit

ChatGPT en andere Large Language Models

Horse

Well-known member

Jenthe

Member

Bjorn

Well-known member

SithCloud

Well-known member

Vega

Well-known member

Bjorn

Well-known member