ChatGPT en andere Large Language Models

Ik heb DALLIE ook even getest, voor fotografie is het niet echt handig, maar voor kunst te genereren soms wel.

Enkele testjes gedaan

Hier

Mensen die vluchten voor een vulkaanuitbarsting, Edvard Munch style.

DALLE_2023-03-26_00.11.12_-_People_fleeing_from_a_volcanic_eruption_by_Edvard_Munch.png
DALLE_2023-03-26_00.11.08_-_People_fleeing_from_a_volcanic_eruption_by_Edvard_Munch.png


Bij deze zelfde maar Pieter Brueghel style.

DALLE_2023-03-26_00.12.45_-_People_fleeing_from_a_volcanic_eruption_by_Pieter_Brueghel.png


Communistische Revolutie, Pieter Breughel style

DALLE_2023-03-26_00.09.28_-_A_communist_protest_in_Paris_with_Fire_by_Pieter_Brueghel.png


Midjourney kan ook al dingen doen (dat is wel betalend), maar deze kan fotografie nabootsen. Zelf wel wat dingen al van gezien op het internet of in de Midjourney Discord.

TheDeprogram-123kr0s.jpg


Bijvoorbeeld dit.

Camilo_Polania_A_muiscan_civilization_in_Colombia_at_actually_t_9ec93297-a24d-47cc-b003-3a4ee1ac868f.png


Hier Muiscabeschaving

BobbyW3363_samurai_vampire_communist_robots_in_a_busy_city_stre_6cca6051-1ce5-4c2d-b0b3-34d6f7dba844.png


Hier samurai vampire communist society in the year 3000

Echt even de Discord van Midjourney rondgekeken, daar staan echt eigenlijk al miljoenen AI gegenereerde foto's van Midjourney in door mensen die de command / hun AI commands deelden.

___

Op basis van dit voor bijvoorbeeld film, ik denk dat we binnenkort AI-gegeneerde CGI gaan zien. Als ik me niet vergis heeft Netflix al AI-anime short op hun service gezet. Maar AI gegeneerde CGI zal wel niet zo verre toekomst zijn, enige problemen is bewegende beelden ipv foto. Bij animatie/anime kan het wel omdat die samengezet worden door zeer veel foto's/frames op een korte tijd te hebben en dan heb je een vloeiend beeld (en dan wordt er bespaard op zaken als oogbewegingen en mondbewegingen wat je kan zien bij oudere animatie vaak).

Het hoeft niet allemaal negatief te zijn, je kan AI ook wel als inspiratie gebruiken bij het visualiseren van zaken, bvb. van zaken waar we bvb. niet directe foto's hebben maar indirecte informatie.

De echte authentieke kunst (en detail) kan het nog niet. Denk aan gezichten, symbolen en tekst. Maar bijvoorbeeld als je kijkt naar Star Wars films, die CGI, dat kan de AI wel nabootsen of misschien al beter (zeker tegenover de prequel trilogie om een voorbeeld te noemen).


jY8Q7DY.png


Wel zeer duur als je het wilt.
 
Laatst bewerkt:
Combinatie kan ook, vraag in het Nederlands met verzoek om in het Engels te antwoorden.
Mijn Frans is goed genoeg om alles te begrijpen, maar niet goed genoeg om vlot mails te sturen. Tegenwoordig stuur ik al mijn Franse mails via Chatgpt.

"stuur een mail in het Frans waarin je zegt dat bla bla bla"

Soms is de mail wat te formeel en als ik dan zeg om hem minder te formeel maken, is het nogal jongerentaal. Dus vaak zijn mijn mails wat stijf 😅
 
Kennen jullie een gratis ChatGPT-achtige bot die visuele input aanvaard, bijvoorbeeld een paar zinnen in een PNG-afbeelding?
 
Daarnet toch een ChatGPT account aangemaakt en geprobeerd en het is best indrukwekkend wat die uit zijn code hoed tovert. Het is zeker allemaal niet waterdicht, en de juiste vragen en basisomschrijvingen zijn uiteraard enorm belangrijk voor een goed resultaat. Maar als eerste stap kan dit echt wel tellen. Ik kan me voorstellen dat je heel snel waterdichte delen code kan laten schrijven door dit ding, waar je anders uren mee zoet bent zelf. Het logisch denken, opbouwen en samenbrengen moet je nog wel zelf doen.
 
Daarnet toch een ChatGPT account aangemaakt en geprobeerd en het is best indrukwekkend wat die uit zijn code hoed tovert. Het is zeker allemaal niet waterdicht, en de juiste vragen en basisomschrijvingen zijn uiteraard enorm belangrijk voor een goed resultaat. Maar als eerste stap kan dit echt wel tellen. Ik kan me voorstellen dat je heel snel waterdichte delen code kan laten schrijven door dit ding, waar je anders uren mee zoet bent zelf. Het logisch denken, opbouwen en samenbrengen moet je nog wel zelf doen.
Ik denk dat voor code GitHub copilot superieur zal zijn. Ook naar aanpassingen op de code toe.
 
Ik denk dat voor code GitHub copilot superieur zal zijn. Ook naar aanpassingen op de code toe.
Interessant, het gebruikt ook de OpenAI Codex blijkbaar in de achtergrond.
Wel leuk om te zien dat hij voor een bepaald javascript ook het foutieve voorstel doet voor implementatie zoals op de vendor website staat. De fix die in bepaalde forums te vinden is, kent hij nog niet ;)
 
Rewrite the lyrics of Adele Skyfall with lyrics about James Bond himself, make the verses match the length of the original song, and make the sentences rhyme

Resultaat:
Verse 1:
He's the man with the golden gun
The world's deadliest spy, second to none
From Russia to the USA, he's always on the run
A license to kill, his job's never done

He's faced villains with devilish schemes
And escaped danger by any means
A master of espionage, the stuff of dreams
The greatest secret agent you've ever seen

Chorus:
James Bond, his name is renowned
In every corner of the world, he can be found
From the tiniest island to the biggest town
The British legend with a license to astound

Verse 2:
He's got a car that's faster than sound
Gadgets and gizmos that will astound
He's suave, he's charming, always profound
A true force of nature, he'll never back down

He's battled through thick and thin
Against the forces of evil, he'll always win
A true icon, a legend within
The one and only, James Bond, to begin

Chorus:
James Bond, his name is renowned
In every corner of the world, he can be found
From the tiniest island to the biggest town
The British legend with a license to astound

Bridge:
He's the hero we need in the night
His courage and wit, always in sight
With every challenge, he takes flight
A true champion of the right

From the streets of London to the sands of Dubai
He's a man on a mission, always ready to try
With every adventure, he takes his high
A true icon, he'll never die

Chorus:
James Bond, his name is renowned
In every corner of the world, he can be found
From the tiniest island to the biggest town
The British legend with a license to astound

Outro:
He's the man with the golden gun
A true hero, second to none
From the very first mission to the last one
James Bond, the greatest secret agent, bar none.

Now sing the song for me on the backing track of the original song

I'm sorry, but as an AI language model, I am not capable of singing on a backing track. However, you can find many talented singers and musicians online who may be able to perform a cover of the song with the rewritten lyrics. You can also try using online music production tools to create your own custom backing track and sing the lyrics yourself or hire a professional singer.

--> Die sloeber weet al dat ik niet kan zingen :cool:
 
Ben laatst naar de AI show van Lieven Scheire geweest, was wel tof. Uiteindelijk niet heel veel bijgeleerd want er komt wel wat aan bod tijdens de nerdland podcaasts, maar wel een mooie zeer technisch uitleg gegeven over wat AI is en hoe AI getraind wordt. En ook leuke feitjes dat wij het zijn die dit doen. Al die zebrapaden en verkeerslichten aanduiden, wel dat is voor hun AI te trainen die later gebruikt gaat worden in hun zelfrijzende auto's. En die captcha's waar je onduidelijke woorden moest invullen was hulp voor het digitaliseren van boekdrukken.
 
Stablediffusion + multicontrolnet

Ook dit is niet geanimeerd maar door een module in UE5 van smartphone video geconverteerd naar bewegend 3d model.

Echt wel gek aant worden. Wat vroeger uren, nee weken, werk was, wordt hier geklaard in minuten en de beweging ziet er beter uit dan eender wat artisten in anime en games tot hiertoe voor elkaar kregen.

Mocap had men natuurlijk al maar nu heb je zelfs de studio en balletjes niet meer nodig. Nog even en je kan volledige levels, karakters en props maken met niets anders dan je gsm. Zelfs dat heb je niet nodig als je de beweging van een bestaand filmje goed vindt, je kan dat gewoon gebruiken en zowel de persoon als achtergrond vervangen door iets of iemand anders.

Ik weet nog hoe indrukwekkend ik style transfer vond toen het gewoon over fotos ging maar de evolutie in video laat duidelijk niet op zich wachten.
 
Laatst bewerkt:


Niet ChatGPT maar familie van in dat het gaat om een LLM gedirigeerd diffusie netwerk met nog wat extra toeters en bellen waarmee je via promt beelden, video en effecten kan genereren. Misschien interessant om de thread titel aan te passen naar iets breder zoals praktische applicaties van AI? We gaan zo in snel tempo de volgende jaren nog 1001 applicaties voorgeschoteld krijgen, de ene nog verbluffender dan de ander.
 
Laatst bewerkt:
Stablediffusion + multicontrolnet

Ook dit is niet geanimeerd maar door een module in UE5 van smartphone video geconverteerd naar bewegend 3d model.

Echt wel gek aant worden. Wat vroeger uren, nee weken, werk was, wordt hier geklaard in minuten en de beweging ziet er beter uit dan eender wat artisten in anime en games tot hiertoe voor elkaar kregen.

Mocap had men natuurlijk al maar nu heb je zelfs de studio en balletjes niet meer nodig. Nog even en je kan volledige levels, karakters en props maken met niets anders dan je gsm. Zelfs dat heb je niet nodig als je de beweging van een bestaand filmje goed vindt, je kan dat gewoon gebruiken en zowel de persoon als achtergrond vervangen door iets of iemand anders.

Ik weet nog hoe indrukwekkend ik style transfer vond toen het gewoon over fotos ging maar de evolutie in video laat duidelijk niet op zich wachten.
Het gekste zou zijn moest gameplay/verhaallijnen on the fly door ai gegeneerd zijn. Herspeelbaarheid oneindig
 
dat gaat geen jaar (ok misschien 2) meer duren vooraleer je met micro met NPCs praat en vraagt waar bijvoorbeeld een sleutel begraven ligt en of hij dat niet kan tonen. Je kan het zo gek niet bedenken. Als alle NPCs autonomie krijgen ga je ze kunnen vragen waar de eindbaas zit, hoe je die kapot maakt en of ze niet willen helpen.
 
dat gaat geen jaar (ok misschien 2) meer duren vooraleer je met micro met NPCs praat en vraagt waar bijvoorbeeld een sleutel begraven ligt en of hij dat niet kan tonen. Je kan het zo gek niet bedenken. Als alle NPCs autonomie krijgen ga je ze kunnen vragen waar de eindbaas zit, hoe je die kapot maakt en of ze niet willen helpen.

Ik denk wel dat sommige onderschatten hoe kostelijk het zou zijn om een AI server te laten draaien puur zodat NPC's meer variatie hebben in taal/gedrag

Stel je eens voor dat Bethesda zoiets implementeert, je kan bijna niet anders dan een "monthly fee" te vragen want je game gebruikt continue resources extern van applicaties van de speler. Zoiets zie ik dan wel weer mogelijks gebeuren maar dat wordt wel een heel kostelijke affaire. Gaat niet gratis zijn voor de speler :p.

En is dat wat men wil? NPC's die AI gegenereerde gesprekken en verhalen uitvoeren in plaats van een deftig geschreven verhaal waar erover nagedacht is. Ik denk het niet. Ik kan het nog begrijpen om een NPC niet voortdurend dezelfde oneliner te geven en wat variatie te geven in zijn gedrag/zinnen maar voor hele verhalen zie ik men nog snel afknappen daarop.

Ik vond Skyrim indertijd al vrij zielloos qua personages :p. Laat staan dat je AI die personages laat invullen :p.
 
Kans is groot dat ze het als monthly subscription live service verkopen omdat ze er mee zouden weg geraken. Er zijn echter ook kleinere LLMs die je lokaal kan draaien maar inderdaad waarom zouden ze dat doen. 😅

Ik hoop ook wel dat main story niet volledig uit handen gegeven wordt, AI mag gerust helpen schrijven maar het moet ook wel effectief goed zijn en dus door mensen gecontroleerd en waar nodig bijgestuurd worden.

Ik denk dat je onderschat wat voor een gigantische vooruitgang realistische gesproken non scripted interactie met NPCs zou zijn. (zeker in VR!) Die van Skyrim waren inderdaad vrij zielloos maar dat zou onder LM gedreven AI agents echt wel veel beter kunnen. Denk aan de eerste dagen van Sydney (Bing's versie van GPT3). Die hadden ze ook een persoonlijkheid gegeven en die was lang zo droog niet als standaard GPT3. Je kan elk agent anders definieren en een andere persoonlijkheid geven. Niet enkel basis zaken zoals a/s/l maar ook waar ze mee zitten en effectief hun emotionele ingesteldheid, zijn ze agressief, depressief, of juist overdreven vriendelijk.

Maar mij gaat het eerder om realisme verhoging, bijvoorbeeld geen map markers meer maar mensen onderweg vragen waar iets is of wat er in de geburen te zien is.
 
Ik denk wel dat sommige onderschatten hoe kostelijk het zou zijn om een AI server te laten draaien puur zodat NPC's meer variatie hebben in taal/gedrag

Stel je eens voor dat Bethesda zoiets implementeert, je kan bijna niet anders dan een "monthly fee" te vragen want je game gebruikt continue resources extern van applicaties van de speler. Zoiets zie ik dan wel weer mogelijks gebeuren maar dat wordt wel een heel kostelijke affaire. Gaat niet gratis zijn voor de speler :p.

En is dat wat men wil? NPC's die AI gegenereerde gesprekken en verhalen uitvoeren in plaats van een deftig geschreven verhaal waar erover nagedacht is. Ik denk het niet. Ik kan het nog begrijpen om een NPC niet voortdurend dezelfde oneliner te geven en wat variatie te geven in zijn gedrag/zinnen maar voor hele verhalen zie ik men nog snel afknappen daarop.

Ik vond Skyrim indertijd al vrij zielloos qua personages :p. Laat staan dat je AI die personages laat invullen :p.
Valt zéér goed mee als je weet dat ChatGPT ongeveer $0.002 kost per 1,000 tokens (= ~ 750 woorden)

De sterkte van een LLM is net dat je het een referentiekader (= personage) kan geven en dus altijd in zijn rol zal blijven binnen de context.
 

Dit wordt sowieso ook een gigantisch deel van onze nabije AI toekomst. Vroeger moest men gelabelde datasets samenstellen zodat AI de verbanden kon leren tussen label en de data in kwestie. Dat zorgde echter voor een gigantische bottleneck alsook fouten uit onvolledigheid omdat de handgeschreven labels nooit alle informatie die een foto bevat konden meegeven. Vandaag is het veld richting selfsupervised learning aan het bewegen waar AI zijn eigen datasets leert labelen en classificeren.

Training machine learning models on labeled cellular imaging, for instance, is challenging, as there are a limited number of experts who can annotate the cells, and certainly not at the scale required. Self-supervised training on microscopic cellular imagery, however, opens up the way for foundational cell imagery models and, consequently, biological discovery, as it becomes possible to compare known treatments with new ones, for example.

Iets ouder nieuws maar vond ik toch ook best verbazingwekkend
Testen met grootse militaire drones van take offs en landings vanop carriers lopen al een tijdje

Maar de capaciteiten van die omgebouwde F16 zijn echt wel gek. The autonomous jet fighter has now completed 17 hours of flight testing, including advanced fighter maneuvers and beyond-visual-range engagements against various simulated adversaries, and with simulated weapons capabilities. The Air Force describes the X-62A as "a flight test accelerator." The test team can fly a mission, land, and rapidly update or change the AI agent, then fly another test mission within hours. Het tijdperk van menselijke fighter pilots gaat sneller ten einde komen dan ik persoonlijk verwacht had.
 
Laatst bewerkt:
Ik ben oprecht blij dat een vertaler tolk die ik ken, eens goed moest lachen met chatGPT want zijn vertaaldiensten zijn verre van perfect. Er is nog veel werk aan de winkel, waar we zeer blij voor mogen zijn. Zo hebben alle vertalers toch nog enkele jaren werk 👌
 
Ik ben oprecht blij dat een vertaler tolk die ik ken, eens goed moest lachen met chatGPT want zijn vertaaldiensten zijn verre van perfect. Er is nog veel werk aan de winkel, waar we zeer blij voor mogen zijn. Zo hebben alle vertalers toch nog enkele jaren werk 👌
ChatGpt en Midjourney zijn in enkele maanden al enorm versterkt, ik denk dat beetje vertalingen niet een probleem zullen zijn :unsure:
 
Terug
Bovenaan