Archief - php/sql: dyslexie opsporen

Het archief is een bevroren moment uit een vorige versie van dit forum, met andere regels en andere bazen. Deze posts weerspiegelen op geen enkele manier onze huidige ideeën, waarden of wereldbeelden en zijn op sommige plaatsen gecensureerd wegens ontoelaatbaar. Veel zijn in een andere tijdsgeest gemaakt, al dan niet ironisch - zoals in het ironische subforum Off-Topic - en zouden op dit moment niet meer gepost (mogen) worden. Toch bieden we dit archief nog graag aan als informatiedatabank en naslagwerk. Lees er hier meer over of start een gesprek met anderen.

yaris

Legacy Member
Hallo,

Een vriend van mij is aan het doctoreren aan de vub en had een vraagje. Is het mogelijk om een database te maken met allemaal woorden onderverdeeld in verschillende categoriën en dan een tekst laten doorlopen en zo dan de woorden aanduiden die in welke categorie behoren.
Het is het volgende eigenlijk, hij doet onderzoek naar dyslexie en zou over vlaanderen testen moeten gaan afnemen en zo op een snelle manier aan de hand van die tekst kunnen zien waar de meeste fouten worden gemaakt, dus die veelgemaakte fouten staan in een database en als het woord zo fout geschreven is dan komt er in het verslag of textfile bv lijn 20 : categorie 1: blalblabla : fout. Ik hoop dat het een beetje duidelijk is.

Dank u,

PS: mocht het mogelijk zijn zouden er dan mensen zijn die geïnteresseerd zijn om eraan mee te werken? Het zou goed staan op je cv als je mee hebt gewerkt aan een project op de VUB :) , over betaling kan ik zelf niks zeggen.

DarkBone

Legacy Member
Da's zeker iets dat kan bewerkstelligd worden met PHP en MySQL (met andere talen en databases ook trouwens). Volledige teksten parsen (zoals dat heet) kan natuurlijk wel wat zwaar worden, maar al bij al zou da nogal meevallen denk ik.

Enige reden waarom het in PHP & MySQL moet zijn?

Ik kan u en uw vriend echter niet helpen. Ik heb het te druk met mijn normale bezigheden en mijn informatica project (ook aan de VUB).

yaris

Legacy Member
Wel de reden dat het graag in php en mysql zou zijn is dat deze talen makkelijker te leren zijn denk ik dan bv java, of c++ of visual basic.net . Hij moet zich hier ook dan in gaan verdiepen hé en daarmee zou het ook niet te lang mogen duren alvorens hij er genoeg van af weet.
bedankt voor de reply hé

Het zouden ook geen teksten van 10 blz moeten worden hé, 1 blad ofzo per bewerking. Hij gaat er wel enkele duizenden moet afnemen de sukkelaar, die gaat zen werk hebben :scream:
PS: is wel mijn beste vriend dus ik mag ermee lachen

killgore

Legacy Member
N/O, maar makkelijker zou ik die talen ook niet noemen, php is op zich echt niet zoveel makkelijker dan c++, enkel zijn type-weakness maakt dit. En mysql is een van de moeilijkste talen die ik ken (debuggen daar is gewoon een hel).

DarkBone

Legacy Member
killgore zei:
N/O, maar makkelijker zou ik die talen ook niet noemen, php is op zich echt niet zoveel makkelijker dan c++, enkel zijn type-weakness maakt dit. En mysql is een van de moeilijkste talen die ik ken (debuggen daar is gewoon een hel).
Nooit echt last van gehad hoor (dat MySQL moeilijk zo zijn), en ik heb er toch al veel mee gewerkt :)

killgore

Legacy Member
DarkBone zei:
Nooit echt last van gehad hoor (dat MySQL moeilijk zo zijn), en ik heb er toch al veel mee gewerkt :)

Mysql op zich niet, het debuggen wel, je hebt geen deftige info (soms niet meer als een plaats die niet klopt) en de foutjes kunnen zo belachelijk als iets zijn :). Dat maakt het imho zo moeilijk

Nullius

Legacy Member
Als je met degelijke functies werkt in php die uw query samenstellen aan de hand van een array met waardes enzo, kan je die fouten tot het minimum beperken of zelfs wegwerken.
Bouw een uitgebreide functie die je query opbouwt aan de hand van het type van de waarde en al ... werkt altijd ;)

yaris

Legacy Member
DarkBone zei:
Heb snel een kleine 'proof of concept' gecodeerd. Code is alles behalve optimaal, en de woorden zijn bijvoorbeeld nog niet in categorieën onderverdeeld.

http://www.webcoder.be/lode/parse_text.php
( tekst hier: http://www.webcoder.be/lode/text.txt )

Het is zoiets dat je bedoelt?

Darkbone, dit is PRECIES wat ik bedoel, lol :applause: :applause: :applause:,
Ik weet dat je veel werk hebt zoals je enkele posts boven zei maar zou het misschien mogelijk zijn voor mijn maat om u is te contacteren op de VUB ? Doctoreer je ook ?
Ik zal deze info is naar hem doorsturen.

DarkBone

Legacy Member
yaris zei:
Darkbone, dit is PRECIES wat ik bedoel, lol :applause: :applause: :applause:,
Ik weet dat je veel werk hebt zoals je enkele posts boven zei maar zou het misschien mogelijk zijn voor mijn maat om u is te contacteren op de VUB ? Doctoreer je ook ?
Ik zal deze info is naar hem doorsturen.
Lol, was het maar waar :)
2de Kan informatica (verkort HO1C)

Ik kan altijd die code doorsturen, is echt zeer weinig :)
Ik vermoed alleen dat het zo goed als zeker véél beter kan geschreven worden, ik heb het echt maar héél snel snel geschreven. Zo kunde het altjid uitbreiden met het tellen van het aantal woorden, om dan frequentiestabellen enzo te maken.

Maar ikzelf zou er de volgende weken zeker nie aan kunnen verder werken, ik kan nie riskeren van men deadline voor het project te missen. Daarna kan ik nog altijd zien wat de mogelijkheden zijn.

yaris

Legacy Member
Hehe, het zou al fantastisch zijn moesten we een basis code kunnen hebben zoals je nu al geschreven hebt. Ik zal je nog wel iets laten weten en misschien kunnen we wel iets overeenkomen. Hartelijk bedankt al hé voor de moeite. Ps: heb jij ook les aan de hoofdgebouwen of ergens anders ?

GizeH

Legacy Member
DarkBone zou je die code eens kunnen copy pasten? ben benieuwd hoe je dit gedaan hebt...

DarkBone

Legacy Member
Ik heb voornamelijk les in de gebouwen E (de 'kelder'verdieping en de computerlokalen op het gelijkvloers van IG), D (ook 'kelder'verdieping) :)

DarkBone

Legacy Member
WARNING: BAD CODE AHEAD!

PHP:
<?php
    $bad_words = array (
    			'zjin',
    			'gebuowen',
    			'vurwerk',
    			'slagtoffer',
    			'tektsen'
    		);
    
    
    $lines = file('text.txt');
    
    foreach ($lines as $line_num => $line) {
    	foreach ($bad_words as $bad_word)
    	{
    		if (strpos($line, $bad_word))
    		{
 			echo "<p><i>Bad word(s) on line #<b>" . ($line_num + 1) . "</b>:</i><br />";
    			$line = htmlspecialchars($line) . "<br />\n";
 			$output = preg_replace("/".$bad_word."/", "<b>".$bad_word."</b>", $line);
    			echo $output."</p>";
    		}
    	}
    }
    ?>

(da's dus op nog geen kwartier geschreven, ik ken zeer weinig van al die string-functies, en heb voorlopig geen tijd/zin om het te herschrijven)

yaris

Legacy Member
Darkbone, mochten we vragen aan jou of je ons wilt helpen ermee ( binnen enkele weken mocht je tijd hebben), kan je misschien eens je condities doorsturen naar ons? Voor samen te komen is de VUB ideaal aangezien hij daar zit en ik er makkelijk kan geraken omdat ik ook werk in brussel.
Daag laat maar iets weten

PS: Mijn maat vond het al super

pieterprovoost

Legacy Member
Als Darkbone geen tijd heeft dan wil ik het wel verder uitwerken. Ben bioloog, studeer nu Marine Sciences in Gent en ga volgend jaar doctoreren. Mijn contactgegevens vind je op http://www.wepp.be.

Moet het trouwens MySQL zijn? Ik wou liefst gewone tekstbestandjes gebruiken.

DarkBone

Legacy Member
Voor mij maakt het niet uit.

MySQL kan wel handig zijn om de frequenties enzo bij te houden van de woorden hé, dus da's extra makkelijk als de woorden dan ook al in de database zitten. Denk wel dat dat de bedoeling is bijvoorbeeld, zo hoeft hij dat niet allemaal handmatig te tellen :p

pieterprovoost

Legacy Member
Ja daar heb je wel een punt. Nu, MySQL is geen probleem voor mij.
Het archief is een bevroren moment uit een vorige versie van dit forum, met andere regels en andere bazen. Deze posts weerspiegelen op geen enkele manier onze huidige ideeën, waarden of wereldbeelden en zijn op sommige plaatsen gecensureerd wegens ontoelaatbaar. Veel zijn in een andere tijdsgeest gemaakt, al dan niet ironisch - zoals in het ironische subforum Off-Topic - en zouden op dit moment niet meer gepost (mogen) worden. Toch bieden we dit archief nog graag aan als informatiedatabank en naslagwerk. Lees er hier meer over of start een gesprek met anderen.
Terug
Bovenaan