Archief - Web crawling

Het archief is een bevroren moment uit een vorige versie van dit forum, met andere regels en andere bazen. Deze posts weerspiegelen op geen enkele manier onze huidige ideeën, waarden of wereldbeelden en zijn op sommige plaatsen gecensureerd wegens ontoelaatbaar. Veel zijn in een andere tijdsgeest gemaakt, al dan niet ironisch - zoals in het ironische subforum Off-Topic - en zouden op dit moment niet meer gepost (mogen) worden. Toch bieden we dit archief nog graag aan als informatiedatabank en naslagwerk. Lees er hier meer over of start een gesprek met anderen.

sanderoo

Legacy Member
Hallo,

Ik heb bijna mijn bachelor diploma en volgend jaar moet ik dus een masterproef doen. (ik studeer ind. ing. ICT)
Graag wou ik zelf een onderwerp kiezen, want de onderwerpen die mijn school voorstelt spreken me niet echt aan. Dus ik wou graag weten of iemand een goed onderwerp weet omtrent web crawling.
Het is de bedoeling dat het iets is waarmee onderzoek gepaard gaat en waarbij ik zelf een web crawler (waarschijnlijk in java) zal moeten ontwikkelen.

Zelf heb ik al een twee onderwerpen gevonden:
- Dynamische webcontent crawlen (hidden web)
- Gepersonaliseerde web crawling

Als iemand nog een interessant onderwerp weet.. alle hulp is welkom! :)

Groetjes
sanderoo

NeverwinterX

Legacy Member
Crawl overal waar je volgens robots.txt niet mag komen en analyseer waarom :p

VinceVe

Legacy Member
Security crawlers zouden wel ook misschien een interessant onderwerp zijn. Dat je op een website gaat zoeken achter security holes. :)

sanderoo

Legacy Member
VinceVe zei:
Security crawlers zouden wel ook misschien een interessant onderwerp zijn. Dat je op een website gaat zoeken achter security holes. :)
Over die security crawlers vond ik niet zo veel informatie. 'k heb uiteindelijk besloten om hidden web crawling te kiezen en het is goedgekeurd door mijn promotor :D
Het archief is een bevroren moment uit een vorige versie van dit forum, met andere regels en andere bazen. Deze posts weerspiegelen op geen enkele manier onze huidige ideeën, waarden of wereldbeelden en zijn op sommige plaatsen gecensureerd wegens ontoelaatbaar. Veel zijn in een andere tijdsgeest gemaakt, al dan niet ironisch - zoals in het ironische subforum Off-Topic - en zouden op dit moment niet meer gepost (mogen) worden. Toch bieden we dit archief nog graag aan als informatiedatabank en naslagwerk. Lees er hier meer over of start een gesprek met anderen.
Terug
Bovenaan