Archief - PDF doorzoekbaar maken

Het archief is een bevroren moment uit een vorige versie van dit forum, met andere regels en andere bazen. Deze posts weerspiegelen op geen enkele manier onze huidige ideeën, waarden of wereldbeelden en zijn op sommige plaatsen gecensureerd wegens ontoelaatbaar. Veel zijn in een andere tijdsgeest gemaakt, al dan niet ironisch - zoals in het ironische subforum Off-Topic - en zouden op dit moment niet meer gepost (mogen) worden. Toch bieden we dit archief nog graag aan als informatiedatabank en naslagwerk. Lees er hier meer over of start een gesprek met anderen.

Karelvanhoof

Legacy Member
Ik heb enkele PDF-documenten die ik zou doorzoekbaar wil maken.
Iemand hier ervaring mee? Welke software kunnen jullie mij aanbevelen voor het beste resultaat?

Ik kan Adobe Acrobat XI Pro Student & Teacher Edition aankopen voor 95 EURO.
Of zou Nuance Power PDF standard (99 EURO) een betere keuze zijn omwille van hun gekende OCR technologie?

Exit

Legacy Member
euh, pdf kan je toch gewoon doorzoeken in de reader of de plugins van de browser (online) ...



tenzij je pdf een 'foto' is => dan moet je alles omzetten naar tekst via OCR software natuurlijk

Karelvanhoof

Legacy Member
De inhoud van de pdf's zijn idd 'foto's'.
Mijn vraag is dus met welk programma ik deze best naar tekst komen omzetten, zodat ik deze kan doorzoeken en eventueel nog kan bewerken. Adobe is dan wel de "stichter" van PDF, maar als ik mij niet vergis maken zij gebruik van een OCR-engine van een derde. Ik veronderstel dus dat daarmee ook niet automatisch gesteld mag worden dat Adobe Acrobat het beste resultaat zal geven... Nuance heeft de alom gekende Omnipage in zijn gamma, misschien dat Power PDF (is de vroegere PDF converter) dan ook een beter resultaat geeft?

Exit

Legacy Member
er zijn genoeg gratis (online) alternatieven voor OCR om te zetten
tenzij de pdf is beveiligd => kopieer de foto uit de pdf en sla die via bvb paint op als jpg
gebruik dan een OCR software om er een leesbaar document van te maken.

Poekie95

Legacy Member
OCR is redelijk hit or miss. Probeer indien mogelijk een originele tekst te krijgen (ie geen foto).
Het archief is een bevroren moment uit een vorige versie van dit forum, met andere regels en andere bazen. Deze posts weerspiegelen op geen enkele manier onze huidige ideeën, waarden of wereldbeelden en zijn op sommige plaatsen gecensureerd wegens ontoelaatbaar. Veel zijn in een andere tijdsgeest gemaakt, al dan niet ironisch - zoals in het ironische subforum Off-Topic - en zouden op dit moment niet meer gepost (mogen) worden. Toch bieden we dit archief nog graag aan als informatiedatabank en naslagwerk. Lees er hier meer over of start een gesprek met anderen.
Terug
Bovenaan