Die andere spaties waren me ook opgevallen bij US. Daarom blijf ik het vreemd vinden dat als ik de platte tekst uit de pdf kopieer, ik de spaties niet zie. (Zie mijn tekst stukje hierboven)
En bij kopiëren wordt er nooit een spellingcorrectie toegepast. Daarom mijn vermoeden dat er ascii tekens tussen geplakt worden die niet bij leesbare tekens horen. US geeft deze dan als spatie weer en bij een tekst kopie worden ze gewoon weggelaten.
Maar wat het ook is, de scannersoftware is gewoon niet goed. Ik heb in het verleden veel tijdschriften ingespannen met de scannersoftware van Canon. Daar had ik zelden tekstproblemen. Zeker niet in de aantallen als hierboven. Zeker niet als het voorbeeld zo scherp is als hier.
----
Voor de aardigheid heb ik de 1e pagina eens uitgeprint en ingeschat als OCR bestand met de VueScan software:
.Want niemand leelt voor zichzell alleen
en niemand sterlt voor zichzell alleen;
want als wi] leven, het is voor de Heer
en als wi] sterven, het is voor de Heer.' Rom. 14. 7-
Gedenk in uw gebeden
Johannes Frederikus Allerink
weduwnaar van
Aleida Johanna tan Elsen
Hi] werd geboren te Eibergen op 30 juli 1889
en is door een noodlottig ongeval overleden op
1 lebr.19ó9in het r.-k. ziekenhuis te Enschede.
Donderdag 6 lebr. is hi] begraven op het r.-k.
kerkhofvan de St. Bonilatiusparochie,Veld maat
te Haaksbergen.
Onverwachts is vader van ons heengegaan; en
dit plotselinge heengaan valt ons zwaar en
maakt ons droevig.
Toch denken wi] dankbaar aan vader terug als
een bil] mens. die tevreden leefde en bezorgd
was overzijn kinderen. Hi] leefde te midden van
ons als een diepgelovig mens die de zin van
zijn leven zocht bij God.
Dierbare kinderen en kleinkinderen graag was
ik nog een paar ]aar bi] jullie gebleven; maar
hoe oud de mens ook wordt, eemaal komt de
dood en daarmee de eeuwigheid. Vergeet dit
nooit.
Bewaartde vrede onder elkaar en bidt voor mij.
Die scannersoftware doet het goed, hoewel hij wel problemen jet de letter 'j' heeft die deze tekst gebruikt. Vroeger had ik nog OCR software die je bepaalde letters expliciet kon laten leren.Bij VueScan kan dat volgens mij niet. Je kunt alleen de taal instellen, zodat hij op grond daarvan correcties kan uitvoeren.
VueScan kun je
hier downloaden. Het is commerciële software, maar de ongeregistreerde versie kan volgens mij wel al ORC doen om te evalueren.