KB: Wegens te grote drukte op deze site


Zo maar een voorbeeld: Middeloo te Velsen. Grotere weergave volgt na muisklik op afbeelding.
Bron: Opregte Haarlemsche Courant, 24-05-1808.  Via KB Historische Kranten.

Ik mag graag zoeken, bladeren en lezen in oude kranten. Veel kranten zijn al (deels) gedigitaliseerd. Een overzicht biedt kranten-historisch.startpagina.nl.
Ook de Koninklijke Bibliotheek had al een webpage om in gedigitaliseerde krantenpagina’s te zoeken. En afgelopen donderdag ging het langverwachte nieuwe KB Historische Kranten in de lucht.

Een omvangrijk deel van alle landelijke, regionale, lokale en koloniale kranten die zijn verschenen tussen 1618 en 1995 wordt gedigitaliseerd. Het betreft meer dan 70 verschillende kranten, van de Oprechte Haarlemsche Courant tot het Algemeen Handelsblad en de Rotterdamsche Courant. Nu zijn één miljoen paginaxe2x80x99s voor iedereen toegankelijk. De overige zeven miljoen paginaxe2x80x99s worden in de komende achttien maanden in etappes aan de website toegevoegd (zie ook bericht KB presenteert 400 jaar kranten online).

Van alles is te vinden. Is het niet via KB dan wel via al die andere opties als in genoemde startpagina. Veel is ook nog niet gedigitaliseerd, dus veel zul je ook niet, of nog niet, vinden. En heel veel heeft ook gewoon niet in de krant te staan. En dan zijn er nog redenen van laten we zeggen op het gebied van zoekwoorden en van ‘zoektechnische aard’.
Om uit de losse pols een aantal te noemen:
– variaties in naamgeving, denk aan Beeckestijn. Op hoeveel wijzen kan en is dat niet geschreven?
– of een aanduiding als Chinees of Turks (bij bv tent of tuin). Vaak ook Chineesche, Chinesche, Turksche. Allerlei variaties waar per stuk mee gezocht moet worden.
– en daar op voortbordurend, het gebruik van de lange-s (?). Dus de s die leest als een f zonder het dwarsstreepje. Kijk en dat is wat met het digitaliseringsproces gebeurt. Die lange-s wordt herkent als een f. En daarmee wordt het Engelfche i.p.v. wat het menselijk oog herkent als Engelsche. Zie bovenstaande advertentie met Engelfche Plantfoenen (2x ‘f’).
– en op het technische aspect doorgaand. De krantenpagina die u ziet is een ‘plaatje’, een ‘foto’ van de pagina. Deze is geïnterpreteerd naar ‘normale’ tekst, en op die tekst wordt gezocht. Maar deze omzetting gaat gepaard met fouten. Vlekjes en vouwtjes, om maar twee voorbeelden te noemen, daar kan het menselijk oog wel mee over weg. Maar software? Nee, die is daar minder goed in. Bv Zocher kan dan ineens Zoeher worden. De bovenstaande advertentie resulteerde na omzetting in de volgende tekst:

Uitdehandtekoop: Een extra welgeütiieerde en zeer geëxtendeerde HOFSTEEDE en OVERPLAATS, genaamd MIDDELOO, met deszelfs capitale, zeer aanzienlijke en pretleus betimmerde Heeren-Huizinge , Tuinmans-Wooning, Koetshuis en Paarden-Stallinge , Orangerie, Billard-Kamer, Chinecfehe Sallon , Hermitage, Viukenhuis en verdere Getimmertens, voorts bevallige. Engelfche Plantfoenen, vischrijke Vijvers en Carper-Kom, Bosfchen , Laanen, Boomgaarden, Menagerie, Moes-en Broekuihen, Annanasfen-Bak, Perfiken-‘en Dnrivcu-K.isfen , en laatftelijk de extra weltoegeniaakte Bouw-, Hooi-en Weilanden, Duingronden &c., alles ftaande en gelegenaan de Jtfiddcn-Weg, nabij en onderden Geïcchie van Yelfsa; tebe.vnweubijdeMake-

Dus Chineesche Sallon als zoekterm komt niet met deze advertentie terug, want de omzetting resulteerde in Chinecfehe Sallon. Idem voor Engelsche Plantsoenen; hier resulteerde het in Engelfche Plantfoenen.
Of te wel, gegevens worden vaak niet zo maar gevonden. Als je hetgeen je zoekt niet kan vinden betekent het niet dat er niet over is geschreven. De enige zekerheid die je hebt is simpelweg dat jij niets hebt kunnen vinden.

En ten aanzien van ‘Wegens te grote drukte op deze site’: met veel enthousiasme en belangstelling is de website onthaalt, met als resultaat een overbelasting en de boodschap: Wegens te grote drukte op deze site is het momenteel niet mogelijk alle vragen te verwerken. Onze excuses hiervoor. Wij verzoeken u het later nogmaals te proberen.

Gewoon volhouden!  JH

Facebooktwitterlinkedinmail

4 reacties op “KB: Wegens te grote drukte op deze site

  1. Dit is heel erg leuk!!!
    En mijn vrouw roept altijd dat ik zo goed kan zoeken dus ik weet zeker dat hier mooie vondsten uit voort gaan komen.
    Het Eemlandarchief archief heeft al langer iets vergelijkbaars te vinden onder http://archiefeemland.courant.nu/
    Bij het tuinhistorisch onderzoek op De Viersprong heb ik hier veel informatie kunnen vinden.
    Via de overige artikelen is het ook zo heerlijk je te verplaatsen in de tijd en wat de mensen bezig hield, geweldig!

  2. KB Historifche kranten in de lucht. Goed dat je deze databank hebt aangekondigd Jan. Wil je hem ook op de pagina Beeldbanken invoeren, zodat alle Cascade-vrienden via Links in de linker kolom op deze weblog er heel snel en makkelijk bij kunnen komen? Even nog geen onzinnige vraag bedacht om deze reactie mee te beginnen (zie reactie op vorige weblog), behalve de expres foute spelling die ik maakte in het eerste woord na KB, om te zien of iedereen heeft opgelet. CO

  3. Ik had een kleine voorsprong, omdat ik eerder al wat heb kunnen testen met oudere versies.

    Wat Jan hierboven zegt is helemaal waar: het electronisch ‘lezen’ van juist die oudere teksten en het omzetten in het juiste woord is ontzettend lastig en foutgevoelig. Er hoeft maar wat tekst van de achterkant door te schijnen en de computer hertaalt het woord mogelijk niet meer zoals het er staat.

    Toch twee tips:

    1. Jan noemde het voorbeeld van Beeckestijn, dat je inderdaad op een gekmakend aantal manieren kunt schrijven. Mensen doen en deden dat dus ook. Om het aantal varianten wat in te perken, en daarmee het aantal hits dat in een (1) keer verschijnt te vergroten, kan gebruik gemaakt worden van de asterisk (*).
    Om ‘Frankendael’ als voorbeeld te nemen: noteer ‘frankend*’ (zonder aanhalingtekens) in het zoekveld en alle varianten in het tweede deel van de naam worden meegenomen (dus ‘aal’, ‘ael’ en eventueel ‘ahl’).

    2. De door Jan genoemde ‘lange-s’, die vaak als ‘f’ wordt gelezen, kan worden omzeild door voor een dergelijk ambigue teken het vraagteken in de plaats te zetten. Voorbeeld:
    – ‘engelsche’ levert vandaag 359957 resultaten op.
    – ‘engelfche’ levert vandaag 16676 resultaten op.
    – ‘engel?che’ levert vandaag 378073 resultaten op (wat eigenaardig genoeg meer is dan de 376633 resultaten die je op grond van beide voorgaande mocht verwachten).
    Dit trucje gaat overigens in omgekeerde vorm op voor het Frankendael voorbeeld: ‘frankenda?l’ (263) levert minder resultaten op dan ‘frankend*’ (316), maar misschien zijn zij wel relevanter. Scheelt toch weer 50 keer klikken.

    Hopelijk verkorten deze tips de zoektochten wat, en vinden we de resultaten snel in het publieke domein terug. HvdE

  4. Goeie aanvulling Henk!

    T.a.v. het voorbeeld van het totaal dat meer is dan de som van de losse delen: engel?che resulteert niet alleen in hits met engelsche en engelfche, maar ook in woorden met iedere ander teken dat op de plaats van ? is ‘gezet’. Of te wel daar waar de omzetting op die positie resulteert in een ander teken dan een s of f.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd met *

Anti-Spam vraag: