Traffic analysis

Vědecká knihovna Olomouc
Vědecká knihovna Olomouc
Česky English Deutsch

Digitalizované historické dokumenty a jejich zpřístupnění

Pozvánka na konferenci, velikost 34 kB.

11. ročník odborné konference
Problematika historických a vzácných knižních fondů Čech, Moravy a Slezska

Digitalizované historické dokumenty a jejich zpřístupnění

Stanislav Psohlavec

Ke konci roku 2002 bylo v rámci projektu "Memoriae mundi series Bohemica" (MMSB) kompletně zdigitalizováno již více než 700 knih. To znamená cca 350.000 obrazů, ale také 700 dosti podrobných popisů. Dokud bylo digitalizováno jen několik desítek rukopisů, byl význam dat spojených s obrazy nízký, nyní však již představují zajímavý zdroj informací. Proto jsme vytvořili a na Internetu zpřístupnili databázi představující dosavadní výsledky. Adresa této databáze je http://www.memoria.cz.

Dalším naším úkolem podobného typu bylo vytvoření databáze záznamů o rukopisech pořízených na základě projektu MASTER. O projektu MASTER je příspěvek pana doktora Uhlíře, zde jen připomenu, že výsledkem projektu je metodika dovolující využití XML pro popis historických dokumentů. Metody lze použít pro velmi podrobný popis, stejně jako pro uchování jednoduchých dat, spíše inventárního charakteru. Proto jsme přivítali možnost konvertovat a k těmto datům připojit rozsáhlá data inventáře zámecké knihovny v Kynžvartu. Vznikla tím databáze obsahující nyní přes 26.000 záznamů, z nichž část je velmi jednoduchá a část dosti podrobná. Věřím, že setkání těchto heterogenních dat v jednom prostředí, pod jedním rešeršním nástrojem ukáže, že takovéto společné zpřístupnění různých dat má smysl. Dosavadní výsledky potvrzují správnost tohoto vývoje. Ukazuje se, že pokud je známa struktura existujících dat, nezáleží příliš na tom, jaká je jejich forma v technických detailech. Je v celku snadné jakákoli strukturovaná data konvertovat do XML a tím umožnit využití již existujících nástrojů.

Z tohoto hlediska mne zaujal příspěvek pana PhDr. Pumprly, který seznámil účastníky konference s problémy se zpracováváním dat v projektu CLAVIS a také se zmínil o tom, že data tohoto projektu nyní existují v jednoduché tagované struktuře. Zdá se, že převod těchto dat do formy XML (s možností využití výsledků evropského projektu MASTER) by byl dosti jednoduchý. Proto jsem nabídl projektu CLAVIS bezplatnou pomoc při konverzi existujících dat a také pomoc s prezentací dosavadních výsledků na Internetu.

Kam směřuje další vývoj u nás? S rostoucím množstvím dat je stále důležitější snadné rutinní používání a zpřístupnění existujících informací. Již v počátcích jsme rozeznali nezbytnost využívání veřejně deklarovaných struktur, uznávaných standardů a důslednou nezávislost na jakýchkoli firemně závislých nástrojích. Splnění těchto požadavků není vždy nejjednodušší, ale je jistotou do budoucnosti. Proto byla naše metodika přijata v roce 2000 jako doporučení UNESCO pro projekt "Paměť světa".

Nyní se čím dál více mluví o XML, o projektu MASTER a nabízí se otázka, v jakém vztahu k tomuto projektu jsou aktivity AiP Beroun? Nezávislost dat a jejich odtržení od nástrojů na jejich tvorbu a využívání byla rozpoznána nejen námi. Je to zřejmá nezbytnost. První zkušenosti s daty pevně svázanými s programy vedly obecně k vystřízlivění z euforie nad všemocností počítačů a programů. Také pro nás bylo vydání prvního (velmi chváleného) disku v roce 1993 s ukázkami nejvzácnějších dokumentů nejprve velkou radostí, ale pak i varováním. Tento disk již na současných počítačích a systémech nefunguje správně, protože rychle zestárl program (nikoli informace nebo samotný disk). Naštěstí jsme toto nebezpečí záhy pochopili a proto již na počátku projektu MMSB vznikla koncepce naprosté nezávislosti produkovaných dat na jakýchkoli programech a nestandardních formách. Proto vznikla forma nazvaná DOBM (Digitisation of Old Book Materials), které veřejně deklarovanou formou používá standardizovaných prostředků (SGML) pro záznam potřebných informací a vytvoření digitálního obrazu knihy.

Rád tvrdím, že firma Microsoft a Bill Gates pracují pro nás, protože stále vymýšlí, jak zlepšit použitelnost námi produkovaných dat ve formě DOBM. Data vytvořená před čtyřmi lety jsou zřetelně lépe použitelná na PC v poslední verzi MS Exploreru a MS Office než ve starších verzích. Totéž platí o platformě Macintosh. DATA a jejich FORMA se však nemění. Zlepšují se jen nástroje pro práci s nimi.

Z podobných důvodů jako DOBM, ale se širším záběrem a obecností, vznikl později projekt MASTER. Ostatně i samotné XML se prosadilo až po začátcích projektu MMSB. Principy jsou díky shodné logice a cílům shodné. Rozdílný je záběr - obecnost cílů.

Projekt MASTER si vzal za cíl vypracovat nástroj dovolující strukturaci (pokud možno) libovolného popisu historického dokumentu. Prvoplánově vznikl jako komplexní metodika, nevázaná jakkoli na konkrétní praktický úkol.

DOBM vznikl jako nástroj se stejnými formálními vlastnostmi (nezávislost na SW, HW, nadčasovost, založeno pouze na textu, využívání tagů, ...) ale vznikl v souvislosti s konkrétním úkolem - digitalizací a praktickým zpřístupněním rukopisů v projektu MMSB.

Z tohoto hlediska jsou dokumenty projektu MMSB logicky blízké s dokumenty se strukturou MASTER. Liší se formálními znaky. Uložení významných informací je zjednodušeně řečeno podmnožinou struktury definované v projektu MASTER. Protože jde v principu o stejnou koncepci, jsme pochopitelně účastni na vývoji prostředků podporujících projekt MASTER a ve zpřístupňování jeho výsledků.

Jestliže se v jednom prostředí setkají data z různých zdrojů strukturovaná na stejných principech, lze na všech datech užít všechny použitelné nástroje. Hledání "společného jmenovatele" je tedy výhodné, může znamenat získání dříve nedostupných, ale již existujících nástrojů. Také vývoj nových, třeba i specielních nástrojů, je přínosem pro práci se všemi daty.

Teoreticky bychom mohli lpět na DOBM, protože data na která nyní "dosáhneme" jsou bez problémů popsatelná s využitím DOBM. Naopak některé informace technického charakteru, které k dokumentům připojujeme, MASTER nezná. Také informace o jednotlivých stranách dokumentu se v MASTERu zařazují obtížně. Naproti tomu MASTER nesrovnatelně obecněji a tím i perspektivněji zvládá popis dokumentu. Zdá se, že řeší všechny současné potřeby odborníků a zároveň má v sobě zakotveny postupy dovolující řešit dosud neznámé požadavky. Proto využijeme pro popis dokumentů konvencí definovaných v projektu MASTER, s rozšířením o technické informace a informace o jednotlivých stranách. To dovolí, aby data vznikající primárně v projektu MASTER, veškerá data do této formy konvertovatelná (a to jsou v podstatě všechna, o kterých vím) i data vzniklá v projektu MMSB, se mohla obhospodařovat stejnými nástroji. To znamená nejen možnost vzniku jedné společné nebo více podobných kompatibilních databází, ale i možnost použití veškerých dalších existujících i v budoucnu vyvinutých nástrojů.

V současnosti zpřístupňujeme databázi "Memoria" která prezentuje dosavadní výsledky digitalizace. Důležitější je ale mladší databáze postavená na projektu MASTER, která spojí dostupná data včetně výsledků digitalizace a bude otevřena i jakýmkoli datům dalším. Odkaz na tuto databázi zde vědomě neuvádím, změny umístění nejsou vyloučeny a budou uvedeny na výše uvedené adrese.

Databáze "MEMORIA"

Databáze vzniklá z bibliografických popisů digitalizovaných rukopisů má svá specifika. Společným jmenovatelem vzniku těchto digitálních dat v projektu MMSB je primárně vytvoření nezbytného základu pro vznik digitální knihy, digitalizovaných vzácných rukopisů a starých tisků. Vstupem pro databázi MEMORIA jsou tedy zásadně hotové digitální dokumenty na CD-R disku s kompletním digitálním obrazem a popisem originálních dokumentů. Takové disky jsou "nabídnuty" našemu systému k importu a po jejich automatizovaném zpracování a kontrole importu se zařadí do této databáze a zveřejní.

Zpřístupnění na Internetu navazuje na to, že jsme mimo jiné producentem bibliografických databází. Bylo proto logické využít prostředky, kterými disponujeme, i ve prospěch tohoto projektu.

Autorská práva

Popisná data pocházejí od odborníků spolupracujících přímo s námi (pokud zadavatel digitalizace - účastník projektu MMSB - nemůže zajistit popis sám) nebo jej dodá sám zadavatel digitalizace.

Ve vyhlášení projektu VISK 6 je deklarován záměr data vzniklá a použitá v projektu MMSB zpřístupnit pro nekomerční využití. Účastí v projektu VISK 6 přijímají zadavatelé digitalizace tento záměr a garantují použitelnost poskytnutých i vzniklých dat v tomto smyslu.

Přístup k celým dokumentům

Pro každý rukopis zanesený do této databáze existuje kompletní digitální obraz originálu, který je pro badatele dostupný v Národní knihovně České republiky a v instituci, která zadala digitalizaci, což je obvykle shodné s institucí uvedenou v databázi v položce "Místo uložení".

V současnosti je v databázi "Memoria" k textové informaci připojeno ke každému záznamu jen několik náhledů obrazů, vybraných podle určitých pravidel z odkazů, vyskytujících se v popisu dokumentu. Pracujeme na vytvořením on-line přístupu z této databáze ke kompletnímu digitálnímu obrazu vzácného dokumentu, který je kromě uložení na pevném mediu (CD-R, DVD) importován také do datového úložiště "Digitální knihovny" v Národní knihovně.

Aktualizováno: 02.09.2008
Redaktor: správce www stránek
Pošli e-mailem
Trvalý odkaz


Vědecká knihovna Olomouc, ­ ­­­­­­­ ­Bezručova 659/2 ­Olomouc 9, 779 11­­­ tel.  +420-585 205 300 e-mail: vkol@vkol.cz   Otevírací doba: Po - Pá 8:30 - 19:00 So 9:00 - 13:00* Ne zavřeno   *MVS a studovna vázaných novin - zavřeno   ID datové schránky­­: yswjrie  
Vědecká knihovna v Olomouci je příspěvkovou organizací zřízenou a financovanou Olomouckým krajem
Tvorba www stránek © Winternet 2008 - 2018
Aktualizováno: 23.10.2018 20:20
TOPlist