Нови технологии и възстановяване на архивното наследство

Електронна библиотека по архивистика и документалистика

Раздел: «Статии»

Научен ръководител на Електронната библиотека: доц. д-р А. Нейкова

Автор: Педро Гарсия

Дизайн: Давид Нинов

София, 2008

Преди два века, когато крал Карл III Испански решил да създаде Главен архив на Индиите в Севиля, той наредил там да се съберат всички документи за испанската колонизация в Америка.

Ставало е въпрос да се съберат в едно архивохранилище документите на институциите на метрополията, централните органи, натоварени с колониалната администрация, без документите на местните администрации. Новото хранилище било предназначено да съхранява документите на Съвета на Индиите, на Casa de Contratación, Casa de Mercaderes и др. Документите, пристигащи от Мексико, Лима или Картахена от Индиите, не е трябвало да се отлагат в този архив.

Програмата в по-голямата си част била осъществена. От Симанкас, Кадикс и Мадрид пристигнали километри от документи, които оформят днес голямото севилско хранилище.

Много документи, които би трябвало да се включат в този архив според решението на крал Карл III обаче никога не са дошли в Севиля. Някои фондове, съдържащи документация, която по своето съдържание не се отнася само за колониите, продължават съгласно логиката да бъдат съхранявани заедно с документите на техните първоначални организации, като напр., документите на Военния секретaриат са запазени в Симанкас, а тези на Инквизицията — в Националния исторически архив в Мадрид.

Дори фондове, съставени изцяло от документи, отнасящи се за Америка, не са били прехвърлени в Севиля: напр. фондът на Министерството за отвъдморските територии от XIX век се намира поради превратностите на историята в Националния исторически архив, въпреки че според идеята на Карл III би трябвало да бъде в Главния архив на Индиите.

Някои важни личности по различни поводи са отбелязвали, че тези документи би трябвало да бъдат в Севиля, за да може този архив наистина да бъде достоен за названието си «главен», но този аргумент не надхвърля стадия на малък архивен конфликт от местен характер.

В действителност изглежда малко вероятно, че след толкова дълъг период от време всичките тези документи физически могат да бъдат прехвърлени в Севиля, където във всеки случай няма да имаме място, за да ги съхраняваме правилно.

Това преместване вече не е необходимо, защото един читател, седнал в читалнята на Главния архив на Индиите може да ползва много лесно, дори и по-лесно, отколкото в техните архивохранилища, документите на Военния секретариат, които са в Симанкас (530 а. е.), на Секцията за отвъдморските територии в Националния исторически архив (965 а. е.), на Секция Разни (24 а. е.), на Секцията на Военните ордени (331 а. е.), на Секцията на Инквизицията (50 връзки), на Секцията на Съветите (250 а. е.) и т. н.

По какъв начин да стане това? Новите технологии ни помогнаха да разрешим този проблем и ни позволиха да осъществим в крайна сметка след два века проекта на Карл III. 530 архивни единици от Главния архив на Симанкас и 1620 от Националния исторически архив бяха сканирани и именно тяхното сканирано копие днес се използва в Главния архив на Индиите, т. е. общо около 4 000 000 страници, които заемат 2500 оптически диска с 5 1/4 инча, наредени на стелажи, обхващащи няколко линейни метра.

Описателната информация, отнасяща се до тези документи, е интегрирана с информационната система на Главния архив на Индиите така, че ако един изследовател търси документи по даден въпрос, те веднага му се предоставят, когато се отнася до документи, чиито оригинали са в архива в Севиля или до документи, които са в цифрова форма. За една или две минути читателят ще види първите образи на търсения документ да се появяват върху неговия работен екран.

Благодарение на тази система архивът на Индиите сега наистина може да се нарече Главен, защото там може да се използва цялата документация под цифрова форма, дори ако самите документи остават в архивите, където първоначално те са отложени.

Тази нова, твърде мощна технология може изгодно да се съчетае, разбира се с известни затруднения, с други технически средства, като например с микрофилма, за да се улесни решаването на проблемите, които поставят консервацията и разпространението на историческото наследство и евентуално неговото възстановяване. Ние ще се опитаме да изложим предимствата на тези нови технологии и да анализираме проблемите, които те повдигат.

1. Решения, произтичащи от новите технологии

Предложените от новите технологии възможности с техните предимства и недостатъци, сравнени с други традиционни технологии, като напр. микрофилма, могат да бъдат групирани в пет групи:

— системи за възстановяване на информацията;

— цифров образ;

— нови носители на информацията;

— обмен на информацията от разстояние;

— обмен на информацията чрез електронно издаване.

1.1. Системи за възстановяване на информацията

Бързото и ефикасно управление на големите количества данни стана относително лесна задача благодарение на съществуването на цял комплекс oт мощно оборудване за обработка на масата информация. Базите данни в различните модели, базите от документални данни, хипертекстовете, хипермедиите и др., позволяват да се натрупва, да се обработва и разпространява всякакъв вид информация с бързина и ефикасност, които доскоро бяха немислими. Преди много години системите за управление на базите данни започнаха да се прилагат в областта на архивите, както в управлението, така и в чистата информация. Множеството каталози, инвентарни описи, пътеводители и други справочници с традиционно описание бяха съставяни в целия свят посредством системите за управление на базите данни, в частност като се използват персонални компютри. Но днес е възможно вече да се мисли за интегрирани системи за архивна информация благодарение на възможностите, които предлагат различните модели за организация на данните, напр. моделът Relationnel, използван доскоро главно за управление, който позволи осъществяването на информационната система в Главния архив на Индиите.

Най-простите и най-удобните oт тeзи системи за «възстановяване на информацията» са тези, които доставят «документалните бази данни». Те са замислени за бързо и лесно управление на текстовата информация и позволяват, общо взето, посредством обратни картотеки и търсене на информацията чрез комбинация от думи, извлечени от свободен текст според булевата логика, една проста и евтина индексация, макар и не твърде точна, основана на, така да се каже, «географска» локализация за всеки от термините, които съставят текста.

Малко по малко тези системи за «свободен текст» се снабдяват с много «по-умни» средства. В бъдеще за архивите ще се използва това, което се нарича «пълен текст», т. е. достъпът до информацията не само посредством описанието, избрано от архивистите (под формата на справочници като каталози, инвентарни описи или даже бази данни), но и пряко чрез самите документи, като «пълният текст» ще бъде включен в информационната система.

Това ще се осъществи чрез различни средства, например като се сканират документите и като се използва оптическа система за разчитане на буквите, или преписвайки документите в информационните картотеки, които ще бъдат пряко достъпни чрез информационните мрежи (много институции получават вече почти цялата си документация на информационен носител). В тези случай може да се окаже рентабилно да се търси пряко по текста на документа, макар че винаги е необходимо да се направи описание с оглед контрол и използване на индекс в езика за контрол.

Всички тези процеси, които току-що коментирахме, и други, като хипертекста или техниките за изкуствен интелект за възстановяване на информацията, започват да предлагат големи предимства по отношение на бързина и капацитет за всички функции на «интелектуален контрол» на информацията, съдържаща се в документите, с голямо предимство за по обширно и ефикасно разпространение.

1.2. Цифров образ

Цифровото изображение е въведено отскоро, но то вече се утвърждава като техника с голямо бъдеще. Това е представяне на физическия образ, получен с помощта на скенер, съхранен в двоичен код върху информационен носител и накрая «възпроизведен» с компютър, за да бъде прочетен на екрана или напечатан на хартия.

Процесът сканиране преобразува оригиналния образ или «аналоговия» в цифров код. Скенерът е апарат, който функционира, от гледна точка на потребителя, почти като класически фотокопирен апарат. Когато се поставя документ в скенера и се натиска бутона за пускане, съвкупността от миниатюрни фоточувствителни устройства (CCD — Charged Couple Devices) обхожда повърхността на документа, анализирайки го точка по точка, повърхността така се разлага на един вид мрежа от точки (откъдето идва употребата на образа «растер»), където всяка се определя със своите пространствени координати За всяка от така определените точки скенерът анализира и измерва интензитета на отразената светлина.

Така получената информация (локализиране на всяка точка чрез своите пространствени координати и нивото на осветеност) се превръща в двоична или цифрова информация от компютъра и се запазва в тази форма. За да се пристъпи към четене или онагледяване, компютърът «възстановява» на екрана или върху хартия всяка от първоначално анализираните точки, нейното ниво на собствена осветеност. Възстановеният образ е подобен на opигинала, но ако се изследва в детайли с подходящ оптически уред, може да се различи всяка от точките, които го съставят. Това не е непрекъснат образ, но «дискретен» образ, съставен от миниатюрни точки, т. е. това е цифров, а не аналогов образ.

В действителност може да се говори за три типа различни образи: образи в черно и бяло на «двойно ниво» (където всяка точка или пиксел е представена в черно или бяло), образ в сиво (където всяка точка може да бъде черна, бяла или с междинен цвят в гамата на сивото) и цветен образ.

Сравнен с традиционния образ върху микрофилм например цифровия образ има предимства, но също и неудобства.

Предимствата са очевидни:

— цифровият образ, интегриран в информационните системи, позволява много бърз достъп до информацията;

— цифровият образ, съставен от числа или digits (цифри), може да бъде разглеждан с математически алгоритми, за да се подобри качеството и четливостта;

— благодарение на този процес може да се съставят системи за масово натрупване на големи количества от образи.

— възможно е оттам да се извадят неограничено количество копия без загуба на качество;

— цифровият образ може да се използва посредством комуникационните линии и да бъде включен в «електронните публикации»;

— възможно е системите за оптично разпознаване на буквите (OCR) да се използват за «четене» и «преписване» на репродуцираните текстове в цифров образ.

От друга страна, проблемите, които поставя цифровият образ, са също добре познати:

— завишена цена;

— отсъствие на специфични норми, откъдето произтичат затруднения при размяната на информация;

— бързина на технологичното развитие, която изисква стратегии за «актуализиране», т. е. промени или адаптиране, за да се използват новите съоръжения;

— необходимост периодично да се прехвърля информацията върху нови носители, за да се избегне повреждането или загубването й и за да може да се каже: «Днес, да се съхранява, означава да се презаписва».

1.3. Новите носители на информацията

Новите носители за съхранение на информацията са с голям капацитет. За вътрешната памет на компютрите, полупроводниковите чипове имат все по голяма плътност, която позволява на паметта RAM на компютрите да разполага със стотици мегабайта за мигновена обработка на големи количества от данни. Лентите и магнитните дискове, които бяха традиционния носител на информатизираните документи, също видимо увеличиха своя капацитет, тъй като днес можем да разполагаме с малки ленти или касети с размер на аудио касета, способни да поберат големи количества от данни.

Но най-голямата новост по отношение на носителите на информация е появата и разпространението на оптическия диск под различна форма, а отскоро и на оптическата лента.

Отскоро най-достъпен за архивите оптически носител е оптическият диск, познат главно на пазара под името WORM (Write Once Read Meny), макар че съществуват и други наименования, като PROM (Programmable Read Only Memory) или DRAW (Direct Read After Write). На пазара се намират също и oптически презаписващи дискове, при които информацията може да се изтрие и дискът да се актуализира повторно. Този диск, притежаващ характеристики, общи за магнитнитe системи, е наречен по тази причина «магнитооптичен».

Съществува и друг вид оптичен диск (CD-ROM), който ще бъде полезен за архивите в близко бъдеще. По нататък ще говорим за него.

Защо дисковете WORM представляват непосредствен интерес за архивите?

Това се дължи на следните причини:

1. Техният огромен капацитет за съхраняване, по-голям от този на всички други носители, ги прави напълно подходящи за съхранение на цифрови образи и документи.

2. Те могат да бъдат записвани пряко от ползвателя, с възможност към него по-късно да се прибавя информация другояче казано, те могат да бъдат използвани за работа ежедневно и да се актуализират on line.

3. Те предлагат пълна сигурност за съхранението на образи, тъй като не са изтриваеми.

4. Въпреки че понастоящем не съществуват сигурни данни за тяхната дълготрайност, възможно е да имат по-голяма дълготрайност за съхранение от магнитните носители и даже може би от тази на други носители, каквито са лентата, микрофилма и пр.

5 Съществуват, освен това много формати на оптични дискове, за част от които ще говорим по нататък, какъвто е компактдискът, много полезен като елемент за публикуване по електронен път.

1.4. Мрежи за пренасяне на данни

Едно от най-очевидните предимства, с които днес разполагат потребителите, е възможността за взаимни връзки, благодарение на мрежите за пренасяне на данни. Тези мрежи, които използват различни технологии, позволяват на потребителите да установяват контакти благодарение на големите системи за размяна на информация.

Масовото използване на новите технологични изобретения като оптичното влакно ще позволи да се изпращат в целия свят по почти мигновен начин баснословни количества от информация. Става въпрос за появата и разпространението на това, което се нарича «магистрали на информацията», които ще позволяват незабавно свързване на различните информационни източници, благодарение на по-мощните непрекъсваеми мрежи за връзка по такъв начин че информацията и капацитетът на компютрите за съхраняване и обработка да се използват в максимална степен.

Досега архивите също можеха да започнат действия в областта на пренасянето на информацията от разстояние както това вече стана в други близки информационни области, по-специално в библиотеките. Без съмнение тази необходимост не се е чувствала дълбоко поради известни характеристики, които отличават архивния документ от библиотечния или от този на център за документация:

— уникалност на архивния документ (противоположно на многото екземпляри от отделна книга);

— контрол на хранилищата на архива за собствените му документи, различни от тези на другите хранилища;

— привидно по-малка бързина, що се отнася до достъпа до информацията, съдържаща се в архивите;

— недостатъчност на финансовите средства на архивите.

Тези възможности за достъп от разстояние ще могат все пак да заинтересуват архивите в бъдеще, с оглед по-добро използване на информацията и по-конкретно, в дейностите по възстановяване на архивното наследство, така, както говорихме по-горе, но тези възможности впрочем не позволяват в едно обозримо бъдеще да се предвидят «читални от разстояние» или «възможни читални», дори такива за «телепотребители».

1.5. Електронно издаване

Новите технологии откриват нови възможности за масова размяна на информация на относително икономични цени. Една от тях е електронното издаване. Още отсега хиляди и хиляди бази данни са на разположение на пазара и могат да бъдат закупени от всеки потребител, притежаващ минимално информационно оборудване персонален компютър и приставка за CD ROM.

CD ROM използва в основата си същата технология, която обслужва производството на музикални компактдискове, върху диск с диаметър 12 см може да се побере повече от 600 мегабайта цифрова информация (текст, фотографии, графики). Физическият формат беше стандартизиран чрез споразумение между «Филипс» и «Сони» през 1985 г, а логическата структура беше съгласувана от група представители на промишлеността под формата на «предложение от High Sierra», която залегна в стандарта ISO 9660. Новите модификации на CD ROM, които съществуват на пазара (CD-I, CD-ROM ХА, DVI...) позволяват едновременно да се интегрира образа, звука, текста, графиките и данните, които могат да се използват взаимно.

Големите обеми данни, които могат да се поместят в един обикновен CD-ROM, на твърде достъпна цена, с възможност за пряко използване, независимо от какъвто и да е PC (персонален компютър), създадоха нова издателска индустрия върху оптически носител, който предлага положителни алтернативи на традиционните форми за използване в режим on line. Днес съществуват хиляди бази данни, достъпни с CD-ROM които всеки потребител може да ползва на своя персонален компютър без да ползва комуникационните мрежи.

В бъдеще двете форми за достъп до базите данни вероятно ще съществуват едновременно, всяка със своите предимства и недостатъци, които са главно:

— по-ниска цена за масово използване на CD-ROM, отколкото използването в on line;

— по-голяма опростеност, предлагана главно от CD-ROM, отколкото интерфейсите на потребителя;

— по-голяма лекота, която се дава чрез достъпа on line за честото поставяне в изправност на базите данни.

2. Използване на новите технологии за възстановяване на архивното наследство

При различни случаи в международен план се признава значението на копията на документите за възстановяване на архивното наследство. Това признание може да се разпростре и върху новите форми за цифрово репродуциране, които, както вече казахме, предлагат положителни решения за архивите, но с известни неудобства все пак.

2.1. Възстановяване на информацията

Очевидно е, че първата помощ, която могат да окажат новите технологии, е да улеснят по-доброто опознаване на документацията, интересуваща различните местни или национални архивни наследства. Интеграцията на тази информация в автоматизираните системи ще позволи много по-лесно да се разменя описателна информация, съдържаща се в документите, която може след това да се разпростре върху магнитни носители (напр. инвентарни описи на Отвъдморската секция в Националния исторически архив, които могат да се ползват в Международната система на Главния архив на Индиите), или при обмена чрез комуникационните линии (напр. информацията за Tribunal des Comptes de La Havane, която може да ce ползва в базите данни на Информационно-документалния център на Архива на Мадрид, благодарение на мрежата PIC в Министерството на културата) или още под формата на издание в CD-ROM.

2.2. Репродукция на документите

Архивните фондове, представляващи интерес за много архивни наследства, могат да бъдат възпроизведени под цифрова форма и по този начин да се доставят екземпляри за използване на всички заинтересовани страни. В случая с Главния архив на Индиите, за който говорихме в началото на това експозе, документите, засягащи Америка, съхранявани в Главния архив на Симанкас и в Националния исторически архив, се използват така лесно в Севиля, както в тяхното оригинално архивохранилище.

2.3. Правила за размяна на документацията

Както беше изяснено по-горе, различните правила за размяна на информацията са:

— доставяне на копия на информационен носител (оптичен или цифров). В този случай документите могат да бъдат използвани на местата, разполагащи с копия, които общо взето не са много;

— използване от разстояние посредством комуникационни линии. Макар че копията от документи се съхраняват само на едно място, можем да имаме достъп до него от различни пунктове;

— осъществяване на издаване чрез CD-ROM. Дисковете могат да бъдат разпространени и да се използват навсякъде при относително ниски цени.

3. Предимства и недостатъци

Въпреки че вече говорихме за различните предимства и неудобства на информационните системи, сравнени с традиционните системи, можем да ги резюмираме по следния начин:

Предимства:

— по-голяма бързина на достъпа и улеснение за разпространяване на информацията;

— по-големи възможности за обработка на образа чрез подобряване на неговото качество или неговата четливост;

— възможност цифровия образ да се възпроизвежда неограничен брой пъти без загуба на качество;

— възможност за интеграция на цифровия образ в системите за масово натрупване на данни с другите функции за контрол или управление на архивите;

— възможност за използване посредством комуникационните линии и за разпpocтранение, благодарение на «електронните публикации»;

— възможност да се използват системите OCR, приложими към образите на документите;

— огромен капацитет за съхраняване на информация върху новите носители;

— възможност да се използват новите носители за записване и впоследствие за директно актуализиране на информацията;

— за някои от новите носители — нараснала сигурност за съхранение на образите (те са неизтриваеми).

Недостатъци:

— повишена цена;

— липса на съответни норми, откъдето произтичат проблеми при обмяната на информация;

— несигурност по отношение трайността на новитe носители, като мненията по този въпрос се различават. Все пак следващите две бележки правят значението на въпроса за трайността oтносителен;

— бързата еволюция на технологията води до необходимостта стратегиитe за периодично «опресняване» на копията да се приспособяват към новото оборудване, новите системи и новите носители;

— необходимост периодично информацията да се презаписва на нови носители, за да се избегне нейното повреждане или загубване; това, което днес можем да наречем «да запазим, значи да презапишем».

В резюме можем да кажем, че принципите, които ръководят използването на системите за репродуциране на документите, за да се възстанови архивното наследство, са също така валидни и за използването на новите технологии. Разликата е, че с новите технологии може да се отиде по-далеч, отколкото с традиционните системи: възможностите са най-разнообразни, бързината за достъп е по-голяма, начините за разпространение са повече. При всички тези случаи това, което има стойност, е не толкова оригиналният документ с неговия физически носител, колкото информацията, която той съдържа. Ние решително напредваме по пътя на еволюцията, която отдава по-голямо значение на самата информация, отколкото на нейния носител.