Подходът IDEA: един опит за нормализация на описанието(1)

Електронна библиотека по архивистика и документалистика

Раздел: «Статии»

Научен ръководител на Електронната библиотека: доц. д-р А. Нейкова

Автор: Дидие Гранж

Дизайн: Давид Нинов

София, 2008

Контекст

От момента на създаването му през 1986 г., в Архива на Женева постъпиха и бяха обработени около 80 архивни фонда от публичен или частен произход. Инвентарните описи на тези фондове възлизат на около 6000 страници текст. Те бяха изготвени последователно в ръкописна форма, печат, чрез програмата Visio 4 и, накрая най-новите, в Word-формат.

В дългосрочен план прибягването до текстообработващ софтуер ни изглеждаше не особено надеждно. Ето защо, с цел изпълнение на задачата, неколкократно разглеждахме въпроса за придобиването на деловоден софтуер, и по-специално програма за архивно описание.

Във всички случаи тези средства поставят значими проблеми: развитието и трайността им зависят изцяло от търговските доставчици, чиято продължителност на съществуване съвсем не е застрахована; придобиването им е свързано със значителни разходи както за закупуването им, така и за поддръжката им; потребителят няма никакъв контрол върху формата им, структуриращ данните.

Вследствие от тези констатации решихме да разработим собствен подход. След 2001 г. целите на проекта вече бяха ясни. Искахме да осъществим автоматизирано информационно средство, което:

— Да се основава на международните стандарти (Архивът на Женева от дълго време стимулира прилагането на стандарти. Интересът към стандартизация съществува от 1994 г. От 1996 г. насам Женевският архив съставя инвентарни описи частично съобразени с ISAD(G). През 1997 г. онлайн бяха въведени описания на ниво фонд, базиращи се на комбинация от стандартите ISAD(G) и канадския RDDA — Правила за описание на архивни документи;

— Да позволи автоматизираното възстановяване на вече съставени инвентарни описи;

— Да улесни изработването на нови инвентарни описи;

— Да дава възможности за използване от лица, които нямат образование по архивистика (по-голямата част от инвентарните описи са дело на стажанти или лица, ангажирани на временен договор);

— Да позволява използване онлайн на всички инвентарни описи. След обсъждане, достигнахме до комбинацията ISAD(G) и EAD/XML, независими от търговските доставчици стандарти, които имат предимството да са устойчиви, като същевременно подлежат на развитие. Така се роди идеята за подхода IDEA (Instrument de description electronique des archives), благодарение на който през декември 2003 г. инвентарните описи бяха въведени в интернет.

От проектите...

Вследствие на благоприятни обстоятелства бяхме в състояние да преминем от скицата към реализирането на проекта:

— През пролетта на 2002 г. наша колега от Висшето училище по управление в Женева ни осигури връзка с г-жа Сара Бен Лага — програмист, специализиран в компютърния език XML, и преподавател във Висшето търговско училище при Университета в Лозана и във Висшето училище по управление в Женева. Тя прояви интерес към нашия проект.

— В началото на есента същата година Архивът получи необходимото финансиране за осъществяването на заданието, а Службата по автоматизация към Дирекцията за информационни системи в Женева определи един от своите програмисти г-жа Ваня Кавали за работа по проекта.

— Накрая, през декември г-жа Сара Бен Лага беше командирована от Висшето училище по управление в Женева за работа и осъществяване на компютърното задание, базирано върху ISAD(G) и EAD, за инвентарните описи на институцията ни.

... към осъществяването

От декември 2002 г. процесът тръгна и последваха няколко етапа. Проектът отне всичко 13 месеца. За улесняване на конвертирането на старите инвентарни описи в нова информационна система предварително трансформирахме в Word всички съществуващи описи в ръкопис, печатни или във формат Visio4. Трябваше по-скоро да успеем автоматично да възстановим максимум данни, отколкото да обхванем отново информацията или да кодираме ръчно описите. Отпуснатата инвестиция за модифициране и приспособяване на съществуващия научно-справочен апарат може да се окаже твърде добра в момента на трансформиране на описанията в EAD, и най-вече в случаите, когато кодирането може да бъде автоматизирано.

От самото начало на проекта направихме избор, който беше определящ в хода на работата. Вместо кодиране в EAD на ръчно изготвените описи, в центъра на процеса поставихме ISAD(G), версия 2000. Този стандарт трябваше да бъде нещо като гръбначен стълб на заданието. Та решихме просто да кодираме във формат EAD полетата ISAD(G) и да добавим четири полета за индексиране: институции, лица, места и теми.

След тази основна опция Сара Бен Лага разработи специфично DTD във формат XML, базирано на структурата ISAD(G). Тя създаде серия от автоматизирани процедури, които позволяват конвертирането от Word в DTD, както и създаването на файлове EAD, html и pdf.

Като издателска програма XML тя предпочете XMLSpy пред XMetal, обикновено използвана от архивните институции с оглед на разходи и съвместимост.

Колкото до Ваня Кавали, от една страна тя внимаваше да разполагаме с необходимия технически носител и, от друга страна, осъществи заданието Lotus Notes (Стандартен продукт за Женева за обработка на данни в базите документи, платформата Lotus Notes е подбрана заради нейната гъвкавост и бързина на адаптиране. Възможно е и прибягването до друга база данни.), в което са складирани и обработени XML, html и pdf файлове, управлявани посредством програмата XMLSpy и реализираните от Сара Бен Лага средства. Накрая тя замисли помощно онлайн средство, предназначено за потребителя, и модул за запазване на документи.

С оглед обобщаване на опита на всички работещи по проекта и използването му в бъдеще, с напредването на работата изготвихме кратко Ръководство по заданието от 40–ина страници. Въпреки че използването на IDEA не е сложно, то изисква някакъв практически опит за вникване в особеностите. Тази инициатива се оказа много полезна. Пособието, непрекъснато обогатявано, постепенно се превърна в безценен справочник.

Резултатът

Уеб-страниците, съдържащи инвентарните описи към фондовете на Градския архив на Женева, са достъпни онлайн от 9 декември 2003 г. (http://www.ville-ge.ch/archives/). Всички описи, без изключение, са на разположение като уеб-страница (html), подлежащ на отпечатване документ (pdf) и кодиран документ (EAD).

Що се отнася до уеб-страниците, основната ни грижа бе да осигурим за потребителите възможно най-добър навигационен комфорт. Ето защо основните данни, необходими за лесно преместване в инвентарния опис, каквито са зоните на ISAD(G) и сериите, съставящи фонда, фигурират постоянно в левия прозорец (допуснахме едно единствено отклоняване от ISAD(G) като избрахме вместо прозорец «Бележки» да добавим «Класификационна схема», който е автоматично управляван от заданието). Така потребителят лесно би могъл да се ориентира в структурата на всеки фонд и да осъществява навигация благодарение на хипертекстови връзки.

Още повече, ако той желае, би могъл да прибегне до търсачката в Lotus Notes и да извърши едновременно търсене в няколко фонда или в цялата съвкупност от фондове. Търсенето в специфичен инвентарен опис може да се осъществи посредством браузър. Ние избрахме да се задоволим за момента с това решение, което се оказва доста ефикасно.

Потребителите могат също така да запазват предварително документите, които ще ползват на място в архива. Във всички случаи е необходим минимален срок от 48 часа. Тази възможност беше доста добре посрещната.

Последствия за архивите

Най-голямото затруднение, което срещнахме в работата по проекта, беше от архивен, а не от технически характер, както очаквахме преди да се хвърлим в тази операция.

Фактът, че сме нова институция улесни задачата ни. Нямахме нито огромна маса инвентарни описи, нито пък натрупване на допълнителни описания, правени по различен модел с течение на времето. Най-старите описи бяха по-сложни за конвертиране в сравнение с новите. Понякога например архитектурата на фондовете трябваше да бъде преработвана, тъй като често се оказваше несвързана с останалите нива на описание. Затова пък описите, реализирани след 1996 г., частично съобразени с ISAD(G), леко преминаха препятствието.

Стандартът ISAD(G) налага постоянно съблюдаване нивото на описание. Всяка информация трябва да бъде стриктно свързана със съответното ниво. Трябваше да изменим практиката си и да въведем няколко вътрешни правила, така че да се запази известна логическа връзка. Някога информацията за експертизата и подбора например фигурираше във въвеждащата част на инвентарния опис, отнесена към фонда в неговата цялост или към една от неговите подчасти. Отсега нататък тя е разпределена към съответното ниво: единствено операциите по експертизата и подбора фигурират на ниво фонд, докато другите се намират в описанието към съответното ниво.

IDEA също така наложи да преосмислим дълбочината на описанието, което искахме да изберем за всеки инвентарен опис. Можехме да модулираме намесата си съобразно значимостта на фондовете, обема, спешността на задачата и наличния персонал. Тази малка революция в практиката може да се окаже твърде полезна с оглед извършването и планирането на съвкупността от операции по обработката на фондовете в една институция.

Прибягването до подхода IDEA постави на преден план проблеми, които не изглеждаха очевидни в началото. Трябваше например да внимаваме за избягването на голяма разнородност в описанието и най-вече при посочването на повтарящи се данни, като дати, справочни данни, съкращения и т. н. Така успяхме да изработим кратко ръководство за описанието, постепенно допълвано в хода на обработката и с приноса на работещите. Този начин на работа щеше да ни позволи да разполагаме в края с помагало за справки и контрол, предназначено за всички онези, които класират и описват фондове, нещо което не съществуваше до този момент.

Още малко по-далеч

Въвеждайки всичките инвентари в интернет, ние осъществихме определено напредничав проект. Не става дума обаче да спираме дотук. Проектът представлява в действителност само един етап. Той се вписва в един по-широк план, който е добре да бъде разработен.

Публичната и Университетска библиотека, която ни партнираше от самото начало на проекта, днес работи по адаптирането на нашето задание за нуждите на департамента си за ръкописи. Във всеки случай необходимата степен на прецизност на описание на литературни или научни ръкописи, към които той е приложим, налага да се доразработят някои информационни полета и полета за индексация, което ние не направихме.

След пускането онлайн на нашите инвентари, други служби в Женева, както и архиви в други кантони на Швейцария проявиха интерес към IDEA. Този справочник, който искахме да бъде съобразен с международните стандарти, опростен, гъвкав и евтин, от създаването си беше замислен, за да бъде споделен. И така щяха да разцъфтят нови партньорства.

Възнамеряваме в близко бъдеще да допълним нашето задание с нов прозорец, свързан със стандарта за архиви ISAAR(CPF) (International Standard Archival Authority Record for Corporate Bodies, Persons, and Families), както и с еквивалентния DTD, EAC (Encoded Archival Context).

Ще трябва да обсъдим задълбочено и въпроса за индексацията. Дори в заданието да бяхме предвидили зони за тази цел, не сме в състояние днес да ги използваме, тъй като ни липсва персонал, необходима компетентност и тезаурус. Единствено по-обширен проект, почиващ на солидна и трайна основа, ще ни позволи да приключим с успех тази работа.

Стои и въпросът за въвеждането в Интернет на самите документи или поне на дигитализираните им копия. Не става въпрос за пускане на всичко онлайн, а за подбиране на някои полезни и свързани помежду им комплекси. Първоначалният подбор на документи вече беше направен. Възнамеряваме да осъществим дигитализация на протоколите (ръкопис и печат) на Административния съвет (изпълнителна власт) и докладите на Градската администрация (печат). Публичната и Университетска библиотека предвижда дигитализация на дневниците на Градския съвет (печат, законодателна власт).

Нормализацията ще позволи също да доведем докрай реализацията на една истинска архивна информационна мрежа в регионален, национален, та дори и в международен мащаб, следвайки модела на Канада например или друг модел, чието определяне предстои. В тази област се отварят нови перспективи.

Извод

Ако трябва да направим препоръки към онези, които биха желали да се заемат с подобна операция, какви ще са те?

Първо, следва от самото начало на процеса добре да се набележат целите и в хода на разработката на проекта да се запази прагматизмът, без да се забравя, че най-доброто често е враг на доброто! Търсенето на перфекционизъм може да стане трудно преодолима пречка.

В този смисъл струва ни се за предпочитане да се ограничим в кодирането на ISAD(G) във формат EAD, отколкото да прибягваме до всички възможности, предложени от EAD, дори да позволяват реализацията на много по-точни и богати описания. Прекомерното изобилие от информационни полета за попълване рискува да усложни ненужно осъществяването на нови инвентарни описи, да не говорим за създадените по-рано.

По последния въпрос следва да преценим зависимостта на конвертирането на старите инвентари от работата, която то би изисквало. В този смисъл случаят с Градския архив на Женева е особено показателен, тъй като архивът е парадоксално привилегирован от скорошното му създаване и от това, че не съхранява особено голям брой фондове. Други архивни институции, с по-стари и по-многобройни фондове, ще имат интерес да се концентрират върху реализацията на нови инвентари от момента, оставяйки въпроса за «подхващане» на по-старите за по-добри дни.

Когато е взето решение за цялостно или частично конвертиране на старите инвентари, важно е те да бъдат хармонизирани максимално с цел да се позволи автоматизирането на тази операция. По-удобно е сред архивистите да се намерят хора, способни да работят по усъвършенстването на старите инвентари с оглед автоматизирането им, отколкото такива, които могат да кодират «ръчно» инвентарите в EAD.

Накрая, разработката трябва да излезе извън рамките на простата реализация на описателен справочник, за да обхване по-широко поле. С развитието на новите технологии създаването на подхода може се впише в поредица от проекти, което трябва да води архивистите от традиционното описание към по-съвършени справочници.

Бележки

1. Представяме на вашето внимание лекцията на г-н Дидие Гранж от Градския архив на Женева, Швейцария, изнесена в рамките на есенния международен стаж по архивистика в Париж по програмата COURANTS’2004, която предизвика особен интерес сред аудиторията. В нея е представен опитът на архива при публикуването на инвентарните описи в интернет чрез прилагането на стандартите ISAD(G) и XML/EAD. Работата по проекта е продължила 13 месеца. В него са участвали 6 души с различна заетост. Бюджет: 48 800 швейцарски франка или 8000–10 000 евро. В резултат, от 2003 г. всички инвентарни описи на архива са достъпни в интернет. Публикуваме изложението с оглед предстоящото автоматизиране на научно-справочния апарат в архивите у нас.