[HOME]
ОУНБ Кіровоград
DC.Metadata

[ HOME ]
Фон Проект МЕТАДАТА


Фон

Російська

Технологічна модель побудови
інформаційного порталу бібліотеки.

Олег Волохін,
головний інженер з автоматизації Кіровоградскької ОУНБ.

Кінець дев'яностих років ХХ сторіччя можна назвати ерою вступу українських бібліотек у всесвітню павутину WWW. Як гриби після дощу в українському сегменті Інтернет почали з'являтися сайти університетських, обласних і міських бібліотек. Виникає закономірне питання про роль і призначення цих сайтів у всесвітній мережі, що розвивається стихійно. Крім того в українському і російському Інтернеті з'явилася достатня кількість так званих “сайтів-бібліотек” від організацій, співтовариств і просто ентузіастів, що насправді (поза мережею Інтернет) бібліотеками не є взагалі. Чи досить для сучасної бібліотеки опублікувати пару десятків html-сторінок з тематикою “як нас знайти”, “перелік платних послуг” та “новини бібліотеки”? Що ж може стати відмітною рисою сайта професійної бібліотеки в Інтернет? І як взагалі бібліотеці оперувати з цією мережею? Як бачите, питань більше, ніж відповідей. І на великий жаль доводиться констатувати, що українська бібліотечна наука не буяє дисертаціями, чи дослідженнями практичними розробками на ці теми. Тим більше, останнім часом у середовищі українських бібліотек піднімається питання про створення інформаційних порталів. Що повиннео стати теоретичною, технологічною основою такого порталу? На яких стандартах або форматах він повинен базуватися і розвиватися? Виходячи з вище сказаного дозволю собі запропонувати результати досліджень і окремих розробок у Кіровоградській ОУНБ ім. Д.Чижевського.
Варто сказати, що після створення веб сайта бібліотеки в січні 1999 року ми і не згадували про створення порталу. Головним питанням для відділу автоматизації було визначити поле діяльності для наукової бібліотеки в мережі Інтернет, вивчити сфери застосування, технології і стандарти.

Структура мережі Інтернет
.

Це величезне скупчення цифрових ресурсів розподілене практично по всій земній кулі. Споконвічно в цій мережі не існує структури, яка б упорядковувала ці ресурси. Не випадково оптимісти від Інтернет називають її найбільшою коморою знань та інформації, а песимісти — “великою сміттєвою купою”. У переважній більшості основу цих ресурсів складають гіпертекстові файли, які включають текст, графіку, звук, відео. Оцінити кількісно мережу Інтернет можна тільки приблизно. Це динамічна система, що змінює свої параметри щохвилини.
За даними Консорціуму Програмного Забезпечення Інтернет1 (ISC) кількість серверів мережі, на яких розміщена інформація складає більш ніж 72 млн. на лютий 2000 року. А обсяг матеріалів, опублікованих в Інтернет підрахувати взагалі не представляється можливим. Якщо узяти до уваги тільки текстову інформацію (крім картинок, звука та відео) і припустити, що одна друкована літера, цифра або розділовий знак, говорячи комп'ютерною мовою, це 1 байт, то вся 20-мільйонна колекція книг найбільшої бібліотеки світу — бібліотеки Конгресу США складає 20 Терабайт (1 Терабайт = 1 мільйон Мегабайт = 1 трильйон Байт). За даними організації Інтернет Архів2 її архів ресурсів Інтернет, зібраний за період 1996-2001р. складає 10 мільярдів веб сторінок обсягом більш 100 Терабайт. Цей архів — усього лише маленька частка простору Інтернет, що збільшує свої розміри з кожною секундою. Фахівці затверджують, що поки Ви дочитаєте цю статтю, у мережі Інтернет з'являться не менш 1000 нових комп'ютерів.
Для того, що б хоч якось керуватися з таким обсягом неструктурованої інформації в мережі Інтернет існують пошукові сервери. За принципом індексування їх можна розділити на дві групи:
1.З індексуванням автоматичним (машинним).
2.З інтелектуальним індексуванням (за участю людини).

Першу групу серверів називають "пошуковими машинами" чи “індексуючими роботами”. Такі роботи самостійно борознять простори Інтернет, ідучи по посиланнях, переходять від сторінки до сторінки і заносять їх у свою базу даних (БД) з наступним індексуванням по повному тексту цифрового ресурсу. До них відносяться всесвітньо відомі Google, Alta Vista, HotBot та інші. Наймогутнішими пошуковими машинами на просторах СНД є Рамблер, Апорт, Яндекс, харківський сервер МЕТА.
Другу групу серверів називають “порталами”, “каталогами” чи ”директоріями”. Тут обробку цифрового ресурсу здійснює людина, каталогізатор вносить дані в БД порталу та індексує їх відповідно до різних рубрикаторів фбо тезаурусів, тобто виконує інтелектуальну обробку матеріалу. Найбільш відомими представниками другої групи є каталог Yahoo. Приблизно за цим принципом побудовані багато платних онлайнових БД, які вносять у свої каталоги не тільки дані про ресурси Інтернет, але й матеріали газет, журналів, інформаційних агентств, прес-релізи компаній та інше. Такі БД становлять вже гібриди каталогів і повнотекстових матеріалів. До їхнього числа можна віднести БД Dialog, Lexis-Nexis, Proquest Direct, EBSCO та інші.
Здавалася б проблема індексації інформації ресурсів Інтернет вирішено тільки пошуковими машинами, адже пошуковий робот такої машини заносить повний текст сторінки у свою БД і досить, того щоб робот потрапив хоча б на одну сторінку сайта. Далі ідучи по посиланнях цієї сторінки він перейде до наступної і наступної, і в такий спосіб поступово проіндексує увесь сайт. На жаль цього не відбувається. Приведу приклад, сайт Кіровоградської ОУНБ протягом трьох років постійно індексується різними пошуковими машинами (не рідше 1 разу на місяць). Здавалося б 3 років досить для пошукових роботів, щоб занести у свою БД усі сторінки нашого сайта. Однак перевірка найбільш популярних пошукових машин показала наступне:

Пошукова машина
Кількість html-сторінок
Кіровоградської ОУНБ в БД
Google (США)
680
Rambler (Россія)
428
Aport (Росія)
1025
Yandex (Росія)
1570
МЕТА (Україна)
1252

Звідси можна зробити висновок, що пошукові машини не вирішують проблему повної індексації всіх ресурсів інтернет, хоча їхні БД, у порівнянні з каталогами (порталами) ) мають значно більший обсяг даних і поповнюються значно швидше, через автоматичну роботу (без участі людини). Саме тому як альтернативний спосіб індексації ресурсів мережі стали виникати Інтернет портали (каталоги, директорії). Найчастіше портали будуються за якимось тематичним принципом. Відомі наприклад, портали фінансові, ЗМІ, регіональні, законодавчі, літературні і т.д. Їх ще називають вертикальними порталами. Крім того існують портали горизонтальні, тобто ті що покривають декілька тематик. Своїм призначенням портали портали доповнюють у певних галузях “пустоти”, а якщо хочете недосконалість пошукових машин, більш докладно висвітлюючи конкретні тематичні галузі інтелектуальним (обробленим людиною) індексуванням ресурсів. Саме портали (каталоги) стануть предметом цієї статті.


До питання про метадані
.

У буквальному значенні МЕТАДАНІ можна розшифрувати як “дані про дані”. Позначка... (від греч. meta — між, після, через), частина складних слів, що позначає проміжність, проходження за чим-небудь, перехід до чого-небудь іншого, зміну стану, перетворення.3
По суті, поняття МЕТАДАНІ, придумане інформаційними фахівцями від комп'ютерних технологій, не є новим за значенням для бібліотечного, музейного чи архівного фахівця. Бібліографічна картка є не що інше, як набір МЕТАДАНИХ на книгу чи статтю з журналу, яка побудована за правилами бібліографічного опису. З початку метадані виникли як допоміжна структура для автоматичної індексації цифрових ресурсів.
Іншими словами в код html-сторінки, в області заголовків (між тегами html <HEAD> і </HEAD>) вносяться в певному порядку дані, що описують певні параметри. Будь-яка інформація, внесена в цю область html-документа не відображається браузером (комп'ютерною програмою, призначеною для показу html-файлів) на екрані комп'ютера і користувач може навіть і не підозрювати, що документ, який він переглядає, несе в собі ще якусь додаткову інформацію, однак програмні роботи, та й сам браузер обробляють ці корисні дані для вирішення певних задач. Подальший розвиток мережі призвів до створення інших наборів МЕТАДАНИХ, призначених не тільки для оперування ними роботами, але й для вирішення більш широкого кола завдань. Зараз таких наборів МЕТАДАНИХ існують десятки. Це можуть бути вузько специфічні набори, призначені для опису ресурсів якоїсь певної галузі чи тематики, маються також і метадані більш загального, універсального характеру. Набір метаданных VRA4, Асоціації Візуальних ресурсів, призначений для опису цифрових ресурсів, що вміщують графічні зображення; GILS5 можна перевести як Глобальний Інформаційний Покажчик-Сервіс, призначений для спрощення пошуку і доступу до ресурсів, які публікуються у мережі Інтернет державними йта індустріальними компаніями США; ініціатива університету Берклі EAD6, Кодування Архівних Описів, покликана забезпечити методи опису, збереження і доступу до цифрових ресурсів бібліотек, музеїв та архівів на основі мови SGML. Існує і багато інших стандартів. Вичерпну інформацію про них можна одержати (англійською мовою) на сайті ІФЛА за адресою: http://www.ifla.org/II/metadata.htm
Нашу увагу привернула Ініціатива Дублінського Ядра Метаданих7 (Dublin Core Metadata Initiative). Стандарт метаданих Dublin Core, (вимовляється “даблін кор”) чи DC (“дісі”) є форматом опису практично будь-яких ресурсів Інтернет — не складний за структурою, відносно легкий у застосуванні, інтернаціональний, тобто застосовується в усьому світі.
Наприкінці 1999р. було прийняте рішення використовувати Dublin Core для власних цифрових ресурсів, що публікуються на сайті Кіровоградської ОУНБ. Починаючи з 2000 р. було введене правило — забезпечувати описом Dublin Core практично кожну html-сторінку, що з'являлася на нашому сайті. Зараз, у першій половині 2002 р. можна констатувати, що сайт Кіровоградської ОУНБ є найбільшим в українському сегменті Інтернет, де використовуються метадані Дублінського Ядра (близько 900 html-сторінок). Виникає питання, чи правильним був вибір, серед безлічі різноманітних стандартів метаданих? Думаю, що час — це найкращий арбітр у даному питанні. Однак вже сьогодні можна констатувати наступне: у вересні 2001р. набір метаданих Dublin Core був затверджений у США, Американським Інститутом Національних Стандартів як стандарт Z39.85. . В Австралії, Канаді, Данії, Фінляндії, Ірландії і Великобританії в цьому ж році формат Dublin Core рекомендований і прийнятий як державний стандарт для онлайн ресурсів та е-комерції8.
Формат Dublin Core версії 1.1 містить у собі 15 елементів для опису цифрового ресурсу:

· Назва — Title,
· Створювач (Автор) — Creator,
· Тема (Предметна рубрика) — Subject,
· Опис (Анотація) — Description,
· Видавець — Publisher,
· Співавтор — Contributor,
· Дата — Date,
· Формат — Format,
· Тип — Type,
· Ідентифікатор — Identifier,
· Джерело — Source,
· Мова — Language,
· Відношення — Relation,
· Охоплення (Покриття) — Coverage,
· Авторські права — Rights.

За правилами Dublin Core кожний з 15-ти елементів не є обов'язковим і може повторяться. У самому загальному випадку для внесення будь-якого елемента досить пари — ІМ'Я і ЗНАЧЕННЯ (Content): <meta name="DC.ІМ'Я" content="ЗНАЧЕННЯ">
Розглянемо реальний приклад для елемента СТВОРЮВАЧ (АВТОР) закодований у мові HTML версії 4.0:
<meta name="DC.Creator" content=”Енгельс, Фрідріх">
Для більш детального опису деяких елементів застосовуються піделементи, які називаються кваліфікаторами. До кваліфікаторів відносяться додаткові підтипи основного елемента і схеми. Наприклад, можна уточнити тип автора (колективний чи індивідуальний) за допомогою кваліфікатора:
<meta name="DC.Creator.PersonalName" content="Маркс, Карл">
За допомогою кваліфікатора СХЕМА (Scheme) можна пояснити з якого контрольованого словника узяте значення елемента:
<meta name="DC.Subject" scheme="ББК" content="Другие разделы спектроскопии">
<meta name="DC.Subject" scheme="ББК" content="В344.9">

Застосування кваліфікаторів бажано, але не є обов'язковим. Усе залежить від того наскільки детально ви бажаєте скласти опис цифрового ресурсу. Порядок слідування елементів не має значення. Повний опис щодо використання формату Dublin Core не входить у завдання даної статті. Українською мовою з форматом Dublin Core можна ознайомитися на сайті бібліотеки ім.Л.Українки9, , або російською мовою — на сайті Російської Державної бібліотеки10, До речі на цьому ж сайті можна скористатися онлайновим редактором метаданих Dublin Core, який створено фахівцями цієї бібліотеки. Розширений посібник з використання стандарту на нашому сайті поки ще тільки готується. Я наведу як приклад опис однієї з html-сторінок сервера Національної парламентської бібліотеки :

Приклад 1.
<META NAME="DC.Title" CONTENT="ВСЕУКРАЇНСЬКА НАУКОВО-ПРАКТИЧНА КОНФЕРЕНЦІЯ ДИРЕКТОРІВ ДЕРЖАВНИХ ТА ОБЛАСНИХ УНІВЕРСАЛЬНИХ НАУКОВИХ БІБЛІОТЕК 'РЕСУРСИ І ПОСЛУГИ СУЧАСНОЇ БІБЛІОТЕКИ'. м.Миколаїв, 13-16 листопада 2001р.">
<META NAME="DC.Title.alternative" CONTENT="СТРАТЕГІЯ РОЗВИТКУ УКРАЇНСЬКИХ БІБЛІОТЕК (Огляд матеріалів конференції)">
<META NAME="DC.Subject.ConferenceName" CONTENT="ВСЕУКРАЇНСЬКА НАУКОВО-ПРАКТИЧНА КОНФЕРЕНЦІЯ">
<META NAME="DC.Subject" CONTENT="ОУНБ України--Ресурси та послуги">
<META NAME="DC.Subject" CONTENT="ОУНБ України--Проблеми інформатизації">
<META NAME="DC.Description" CONTENT="13-16 листопада 2001 р. у м. Миколаєві відбулася Всеукраїнська науково-практична конференція директорів державних та обласних універсальних наукових бібліотек 'Ресурси і послуги сучасної бібліотеки', організована Міністерством культури і мистецтв України спільно з управлінням культури Миколаївської облдержадміністрації. Матеріали конференції опубликовані на сайті НПБ Украини.">
<META NAME="DC.Description.TableOfContents" CONTENT="СТРАТЕГІЯ РОЗВИТКУ УКРАЇНСЬКИХ БІБЛІОТЕК (Огляд матеріалів конференції)--Доповідь начальника відділу бібліотек та інформаційних систем МКіМ України Т. Прокошевої--Рекомендації Всеукраїнської науково-практичної конференції директорів державних та обласних універсальних наукових бібліотек 'Ресурси і послуги сучасної бібліотеки'">
<META NAME="DC.Publisher.CorporateName" CONTENT="Національна парламентська бібліотека України">
<META NAME="DC.Contributor.PersonalName" CONTENT="Ніколенко, Г.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Кононенко, Л.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Лоскутников, В.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Прокошева, Т.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Корнієнко, А.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Богза, Н.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Визір, О.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Моісеєва, Н.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Венгереш, М.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Гич, Г.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Архипська, Л.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Пашкова, В.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Вітенко, В.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Пивоваров, В.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Новакова, Л.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Риб'янцева, І.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Тітова, Н.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Коротун, Н.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Ботушанська, О.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Незнамова, Л.">
<META NAME="DC.Date.created" CONTENT="2001-12-14">
<META NAME="DC.Format" CONTENT="text/html; charset=windows-1251">
<META NAME="DC.Format" CONTENT="36949 bytes">
<META NAME="DC.Type" CONTENT="Text">
<META NAME="DC.Type" CONTENT="Text.Proceedings">
<META NAME="DC.Type" CONTENT="Text.Thesis">
<META NAME="DC.Identifier" CONTENT="http://www.nplu.kiev.ua/uk/main/conf.htm">
<META NAME="DC.Language" SCHEME="ISO 639-2" CONTENT="ukr">
<META NAME="DC.Coverage.PlaceName" SCHEME="DCMI Point" CONTENT="м.Миколаїв, Україна">
<META NAME="DC.Coverage.temporal" CONTENT="13-16 листопада 2001 року">
<META NAME="DC.Rights" CONTENT="Національна парламентська бібліотека України, 2001">


Практичне використання Dublin Core у бібліотеці
.

Для більш легкого розуміння звичайним бібліотекарем питань використання метаданих Dublin Core, думаю, буде доречним провести ряд паралелей і допусків. Давайте подивимося на опис ресурсів Інтернет, як на традиційну бібліотечну роботу із складання каталогу:
1. Опис з використанням Dublin Core ресурсів Інтернет є ні що інше як бібліографічний опис книги чи аналітичної статті журналу (газети).
2. Через те що правила бібліографічного опису (ГОСТ-7.1.84) не мають у своєму розпорядженні дані про цифрові ресурси, будемо вважати, що правила Dublin Core і є наш звід правил про опис цих ресурсів (до речі, з обліком останнього світового досвіду). Тобто Dublin Core — це “ГОСТ-7.1.84” для Інтернет.
3. Традиційний каталог передбачає збереження бібліографічної картки окремо від першоджерела (для паперового каталогу — картка в каталожній шухляді, для електронного — запис у бібліографічній БД). Ми будемо дотримувати всього того, що стосується електронного каталогу. Але додатково врахуємо, що користувач мережі Інтернет не знаходиться в стінах нашої бібліотеки, і не зможе одержати доступ до карткового каталогу. Тому створюючи опис Dublin Core для html-сторінок власного сервера ми поміщаємо цей опис в код HTML безпосередньо в тіло документа що публікується. Іншими словами: ми публікуємо в мережі Інтернет електронний документ і одночасно “зашиваємо” каталожну картку в тіло першоджерела.
Тепер виникає закономірне питання: як зробити доступним для користувача мережі перегляд такої електронної картки, а для каталогізатора роботу з нею? Адже не кожен користувач знає як відшукати і виділити в коді html-сторінки цю корисну інформацію. Зізнаюся, в очах моїх колег по відділу, які створювали описи в стандарті Dublin Core протягом останніх 2 років я бачив німий докір — навіщо вносити метадані Dublin Core у html-сторінки якщо від них немає ніякої практичної користі? Дійсно, ці дані ніяк не відображаються в екрані браузера і користувач, що переглядає сторінку навіть і не підозрює про те, що ця сторінка має в собі вторинні дані, які дозволяють одержати короткий опис про неї. Крім того на сьогоднішній день жодна відома пошукова машина Інтернет не використовує Dublin Core для індексації ресурсу, вона їх просто ігнорує. Логічним буде припустити, що для реального використання Dublin Core необхідні якісь додаткові онлайнові програми-утиліти, що дозволяють вирішити цю проблему. Про такі програми, створені у нашій бібліотеці піде мова далі.


Утиліта “Переглядач-Конвертор метаданих Dublin Core”.
.

З осені 2001 р. на html-сторінках нашого бібліотечного сайту почали з'являтися лінки з ім'ям DC.Metadata розташовані для легкого виявлення у видному місці, як правило у верхньому-лівому кутку сторінки. При натисканні курсором на такий лінк відпрацює програма, написана мовою Perl, сформує і покаже html-сторінку з метаданими Dublin Core у зручному для читання людиною вигляді. Іншими словами, програма вибере з html-коду сторінки корисні описові дані і покаже вам фактично електронну каталожну картку про документ Інтернет, який ви збираєтеся читати. Погодьтеся, якщо ви збираєтеся переглядати ресурс розміром у кілька друкованих сторінок, а може й десятків сторінок — такі описові дані навряд чи будуть зайвими. До речі, якщо ви використовуєте Dublin Core на своєму сайті, то можете використовувати переваги онлайнових технологій. Для цього досить у коді ваших html-сторінок розмістити наступний рядок коду:
<a href="http://www.library.kr.ua/cgi-bin/dcview.cgi">DC.Metadata</a>
Цього буде досить для того, щоб на сторінці вашого сервера з'явився лінк DC.Metadata, і користувачі вашого сервера зможуть переглядати описові дані Dublin Core вашої сторінки.
Наступна програма є продовженням попередньої, але з розширеними функціями (http://www.library.kr.ua/dc/lookatdc.html). Її призначення — можливість тестувати будь-які сторінки мережі Інтернет на предмет наявності метаданих Dublin Core. Це пошукова форма, яка має інтерфейс на трьох мовах (український, російський та англійський). Крім того ви можете отримувати вторинну інформацію про сторінки навіть у тому випадку, якщо вони не мають метаданих Dublin Core. Програма просто згенерує максимально можливу кількість даних з інших, супутніх параметрів сторінки та відповідей сервера, а далі перекодує їх на льоту у формат Dublin Core.
Побічно програма дозволяє судити взагалі про яку-небудь присутність метаданих на сторінці, тому що використовує у своїй роботі стандартні html-метадані, призначені для обробки сторінки традиційними пошуковими машинами Інтернет. Я провів невелике тестування веб ресурсів деяких бібліотек України і ведучих бібліотек Росії на предмет наявності хоч яких-небудь метаданих. Результати виявилися жалюгідними. Можна затверджувати, що практично бібліотеки не приділяють цьому питанню належної уваги. Мені часто приходилося чути від бібліотекарів скарги на погано оформлені видання в контексті вихідних даних про книги чи наприклад CD ROM, що оформлені з видавничої точки зору зовсім безграмотно. Особливо важко приходиться з такими виданнями відділам обробки. Дуже важко або не можливо витягти вихідні дані та інші параметри при внесенні опису такого документа в бібліотечний каталог. Однак давайте глянемо під цим кутом на веб сайти українських бібліотек. Створюючи чергову html-сторінку бібліотека, у даному випадку виступає видавцем цифрового документа в мережі Інтернет. І що ж виходить? Ця ж бібліотека “штампує” для мережі Інтернет документи без роду й імені??? Чи це не приклад видавничої діяльності в новому середовищі організацією, яка знає як професійно працювати з інформацією? Питання залишається відкритим...


Утиліта “Редактор-Конвертор метаданих Dublin Core” (версія 1.1).

Цю програму можна відшукати за адресою:
http://www.library.kr.ua/dc/dcedituni.html. . Її можна використовувати в двох напрямках:
1.Як повнофункційний редактор метаданих Dublin Core для створення, редагування і наступного внесення створеного коду в реальну html-сторінку (у форматі HTML 4.0).
2.Як конвертор з формату метаданих Dublin Core у бібліографічний формат обміну даними UNIMARC (UKRMARC) з наступним збереженням цих даних у файлі ISO-2709.
Крім того за допомогою програми представляється можливим побудувати технологію створення та розвитку ІНФОРМАЦІЙНОГО ПОРТАЛУ бібліотеки в мережі Інтернет максимально наблизивши таку роботу до традиційних бібліотечних функцій — створення бібліотечного каталогу (вторинної інформації про ресурси). У такий спосіб бібліотека фактично буде працювати в звичайному середовищі стосовно до порівняно нових ресурсів, розташованим у мережі Інтернет. Використання РЕДАКТОРА-КОНВЕРТОРА можна представити на наступній блок-схемі:

Використання РЕДАКТОРА-КОНВЕРТОРА як редактора Dublin Core.

Такий етап роботи з РЕДАКТОРОМ-КОНВЕРТОРОМ версії 1.1 (РКv1.1) можна вважати проміжним. Він призначений для створення і редагування метаданих DC вже існуючих html-сторінок. У випадку, якщо html-сторінка ще не має метаданных DC - Ркv1.1 згенерує їх, використовуючи побіжні метадані та відповіді сервера. Інтерфейс РКv1.1 у стадії редагування складається з двох зон: вікна метаданих, закодованих за правилами мови HTML 4.0 (виділений блакитним кольором тексту) і власне редактора, з полями для введення даних (нижній екран). Там де це можливо, у відповідностями правил стандарту DC редактор пропонує варіанти заповнення полів конкретного елемента через систему меню. Є коротка система допомоги щодо кожного елемента DC, з рекомендаціями щодо використання та декілька практичних прикладів. Така допомога з'являється в окремому вікні браузера. Щоб виключити проблеми з відображенням кодувань — редактор автоматично перекодовує відповіді сервера з кодової сторінки KOI-8R у кодову сторінку Windows-1251. Є можливість додавання рядків для кожного елемента DC відповідною кнопкою: “+ ІМ'Я_ЕЛЕМЕНТА”, якщо всі поля даного елемента вже заповнені. Після внесення даних (чи їхньої корекції) у якому-небудь полі, необхідно скористатися кнопкою “DC-Змінити” для обліку проведених змін. Після цього редактор відобразить у верхньому екрані ваші зміни в коді HTML (блакитним кольором). Якщо ви вважаєте редагування метаданих закінченим — досить виділити мишкою код, означений блакитним кольором, скопіювати його в буфер обміну (Ctrl+C) і за допомогою будь-якого текстового редактора вставити дані в реальну html-сторінку між тегами <HEAD> та </HEAD>.

Використання РЕДАКТОРА-КОНВЕРТОРА
як конвертор Dublin Core - UNIMARC.

Цей етап використовується в тому випадку, коли вам необхідно зберегти метадані про html-сторінку в бібліографічній БД у форматі UNIMARC (UKRMARC). Виконавши роботи, описані в першому етапі (створення або редагування метаданих DC) необхідно скористуватися кнопкою редактора “UNIMARC”. Програма виконає конвертування і покаже вам новий екран у форматі UNIMARC.

Приклад 2.
001 http://www.nplu.kiev.ua/uk/main/conf.htm
035 ##$ahttp://www.nplu.kiev.ua/uk/main/conf.htm
100 ##$a20020312j2001####|||u0ukry0102####ca
101 0#$aukr
200 1#$aВСЕУКРАЇНСЬКА НАУКОВО-ПРАКТИЧНА КОНФЕРЕНЦІЯ ДИРЕКТОРІВ ДЕРЖАВНИХ ТА ОБЛАСНИХ УНІВЕРСАЛЬНИХ НАУКОВИХ БІБЛІОТЕК 'РЕСУРСИ І ПОСЛУГИ СУЧАСНОЇ БІБЛІОТЕКИ'. м.Миколаїв, 13-16 листопада 2001р.
210 ##$cНаціональна парламентська бібліотека України$d2001
230 ##$atext/html, text/html; charset=windows-1251, 36949 bytes
300 ##$aМісцевість: м.Миколаїв, Україна
300 ##$aКоординати часові: 13-16 листопада 2001 року
330 ##$a13-16 листопада 2001 р. у м. Миколаєві відбулася Всеукраїнська науково-практична конференція директорів державних та обласних універсальних наукових бібліотек 'Ресурси і послуги сучасної бібліотеки', організована Міністерством культури і мистецтв України спільно з управлінням культури Миколаївської облдержадміністрації. Матеріали конференції опубликовані на сайті НПБ Украини.
330 ##$aСТРАТЕГІЯ РОЗВИТКУ УКРАЇНСЬКИХ БІБЛІОТЕК (Огляд матеріалів конференції)--Доповідь начальника відділу бібліотек та інформаційних систем МКіМ України Т. Прокошевої--Рекомендації Всеукраїнської науково-практичної конференції директорів державних та обласних універсальних наукових бібліотек 'Ресурси і послуги сучасної бібліотеки'
333 ##$aНаціональна парламентська бібліотека України, 2001
336 ##$atext/html, text/html; charset=windows-1251
336 ##$a36949 bytes
517 1#$aСТРАТЕГІЯ РОЗВИТКУ УКРАЇНСЬКИХ БІБЛІОТЕК (Огляд матеріалів конференції)
608 ##$aТекст$2Dublin Core
608 ##$aТекст-Праці$2Dublin Core
608 ##$aТекст-Тезіс$2Dublin Core
686 ##$aВСЕУКРАЇНСЬКА НАУКОВО-ПРАКТИЧНА КОНФЕРЕНЦІЯ
686 ##$aОУНБ України--Ресурси та послуги
686 ##$aОУНБ України--Проблеми інформатизації
702 #0$aНіколенко, Г.
702 #0$aКононенко, Л.
702 #0$aЛоскутников, В.
702 #0$aПрокошева, Т.
702 #0$aКорнієнко, А.
702 #0$aБогза, Н.
702 #0$aВизір, О.
702 #0$aМоісеєва, Н.
702 #0$aВенгереш, М.
702 #0$aГич, Г.
702 #0$aАрхипська, Л.
702 #0$aПашкова, В.
702 #0$aВітенко, В.
702 #0$aПивоваров, В.
702 #0$aНовакова, Л.
702 #0$aРиб'янцева, І.
702 #0$aТітова, Н.
702 #0$aКоротун, Н.
702 #0$aБотушанська, О.
702 #0$aНезнамова, Л.
856 4#$uhttp://www.nplu.kiev.ua/uk/main/conf.htm

Примітка: Приклад №2 є результатом роботи програми, з використанням даних прикладу №1. Для прикладів використовувалася реальна html-сторінка (http://www.nplu.kiev.ua/uk/main/conf.htm) сервера Національної парламентської бібліотеки з матеріалами про всеукраїнську науково-практичну конференцію директорів бібліотек, що проходила в м.Миколаєві, у 2001 році . В реальності ж таких метаданих не існує і створені вони для демонстрації роботи програми.

У тому випадку якщо вас щось не влаштовує в даних то використовуючи кнопку браузера “Назад” можна повернутися в редактор і зробити відповідні корегування. Якщо усе в порядку, то використовуючи кнопку “ISO-2709” ви можете зберегти запис для вашої БД у файлі формату ISO-2709 на локальному диску свого комп'ютера. На запит браузера вам необхідно вибрати опцію “Зберегти файл”, вибрати папку на вашому комп'ютері для збереження файлу, присвоїти йому ім'я з розширенням “ISO” (ІМ'Я.ISO). Після цього ви можете імпортувати даний файл у вашу професійну бібліотечну систему.


Теоретичні питання конверсії з Dublin Core у UNIMARC
.

Основна проблема конверсії полягає в тому, що формат Dublin Core є більш простим форматом у порівнянні з UNIMARC. Для формату UNIMARC, як професійного формату передачі даних, який враховує правила бібліографічного опису, обов'язкова більш строга деталізація окремих елементів опису. Для наочності приведу таблицю мапування (таблицю відповідностей між елементами двох форматів) що використовує програма.
Примітка: деякі деталі виключені для поліпшення читаності.
Dublin Core
UNIMARC
Title
(Назва)
200 $a Основна назва
200 $e Відомості, що відносяться до назви
517 $a Варіант назви
Creator
(Створювач, Автор)
700 $a Ім'я особи — первинна інтелектуальна відповідальність
701 $a Ім'я особи — альтернативна інтелектуальна відповідальність
710 $a Найменування організації - первинна інтелектуальна відповідальність
711 $a Найменування організації - альтернативна інтелектуальна відповідальність
200 $f Перші відомості про відповідальність
Subject
(Предмет.
Ключові слова)
610 $a Неконтрольовані предметні терміни
606 Найменування теми як предмет
675 Універсальна десяткова класифікація (UDC/УДК)
676 Десяткова класифікація Дьюі (DDC/ДДК)
680 Класифікація Бібліотеки Конгресу (LCC/КБК)
686 Індекси інших класифікацій
Description
(Опис)
330 $a Резюме або реферат
Publisher
(Видавець)
210 $c Ім'я видавця, розповсюджувача і т.д.
Contributor
(Співавтор)
701 $a Ім'я особи — альтернативна інтелектуальна відповідальність
711 $a Найменування організації - альтернативна інтелектуальна відповідальність
200 $g Наступні відомості про відповідальність
Date
(Дата)
210 $d Дата видання, поширення і т.д.
Type
(Тип)
608 Форма, жанр, фізичні характеристики документа як точка доступу
Format
(Формат)
230 $a Специфічна область матеріалу: характеристика електронного ресурсу
336 $a Тип комп'ютерного файлу
Identifier
(Ідентифікатор)
001 (обов'язкове для UNIMARC)
010 (ISBN)
011 (ISSN)
020 (Номер документа в національній бібліографії)
035 Інші системні номери
856 $u (URL)
Source
(Джерело)
324 Оригінальна версія примітки
Language
(Мова)
101 Мова документа

Reletion
(Відношення)
300 Загальні примітки
Covarage
(Охоплення. Покриття.)
300 Загальні примітки
Rights
(Авторські права)
333 Примітки про особливості поширення і використання

Для формату UNIMARC (UKRMARC, RUSMARC) ряд полів є обов'язковим, без наявності яких запис не буде повноцінним. Наведу таблицю цих обов'язкових полів та відповідні їм поля формату Dublin Core:
UNIMARC
Dublin Core
001 - Ідентифікатор запису Identificator (Ідентифікатор)
100 - Дані загальної обробки Date (Дата), Language (Мова)
101 - Мова документа Language (Мова)
200 - Заголовок і відомості про відповідальність Title (Заголовок), Creator (Створювач, Автор), Contributor (Співавтор)

Однак, згідно правил Dublin Core кожний з 15-ти елементів не є обов'язковим. Іншими словами опис ресурсу у форматі Dublin Core, де відсутні вище перераховані елементи буде цілком коректним. Тому у випадку відсутності в описі тестуємого ресурсу елементів Identificator (Ідентифікатор) і Date (Дата), РКv1.1 створить їх самостійно на основі відповідей сервера. При відсутності елементів Title (Заголовок) та Language (Мова) — РКv1.1 не буде конвертувати опис у формат UNIMARC доти, поки каталогізатор не внесе назву до елементу Title та код мови (або мов) вручну. Цілком можливий варіант, коли в описі відсутні елементи Автор та/або Співавтор, конвертування в цьому випадку буде виконано, але при наявності даних у цих полях РКv1.1 обов'язково запросить указати вручну тип автора (колективний чи персональний).

Про технологію побудови бібліотечного інформаційного порталу
.

Зробимо імпорт запису про ресурс Інтернет з файлу ISO-2709 у бібліографічну БД “Ресурси Інтернет”. Тест проводився за допомогою системи ІРБІС версії 2002 року. Тепер запис на ресурс у БД може виглядати в декількох представленнях — інформаційному виді, у виді бібліографічної картки і т.д.

Приклад 3.
В85
ВСЕУКРАЇНСЬКА НАУКОВО-ПРАКТИЧНА КОНФЕРЕНЦІЯ ДИРЕКТОРІВ ДЕРЖАВНИХ ТА ОБЛАСНИХ УНІВЕРСАЛЬНИХ НАУКОВИХ БІБЛІОТЕК 'РЕСУРСИ І ПОСЛУГИ СУЧАСНОЇ БІБЛІОТЕКИ'. м.Миколаїв, 13-16 листопада 2001р.. -Б.м., 2001. -Б.ц.
Місцевість: м.Миколаїв, Україна. Координати часові: 13-16 листопада 2001 року

Анотація: 13-16 листопада 2001 р. у м. Миколаєві відбулася Всеукраїнська науково-практична конференція директорів державних та обласних універсальних наукових бібліотек 'Ресурси і послуги сучасної бібліотеки', організована Міністерством культури і мистецтв України спільно з управлінням культури Миколаївської облдержадміністрації. Матеріали конференції опубликовані на сайті НПБ Украини.СТРАТЕГІЯ РОЗВИТКУ УКРАЇНСЬКИХ БІБЛІОТЕК (Огляд матеріалів конференції)--Доповідь начальника відділу бібліотек та інформаційних систем МКіМ України Т. Прокошевої--Рекомендації Всеукраїнської науково-практичної конференції директорів державних та обласних універсальних наукових бібліотек 'Ресурси і послуги сучасної бібліотеки'

ДОД.ТОЧКИ ДОСТУПУ:
Ніколенко, Г.
Кононенко, Л.
Лоскутников, В.
Прокошева, Т.
Корнієнко, А.
Богза, Н.
Визір, О.
Моісеєва, Н.
Венгереш, М.
Гич, Г.
Архипська, Л.
Пашкова, В.
Вітенко, В.
Пивоваров, В.
Новакова, Л.
Риб'янцева, І.
Тітова, Н.
Коротун, Н.
Ботушанська, О.
Незнамова, Л.
див. ПОСИЛАННЯ - INTERNET: http://www.nplu.kiev.ua/uk/main/conf.htm

Такий вигляд має запис у системі ІРБІС, у традиційному бібліотечному форматі.

Якщо бібліотека має свій модуль OPAC (модуль, що відображає внутрішній електронний каталог бібліотеки в мережі Інтернет) то не становить проблеми підключити до цього модуля нову БД, “Ресурси Інтернет”, у якій будуть накопичуватися записи, отримані в результаті конверсії з формату Dublin Core. Онлайновий інтерфейс може варіюватися. Інтерфейс можна побудувати наприклад, у вигляді каталогу Yahoo чи чогось подібного. Тепер пошук можливо здійснювати не тільки в традиційному для Інтернет порталу вигляді — за ключовими словами, але й за АВТОРОМ, НАЗВОЮ, ВИДАВЦЕМ, ДАТОЮ, ПРЕДМЕТНОЮ РУБРИКОЮ, МОВОЮ ТЕКСТУ, СПІВАВТОРАМИ, ФОРМОЮ та ЖАНРОМ, ФІЗИЧНИМИ ХАРАКТЕРИСТИКАМИ ДОКУМЕНТА. На цьому можна вважати закінченими підготовчі роботи зі створення інформаційного порталу Інтернет, надалі необхідний робота бібліографів-каталогізаторів щодо наповнення БД описами ресурсів. Крім того, вся інформація стане доступною користувачам електронного каталогу бібліотеки без мережі Інтернет.
Звичайно, можна і не конвертувати дані у формат UNIMARC, не заносити їх у бібліографічну БД, а зупинитися на проміжному етапі — зберігати дані у форматі Dublin Core і на їхній основі будувати портал бібліотеки в Інтернет. Однак на мій погляд це не зовсім логічно для бібліотеки. По-перше буде потрібно якесь додаткове середовище для збереження даних. По-друге необхідне створення механізму доступу, пошуку і добування даних з такої БД. І по-третє такий масив даних буде “відірваний” від інших інформаційних масивів бібліотеки.
І останнє питання. А чи варто бібліотеці створювати інформаційний портал? Ресурсів в Інтернет так багато, а бібліотекарів у вашій бібліотеці так мало. Ресурси мігрують у мережі: з'являються, зникають, змінюють місце прописки... Як за всім цим погнатися???
Перше, що необхідно пам'ятати — це призначення порталу. Цей вид пошукового сервісу в Інтернет не може охопити усе. Тому необхідно орієнтуватися на конкретну тему чи ряд тем, котрі може охопити ваш портал. Напевно насамперед він повинен бути літературним, ну і в другу чергу регіональним. Менш успішним буде проект, якщо ви спробуєте охопити усі галузі. Швидше за все з цього вийде “про все — практично ні про що” і для майбутнього користувача вашого порталу він буде мати відповідну ціну. В усі віки бібліотека спеціалізувалося (в інформаційному значенні) на створенні вторинної інформації про документи, тобто створенні каталогів. З цього звичайно ж не виходить, що бібліотека повинна відмовитися від видавничої діяльності. Навпаки, набагато простіше стало публікувати повнотекстові матеріали за допомогою мережі Інтернет.
Однак вже сьогодні можна констатувати той факт, що в публікаціях повних текстів книг у російськомовному й україномовному сегменті мережі Інтернет професійні бібліотеки безнадійно загубили свої позиції. За останні 5-6 років у мережі з'явилася величезна кількість повнотекстових бібліотек, створених ентузіастами від літератури. Кількість повнотекстових книг складає десятки тисяч!!! Хтось скаже не бібліотечна це справа займатися публікаціями в таких обсягах, і напевно буде прав. Можливо більш логічним буде публікація в Інтернет рідких книг із власних колекцій, не порушуючи при цьому закону про авторські права. Але не зайвим буде створення адресних каталогів бібліотек Мошкова, Євгенія Пескіна та подібних українських сайтів. Напевно зовсім не зайвим буде на вашому порталі рубрика ЛІТЕРАТУРА-ПОВНІ ТЕКСТИ, яка потім буде розширюватися за рахунок підрубрик наприклад, Тарас Шевченко, Ліна Костенко і т.д. Рубрики вашого порталу можна буде формувати на основі аналізу реальних запитів користувачів бібліотеки.
Доречним буде згадати, що 4 січня 2002 року Кабінет Міністрів України видав постанову "Про Порядок оприлюднення у мережі Інтернет інформації про діяльність органів виконавчої влади11." Один з пунктів цієї постанови говорить: “Міністерствам, іншим центральним органам виконавчої влади, Раді міністрів Автономної Республіки Крим, обласним, Київській та Севастопольській міським державним адміністраціям починаючи із січня 2002 р. забезпечити розміщення і постійне оновлення інформації на власних веб-сайтах у мережі Інтернет відповідно до Порядку, затвердженого цією постановою”. А це значить, що згодом з'явиться ще більша кількість сайтів, де будуть публікуватися розпорядження, постанови та інші повні тексти документів органів місцевого самоврядування. Опис цих документів може стати регіональною складової вашого бібліотечного порталу.
Підведу підсумок даної публікації. Запропонована технологія пропонує як базовий стандарт для взаємодії з мережею Інтернет використовувати формат метаданих Dublin Core, для вивчення якого буде потрібно певні зусилля з боку бібліотек, але в іншому ж така технологія та розроблене програмне забезпечення вписується в рамки традиційної бібліотечної роботи. Пропозиції і зауваження щодо роботи онлайнового РЕДАКТОРА-КОНВЕРТОРА приймаються автором за адресою електронної пошти: omv@library.kr.ua. Пропоную обговорити проблеми, порушені в даній статті за допомогою нових інформаційних технологій на Бібліотечному веб форумі Кіровоградської ОУНБ: http://www.library.kr.ua/forum/
За допомогою нашого веб форуму це можна робити швидко і практично. Після реєстрації ви можете внести свій e-mail у спеціальну форму, після чого програмний робот буде сповіщати вас листом про кожне нове повідомлення на форумі. В майбутньому планується розширити можливості РЕДАКТОРА-КОНВЕРТОРА шляхом створення додаткових конверторів метаданих з формату Dublin Core в XML формат та інші.


Посилання:

1 Консорциум Программного Обеспечения Интернет (ISC)/ http://www.isc.org/
2 Интернет Архив (Internet Archive)/ http://www.archive.org/
3 Большая советская энциклопедия/ http://www.rubricon.ru/
4 Ассоциация Визуальных ресурсов (Visual Resources Association)/ http://www.vraweb.org/
5 Global Information Locator Service (GILS)/ http://www.gils.net/
6 Кодирование Архивных Описаний (EAD)/ http://sunsite.berkeley.edu/FindingAids/EAD/bfac.html
7 Инициатива Дублинского ядра метаданных (DCMI)/ http://dublincore.org
8 Adoption of Dublin Core by Governments/ http://dublincore.org/news/adoption/
9 Метадані. Дублінський базовий комплект елементів метаданих/ http://lucl.lucl.kiev.ua/win/metadataf.html
10 Создание систематического каталога российских ресурсов Интернет/ http://www.rsl.ru/dc/
11 Постанова КМУ від 4 січня 2002 р. N 3 "Про Порядок оприлюднення у мережі Інтернет інформації про діяльність органів виконавчої влади"/ http://www.library.kr.ua/zakon/postkm20020104.html

Бібліографія:
1. The Organization of Information./Arlene G. Taylor -Englewood, Colorado: Libraries Unlimited, Inc., 1999.
2. Information Architecture for the World Wide Web./Louis Rosenfeld and Peter Morville, Cambridge: O'Reilly, 1998.
3. Российский коммуникативный формат. В помощь разработчикам программного обеспечения/ http://www.rba.ru:8101/rusmarc/
4. ISO 2709 - 1981: Документация - Формат для обмена библиографической информацией на магнитной ленте.
5. Michael Day, 6.2 Mapping Dublin Core to UNIMARC. In: Format conversion feasibility, ed. Rachel Heery. BIBLINK Project Deliverable D4.1, 15 September 1997./http://hosted.ukoln.ac.uk/biblink/wp4/d4.1/doc0006-1.html
6. IFLA Universal Bibliographic Control and International MARC Core Programme, UNIMARC: an introduction./ http://www.ifla.org/VI/3/p1996-1/unimarc.htm
7. IFLA Universal Bibliographic Control and International MARC Core Programme. UNIMARC manual: bibliographic format. 2nd ed., with update 1. UBCIM publications, n.s., vol. 14. Munchen: K.G. Saur, 1996./ http://www.ifla.org/VI/3/p1996-1/concise.htm


[ HOME ]

Проект МЕТАДАТА
Фон Фон © ОУНБ Кiровоград 1998-2002 Webmaster: webmaster@library.kr.ua