[HOME]
ОУНБ Кіровоград
DC.Metadata

[ HOME ]
Фон Проект МЕТАДАТА


Фон

Українська

Технологическая модель построения
информационного портала библиотеки.

Олег Волохин,
главный инженер по автоматизации Кировоградской ОУНБ.

Конец девяностых годов ХХ столетия можно назвать эрой вступления украинских библиотек во всемирную паутину WWW. Как грибы после дождя в украинском сегменте Интернет начали появляться сайты университетских, областных и городских библиотек. Возникает закономерный вопрос о роли и предназначении этих сайтов во всемирной сети, которая развивается стихийно. Кроме того в украинском и российском Интернете появилось достаточное количество так называемых "сайтов-библиотек" от организаций, сообществ и просто энтузиастов, которые на самом деле (вне сети Интернет) библиотеками, как таковыми не являюся. Достаточно ли для современной библиотеки опубликовать пару десятков html-страниц с тематикой "как нас найти", "перечень платных услуг" и "новости библиотеки"? Что же может стать отличительной чертой сайта профессиональной библиотеки в Интернет? И как вообще библиотеке оперировать с этой сетью? Как видите, вопросов больше, чем ответов. И к большому сожалению приходится констатировать, что украинская библиотечная наука не изобилует диссертациями, исследованиями или практическими разработками на эти темы. Тем более, в последнее время в среде украинских библиотек поднимается вопрос о создании информационных порталов. Что должно стать теоретической, технологической основой такого портала? На каких стандартах или форматах он должен базироваться и развиваться? Исходя из выше сказанного позволю себе предложить результаты исследований и отдельных разработок в Кировоградской ОУНБ им. Д.Чижевского.
Следует сказать, что после создания веб сайта библиотеки в январе 1999 года мы и не помышляли о создании портала. Главным вопросом для отдела автоматизации было определить поле деятельности для научной библиотеки в сети Интернет, изучить сферы применения, технологии и стандарты.


Структура сети Интернет.

Это огромное скопление цифровых ресурсов распределенное практически по всему земному шару. Изначально в этой сети не существует структуры, которая бы упорядочивала эти ресурсы. Не случайно оптимисты от Интернет называют ее крупнейшей кладовой знаний и информации, а пессимисты - "большой мусорной кучей". В подавляющем большинстве основу этих ресурсов составляют гипертекстовые файлы, включающие в себя текст, графику, звук, видео. Оценить количественно сеть Интернет можно только приблизительно. Это динамическая система, меняющая свои параметры ежеминутно.
По данным Консорциума Программного Обеспечения Интернет1 (ISC) количество серверов сети, на которых размещена информация составило более 72 млн. на февраль 2000 года. А объем материалов, опубликованных в Интернет подсчитать вообще не представляется возможным. Если взять во внимание только текстовую информацию (исключая картинки, звук и видео) и предположить, что одна печатная буква, цифра либо знак препинания, говоря компьютерным языком, это 1 байт, то вся 20-миллионная коллекция книг крупнейшей библиотеки мира - библиотеки Конгресса США составляет 20 Террабайт (1 Террабайт = 1 миллион Мегабайт = 1 триллион Байт). По данным организации Интернет Архив2 ее архив ресурсов Интернет, собранный за период 1996-2001гг. составляет 10 миллиардов веб страниц объемом более 100 Террабайт. Этот архив - всего лишь маленькая доля пространства Интернет, увеличивающего свои размеры с каждой секундой. Специалисты утверждают, что пока Вы дочитаете эту статью, в сети Интернет появятся не менее 1000 новых компьютеров.
Для того, что бы хоть как-то управляться с таким объемом неструктурированной информации в сети Интернет существуют поисковые сервера. По принципу индексирования их можно разделить на две группы:
1.С индексированием автоматическим (машинным).
2.С интеллектуальным индексированием(с участием человека).

Первую группу серверов называют "поисковыми машинами" или "индексирующими роботами". Такие роботы самостоятельно бороздят просторы Интернет, следуя по ссылкам, переходят от страницы к странице и заносят их в свою базу данных (БД) с последующим индексированием по полному тексту цифрового ресурса. К ним относятся всемирно известные Google, Alta Vista, HotBot и др. Мощнейшими посковыми машинами на просторах СНГ являются Рамблер, Апорт, Яндекс, харьковский сервер МЕТА.
Вторую группу серверов называют "порталами", "каталогами" или "директориями". Здесь обработку цифрового ресурса осуществляет человек (каталогизатор) внося данные в БД портала и индексируя их в соотвествии с различными тезаурусами или рубрикаторами, т.е. выполняет интеллектуальную обработку материала. Наиболее известными представителами второй группы является каталог Yahoo. Приблизительно по этому принципу построены многие платные онлайновые БД, вносящие в свои каталоги не только данные о ресурсах Интернет, но и материалы газет, журналов, информационных агенств, пресс-релизы компаний и пр. Такие БД представляют из себя уже гибриды каталогов и полнотекстовых материалов. К их числу можно отнести БД Dialog, Lexis-Nexis, Proquest Direct, EBSCO и прочие.
Казалось бы проблема индексации информации ресурсов Интернет решена только поисковыми машинами, ведь поисковый робот такой машины заносит полный текст страницы в свою БД и достаточно, того чтобы робот попал хотя бы на одну страницу сайта, а далее следуя по ссылкам этой страницы он перейдет к следующей и следующей, и таким образом постепенно проиндексирует весь сайт. К сожалению этого не происходит. Приведу пример, сайт Кировоградской ОУНБ на протяжении трех лет постоянно индексируется различными поисковыми машинами (не реже 1 раза в месяц). Казалось 3 лет достаточно для поисковых роботов, чтобы занести в свою БД все страницы нашего сайта. Однако провека наиболее популярных поисковых машин показала следующее:

Поисковая машина
Количество html-страниц
Кировоградской ОУНБ в БД
Google (США)
680
Rambler (Россия)
428
Aport (Россия)
1025
Yandex (Россия)
1570
МЕТА (Украина)
1252

Отсюда можно сделать вывод, что поисковые машины не рашают проблему полной индексации всех ресурсов Интернет, хотя их БД по сравнению с каталогами (порталами) имеют значительно больший объем данных и пополняются несоизмеримо быстрее, ввиду автоматической работы (без участия человека). Именно поэтому как альтернативный способ индексации ресурсов сети стали возникать Интернет порталы (каталоги, директории). Чаще всего порталы строятся по какому-то тематическому принципу. Известны например, порталы финансовые, СМИ, региональные, законодательные, литературные и т.д. Их еще называют вертикальными порталами. Кроме того существуют порталы горизонтальные, то есть охватывающие несколько тематик. Своим предназначением порталы дополняют в определенных отраслях "пробелы", а если хотите несовершенство поисковых машин, более подробно освещая конкретные тематические отрасли интеллектуальным (обработанных человеком) индексированием ресурсов. Именно порталы (каталоги) станут предметом этой статьи.


К вопросу о метаданных.

В буквальном смысле МЕТАДАННЫЕ можно расшифровать как "данные о данных". Мета... (от греч. metб - между, после, через), часть сложных слов, обозначающая промежуточность, следование за чем-либо, переход к чему-либо другому, перемену состояния, превращение.3
В сущности, понятие МЕТАДАННЫЕ, придуманное информационными специалистами компьютерных технологий, не является новым по значению для библиотечного, музейного или ахивного специалиста. Библиографическая карточка есть не что иное, как набор МЕТАДАННЫХ на книгу или статью из журнала, построенная по правилам библиографического описания. Изначально метаданные возникли как вспомогательная структура для автоматической индексации цифровых ресурсов.
Иными словами в код html-страницы, в области заголовков (между тегами html <HEAD> и </HEAD>) вносятся в определенном порядке данные, описывающие определенные параметры. Любая информация, внесенная в эту область html-документа не отображается браузером (компьютерной программой, предназначенной для показа html-файлов) на экране компьютера и пользователь может даже не подозревать, что просматриваемый им документ несет в себе еще какую-то дополнительную информацию, однако программные роботы, да и сам браузер извлекают эти полезные для решения определенных задач данные. Дальнейшее развитие сети привело к созданию других наборов МЕТАДАННЫХ, предназначенных не только для оперирования ими роботами, но и для решения более широкого круга задач. Сейчас таких наборов МЕТАДАННЫХ существуют десятки. Это могут быть узкоспецифические наборы, предназначенные для описания ресурсов какой-то определенной отрасли или тематики, имеются также и метаданные более общего, универсального характера: набор метаданных VRA4, Ассоциации Визуальных ресурсов, предназначенный для описания цифровых ресурсов содержащих графические изображения; набор метаданных GILS5 можно перевести как Глобальный Информационный Указатель-Сервис, предназначен для упрощения поиска и доступа к ресурсам, издаваемым в США государственными и индустриальными компаниями в сети Интернет; инициатива университета Беркли EAD6, Кодирование Архивных Описаний, призванная обеспечить методы описания, сохранения и доступа к цифровым ресурсам библиотек, музеев и архивов на основе языка SGML и многие другие. Исчерпывающую информацию по которым можно получить (на английском языке) на сайте ИФЛА по адресу: http://www.ifla.org/II/metadata.htm
Наше внимание привлекла Инициатива Дублинского Ядра Метаданных7 (Dublin Core Metadata Initiative). Стандарт метаданных Dublin Core, (произносится "даблин кор") или DC ("диси") является форматом описания практически любых ресурсов Интернет - не сложен по структуре, относительно легок в применении, расширяемый и интернациональный, т.е. нашедший свое применение по всему миру.
В конце 1999г. было принято решение использовать Dublin Core для собственных цифровых ресурсов, публикуемых на сайте Кировоградской ОУНБ. Начиная с 2000 г. было введено правило снабжать описанием Dublin Core практически каждую html-страницу, которая появлялась на нашем сайте. Сейчас, в первой половине 2002 г. можно констатировать, что сайт Кировоградской ОУНБ является крупнейшим в украинском сегменте Интернет, где используюся метаданные Дублинского Ядра (около 900 html-странииц). Возникает вопрос, правильным ли был выбор, среди множества разнообразных стандартов метаданных? Думаю, что время - это лучший арбитр в данном вопросе. Однако уже сегодня можно констатировать следующее: в сентябре 2001г. набор метаданных Dublin Core был утвержден в США, Американским Институтом Национальных Стандартов как стандарт Z39.85. В Австралии, Канаде, Дании, Финляндии, Ирландии и Великобритании в этом же году формат Dublin Core рекомендован и принят как государственный стандарт для онлайн ресурсов и е-коммерции8 . Формат Dublin Core версии 1.1 влючает в себя 15 элементов для описания цифрового ресурса:

· Заглавие - Title,
· Создатель(Автор) - Creator,
· Тема (Предметная рубрика) - Subject,
· Описание (Аннотация) - Description,
· Издатель - Publisher,
· Соавтор - Contributor,
· Дата - Date,
· Формат - Format,
· Тип - Type,
· Идентификатор - Identifier,
· Источник - Source,
· Язык - Language,
· Отношение - Relation,
· Охват (Покрытие) - Coverage,
· Авторские права - Rights.

По правилам Dublin Core каждый из 15-ти элементов не является обязательным и может повторятся. В самом общем случае для внесения любого элемента достаточно пары - ИМЯ и ЗНАЧЕНИЕ (Content):
<meta name="DC.ИМЯ" content="ЗНАЧЕНИЕ">
Рассмотрим реальный пример для элемента СОЗДАТЕЛЬ (АВТОР) закодированный в языке HTML версии 4.0:
<meta name="DC.Creator" content="Энгельс, Фридрих">
Для более детального описания некоторых элементов применяются подэлементы, называемые квалификаторами. К квалификаторам относятся дополнительные подтипы основного элемента и схемы. Например, можно уточнить тип автора (коллективный или индивидуальный) с помощью квалификатора:
<meta name="DC.Creator.PersonalName" content="Маркс, Карл">
С помощью квалификатора СХЕМА (Scheme) можно пояснить из какого контролируемого словаря взято значение элемента:
<meta name="DC.Subject" scheme="ББК" content="Другие разделы спектроскопии">
<meta name="DC.Subject" scheme="ББК" content="В344.9">

Применение квалификаторов желательно, но не обязательно. Все зависит от того, насколько детально Вы желаете составить описание цифрового ресурса. Порядок следования элементов не имеет значения. Полное описание по использованию формата Dublin Core не входит в задачи данной статьи. На украинском языке с форматом Dublin Core можно ознакомиться на сайте библиотеки им.Л.Украинки9, или на русском языке - на сайте Российской Государственной библиотеки10, кстати на этом же сайте можно использовать онлайновый редактор метаданных Dublin Core, созданный специалистами этой библиотеки. Расширенное руководство по использованию стандарта на нашем сайте пока еще только готовится. Я приведу в качестве примера описание одной из html-страниц сервера Национальной парламентской библиотеки :

Пример 1.
<META NAME="DC.Title" CONTENT="ВСЕУКРАЇНСЬКА НАУКОВО-ПРАКТИЧНА КОНФЕРЕНЦІЯ ДИРЕКТОРІВ ДЕРЖАВНИХ ТА ОБЛАСНИХ УНІВЕРСАЛЬНИХ НАУКОВИХ БІБЛІОТЕК 'РЕСУРСИ І ПОСЛУГИ СУЧАСНОЇ БІБЛІОТЕКИ'. м.Миколаїв, 13-16 листопада 2001р.">
<META NAME="DC.Title.alternative" CONTENT="СТРАТЕГІЯ РОЗВИТКУ УКРАЇНСЬКИХ БІБЛІОТЕК (Огляд матеріалів конференції)">
<META NAME="DC.Subject.ConferenceName" CONTENT="ВСЕУКРАЇНСЬКА НАУКОВО-ПРАКТИЧНА КОНФЕРЕНЦІЯ">
<META NAME="DC.Subject" CONTENT="ОУНБ України--Ресурси та послуги">
<META NAME="DC.Subject" CONTENT="ОУНБ України--Проблеми інформатизації">
<META NAME="DC.Description" CONTENT="13-16 листопада 2001 р. у м. Миколаєві відбулася Всеукраїнська науково-практична конференція директорів державних та обласних універсальних наукових бібліотек 'Ресурси і послуги сучасної бібліотеки', організована Міністерством культури і мистецтв України спільно з управлінням культури Миколаївської облдержадміністрації. Матеріали конференції опубликовані на сайті НПБ Украини.">
<META NAME="DC.Description.TableOfContents" CONTENT="СТРАТЕГІЯ РОЗВИТКУ УКРАЇНСЬКИХ БІБЛІОТЕК (Огляд матеріалів конференції)--Доповідь начальника відділу бібліотек та інформаційних систем МКіМ України Т. Прокошевої--Рекомендації Всеукраїнської науково-практичної конференції директорів державних та обласних універсальних наукових бібліотек 'Ресурси і послуги сучасної бібліотеки'">
<META NAME="DC.Publisher.CorporateName" CONTENT="Національна парламентська бібліотека України">
<META NAME="DC.Contributor.PersonalName" CONTENT="Ніколенко, Г.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Кононенко, Л.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Лоскутников, В.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Прокошева, Т.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Корнієнко, А.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Богза, Н.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Визір, О.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Моісеєва, Н.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Венгереш, М.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Гич, Г.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Архипська, Л.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Пашкова, В.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Вітенко, В.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Пивоваров, В.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Новакова, Л.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Риб'янцева, І.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Тітова, Н.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Коротун, Н.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Ботушанська, О.">
<META NAME="DC.Contributor.PersonalName" CONTENT="Незнамова, Л.">
<META NAME="DC.Date.created" CONTENT="2001-12-14">
<META NAME="DC.Format" CONTENT="text/html; charset=windows-1251">
<META NAME="DC.Format" CONTENT="36949 bytes">
<META NAME="DC.Type" CONTENT="Text">
<META NAME="DC.Type" CONTENT="Text.Proceedings">
<META NAME="DC.Type" CONTENT="Text.Thesis">
<META NAME="DC.Identifier" CONTENT="http://www.nplu.kiev.ua/uk/main/conf.htm">
<META NAME="DC.Language" SCHEME="ISO 639-2" CONTENT="ukr">
<META NAME="DC.Coverage.PlaceName" SCHEME="DCMI Point" CONTENT="м.Миколаїв, Україна">
<META NAME="DC.Coverage.temporal" CONTENT="13-16 листопада 2001 року">
<META NAME="DC.Rights" CONTENT="Національна парламентська бібліотека України, 2001">


Практическое использование Dublin Core в библиотеке.

Для более легкого понимания обычным бибилитекарем вопросов использования метаданных Dublin Core, думаю, будет уместным провести ряд параллелей и допусков. Давайте посмотрим на описание ресурсов Интернет, как на традиционную библиотечную работу по составлению каталога:
1. Описание с использованием Dublin Core ресурсов Интернет есть ни что иное как библиографическое описание книги или аналитической статьи журнала (газеты).
2. Ввиду того что правила библиографического описания (ГОСТ-7.1.84) не располагают данными о цифровых ресурсах, будем считать, что правила Dublin Core и есть наш свод правил об описании этих ресурсов (кстати, с учетом последнего мирового опыта). То есть Dublin Core - это "ГОСТ-7.1.84" для Интернет.
3. Традиционный каталог предусматривает хранение библиографической карточки отдельно от первоисточника (для бумажного каталога - карточка в каталожном ящике, для электронного - запись в библиографической БД). Мы будем придерживаться всего того, что касается электронного каталога. Но дополнительно учтем, что пользователь сети Интернет не находится в стенах нашей библиотеки, и не сможет получить доступ к карточному каталогу. Поэтому создавая описание Dublin Core для html-страниц собственного сервера мы помещаем это описание к коде HTML непосредственно в тело публикуемого документа. Иными словами: мы публикуем в сети Интернет электронный документ и одновременно "вшиваем" каталожную карточку в тело первоисточника.
Теперь возникает закономерный вопрос: как сделать доступным для пользователя сети просмотр такой электронной карточки, а для каталогизатора работу с ней? Ведь не каждый пользователь знает как отыскать и выделить в коде html-страницы эту полезную информацию. Признаюсь, в глазах моих коллег по отделу, создаваших описания в стандарте Dublin Core на протяжении последних 2 лет я видел немой упрек - зачем вносить метаданные Dublin Core в html-страницы если от них нет никакого практического толка? Действительно, эти данные никак не отображатся в экране браузера и пользователь, просматривающий страницу даже и не подозревает о том, что эта страница имеет в себе вторичные данные, позволяющие получить краткое описание о ней. Кроме того на сегодняшний день ни одна известная поисковая машина Интернет не использует Dublin Core для индексации ресурса, она их просто игнорирует. Логичным будет предположить, что для реального использования Dublin Core необходимы какие-то дополнительные онлайновые программы-утилиты, позволяющие решить эту проблему. О таких программах, созданных в нашей библиотеке пойдет речь далее.


Утилита "Просмотрщик-Конвертор метаданных Dublin Core".

С осени 2001 г. на html-страницах нашего библиотечного сайта начали появляться линки с именем DC.Metadata. Расположены они, для легкого обнаружения в видном месте - как правило в верхнем-левом углу страницы. При нажатии курсором на такой линк отработает программа на языке Perl, сформирует и покажет html-страницу с метаданными Dublin Core в удобном для чтения человеком виде. Иными словами, программа выберет из html-кода страницы полезные описательные данные и покажет вам фактически электронную каталожную карточку о документе Интернет, который вы собираетесь читать. Согласитесь, если вы собираетесь просматривать ресурс размером в несколько печатных страниц, а может быть и десятков страниц - такие описательные данные врядли будут лишними. Кстати, если вы используете Dublin Core на своем сайте, то можете использовать преимущества онлайновых технологий. Для этого достаточно в коде ваших html-страниц разместить следующую строку:
<a href="http://www.library.kr.ua/cgi-bin/dcview.cgi">DC.Metadata</a>
Этого будет достаточно для того, чтобы на странице вашего сервера появился линк DC.Metadata, и пользователи вашего сервера смогут просматривать описательные данные Dublin Core вашей страницы.
Следующая программа является продолжением предыдущей, но с расширенными функциями (http://www.library.kr.ua/dc/lookatdcr.html). Ее предназначение - возможность тестировать любые страницы сети Интернет на предмет наличия метаданных Dublin Core. Это поисковая форма, имеющая интерфейс на трех языках (украинский, русский и английский). Кроме того вы можете получать вторичную информацию о страницах даже в том случае, если они не имеют метаданных Dublin Core. Программа просто сгенерирует максимальное возможное количество данных из других, сопутствующих параметров страницы и ответов сервера, а далее перекодирует их на лету в формат Dublin Core.
Коссвенно программа позволяет судить вообще о каком-либо присутствии метеданных на странице, т.к. использует в своей работе стандартные html-метаданные, предназначенные для опознавания страницы традиционными поисковыми машинами Интернет. Я провел небольшое тестирование веб ресурсов некоторых библиотек Украины и ведущих библиотек России на предмет наличия хоть каких-либо метаданных. Результаты оказались плачевными. Можно утверждать, что практически, библиотеки не уделяют данному вопросу должного внимания. Мне часто приходилось слышать от библиотекарей жалобы на плохо оформленные издания в контексте выходных данных, о книгах-перевертышах или например, CD ROM, которые оформлены с издательской точки зрения совершенно безграмотно. Особенно трудно приходится с такими изданиями отделам обработки. Трудно или не возможно извлечь выходные данные и прочие параметры при внесении описания такого документа в библиотечный каталог. Однако давайте взглянем под этим углом на веб сайты украинских библиотек. Создавая очередную html-страницу, библиотека в данном случае выступает издателем цифрового документа в сети Интернет. И что же получается? Эта же библиотека "штампует" для сети Интернет документы без роду и имени??? Это ли не пример издательской деятельности в новой среде организацией, которая знает как профессионально работать с информацией? Вопрос остается открытым…


Утилита "Редактор-Конвертор метаданных Dublin Core" (версия 1.1).

Эту программу можно отыскать по адресу:
http://www.library.kr.ua/dc/dceditunir.html. Ее можно использовать в двух направлениях:
1.Как полнофункциональный редактор метаданных Dublin Core для создания, редактирования и последующего внесения созданного кода в реальную html-страницу (в формате языка HTML 4.0).
2.Как конвертор из формата метаданных Dublin Core в библиографический формат обмена данными UNIMARC (RUSMARC, UKRMARC) с последующим сохранением данных в файле ISO-2709.
Кроме того при помощи этой программы представляется возможным построить технологию создания и развития ИНФОРМАЦИОННОГО ПОРТАЛА библиотеки в сети Интернет максимально приблизив эту работу к традиционным библиотечным функциям - создание библиотечного каталога (вторичной информации о ресурсах). Таким образом библиотека фактически будет работать в обычной среде применительно к новым ресурсам, расположенным в сети Интернет. Использование РЕДАКТОРА-КОНВЕРТОРА можно представить на следующей блок-схеме:

Использование РЕДАКТОРА-КОНВЕРТОРА в качестве редактора Dublin Core.

Такой этап работы с РЕДАКТОРОМ-КОНВЕРТОРОМ версии 1.1 (РКv1.1) можно считать промежуточным. Он предназначен для создания и редактирования метаданных DC уже существующих html-страниц. В случае, если html-страница еще не имеет метаданных DC - РКv1.1 сгенерирует их, используя попутные метаданные и ответы сервера. Интерфейс РКv1.1 в стадии редактированя состоит из двух зон: окна метаданных, закодированных по правилам языка HTML 4.0 (выделен голубым цветом текста) и собственно редактора с полями ввода данных (нижний экран). Там где это возможно, в соответствии с правилами стандарта DC, редактор снабжен выпадающими меню с вариантами заполения поля конкретного элемента. Имеется краткая система помощи по каждому элементу DC с рекомендациями по использованию и несколькими примерами. Такая помошь появляется в отдельном окне браузера. Чтобы исключить проблемы с отображением кодировок - редактор автоматически перекодирует ответы сервера из кодировки KOI-8R в кодировку Windows-1251. Имеется возможность добавления строк для каждого элемента соответствующей кнопкой: "+ ИМЯ_ЭЛЕМЕНТА", если все поля данного элемента уже заполнены. После внесения данных (или их коррекции) в каком-либо поле необходимо использовать кнопку "DC-Изменить" для учета проведенных изменений. После этого редактор отобразит в верхнем экране ваши изменения в коде HTML (синим цветом). Если вы считаете редактирование медаданных законченым - достаточно выделить мышкой код, изображенный синим цветом, скопировать его в буфер обмена (Ctrl+C) и при помощи любого текстового редактора вставить данные в реальную html-страницу между тегами <HEAD> и </HEAD>.

Использование РЕДАКТОРА-КОНВЕРТОРА
в качестве конвертора Dublin Core - UNIMARC.

Этот этап используется в том случае, когда вам необходимо сохранить матаданные о html-странице в бибилографической БД, в формате UNIMARC (RUSMARC, UKRMARC). Выполнив работы, описанные в первом этапе (создание или редактирование метаданных DC) необходимо использовать кнопку редактора "UNIMARC". Программа произведет конвертирование и покажет вам новый экран в формате UNIMARC.

Пример 2.
001 http://www.nplu.kiev.ua/uk/main/conf.htm
035 ##$ahttp://www.nplu.kiev.ua/uk/main/conf.htm
100 ##$a20020312j2001####|||u0ukry0102####ca
101 0#$aukr
200 1#$aВСЕУКРАЇНСЬКА НАУКОВО-ПРАКТИЧНА КОНФЕРЕНЦІЯ ДИРЕКТОРІВ ДЕРЖАВНИХ ТА ОБЛАСНИХ УНІВЕРСАЛЬНИХ НАУКОВИХ БІБЛІОТЕК 'РЕСУРСИ І ПОСЛУГИ СУЧАСНОЇ БІБЛІОТЕКИ'. м.Миколаїв, 13-16 листопада 2001р.
210 ##$cНаціональна парламентська бібліотека України$d2001
230 ##$atext/html, text/html; charset=windows-1251, 36949 bytes
300 ##$aМісцевість: м.Миколаїв, Україна
300 ##$aКоординати часові: 13-16 листопада 2001 року
330 ##$a13-16 листопада 2001 р. у м. Миколаєві відбулася Всеукраїнська науково-практична конференція директорів державних та обласних універсальних наукових бібліотек 'Ресурси і послуги сучасної бібліотеки', організована Міністерством культури і мистецтв України спільно з управлінням культури Миколаївської облдержадміністрації. Матеріали конференції опубликовані на сайті НПБ Украини.
330 ##$aСТРАТЕГІЯ РОЗВИТКУ УКРАЇНСЬКИХ БІБЛІОТЕК (Огляд матеріалів конференції)--Доповідь начальника відділу бібліотек та інформаційних систем МКіМ України Т. Прокошевої--Рекомендації Всеукраїнської науково-практичної конференції директорів державних та обласних універсальних наукових бібліотек 'Ресурси і послуги сучасної бібліотеки'
333 ##$aНаціональна парламентська бібліотека України, 2001
336 ##$atext/html, text/html; charset=windows-1251
336 ##$a36949 bytes
517 1#$aСТРАТЕГІЯ РОЗВИТКУ УКРАЇНСЬКИХ БІБЛІОТЕК (Огляд матеріалів конференції)
608 ##$aТекст$2Dublin Core
608 ##$aТекст-Праці$2Dublin Core
608 ##$aТекст-Тезіс$2Dublin Core
686 ##$aВСЕУКРАЇНСЬКА НАУКОВО-ПРАКТИЧНА КОНФЕРЕНЦІЯ
686 ##$aОУНБ України--Ресурси та послуги
686 ##$aОУНБ України--Проблеми інформатизації
702 #0$aНіколенко, Г.
702 #0$aКононенко, Л.
702 #0$aЛоскутников, В.
702 #0$aПрокошева, Т.
702 #0$aКорнієнко, А.
702 #0$aБогза, Н.
702 #0$aВизір, О.
702 #0$aМоісеєва, Н.
702 #0$aВенгереш, М.
702 #0$aГич, Г.
702 #0$aАрхипська, Л.
702 #0$aПашкова, В.
702 #0$aВітенко, В.
702 #0$aПивоваров, В.
702 #0$aНовакова, Л.
702 #0$aРиб'янцева, І.
702 #0$aТітова, Н.
702 #0$aКоротун, Н.
702 #0$aБотушанська, О.
702 #0$aНезнамова, Л.
856 4#$uhttp://www.nplu.kiev.ua/uk/main/conf.htm

Примечание: Пример №2 является результатом работы программы, использующей данные из примера №1. Для примеров использовалась реальная html-страница (http://www.nplu.kiev.ua/uk/main/conf.htm) сервера Национальной парламетской библиотеки с материалами о всеукранской научно-практической конференции директоров библиотек, проходившей в г.Николаеве, в 2001 году . В реальности же таких метаданных в природе не существует и созданы для демострации работы программы.

В случае если вас что-то не устраивает в данных то, используя кнопку браузера "Назад" можно вернуться в редактор и произвести соответствующие корректировки. Если все в порядке, то используя кнопку "ISO-2709" вы можете сохранить запись для вашей БД в двоичном файле формата ISO-2709 на локальном диске своего компьютера. На запрос браузера вам необходимо выбрать опцию "Сохранить файл", выбрать папку на вашем компьютере для сохранения файла, присвоить ему имя с расширением "ISO" (ИМЯ.ISO). После этого вы можете импортировать данный файл в вашу профессиональную библиотечную систему.


Теоретические вопросы конверсии из Dublin Core в UNIMARC.

Основная проблема конверсии заключается в том, что формат Dublin Core является более простым форматом по сравнению с UNIMARC. Для формата UNIMARC - профессионального формата передачи данных, который учитывает правила библиографического описания, обязательна более строгая детализация отдельных элемениов описания. Для наглядности приведу таблицу мапирования (таблицу соответствий между элементами двух форматов) которые использует программа. Примечание: некоторые детали исключены для улучшения читаемости.
Dublin Core
UNIMARC
Title
(Заглавие)
200 $a Основное заглавие
200 $e Сведения, относящиеся к заглавию
517 $a Вариант заглавия
Creator
(Создатель, Автор)
700 $a Имя лица - первичная интеллектуальная ответственность
701 $a Имя лица - альтернативная интеллектуальная ответственность
710 $a Наименование организации - первичная интеллектуальная ответственность
711 $a Наименование организации - альтернативная интеллектуальная ответственность
200 $f Первые сведения об ответственности
Subject
(Предмет. Ключевые слова)
610 $a Неконтролируемые предметные термины
606 Наименование темы как предмет
675 Универсальная десятичная классификация (UDC/УДК)
676 Десятичная классификация Дьюи (DDC/ДДК)
680 Классификация Библиотеки Конгресса (LCC/КБК)
686 Индексы других классификаций
Description
(Описание)
330 $a Резюме или реферат
Publisher
(Издатель)
210 $c Имя издателя, распространителя и т. д.
Contributor
(Соавтор)
701 $a Имя лица - альтернативная интеллектуальная ответственность
711 $a Наименование организации - альтернативная интеллектуальная ответственность
200 $g Последующие сведения об ответственности
Date
(Дата)
210 $d Дата издания, распространения и т.д.
Type
(Тип)
608 Форма, жанр, физические характеристики документа как точка доступа
Format
(Формат)
230 $a Специфическая область материала: характеристика электронного ресурса
336 $a Тип компьютерного файла
Identifier
(Идентификатор)
001 (обязательное для UNIMARC)
010 (ISBN)
011 (ISSN)
020 (Номер документа в национальной библиографии)
035 Другие системные номера
856 $u (URL)
Source
(Источник)
324 Оригинальная версия примечания
Language
(Язык)
101 Язык документа
Reletion
(Отношение)
300 Общие примечания
Covarage
(Охват. Покрытие.)
300 Общие примечания
Rights
(Авторские права)
333 Примечания об особенностях распространения и использования

Для формата UNIMARC (UKRMARC, RUSMARC) ряд полей является обязательным, без наличия которых запись не будет полноценной. Приведу таблицу этих обязательных полей и соответствующие им поля формата Dublin Core:
UNIMARC
Dublin Core
001 - Идентификатор записи
Identificator (Идентификатор)
100 - Данные общей обработки
Date (Дата), Language (Язык)
101 - Язык документа
Language (Язык)
200 - Заглавие и сведения об ответственности
Title (Заглавие), Creator (Создатель, Автор), Contributor (Соавтор)

Однако, согласно правил Dublin Core любой из 15-ти элементов не является обязательным. Иными словами описание ресурса в формате Dublin Core, где отсутствуют выше перечисленные элементы будет вполне корректной. Поэтому в случае отстутствия в описании элементов Identificator (Идентификатор) и Date (Дата), РКv1.1 создаст их самостоятельно на основе ответов сервера. При отсутствии элементов Title (Заглавие) и Language (Язык) - РКv1.1 не будет конвертировать описание в формат UNIMARC до тех пор, пока каталогизатор не внесет заглавие элемента в поле Title и код языка (языков) вручную. Вполне возможен вариант, когда в описании отсутствеют элементы Автор и/или Соавтор, конвертирование в этом случае буде произведено, но при наличии данных в этих полях РКv1.1 обязательно потребует указать вручную тип автора (коллективный или персональный).


О технологии построения библиотечного информационного портала.

Произведем импорт записи о ресурсе Интернет из файла ISO-2709 в библиографическую БД "Ресурсы Интернет". Тест проводился при помощи системы ИРБИС версии 2002 года. Теперь запись на ресурс в БД может выглядеть в нескольких представлениях - информационном виде, в виде библиографической карточки и т.д.

Пример 3.
В85
   ВСЕУКРАЇНСЬКА НАУКОВО-ПРАКТИЧНА КОНФЕРЕНЦІЯ ДИРЕКТОРІВ ДЕРЖАВНИХ ТА ОБЛАСНИХ УНІВЕРСАЛЬНИХ НАУКОВИХ БІБЛІОТЕК 'РЕСУРСИ І ПОСЛУГИ СУЧАСНОЇ БІБЛІОТЕКИ'. м.Миколаїв, 13-16 листопада 2001р.. -Б.м., 2001. -Б.ц.
Местность: м.Миколаїв, Україна. Координаты временные: 13-16 листопада 2001 року

Аннотация: 13-16 листопада 2001 р. у м. Миколаєві відбулася Всеукраїнська науково-практична конференція директорів державних та обласних універсальних наукових бібліотек 'Ресурси і послуги сучасної бібліотеки', організована Міністерством культури і мистецтв України спільно з управлінням культури Миколаївської облдержадміністрації. Матеріали конференції опубликовані на сайті НПБ Украини.СТРАТЕГІЯ РОЗВИТКУ УКРАЇНСЬКИХ БІБЛІОТЕК (Огляд матеріалів конференції)--Доповідь начальника відділу бібліотек та інформаційних систем МКіМ України Т. Прокошевої--Рекомендації Всеукраїнської науково-практичної конференції директорів державних та обласних універсальних наукових бібліотек 'Ресурси і послуги сучасної бібліотеки'

ДОП.ТОЧКИ ДОСТУПА:
Ніколенко, Г.
Кононенко, Л.
Лоскутников, В.
Прокошева, Т.
Корнієнко, А.
Богза, Н.
Визір, О.
Моісеєва, Н.
Венгереш, М.
Гич, Г.
Архипська, Л.
Пашкова, В.
Вітенко, В.
Пивоваров, В.
Новакова, Л.
Риб'янцева, І.
Тітова, Н.
Коротун, Н.
Ботушанська, О.
Незнамова, Л.
см. ССЫЛКУ - INTERNET: http://www.nplu.kiev.ua/uk/main/conf.htm

Такой вид имеет запись в системе ИРБИС в традиционном библиотечном формате.

Если библитека имеет свой модуль OPAC (модуль, отображающий внутренный электронный каталог библиотеки в сети Интернет) то не составляет труда подключить к этому модулю новую БД, например, "Ресурсы Интернет", в которой будут накапливаться записи, полученные в результате конверсии из формата Dublin Core. Онлайновый интерфейс может варьироваться. Интерфейс можно построить например, по виду каталога Yahoo или чего-либо подобного. Теперь имеется возможность осуществлять поиск не только в традиционном для Интернет портала виде - по ключевым словам, но и по АВТОРУ, ЗАГЛАВИЮ, ИЗДАТЕЛЮ, ДАТЕ, ПРЕДМЕТНОЙ РУБРИКЕ, ЯЗЫКУ ТЕКСТА, СОАВТОРАМ, ФОРМЕ и ЖАНРУ, ФИЗИЧЕСКИМ ХАРАКТЕРИСТИКАМ ДОКУМЕНТА. На этом можно считать законченными подготовительные работы по созданию информационного портала Интернет, в дальнейшем необходима работа библиографов-каталогизаторов по наполнению БД описаниями ресурсов. Кроме того, вся информация станет доступной пользователям электронного каталога библиотеки без использования сети Интернет.
Конечно, можно и не конвертировать данные в формат UNIMARC, не заносить их в библиографическую БД, а остановиться на промежуточном этапе - сохранять данные в формате Dublin Core и на их основе строить портал библиотеки в Интернет. Однако, на мой взгляд это не совсем логично для библиотеки. Во-первых, потребуется какая-то дополнительная среда для хранения данных. Во-вторых, необходимо создание механизма доступа, поиска и извлечения данных из такой БД. И в-третьих, этот массив данных будет "оторван" от остальных информационных массивов библиотеки.
И последний вопрос. А стоит ли библиотеке создавать информационный портал? Ресурсов в Интернет так много, а библиотекарей в вашей библиотеке так мало. Ресурсы мигрируют в сети: появляюися, исчезают, меняют место прописки… Как за всем этим угнаться??? Первое, что необходимо помнить - это предназначение портала. Этот вид поискового сервиса в Интернет не может охватить все. Поэтому необходимо ориентироваться на конкретную тему или ряд тем, которые может охватить ваш портал. Наверное прежде всего он должен быть литературным, ну и во вторую очередь региональным. Менее успешным будет проект, если вы попытаетесь охватить все. Скорее всего из этого получится "обо всем - практически ни о чем" и для будущего пользователя вашего портала он будет иметь соответствующую цену. Во все века библиотека специализировалась (в информационном смысле) на создании вторичной информации о документах, то есть создании каталогов. Это конечно же не значит, что библиотека должна отказаться от издательской деятельности. Наоборот, гораздо проще стало публиковать полнотекстовые материалы при помощи сети Интернет.
Одна уже сегодня можно констатировать тот факт, что в публикациях полных текстов книг в рускоязычном и украиноязычном сегменте сети Интернет профессиональные библиотеки безнадежно утеряли свои позиции. За последние 5-6 лет в сети появилось огромное количество полнотекстовых библиотек, созданных энтузиастами от литературы. Количество полнотестовых книг составляет десятки тысяч!!! Кто-то скажет не библиотечное это дело заниматься публикациями в таких объемах, и наверное будет прав. Возможно более логичным будет публикация в Интернет редких книг из собственных коллекций, не нарушая при этом закона об авторских правах. И тем не менее, не лишним будет создание адресных каталогов библиотек Мошкова, Евгения Пескина, подобных украинских сайтов. Наверное совсем не лишним будет на вашем портале рубрика ЛИТЕРАТУРА-ПОЛНЫЕ ТЕКСТЫ, которая может расширяться подрубриками, например, Тарас Шевченко, Лина Костенко и т.д. Рубрики вашего портала можно формировать на основе анализа реальных запросов пользователей библиотеки.
Уместным будет упомянуть, что 4 января 2002 года Кабинет Министров Украины издал постановление "Про Порядок оприлюднення у мережі Інтернет інформації про діяльність органів виконавчої влади11." Один из пунктов этого постановления гласит: "Міністерствам, іншим центральним органам виконавчої влади, Раді міністрів Автономної Республіки Крим, обласним, Київській та Севастопольській міським державним адміністраціям починаючи із січня 2002 р. забезпечити розміщення і постійне оновлення інформації на власних веб-сайтах у мережі Інтернет відповідно до Порядку, затвердженого цією постановою". А это значит, что со временем появится еще большее количество сайтов, где будут публиковаться распоряжения, постановления и прочие полные тексты документов органов местного самоуправления. Описание этих документов может стать региональной составляющей вашего библиотечного портала.
Подведу итог данной публикации. Предложенная технология предлагает в качестве базового стандарта для взаимодействия с сетью Интернет использовать формат метаданных Dublin Core, для изучения которого потребуется определенные усилия со стороны библиотек, но в остальном же, эта технология и разработанное программное обеспечение вписывается в рамки традиционной библиотечной работы. Предложения и замечания по работе онлайнового РЕДАКТОРА-КОНВЕРТОРА принимаюися автором по адресу электронной почты: omv@library.kr.ua. Предлагаю обсудить проблемы, затронутые в данной статье с помощью новых информационных технологий на Библиотечном веб форуме Кировоградской ОУНБ: http://www.library.kr.ua/forum/
С помощью нашего веб форума это можно делать быстро и практично. После ригистрации имеется возможность внести свой e-mail в специальную форму, после чего программный робот будет извещать вас письмом о каждом новом сообщении на форуме. В будущем планируется расширить возможности РЕДАКТОРА-КОНВЕРТОРА путем создания дополнительных конверторов метаданных из формата Dublin Core в XML формат и другие.


Ссылки:

1 Консорциум Программного Обеспечения Интернет (ISC)/ http://www.isc.org/
2 Интернет Архив (Internet Archive)/ http://www.archive.org/
3 Большая советская энциклопедия/ http://www.rubricon.ru/
4 Ассоциация Визуальных ресурсов (Visual Resources Association)/ http://www.vraweb.org/
5 Global Information Locator Service (GILS)/ http://www.gils.net/
6 Кодирование Архивных Описаний (EAD)/ http://sunsite.berkeley.edu/FindingAids/EAD/bfac.html
7 Инициатива Дублинского ядра метаданных (DCMI)/ http://dublincore.org
8 Adoption of Dublin Core by Governments/ http://dublincore.org/news/adoption/
9 Метадані. Дублінський базовий комплект елементів метаданих/ http://lucl.lucl.kiev.ua/win/metadataf.html
10 Создание систематического каталога российских ресурсов Интернет/ http://www.rsl.ru/dc/
11 Постанова КМУ від 4 січня 2002 р. N 3 "Про Порядок оприлюднення у мережі Інтернет інформації про діяльність органів виконавчої влади"/ http://www.library.kr.ua/zakon/postkm20020104.html

Библиография:
1. The Organization of Information./Arlene G. Taylor -Englewood, Colorado: Libraries Unlimited, Inc., 1999.
2. Information Architecture for the World Wide Web./Louis Rosenfeld and Peter Morville, Cambridge: O'Reilly, 1998.
3. Российский коммуникативный формат. В помощь разработчикам программного обеспечения/ http://www.rba.ru:8101/rusmarc/
4. ISO 2709 - 1981: Документация - Формат для обмена библиографической информацией на магнитной ленте.
5. Michael Day, 6.2 Mapping Dublin Core to UNIMARC. In: Format conversion feasibility, ed. Rachel Heery. BIBLINK Project Deliverable D4.1, 15 September 1997./http://hosted.ukoln.ac.uk/biblink/wp4/d4.1/doc0006-1.html
6. IFLA Universal Bibliographic Control and International MARC Core Programme, UNIMARC: an introduction./ http://www.ifla.org/VI/3/p1996-1/unimarc.htm
7. IFLA Universal Bibliographic Control and International MARC Core Programme. UNIMARC manual: bibliographic format. 2nd ed., with update 1. UBCIM publications, n.s., vol. 14. Munchen: K.G. Saur, 1996./ http://www.ifla.org/VI/3/p1996-1/concise.htm


[ HOME ]

Проект МЕТАДАТА
Фон Фон © ОУНБ Кiровоград 1998-2002 Webmaster: webmaster@library.kr.ua