Романенко Л. В. Практический опыт


Л. В. Романенко, С. А. Самарина

заведующая отделом оцифровки и микрографирования; библиотекарь отдела оцифровки и микрографирования ГУК «Алтайская краевая универсальная научная библиотека им. В. Я. Шишкова»

 

 Практический опыт оцифровки краеведческих фондов в Алтайской краевой универсальной научной библиотеке им. В. Я. Шишкова

Период существования документов в цифровой форме – чуть более двух десятков лет. Несмотря на такой короткий срок, спрос на электронные ресурсы возрастает и многие учреждения, в том числе и библиотеки, создают электронные документы самостоятельно. В настоящее время не существует единых подходов и рекомендаций в области формирования электронных ресурсов, и каждая организация разрабатывает свой путь решения данной проблемы.

Формирование собственных электронных документов стало одним из приоритетных направлений деятельности АКУНБ за последнее время. Это получило отражение в структуре библиотеки –  в июне 2009 г. был образован отдел оцифровки и микрографирования, одной из основных задач которого является работа по оцифровке документов редкого и краеведческого фондов.

В библиотечном деле, независимо от физического носителя информации, цепочка «документ – читатель» включает в себя несколько этапов:  комплектование, создание информации о документе в справочно-поисковом аппарате библиотеки, размещение документа в хранилище, организация доступа читателей к документу, учет документов, обеспечение надежного хранения документа. Правила, требования, технологии и ответственность за четкое функционирование этой цепочки закреплены в нормативных документах библиотек.

Работы по оцифровке собственного фонда нашей библиотеки осуществляются как самостоятельное направление  в рамках создания электронной библиотеки АКУНБ (ЭБ АКУНБ).  Поэтому вся разработанная в АКУНБ нормативная база по данному вопросу является составной частью нормативно-правовой документации по ЭБ АКУНБ.

Библиотека приступила к оцифровке документов, имея за плечами определенный опыт создания собственных электронных ресурсов, но задача формирования электронных документов в рабочем, поточном режиме потребовала иного подхода к этому процессу. Важно было не только разработать все этапы цепочки «документ – электронный документ – читатель», но и максимально комфортно встроить их в работу всей библиотеки.

Ознакомившись с опытом оцифровки документов и организации электронных библиотек в библиотеках России и Сибирского региона, мы стали отрабатывать свои технологии, по возможности активно применяя опыт других библиотек. Одновременно развернули работы по всем направлениям деятельности в цепочке «документ-читатель»:

- комплектование – взаимодействие с отделами-фондодержателями и создание электронных копий документов (ЭКД);

- работа с СПА – описание ЭКД в электронном каталоге библиотеки;

- размещение в хранилище – создание системы хранения больших объемов электронной информации на серверах библиотеки;

- доступ к ЭКД – организация системы доступа пользователей библиотеки к электронным документам;

- учет документов;

- сохранность документов – организация системы архивирования и хранения ЭКД.

В настоящее время все процессы отработаны, нормативная база отражает их в полной мере и оцифровка редких, краеведческих документов идет в потоковом режиме. Необходимым условием  надежного функционирования электронных документов является организация качественной электронной среды, организуемой не базе программно-аппаратного комплекса библиотеки.

Оцифровка фондов документов начинается с планирования. Отдел оцифровки и микрографирования (ООиМ) сканирует около 60 тыс. страниц документов в год. Отделы-фондодержатели, в обязанность которых входят отбор, просмотр и подготовка документов к сканированию, подбирают документы на оцифровку в соответствующем объеме. В первую очередь на оцифровку отбирают документы из редкого краеведческого фонда, касающиеся Алтайского края, его истории, развития, образования, культуры, экономики, его вклада в развитие Сибирского региона. Партии документов передаются на оцифровку в ООиМ по акту приемки-передачи.

В отделе оцифровки и микрографирования установлено четыре компьютерные станции, к двум из которых подключено три сканера. Широкоформатный книжный сканер SMA-11, снабженный книжной колыбелью, позволяет оцифровывать документы размером до формата А1 включительно толщиной переплета до 25 см и весом до 50 кг. Планшетный сканер Epson Expression 10000+  используется для небольших книг и документов размером до формата А3. Сканер с микропленок Mikrofilm ScanPro1000 используется для оцифровки документов, размещенных на микропленках. В отделе четыре автоматизированных рабочих места: на двух компьютерах осуществляется оцифровка оригиналов и доработка полученных сканов в графических редакторах, на одном компьютере – создание многостраничного документа, формирование архивных и пользовательских копий, инвентарный учет ЭКД. Еще один компьютер занят под создание библиографической записи на ЭКД и размещение его в ЭБ АКУНБ. Таким образом, в отделе осуществляется полный цикл по созданию ЭКД:

- получение первоначальных цифровых изображений документа (сканов);

- обработка сканов;

- создание многостраничного документа;

- создание библиографической записи (БЗ) на ЭКД;

- учет ЭКД;

- хранение ЭКД.

Получение первоначальных цифровых изображений документа. Перед сканированием проверяется наличие ЭКД в ЭБ АКУНБ, чтобы не допустить повторной оцифровки документа. В зависимости от вида документа, его качества и требований к сохранности используется один из трех сканеров. Специализированное программное обеспечение (индивидуальное для каждого сканера) позволяет регулировать качество получаемого цифрового изображения (цвет, контраст, dpi, формат сохраняемого изображения и т.д.). Все документы сканируются с разрешением не ниже 300 dpi в формате TIFF (способ сжатия LZW, т.к. позволяет сжимать). Большинство книг сканируется в цветном режиме. Исключение делается в том случае, если на оцифровываемом объекте нет никакой значимой цветной информации, тогда используется ре-жим  «градации серого». Допускается сканирование документов в черно-белом режиме, если документ не принадлежит редкому фонду и содержит текст без иллюстраций на светлой бумаге с хорошо пропечатанными темными символами. Микропленки сканируются в черно-белом режиме с разрешением   300-600 dpi. Сканированию подлежат все части объекта: обложки (лицевая и тыльная стороны), титульный лист и его оборот, концевой титульный лист, вклейки и их оборотные стороны, пустые страницы, оборотные стороны открыток, фотографий и т.д.

Оцифровка редких книг имеет свои особенности. Переплетная крышка редкой книги сканируется вместе с корешком, на котором обычно располагаются значимые наклейки, надписи, тиснение. Если сканируемая книга напечатана на тонкой бумаге и имеет место эффект просвечивания обратной стороны страницы, то под сканируемые страницы подкладывается чистый лист бумаги. Документы сканируются постранично или в развороте. Тугой переплет, не позволяющий развернуть книгу или скрывающий внутренние поля страниц, требует сканирования книги в развороте, затем страницы «разрезаются» при дополнительной обработке. Слежавшиеся мятые страницы, жесткие заломы распрямляются небольшим увлажнением.

Микропленки перед сканированием обязательно перематываются и обеспыливаются. Мелкие ворсинки и пыль, попавшие на пленку, при хранении ухудшают качество цифрового изображения.

После сканирования происходит сверка файлов цифровых изображений страниц документа с оригиналом для проверки качества сканирования и отсутствия пропуска страниц. Если объект невозможно отсканировать целиком (большеформатные газеты, карты, чертежи, плакаты и т.д.), то документ сканируется частями с последующей доработкой («склейкой» частей) в графическом редакторе. В результате этого этапа получается набор файлов, каждый из которых содержит изображение страницы (или разворота страниц) оригинала от обложки до обложки в порядке следования их в документе.

Обработка первоначальных цифровых изображений. Полученные первоначальные цифровые изображения обрабатываются с помощью специальной программы Scan Tailor (tailor – портной). Это интерактивный инструмент для пост-обработки сканированных страниц. Он выполняет операции: разрезание страниц, компенсация наклона, добавление / удаление полей и другие, выдавая в результате страницы с заданными параметрами. Зачастую при работе с редкими книгами, книгами с серьезными дефектами, со сканами с микропленок необходима дополнительная обработка изображений в графическом редакторе. Например, сканы с микропленок иногда требуют усиления контурной резкости букв и четкости изображения; порой нужна цветокоррекция; особенно часто требуют доработки дефекты обложки издания, титульного листа, пятна и порывы на  страницах издания. Все это осуществляется с помощью графического редактора Adobe Photoshop.

В результате обработки первичных сканов мы получаем  архивную копию оцифрованного оригинала, которой присваивается уникальное имя.  Архивная копия представляет собой именной структурированный набор файлов единого размера, формата (как правило, TIFF) и разрешения (не ниже 300 dpi), что наиболее качественно отображает оригинал в электронном виде. Архивная копия представляет собой наиболее качественное изображение оригинала, занимает большой объем дискового пространства, подлежит тщательному хранению и является основой для получения многостраничной пользовательской копии документа.

Создание многостраничного документа. В нашей библиотеке используется два вида представления многостраничной электронной копии  документа: в формате PDF с помощью программы Abobe Acrobat и в формате DJVU с помощью программы DjVuSolo.

Изначально многостраничный документ мы создавали только в формате PDF. В использовании данного формата много положительных моментов – удобное программное профессиональное и пользовательское обеспечение,  широкие функциональные возможности по созданию и работе с готовым документом, привычный для многих читателей интерфейс.

Формат DJVU, при высоком качестве получаемого документа, занимает значительно меньше дискового пространства. В зависимости от вида сканируемого документа сокращение дискового объема файла по сравнению с форматом PDF происходит в 3-10 раз быстрее. Таким образом, формат DJVU позволят экономить дисковую память компьютеров, а также время передачи данных в локальной сети  библиотеки и  в сети Интернет.  

Полученная многостраничная ЭКД  именуется пользовательской копией документа. Ей присваивается имя, соответствующее архивной копии, и далее документ размещается в ЭБ АКУНБ.

Создание библиографической записи на ЭКД. Справочно-поисковый аппарат (СПА) – это тот инструмент, который позволяет пользователям максимально  полно ориентироваться как в фонде библиотеки, так и в ее электронных ресурсах.

Все ЭКД, как составная часть фонда ЭБ АКУНБ, подлежат обязательной каталогизации соответственно следующим условиям:

- библиографические записи на объекты каталогизации ЭБ являются частью единого электронного каталога АКУНБ;

- документы подлежат обработке в соответствии с международными и отечественными нормативами, действующими в сфере библиографического описания документов;

- процессы обработки производятся в автоматизированном режиме и доступны только в электронном виде.

- ЭКД описывается как самостоятельный электронный документ;

- в библиографическую запись обязательно вносится информация о местонахождении (адресе) электронного документа;

- в БЗ ЭКД обязательно вносится информация о наличии оригинала документа (место хранения, инвентарный номер), в БЗ оригинала документа добавляется пометка о наличии полного текста документа в ЭБ АКУНБ.

Весь электронный СПА в нашей библиотеке создается на базе автоматизированной информационной системы «Ирбис», включая и ЭБ АКУНБ. В АИС «Ирбис» встроена возможность доступа к полному тексту через библиографическую запись, а наличие Web-интерфейса позволяет организовать доступ к полнотекстовым ресурсам по сети Интернет.

После создания БЗ и занесения в нее ссылки на место хранения в ЭБ АКУНБ, электронная копия документа становится доступна читателям с любого компьютера, включенного в локальную сеть библиотеки.

Учет ЭКД. Единицей учета ЭКД являются название, адрес документа и объем занимаемой дисковой памяти (адрес документа – набор имен взаимосвязанных файлов, каталога файлов, сетевого / локального устройства, доступный пользователям посредством командного языка операционной системы компьютера; объем занимаемой дисковой памяти – «размер файла», количество мегабайт, занимаемое ЭКД). Отдел комплектования ведет суммарный безынвентарный учет ЭКД в книге суммарного учета. Отдел оцифровки и микрографирования ведет индивидуальный инвентарный учет ЭКД.

После оцифровки оригинала создаются «пользовательская» и «архивная» копии, которые являются объектами постоянного хранения и учета в ЭБ АКУНБ. Каждому электронному документу присваиваются персональные шифр и инвентарный номер, которые однозначно определяют созданный электронный документ. Подробная информация о самом документе (БЗ, форматы копий, dpi, размеры страниц, объемы файлов, количество страниц в документе) и его размещении в электронном хранилище ЭБ АКУНБ  заносится в соответствующие журналы учета.

За два года работы отдела фонд ЭКД содержит более 1170 документов, общим объемом около 100 тыс. страниц; объем пользовательских копий составляет 20 Гб, объем архивных копий – 792,4 Гб.

Хранение ЭКД. Объектами хранения фонда ЭКД являются пользовательские и архивные копии электронных документов. Пользовательские копии предназначены для предоставления документов пользователям библиотеки, архивный фонд предназначен для долговременного хранения ЭД, восстановления пользовательских копий при утрате, на случай непредвиденных обстоятельств (смена форматов, программного обеспечения, аппаратных платформ и т.д.).

Пользовательские и архивные копии ЭД на физическом уровне представляют собой специальным образом организованный и упорядоченный набор файлов, которые входят в систему каталогов и подкаталогов, размещенных на серверах библиотеки. Их сохранность обеспечивается программно-аппаратными средствами, за надежное функционирование которых несет ответственность отдел автоматизации.

Дополнительно архивные копии ЭД дублируются на компакт-дисках в двух экземплярах, что позволяет обеспечить сохранность документов в случае потери данных на серверах АКУНБ.

Доступ к ЭКД осуществляется с помощью АИС «Ирбис» в  локальной сети библиотеки. Отдел автоматизации библиотеки ведет активную работу по организации доступа к ресурсам ЭБ АКУНБ через сайт библиотеки.

Качество создаваемых электронных документов позволяет Алтайской краевой библиотеке участвовать в корпоративной работе по обмену электронными ресурсами с другими библиотеками России и Сибири. С 2010 г. мы работаем с ФГУ «Президентская библиотека им. Б. Н. Ельцина», в которую передали 60 электронных копий документов объемом более 19  тыс. страниц. В 2011 г. заканчивается реализация проекта четырех областных библиотек Сибири «Электронная Сибирь». Наша библиотека уже передала  103 документа общим объемом более 37 тыс. страниц и планирует добавить еще 57 документов объемом более 15 тыс. страниц.

В наше непростое время библиотеки сохранили свою миссию собирателей и хранителей знаний, а благодаря электронной среде они стали ближе и доступнее своим пользователям.

 

Комментировать

Copyright 2012-207.
^ Наверх