«Электронекрасовка»: как сделать крутой проект по оцифровке библиотечных материалов
Оцифровка собственных фондов становится обычной работой для все большего числа библиотек по всему миру. Это позволяет не только сохранить уникальные материалы, но и сделать их доступным широкой публике.
Так, московская библиотека им. Н.А. Некрасова с 2017 года реализует масштабный проект «Электронекрасовка». Издания 1564–2017 годов — книги, журналы, газеты, открытки и многое другое, чем богаты библиотечные фонды, — в постоянном режиме сканируются и выкладываются в открытый доступ. На данный момент на сайте electro.nekrasovka.ru опубликовано порядка 60 тысяч единиц книжных и некнижных коллекций библиотеки.
Какие материалы попадают под оцифровку в первую очередь, как выглядит процесс сканирования и что ждет «Электронекрасовку» в дальнейшем — поговорили об этом с куратором проекта Ильей Старковым.
— Илья, расскажите о своей работе, как вы стали участником проекта оцифровки библиотечных материалов?
— По образованию я «специалист по информационным системам», что отчасти подразумевает работу с репрезентацией массивов данных. Именно репрезентацией и популяризацией оцифрованных архивов я с коллегами занимаюсь в московской Библиотеке им. Н.А. Некрасова, где курирую проект «Электронекрасовка».
Прежде я работал над личным исследовательским проектом «Тогда», где собрано много всего интересного про 1920–1930-е годы в СССР: про русский авангард, конструктивизм, архитектуру, новый быт и всю нашу культуру в целом в этот период. Это и стало поводом для знакомства с Некрасовкой, у которой уникальные фонды редких книг, периодики и малой графики.
— Как появилась идея запустить проект по оцифровке?
— Во-первых, есть госзаказ на оцифровку редких фондов, и, во-вторых, это наше желание поделиться редкими книжными и некнижными коллекциями из нашего хранения. Например, у нас хранится более 250 тысяч единиц малой графики — это коллекции открыток, спичечных этикеток, промграфики, фотографий, плакатов, экслибрисов. Все это постепенно появится на сайте.
Также у нас богатая коллекция периодики начала XX века, включая журналы про кино, театр, искусство, юмор и сатиру, журналы русского авангарда.
Библиотека уже несколько лет планомерно занимается оцифровкой своих и партнерских фондов. Книжные памятники, старые и редкие издания, периодика — все это станет доступно. Нашей команде и мне лично кажется важным делиться в свободном доступе изданиями, которые раньше были недоступны. Это прямая функция библиотек — быть на пересечении знаний и интересов.
— Как происходит отбор материалов для оцифровки, что в приоритете?
— В первую очередь оцифровываются «книжные памятники», то есть издания, имеющие особое историческое, научное, культурное значение. Это конкретный общероссийский список книг. На данный момент у нас оцифровано и размещено на сайте 150 книжных памятников. Среди них — трактат Джакомо Виньолы «Правило пяти ордеров», изданный в 1564 году, это наше старейшее издание; «Псалтирь» Мартина Лютера 1610 года; один из первых российских журналов «Вечерняя заря» 1782 года. В общем, настоящий книжный клад.
Дальше в списке приоритетов редкие и старинные книги, газеты и журналы, которые не имеют ограничений по авторскому праву, то есть находятся в общественном достоянии.
Важна также актуальность сканируемых изданий. Например, к 100-летию ВХУТЕМАСа мы публиковали книги и журналы, имеющие отношение к художественным мастерским. В 2021 году 100-летие НЭПа, у нас на сайте опубликованы журналы 1920-х годов, а также большие коллекции табачных, кондитерских и парфюмерных этикеток этого времени.
— Как происходит процесс оцифровки, насколько это трудозатратно?
— Был создан Сектор развития электронной библиотеки, в рамках которого и происходит вся оцифровка. У нас есть два больших планетарных сканера, позволяющих сканировать издания до А2 формата в хорошем разрешении.
Сам процесс выглядит достаточно просто: в начале года создаются списки на оцифровку, после получения книг из фондов они сканируются и передаются на распознание. Большая часть публикуемых книг имеет текстовый слой, то есть полное распознание. После этого издания публикуются на сайте «Электронекрасовка», читатели с помощью поисковика могут искать по его содержанию. Всего в отделе оцифровки работает семь человек.
Сайт состоит из шести разделов. В «Каталоге» публикуются все издания. В «Изотеке» можно найти некнижные коллекции. В «Периодику» вынесены все периодические издания с разбивкой по темам, годам и месяцам. В разделе «Подборки» собраны тематические полки, в «Лектории» — лекции и подкасты вокруг наших фондов, а в «Журнале» — статьи и медийные форматы.
— С какими сложностям вы сталкиваетесь в процессе своей работы?
— Самым сложным моментом, наверное, является распознание. К сожалению, не все издания дошли до наших дней в хорошем состоянии, где-то бумага уже истлела, где-то печать плохая. Мы даже создали собственную нейросеть, которую обучили на примерах наших сканов.
— Как вы продвигаете проект «Электронекрасовка»?
— В момент запуска проекта нам хотелось найти свой язык общения с нашими читателями, поэтому вокруг оцифрованных фондов, которые являются доминантой проекта, мы запустили небольшое культурологическое медиа. В формате лекций, игр, тестов, подкастов, статей мы не только популяризируем наши фонды, но и показываем как их могут использовать не профессиональные исследователи.
Например, одни и те же периодические издания Серебряного века могут лечь в основу литературного подкаста или цикла статей, а могут рассказать про художников эпохи, которые оформляли эти журналы. Так у нас появился проект «Азбука книжного модерна», в котором мы показываем книжную и журнальную иллюстрацию и дизайн начала XX века, когда иллюстрация приобретала такое же — а зачастую большее — значение, как и сам текст.
— Вы работаете над увеличением своей аудитории?
— Да, мы постоянно стараемся расширять порог вхождения к нашим изданиям. Для этого экспериментируем с современными и уже привычными в нашей повседневности медийными форматами. Тут, наверное, не обойтись без примеров. У нас оцифрована книга «Домашний быт русских цариц XVI и XVII столетий», изданная в 1872 году, издание важное и интересное, но петровская орфография и вязкое изложение делают сложной книгу для массового читателя. Мы переработали часть книги и сделали игру «Кабы я была царица», где читатель может, нажав на одну из карточек, узнать, что нужно было сделать монаршей особе, чтобы встретиться с подругами, повеселиться или сходить в театр. Это ни в коем случае не подмена книги, это такой трейлер, чтобы заинтересовать почитать большое историческое издание.
— Как вы планируете развивать проект в дальнейшем?
— Цели достаточно простые: оцифровать еще больше изданий, сделать сайт более удобным, записывать новые подкасты, делать выставки, организовывать лекции и рассказывать об этом нашим читателям.
Проектов, подобных «Электронекрасовке» становится все больше, что очень радует. Так, нынешней осенью Научная библиотека Томского госуниверситета представила цифровую площадку, где можно получить доступ к собранию периодических изданий, рукописей, материалов исследовательских экспедиций, архивам ученых и другим ресурсам. В проекте по оцифровке активно участвуют волонтеры, и сейчас присоединиться к проекту может любой желающий.
Текст: Татьяна Орлова
Подписывайтесь на наш телеграм-канал «Томский Обзор».