Торренты спасут культуру

15.05.2018

Поговорим о том, как свободное программное обеспечение может помочь сохранить культурное наследие в цифровом виде.

Недавно посетил семинар на тему сохранения электронной информации. Мероприятие для библиотек, архивов и т.п., то есть вопрос рассматривался с гуманитарной точки зрения.

Первым шел доклад человека с длинными регалиями. Он и председатель тематической программы ЮНЕСКО, и президент Межрегионального центра библиотечного сотрудничества, и председатель Межправительственного совета. Видимо человек «с большими знаниями своей темы». Звать Кузьмин Евгений Иванович.

Тема доклада: Синдром цифровой амнезии. Кратко суть: надо не только книжки сохранять, но и цифровую информацию, а это сложно и чуть-ли невозможно. Приводятся разные мысли и доводы, и люди даже им верят. Но был там и технарь в виде меня. И мне было странно слышать многие вещи.

Проблемы насущные

Среди затронутых автором проблематик, есть следующие:

  • электронная информация записана на различные платформы и носители. Носители устаревают. И возможно мы через какое-то время не сможем прочитать информацию со старых носителей, ввиду отсутствия «ретро» технических средств.
  • проблема совместимости нового ПО со старым
  • необходимость резервного копирования
  • нет систем обмена данными между разными местами хранения (библиотеками, фондами и т.п.)

Отдельно автор выразил мысль, что открытое ПО плохо в данном случае. Так как есть примеры того, как на основе СПО спецы единолично писали свои каталоги, базы и т.д., а потом уходили и не поддерживали проекты.

СПО спасет мир

Послушал докладчика, и понял, что он не шарит. Возмутила глупость про СПО, ведь автор привел пример, когда на открытом ПО делают по сути закрытое. Использование проприетарное ПО в этом случае не решит проблему — что делать, если изготовитель продукта прекратить поддержку, или попадёт под санкции?

С другой стороны, хорошее открытое ПО поддерживается множеством специалистов, коды доступны всем. И именно в мире СПО есть готовые решения озвученных выше проблем.

Торренты

Да, этим самые пиратские гадкие торренты. Точнее децентрализованные системы на базе этой технологии.

Хранитель информации выкладывает её. Желающие подключаются, получают копию себе. При отключении любого узла информация может быть получена с остальных. 

Решается несколько проблем: резервное копирование на множестве устройств, обмен между организациями — хранителями между собой и с пользователями, плюс гетерогенная среда.

Немного о последнем. По мере морального устаревания одних носителей их безболезненно заменяют более технологичные родственники. Pear-to-pear сети позволяют сохранять информацию по сути в гетерогенной среде. У одного пользователя файлы конкретной раздачи могут лежать на флешке, у другого на CD диске в дисководе (извращение какое), у другого на HDD, а у Васи вообще на смартфоне.

Распределенные системы по типу Git

Кратко с точки зрения чайника. Суть работы системы управления версиями Git:

  • есть репозитории где хранится коды программы, на сервере.
  • автор правит код у себя, хранит в локальном репозитирии и отправляет версию в репозиторий на сервере
  • возможна совместная работа
  • другие пользователи могут клонировать репозитории к себе, получать изменения и т.п.

В таком виде можно хранить любую информацию. Создать сервер для репозиториев. Каждый хранитель электронной информации (архив, библиотека), хранить данные в своем репозитории. Другие могут клонировать по необходимости себе.

В итоге и обмен, и контроль, и резервное копирование (свои мощности, репозиторий на сервере, клоны на мощностях других участников).

И подобные реализации уже есть, например, в свое время немецкое правительство выложило все законы на гитхаб — крупнейший веб-сервис для хостинга IT-проектов и их совместной разработки.

Открытые форматы

Но как решить проблему совместимости различных программ и форматов? Легко — хранить данные в открытых форматах. Чем они отличаются от «закрытых»? Тем, что разработкой таких форматов занимается обычно некоммерческие организации, и на их использование не накладывается ограничений, лицензий и т.п. Немного википедии:

Главная цель открытых форматов — гарантировать возможность доступа к данным в течение долгого времени безо всякой оглядки на лицензионные права и технические спецификации. Другая цель — активизировать конкуренцию вместо того, чтобы позволять компании — автору проприетарного формата препятствовать конкурирующим продуктам. В последние годы правительственные организации многих стран проявляют всё больший интерес к открытым форматам.
Wiki: Открытый формат

Проблемы внедрения

У выше представленных решений есть две проблемы для внедрения. Точнее проблемы не у самих решений, а у тех, для кого они предлагаются.

Во-первых, внедрение требует наличие технических специалистов, а также определенной воли участников процесса. Не всегда у библиотек и архивов есть оба эти «компонента».

Во-вторых, точкой преткновения может стать нежелание участников процесса делиться. Ведь каждый хочет хранить данные, будь-то редкие книги, экспонаты, электронные издания у себя. Каждый хочет быть единственной «точкой входа». Почему? Да потому, что многим учреждениям, в качестве отчетного индикатора, свыше спущены цифры по посещаемости. Тут всплывает отдельная тема — спущенная сверху установка работать не на качество и результат, а на цифры.

Плюс проблема с авторскими правами.

Вот такие мысли по поводу спасения нас от цифровой амнезии.

Делитесь информацией, используйте открытые технологии её хранения, и она не потеряется.