Консервирование скоропортящихся продуктов

(Март 2002)

О попытках решения крайне нетривиальной проблемы – как обеспечить долгосрочное хранение информации в цифровую эпоху.

«Капсула времени», заложенная в 2000 г. в Нью-Йоркском музее естественной истории и среди прочего содержащая диск HD-Rosetta

 

Повальная  компьютеризация нашей жизни и тотальный перевод в цифровую форму всего, что поддается оцифровке, — эти человеческие порывы становятся, похоже, наиболее характерной особенностью эпохи высоких технологий. Причем предпринимаются такого рода шаги (как правило) весьма торопливо, беспорядочно и спонтанно, без критического осмысления уже накопленного опыта и тщательных оценок возможных будущих последствий.

К счастью, вынесенная в скобки ремарка чрезвычайно важна,  поскольку ныне «правила» начинают понемногу изменяться, и все больше людей проникаются важностью идеи обеспечения долговечного хранения оцифрованной информации.

Так, в Великобритании первая неделя весны (2002 г) ознаменовалась рождением межведомственной «Коалиции цифровой сохранности» или кратко DPC (Digital Preservation Coalition) — первой общенациональной организации, поставившей перед собой цель «обеспечить, чтобы порождаемая нами цифровая информация не утрачивалась для нынешнего и будущих поколений».

Среди главных организаторов Коалиции можно упомянуть государственный архив страны Public Record Office (PRO), Британскую библиотеку, Лондонский университет и Объединенный комитет по информационным системам образовательных учреждений (JISC). А одним из важнейших побудительных стимулов к созданию DPC стал фактический крах крупномасштабного мультимедийно-компьютерного проекта 16-летней давности под названием «BBC Domesday Project».

В 1986 году по инициативе Би-Би-Си весьма оригинальным образом было отмечено 900-летие знаменитого документа  «Domesday Book» — многотомного свода результатов первой всеанглийской переписи населения, проведенной в XI веке по указу Вильгельма Завоевателя.

В народе этот труд быстро получил название «Книга Судного дня», по аналогии со всеведающей книгой из библейского пророчества, а спустя девять веков было решено изготовить высокотехнологичную версию подобного документа — пару интерактивных видео-дисков с разнообразнейшей информацией о жизни британцев в конце XX века.

В грандиозный мультимедийный проект было вложено более 2,5 млн фунтов стерлингов, на два 12-дюймовых лазерных диска были уложены данные о 250 тысячах мест в Британии, 25 тысяч карт, 50 тысяч рисунков и фотографий, 3 тысячи таблиц, 60 минут видеороликов и никем не подсчитанное количество слов текста.

В информационном наполнении уникального документа в общей сложности приняло участие около миллиона взрослых и детей, а на полный просмотр всей информации одним человеком потребовалось бы около 7 лет.

Главная же беда оказалась в том, что для работы с дисками был создан специальный микрокомпьютер Acorn BBC Master (www.heimcomputer.de/english/comp/acornmaster.html) стоимостью около 5 тысяч фунтов стерлингов.  Заказов на  такие машины поступило всего несколько десятков, и на сегодняшний день работоспособных аппаратов практически не осталось.

Попросту же говоря, потертые и местами поцарапанные лазерные диски 15-летней давности сегодня не на чем прочесть, а гигантский свод интереснейшей для потомков информации находится  под угрозой полного исчезновения.

Дабы ирония ситуации стала особо понятна, следует упомянуть, что почти тысячелетней давности оригинал «Книги Судного дня» по сию пору хранится в ахиве Public Record Office в прекрасном состоянии и доступен для ознакомления. Поэтому участники коалиции DPC в качестве первой реальной задачи избрали спасение проекта «BBC Domesday», попутно пытаясь достичь и главной цели — выработать единую систему эмуляции сохраняемых данных в независимости от формата их упаковки.

Благо проблема эта уже приобрела для всех развитых стран массовый и кризисный характер. Один из ярчайших тому примеров — получившая прошлым летом огласку история с данными космических зондов НАСА.

В 1999 году нейробиолог Джозеф Миллер запросил в космическом агентстве данные о марсианских пробах, доставленные кораблем Viking в середине 1970-х. После небыстрых поисков в НАСА нашли нужные магнитные ленты с информацией, однако вот прочесть формат 25-летней давности оказалось никак невозможно, поскольку занимавшиеся обработкой программисты уже все померли, а техдокументации не сохранилось. Единственное, что помогло восстановить хотя бы часть утраченной информации, — отрывочные распечатки на бумагу.

Массивы ценной информации и без того всегда были подвержены угрозам пропажи из-за достаточно быстрого износа  и физического распада магнитного слоя на носителях. Множество же стремительно  устаревающих форматов нередко приводит ученых в состояние, близкое к отчаянию.

Восьми- и пятидюймовые компьютерные диски, видеокассеты Betamax, восьмидорожечные магнитофонные кассеты — список выходящих из употребления устройств хранения растет с каждым годом, но еще быстрее растут горы недоступной и грозящей полным исчезновением информации, накапливавшейся нередко с большим трудом. И несмотря на все предпринимавшиеся усилия, по признанию экспертов, до сегодняшнего дня никому так и не удалось продемонстрировать достаточно  жизнеспособное решение этой острейшей проблемы.

Есть, правда, весьма своеобразное, хотя и крайне недешевое решение задачи долгосрочного (и даже сверхдолгосрочного) хранения ценных документов, предложенное американской  фирмой Norsam Technologies (www.norsam.com).

rosetta1

Эта компания была создана в 1995 году для коммерциализации разработанных в LANL, Лос-Аламосской национальной лаборатории, технологий на основе сфокусированного ионного луча.  Наиболее известной, наверное, продукцией, создаваемой в стенах Norsam, стали так называемые диски и пластины  HD-Rosetta (от High Density). На никелевой пластине площадью менее 2 квадратных дюймов автоматизированные комплексы Norsam методом микрогравировки  способны размещать  порядка 200 тысяч страниц формата A4.

Страницы документов, полученные от заказчика в цифровом виде или отсканированные непосредственно в Norsam, уменьшаются до микронного размера и «попиксельно» переносятся на никелевую пластину FIB-машиной (от Focused Ion Beam).

Внутри FIB-аппарата пучок ионов галлия фокусируется на поверхности пластины, так что эти ионы с хирургической точностью выбивают из нужных мест атомы металла, по сути дела выполняя микрогравировку текста или изображения. Размер пикселя при такой технологии составляет около 100 нанометров, а химические присадки к ионам луча позволяют гравировать не только монохромные, но и цветные иллюстрации.

rosetta-disk1
Cхема расположения информации на реальном диске Rosettа, хранящем образцы письменности народов мира

 

Избранные в качестве носителя информации никелевые пластины обеспечивают не только высочайшую стойкость к воздействиям электромагнитных излучений, повышенной влажности, соленой воды или температурных колебаний вплоть до 500 градусов по Цельсию, но и гарантированный срок хранения информации продолжительностью в несколько тысяч лет.

Важная особенность технологии HD-Rosetta — это по сути дела «аналоговое» сохранение документов, делающее их абсолютно независимыми от любой компьютерной платформы и доступными для ознакомления с помощью всякого достаточно  мощного микроскопа.

С одной стороны, конечно же, платформонезависимость носителя информации — это важнейший плюс. Но здесь же, понятное дело, заключается и существенный минус технологии, поскольку архивация музыки или тем паче видеоинформации на пластинах HD-Rosetta пока не предусмотрена.

Строго говоря, это вовсе нельзя называть недостатком технологии, поскольку при подобной плотности записи пикселей на ту же самую небольшую площадь пластины можно без проблем уложить и полторы сотни гигабайт цифровых данных. Просто не придумано пока такого формата, который гарантированно был бы декодирован нашими потомками хотя бы в следующем веке, не говоря уже о тысячелетиях.

И на помощь тут может прийти довольно экзотический пока еще раздел научно-инженерных исследований, получивший название «антикриптография».  Под этим термином с некоторых пор стали подразумевать общую методику изготовления документов и посланий, имеющих встроенные в свое тело ключи к тому, каким образом их надлежит декодировать.

Достаточно подробную информацию об истории возникновения, целях и задачах этой новой дисциплины можно найти в одноименном материале. Здесь же лишь процитируем пояснения из статьи «Антикриптография — очередной рубеж в компьютерной науке», опубликованной одним из пионеров данной области, американским программистом-разработчиком Брайеном Макконнелом.

По его словам, цели антикриптографии — это поиск таких методов наиболее эффективной компрессии информацию, которые (а) обладают наименьшей избыточностью, т.е. несут максимум полезных данных, (б) одновременно содержат исчерпывающие подсказки относительно того, как послание декодировать получателю, изначально не имеющему ни малейшего представления о содержимом.

Здесь пора пояснить, что Макконнел — активист международно движения  SETI, занимающегося  поисками в космосе сигналов от внеземного разума, а попутно и разработкой кодов, потенциально понятных для инопланетян. Но по мере углубления в задачи антикриптографии исследователям SETI стало очевидно, что у этой дисциплины имеется и множество вполне конкретных земных областей применения.

Например, при опоре на антикриптографические принципы становится возможным создать систему, которая в Интеренете снимет необходимость в загрузке специальных программ для просмотра скомпрессированной графики или видеофайлов.

Трюк заключается в том, чтобы перемежать данные, описывающие картинку, с алгоритмом (или командами) для преобразования данных в визуально воспринимаемый образ. При подобном сценарии компьютер пользователя автоматически обучается тому, как обрабатывать и выводить на дисплей любой новый тип кодирования графики.

Понятно, что опираясь на эти же принципы можно будет создавать архивы долгосрочного хранения или закладывать в специальные контейнеры («капсулы времени»)  информативные послания для наших потомков. И уже не беспокоиться при этом, что формат данных окажется безнадежно устаревшим или безвозвратно утерянным…

# # #

%d такие блоггеры, как: