(Январь 2001)
Наступает эпоха ГКГ
Уже весьма скоро конструкторы и врачи смогут манипулировать подвижными трехмерными изображениями, свободно висящими перед ними в воздухе, а не на экранах компьютеров.
Так, во всяком случае, утверждают инженеры-разработчики из DERA (Defence Evaluation and Research Agency ), крупнейшего в Западной Европе научно-исследовательского центра, ныне принадлежащего Министерству обороны Великобритании, а в ближайшем будущем ожидающего приватизации.
По словам разработчиков DERA, работающих над созданием голографической рабочей станции, автомобильные дизайнеры получат возможность формировать кузов машины голосом и легкими касаниями пера к модели, тут же наблюдая, как та или иная идея будет выглядеть в натуре.
Хирурги смогут вращать объемные картины результатов сканирования мозга, чтобы выявить повреждения, военные получат новые дисплеи для представления тактической информации, ну а в целом принципиально нового уровня программы визуализации и симуляторы появятся в самых разных областях.
Потребность в более эффективных способах восприятия сложной, генерируемой компьютером информации ощущается постоянно. Человек живет и взаимодействует в трехмерном мире, однако подавляющее большинство компьютерных дисплеев пока что двумерны и в лучшем случае могут выстраивать качественные проекции объемных предметов на плоскости. При этом многочисленные и разнообразные исследования показывают, что люди воспринимают информацию значительно быстрее и эффективнее, если она представлена в действительно трехмерной форме.
Ныне существуют и совершенствуются несколько подходов, которые можно использовать для визуальной подачи трехмерных объектов. Примерами являются стереодисплеи, автостерео-системы, интегральная фотография, стереограммы и голография. Однако лишь последний в этом списке метод обеспечивает генерацию реального 3-мерного объекта, доступного для пользователя в виде, обеспечивающем всю психологическую и физиологическую глубину восприятия объемного предмета.
В отличие от других технологий генерации изображения, голография не требует от человека надевать какой-нибудь шлем или специальные очки, чтобы воспринимать образы. Картина может быть доступна для обозрения группе пользователей, смотрящих под разными углами, а длительное использование технологии не приводит к неприятным и болезненным эффектам.
По этим причинам голографию принято считать конечной целью в разработке трехмерных дисплеев. Но к сожалению, эта технология является и наиболее сложной для эффективного практического воплощения, так что на рынке пока что нет такого рода устройств для работы в условиях реальных интерактивных приложений.
В недалеком будущем, однако, ситуация в данной области должна существенно измениться. Агентство DERA, работая в рамках совместного предприятия с автомобильным гигантом Ford Motor, примерно к 2003 году планирует выпустить на рынок первые продукты на основе «генерируемой компьютером голографии» или ГКГ (computer generated holography, CGH).
Как говорит Крис Слингер (Chris Slinger), глава голографического подразделения DERA (г.Малверн, Ворчестершир), уже сейчас они могут создавать плавающие в 3-мерном пространстве реальные изображения, которыми пользователи манипулируют, используя инструментарий, отчасти существующий в виде реальных, а отчасти — в виде виртуальных инструментов. По оценкам Слингера, это не похоже ни на что из всего, применявшегося прежде.
Голография обычная и компьютерная
ГКГ функционирует на основе тех же самых базовых принципов голографии, что были изобретены венгро-британским физиком Деннисом Габором в конце 1940-х годов. Габор работал над усовершенствованием электронного микроскопа и предложил регистрировать информацию не только об амплитудах волн (как в обычной фотографии), но и об их фазах. В результате был создан способ записи и восстановления волнового поля, основанный на фиксации интерференционной картины, образованной волной, отраженной снимаемым объектом, и когерентной с ней волной, идущей непосредственно от источника света (опорная волна). Зарегистрированную на фотопластинке интерференционную картину стали называть голограммой.
При воспроизведении, когда свет опорной волны падает на голограмму, он дифрагирует, формируя серии волн. В результате интерференции этих волн порождается волновой фронт, который воспроизводит ту же самую картину, что и при рассеивании света исходным объектом. Подлинный расцвет голографических технологий пришелся на 60-е годы — благодаря появлению лазеров, применяемых в качестве источника когерентного света.
Однако генерируемая компьютером голография появилась на свет значительно позже, лишь на рубеже 1980-х годов, когда для ее развития появились соответствующие технологические предпосылки. В отличие от класических голограмм, в ГКГ от объекта, используемого для формирования голографического образа, не требуется «физическое наличие», а необходимо лишь существование в виде математического описания.
Другими словами, помимо воспроизведения образов реальных объектов, система ГКГ позволяет порождать и 3-мерные образы объектов воображаемых. Здесь физическая интерференция световых волн заменяется вычислительной фазой, на которой компьютер с помощью расчетов определяет картину распределения интенсивностей света для ГКГ-изображения.
Если же требуется иметь видоизменяемый образ, то пересчитываемую картинку можно записывать в специальное реконфигурируемое устройство, способное модулировать световую волну. Такие устройства называют «пространственными световыми модуляторами» или ПСМ (spatial light modulator, SLM).
В настоящее время существуют различные варианты ПСМ, реализованные на основе жидкокристаллических, акусто-оптических и микромашинных устройств.
ГКГ — это на сегодняшний день единственная технология, способная создавать 3-мерные синтетические образы, в полной мере обладающие свойствами визуальной глубины. Но одна из самых больших сложностей, стоящих на пути широкого распространения реконфигурируемой ГКГ — это гигантское количество информации, которое ГКГ-устройство должно перерабатывать.
Основная проблема всех ранее генерировавшихся компьютером голограмм состояла в том, что они не могли воспроизводить достаточное количество пикселей, чтобы создавать изображения полезного на практике размера. По словам Стивена Бентона, одного из наиболее авторитетных специалистов в данной области, для генерации сколь-нибудь полезной 3D-картинки требуется порядка пяти миллиардов пикселей.
Так что процесс генерации очень быстро упирается в гигабайтные объемы данных лишь для одного изображения, которые необходимо быстро обсчитывать, хранить и воспроизводить. Все эти операции требуют поистине колоссальных ресурсов.
Однако последние годы ознаменовались существенными достижениями в разработке новых ГКГ-алгоритмов и пространственных световых модуляторов, а также в вычислительной технике в целом, что все же сделало возможной генерацию реконфигурируемых, высококачественных трехмерных изображений со скоростями, требуемыми в интерактивной работе.
Поколения ГКГ-алгоритмов
Двадцатилетняя история компьютерной голографии насчитывает уже несколько поколений алгоритмов, обеспечивающих генерацию изображений с помощью вычисления интерференционной картины для ГКГ-дисплея.
Первое поколение — это алгоритмы вычисления ГКГ на основе быстрого преобразования Фурье. Обычно такого рода алгоритмы легко реализуются, но вычислительно неэффективны. Еще более важное ограничение — здесь крайне сложно генерировать «несветящиеся» участки изображения, т.е. тени, оттенки и прочие детали сложных поверхностей. Другими словами, применимость подобных алгоритмов в реальных приложениях весьма проблематична.
Второе поколение — интерференционные алгоритмы. Здесь весьма близко имитируется распространение света при традиционной голографической записи, так что в итоге удается генерировать трехмерные изображения весьма высокого качества. Однако гигантские объемы вычислений по сию пору вызывают серьезные сомнения, что алгоритмы этого поколения в обозримом будущем удастся эффективно реализовать в реальных интерактивных приложениях.
Третье поколение — дифракционные алгоритмы. Это наиболее свежая разработка, впервые предложенная около пяти лет назад в Массачусетском технологическом институте. Сила этих алгоритмов в эффективном балансировании между качеством изображения и скоростью вычислений. В частности, здесь можно вычислять ГКГ с относительно низким разрешением, более подходящим для человеческого глаза, нежели с чрезмерным разрешением, свойственным обычным ГКГ. Еще одно достоинство — относительно простые операции пересчета, которые хорошо укладываются под методы аппаратного ускорения.
Активный мозаичный модулятор DERA
На основе ГКГ-алгоритмов третьего поколения несколько групп в разных исследовательских центрах мира разрабатывают различные подходы к построению высокой сложности пространственно-световых модуляторов (ПСМ), которые имели бы достаточно большое количество пикселей, чтобы генерировать полезные в реальных приложениях изображения.
Среди наиболее примечательных разработок обычно называют американскую «холовидео-систему» Стива Бентона, разработанную в МТИ на основе комбинирования акусто-оптических модуляторов и механических сканеров, а также распараллеленную жидкокристаллическую ПСМ-систему японского консорциума TAO. Однако, при количестве пикселей порядка 35 миллионов обе эти конструкции уже не могут обеспечить практичное использование в реальной ГКГ-системе.
С другой стороны, в последние годы ученые британского агентства DERA Ч. Браун и М. Стенли (C.V. Brown, M. Stanley) разработали фундаментально новый подход, получивший название «активный мозаичный модулятор» (active tiling modulator).
Как показывают расчеты и эксперименты, с помощью этой технологии вполне достижимы необходимые объемы пикселей и скорости модуляции, необходимые в практических приложениях. В системе удачно скомбинированы уже известные преимущества электрически-адресуемых и оптически-адресуемых ПСМ, что позволяет обеспечить оптимальную по времени и пространству полосу пропускания.
Для генерации гигантского количества пикселей, формирующих голограмму, здесь используются ферроэлектрические жидкие кристаллы. На базе активного мозаичного модулятора в DERA разработана самостоятельная технология создания голографических дисплеев. Система имеет модульную конструкцию и может масштабироваться до больших или меньших размеров, требуемых для конкретных изображений.
Как признают ученые, в настоящее время активный мозаичный модулятор еще нельзя считать полностью завершенным продуктом, и работы над его совершенствованием продолжаются. Продемонстрировано эффективное функционирование рабочих каналов и хорошая масштабируемость системы, однако критично важный порог в миллиард пикселей пока что не достигнут. По мнению разработчиков, для полного завершения проекта потребуется еще года три.
Голографический АРМ
Одновременно с доведением до товарного вида голографического дисплея, полным ходом идет и комплексная работа по созданию трехмерной рабочей станции на основе принципа, получившего название «подмена реальности». Эту работу совместно осуществляют DERA и «Студия цифрового дизайна» (Digital Design Studio, DDS) из Глазго при финансовой поддержке компании Ford Motor.
За термином «подмена реальности» стоит идея широкого применения всех тех естественных и интуитивных методов, которые мы используем при взаимодействии с настоящими моделями, но при этом делается упор на всестороннее улучшение и развитие этих приемов с помощью уникальных возможностей цифровых систем. Среди наиболее существенных черт такого подхода выделяют следующие:
- Сконцентрированные на возможностях и предпочтениях человека конструктивные решения;
- Возможности одновременного доступа к модели для множества людей;
- Создание высококачественных трехмерных моделей, манипулирование и взаимодействие с которыми возможно в реальном времени с помощью жестов и прикосновений;
- Возможность использования «ручных инструментов» как альтернативы точным геометрическим методам;
- Возможность самостоятельного обустройства среды пользователя;
- Возможности продвинутого вспомогательного инструментария, типа «сглаживания» кривых и поверхностей с помощью голоса.
Все эти особенности порождают потребность в рабочей станции, где трехмерный голографический дисплей сочетается с технологиями взаимодействия на основе жестикуляции, осязания и голоса. Успешная интеграция всех этих инструментов обеспечивает платформу, на которой создаются совершенно новые типы интерфейсов для общения с компьютером и работы с изображениями.
По сути дела, отпадает необходимость работы с цифровыми моделями в строго геометрических понятиях, поскольку создается более «человеческая» альтернатива для взаимодействия с компьютером: менее сжестко структурированная и более спонтанная. Кроме того, трехмерная голографическая модель позволяет одновременно работать с нею множеству пользователей, как специалистов так и неспециалистов, что открывает совершенно новые возможности для обсуждения в процессах конструирования и производства.
Студия DDS отвечает за функциональную концепцию развития данного продукта в целом, включая общий эстетический вид и интеграцию технологий интерактивного взаимодействия с компьютером, таких как осязательные устройства, интерфейсы жестов, трехмерный звук и разработка программных приложений. Агентстве DERA, со своей стороны, обеспечивает решение всех задач вокруг ядра системы: аппаратное обеспечение собственного трехмерного голографического дисплея и разработка для него эффективных компьютерных алгоритмов.
Еще один участник разработки, компания Ford, сотрудничает с DERA в области исследований технологии интерактивной трехмерной голографии с 1997 года. Итогом же этого сотрудничества стало создание в мае 2000 года совместного предприятия Holographic Imaging, которое и станет продвигать на коммерческий рынок голографическую рабочую станцию.
# # #