Архивы: по дате | по разделам | по авторам

АрхиМедиа

Архив
автор : Михаил Попов   21.01.2002

Год назад, в январе 2001-го, президент Intel Крейг Баррет на выставке-ярмарке "Consumer Electronics Show" фигурально поставил персональный компьютер в "центр цифровой вселенной", причем заметил, что эта вселенная непрерывно расширяется, обогащаясь новыми подключающимися к ПК цифровыми устройствами.

Год назад, в январе 2001-го, президент Intel Крейг Баррет на выставке-ярмарке «Consumer Electronics Show» фигурально поставил персональный компьютер в «центр цифровой вселенной», причем заметил, что эта вселенная непрерывно расширяется, обогащаясь новыми подключающимися к ПК цифровыми устройствами.

Мультимедиа

Задача компаний - лидеров ИТ-отрасли состоит в том, чтобы придумать как можно больше применений своей продукции и убедить нас, что они нужны, интересны и полезны. Покупатели же с помощью доброжелательной специализированной прессы пытаются отделить зерна от плевел. Можно ли называть ПК центром цифровой вселенной? Конечно, поскольку под цифровой вселенной каждый волен понимать что угодно. В этой статье мне хотелось бы лишь обратить ваше внимание на компьютер как на хранилище разнообразной медийной информации - от картинок до музыки и видео. Пригоден ли он для этой роли? И если да, то в какой мере?

Попытки организовать на компьютере хранилища медиа-архивов начали предприниматься довольно давно. Лет семь назад, когда CD-ROM вышел в массы, «мультимедиа» было куда более популярным словом, чем сегодня. Проигрывание музыки, работа с графикой и видеофайлами на ПК были в новинку, и как всякая новинка, привлекали к себе внимание и занимали умы. Однако только сегодня, когда от слова «мультимедиа» уже попахивает нафталином, стало возможным всерьез говорить об организации на компьютере хранилищ оцифрованной аналоговой информации. Почему?

Все упирается в стоимость носителей информации. Более того, этот вопрос всегда был и будет ключевым. Просто на данном этапе мы подошли к порогу, когда привычные для восприятия виды медийной информации стало возможно хранить на ПК. Фото стандартного формата 10x15 сантиметров? Они без видимых искажений получаются из файлов JPG объемом один-два мегабайта. А ведь еще двадцать лет назад жесткий диск объемом несколько мегабайт был большим (и очень дорогим) техническим достижением. На нем можно было разместить несколько графических изображений в хорошем разрешении или же тысячи страниц (в переводе на бумажный эквивалент) текстовой информации. И не только разместить, но проанализировать и организовать, например, в виде базы данных.

Как только место на носителях-хранителях перестало цениться на вес золота, графика стала проникать в базы данных. Например, к сведениям о сотрудниках было бы логично присовокупить их небольшие фотографии. Или дополнить изображениями базу данных по произведениям искусства. Ориентировочно период бурного расцвета мультимедийных СУБД приходится на 1995-97 годы, когда все крупнейшие базостроители (IBM, Oracle, Informix) стали включать в свои системы инструменты для работы с мультимедийными объектами.

Запросы заказчиков росли и вместе с ними - объемы медийной информации. Отсканированные документы и рентгенограммы, записи телефонных звонков в диспетчерских центрах, видео (например, рекламные ролики). Корпорации требовали, а производители БД шли им навстречу. Значительные объемы нетекстовых данных было нецелесообразно хранить в главной таблице, поэтому они выносились за ее пределы, оформляясь как большие бинарные объекты (Binary Large Object - BLOB). В поколении реляционных систем поддержка определенных типов обеспечивалась - или не обеспечивалась на уровне ядра. Затем пришли объектно-реляционные СУБД - в которых расширение поддерживаемых типов данных требовало дополнительных модулей (datablades, cartridges и др.). Параллельно развивались объектно-ориентированные СУБД, разработчики которых козыряли именно облегчением работы со сложными типами данных, в том числе медийных. Самым, пожалуй, ярким примером объектно-ориентированных систем является Jasmine, которая разрабатывалась компанией Fujitsu, а затем перешла к Computer Associates, после чего ее развитие стало отвечать конъюнктуре момента (к настоящему времени Jasmine - система беспроводного управления распределенной средой независимых объектов). А в середине 1990-х годов ситуация виделась совсем по-другому: «Когда весь мультимедийный контент выйдет в Сеть, объектные СУБД станут одним из основных генераторов прибыли в ПО для Интернета» - это прогноз Forrester Research, датированный 1996 годом. Время расставило все по своим местам - выяснилось, что крупным заказчикам нужны не головокружительные возможности объектных баз данных, а традиция взаимоотношений с известными поставщиками, которые постепенно наращивали возможности своих БД в рамках реляционной модели. Jasmine, несмотря на очень агрессивный маркетинг со стороны Computer Associates, так и не стала «основным генератором прибыли».

Однако база данных, будь она реляционной или объектной до мозга костей, (в данном случае не столь важно), позволяла структурировать медийную информацию постольку, поскольку она привязана к текстовым данным. То есть уже была изначально структурирована. Попробуйте задать, например, поиск изображения, скажем, птицы, в известных поисковых машинах, например Google или AltaVista. Они вернут вам файлы, в имени которых может фигурировать птица, картинки с веб-страниц, где говорится о птицах, но при этом искалка не будет заниматься распознаванием образов и ей будет абсолютно все равно, что «нарисовано» на возвращаемой в качестве результата поиска картинки - птичка или поросенок.

Работа над распознаванием образов, конечно, ведется и весьма интенсивно, но результаты ее еще далеки от практической эффективности. AltaVista, впрочем, пробовала искать картинки по принципу «похожести», однако не преуспела в этом. Ведь когда мы ищем нечто похожее, можем иметь в виду совсем разные вещи - от похожего цветового решения до аналогичного объекта. И если первое решается компьютером достаточно просто, то второе дается ему с большим трудом, если дается вообще. Как правило, все программы распознавания образов хорошо работают на демонстрационных примерах, но когда дело доходит до реальных задач, от эффективности не остается и следа.

В качестве примера можно привести вытащенные кем-то в Интернет логи работы компьютерной системы распознавания людей по фотографии, установленной в нескольких общественных местах города Тампа (штат Флорида). Оказалось, что она не только не дотягивает до заявленных характеристик узнавания человека, даже если он изменил свою внешность (по характерным пропорциям лица), но сплошь и рядом путает мужчин и женщин. Энтузиазм разработчиков, однако, не угасает, если у них имеется финансирование. Исследования ведутся в том числе и у нас в стране - можно вспомнить созданную саровскими программистами в центре разработок Intel библиотеку компьютерного зрения. Но на фоне общего снижения темпов роста в отрасли многие разработки прекратились. Наиболее показательный пример - бельгийская компания Lernout & Hauspie, которая в 2000 году за полмиллиарда долларов приобрела знаменитую Dragon Systems, одного из передовых разработчиков систем распознавания речи. А в ноябре 2001 года имущество L&H пошло с молотка в ходе процедуры банкротства, причем технологию Dragon купила компания Scansoft - всего лишь за 10 млн. долларов.

Итак, еще раз отмечу, полезные свойства баз данных, такие как индексация и поиск по заданным критериям пока используются далеко не в полной мере, если речь идет об аудио- или визуальной информации. Если, конечно, она не сопровождается текстовыми комментариями или не содержит в себе образов текста - технологии оптического распознавания символов (OCR) сегодня достигли совершенства в машинном «чтении» печатного текста и вплотную подбираются к практически годному распознаванию рукописей.

Для дома, для семьи

Однако все, или почти все, что связано с «серьезными» СУБД не имеет отношения к созданию домашних мультимедийных архивов. Здесь друг друга сменяют не поколения известных баз данных, а различные версии частных программных решений. Рынок для приложений огромен - любительская оцифровка мира идет все интенсивнее, и многие авторы приложений работают не за деньги, а за славу, являя миру продукты с богатой функциональностью по достаточно низкой (иногда и вовсе нулевой) цене.

Microsoft, как всегда, старается выбить почву из-под ног независимых производителей софта. Windows XP содержит в себе начальные средства для организации работы как с изображениями, так и со звуковыми- и видео-файлами. Графические файлы, будучи помещены в папочку My Documents, представлены в виде своих миниатюрных изображений, а для их просмотра используется Windows Picture and Fax Viewer, встроенный в Explorer. Windows Media Player научился компрессировать звуковые дорожки - только не в MP3, как хотелось бы всем, а в WMA - проприетарный формат Microsoft, поддерживающий защиту от копирования. DVD-диски она, правда, еще не умеет «сдирать» в формат DIVX - модифицированный MPEG4. Но и это, должно быть, не за горами (в каком-нибудь проприетарном защищенном варианте от Microsoft). Для пользователя, чьи потребности не возросли до гурманства, поставляемого с Windows XP набора для организации мультимедийного архива хватит вполне.

Однако все средства для его создания существуют и по отдельности, превосходя по функциям и удобству использования придатки к операционной системе. В качестве примера одного из таких средств можно привести MusicMatch Jukebox, которая не только с успехом кодирует звуковые дорожки в файлы MP3, но и собирает в свою базу разбросанные по жестким дискам музыкальные богатства. Выше я говорил о том, что в плане индексирования и организации аудиоинформация не является самодостаточной, но нуждается в текстовых ярлычках. И все было бы совсем плохо, если бы приходилось вносить их вручную. К счастью, нет, - практически все более или менее продвинутые компьютерные проигрыватели CD вычисляют уникальный (почти) идентификатор диска и обращаются с ним в базу данных CDDB (она, правда, коммерциализовалась и перешла к компании Gracenote, но зато как альтернатива ей возникла свободная FreeDB). База возвращает список ассоциированной с данным идентификатором диска текстовой информации - названия диска, трека, графическую информацию (фото обложки).

Иная ситуация с графическими файлами. Задача их организации встает чаще всего перед теми представителями вида user domesticus, кто уже обзавелся цифровой фотокамерой. Одним из лучших инструментов является всем известная ACDSee, которая при переходе от третьей к четвертой версии наконец-то научилась пристойно масштабировать изображения в полноэкранном показе, а также обросла рядом дополнительных улучшений и исправлений. Например, таких, как создание уменьшенных изображений фото на сменных носителях, что актуально в первую очередь для CD-ROM. В самом деле, снимки в хорошем разрешении у увлеченного фотографа отнимают столько места, что жестких дисков не напасешься. Кроме того, диски имеют свойство иногда сбоить, тогда как фото обычно хочется «хранить вечно». А значит - неизбежный бэкап на CD-ROM и мучительные воспоминания, на котором из них записана такая нужная в данный момент картинка. Возможность ее поиска без необходимости сменить в дисководе десяток дисков весьма привлекает.

Есть еще один вариант хранения архивов своих видеоизображений - размещение их в Интернете. Удешевление дискового пространства привело к появлению бесплатных серверов, на которых можно хранить и демонстрировать всему миру свои фотографии (пример - www.fotki.com). А тем, кто захочет сделать фотоархив на своем Unix- или Linux-сервере, можно посоветовать бесплатный perl-скрипт myPhotoGallery. myPhotoGallery удобна и для создания удаленных архивов любых типов файлов, в том числе аудио- и видео-файлов.

Что касается видео, то за последний год большую популярность приобрела технология DivX/MPEG4. Она позволяет сжать полуторачасовой фильм в файл, помещающийся на одном CD. «Размер имеет значение» - сегодня фильмы с «почти DVD-качеством» продаются на любом дисковом развале. «Почти» - с большой натяжкой, ибо сжатие все-таки вносит зримые (и подсознательно раздражающие при длительном просмотре) искажения.

В заключение можно отметить, что польза домашнего ПК в организации домашнего мультимедийного архива находится в прямой зависимости от организованности его владельца. Если вам не лень аннотировать свои медийные сокровища, ПК поможет. В противном случае он останется просто универсальным проигрывателем, а нужный клип придется искать в своих файлах не меньше времени, чем кассету в на полке.

[i42730]

© ООО "Компьютерра-Онлайн", 1997-2022
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.