Архивы: по дате | по разделам | по авторам

Вспомнить все

Архив
автор : Георгий Башилов   29.11.2002

Вместительность дисков растет, и цены на хранение информации падают настолько, что вручную удалять однажды созданные файлы становится экономически нецелесообразным: затраты времени на рутинные операции превосходят стоимость сэкономленных мегабайтов.

Вместительность дисков растет, и цены на хранение информации падают настолько, что вручную удалять однажды созданные файлы (если, конечно, они не содержат видео или другой «тяжелой» информации) становится экономически нецелесообразным: затраты времени на рутинные операции превосходят стоимость сэкономленных мегабайтов.

По прогнозам авторов проекта MyLifeBits, через пять лет (а может, и раньше) терабайтные жесткие диски будут не дороже трехсот долларов - для сравнения, сейчас примерно в эту сумму обойдется 200-гигабайтный накопитель. Соответственно, трехсотдолларовое устройство сможет вместить, например, 3,6 миллиона JPEG-файлов по триста килобайт каждый, или 9300 часов музыкальных записей в формате MP3 (256 кбит/с), или 1400 часов полноэкранного видео, ужатого до потока 1,5 Мбит/с.

В пересчете на год получается 9800 фотографий в день, или 26 часов музыки, или - четыре часа видео ежедневно. Вполне достаточно, чтобы день за днем записывать все - или почти все, увиденное, услышанное, прочитанное или написанное человеком на протяжении всей его жизни.

Напрашивается следующий шаг - организовать хранилище информации, предоставить средства для поиска, аннотации и извлечения данных. Именно этим и занимаются сейчас Джим Геммел (Jim Gemmell) и Гордон Белл (Gordon Bell), сотрудники одного из подразделений Microsoft Research, в рамках проекта MyLifeBits, или, в почти дословном переводе, «цифровые кусочки моей жизни».

Иерархические методы представления информации - традиционные директории, файлы и деревья, при создании такой базы уже не годятся - слишком много ограничений. Кроме того, один и тот же объект может в той или иной комбинации входить во множество разных коллекций. Так, фотография сестры, сделанная в день ее рождения, может оказаться в выборке «дни рождения», «сёстры» или просто «любимые фотографии». Может потребоваться доступ и по дате фотографии, и по множеству других признаков. Нелишне, с учетом гигантского объема вводимой информации, предусмотреть средства автоматического (или полуавтоматического) аннотирования документов и составления презентаций по запросу (так называемых динамических коллекций - списков, соответствующих определенному критерию), а также извлечения смысла из обширных текстов, помещаемых в базу.

От идеи до воплощения (пока в прототипе) - всего полвека: еще в 1945 году Ванневар Буш придумал забавное электромеханическое устройство - Мемекс (Memex), которое должно было обеспечивать хранение и вывод на экран всей накопленной человечеством информации, зафиксированной в книгах и других источниках, а также личных записей и корреспонденции пользователя.

Идеи авторов проекта MyLifeBits перекликаются и с трудами Теодора Нельсона, придумавшего термин «гипертекст» и легендарный проект Xanadu (см. «КТ» #316). По мнению Нельсона, нынешняя Паутина - вовсе не гипертекст, а всего лишь «хорошо приукрашенные директории» - в общем, наиболее тривиальная форма гипертекста, которую только можно было представить. Xanadu, в отличие от WWW, подразумевала не только просмотр текстов, но и активную работу с ними, комментирование, редактирование и т.д, и совершенно другие принципы организации и представления информации.

Интересно, что в ближайших планах создателей MyLifeBits - добавление в свою СУБД элементов искусственного интеллекта: средств распознавания образов, разбиения элементов (записей) на кластеры, сегментации видеоряда и пр. То есть MyLifeBits из простого «цифрового протеза», позволяющего вспомнить дела давно минувших дней, со временем может превратиться в цифрового ассистента, помогающего, опираясь на прошлый опыт, оптимальным образом построить свое поведение в какой-либо ситуации. Отсюда, в принципе, недалеко и до клонирования - кто знает, не станет ли такая база, по мере дряхления правообладателя, более адекватна своему прообразу, чем реальная человеческая особь?

Вот только не пришлось бы, особенно - с учетом легкости тиражирования и распространения информации, переименовывать проект в HisLifeBits - цифровые осколки его прошлого? Только представьте, какие сокровища тогда можно будет обнаружить на пиратских развалах…

© ООО "Компьютерра-Онлайн", 1997-2022
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.