Когнитивный инжиниринг
АрхивНа одной из лекций профессор привел научный факт: из всего объема информации, поступающей к человеку в течение жизни, устойчивыми знаниями становятся лишь 13%! Чтобы сделать умственную работу более легкой и эффективной, приходится снова учиться - на этот раз основным принципам когнитивной эргономики.
На одной из лекций по анатомии человека профессор привел научный факт (поразивший меня тогда своей фатальностью): из всего объема информации, поступающей к человеку в течение жизни посредством анализаторных систем, устойчивыми знаниями становятся лишь 13%! Как я узнал позже, эта цифра справедлива только для самых способных и талантливых людей — что же говорить о простых смертных. Для того чтобы сделать умственную работу более легкой, быстрой и эффективной, приходится снова учиться — на этот раз основным принципам когнитивной, то есть познавательной эргономики.
Информационная перегрузка
Каждый из нас обладает определенным объемом знаний, которые в зависимости от уровня биологической и социальной значимости, а также образа жизни либо пополняются, либо утрачиваются. Для любого специалиста в какой-либо области первостепенное значение имеет та информация, которая входит в сферу его профессиональных интересов. Этим и объясняется, что большинство людей имеет весьма поверхностные знания по предметам, не относящимся к их основному роду деятельности или увлечениям. Для квалифицированного выполнения своих профессиональных обязанностей (прежде всего, креативной наукоемкой деятельности) человеку приходится учиться практически всю жизнь. Как говорила Алиса из Зазеркалья Льюиса Кэрролла: «Иногда, чтобы оставаться на месте, надо бежать».
На протяжении всей истории человечества темпы выработки новой информации растут. Но, научившись создавать информацию, люди со временем начали в ней задыхаться, то есть испытывать информационную перегрузку. Приобретение обширных знаний даже по узкой специальности и эффективное использование всех существующих знаний стало затруднительным из-за колоссальных объемов имеющихся данных. В связи с этим появились концепции непрерывного образования, а также образования в течение всей жизни. Довольно распространенным является мнение, что, чем больше времени затрачивать на учебу, тем обширнее и прочнее приобретенные знания. Но дело в том, что учащийся должен усвоить необходимый объем знаний (при достаточной их глубине) за минимальное время.
Пути решения проблемы
При осуществлении профессиональной деятельности каждый человек вынужден использовать свою когнитивную сферу. К ней относятся такие процессы, как ощущения, восприятие, представления, память, внимание, мышление и интеллект. Результативность нашей работы напрямую зависит от скорости этих процессов, а также от параметров двигательной активности. Рассматривая систему «человек — машина», можно выделить несколько путей оптимизации ее работы:
- повышение производительности аппаратной части;
- оптимизация программного кода;
- повышение производительности труда оператора за счет улучшения взаимодействия с программно-аппаратным комплексом.
Разумеется, оптимальным будет использование всех возможных путей. Но, на мой взгляд, производительность аппаратной части в большинстве случаев является наименее критичным фактором по сравнению с двумя другими. В то же время проблема оптимизации программного кода сейчас актуальна как никогда. По-прежнему «ошибки в программах так же неисчерпаемы, как атом», и количество багов прогрессивно возрастает по мере увеличения объема и избыточной функциональности программ.1 Под оптимизацией кода чаще всего понимают комплекс мер, направленных на уменьшение времени реакции системы на действия пользователя. Однако в это определение необходимо включить создание дизайна, ориентированного на нужды пользователя (User Centered Design). Подобный подход позволит улучшить взаимодействие оператора и ПК.
Решение же последней задачи сводится не только к выполнению соответствующих санитарно-гигиенических требований. Помимо этого существует и так называемая когнитивная эргономика, позволяющая на основе данных нейробиологии и инженерной психологии эффективно использовать ряд эволюционных физиологических преимуществ человека, которые остаются большей частью невостребованными при стандартных методах использования современных информационных технологий.
Плюсы и минусы эволюции человека
Биологическая эволюция человека в наше время все еще происходит. Однако она имеет гораздо меньшее влияние, чем эволюция социальная, поскольку человек, поднявшись над остальными царствами живых организмов, занял господствующее положение2, тем самым значительно ослабив действие неблагоприятных факторов на свой вид. Эволюция, длящаяся уже 1,5 млн. лет, привела, помимо всего прочего, к тому, что наш зрительный аппарат стал способен успешно решать две задачи: воспринимать как можно больше световой информации за единицу времени и тщательно анализировать свойства воспринимаемых зрительных объектов. В процессе решения этих задач человек приобрел бинокулярное зрение с достаточным углом обзора, обеспечивающим периферическое зрение.
Для системы «человек — машина» наибольшее значение из анализаторов имеет зрительный, поскольку от 80 до 95% всей информации о рабочей среде человек получает с его помощью. Зрительный анализатор предназначен для работы в двух режимах: симультанном (периферическое зрение) и сукцессивном (центральное зрение). Симультанный режим основан на использовании фоторецепторов сумеречного зрения (палочек) и предназначен для быстрой ориентации в окружающей обстановке благодаря беглому панорамному обзору. Сукцессивный режим более медленный — он задействует фоторецепторы цветового зрения (колбочки) и предоставляет возможность восприятия более детальной зрительной информации.
В настоящее время большинство людей применяют классическую технику чтения, то есть в большей степени используют медленное центральное зрение с тщательным последовательным анализом поступающей информации (сначала букв, потом слов, а затем и предложений со знаками препинания). Если же большую часть информации представить в графической форме (в виде эквивалентных рисунков), то зрительный анализатор станет функционировать в более быстром (симультанном) режиме.3
До того момента, когда впервые появилась письменная речь, человек пользовался в основном симультанным режимом восприятия любой световой информации (причем это происходило за доли секунды и с минимальными усилиями, то есть рефлекторно). Но с момента изобретения книг, а впоследствии и персональных компьютеров, человечество сделало шаг назад в скорости и качестве восприятия зрительной информации, перейдя к более медленному сукцессивному режиму.
«В начале была командная строка»4, которая использовалась в операционной системе UNIX5, а позднее в MS-DOS. Разумеется, в те далекие времена интерфейс большинства программ основывался на командной строке и был далек от эргономического совершенства. Тем не менее, командный интерфейс и по сей день не потерял актуальности и продолжает активно использоваться не только в клонах UNIX, но и в ряде популярных консольных приложений. В частности, культовый почтовый клиент The Bat! при желании можно использовать исключительно в режиме командной строки без потерь в функциональности, а обладая соответствующими навыками — и без потерь времени.6
Затем в 1976 году благодаря усилиям лаборатории Xerox из Palo-Alto Research Center появился WIMP-интерфейс7 в системе под названием Smalltalk, как пример дружественного интерфейса8. Эта идея послужила Стиву Джобсу стимулом в создании GUI9 в Mac OS для первых компьютеров Apple (системы Lisa и Macintosh). Позднее усилиями одной компании (ныне известной практически всем) идея GUI (точнее, программный интерфейс Apple Macintosch) привела к появлению графической оболочки Windows.
В настоящее время оконный интерфейс существует в двух режимах: текстовом и графическом. Чаще используется графический оконный режим — либо в виде графической оболочки, например X-Windows или KDE для Linux, либо в интегрированном в ядро системы виде. Со времен Windows 95 оконный интерфейс предоставил пользователям большие возможности не только для работы, но и для своего рода развлечений. Замена темы рабочего стола, фонового рисунка, экранной заставки, стиля, цветовой и звуковой схем и т. п. все еще входит в список регулярных занятий (особенно в рабочее время) некоторых пользователей.
Относительно недавно в веб-дизайне стал массово использоваться анимационный интерфейс на основе технологии Flash. Выработанная в процессе эволюции человека ориентировочно-исследовательская реакция на новизну10 эксплуатируется без зазрения совести — в основном ради привлечения широкого внимания к веб-ресурсу. Яркие движущиеся элементы интерфейса сразу же обращают на себя внимание, но через короткое время начинают вызывать обратную реакцию, поскольку, во-первых, отвлекают от нужной информации, а во-вторых, снижают скорость загрузки веб-страниц. В то же время анимационный интерфейс, если, конечно, у дизайнера есть чувство меры и вкус, может выглядеть очень элегантно, не вызывает раздражения и даже создает определенные преимущества в работе по сравнению с графическим оконным интерфейсом.
1 Согласно закону Паретто (закон «80/20»), 80% пользователей используют только 20% функциональности программ.
2 Во всяком случае, люди имеют наглость так считать. — Прим. расы Торпп.
3 Эта тема была затронута в «КТ» #522.
4 www.zhurnal.lib.ru/j/juber_a/commandlineforever.shtml.
5 До UNIX командная строка использовалась в ряде менее известных операционных систем.
6 www.nobat.ru/cmd_intro.html.
7 Windows, Icons, Menus, Point-and-click — окна, пиктограммы, меню, «укажи и щелкни».
8 Считается, что до Алана Кея (Xerox PARC), которому принадлежит авторство идеи WIMP, в середине 60-х годов эту же идею высказывал Дуглас Энгельбарт (Stanford Research Institute).
9 Graphic User Interface — графический интерфейс пользователя.
10 Непроизвольное внимание к новой информацию любой модальности.
В качестве альтернативы графическим окнам в настоящее время выступает концепция SILK-интерфейса11. Один из его вариантов — голосовой интерфейс, на который многие возлагают большие надежды. Первый опытный образец системы речевого ввода Tangora 4 создан корпорацией IBM еще в далеком 1986 году. В 1992 году система была реализована в клиент-серверной модели на RISC-архитектуре. Одновременно началась разработка системы речевого ввода под OS/2 для ПК. Таким образом, в конце 90-х существовало мнение, что голосовые интерфейсы — это прерогатива исключительно IBM. Собственно, так оно и было. Но с течением времени позиции IBM на рынке операционных систем не улучшались, хотя технологии голосового интерфейса продолжали успешно развиваться. В частности, в 1993 году корпорация представила систему речевого ввода Personal Dictation, а в 1995 году на CeBIT продемонстрировала систему диктовки VoiceType со специализированными словарями для врачей и юристов.
В настоящее время имеются многочисленные разработки в области голосового интерфейса, в том числе программа распознавания речи ViaVoice из пакета SmartSuite v.9.0 от Lotus (дочерней фирмы IBM) и, разумеется, Office XP от Microsoft.
Особого внимания заслуживает система речевого ввода Dragon Dictate System, которая берет начало в 1990 году. Кроме того, следует отметить российские разработки для голосонезависимого распознавания команд русской речи Voice Commander от IstraSoft и проект «Голос» от Redlab.
Искусство построения интерфейса
Проблема создания эргономичного интерфейса возникла задолго до появления первых компьютеров. Уже первые рукописные, а затем и печатные книги требовали представления информации в определенной форме, способствующей тому, чтобы книга успешно выполняла свою основную функцию — носителя информации. Именно тогда были сформулированы основные и, как оказалось позднее, универсальные правила создания эргономичного интерфейса, то есть посредника между различными носителями информации и человеком.
Любой интерфейс можно рассматривать как систему, состоящую из динамически обновляемой информации (графика, текст, звук, анимация и т. д.), посредством которой оператор может более или менее эффективно взаимодействовать с компьютером, а также психофизиологических механизмов, благодаря которым информация с той или иной степенью адекватности воспринимается пользователем. Именно на эти глубинные механизмы взаимодействия оператора с экранной информацией и воздействует интерфейс программы.
Рассмотрим основные элементы эргономичного визуального интерфейса. Во-первых, он отображается на экране монитора и состоит из ряда участков, часть которых являются наиболее активными, то есть бросающимися в глаза. Во-вторых, цветовая схема элементов интерфейса должна быть построена на основе знаний психофизиологии цвета. В частности, красный цвет — сигнал опасности, зеленый — сигнал штатной ситуации и т. д. В-третьих, гарнитуру шрифта, его размер, начертание, а также варианты расположения текстовых блоков на странице необходимо выбирать в соответствии со степенью их важности для целевой аудитории. Наконец, это удобная и интуитивная система навигации (но отнюдь не квест с малопонятными метафорами). И последнее (по порядку, но не по значимости): интерфейс программы должен адекватно моделировать реальные производственные ситуации, возникающие в той или иной области применения.
Наиболее точное, на мой взгляд, описание правильного интерфейса дано в одной из лучших книг о веб-дизайне12: интерфейс «не должно быть видно» до тех пор, пока пользователь свое сознательное внимание обращает на содержательную часть, а не на способ ее представления. Исключением из этого правила являются компьютерные игры, в которых не считается дурным тоном использовать яркий и броский интерфейс, создающий определенную атмосферу в соответствии с типом игры.
Практически любой серьезный программный продукт прежде всего нацелен на строго определенный контингент пользователей, которым он действительно необходим, как воздух. А уже потом программа приобретает популярность среди широких масс anykey’щиков, активно интересующихся данным предметом в свободное от работы время. Следовательно, в первую очередь интерфейс должен соответствовать требованиям целевой аудитории.
Учитывая, что в большинстве случаев интерфейс отражает внутреннюю схему реализации программы и особенности мышления самого программиста, конечным пользователям продукта со средним уровнем подготовки в сфере IT логика программы и ряд терминов скорее всего будут непонятны. В связи с этим к разработке узкоспециализированного коммерческого программного обеспечения необходимо привлекать специалистов в области usability. Это позволит разработать дизайн пользовательского интерфейса, который будет адекватной моделью типичных пользовательских ролей и сценариев, а значит, повысит эксплуатационные свойства всего информационного ресурса.
Эмоциональный компьютинг
Одним из критериев качества интерфейса является чувство эстетического удовлетворения, испытываемое пользователем (как, впрочем, и разработчиком интерфейса) в процессе общения с тем или иным программным продуктом. Таким образом, эмоциональная реакция, будучи внешним отражением механизмов взаимодействия оператора с экранной информацией, вместе с тем является и показателем соответствия особенностей интерфейса негласным требованиям целевой аудитории.
Успешные работы в данном направлении ведутся в нескольких крупных исследовательских центрах. В частности, в Массачусетском технологическом институте под руководством Дженнифер Хили (Jennyfer A. Healey) уже несколько лет действует лаборатория по изучению и разработке методов надежного распознавания эмоций человека. Указанные методы основаны на использовании технологий искусственного интеллекта, управляющего «эмоциональной сферой» различных интеллектуальных устройств. В качестве прототипа был создан аудиоплейер, адекватно (по мнению разработчиков) реагирующий на психологическое состояние слушателя во время составления и прослушивания плей-листа.13
Подобные тенденции в сфере информационных технологий появились уже давно, но, тем не менее, пока не стали массовыми. Перспективным направлением является разработка интерфейса, способного на основе восприятия и анализа эмоций пользователя корректировать способ подачи экранной информации, тем самым улучшая взаимодействие человека с компьютером.
Напоследок
В заключение хотелось бы заострить внимание читателей на следующем моменте. Неутихающие споры о том, какой программный интерфейс лучше, давным-давно перешли в разряд идеологических. Однако апологетам командной строки из числа профессионалов все труднее разубеждать поклонников графического оконного интерфейса. За последние восемь-десять лет ситуация несколько изменилась, и сейчас большинство ПК работает под операционной системой MS Windows. Возможно, кому-то это не нравится, но это реальность, с которой не поспоришь. Кроме того, часть профессионалов также была вынуждена перейти на использование графического оконного интерфейса, что означало не только смену клавиатуры на мышь, но и изменение самого стиля мышления. Помимо прочего, этот переход означает, что все мы незаметно для себя безнадежно привыкаем к легкому и красивому, но не всегда правильному и логичному программному интерфейсу, а возврат к чему-либо более профессиональному оказывается крайне затруднительным. Графический оконный интерфейс существует уже больше четверти века, и, разумеется, за это время он успел устареть, а большинство из нас успело благополучно попасть в зависимость от популярных, но не всегда удачных его реализаций. Остается надеяться, что создатели программных интерфейсов будут ориентироваться в своей работе не только на типичного среднего пользователя, но и на основные правила когнитивной эргономики, поскольку это значительно облегчит нашу жизнь.
11 Speech, Image, Language, Knowlege — речь, образ, язык, знание.
12 Стив Круг, «Не заставляйте меня думать».
13 Сергей Митилино, «Социальный ПК»//Компьютерное обозрение #1-2, 17–23 января 2001.