Архивы: по дате | по разделам | по авторам

Уходим болотами и "Голубятня, Корова:3"

Архив
автор : Сергей Голубицкий   24.11.2005

Со дна баночки культур-повидла нашкрябал пол чайной ложки фактуры - убогой, как отечественный ритейл. История о том, как покупал PCMCIA-тюнер Behold TV Columbus.

Со дна баночки культур-повидла нашкрябал пол чайной ложки фактуры - убогой, как отечественный ритейл. История о том, как покупал PCMCIA-тюнер Behold TV Columbus. Весело покупал, с песнями и плясками. Ничто не предвещало беды поначалу: Price.ru, обзвон торговцев на первой странице. Накатанный результат: у тех нет, у этих - только за безнал, у третьих - цена не та, что заявлена. Нахожу вроде приличных людей - "АБ-Групп" называется. Сидят, правда, на Нижегородской улице - от дома туда примерно как до Мурманска. Спрашиваю: "Нужно ли резервировать?" "Конечно!" "Замечательно. Меня зовут имярек". "Заказ принял. Номер вашей резервации такой-то".

Отправляюсь в путь, гнию пару часов в пробке на Третьем кольце. С горем пополам добираюсь. Менеджерствующий юнош ковыряет на мониторе свое "1С:Предприятие" и выдает загадочную фразу: "А вы знаете, вашего тюнера нету". "??????". "Буквально десять минут назад заходил покупатель, сказал, что тоже резервировал через Интернет, ну мы ему и продали". "А что, покупатель ваш назвал мой номер резервации?" "Не назвал, да мы как-то и не спрашивали – многие клиенты приходят и не помнят своего номера, вот мы и не спрашиваем. Извините за накладочку".

В самом деле, какие проблемы? Денег не крали, в морду не дали, так что, пацан, нет повода кипешиться. Нормальная накладочка. Вонючая такая, совковая, знакомая всем с детства. Кто мы такие, в конце концов? Покупатели? Клиенты? Кормильцы? Мозги нации? Ага, в натуре. Мы - дерьмо. Характерно, что и человек за прилавком – тоже дерьмо, стоит ему только выйти из-за своего прилавка и окунуться в реалии окружающего бытия: его сразу же начнут на каждом углу оплевывать, обхамывать, обманывать и разводить как лоха. Потому что это Гиперборея у нас тут такая - по ту сторону добра и зла.

Впихнули в почтовый ящик буклетину банка "Русский стандарт": "С 1 октября по 1 декабря отменена оплата за снятие наличных!" Урррря! Внутри буклетины – описание тарифного плана: "Размер процентов, начисляемых по кредиту (годовых), – 23%". Урррря! Почти Европь, растудыть! Ниже, правда, приписочка для въедливых непатриотичных "мозгов нации", тех, что 0,0001% населения: "Ежемесячная комиссия за обслуживание кредита – 1,9%". Аааа, вот оно как: 1,9% да на двенадцать месяцев = 22,8%, да плюс 23% годовых, заявленных в открытую, получается 45,8%!!! Цифру, которую ни в одном приличном государстве произнести вслух невозможно – арестуют за вымогательство. Зато в Гиперборее - без проблем! Чего с лохами-то церемониться, с холопами. Разводили столетиями и разводить будем, – правильное название у банка, в самое яблочко!

Однодневной вылазки в "житуху реализма" из теплого и родного виртуального мира хватило за глаза, чтобы ощутить себя диверсантом на вражеской территории: "Уходили через лес, где вскоре нарвались на вызванную по тревоге спецгруппу. Отбежав на довольно большое расстояние и выйдя на край болота, устроили засаду. Сначала удачно перестреляли трех овчарок из пистолетов, потом забросали гранатами не догадавшихся остановиться преследователей, всего человек десять. Взяли четыре автоматических карабина с дополнительными магазинами, документы. Болото решили не обходить, а идти вброд. Брода, однако, не оказалось, и через полчаса все четверо утонули. Тонули медленно. Трясина по-слоновьи чавкала, безусый Котов плакал как девчонка"[Д. Е. Галковский, "Святочный рассказ №2".].

Вернемся, однако, к приятному и светлому. На прошлой неделе мы остановились на языке запросов, реализованном в "Архивариусе 3000". Язык этот отстает от Cros по одной-единственной позиции: поиску в интервале слов (рис. 1).

Изображенное на рисунке выражение позволяет найти контекст, в котором слова "голубятня" и "корова" находятся друг от друга на расстоянии, не превышающем трех слов. Не спешите отмахиваться: за внешней экзотичностью этого запроса скрывается мощнейший инструмент датамайнинга, который только и позволяет проводить контекстные изыскания. Пример из личного опыта: в эссе "Запах несвежего чизбургера" я рассказывал читателям "Бизнес-журнала" о скрытых механизмах, позволивших американским автомобильным империям порвать на гербарий (© "Голубятня") корейскую Daewoo. По вполне понятным причинам во время подготовки материалов голова моя совершенно съехала от корейских имен - Чунг Джу Йанг, Ли Бьонг Чул, Ку Ин Вэй, Ким У Чун … Как вы догадываетесь, связать эти кракозябры с реальными лицами и обстоятельствами не представлялось ни малейшей возможности, поэтому, взяв перо в руки, был не в состоянии вспомнить ни единого факта: где родился Ким У Чун? Какой чаебол возглавлял Чун Джу Йан? Спасательный круг бросил именно "поиск в интервале слов", реализованный в Cros: "Kim Woo Chung, born: 3", "Chung Ju Yung, found*:4". Обратите внимание: если бы я оформил вопрос банальным рабоче-крестьянским способом ("Kim Woo Chung AND born"), то получил бы в ответ список документов, в которых встречаются ОБА слова. Конечно, рано или поздно нужный контекст удалось бы отыскать и при таком запросе, однако затраты времени оказались бы несоизмеримы.

В текущей версии "Архивариуса 3000" реализованы все джентльменские операторы запросов: "+" для обязательного присутствия слова в документе, "-" для его обязательного отсутствия, "~" для возможного, но необязательного присутствия слова, "*" для замены любых букв в искомом слове, "?" для замены одной буквы в слове. Есть и первое приближение к поиску в интервале слов – оператор "[]", осуществляющий поиск в фиксированном диапазоне из десяти слов. Иными словами, запрос в "Архивариусе" [Kim Woo Chung born] аналогичен кросовскому "Kim Woo Chung, born: 10".

Интерфейс поиска в "Архивариусе" вполне веселенький и комильфо (рис. 2).

При желании можно заняться тонкой настройкой поиска, определив дату изменения файла, его имя, параметры почтового сообщения (на случай, если поиск ведется по индексу электронных писем), обозначить язык контекста, кодировку, тип и т. д. (рис. 3).

Очень удачен, на мой взгляд, Мастер поиска, практически гарантирующий программе коммерческий успех в Пиндустане (рис. 4).

Шутки шутками, но с помощью Мастера поиска и в самом деле можно детализировать запросы с высокой эффективностью.

Впрочем, в Cros эта же функция реализована хоть и менее наглядно (в типичном user-unfriendly-ключе), однако более гибко (рис. 5).

Наконец, окно результатов поиска в "Архивариусе" радует выразительностью и осмысленностью (рис. 6).

Многоцветная подсветка, безусловно, добавляет наглядности, однако мне лично не хватает дополнительного окна для заметок пользователя - очень ценная фича датамайнинга, реализованная в Cros. В любом случае, абсолютно уверен, что все эти мелкие недоделы Евгений Троицкий наверстает уже в ближайших релизах. Помните, как неделю назад я восхищался скоростью, с которой развивается "Архивариус"? Причем развивается не по мелочам, а глобально. Так вот, за истекший короткий срок появился очередной релиз программы, устраняющий фундаментальное ограничение размера индекса в 1,5 гигабайта. Для получения результата Евгению потребовалось полностью пересмотреть весь формат индексных баз. И ничего – всё пересмотрел, всё изменил. Полагаю, "поиск в интервале слов" и окно для заметок - фичи гораздо более простые. Так что буду внимательно следить за дальнейшим развитием "Архивариуса 3000" и сразу же информировать читателей обо всех достойных нововведениях.

Линки, помянутые в "Голубятне", вы найдете на домашней странице internettrading.net/guru.

© ООО "Компьютерра-Онлайн", 1997-2024
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.