Архивы: по дате | по разделам | по авторам

Секреты TheBat!. Обучение модуля BayesIt!

АрхивПочта
автор : Надежда Баловсяк   02.02.2005

Продолжаем наше знакомство с фильтром BayesIt!. Обучаем антиспамерский модуль распознавать нежелательную корреспонденцию, корректируем работу программы путем настройки "белых" и "черных" списков.

Недавно мы рассматривали установку и настройку антиспам-фильтра BayesIt!. Работа этого модуля базируется на тех статистических данных, которые он собирает, обрабатывая входящую почту, поэтому следующим этапом является обучение фильтра распознавать письма как спам или как обычные письма. При получении спам-сообщения необходимо его выделить и выбрать пункт "Special -> Mark as Junk".


Пометить письмо как спам.

В этом случае BayesIt! переместит письмо в специальную папку "Junk mail", а также, что гораздо более важно, определив письмо как спам, фильтр сможет отсеять все похожие на это сообщения, то есть таким образом происходит обучение фильтра детектировать письма. Возможно, что до установки писем вы отсортировали спам другим способом (вручную, или используя другие методы, которые мы рассматривали) и разместили нежелательные письма в специальной папке, тогда BayesIt! можно предложить обработать все эти письма. Отметьте их и выберите тот же пункт меню. После этого обучения при последующем получении почты фильтр BayesIt будет автоматически отсортировывать спам-сообщения, причем со временем работа его будет улучшаться, то есть чем больше писем фильтр отработает (вручную или с вашей помощью), тем лучшим будет качество его работы. При работе фильтра возможны ошибки. Не так страшно, если нежелательные письма не будут отмечены, гораздо хуже, когда BayesIt! пометит нужное письмо как спам. В этом случае необходимо осуществить обратное действие, пометив письма как не-спам (выбрать пункт "Specials -> Mark as NOT Junk"). После выбора этого пункта письмо не переместиться в исходную папку, сделать это необходимо вручную, но соответствующее ему правило фильтрации будет удалено из фильтра. Этот момент очень важен, ибо восприняв письмо как спам один раз фильтр будет воспринимать похожие письма как нежелательные все время, и будет их отфильтровывать в папку со спамом.

Далее поговорим о настройке черного и белого списков для фильтра BayesIt. Для этого необходимо выбрать "Свойства -> Белые и черные списки BayesIt!...". На вкладках окна редактора списков можно настроить правила для отбора писем, не являющихся спамом (вкладка "Правила 'белого' списка"), правила отбора спама (вкладка "Правила 'черного' списка") и правила, в соответствии с которыми письмо не будет определено ни как спам, ни как не-спам (правила "игнор"-списка).


Редактирование "черного" и "белого" списков.

Если фильтр воспринимает письмо согласно этому правилу, он на него не будет реагировать, то есть такие письма исключаются из обработки. Наивысший приоритет у последней вкладки, затем осуществляется проверка по правилам "белого" списка". "Черный" список проверяется последним. Для добавления правила необходимо нажать на кнопку "Добавить". Первая строка позволяет настроить область проверки. Возможно проводить анализ заголовка, темы или других параметров ("отправитель", "получатель", "копия"), либо везде (анализироваться будут все параметры). В следующем поле формируется условие. В третьем поле задается строка, с которой производится сравнение, и последняя строка предназначена для имени правила.


Построение правил для списков.

Использование "черного" и "белого" списка в TheBat! 3.0 имеет более высокий приоритет, чем фильтр BayesIt!. Это означает, что если письмо было удовлетворено одному из правил этих списков, оно будет определено как спам (или не-спам) независимо от работы фильтра. Используются метод "черного" и "белого" списка в основном тогда, когда BayesIt! ошибается на определенном одном и том же виде сообщения: в этом случае можно подкорректировать работу фильтра, создав правило для соответствующего списка.

© ООО "Компьютерра-Онлайн", 1997-2024
При цитировании и использовании любых материалов ссылка на "Компьютерру" обязательна.