Что мы сделаем с "центром американского английского" ? Настроим спам-фильтр в Mozilla!


Врага надо знать в лицо

Не знаю как тебе, читатель, а мне порядком надоели письма типа "do you want to enlarge your pennis" или "Sexual tapes by Pamela Anderson". На мой весьма старый и известный ящик samm@os2.ru подобных экскрементов приходит каждый день в огромном количестве. При этом традиционные методы борьбы (фильтр на email адрес, тонна тротила или письмо провайдеру) из-за огромного количества спамеров и используемых ими методов совершенно перестали быть эффективными. Но не всё так плохо. Видимо, авторов замечательной программы Mozilla любители халявной реклами достали не меньше нашего и в версии 1.3 они включили в функции почтового клиента мощные инструменты для борьбы со спамом.

Как использовать защиту от спама?

Инструменты для борьбы с нежелательными сообщениями в почтовом клиенте Mozilla называются Junk Mail Controls (junk — дрянь, барахло). В этой главе мы разберёмся, как использовать фильтры спама.

  1. Обучим мурзилку различать спам и полезные сообщения. Для этого выделите сообщения, содержащие спам, и выберите в меню Tools | Mark Selected Messages as Junk. Остальные сообщения можно отметить как не содержащие спам: Tools | Mark Selected Messages as Not Junk.
  2. Выберем в меню Tools | Junk Mail Controls... и включите Junk Mail Controls для ваших pop3 и imap ящиков. Это включит автоматический анализ входящих сообщений.
  3. Обязательно корректируйте распознавание писем (отмечайте неотмеченный спам и снимайте отметку с нормальных писем)
  4. Выделите ваши старые сообщения и выберите в меню Tools | Run Junk Mail Controls. Используя фильтр View | Not Junk вы можете просматривать только полезные сообщения (также рекомендую создать фильтр Junk Only для быстрого удаления спама).
  5. Используя Tools | Junk Mail Controls... вы можете настроить автоматическое перемещение спама в папку "Junk".

Как это всё работает?

Мозилла использует алгоритм, который разработал Paul Graham — "A Plan for Spam". Суть его достаточно проста. В период обучения, когда пользователь помечает письма как "спам", слова из отмеченных сообщений попадают в таблицу "плохих" слов. Когда пользователь снимает пометку с сообщения (Mark Selected Messages as Not Junk), слова из него попадают в таблицу "хороших" слов. В таблицах хранится также количество (в процентах) совпадений по каждому из слов.

Каждое новое письмо анализируется с использованием обеих таблиц и получает свой индекс ("плохие" слова его увеличивают, а "хорошие" — уменьшают). При достижении некоторого числа письмо считается спамом. Такой, несколько неочевидный метод на практике даёт прекрасные результаты.

Ниже представленна таблица, в которой показываются действия Mozilla Mail при обработке сообщений. Она приведена для того, чтобы лучше понять, как проходит процесс "обучения".

Изначальный статус письма Действие пользователя Изменения таблиц
Не определён (пользователь видит его как "not junk") Отметить как junk Добавить слова в таблицу "плохих"
Не определён (пользователь видит его как "not junk") Отметить как НЕ junk Добавить слова в таблицу "хороших"
Не Junk Отметить как junk Удалить слова из таблицы "хороших",добавить слова в таблицу "плохих"
Не Junk Отметить как НЕ junk Изменений не происходит
Junk Отметить как junk Изменений не происходит
Junk Отметить как НЕ junk Удалить слова из таблицы "плохих",добавить слова в таблицу "хороших"
Все данные таблиц хранятся в файле "training.dat" (изначально - пустом). Детектирование спама происходит после работы других фильтров. Файл "training.dat" — один на все ваши почтовые аккаунты. Внутренняя кодировка файла — UTF-8, что повышает эффективность работы для писем в разных кодировках одного языка.

А теперь со всей этой ... мы попытаемся взлететь

Вот, в общем-то, и всё, о чём я собирался рассказать в этой заметке. Удачной вам борьбы со спамом. В случае достаточного (или недостаточного?) количества пива я продолжу рассказ о методах борьбы со спамом, но уже на стороне сервера.

Alex Samorukov



Интересные ссылки: Право закон федеральные законы.
Комментариев к странице: 0 | Добавить комментарий
Домой | Проект ядро Core/2 | Проект OS/4 Download | Новости | Гостевая книга | Подробно обо всем | Нужные программы | Проекты | OS/2 FAQ | Всячина | За и Против | Металлолом | #OS2Russian | RDM/2 | Весёлые картинки | Наша галерея | Доска объявлений | Карта сайта | ПОИСК | ФОРУМ