Что мы сделаем с "центром американского английского" ? Настроим спам-фильтр в Mozilla!
Врага надо знать в лицо
Не знаю как тебе, читатель, а мне порядком надоели письма типа "do you want to enlarge your pennis" или "Sexual tapes by Pamela Anderson". На мой весьма старый и известный ящик samm@os2.ru подобных экскрементов приходит каждый день в огромном количестве. При этом традиционные методы борьбы (фильтр на email адрес, тонна тротила или письмо провайдеру) из-за огромного количества спамеров и используемых ими методов совершенно перестали быть эффективными. Но не всё так плохо. Видимо, авторов замечательной программы Mozilla любители халявной реклами достали не меньше нашего и в версии 1.3 они включили в функции почтового клиента мощные инструменты для борьбы со спамом.
Как использовать защиту от спама?
Инструменты для борьбы с нежелательными сообщениями в почтовом клиенте Mozilla называются Junk Mail Controls (junk — дрянь, барахло). В этой главе мы разберёмся, как использовать фильтры спама.
- Обучим мурзилку различать спам и полезные сообщения. Для этого выделите сообщения, содержащие спам, и выберите в меню Tools | Mark Selected Messages as Junk. Остальные сообщения можно отметить как не содержащие спам: Tools | Mark Selected Messages as Not Junk.
- Выберем в меню Tools | Junk Mail Controls... и включите Junk Mail Controls для ваших pop3 и imap ящиков. Это включит автоматический анализ входящих сообщений.
- Обязательно корректируйте распознавание писем (отмечайте неотмеченный спам и снимайте отметку с нормальных писем)
- Выделите ваши старые сообщения и выберите в меню Tools | Run Junk Mail Controls. Используя фильтр View | Not Junk вы можете просматривать только полезные сообщения (также рекомендую создать фильтр Junk Only для быстрого удаления спама).
- Используя Tools | Junk Mail Controls... вы можете настроить автоматическое перемещение спама в папку "Junk".
Как это всё работает?
Мозилла использует алгоритм, который разработал Paul Graham — "A Plan for Spam". Суть его достаточно проста. В период обучения, когда пользователь помечает письма как "спам", слова из отмеченных сообщений попадают в таблицу "плохих" слов. Когда пользователь снимает пометку с сообщения (Mark Selected Messages as Not Junk), слова из него попадают в таблицу "хороших" слов. В таблицах хранится также количество (в процентах) совпадений по каждому из слов.
Каждое новое письмо анализируется с использованием обеих таблиц и получает свой индекс ("плохие" слова его увеличивают, а "хорошие" — уменьшают). При достижении некоторого числа письмо считается спамом. Такой, несколько неочевидный метод на практике даёт прекрасные результаты.
Ниже представленна таблица, в которой показываются действия Mozilla Mail при обработке сообщений. Она приведена для того, чтобы лучше понять, как проходит процесс "обучения".
Изначальный статус письма | Действие пользователя | Изменения таблиц |
Не определён (пользователь видит его как "not junk") | Отметить как junk | Добавить слова в таблицу "плохих" |
Не определён (пользователь видит его как "not junk") | Отметить как НЕ junk | Добавить слова в таблицу "хороших" |
Не Junk | Отметить как junk | Удалить слова из таблицы "хороших",добавить слова в таблицу "плохих" |
Не Junk | Отметить как НЕ junk | Изменений не происходит |
Junk | Отметить как junk | Изменений не происходит |
Junk | Отметить как НЕ junk | Удалить слова из таблицы "плохих",добавить слова в таблицу "хороших" |
А теперь со всей этой ... мы попытаемся взлететь
Вот, в общем-то, и всё, о чём я собирался рассказать в этой заметке. Удачной вам борьбы со спамом. В случае достаточного (или недостаточного?) количества пива я продолжу рассказ о методах борьбы со спамом, но уже на стороне сервера.
Alex Samorukov
Интересные ссылки: Право закон федеральные законы.
Комментариев к странице: 0 | Добавить комментарий
Домой | Проект ядро Core/2 | Проект OS/4 Download | Новости | Гостевая книга | Подробно обо всем | Нужные программы | Проекты | OS/2 FAQ | Всячина | За и Против | Металлолом | #OS2Russian | RDM/2 | Весёлые картинки | Наша галерея | Доска объявлений | Карта сайта | ПОИСК | ФОРУМ