Один из приемов, который спамеры используют для обхода антиспам-фильтров, — искажение текста в письме тем или иным способом. Доведенный до крайности, этот метод приводит к нечитаемости рекламных писем и лишает их рассылку смысла.
Электронная почта — это современное и высокотехнологичное средство коммуникации. Она активно используется не только для обмена информацией, но и для продвижения товаров и услуг, в том числе — для проведения спамерских рекламных кампаний (массовой рассылки анонимной незапрошенной рекламы). Спамерская реклама крайне эффективна, так как спам охватывает огромную потребительскую аудиторию и обладает высокой скоростью распространения.
С каждым годом объемы спама неуклонно растут, и спам из побочного фактора почтовой коммуникации постепенно превратился в крупномасштабную угрозу электронной почте. Интернет-сообщество оказалось перед необходимостью искать средства защиты от этой угрозы, и в результате появился новый вид ПО — почтовые антиспам-фильтры. В свою очередь, спамеры не хотят отказываться от удобных и уже отлаженных способов рекламы, поэтому они также принимают ответные меры и пытаются найти способы обхода почтовых фильтров.
Таких способов появилось уже достаточно много. Часть из них работает на уровне технических и формальных характеристик письма, часть связана с оформлением и подачей контента, но, пожалуй, существует только один спамерский прием, который бросается в глаза даже неопытному пользователю и вызывает недоумение и протесты у рекламодателей.
Речь идет о намеренном искажении внешнего вида слов в тексте письма: сознательно внесенных орфографических ошибках, использовании символов различных цветов и так далее. Типичным примером намеренного искажения является написание слова viagra с использованием символа @ вместо латинской буквы «a»: vi@gra.
Намеренное искажение слов достаточно давно известно в теории и практике рекламного дела и используется там как самостоятельный стилистический прием. Но если в традиционной рекламе искажение в написании слов направлено на привлечение внимания читателя, то в спаме искажения преследуют совершенно иные цели. Они предназначены для решения конкретных практических задач, в частности, — помешать программе-фильтру распознать ключевые слова, типичные для спама, или не допустить отождествления двух и более текстов как «одинаковых».
Спамеры активно используют следующие три вида искажений:
- замена одних элементов слова (букв) на другие
- разбиение слова небуквенными символами
- вставка в слово «лишних» элементов
При замене одних элементов слова другими могут использоваться буквы, принадлежащие языку, отличному от языка текста в целом, небуквенные символы и цифры. Например, в англоязычном спаме встречаются такие варианты написания слова viagra с использованием небуквенных символов, цифр и букв с надстрочными знаками (не используются в алфавите английского языка): vi@gra, viagr@, vi@gr@, vi("gra, v!agra, v|agra, v1agra, viágra, viagrá, viágrá и т.п.
Вот пример спамерского письма, содержащего рекламу пищевой добавки для снижения веса. Практически все слова в тексте данного письма содержат замены букв английского алфавита на буквы с диакритиками, принадлежащие алфавитам других европейских языков:
On átkíns or the soùth beaçh dïet, try our dìet pát¢h. A new cutting edge, advanced áppëtite sùpprèssant, mètabólism bôôster, and ènérgy ènháncer…all in one. The perfect sμpplemênt to ássist you in lôsiñg those extrá pôuñds just in time for sûmmèr
Lèarñ the trûth about losing wèight. All ordérs backéd by our nó rísk, monéy back Gμarántêe! Shìpped Discrëetly. |
Еще одним распространенным способом замены символов является замена цифр на слова в контактных телефонах, которые спамеры размещают в своей рекламе. Например, Центр американского английского, пользующийся печальной славой «спамера No. 1» в Рунете, использует в своей рекламе следующие варианты написания телефона:
1 0 пять пять 1 8 6, один 0 пять пять 1 8 шесть, 1 0 пять пять 1 восемь 6 |
и так далее.
Второй тип намеренного искажения слова — разбиение — предполагает разделение слова на несколько частей таким образом, чтобы автоматические анализаторы не могли отождествить данное слово с элементами списков ключевых спамерских слов. Вот пример спама, в тексте которого использован прием разбиения. «Разбивающим» символом служит пробел, случайным образом расставленный в словах:
Ко неч но, это не совсем че ст но, но ка ко й му ж чи на не ме чт ал тай но по дсы па ть в в ин о св ое й и зб ра нн иц ы не ч то та кое, от че го он а бы на бр ос ил ась на н ег о в со ст оян ии се кс уaл ьн oгo исс туп лен ия . . .
Пр ед ла га ем В а м, РЕ АЛ ЬН ОЕ, СИ ЛЬ НО ДЕ ЙС ТВ УЮ ЩЕЕ СР ЕД СТ ВО… …МО МЕ НТ АЛ ЬН О РА СТ ВО РЯ ЕТ СЯ В ЛЮ БО М НА ПИ ТК Е, не ос та вл яя ни ед ин ого пр ив ку са! |
Третий тип намеренных искажений — вставка лишних элементов — встречается, в основном, в письмах формата HTML, так как этот формат позволяет оформлять письмо шрифтами разных гарнитур, использовать различные цветовые эффекты. Достаточно распространенным приемом является вставка букв того же цвета, что и фон письма, например, белым шрифтом по белому фону. Читатель воспринимает такие слова как набранные в разрядку. Также у спамеров популярно случайное удвоение букв в словах, например:
«Фрегат» досставит на доом, в офис, на банкет икру чеерную, красную, крабы по цеенам ниже рыноочных. |
Стремление спамеров обмануть контентные фильтры иногда приводит к анекдотическим результатам. Текст письма искажается настолько, что страдает его читаемость. Так произошло, например, со следующей рекламой медицинских препаратов:
Vl/GR/| $0.95 /l)0SE C|/|L|S $2.00 /|)0SE }{E|||C/lL $0.91 /l)()SE PR()PECl/|GR/, GLUC()PH/|GR/|GE, V|0} {}{, CELEBRE}{, |/|ERl|)l/, Z()L0FF, P/l}{lL, LlP|T()R <E ll T E R> |
Поскольку этот текст получился практически нечитаемым, ниже дан перевод на «обычный» английский язык:
VIAGRA $0.95 per dose CIALIS $2.00 per dose XENICAL $0.91 per dose … etc. <ENTER> |
Искажение текста в спаме или сколько ошибок можно сделать в слове «viagra»