Архив новостей

Искажение текста в спаме или сколько ошибок можно сделать в слове «viagra»

Один из приемов, который спамеры используют для обхода антиспам-фильтров, — искажение текста в письме тем или иным способом. Доведенный до крайности, этот метод приводит к нечитаемости рекламных писем и лишает их рассылку смысла.

Электронная почта — это современное и высокотехнологичное средство коммуникации. Она активно используется не только для обмена информацией, но и для продвижения товаров и услуг, в том числе — для проведения спамерских рекламных кампаний (массовой рассылки анонимной незапрошенной рекламы). Спамерская реклама крайне эффективна, так как спам охватывает огромную потребительскую аудиторию и обладает высокой скоростью распространения.

С каждым годом объемы спама неуклонно растут, и спам из побочного фактора почтовой коммуникации постепенно превратился в крупномасштабную угрозу электронной почте. Интернет-сообщество оказалось перед необходимостью искать средства защиты от этой угрозы, и в результате появился новый вид ПО — почтовые антиспам-фильтры. В свою очередь, спамеры не хотят отказываться от удобных и уже отлаженных способов рекламы, поэтому они также принимают ответные меры и пытаются найти способы обхода почтовых фильтров.

Таких способов появилось уже достаточно много. Часть из них работает на уровне технических и формальных характеристик письма, часть связана с оформлением и подачей контента, но, пожалуй, существует только один спамерский прием, который бросается в глаза даже неопытному пользователю и вызывает недоумение и протесты у рекламодателей.

Речь идет о намеренном искажении внешнего вида слов в тексте письма: сознательно внесенных орфографических ошибках, использовании символов различных цветов и так далее. Типичным примером намеренного искажения является написание слова viagra с использованием символа @ вместо латинской буквы «a»: vi@gra.

Намеренное искажение слов достаточно давно известно в теории и практике рекламного дела и используется там как самостоятельный стилистический прием. Но если в традиционной рекламе искажение в написании слов направлено на привлечение внимания читателя, то в спаме искажения преследуют совершенно иные цели. Они предназначены для решения конкретных практических задач, в частности, — помешать программе-фильтру распознать ключевые слова, типичные для спама, или не допустить отождествления двух и более текстов как «одинаковых».

Спамеры активно используют следующие три вида искажений:

  • замена одних элементов слова (букв) на другие
  • разбиение слова небуквенными символами
  • вставка в слово «лишних» элементов

При замене одних элементов слова другими могут использоваться буквы, принадлежащие языку, отличному от языка текста в целом, небуквенные символы и цифры. Например, в англоязычном спаме встречаются такие варианты написания слова viagra с использованием небуквенных символов, цифр и букв с надстрочными знаками (не используются в алфавите английского языка): vi@gra, viagr@, vi@gr@, vi("gra, v!agra, v|agra, v1agra, viágra, viagrá, viágrá и т.п.

Вот пример спамерского письма, содержащего рекламу пищевой добавки для снижения веса. Практически все слова в тексте данного письма содержат замены букв английского алфавита на буквы с диакритиками, принадлежащие алфавитам других европейских языков:

On átkíns or the soùth beaçh dïet, try our dìet pát¢h. A new cutting edge, advanced áppëtite sùpprèssant, mètabólism bôôster, and ènérgy ènháncer…all in one. The perfect sμpplemênt to ássist you in lôsiñg those extrá pôuñds just in time for sûmmèr

Lèarñ the trûth about losing wèight.

All ordérs backéd by our nó rísk, monéy back Gμarántêe!

Shìpped Discrëetly.

Еще одним распространенным способом замены символов является замена цифр на слова в контактных телефонах, которые спамеры размещают в своей рекламе. Например, Центр американского английского, пользующийся печальной славой «спамера No. 1» в Рунете, использует в своей рекламе следующие варианты написания телефона:

1 0 пять пять 1 8 6, один 0 пять пять 1 8 шесть, 1 0 пять пять 1 восемь 6

и так далее.

Второй тип намеренного искажения слова — разбиение — предполагает разделение слова на несколько частей таким образом, чтобы автоматические анализаторы не могли отождествить данное слово с элементами списков ключевых спамерских слов. Вот пример спама, в тексте которого использован прием разбиения. «Разбивающим» символом служит пробел, случайным образом расставленный в словах:

Ко неч но,   это   не   совсем че ст но,   но   ка ко й   му ж чи на   не   ме чт ал   тай но по дсы па ть   в   в ин о   св ое й   и зб ра нн иц ы   не ч то   та кое, от   че го   он а   бы на бр ос ил ась   на   н ег о   в   со ст оян ии   се кс уaл ьн oгo   исс туп лен ия . . .

Пр ед ла га ем   В а м, РЕ АЛ ЬН ОЕ,   СИ ЛЬ НО ДЕ ЙС ТВ УЮ ЩЕЕ   СР ЕД СТ ВО…

…МО МЕ НТ АЛ ЬН О   РА СТ ВО РЯ ЕТ СЯ   В   ЛЮ БО М   НА ПИ ТК Е, не   ос та вл яя   ни   ед ин ого   пр ив ку са!

Третий тип намеренных искажений — вставка лишних элементов — встречается, в основном, в письмах формата HTML, так как этот формат позволяет оформлять письмо шрифтами разных гарнитур, использовать различные цветовые эффекты. Достаточно распространенным приемом является вставка букв того же цвета, что и фон письма, например, белым шрифтом по белому фону. Читатель воспринимает такие слова как набранные в разрядку. Также у спамеров популярно случайное удвоение букв в словах, например:

«Фрегат» досставит на доом, в офис, на банкет икру чеерную, красную, крабы по цеенам ниже рыноочных.

Стремление спамеров обмануть контентные фильтры иногда приводит к анекдотическим результатам. Текст письма искажается настолько, что страдает его читаемость. Так произошло, например, со следующей рекламой медицинских препаратов:

Vl/GR/| $0.95 /l)0SE
C|/|L|S $2.00 /|)0SE
}{E|||C/lL $0.91 /l)()SE
PR()PECl/|GR/, GLUC()PH/|GR/|GE, V|0} {}{,
CELEBRE}{, |/|ERl|)l/, Z()L0FF, P/l}{lL, LlP|T()R
<E ll T E R>

Поскольку этот текст получился практически нечитаемым, ниже дан перевод на «обычный» английский язык:

VIAGRA $0.95 per dose
CIALIS $2.00 per dose
XENICAL $0.91 per dose
… etc.
<ENTER>

Некоторые из существующих антиспам-фильтров умеют так или иначе бороться с намеренными искажениями. Очевидно, что через какое-то время подавляющее большинство фильтров окажутся способными преодолевать подобные спамерские «трюки». Кроме того, заказчики рекламы чаще всего недовольны тем, что написанный ими рекламный текст попадает к потенциальным клиентам в искаженном виде. Поскольку такая рассылка воспринимается пользователями как «несерьезная», это приводит к снижению потребительского имиджа как фирмы-продавца, так и товара. А в итоге — к снижению продаж.

Поэтому можно предположить, что эта спамерская «хитрость» через какое-то время канет в лету и останется только в архивах. Уже сейчас мы видим, что наиболее продвинутые спамеры предлагают своим клиентам рассылки без удвоенных и ошибочно написанных букв: «эффективная e-mail рассылка без заикающихся букв в словах» (цитата из реальных предложений спамерских услуг).

Искажение текста в спаме или сколько ошибок можно сделать в слове «viagra»

Ваш e-mail не будет опубликован. Обязательные поля помечены *

 

Подпишитесь на еженедельную рассылку

Самая актуальная аналитика – в вашем почтовом ящике

Последние публикации
Отчеты

MosaicRegressor: угроза в недрах UEFI

Мы обнаружили скомпрометированный образ прошивки UEFI, содержащий вредоносный имплант для установки дополнительного вредоносного ПО на компьютеры жертв. Насколько мы знаем, это второй общеизвестный случай обнаружения активного заражения в прошивке UEFI.

Подпишитесь на еженедельную рассылку

Самая актуальная аналитика – в вашем почтовом ящике