Анализ движения мыши с помощью машинного обучения и методики определения автоматизированных ботов. Часть I.

Clickfraud
Clickfraud

Основанием для написания этого небольшого цикла статей про анализ движения мыши с помощью машинного обучения стало то, что в своей работе над системой защиты от автоматизированных ботов мы  в Clickfraud занялись поиском новых методов защиты. В этой статье разберем методики определения автоматизированных ботов.

В последнее время злоумышленники все чаще используют автоматизированных ботов, которые приходят на сайт под видом обычных пользователей и осуществляют вредоносную деятельность. Например, одним из видов такой деятельности является мошенничество с кликами (clickfraud). Боты повторяют действия человека, создавая имитацию движения мыши, кликая на рекламу и тем самым наносят финансовый ущерб рекламодателям. В связи с этим у владельцев сайтов возросла потребность в инструментах обнаружения ботов среди обычных посетителей сайта.

Сама же задача выявления автоматизированных ботов в общем потоке трафика является весьма непростой. Различают два типа методов определения ботов:

  • Определение ботов через решение тестов. То есть алгоритм определяет, является ли пользователь человеком, после решения задачи (CAPTCHA, или Капча) на сайте.
  • Определение ботов в фоновом режиме. Это когда алгоритмы анализируют набор параметров пользователей во время их взаимодействия с сайтом.

Определение ботов через решение тестов имеет свои ограничения. С одной стороны, системы Капча бывают сложными в том числе и для людей, а с другой стороны, простые системы Капча решаются автоматизированными ботами с помощью машинного обучения.

Для фонового определения ботов обычно используются такие параметры, как присутствие IP-адреса пользователя в черных списках, использование автоматизированными ботами определенных версий браузера для тестирования ПО и многие другие. Но и такие методы определения ботов часто допускают ошибки. Например, не всегда присутствие IP-адреса пользователя в черном списке означает, что это бот-сессия, а версия веб-браузера не всегда определяется корректно.

Приняв во внимание выявленные недостатки, а также уже имеющихся исследований в области обнаружения ботов с использованием поведенческой биометрии, мы в Clickfraud решили разработать программное обеспечение, которое определяет ботов на основании информации о движении мыши пользователей. За основу мы взяли тот факт, что поведенческие паттерны обычных пользователей и автоматизированных ботов отличаются.

Основанием для нашей разработки в Clickfraud стали запросы пользователей на более точный алгоритм обнаружения ботов на сайте, чтобы повысить эффективность борьбы с имитацией движения мыши. Поэтому в рамках проекта по защите от скликивания мы решили воспользоваться для определения ботов алгоритмами машинного обучения. В качестве исходных данных берутся сведения о пользовательских сессиях, собранных в течение разработки ПО и испытаний его работоспособности.

После того, как мы получили статистические данные о движении мыши каждого пользователя и параметры качества сессии, мы в Clickfraud обучили нейронную сеть выявлять ботов среди обычных людей. Также оценили эффективность обнаружения ботов на сайтах пользователей и смогли достигнуть точности определения автоматизированных ботов из общего анализируемого трафика более 90% анализируемых сессий пользователей. В качестве методик испытаний мы использовали тестовые запуски модели ML с разными алгоритмами, где замерялись показатели точности алгоритма и проценты выявления “хороших” и “плохих” сессий. В своей работе мы использовали информацию из исследований в области поведенческой биометрии, провели анализ и сравнение данных о скоростях, временных интервалах и других параметрах движений мыши разных пользователей.

Мы в Clickfraud считаем, что разработанная программа по определению движения мыши будет востребована теми пользователями, которые размещают рекламу и хотят отслеживать нежелательный трафик на своих объявлениях, а также намерены эффективно экономить рекламные бюджеты, отсекая ложные клики.

В последующих статьях мы остановимся подробнее на алгоритмах определения ботов с помощью движения мышки.

clickfraud, ООО “ИНТЕРНЕТ ЗАЩИТА”, ИНН 7806602123, ОГРН 1227800111769, info@clickfraud.ru
Просмотров: 0