1 место на чемпионате по искусственному интеллекту
Предсказываем покупки, удерживаем клиентов, ловим мошенников.
Команда Surf заняла первое место на чемпионате по искусственному интеллекту на Russian Artificial Intelligence Forum. Задача RAIF — показать бизнесу, что самые сложные из реальных и актуальных задач можно эффективно решать с помощью машинного обучения. Всего в соревновании участвовали больше двухсот команд.
Задачи определили партнеры форума: банк Уралсиб, Альфа-страхование и М.Видео
- AI в ритейле — Увеличить конверсию интернет-магазина из визитов в покупки
- AI в банках — Предсказать вероятность оттока клиентов и предложить способы удержания
- AI в страховании — Выявлять случаи страхового мошенничества
Все три задачи показались нам интересными, поэтому решали их параллельно. Главная польза чемпионата в том, что задачи выбраны не просто интересные, а применимые в живом бизнесе. Можно работать с реальными данными крупных компаний и получить опыт, который пригодится в будущих проектах. В ритейле мы заняли первое место, в банках и страховании наши решения вошли в топ лучших.
AI в ритейле: предсказываем вероятность покупки в реальном времени
Ближе всего нам оказалась задача М.Видео. Мы много работаем с ритейлом и e-commerce, хорошо понимаем такой бизнес. Да и наш собственный продукт изначально создавался для ритейла.
Что, если мы будем знать, с какой вероятностью пользователь совершит покупку в момент, когда он еще находится на сайте?
- Можем рекомендовать товары, которые пользователь купит с большей вероятностью.
- Можем предлагать специальные условия на покупку.
- Можем понять, что покупателю требуется помощь и сразу связать его с консультантом.
Для этого используем сверточную нейросеть, анализирующую информацию о поведении пользователя. Такие данные есть у большинства интернет-магазинов, но используются пока не на полную катушку. Сейчас статистику анализируют маркетологи, строят стратегии на будущее и разбирают ошибки. С AI можно не только находить невидимые для человека зависимости, но и оптимизировать воронку продаж в реальном времени.
В случае задачи от М.Видео:
- Считываем признаки конкретной сессии.
- Передаем данные в модель.
- Получаем вероятность покупки в рамках сессии.
- Действуем, чтобы увеличить эту вероятность.
В будущем AI можно научить искать зависимости в покупках внутри одной сессии, находить важную для предсказания информацию в cookies и многому другому. Чемпионат закончился, но задача не стала менее актуальной, будем развивать эти идеи дальше.
AI в банках: удерживаем клиентов
Задача банка «Уралсиб» была интересна по-своему: нужно не только предсказать отток пользователей, но и придумать, как их удержать. А значит одного только технического опыта здесь недостаточно, нужно и хорошее понимание бизнеса.
Мы решили предсказывать вероятность того, что клиент на 2 месяца прекратит пользоваться услугами банка. Обычно такие клиенты не возвращаются. А чтобы времени на ответную реакцию хватало, предсказание должно формироваться минимум за месяц до этого.
Данные банка помогли нам разделить клиентов на 3 типа, в зависимости от прибыли, которую они приносят. Для самых выгодных клиентов даже небольшая вероятность отказа требует ответных действий. Для средних — вмешиваться стоит, если вероятность отказа большая. В случае клиентов, приносящих меньше всего прибыли — вмешиваться неэффективно.
Чтобы эффективно бороться с оттоком мало одного понимания банковской сферы и конкурсных данных. Здесь потребовалось бы плотное взаимодействие с самим банком и гораздо больший объем информации. Но, увы, не было даже данных о том, как сам банк уже борется с оттоком.
AI в страховании: ловим мошенников
Искусственный интеллект может стать спасательным кругом для рынка ОСАГО. Сейчас рентабельность страдает от массовых случаев мошенничества. Службы безопасности страховых компаний тратят огромные ресурсы на борьбу со злоумышленниками, но мошенников все равно становится только больше.
Задача — создать аналитическую модель, которая на основе данных о текущих страховых случаях сможет самостоятельно выявлять мошенников. Подходы к решению этой задачи у большинства команд оказались схожими, различалась лишь эффективность реализации. Мы обратились к классике: использовали XGBoost и логистическую регрессию.
К сожалению, быстро стало понятно, что для серьезного решения данных явно недостаточно. Во-первых, было нужно больше примеров. Во-вторых — больше признаков, влияющих на целевую переменную. Например, личная информация о заявителе и данные о ДТП, которые можно взять с сайта МВД.
Построенные на правильных данных системы в будущем помогут очистить страховой рынок от мошенников. Нужно лишь правильно подобрать данные и привлечь опытных аналитиков.
Участие в РАИФ — интересный опыт. Попробовали силы в новых задачах и потренировались на данных, которые иначе получить сложно.
Наработки хотим использовать как фундамент для будущих проектов.