Data Scientist, Москва

Ищем коллегу для работы над проектами Fraud Management System и Revenue Leakage Control.

Задачи:

  • Построение моделей, предсказывающих доходность(маржинальность) клиентов. Работать предстоит в небольшой команде, поэтому велика вероятность принимать непосредственное участие еще в ряде проектов -выявление нетипичного поведения абонентов (фрода) в потоке данных, скоринг дебиторской задолженности и др.
  • В процессе работы необходимо будет не только проводить исследования и строить ML модели, но и писать бизнесовый код, продумывать проведение экспериментов (А/B тестов) и мн. др., в общем –принимать участие в полном цикле разработки ML-модуля в большом проекте.

Необходимые знания и опыт:

  • 2-4 года опыта работы в R&D или на должности Data Scientist
  • Опыт применения ML в бизнес-задачах, вывод моделей«на бой» (production)
  • Знания классических алгоритмов ML (бустинги –обязательно)
  • Умение работать с большими объемами данных –загрузка, препроцессинг, обучение. Что делать, если весь датасет не помещается в оперативку
  • Визуализация данных и результатов, интерпретация результатов модели
  • Умение построения полезных признаков из огромного массива данных (Feature Engineering)
  • Хорошее владение Python и ML-стеком (стандартные библиотеки для ML + мультипроцессинг). 

Будет плюсом:

  • Высшее техническое образование;
  • Знание C# (или других языков со статической типизацией);
  • Медали на Kaggle (или в схожих системах) в табличных соревнованиях;
  • Опыт работы с базами данных (MySQL, MariaDB ит.п.);
  • Опыт с распределенными вычислениями (PySpark);
  • Опыт работы с контейнерами (Docker);
  • Опыт разработки веб-сервисов (Flask,REST-API);
  • Опыт работы с фреймворками keras/tensorflow/pytorch.
  • Опыт работы с Uplift моделями