• Формализация и декомпозиция исследовательских задач
• Сбор данных (структурированные и неструктурированные) из различных систем
• Подготовка датасетов для ML-задач
• Анализ данных, поиск закономерностей в них
• Проверка и создание гипотез
• Разработка предиктивных признаков (feature engineering)
• Разработка ML-модели и подбор гиперпараметров (классические ML-алгоритмы, бустинг, нейронные сети)
• Оценка качества ML-моделей, выбор адекватных задаче метрик
• Поддержка и сопровождение разработанных ML-моделей
• Участие в автоматизации поставки данных для моделей
• Участие в работах по внедрению новых АПК, инструментов, интерфейсов и их тестировании для задач антифрода
• Опыт работы с БД Oracle (SQL диалект, аналитические функции, триггеры, PL\SQL, hint-ы, оптимизация запросов) или PostgreS, Clickhouse
• Желание понимать и работать с данными: видеть за ними физический смысл, понимать назначение источников и их характеристики, сопоставлять данные, уметь делать обоснованные выводы
• Уверенное владение Python и основными библиотеками анализа данных и ML
• Опыт аналитических исследований
• Опыт формирования и проверки гипотез
• Опыт планирования, проведения экспериментов и доведение их до логического конца
• Навыки разработки в VSCode, PyCharm, Jupyter Notebook
• Будет плюсом: - Опыт работы с BI платформами (Splunk) - Опыт текстовой аналитики (NLP, NER в Pytorch) - Опыт анализа звука/голоса - Знание основ Apache Spark, Hadoop, Airflow