• Работа с разнородными источниками данных (Oracle, Hadoop)
• Подготовка, очистка и предобработка данных, построение агрегатов
• Ad-hock аналитика
• Разработка аналитических моделей, проверка значимости результатов моделей (AB-тестирование) и эффективности кампаний
Мы используем
Oracle Exadata (SQL, PL/SQL), Cloudera Hadoop, Hive, Spark, Pyspark, Python (sklearn, xgboost, pandas, etc), Linux bash. Система контроля версий: git
• Высшее или неоконченное высшее техническое образование
• Аналитический склад ума, понимание математики, статистики и теории вероятностей
• Желание развиваться в области data science
• Понимание алгоритмов машинного обучения, статистического анализа
• Знание языка программирования Python
• Знание языка запросов SQL
• Ответственность за результат
• Военный билет или проставленная отсрочка в приписном свидетельстве (для юношей)