Поддерживать разработку pipeline:
• Принимать активное участие в разработке и улучшении существующих pipeline-ов
• Анализировать требования к новым pipeline-ам и предлагать оптимальные решения
• Обеспечивать бесперебойную работу pipeline-ов и оперативно устранять возникающие проблемы
Применять необходимые алгоритмы и методики для автоматизации и ускорения выявления аномалий во временных рядах:
• Изучать и анализировать временные ряды данных для выявления закономерностей и аномалий
• Использовать математические модели и методы машинного обучения для прогнозирования и обнаружения аномалий
• Автоматизировать процесс выявления аномалий с помощью скриптов и инструментов
Проводить анализ, алгоритмизацию и автоматизацию контроля качества ключевых метрик после плановых событий:
• Детально изучать данные, выявлять закономерности и тенденции
• Определять оптимальные методы анализа и алгоритмы для автоматизации контроля качества
• Разрабатывать и внедрять системы автоматического мониторинга и оповещения о возможных проблемах
• Опыт работы в области Data Science от 2 лет
• Глубокое понимание алгоритмов машинного обучения и статистического анализа
• Навыки построения аналитических моделей на Python
• Опыт работы с реляционными (SQL) и распределёнными базами данных
• Опыт работы с Linux на базовом уровне
• Практические навыки работы с инструментами для разработки, такими как Docker, FastAPI, AirFlow, Streamlit
• Преимуществом будет опыт работы в телекоммуникационной отрасли, банковской сфере или цифровых индустриях
• Участие и успехи в соревнованиях по data mining (например, Kaggle) будут плюсом
• Знание английского языка на техническом уровне
• Умение работать в команде