Москва

Devops LLM

DevOps/SRE

Требуемый опыт

от 3 до 6 лет

Занятость

Полный рабочий день

Ключевые навыки

Администрирование Linux
Docker

Какие задачи необходимо решать

  • Организация и поддержка инструментов и процесса непрерывной интеграции/развертывания сервисов в области аналитики больших данных
  • Развитие, поддержка и резервирование различных сред – разработки/тестирования/пре-продуктивной/продуктивной
  • Обновление технической документации (внесение обновлений о процессах в Confluence)
  • Ведение коммуникаций с подразделениями разработки, машинного обучения, эксплуатации инфраструктурных платформ

Расширение команды в связи с внедрением новых вариативных LLM подходов в текущие бизнес-процессы, для оптимизации рутинных задач и улучшения клиентского опыта посредством персонализации.

Для решения этих задач требуется

  • Практический опыт внедрения и поддержки сервисов релевантного технологического стека от 5 лет
  • Опыт тонкой настройки системы ПО (nginx, python apps , СУБД), понимание методологии infrastructure-as-code, опыт применения соответствующих решений (ansible), глубокая экспертиза в устранении и предотвращении сбоев
  • Опыт работы со средами изоляции/контейнеризации, например, Docker Swarm и Kubernetes (знание сильных и слабых сторон, навыки создания манифестов, организация container networking), опыт оптимизации сборки образов, экспертные знания в этой сфере
  • Опыт построения pipelines для сборок и деплоя различных приложений и их реализации (GitLab) с использованием gitlab-runner ( знания Jenkins приветствуются) в разделённых средах (dev/test/stage/prod)
  • Опыт настройки резервирования сред и данных
  • Опыт развертывания и поддержки airflow2
  • Опыт развертывания и поддержки nexus, gitlab, gitlab-runner
  • Опыт развёртывания хранилищ glusterFS и minio
  • Экспертные знания Unix-подобных OS (Linux RHEL 8, CentOS 8-9, Астра)
  • Опыт работы с базами данных (Oracle/PostgreSQL/Hive и т.п.)
  • Уверенные знания shell/bash, Python и/или других скриптовых языков
  • Опыт работы и выявления ошибок в REST API (с использованием cURL/Postman/пр.)
  • Опыт построения высоконагруженных систем и организации мониторинга (prometeuth + grafana + ELK) с возможностью оповещения о сбоях; Опыт работы с экосистемой Hadoop/Spark

Мы предлагаем

Оформление по ТК РФ
Справедливая и прозрачная система вознаграждения
ДМС со стоматологией
Компенсация мобильной связи
Маркетплейс льгот и сервисов Mega4You
Понятный карьерный маршрут
2500 учебных программ в мобильном приложении МегаФон Драйв
Программа поддержки и помощи сотрудникам
Активное корпоративное сообщество и насыщенный календарь событий