← Все вакансии

ML Ops-инженер

<1 дня на сайте
Т-Банк
удаленно удалённо ML Senior Middle
Откликнуться на сайте Т-Банк →

Ищем инженера, который будет автоматизировать жизненный цикл ML-моделей: от разработки и тестирования до развертывания, мониторинга и поддержки в продакшене

Обязанности

  • Разрабатывать и поддерживать ML-пайплайны дообучения моделей машинного обучения

  • Развертывать AI-модели: настраивать CI/CD для ML, автоматизировать выкатку моделей, контролировать версионирование, создавать отказоустойчивую и масштабируемую среду, строить ML-пайплайны с Apache Airflow для обработки данных и внедрять open source-модели в инфраструктуру компании

  • Проводить мониторинг и обслуживание AI-моделей 

  • Управлять инфраструктурой в виде GPU-серверов 

  • Разворачивать и поддерживать современные ML-инструменты 

  • Документировать и стандартизировать практики вокруг обслуживания инфраструктуры для машинного обучения

  • Оптимизировать сервинг моделей: утилизация и виртуализация GPU, настройка GPU/CUDA-оптимизаций, конфигурирование сервинга для инференса, мониторинг работы моделей, алертинг 

  • Создавать программные модули для обучения и обслуживания AI-моделей

Требования

  • Знаете Python или Go, умеете писать production-ready код 

  • Работали с библиотеками для данных Pandas и NumPy, вели эксперименты — Jupyter, ClearML

  • Работали с хранилищами данных: S3, Postgres, Redis

  • Понимаете жизненный цикл ML-модели: обучение, валидация, переобучение

  • Знаете основные метрики качества моделей: AUC-ROC, Precision/Recall и другие

  • Работали с Docker и Kubernetes 

  • Развертывали модели в продакшн: Triton, Seldon, BentoML или аналоги

  • Настраивали мониторинг инфраструктуры Grafana и Prometheus, и самих моделей 

  • Умеете настраивать CI/CD пайплайны для ML: GitLab CI, AirFlow

  • Понимаете принципы Infrastructure as a Code, знаете Terraform или его аналоги

Задачи

Направление ML Ops — неотъемлемая часть инфраструктурных и продуктовых команд, которые участвуют в доставке ML-моделей в продакшен. 

Один из центров экспертизы ML Ops в Т-Банке — команда ML Core Platform.

ML Core — передовая платформа для машинного обучения, которая ускоряет разработку и внедрение ML-моделей в бизнес-процессы. Мы добавляем в платформу инструменты, которые обеспечивают эффективную разработку, обучение и прототипирование моделей. 

ML Core интегрирована с другими платформами и инструментами компании. Это позволяет нам внедрять и использовать модели в разных продуктах и сервисах: от информационной безопасности и рисков до голосовых технологий и R&D.

Мы предлагаем

  • Работу в офисе или удаленно — по договоренности

  • Возможность работы в аккредитованной ИТ-компании

  • ДМС со стоматологией, включая чекапы, компенсацию покупки лекарств и льготные условия страхования для близких. Еще — страховка от несчастных случаев и болезней

  • Рост по карьерному треку: проходите курсы по софт- и хард-скиллам, развивайтесь с поддержкой ментора и повышайте уровень с матрицей компетенций и регулярным ревью

  • Сильное комьюнити. Вы будете работать с экспертами в своей области, сможете делиться знаниями и выступать на конференциях, посещать митапы и писать статьи

  • Онлайн-консультации с психологами, юристами, специалистами по финансам и здоровому образу жизни

  • Компенсацию затрат на спортивные абонементы, приложение Т-Спорта для онлайн-занятий и командные тренировки с коллегами

  • 3 дополнительных дня к отпуску — можно использовать для отдыха или получить компенсацию

  • Специальные тарифы на продукты Т-Банка и широкую программу скидок от партнеров

  • Достойную зарплату — обсудим ее на собеседовании