Ведущий инженер доступности
1 день на сайтеОблачная платформа VK Tech
Наша команда SRE — это техническое сердце платформы, отвечающее за её бесперебойную работу и развитие.
Мы не просто поддерживаем инфраструктуру, мы активно участвуем в жизненном цикле продуктов, делая облако быстрее, надёжнее и технологичнее.
Задачи
- Проектирование и эксплуатация отказоустойчивых сервисов
- Администрирование и поддержка серверной инфраструктуры
- Написание и правка ролей для автоматизированного развёртывания сервисов
- Исправление багов и доработка внутреннего инструментария для уменьшения рутины и ускорения выполнения типовых задач
- Доработка систем мониторинга, реагирование на инциденты, разбор инцидентов в рамках дежурства
Требования
- Опыт работы с операционной системой Linux
- Опыт в написании ролей и плейбуков на Ansible
- Знание Jinja2
- Опыт производственной эксплуатации кластеров Kubernetes как с инфраструктурной стороны, так и со стороны сервисов
- Опыт настройки HAProxy в производственной среде
- Опыт написания автоматизации на Python, Shell
- Понимание стека TCP/IP и протокола HTTP в частности
- Опыт работы с кластерами Galera, Postgres, Kafka, Redis, etcd
- Умение использовать утилиты для низкоуровневого траблшутинга работы
Будет плюсом
- Опыт работы с Openstack в части IaaS компонент
- Опыт работы с протоколами маршрутизации BGP
- Наличие пет-проекта на Python/Go
- Знакомство с практиками CI/CD