Работал офисным сисадмином: заказывал оборудование, устанавливал ОС и конфигурировал ПО, ремонтировал оргтехнику и отвечал на вопросы пользователей.
Поддерживал и развивал серверный парк для коммерческих веб-проектов, следил за стабильностью их работы.
За два года я установил кластер для коммерческих проектов компании и автоматизировал его развёртку. Настроил системный мониторинг в компании, улучшив качество работы сервисов.
Запустил IP-телефонию для отдела продаж, а также упростил документооборот для бухгалтерии в офисе. Задокументировал инфраструктуру и запустил первую базу знаний компании.
Основал проект хостинг-платформы для интернет-магазинов в составе обособленного подразделения компании-интегратора.
Управлял небольшой командой эксплуатации, автоматизировал процессы и инфраструктуру, вёл деловую переписку с заказчиками и занимался продвижением услуг.
Организовал работу с отделом продаж, разработки и технической поддержки. Построил финансовую модель, разработал тарифные планы услуги и разработал стратегии продвижения среди клиентов.
Установил, настроил и автоматизировал ядро услуги, запустил мониторинг и сервис резервного копирования.
Администрировал внутреннюю и внешнюю инфраструктуры для коммерческих B2B и B2C проектов. Запустил более 10 проектов: от проектирования архитектуры до передачи в эксплуатацию команде поддержки и, реже, вывода из эксплуатации.
Организовал техническую площадку для митапов, помогая сотрудникам обмениваться знаниями. Выпускал видеоролики на YouTube и развивал DevRel: помогал компании строить HR-бренд и привлекать соискателей.
Разработал мониторинг резервного копирования, ускорив время реакции на проблемы при сохранении данных.
Запустил георезервированный, отказоустойчивый и масштабируемый Kafka-кластер для обслуживания трафика свыше 1Gbps. Настроил мониторинг брокеров Kafka для интеграции в командах разработки.
Запустил единую систему визуализации метрик Grafana, улучшив качество мониторинга и поддержки проектов.
Запустил георезервированный и масштабируемый ClickHouse-кластер для мониторинга и решения бизнес-задач коммерческих проектов. Построил централизованную систему сбора логов с балансировщиков нагрузки, ускорив до 100 раз время поиска событий инженерами техподдержки.
Запустил офисную систему контроля доступа и видеонаблюдения, а также улучшил качество работы с охранным агентством. Благодаря изменениям избавились от инцидентов безопасности.
Запустил хранилище артефактов для релизов приложений, что позволило консолидировать общие зависимости в проектах. Это изменение оказало существенное влияние на развитие разработки, CI и качества тестирования проектов.
Запустил корпоративный Kubernetes-кластер для проектов компании на Baremetal. Автоматизировал развёртку и конфигурацию ОС и платформы, описав инфраструктуру как код. Настроил первое S3-совместимое объектное хранилище для артефактов GitLab.
Запустил VictoriaMetrics для сбора метрик приложений компании и кластер сбора и архивации журналов приложений на базе Vector и Loki.
Контекст. Купер (ex СберМаркет) — это eCommerce-проект по доставке продуктов и товаров из любимых магазинов и ресторанов, представленный тремя монолитными приложениями на Ruby/Rails и несколькими сотнями связанных с ними микросервисами.
Организационная структура компании иерархическая: ИТ-департамент состоит из доменов, домены состоят из юнитов, а юниты — из команд с инженерами. Команды преимущественно кросс-функциональны.
Присоединился к команде в 2022-м году в роли Senior DevOps Engineer в домене ИТ-эксплуатации, а с конца 2022-го года руководил подгруппой SRE для домена Customer, что отвечает за надёжность пути покупателя в мобильном и веб-приложении Купера.
Более 50% трафика интернет-магазина приходится на «витрину» — самое крупное монолитное приложение на Ruby/Rails, над которым работает свыше 45 команд.
С середины 2023-го года работаю в должности руководителя направления юнита, что отвечает за надёжность и производительность клиентской витрины: жизненного цикла заказа, платежей и фискализации.
Оптимизация SDLC. Проанализировал, оптимизировал и сделал наблюдаемым SDLC. Сократил время сборки на 90%, ускорил доставку на 15%, ускорил стадию тестирования на 50% за счёт распараллеливания юнит-тестов и автоматической маркировки flaky-тестов. Увеличил частоту релизов в два раза, но сохранил низкую долю ошибок при выпуске новых версий.
Запустил первую версию DORA-мониторинга для проектов, позволяя удерживать баланс между скоростью разработки и стабильностью системы.
Завершил проект Code Push — технологии доставки обновлений на iOS и Android. В результате удалось сократить Release Cycle Time мобильной разработки до пары часов и обойти санкционные ограничения.
Контейнеризировал и смигрировал «витрину» в платформу (PaaS) без простоя, что позволило унифицировать инструменты разработки и эксплуатации.
Улучшение надёжности. Добавил поддержку канареечных релизов в «витрину», что позволило сократить влияние на пользователей, а также уменьшить время восстановления после сбоя за счёт автоматического отката «плохих» релизов.
Инициировал и запустил первую версию SLO/SLA в компании, адаптировал инструмент для 100% критичных сервисов. Проанализировал и разработал мониторинг критичного пути пользователя для направлений Grocery и RTE (рестораны), что позволило сделать наблюдаемым сбои в системе и оценивать их влияние на бизнес.
Подготовка к высоким нагрузкам. Завершил миграцию контента из «витрины» в PIM-систему, что позволило сократить нагрузку и увеличить ёмкость кластера.
Организовал работу команды нагрузочного тестирования и разработал методологию, что позволило организовать регрессионное тестирование ёмкости приложений в компании. Удалось увеличить число тестов в 6 раз, покрыть тестами 92% пользовательского трафика, а также стать драйвером к увеличению ёмкости в командах разработки.
Инициировал и лидировал кросс-доменный проект подготовки Купера к высокому сезону с 200 участниками: разработал стратегию подготовки к высокому сезону, включая несколько планов и оценку рисков отказов; организовал работу команд и фасилитировал продвижение проектов. В результате за полгода увеличил производительность в 2.2 раза при сохранении доступности в 99.9%.
Развитие ИТ-бренда. Запустил некоммерческий DevRel-проект «Архитектурные ката» — игр для начинающих архитекторов, с целью популяризации навыка проектирования (system design) в компании и за её пределами. За год собрал сообщество из 1000+ человек и провёл больше 10 сессий игр.
Выступил 10+ на ИТ-конференциях и тематических митапах. Опубликовал 4 статьи и стал номинантом «Технотекст-2023» на Хабре.
Сейчас занимаюсь продуктовыми и техническими проектами: сокращаю издержки в заказах, развиваю универсальную платёжную и фискальную платформы, готовлю проекты к высоким нагрузкам. Также являюсь идеологом развития SRE-практик в командах.