ru

en

Карьера

  1. Simtech Group

    Работал офисным сисадмином: заказывал оборудование, устанавливал ОС и конфигурировал ПО, ремонтировал оргтехнику и отвечал на вопросы пользователей.

    Поддерживал и развивал серверный парк для коммерческих веб-проектов, следил за стабильностью их работы.

    За два года я установил кластер для коммерческих проектов компании и автоматизировал его развёртку. Настроил системный мониторинг в компании, улучшив качество работы сервисов.

    Запустил IP-телефонию для отдела продаж, а также упростил документооборот для бухгалтерии в офисе. Задокументировал инфраструктуру и запустил первую базу знаний компании.

  2. Simtech Development

    Основал проект хостинг-платформы для интернет-магазинов в составе обособленного подразделения компании-интегратора.

    Управлял небольшой командой эксплуатации, автоматизировал процессы и инфраструктуру, вёл деловую переписку с заказчиками и занимался продвижением услуг.

    Организовал работу с отделом продаж, разработки и технической поддержки. Построил финансовую модель, разработал тарифные планы услуги и разработал стратегии продвижения среди клиентов.

    Установил, настроил и автоматизировал ядро услуги, запустил мониторинг и сервис резервного копирования.

  3. FunBox

    Администрировал внутреннюю и внешнюю инфраструктуры для коммерческих B2B и B2C проектов. Запустил более 10 проектов: от проектирования архитектуры до передачи в эксплуатацию команде поддержки и, реже, вывода из эксплуатации.

    Организовал техническую площадку для митапов, помогая сотрудникам обмениваться знаниями. Выпускал видеоролики на YouTube и развивал DevRel: помогал компании строить HR-бренд и привлекать соискателей.

    Разработал мониторинг резервного копирования, ускорив время реакции на проблемы при сохранении данных.

    Запустил георезервированный, отказоустойчивый и масштабируемый Kafka-кластер для обслуживания трафика свыше 1Gbps. Настроил мониторинг брокеров Kafka для интеграции в командах разработки.

    Запустил единую систему визуализации метрик Grafana, улучшив качество мониторинга и поддержки проектов.

    Запустил георезервированный и масштабируемый ClickHouse-кластер для мониторинга и решения бизнес-задач коммерческих проектов. Построил централизованную систему сбора логов с балансировщиков нагрузки, ускорив до 100 раз время поиска событий инженерами техподдержки.

    Запустил офисную систему контроля доступа и видеонаблюдения, а также улучшил качество работы с охранным агентством. Благодаря изменениям избавились от инцидентов безопасности.

    Запустил хранилище артефактов для релизов приложений, что позволило консолидировать общие зависимости в проектах. Это изменение оказало существенное влияние на развитие разработки, CI и качества тестирования проектов.

    Запустил корпоративный Kubernetes-кластер для проектов компании на Baremetal. Автоматизировал развёртку и конфигурацию ОС и платформы, описав инфраструктуру как код. Настроил первое S3-совместимое объектное хранилище для артефактов GitLab.

    Запустил VictoriaMetrics для сбора метрик приложений компании и кластер сбора и архивации журналов приложений на базе Vector и Loki.

  4. SberMarket

    Контекст. СберМаркет — это eCommerce-проект по доставке продуктов и товаров из любимых магазинов и ресторанов, представленный тремя монолитными приложениями на Ruby/Rails и несколькими сотнями связанных с ними микросервисами.

    Организационная структура компании иерархическая: ИТ-департамент состоит из доменов, домены состоят из юнитов, а юниты — из команд с инженерами. Команды преимущественно кросс-функциональны.

    Присоединился к команде в 2022-м году в роли Senior DevOps Engineer в домене ИТ-эксплуатации, а с конца 2022-го года руководил подгруппой SRE для домена Customer, что отвечает за надёжность пути покупателя в мобильном и веб-приложении СберМаркет.

    Более 50% трафика интернет-магазина приходится на «витрину» — самое крупное монолитное приложение на Ruby/Rails, над которым работает свыше 45 команд.

    С середины 2023-го года работаю в должности руководителя направления юнита, что отвечает за надёжность и производительность клиентской витрины: жизненного цикла заказа, платежей и фискализации.


    Оптимизация SDLC. Проанализировал, оптимизировал и сделал наблюдаемым SDLC. Сократил время сборки на 90%, ускорил доставку на 15%, ускорил стадию тестирования на 50% за счёт распараллеливания юнит-тестов и автоматической маркировки flaky-тестов. Увеличил частоту релизов в два раза, но сохранил низкую долю ошибок при выпуске новых версий.

    Запустил первую версию DORA-мониторинга для проектов, позволяя удерживать баланс между скоростью разработки и стабильностью системы.

    Завершил проект Code Push — технологии доставки обновлений на iOS и Android. В результате удалось сократить Release Cycle Time мобильной разработки до пары часов и обойти санкционные ограничения.

    Контейнеризировал и смигрировал «витрину» в платформу (PaaS) без простоя, что позволило унифицировать инструменты разработки и эксплуатации.

    Улучшение надёжности. Добавил поддержку канареечных релизов в «витрину», что позволило сократить влияние на пользователей, а также уменьшить время восстановления после сбоя за счёт автоматического отката «плохих» релизов.

    Инициировал и запустил первую версию SLO/SLA в компании, адаптировал инструмент для 100% критичных сервисов. Проанализировал и разработал мониторинг критичного пути пользователя для направлений Grocery и RTE (рестораны), что позволило сделать наблюдаемым сбои в системе и оценивать их влияние на бизнес.

    Подготовка к высоким нагрузкам. Завершил миграцию контента из «витрины» в PIM-систему, что позволило сократить нагрузку и увеличить ёмкость кластера.

    Организовал работу команды нагрузочного тестирования и разработал методологию, что позволило организовать регрессионное тестирование ёмкости приложений в компании. Удалось увеличить число тестов в 6 раз, покрыть тестами 92% пользовательского трафика, а также стать драйвером к увеличению ёмкости в командах разработки.

    Инициировал и лидировал кросс-доменный проект подготовки СберМаркета к высокому сезону с 200 участниками: разработал стратегию подготовки к высокому сезону, включая несколько планов и оценку рисков отказов; организовал работу команд и фасилитировал продвижение проектов. В результате за полгода увеличил производительность в 2.2 раза при сохранении доступности в 99.9%.

    Развитие ИТ-бренда. Запустил некоммерческий DevRel-проект «Архитектурные ката» — игр для начинающих архитекторов, с целью популяризации навыка проектирования (system design) в компании и за её пределами. За год собрал сообщество на 900 человек и провёл больше 10 сессий игр.

    Выступил 10+ на ИТ-конференциях и тематических митапах. Опубликовал 4 статьи и стал номинантом «Технотекст-2023» на Хабре.


    Сейчас занимаюсь продуктовыми и техническими проектами: сокращаю издержки в заказах, развиваю универсальную платёжную и фискальную платформы, готовлю проекты к высоким нагрузкам. Также являюсь идеологом развития SRE-практик в командах.