Top.Mail.Ru

Senior MLops

В архиве c 30 марта 2024
Москва
260 000 - 384 000 ₽

Обязанности:

  • сбор и спецификация функциональных и нефункциональных требований к промышленным решениям с использованием AI-моделей
  • оценка нагрузки и выбор систем хранения
  • формирование технических требований для обеспечения масштабируемости, надежности и низкой задержки работы микросервисов
  • разработка и актуализация микросервисной архитектуры с учетом одобренного тех. стека
  • определение архитектурного data-ландшафта всего продукта
  • реализация скриптов предобработки и загрузки данных в БД (Python, стандартные библиотеки для работы с данными)
  • подготовка Python-скриптов к использованию в серверном окружении в рамках микросервисной архитектуры
  • реализация логики обработки данных в БД Postgres (PL/pgSQL) и Greenplum
  • организация интеграций с Централизованным ХД (Greenplum) в рамках ETL-пайплайнов

Требования:

  • контейнеризация: Docker, OpenShift, K8s
  • инструменты DevOps (MLOps): Bitbucket, Nexus, Jenkins
  • брокеры сообщений: Kafka, RabbitMQ
  • ML System Design (от этапа scope refinement до модульного дизайна с выделением подсистем хранения и аналитики)
  • сбор и спецификация требований к произвольному элементу data-ландшафта: pipeline, DB, DWH (dim/lkp/fact/table, DDS/ODS, data mart)
  • OLTP vs OLAP
  • продвинутый уровень SQL (DDL, DML, DCL, TCL + диалекты T-SQL, PL/SQL, PL/pgSQL)
  • SMP СУБД: MS SQL Server, MySQL, Oracle, PostgreSQL и др.
  • MPP СУБД: Teradata, Greenplum и др.
  • опыт обработки больших объемов данных и распараллеливания вычислений
  • ER-моделирование: инфологическая, даталогическая модели
  • нормализация БД (3 НФ)
  • знание ETL/ELT + ETL-инструменты: Apache NiFi/Airflow, Ab Initio, Informatica и др.
  • знание ЯП Python: функциональный подход, ООП, библиотеки для анализа данных, WEB-фреймворки (Flask, Django и др.)
  • ключевые архитектурные парадигмы построения детального слоя хранилищ данных (DDS DWH), а именно Star/Snowflake Schema, Data Vault 1.0/2.0, Anchor Modelling
  • логирование основных событий в БД, в том числе для выстраивания мониторинга и обеспечения контроля качества данных, а также управления модельным риском
  • понимание фундаментальных различий основных видов NoSQL-решений: key-value, column-oriented, document-oriented, graph
  • опыт работы с NoSQL-решениями: MongoDB, Elasticsearch, Firebase, Redis, Cassandra, Vertica, ClickHouse, Neo4j и др.
  • файловые системы и объектные хранилища: HDFS, S3

Условия:

  • возможность работать в офисе или, по результатам прохождения испытательного срока – в рамках смешанного графика
  • свободное взаимодействие в команде, отсутствие излишнего формализма. Наша цель –
  • выполнение задачи с учетом заданных требований, а не соответствие формальной картинке
  • команда молодых профессионалов, готовых поддержать твои инициативы и поделиться опытом
  • конференции и обучение на корпоративных курсах за наш счёт
  • отличная ДМС, включая несчастные случаи и тяжелые заболевания
  • возможность сменить команду или проект при желании
  • программы лояльности для сотрудников: скидки на продукты банка и компаний-партнеров, льготные условия кредитования
  • материальная помощь и социальная поддержка
  • корпоративная пенсионная программа
Настя из careerspace
Настя из careerspace
Поможем устроиться на эту работу или лучше!

Вакансия в архиве

Посмотрите похожие вакансии

© 2021—2025 ООО «Карьерное пространство»
Карьерная поддержка
Поиск работы
Медиа
Информация
© 2021—2025 ООО «Карьерное пространство»