Top.Mail.Ru

Junior / Middle Data Engineer

В архиве c 16 июня 2022
Москва
от 70 000 ₽

Задачи:

  • исследование источников данных (внешних данных, реплик АС Банка, других витрин);
  • разработка и изменение витрин данных на Hadoop/GreenPlum исходя из требований аналитиков данных;
  • создание алгоритмов загрузки данных в витрины с учётом историчности, уникальности, логики обновления таблиц;
  • написание функций для первичной обработки, преобразования и агрегации данных на Spark (Scala, Java, Python).

Что мы ожидаем:

  • понимание работы Hive, Spark на Hadoop;
  • базовые знания языков программирования Python;
  • знание SQL на уровне аналитических запросов;
  • понимание объектно-ориентированного подхода к разработке;
  • умение обращаться с git, bash.

Будет плюсом:

  • опыт разработки на Spark/PySpark;
  • оптимизация выполнения сценариев на Spark;
  • понимание процессов ETL, ELT.

Что мы предлагаем:

  • команда высокомотивированных и увлеченных профессионалов, с которой вы получите максимальное удовольствие от работы;
  • мощное железо, дополнительные мониторы и всё, что нужно для продуктивной работы;
  • возможность работы с новыми технологиями;
  • обучение за счет компании;
  • красивый и комфортный офис (пр-т Кутузовский 32);
  • ДМС с первого дня.

Вакансия в архиве

Посмотрите похожие вакансии

© 2021—2026 ООО «Карьерное пространство»
© 2021—2026 ООО «Карьерное пространство»