Courses Flat > IBM BigIntegrate для инженеров данных v11.5.0.2

CourseViewByUNPortlet

Actions
Loading...

IBM BigIntegrate для инженеров данных v11.5.0.2

IBM BigIntegrate for Data Engineers v11.5.0.2

  • Код курса: KM700
  • Продолжительность: 1 день
  • Цена курса: 23450 руб.
  • Язык материалов: en

Цель курса

Этот курс посвящен тому, как запускать задания DataStage в среде Hadoop. Вы будете запускать задания (job) в традиционном режиме и режиме YARN, получать доступ к файлам HDFS и таблицам Hive, используя различные форматы файлов и стейджи коннекторы.

Для кого предназначен этот курс

Инженеров данных, которые хотят понять, как дистрибутивы Hadoop (такие как HDP, Cloudera, MapReduce или ODP) используются для создания заданий (job) DataStage.

Для успешного прохождения курса слушатели должны

  • Иметь представление о том, что из себя представляют Большие Данные
  • Обладать знаниями и навыками в объеме учебного курса KM204 (http://qdts.ru/wps/portal/Home/courses/im/km204)

По окончании курса слушатели смогут:

  • Создавать задания (job) в среде DataStage и запускать их в режиме YARN
  • Получать доступ к файлам HDFS и таблицам Hive

Основные темы:

  • Знакомство с BigIntegrate и BigQuality
  • Упражнение: Запуск и тестирование системы
  • DataStage и YARN
  • Упражнение: Запуск задач в режимах DataStage и YARN
  • Трассировка и отладка задач, запускаемых в режиме YARN
  • Упражнение: Трассировка и отладка задач, запускаемых в режиме YARN
  • Конфигурационные параметры
  • Упражнение: Конфигурационные параметры
  • Доступ к данным на Hadoop
  • Упражнение: Доступ к данным на Hadoop