[BigData Тeam] Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka (2023)

  • Автор темы Автор темы Rayhorn
  • Дата начала Дата начала

Rayhorn

Модератор
Команда форума
Модератор
Сообщения
3.740
Реакции
3.299
Снимок экрана 2023-11-13 111951.png




Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka [bigdata team]

Вы научитесь работать с потоковой обработкой данных, познакомитесь с Kafka и Spark Structured Streaming, освоите NoSQL поверх больших данных, подружите Spark с Cassandra.
В этом модуле вы изучите:

  • подходы к Realtime-обработке;
  • гарантии обработки, переход от одной гарантии к другой, архитектуры "Лямбда" и "Каппа";
  • Spark Streaming vs. Spark RDD, Spark Structured Streaming vs. Spark DataFrames, DStream;
  • архитектура Kafka, Kafka Streams, репликация в Kafka. Отличие Kafka от классических очередей;
  • семантики доставки сообщений, сжатие данных в Kafka, синхронная и асинхронная репликация.
  • отличия Key-Value хранилищ от реляционных БД;
  • компактификация и её виды, CQLSH;
  • архитектура Cassandra;
  • обеспечение надёжности и высокодоступности в Key-Value хранилищах;
  • интеграция Spark с Cassandra.
  • как бороться с Data Skew с помощью MapReduce подходов в разных фреймворках;
  • trade-off между CPU и IO-bound приложениями, подходы к сжатию в Big Data, горячие и холодные данные;
  • форматы данных в Big Data: ORC vs Parquet, Avro, ...




 
Последнее редактирование:

Похожие темы

Практический курс по Big Data. Часть 1. HDFS, Map Reduce, Hive [bigdata team] Кому подойдет этот курс: Разработчикам Вы программируете, но хотите расширить профессиональные возможности и получить практические навыки работы с большими данными? На курсе вы научитесь работать с Hadoop, MapReduce...
Ответы
0
Просмотры
505
Практический курс по Big Data. Часть 2. Spark: from zero to hero [bigdata team] На протяжении этой части курса вы будете работать со Spark: от основных терминов и RDD до Spark DataFrames и оптимизации Spark вычислений. В этом модуле вы изучите: cхема выполнения задачи в Spark; основные термины...
Ответы
0
Просмотры
487
Знакомая ситуация? На собеседованиях middle+ просят пройти system design интервью, а я ничего не знаю На работе приходится принимать участие в проектировании сложной системы, а у меня нет знаний в этой области, ничем не могу помочь Есть база по system design, но западают сложные темы и детали...
Ответы
1
Просмотры
502
Назад
Сверху Снизу