PhoenixFM
Премиум
- 30 Дек 2017
- 10.689
- 2.440
[BigData Тeam] Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka (2023)
Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka [bigdata team]
Вы научитесь работать с потоковой обработкой данных, познакомитесь с Kafka и Spark Structured Streaming, освоите NoSQL поверх больших данных, подружите Spark с Cassandra.
В этом модуле вы изучите:
Скачать:
Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka [bigdata team]
Вы научитесь работать с потоковой обработкой данных, познакомитесь с Kafka и Spark Structured Streaming, освоите NoSQL поверх больших данных, подружите Spark с Cassandra.
В этом модуле вы изучите:
- подходы к Realtime-обработке;
- гарантии обработки, переход от одной гарантии к другой, архитектуры "Лямбда" и "Каппа";
- Spark Streaming vs. Spark RDD, Spark Structured Streaming vs. Spark DataFrames, DStream;
- архитектура Kafka, Kafka Streams, репликация в Kafka. Отличие Kafka от классических очередей;
- семантики доставки сообщений, сжатие данных в Kafka, синхронная и асинхронная репликация.
- отличия Key-Value хранилищ от реляционных БД;
- компактификация и её виды, CQLSH;
- архитектура Cassandra;
- обеспечение надёжности и высокодоступности в Key-Value хранилищах;
- интеграция Spark с Cassandra.
- как бороться с Data Skew с помощью MapReduce подходов в разных фреймворках;
- trade-off между CPU и IO-bound приложениями, подходы к сжатию в Big Data, горячие и холодные данные;
- форматы данных в Big Data: ORC vs Parquet, Avro, ...
Вам необходимо зарегистрироваться на сайте для просмотра скрытых ссылок
Скачать:
Скрытое содержимое для пользователей: Premium, Член клуба - Купить доступ
Возможно, Вас ещё заинтересует:
- [Андрей Кобец] [kobezzza] IndexedDB в действии. Тариф Расширенный (2025)
- [Инфоурок] Базовая компьютерная подготовка с изучением Windows, Word, Excel, интернета
- [Product University] Blockchain Developer c нуля
- [Venator Browser] Закладки, каталог и статьи из OSINT браузера Venator Red 2.0
- Linux для разработчиков [2024] [Слёрм] [Павел Калашников]
- [plc-edu] Дмитрий Громов - HMI Язык C++ в среде Qt Creator
- Чиним сломанные процессы [Podlodka.io, Михаил Дружинин, Дмитрий Константинов и др.]
- [Глеб Учитель] [Stepik] Проектирование архитектуры и интеграций (API / брокеры) сервисов
- Все про базы данных [Podlodka.io, Дмитрий Константинов, Константин Евтеев и т.д]
- Терминал Linux. Основы работы в командной строке [Stepik]