Расширенная аналитика с PySpark

Вес 299 г
Габариты 21.59 × 14.48 × 2.54 см
handling_time

30 days

ISBN

978-5-9775-1770-6

EAN

9785977517706

Издательство

Серия

Переплет

Автор

Стандарт

20

Дата получения

07.03.2023

Год выпуска

Количество страниц

SKU

97347

Формат, мм\см

12x167x233

Тираж

271 
icon

* в связи с отменой регулярного авиасообщения срок доставки может быть дольше обычного

Описание

Книга посвящена практическим методам анализа больших объемов данных с использованием языка Python и фреймворка Spark, она знакомит с моделью программирования Spark и основами системы с открытым исходным кодом PySpark. Каждая глава описывает отдельный аспект анализа данных, показаны основы обработки данных в PySpark и Python на примере очистки данных, подробно освещается машинное обучение с помощью Spark. Книга поможет читателю понять, как устроен и работает весь конвейер PySpark для комплексной аналитики больших наборов данных: от создания и оценки моделей до очистки, предварительной обработки и исследования данных с особым акцентом на производственные приложения. Отдельные главы посвящены обработке изображений и библиотеке Spark NLP.

Книги, изданные в Израиле