KSIĄŻKA
Zaawansowana analiza danych w PySpark. Metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark - Akash Tandon, Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills [KSIĄŻKA]

4799

Wysyłamy w 72h

Darmowa wysyłkaKup jeszcze za 99.99zł
Poczta Polska999
Paczkomaty 24/7 1599
Kategoria Programowanie
Autor Akash Tandon, Sandy Ryza, Uri Laserson więcej
Ilość stron 192
Okładka miękka
Opis

Potrzeby w zakresie analizy dużych zbiorĂłw danych i wyciągania z nich użytecznych informacji stale rosną. SpośrĂłd dostępnych narzędzi przeznaczonych do tych zastosowań szczegĂłlnie przydatny jest PySpark - interfejs API systemu Spark dla języka Python. Apache Spark świetnie się nadaje do analizy dużych zbiorĂłw danych, a PySpark skutecznie ułatwia integrację Sparka ze specjalistycznymi narzędziami PyData. By jednak można było w pełni skorzystać z tych możliwości, konieczne jest zrozumienie interakcji między algorytmami, zbiorami danych i wzorcami używanymi w analizie danych.

Oto praktyczny przewodnik po wersji 3.0 systemu Spark, metodach statystycznych i rzeczywistych zbiorach danych. OmĂłwiono w nim zasady rozwiązywania problemĂłw analitycznych za pomocą interfejsu PySpark, z wykorzystaniem dobrych praktyk programowania w systemie Spark. Po lekturze można bezproblemowo zagłębić się we wzorce analityczne oparte na popularnych technikach przetwarzania danych, takich jak klasyfikacja, grupowanie, filtrowanie i wykrywanie anomalii, stosowane w genomice, bezpieczeństwie systemĂłw IT i finansach. Dodatkowym plusem są opisy wykorzystania przetwarzania obrazĂłw i języka naturalnego. Zaletą jest też szereg rzeczywistych przykładĂłw dużych zbiorĂłw danych i ich zaawansowanej analizy.

Dzięki książce poznasz:

  • model programowania w ekosystemie Spark
  • podstawowe metody stosowane w nauce o danych
  • pełne implementacje analiz dużych publicznych zbiorĂłw danych
  • konkretne przypadki użycia narzędzi uczenia maszynowego
  • kod, ktĂłry łatwo dostosujesz do swoich potrzeb

PySpark: systemowa odpowiedź na problemy inżyniera danych!

EAN 9788383220697
Dział KSIĄŻKA
Data premiery 2023-02-22
Tytuł oryginalny Advanced Analytics with PySpark: Patterns for Learning from Data at Scale Using Python and Spark
ISBN 978-83-8322-069-7
Autor Akash Tandon, Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills
Ilość stron 192
Okładka miękka
Liczba nośników [1xKSIĄŻKA]
Wymiary 165x235