{"product_id":"9781789808810","title":"Procesamiento de big data con Apache Spark: aborde de manera eficiente grandes conjuntos de datos y análisis de big data con Spark y Python","description":"No es necesario pasar horas analizando datos interminables: deje que Spark, uno de los motores de procesamiento de big data más rápidos disponibles, haga el trabajo duro por usted. Características clave Póngase en funcionamiento con Apache Spark y Python Integre Spark con AWS para análisis en tiempo real Aplique flujos de datos procesados ​​a las API de aprendizaje automático de Apache Spark Descripción del libro Procesar big data en tiempo real es un desafío debido a la escalabilidad, la coherencia de la información y los fallos -tolerancia. Este libro le enseña cómo utilizar Spark para hacer que su flujo de trabajo analítico general sea más rápido y eficiente. Explorará todos los conceptos y herramientas principales dentro del ecosistema Spark, como Spark Streaming, la API de Spark Streaming, la extensión de aprendizaje automático y la transmisión estructurada. Comenzará aprendiendo los fundamentos del procesamiento de datos utilizando conjuntos de datos distribuidos resistentes (RDD), SQL, conjuntos de datos y API de marcos de datos. Después de comprender estos conceptos básicos, pasará al uso de las API de Spark Streaming para consumir datos en tiempo real desde sockets TCP e integrará Amazon Web Services (AWS) para el consumo de transmisiones. Al final de este libro, no solo habrá comprendido cómo utilizar extensiones de aprendizaje automático y flujos estructurados, sino que también podrá aplicar Spark en sus próximos proyectos de big data. Lo que aprenderá Escriba sus propios programas Python que puedan interactuar con Spark Implemente el consumo de flujo de datos usando Apache Spark Reconozca operaciones comunes en Spark para procesar flujos de datos conocidos Integre el streaming de Spark con Amazon Web Services (AWS) Cree un modelo de filtrado colaborativo con el conjunto de datos movielens Aplique flujos de datos procesados ​​a las API de aprendizaje automático de Spark. Para quién está dirigido este libro El procesamiento de datos con Apache Spark es para usted si es un ingeniero de software, arquitecto o profesional de TI que desea explorar sistemas distribuidos y análisis de big data. Aunque no necesita ningún conocimiento de Spark, se recomienda tener experiencia previa trabajando con Python.\u003cbr\u003e\u003cbr\u003e\u003cul\u003e\n\n \u003cli\u003e| \u003cb\u003eAutor:\u003c\/b\u003e Manuel Ignacio Franco Galeano\u003c\/li\u003e\n\n\u003cli\u003e | \u003cb\u003eEditorial:\u003c\/b\u003e Packt Publishing\u003c\/li\u003e\n\n\u003cli\u003e | \u003cb\u003eFecha de publicación:\u003c\/b\u003e 31 de octubre de 2018\u003c\/li\u003e\n\n\u003cli\u003e | \u003cb\u003eNúmero de páginas:\u003c\/b\u003e 142 páginas\u003c\/li\u003e\n\n\u003cli\u003e | \u003cb\u003eIdioma:\u003c\/b\u003e inglés\u003c\/li\u003e\n\n\u003cli\u003e | \u003cb\u003eEncuadernación:\u003c\/b\u003e Tapa blanda\u003c\/li\u003e\n\n\u003cli\u003e | \u003cb\u003eISBN-10:\u003c\/b\u003e 1789808812\u003c\/li\u003e\n\n\u003cli\u003e | \u003cb\u003eISBN-13:\u003c\/b\u003e 9781789808810\u003c\/li\u003e\n\n\n\u003c\/ul\u003e","brand":"Packt Publishing","offers":[{"title":"Default Title","offer_id":46742061515057,"sku":"9781789808810","price":39.29,"currency_code":"USD","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0798\/8215\/8385\/products\/9781789808810.jpg?v=1692192392","url":"https:\/\/www.recomparo.com\/es\/products\/9781789808810","provider":"ReComparo.com","version":"1.0","type":"link"}