Etiqueta: BigData
Corriendo Apache Spark sobre Kubernetes
Vamos a ver cómo Spark ofrece un mecanismo de ejecución alternativo para que el procesamiento de los jobs se lance sobre PODs/contenedores de Kubernetes.
Introducción a Spring Data Hadoop
En este tutorial vamos a ver la manera de configurar un runner de Hadoop para lanzar un Job MapReduce con Spring Data.
Primeros pasos con Apache Pig
En este tutorial vamos a ver cómo funciona Apache Pig, una plataforma creada por Yahoo! que nos abstrae y simplifica el desarrollo de algoritmos MapReduce en Hadoop.
Implementando tu propio Writable en Hadoop
Para tareas MapReduce un poco más complejas es necesario crear registros compuestos. En este tutorial vamos a ver cómo crear nuestro propio Writable para solucionar este problema.
Primeros pasos de MapReduce con Hadoop
En este tutorial se realiza un ejemplo simple de un algoritmo MapReduce con el API de Hadoop