Inicio Etiquetas Big data

Etiqueta: big data

Para qué sirve la programación en Python

Python es un lenguaje de programación muy variado pero no muy difícil. Empezar a aprender cualquier lenguaje de programación requiere valor, fuerza de voluntad, tiempo y mucho café. Por lo tanto, debes empezar por saber que quieres aprender y para qué se utiliza la programación en Python.

Algoritmos de clasificación con RStudio

Algoritmos de clasificación con RStudio: árboles de decisión, modelo del bosque aleatorio, matrices de confusión, curvas ROC y particionamiento de datos

Gráficos de judías, ScatterPlots y mapas con RStudio

gráficos de judías, gráficas con funciones de densidad sobre histogramas, matrices de scatterplots, representación de datos sobre mapas.

Detección y reemplazo de outliers con R

Daremos un repaso rápido a algunos conceptos básicos de estadística para centrarnos en la detección y reemplazo de outliers con R. Por el camino aprenderemos a manejar fechas y horas, a convertir una variable numérica en categórica, los diagramas de caja y bigotes, y a crear nuestras propias funciones.
Obtener datos con R

Obtener datos con R (HTML, XML y FWF)

Aprenderemos a construir un dataFrame, a obtener datos con R a través de la librería RCurl, a leer un fichero de formato de ancho fijado (FWF), tablas HTML y a parsear XMLs. También presentaremos...

Leer un JSON con R (RStudio)

En este artículo aprenderemos cómo leer un JSON con R usando RStudio. Trataremos un JSON desde internet y lo cargaremos en un dataFrame con el que poder trabajar. Conoceremos la librería jsonlite y curl, además de aprender cómo escapar caracteres de una URI, y cómo concatenar cadenas de texto. También aprenderemos a mezclar dos dataFrames y a verificar que son idénticos o no.

Introducción a Data Science con R y RStudio

El Big Data, Machine Learning y en general El Data Science se pueden trabajar de una forma muy sencilla con R y RStudio. Este es el primer tutorial de muchos, donde quiero sumergirme en estos temas de la mano de R y del IDE RStudio

Introducción a Apache Flink

En este tutorial haremos una pequeña introducción a la motivación por usar Apache Flink, sus ideas principales y un ejemplo de proyecto Maven haciendo uso del framework. 0. Índice de contenidos. 1. ¿Qué es...

Introducción a Apache Spark – Batch y Streaming

Vamos a dar un pequeño paseo por el framework de computación paralela más popular del momento, Apache Spark. Índice de contenidos 1. Introducción 2. Apache Spark y la ciencia...

Autentia en Big Data Spain 2015 – Segundo día

Continuamos nuestra crónica del de Big Data Spain 2015 con segundo día de la conferencia, en la que pudimos asistir a las ponencias de Facebook,...

Otros artículos

Autores destacados

617 PUBLICACIONES9.777.481 VISITAS
27 PUBLICACIONES460.207 VISITAS
26 PUBLICACIONES586.841 VISITAS