Inicio Etiquetas Big data

Etiqueta: big data

Algoritmos de clasificación con RStudio

Algoritmos de clasificación con RStudio: árboles de decisión, modelo del bosque aleatorio, matrices de confusión, curvas ROC y particionamiento de datos

Gráficos de judías, ScatterPlots y mapas con RStudio

gráficos de judías, gráficas con funciones de densidad sobre histogramas, matrices de scatterplots, representación de datos sobre mapas.

Detección y reemplazo de outliers con R

Daremos un repaso rápido a algunos conceptos básicos de estadística para centrarnos en la detección y reemplazo de outliers con R. Por el camino aprenderemos a manejar fechas y horas, a convertir una variable numérica en categórica, los diagramas de caja y bigotes, y a crear nuestras propias funciones.
Obtener datos con R

Obtener datos con R (HTML, XML y FWF)

Aprenderemos a construir un dataFrame, a obtener datos con R a través de la librería RCurl, a leer un fichero de formato de ancho fijado (FWF), tablas HTML y a parsear XMLs. También presentaremos...

Leer un JSON con R (RStudio)

En este artículo aprenderemos cómo leer un JSON con R usando RStudio. Trataremos un JSON desde internet y lo cargaremos en un dataFrame con el que poder trabajar. Conoceremos la librería jsonlite y curl, además de aprender cómo escapar caracteres de una URI, y cómo concatenar cadenas de texto. También aprenderemos a mezclar dos dataFrames y a verificar que son idénticos o no.

Introducción a Data Science con R y RStudio

El Big Data, Machine Learning y en general El Data Science se pueden trabajar de una forma muy sencilla con R y RStudio. Este es el primer tutorial de muchos, donde quiero sumergirme en estos temas de la mano de R y del IDE RStudio

Introducción a Apache Flink

En este tutorial haremos una pequeña introducción a la motivación por usar Apache Flink, sus ideas principales y un ejemplo de proyecto Maven haciendo uso del framework. 0. Índice de contenidos. 1. ¿Qué es...

Introducción a Apache Spark – Batch y Streaming

Vamos a dar un pequeño paseo por el framework de computación paralela más popular del momento, Apache Spark. Índice de contenidos 1. Introducción 2. Apache Spark y la ciencia...

Autentia en Big Data Spain 2015 – Segundo día

Continuamos nuestra crónica del de Big Data Spain 2015 con segundo día de la conferencia, en la que pudimos asistir a las ponencias de Facebook,...

Autentia en Big Data Spain 2015 – Primer día

Los días 15 y 16 de octubre se celebró en Madrid la edición 2015 de la conferencia Big Data Spain, organizada por Paradigma Tecnológico, que...

Otros artículos

Autores destacados

Javier Estrada Martínez
16 PUBLICACIONES3.710 VISITAS
Ignacio Acisclo Pérez
13 PUBLICACIONES50.117 VISITAS
Viktor Yordanov Ivanov
8 PUBLICACIONES6.329 VISITAS