Programa del Curso

Resumen rápido

  • Fuentes de datos
  • Cuidado de los datos
  • Sistemas de recomendación
  • Objetivo Marketing

Datatypes

  • Estructurado vs no estructurado
  • Estático vs transmitido
  • Datos actitudinales, conductuales y demográficos
  • Analítica basada en datos frente a analítica impulsada por el usuario
  • Validez de los datos
  • Volumen, velocidad y variedad de datos

Modelos

  • Modelos de construcción
  • Modelos estadísticos
  • Aprendizaje automático

Clasificación de datos

  • Agrupamiento
  • kGroups, k-means, los vecinos más cercanos
  • Colonias de hormigas, bandadas de pájaros

Modelos predictivos

  • Árboles de decisión
  • Máquina de vectores de soporte
  • Clasificación Bayes ingenua
  • Redes neuronales
  • Modelo Markov
  • Regresión
  • Métodos de conjunto

REY

  • Relación beneficio/costo
  • Costo del software
  • Costo de desarrollo
  • Beneficios potenciales

Modelos de construcción

  • Preparación de datos (MapReduce)
  • Limpieza de datos
  • Elección de métodos
  • Desarrollo del modelo
  • Modelo de prueba
  • Evaluación del modelo
  • Implementación e integración de modelos

Visión general del software comercial y de código abierto

  • Selección del paquete R-project
  • Python Bibliotecas
  • Hadoop y Mahout
  • Proyectos Apache seleccionados relacionados con Big Data y Analytics
  • Solución comercial seleccionada
  • Integración con el software y las fuentes de datos existentes

Requerimientos

Comprensión de los métodos tradicionales de gestión y análisis de datos como SQL, almacenes de datos, inteligencia empresarial, OLAP, etc. Comprensión de la estadística básica y la probabilidad (media, varianza, probabilidad, probabilidad condicional, etc.)

  21 horas

Número de participantes



Precio por participante

Testimonios (2)

Cursos Relacionados

Unified Batch and Stream Processing with Apache Beam

  14 horas

Categorías Relacionadas