Cursos de Ciencia de Datos para Big Data Analytics

Algunos de nuestros clientes

Código del Curso

dsbda

Duración

35 horas (usualmente 5 días, incluidas las pausas)

Descripción General

Big data son conjuntos de datos que son tan voluminosos y complejos que el software de aplicación de procesamiento de datos tradicional es inadecuado para manejarlos. Los grandes desafíos de datos incluyen la captura de datos, el almacenamiento de datos, el análisis de datos, la búsqueda, el intercambio, la transferencia, la visualización, la consulta, la actualización y la privacidad de la información.

Machine Translated

Programa del Curso

Introducción a Data Science para Big Data Analytics

  • Descripción de Data Science
  • Descripción general de Big Data
  • Estructuras de datos
  • Controladores y complejidades de Big Data
  • El ecosistema Big Data y un nuevo enfoque de análisis
  • Tecnologías clave en Big Data
  • Proceso y problemas de minería de datos
    • Asociación Patrón Minería
    • Agrupación de datos
    • Detección de valores atípicos
    • Clasificación de datos

Introducción al ciclo de vida de Data Analytics

  • Descubrimiento
  • Preparación de datos
  • Planificación del modelo
  • Construcción del modelo
  • Presentación / Comunicación de resultados
  • Operacionalización
  • Ejercicio: estudio de caso

A partir de este punto, la mayor parte del tiempo de capacitación (80%) se gastará en ejemplos y ejercicios en R y en la tecnología de big data relacionada.

Comenzando con R

  • Instalación de R y Rstudio
  • Características del lenguaje R
  • Objetos en R
  • Datos en R
  • Manipulación de datos
  • Problemas de Big Data
  • Ceremonias

Comenzando con Hadoop

  • Instalando Hadoop
  • Comprender los modos de Hadoop
  • HDFS
  • Arquitectura MapReduce
  • Visión general de los proyectos relacionados con Hadoop
  • Programas de escritura en Hadoop MapReduce
  • Ceremonias

Integrando R y Hadoop con RHadoop

  • Componentes de RHadoop
  • Instalación de RHadoop y conexión con Hadoop
  • La arquitectura de RHadoop
  • Hadoop transmitiendo con R
  • Resolución de problemas de análisis de datos con RHadoop
  • Ceremonias

Preprocesamiento y preparación de datos

  • Pasos de preparación de datos
  • Extracción de características
  • Limpieza de datos
  • Integración y transformación de datos
  • Reducción de datos: muestreo, selección de subconjuntos de características,
  • Reducción de dimensionalidad
  • Discretización y binning
  • Ejercicios y estudio de caso

Métodos analíticos de datos exploratorios en R

  • Estadísticas descriptivas
  • Análisis exploratorio de datos
  • Visualización - pasos preliminares
  • Visualizando una sola variable
  • Examinando múltiples variables
  • Métodos estadísticos para la evaluación
  • Evaluación de la hipótesis
  • Ejercicios y estudio de caso

Visualizaciones de datos

  • Visualizaciones básicas en R
  • Paquetes para la visualización de datos ggplot2, celosía, trama, celosía
  • Formateo de parcelas en R
  • Gráficos avanzados
  • Ceremonias

Regresión (Estimación de valores futuros)

  • Regresión lineal
  • Casos de uso
  • Descripcion del modelo
  • Diagnostico
  • Problemas con la regresión lineal
  • Métodos de contracción, regresión de cresta, el lazo
  • Generalizaciones y no linealidad
  • Splines de regresión
  • Regresión polinómica local
  • Modelos aditivos generalizados
  • Regresión con RHadoop
  • Ejercicios y estudio de caso

Clasificación

  • Los problemas relacionados con la clasificación
  • Refrescante Bayesiano
  • Naïve Bayes
  • Regresión logística
  • K vecinos más cercanos
  • Algoritmo de árboles de decisión
  • Redes neuronales
  • Máquinas de vectores de soporte
  • Diagnóstico de clasificadores
  • Comparación de los métodos de clasificación
  • Algoritmos escalables de clasificación
  • Ejercicios y estudio de caso

Evaluar el rendimiento y la selección del modelo

  • Sesgo, varianza y complejidad del modelo
  • Precisión vs Interpretabilidad
  • Evaluando clasificadores
  • Medidas del rendimiento del modelo / algoritmo
  • Método de validación Hold-out
  • Validación cruzada
  • Algoritmos de aprendizaje de sintonización con paquete caret
  • Visualización del rendimiento del modelo con Profit ROC y curvas de elevación

Métodos de conjunto

  • Harpillera
  • Bosques Aleatorios
  • Impulso
  • Aumento de gradiente
  • Ejercicios y estudio de caso

Máquinas de vectores de soporte para clasificación y regresión

  • Clasificadores de Margen Máximo
    • Clasificadores de vectores de soporte
    • Máquinas de vectores de soporte
    • SVM para problemas de clasificación
    • SVM para problemas de regresión
  • Ejercicios y estudio de caso

Identificar agrupaciones desconocidas dentro de un conjunto de datos

  • Selección de características para la agrupación
  • Algoritmos basados en representativos: k-means, k-medoids
  • Algoritmos jerárquicos: métodos aglomerativos y divisivos
  • Algoritmos de base probabilísticos: EM
  • Algoritmos basados en densidad: DBSCAN, DENCLUE
  • Validación de cluster
  • Conceptos avanzados de clustering
  • Agrupación con RHadoop
  • Ejercicios y estudio de caso

Descubriendo conexiones con Link Analysis

  • Conceptos de análisis de enlaces
  • Métricas para analizar redes
  • El algoritmo de Pagerank
  • Búsqueda de tema inducida por hipervínculo
  • Predicción del enlace
  • Ejercicios y estudio de caso

Asociación Patrón Minería

  • Modelo de Minería de Patrón Frecuente
  • Problemas de escalabilidad en la minería de patrones frecuentes
  • Algoritmos de fuerza bruta
  • Algoritmo Apriori
  • El enfoque de crecimiento FP
  • Evaluación de las reglas del candidato
  • Aplicaciones de las Reglas de Asociación
  • Validación y prueba
  • Diagnostico
  • Reglas de asociación con R y Hadoop
  • Ejercicios y estudio de caso

Construir motores de recomendación

  • Entender los sistemas de recomendación
  • Técnicas de minería de datos utilizadas en los sistemas de recomendación
  • Sistemas de recomendación con el paquete recommenderlab
  • Evaluar los sistemas de recomendación
  • Recomendaciones con RHadoop
  • Ejercicio: motor de recomendación de construcción

Análisis de texto

  • Pasos de análisis de texto
  • Recopilación de texto sin formato
  • Bolsa de palabras
  • Frecuencia de términos: frecuencia de documento inverso
  • Determinando Sentimientos
  • Ejercicios y estudio de caso
     

Testimonios

★★★★★
★★★★★

Categorías Relacionadas

Promociones

Descuentos en los Cursos

Respetamos la privacidad de su dirección de correo electrónico. No transmitiremos ni venderemos su dirección a otras personas.
En cualquier momento puede cambiar sus preferencias o cancelar su suscripción por completo.

is growing fast!

We are looking to expand our presence in Peru!

As a Business Development Manager you will:

  • expand business in Peru
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!