Temario del curso
Semana 1: Conceptos de Big Data
- Definición VVVV (Velocidad, Volumen, Variedad, Veracidad)
- Límites de la capacidad de procesamiento de datos tradicional
- Procesamiento Distribuido
- Análisis Estadístico
- Tipo de Análisis de Aprendizaje Automático
- Visualización de Datos
- Procesamiento Distribuido (por ejemplo, map-reduce)
- Introducción a los lenguajes utilizados
- Curso intensivo en el lenguaje R
- Curso intensivo en Python
Semanas 2 y 3: Realización de Análisis de Datos
- Análisis Estadístico
- Estadísticas Descriptivas en Conjuntos de Datos Grandes (por ejemplo, cálculo de la media)
- Estadísticas Inferenciales (estimación)
- Pronóstico con Modelos de Correlación y Regresión
- Análisis de Series Temporales
- Bases del Aprendizaje Automático
- Aprendizaje Supervisado vs No Supervisado
- Clasificación y Clustering
- Estimación del costo de métodos específicos
- Filtro
Semana 4: Procesamiento del Lenguaje Natural
- Procesamiento de texto
- Comprensión del significado del texto
- Generación de texto automática
- Análisis de Sentimientos/Temas
- Vision por Computadora
Semanas 5 y 6: Conceptos de Herramientas
- Solución de Almacenamiento de Datos (SQL, NoSQL, jerárquico, orientado a objetos, orientado a documentos)
- MySQL, Cassandra, MongoDB, Elasticsearch, HDFS, etc...
- Elegir la solución adecuada al problema
- Procesamiento Distribuido
- Spark
- Aprendizaje Automático con Spark (MLLib)
- Spark SQL
- Escalabilidad
- Nube pública (AWS, Google, etc...)
- Nube privada (OpenStack, cloud foundry)
- Autescalabilidad
Semana 7: Habilidades Blandas
- Habilidades de Asesoría y Liderazgo
- Impactar: narración basada en datos
- Comprender a su audiencia
- Presentación efectiva de datos - transmitir su mensaje
- Influir y liderar el cambio
- Gestionar situaciones difíciles
Examen
- Examen final de graduación del programa
Requerimientos
Los participantes deben tener una sólida base en matemáticas, al menos nivel de secundaria.
Aunque no se requieren habilidades de programación, cualquier habilidad en este área será útil.
Los participantes serán evaluados y entrevistados antes de su participación en este programa de formación.
Testimonios (5)
Comprender mejor los datos masivos
Shaune Dennis - Vodacom
Curso - Big Data Business Intelligence for Telecom and Communication Service Providers
Traducción Automática
El entrenador fue flexible. Y de hecho, bastante alentador para que yo tomara el curso.
Grace Goh - DBS Bank Ltd
Curso - Python in Data Science
Traducción Automática
Presentación del tema conocimientos cronograma
Aly Saleh - FAB banak Egypt
Curso - Introduction to Data Science and AI (using Python)
Traducción Automática
Es genial que el curso esté diseñado específicamente para las áreas clave que he resaltado en el cuestionario previo al curso. Esto realmente ayuda a abordar las preguntas que tengo sobre el tema y a alinearse con mis objetivos de aprendizaje.
Winnie Chan - Statistics Canada
Curso - Jupyter for Data Science Teams
Traducción Automática
Mostrando muchos métodos con guiones previamente preparados - materiales muy bien preparados y fáciles de rastrear
Kamila Begej - GE Medical Systems Polska Sp. Zoo
Curso - Machine Learning – Data science
Traducción Automática