Temario del curso
Introducción a Apache Spark
- El papel de Spark en el procesamiento de big data
- Arquitectura de Spark y sus componentes
Configuración Apache Spark
- Requisitos de hardware y software
- Procedimientos de instalación para los modos autónomo y de clúster
- Prácticas recomendadas de configuración para administradores de sistemas
Administración de clústeres de Spark
- Herramientas y técnicas de gestión de clústeres
- Supervisión de aplicaciones de Spark y recursos de clúster
- Configuraciones de seguridad y gestión de usuarios
Ajuste y optimización del rendimiento
- Asignación y programación de recursos
- Tuning Spark para un rendimiento óptimo
- Identificación y resolución de cuellos de botella comunes
Solución de problemas y resolución de problemas
- Desafíos comunes de la administración de Spark
- Herramientas y técnicas de diagnóstico para la resolución de problemas
- Enfoque paso a paso para resolver problemas comunes
- Procedimientos recomendados para mantener un entorno de Spark saludable
Temas de Administración Avanzada
- Integración con otras herramientas de big data
- Garantizar la alta disponibilidad y la recuperación ante desastres
- Actualización y escalado de clústeres de Spark
Resumen y próximos pasos
Requerimientos
- Conocimientos básicos de configuración y gestión de redes
- Familiaridad con el sistema operativo Linux y la interfaz de línea de comandos
- Interés en aprender sobre sistemas de computación distribuida y gestión de big data
Audiencia
- Administradores de sistemas
Testimonios (3)
Me gustó que fuera práctico. Amé aplicar el conocimiento teórico con ejemplos prácticos.
Aurelia-Adriana - Allianz Services Romania
Curso - Python and Spark for Big Data (PySpark)
Traducción Automática
El hecho de poder llevar con nosotros la mayoría de la información/curso/presentación/ejercicios realizados, para poder revisarlos y tal vez volver a hacer lo que no entendimos la primera vez o mejorar lo que ya hicimos.
Raul Mihail Rat - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
Traducción Automática
La combinación de teoría y práctica con herramientas como databricks