Cursos de Python y Spark para Big Data (PySpark)

Algunos de nuestros clientes

Código del Curso

sparkpython

Duración

21 horas (usualmente 3 días, incluidas las pausas)

Requerimientos

  • Habilidades de programación general
     

Descripción General

Python es un lenguaje de programación de alto nivel famoso por su claridad de sintaxis y código. Spark es un motor de procesamiento de datos utilizado para consultar, analizar y transformar big data. PySpark permite a los usuarios interactuar con Spark con Python.

En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán a usar Python y Spark juntos para analizar los datos grandes mientras trabajan en ejercicios prácticos.

Al final de esta capacitación, los participantes podrán:

  • Aprenda a usar Spark con Python para analizar Big Data
  • Trabajar en ejercicios que imitan las circunstancias del mundo real
  • Utilice diferentes herramientas y técnicas para el análisis de Big Data utilizando PySpark

Audiencia

  • Desarrolladores
  • Profesionales de TI
  • Científicos de datos

Formato del curso

  • Conferencia de parte, discusión en parte, ejercicios y práctica práctica

Programa del Curso

Introducción

Comprender Big Data

Descripción de Spark

Descripción de Python

Descripción de PySpark

  • Distribuir datos utilizando un marco de conjuntos de datos distribuidos resilientes
  • Distribución de la computación usando los operadores de Spark API

Configurando Python con Spark

Configurando PySpark

Uso de las instancias de Amazon Web Services (AWS) EC2 para Spark

Configurando Databricks

Configuración del clúster EMR de AWS

Aprender los principios básicos de la programación Python

  • Comenzando con Python
  • Usando el cuaderno Jupyter
  • Usando variables y tipos de datos simples
  • Trabajando con listas
  • Usando if Declaraciones
  • Uso de entradas de usuario
  • Trabajando con while Loops
  • Funciones de implementación
  • Trabajando con Clases
  • Trabajando con archivos y excepciones
  • Trabajando con proyectos, datos y API

Aprender los conceptos básicos de Spark DataFrame

  • Primeros pasos con Spark DataFrames
  • Implementando Operaciones Básicas con Spark
  • Usando Groupby y operaciones agregadas
  • Trabajando con marcas de tiempo y fechas

Trabajando en un ejercicio de proyecto Spark DataFrame

Entender el aprendizaje automático con MLlib

Trabajando con MLlib, Spark y Python para el aprendizaje automático

Entender las regresiones

  • Aprendizaje de la teoría de regresión lineal
  • Implementando un código de evaluación de regresión
  • Trabajando en un ejercicio de regresión lineal de muestra
  • Aprender la teoría de la regresión logística
  • Implementando un Código de Regresión Logística
  • Trabajando en un ejemplo de ejercicio de regresión logística

Comprender los bosques aleatorios y los árboles de decisión

  • Teoría de los métodos del árbol de aprendizaje
  • Implementando Árboles de Decisión y Códigos Forestales Aleatorios
  • Trabajando en un ejemplo de ejercicio de clasificación aleatoria de bosques

Trabajando con K-means Clustering

  • Comprender la teoría de agrupamiento de K-means
  • Implementando un código de agrupamiento K-means
  • Trabajando en un ejemplo de ejercicio de agrupamiento

Trabajando con los sistemas de recomendación

Implementando el procesamiento del lenguaje natural

  • Comprender el procesamiento del lenguaje natural (NLP)
  • Descripción de las herramientas de PNL
  • Trabajando en un ejercicio de muestra NLP

Streaming con Spark en Python

  • Descripción general Streaming with Spark
  • Ejercicio Spark Streaming de muestra

Observaciones finales

Testimonios

★★★★★
★★★★★

Categorías Relacionadas

Promociones

Descuentos en los Cursos

Respetamos la privacidad de su dirección de correo electrónico. No transmitiremos ni venderemos su dirección a otras personas.
En cualquier momento puede cambiar sus preferencias o cancelar su suscripción por completo.

is growing fast!

We are looking to expand our presence in Peru!

As a Business Development Manager you will:

  • expand business in Peru
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!