Cursos de Apache Spark MLlib

Algunos de nuestros clientes

Código del Curso

spmllib

Duración

35 horas (usualmente 5 días, incluidas las pausas)

Requerimientos

Conocimiento de uno de los siguientes:

  • Java
  • Scala
  • Python
  • SparkR.

Descripción General

MLlib es la biblioteca de aprendizaje automático (ML) de Spark. Su objetivo es hacer que el aprendizaje práctico de la máquina sea escalable y fácil. Consiste en algoritmos comunes de aprendizaje y utilidades, incluyendo clasificación, regresión, agrupación, filtrado colaborativo, reducción de dimensionalidad, así como primitivas de optimización de nivel más bajo y API de oleoducto de nivel superior.

Se divide en dos paquetes:

  • spark.mllib contiene la API original construida sobre RDDs.
  • spark.ml proporciona una API de nivel superior construida en la parte superior de DataFrames para la construcción de tuberías de ML.
     

Audiencia

Este curso está dirigido a ingenieros y desarrolladores que buscan utilizar una biblioteca de máquinas construida para Apache Spark

Programa del Curso

spark.mllib: tipos de datos, algoritmos y utilidades

  • Tipos de datos
  • Estadísticas básicas
    • resumen estadístico
    • correlaciones
    • muestreo estratificado
    • evaluación de la hipótesis
    • transmisión de pruebas de significación
    • generación aleatoria de datos
  • Clasificación y regresión
    • modelos lineales (SVMs, regresión logística, regresión lineal)
    • bayes ingenuo
    • árboles de decisión
    • conjuntos de árboles (bosques al azar y árboles con gradiente de presión)
    • regresión isotónica
  • Filtración colaborativa
    • alternando los mínimos cuadrados (ALS)
  • Clustering
    • medios k
    • Mezcla gaussiana
    • agrupación de iteración de energía (PIC)
    • asignación latente de Dirichlet (LDA)
    • k-medios biestables
    • streaming k-means
  • Reducción de dimensionalidad
    • descomposición de valores singulares (SVD)
    • análisis de componentes principales (PCA)
  • Extracción y transformación de características
  • Mina de modelos frecuente
    • FP-crecimiento
    • reglas de asociación
    • PrefixSpan
  • Métricas de evaluación
  • Exportación de modelo PMML
  • Optimización (desarrollador)
    • descenso gradiente estocástico
    • memoria limitada BFGS (L-BFGS)

spark.ml: API de alto nivel para tuberías de ML

  • Visión general: estimadores, transformadores y tuberías
  • Extracción, transformación y selección de funciones
  • Clasificación y regresión
  • Clustering
  • Temas avanzados

Testimonios

★★★★★
★★★★★

Categorías Relacionadas

Cursos Relacionados

Promociones

Descuentos en los Cursos

Respetamos la privacidad de su dirección de correo electrónico. No transmitiremos ni venderemos su dirección a otras personas.
En cualquier momento puede cambiar sus preferencias o cancelar su suscripción por completo.

is growing fast!

We are looking to expand our presence in Peru!

As a Business Development Manager you will:

  • expand business in Peru
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!

Este sitio en otros países / regiones