
Big Data es un término que se refiere a soluciones destinadas a almacenar y procesar grandes conjuntos de datos. Desarrollado inicialmente por Google, estas soluciones han evolucionado e inspirado otros proyectos, de los cuales muchos están disponibles como código abierto. Según los informes de Gartner, Big Data es el próximo gran paso en TI justo después del Cloud Computing y será una tendencia líder en los próximos años.
Los cursos locales dirigidos por instructor en vivo de capacitación en Big Data comienzan con una introducción a conceptos elementales, luego avanzan hacia los lenguajes de programación y las metodologías utilizadas para realizar el Análisis de Datos. Las herramientas y la infraestructura para habilitar el almacenamiento de Big Data, el Procesamiento Distribuido y la Escalabilidad se discuten, comparan e implementan en sesiones demostrativas de práctica. La capacitación en Big Data está disponible en dos modalidades: "presencial en vivo" y "remota en vivo"; la primera se puede llevar a cabo localmente en las instalaciones del cliente en Peru o en los centros de capacitación corporativa de NobleProg en Peru, la segunda se lleva a cabo a través de un escritorio remoto interactivo.
NobleProg -- The World's Local Trainer Provider
Testimonios
La capacitacidad de la herramienta
Gerardo Avila - Reckitt Benckizer
Curso: KNIME Analytics Platform for BI
APRENDIZAJE DE UNA HERRAMIENTA NUEVA
MARIA ELENA DOMINGUEZ ESCUDERO - Reckitt Benckizer
Curso: KNIME Analytics Platform for BI
El hecho de que todos los datos y el software estaban listos para usar en una máquina virtual ya preparada, proporcionada por el capacitador en discos externos.
vyzVoice
Curso: Hadoop for Developers and Administrators
Machine Translated
rango de material
Maciej Jonczyk
Curso: From Data to Decision with Big Data and Predictive Analytics
Machine Translated
sistematizar el conocimiento en el campo de ML
Orange Polska
Curso: From Data to Decision with Big Data and Predictive Analytics
Machine Translated
Una gran cantidad de problemas que pueden ser explorados después del entrenamiento
Klaudia Kłębek
Curso: Data Mining z wykorzystaniem R
Machine Translated
El capacitador estaba tan bien informado e incluyó áreas en las que estaba interesado.
Mohamed Salama
Curso: Data Mining & Machine Learning with R
Machine Translated
Muy adaptado a las necesidades.
Yashan Wang
Curso: Data Mining with R
Machine Translated
Richard es muy tranquilo y metódico, con una visión analítica, exactamente las cualidades necesarias para presentar este tipo de curso.
Kieran Mac Kenna
Curso: Spark for Developers
Machine Translated
Me gustan los ejercicios realizados.
Nour Assaf
Curso: Data Mining and Analysis
Machine Translated
El ejercicio práctico y la capacidad del entrenador para explicar temas complejos en términos simples.
youssef chamoun
Curso: Data Mining and Analysis
Machine Translated
La información brindada fue interesante y la mejor parte fue hacia el final cuando recibimos datos de Durex y trabajamos en datos con los que estamos familiarizados y realizamos operaciones para obtener resultados.
Jessica Chaar
Curso: Data Mining and Analysis
Machine Translated
En general, me gustó que el entrenador diera ejemplos en vivo.
Simon Hahn
Curso: Administrator Training for Apache Hadoop
Machine Translated
Realmente disfruté de las grandes competencias de Trainer.
Grzegorz Gorski
Curso: Administrator Training for Apache Hadoop
Machine Translated
Realmente disfruté las muchas sesiones prácticas.
Jacek Pieczątka
Curso: Administrator Training for Apache Hadoop
Machine Translated
compartir diagrama conceptual y también muestra para manos sucias
Mark Yang - FMR
Curso: Spark for Developers
Machine Translated
Pensé que la información era interesante.
Allison May
Curso: Data Visualization
Machine Translated
Realmente aprecié que Jeff utilizara datos y ejemplos que fueran aplicables a los datos educativos. Lo hizo interesante e interactivo.
Carol Wells Bazzichi
Curso: Data Visualization
Machine Translated
Aprender sobre todos los tipos de gráficos y para qué se utilizan. Aprendiendo el valor del desorden. Aprendiendo sobre los métodos para mostrar datos de tiempo.
Susan Williams
Curso: Data Visualization
Machine Translated
Entrenador estaba entusiasmado.
Diane Lucas
Curso: Data Visualization
Machine Translated
Me gustó mucho el contenido / Instructor.
Craig Roberson
Curso: Data Visualization
Machine Translated
Soy un aprendiz práctico y esto fue algo que hizo mucho.
Lisa Comfort
Curso: Data Visualization
Machine Translated
Me gustaron los ejemplos.
Peter Coleman
Curso: Data Visualization
Machine Translated
En general, me beneficio de los ejemplos.
Peter Coleman
Curso: Data Visualization
Machine Translated
Disfruté los buenos ejemplos del mundo real, las revisiones de los informes existentes.
Ronald Parrish
Curso: Data Visualization
Machine Translated
Casos y casos aplicables
zhaopeng liu - Fmr
Curso: Spark for Developers
Machine Translated
Análisis de caso
国栋 张
Curso: Spark for Developers
Machine Translated
todas las partes de esta sesión
Eric Han - Fmr
Curso: Spark for Developers
Machine Translated
Realmente me beneficié de la buena disposición del entrenador para compartir más.
Balaram Chandra Paul
Curso: A practical introduction to Data Analysis and Big Data
Machine Translated
Sabemos mucho más sobre todo el entorno.
John Kidd
Curso: Spark for Developers
Machine Translated
El entrenador hizo la clase interesante y entretenida, lo que ayuda bastante con el entrenamiento de todo el día.
Ryan Speelman
Curso: Spark for Developers
Machine Translated
Creo que el entrenador tenía un estilo excelente de combinar el humor y las historias de la vida real para que los temas disponibles fueran muy accesibles. Recomiendo encarecidamente a este profesor en el futuro.
Curso: Spark for Developers
Machine Translated
Me gustó mucho la forma interactiva de aprender.
Luigi Loiacono
Curso: Data Analysis with Hive/HiveQL
Machine Translated
Fue un entrenamiento muy práctico, me gustaron los ejercicios prácticos.
Proximus
Curso: Data Analysis with Hive/HiveQL
Machine Translated
Me beneficié de la buena visión general, un buen equilibrio entre la teoría y los ejercicios.
Proximus
Curso: Data Analysis with Hive/HiveQL
Machine Translated
Disfruté de la interacción dinámica y "manos a la obra" del tema, gracias a la Máquina Virtual, ¡muy estimulante !.
Philippe Job
Curso: Data Analysis with Hive/HiveQL
Machine Translated
Ernesto hizo un gran trabajo al explicar los conceptos de alto nivel del uso de Spark y sus diversos módulos.
Michael Nemerouf
Curso: Spark for Developers
Machine Translated
Me beneficié de la competencia y el conocimiento del entrenador.
Jonathan Puvilland
Curso: Data Analysis with Hive/HiveQL
Machine Translated
En general, me beneficié de la presentación de tecnologías.
Continental AG / Abteilung: CF IT Finance
Curso: A practical introduction to Data Analysis and Big Data
Machine Translated
En general, el contenido fue bueno.
Sameer Rohadia
Curso: A practical introduction to Data Analysis and Big Data
Machine Translated
Ejercicios de ejemplo; intercambio de experiencias prácticas de trabajo
澳新银行
Curso: Data Vault: Building a Scalable Data Warehouse
Machine Translated
Cubo y DV
Alan Xie
Curso: Data Vault: Building a Scalable Data Warehouse
Machine Translated
El maestro tiene un conocimiento exhaustivo del almacén de datos.
澳新银行
Curso: Data Vault: Building a Scalable Data Warehouse
Machine Translated
El maestro explicó en detalle y discutió el ambiente
澳新银行
Curso: Data Vault: Building a Scalable Data Warehouse
Machine Translated
Michael the trainer es muy conocedor y habilidoso sobre el tema de Big Data y R. Es muy flexible y personaliza rápidamente la capacitación que satisface las necesidades de los clientes. Él también es muy capaz de resolver problemas técnicos y de temas sobre la marcha. Fantástico y profesional entrenamiento !.
Xiaoyuan Geng - Ottawa Research and Development Center, Science Technology Branch, Agriculture and Agri-Food Canada
Curso: Programming with Big Data in R
Machine Translated
Realmente disfruté la presentación de nuevos paquetes.
Ottawa Research and Development Center, Science Technology Branch, Agriculture and Agri-Food Canada
Curso: Programming with Big Data in R
Machine Translated
El tutor, el Sr. Michael Yan, interactuó muy bien con la audiencia, la instrucción fue clara. El tutor también hace todo lo posible para agregar más información basada en las solicitudes de los estudiantes durante la capacitación.
Ottawa Research and Development Center, Science Technology Branch, Agriculture and Agri-Food Canada
Curso: Programming with Big Data in R
Machine Translated
El tema y el ritmo fueron perfectos.
Tim - Ottawa Research and Development Center, Science Technology Branch, Agriculture and Agri-Food Canada
Curso: Programming with Big Data in R
Machine Translated
Creo que el entrenador tenía un estilo excelente de combinar el humor y las historias de la vida real para que los temas disponibles fueran muy accesibles. Recomiendo encarecidamente a este profesor en el futuro.
Curso: Spark for Developers
Machine Translated
Algunos de nuestros clientes






















.jpg)
.png)


























Programas de los cursos Big Data
Aprender a trabajar con SPSS a nivel de independencia
Los destinatarios:
Analistas, investigadores, científicos, estudiantes y todos aquellos que quieran adquirir la capacidad de utilizar el paquete SPSS y aprender técnicas de minería de datos populares.
En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán cómo usar MonetDB y cómo sacar el máximo provecho de ella.
Al final de esta capacitación, los participantes podrán:
- Comprender MonetDB y sus características
- Instalar y comenzar con MonetDB
- Explora y realiza diferentes funciones y tareas en MonetDB
- Acelere la entrega de su proyecto maximizando las capacidades de MonetDB
Audiencia
- Desarrolladores
- Expertos técnicos
Formato del curso
- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
- para ejecutar consultas SQL .
- para leer datos de una instalación de Hive existente.
En esta capacitación en vivo dirigida por un instructor (en el sitio o remota), los participantes aprenderán cómo analizar varios tipos de conjuntos de datos usando Spark SQL .
Al final de esta capacitación, los participantes podrán:
- Instalar y configurar Spark SQL .
- Realizar análisis de datos usando Spark SQL .
- Consultar conjuntos de datos en diferentes formatos.
- Visualizar datos y resultados de consultas.
Formato del curso
- Conferencia interactiva y discusión.
- Muchos ejercicios y práctica.
- Implementación práctica en un entorno de laboratorio en vivo.
Opciones de personalización del curso
- Para solicitar una capacitación personalizada para este curso, contáctenos para organizarlo.
Los asistentes aprenderán durante este curso cómo administrar los big data utilizando sus tres pilares de integración de datos, control de datos y seguridad de datos para convertir big data en valor comercial real. Diferentes ejercicios realizados en un estudio de caso de la gestión de clientes ayudarán a los asistentes a comprender mejor los procesos subyacentes.
En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán los fundamentos de Apache Hama a medida que avanzan en la creación de una aplicación basada en BSP y un programa centrado en vértices utilizando los marcos de Apache Hama.
Al final de esta capacitación, los participantes podrán:
- Instalar y configurar Apache Hama
- Comprender los fundamentos de Apache Hama y el modelo de programación Bulk Synchronous (BSP)
- Construya un programa basado en BSP usando el marco Apache Hama BSP
- Construya un programa centrado en vértices usando Apache Hama Graph Framework
- Cree, pruebe y depure sus propias aplicaciones Apache Hama
Audiencia
- Desarrolladores
Formato del curso
- Parte de lectura, parte de discusión, ejercicios y práctica práctica
Nota
- Para solicitar una capacitación personalizada para este curso, contáctenos para hacer arreglos.
En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán cómo integrar Kafka Streams en un conjunto de aplicaciones Java de muestra que pasan datos desde y hacia Apache Kafka para el procesamiento de flujo.
Al final de esta capacitación, los participantes podrán:
- Comprenda las características y ventajas de Kafka Streams frente a otros marcos de procesamiento de flujos
- Procesar datos de flujo directamente dentro de un clúster de Kafka
- Escriba una aplicación Java o Scala o microservicio que se integre con Kafka y Kafka Streams
- Escribe un código conciso que transforme los temas de entrada de Kafka en temas de salida de Kafka
- Construye, empaqueta y despliega la aplicación
Audiencia
- Desarrolladores
Formato del curso
- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
Notas
- Para solicitar una capacitación personalizada para este curso, contáctenos para hacer arreglos.
En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán cómo instalar, configurar y usar Dremio como una capa unificadora para las herramientas de análisis de datos y los repositorios de datos subyacentes.
Al final de esta capacitación, los participantes podrán:
- Instalar y configurar Dremio
- Ejecutar consultas en múltiples fuentes de datos, independientemente de la ubicación, el tamaño o la estructura
- Integre Dremio con BI y fuentes de datos como Tableau y Elasticsearch
Audiencia
- Científicos de datos
- Analistas comerciales
- Ingenieros de datos
Formato del curso
- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
Notas
- Para solicitar una capacitación personalizada para este curso, contáctenos para hacer arreglos.
En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán a optimizar y depurar Apache Drill para mejorar el rendimiento de las consultas en conjuntos de datos de gran tamaño. El curso comienza con una descripción general de la arquitectura y una comparación de características entre Apache Drill y otras herramientas interactivas de análisis de datos. Luego, los participantes pasan por una serie de sesiones de práctica interactivas y prácticas que incluyen instalación, configuración, evaluación del rendimiento, optimización de consultas, partición de datos y depuración de una instancia de Apache Drill en un entorno de laboratorio en vivo.
Al final de esta capacitación, los participantes podrán:
- Instalar y configurar el Apache Drill
- Comprender la arquitectura y las características de Apache Drill
- Comprender cómo Apache Drills recibe y ejecuta consultas
- Optimizar consultas de exploración para la ejecución de SQL distribuido
- Debug Drilling de depuración
Audiencia
- Desarrolladores
- Administradores de sistemas
- Analistas de datos
Formato del curso
- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
Notas
- Para solicitar una capacitación personalizada para este curso, contáctenos para hacer arreglos.
Al final de esta capacitación, los participantes podrán construir aplicaciones para productores y consumidores para el procesamiento de datos de flujo en tiempo real.
Audiencia
- Desarrolladores
- Administradores
Formato de la carrera
- Parte de lectura, parte de discusión, ejercicios y práctica práctica
Nota
- Para solicitar un entrenamiento personalizado para esta carrera, contáctenos para organizarlo.
En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán los fundamentos de Apache Drill, luego aprovecharán el poder y la conveniencia de SQL para consultar de manera interactiva big data en múltiples fuentes de datos, sin escribir código. Los participantes también aprenderán a optimizar sus consultas de exploración para la ejecución de SQL distribuido.
Al final de esta capacitación, los participantes podrán:
- Realizar exploración de "autoservicio" en datos estructurados y semiestructurados en Hadoop
- Consultar datos conocidos y desconocidos mediante consultas SQL
- Comprender cómo Apache Drills recibe y ejecuta consultas
- Escribir consultas SQL para analizar diferentes tipos de datos, incluidos datos estructurados en Hive, datos semiestructurados en tablas HBase o MapR-DB, y datos guardados en archivos como Parquet y JSON.
- Utilice Apache Drill para realizar el descubrimiento de esquemas sobre la marcha, evitando la necesidad de complejas operaciones ETL y esquemas
- Integre Apache Drill con herramientas de BI (Business Intelligence) como Tableau, Qlikview, MicroStrategy y Excel
Audiencia
- Analistas de datos
- Científicos de datos
- Programadores de SQL
Formato del curso
- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán los elementos esenciales de MemSQL para el desarrollo y la administración.
Al final de esta capacitación, los participantes podrán:
- Comprender los conceptos clave y las características de MemSQL
- Instalar, diseñar, mantener y operar MemSQL
- Optimizar esquemas en MemSQL
- Mejorar las consultas en MemSQL
- Rendimiento de referencia en MemSQL
- Construya aplicaciones de datos en tiempo real usando MemSQL
Audiencia
- Desarrolladores
- Administradores
- Ingenieros de operación
Formato del curso
- Conferencia de parte, discusiaón en parte, ejercicios y práctica práctica
En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán los fundamentos de Amazon Redshift.
Al final de esta capacitación, los participantes podrán:
- Instalar y configurar el Redshift de Amazon
- Cargar, configurar, implementar, consultar y visualizar datos con Amazon Redshift
Audiencia
- Desarrolladores
- Profesionales de TI
Formato del curso
- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
Nota
- Para solicitar una capacitación personalizada para este curso, contáctenos para hacer arreglos.
En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán cómo trabajar con Hadoop, MapReduce, Pig y Spark utilizando Python, ya que pasan por múltiples ejemplos y casos de uso.
Al final de esta capacitación, los participantes podrán:
- Comprender los conceptos básicos detrás de Hadoop, MapReduce, Pig y Spark
- Utilice Python con Hadoop Distributed File System (HDFS), MapReduce, Pig y Spark
- Utilice Snakebite para acceder mediante programación a HDFS dentro de Python
- Usa mrjob para escribir trabajos de MapReduce en Python
- Escribir programas Spark con Python
- Extienda la funcionalidad del cerdo usando las UDF de Python
- Administrar trabajos de MapReduce y scripts Pig utilizando Luigi
Audiencia
- Desarrolladores
- Profesionales de TI
Formato del curso
- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán a usar Python y Spark juntos para analizar los datos grandes mientras trabajan en ejercicios prácticos.
Al final de esta capacitación, los participantes podrán:
- Aprenda a usar Spark con Python para analizar Big Data
- Trabajar en ejercicios que imitan las circunstancias del mundo real
- Utilice diferentes herramientas y técnicas para el análisis de Big Data utilizando PySpark
Audiencia
- Desarrolladores
- Profesionales de TI
- Científicos de datos
Formato del curso
- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán la mentalidad con la cual abordarán las tecnologías de Big Data, evaluarán su impacto en los procesos y políticas existentes, e implementarán estas tecnologías con el propósito de identificar la actividad delictiva y prevenir el delito. Se examinarán estudios de casos de organizaciones de orden público de todo el mundo para obtener información sobre sus enfoques, desafíos y resultados de adopción.
Al final de esta capacitación, los participantes podrán:
- Combine la tecnología Big Data con procesos tradicionales de recopilación de datos para armar una historia durante una investigación
- Implementar soluciones industriales de almacenamiento y procesamiento de big data para el análisis de datos
- Preparar una propuesta para la adopción de las herramientas y procesos más adecuados para permitir un enfoque basado en datos para la investigación criminal
Audiencia
- Especialistas en aplicación de la ley con experiencia técnica
Formato del curso
- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
Análisis de datos que no solo los ayuda a cumplir con el cumplimiento, sino que están dentro del alcance de los mismos
proyecto pueden aumentar la satisfacción del cliente y así reducir el abandono. De hecho desde
el cumplimiento está relacionado con la calidad del servicio vinculada a un contrato, cualquier iniciativa para cumplir
cumplimiento, mejorará la "ventaja competitiva" de los CSP. Por lo tanto, es importante que
Los reguladores deberían ser capaces de asesorar / orientar un conjunto de prácticas analíticas de Big Data para los CSP que
ser de beneficio mutuo entre los reguladores y los CSP.
2 días de curso: 8 módulos, 2 horas cada uno = 16 horas
En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán sobre las diversas ofertas de tecnología e implementaciones para procesar datos de gráficos. El objetivo es identificar los objetos del mundo real, sus características y relaciones, luego modelar estas relaciones y procesarlas como datos utilizando enfoques de computación gráfica. Comenzamos con una amplia visión general y nos limitamos a herramientas específicas a medida que avanzamos en una serie de estudios de casos, ejercicios prácticos e implementaciones en vivo.
Al final de esta capacitación, los participantes podrán:
- Comprender cómo se conservan y atraviesan los datos de gráfico
- Seleccione el mejor marco para una tarea determinada (desde bases de datos de gráficos hasta marcos de procesamiento por lotes)
- Implemente Hadoop, Spark, GraphX y Pregel para llevar a cabo la computación gráfica en muchas máquinas en paralelo
- Ver problemas de Big Data en el mundo real en términos de gráficos, procesos y recorridos
Audiencia
- Desarrolladores
Formato del curso
- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán los fundamentos de la programación basada en flujo a medida que desarrollan una cantidad de extensiones de demostración, componentes y procesadores que usan Apache NiFi.
Al final de esta capacitación, los participantes podrán:
- Comprender los conceptos de arquitectura y flujo de datos de NiFi
- Desarrollar extensiones utilizando NiFi y API de terceros
- Desarrolla a medida su propio procesador Apache Nifi
- Ingerir y procesar datos en tiempo real de formatos de archivo dispares y poco comunes y fuentes de datos
Audiencia
- Desarrolladores
- Ingenieros de datos
Formato del curso
- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán a implementar y administrar Apache NiFi en un entorno de laboratorio en vivo.
Al final de esta capacitación, los participantes podrán:
- Instalar y configurar Apachi NiFi
- Fuente, transformar y gestionar datos de fuentes de datos dispersas y distribuidas, incluidas bases de datos y lagos de datos grandes.
- Automatice los flujos de datos
- Habilitar análisis de transmisión
- Aplicar varios enfoques para la ingestión de datos
- Transformar Big Data y en conocimientos empresariales
Audiencia
- Administradores del sistema
- Ingenieros de datos
- Desarrolladores
- DevOps
Formato del curso
- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán a configurar una instancia de SolrCloud en Amazon AWS.
Al final de esta capacitación, los participantes podrán:
- Comprender las características de SolCloud y cómo se comparan con las de los clústeres maestros-esclavos convencionales
- Configurar un clúster centralizado de SolCloud
- Automatice procesos como la comunicación con fragmentos, agregue documentos a los fragmentos, etc.
- Utilice Zookeeper junto con SolrCloud para automatizar aún más los procesos
- Use la interfaz para administrar informes de errores
- Balance de carga una instalación de SolrCloud
- Configure SolrCloud para un procesamiento continuo y conmutación por error
Audiencia
- Desarrolladores de Solr
- Gerentes de proyecto
- Administradores del sistema
- Analistas de búsqueda
Formato del curso
- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán a construir una Bóveda de datos.
Al final de esta capacitación, los participantes podrán:
- Comprender los conceptos de arquitectura y diseño detrás de Data Vault 2.0 y su interacción con Big Data, NoSQL y AI.
- Utilice las técnicas de bóvedas de datos para habilitar la auditoría, el seguimiento y la inspección de datos históricos en un almacén de datos
- Desarrollar un proceso ETL consistente (consistente) y repetible (Extraer, Transformar, Cargar)
- Construya y despliegue almacenes altamente escalables y repetibles
Audiencia
- Modeladores de datos
- Especialista en almacenamiento de datos
- Especialistas en inteligencia empresarial
- Ingenieros de datos
- Administradores de bases
Formato del curso
- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán a usar Datameer para superar la pronunciada curva de aprendizaje de Hadoop a medida que avanzan en la configuración y el análisis de una serie de grandes fuentes de datos.
Al final de esta capacitación, los participantes podrán:
- Crea, selecciona e interactivamente explora un lago de datos empresariales
- Acceda a almacenes de datos de inteligencia empresarial, bases de datos transaccionales y otras tiendas analíticas
- Use una interfaz de usuario de hoja de cálculo para diseñar las tuberías de procesamiento de datos de extremo a extremo
- Acceda a funciones preconstruidas para explorar relaciones de datos complejas
- Utilice asistentes de arrastrar y soltar para visualizar datos y crear paneles
- Use tablas, cuadros, gráficos y mapas para analizar los resultados de las consultas
Audiencia
- Analistas de datos
Formato del curso
- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
En este entrenamiento en vivo dirigido por un instructor (in situ o remoto), los participantes aprenderán cómo configurar e integrar diferentes marcos de Procesamiento de Stream con los sistemas de almacenamiento de big data existentes y aplicaciones de software y microservicios relacionados.
Al final de esta capacitación, los participantes podrán:
- Instale y configure diferentes marcos de procesamiento de flujo, como Spark Streaming y Kafka Streaming
- Comprender y seleccionar el marco más adecuado para el trabajo
- Proceso de datos de forma continua, concurrente y de forma récord por registro
- Integre soluciones de procesamiento de flujo con bases de datos existentes, almacenes de datos, lagos de datos, etc.
- Integración de la biblioteca de procesamiento de flujo más apropiada con aplicaciones empresariales y microservicios
Audiencia
- Desarrolladores
- Arquitectos de software
Formato del curso
- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
Notas
- Para solicitar una capacitación personalizada para este curso, contáctenos para hacer arreglos.
En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán cómo maximizar las características de Pentaho Open Source BI Suite Community Edition (CE).
Al final de esta capacitación, los participantes podrán:
- Instalar y configurar Pentaho Open Source BI Suite Community Edition (CE)
- Comprender los fundamentos de las herramientas Pentaho CE y sus características
- Genere informes usando Pentaho CE
- Integrar datos de terceros en Pentaho CE
- Trabaja con big data y análisis en Pentaho CE
Audiencia
- Programadores
- Desarrolladores de BI
Formato del curso
- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
Nota
- Para solicitar una capacitación personalizada para este curso, contáctenos para hacer arreglos.
En este entrenamiento en vivo dirigido por un instructor, los participantes aprendieron los principios detrás del almacenamiento persistente y puro en la memoria a medida que avanzan en la creación de un proyecto de ejemplo de computación en memoria.
Al final de esta capacitación, los participantes podrán:
- Utilice Ignite para la memoria en la memoria, la persistencia en disco y una base de datos en memoria puramente distribuida
- Logre la persistencia sin sincronizar los datos a una base de datos relacionales
- Use Ignite para llevar a cabo SQL y Uniones Distribuidas
- Mejore el rendimiento moviendo los datos más cerca de la CPU, usando la RAM como almacenamiento
- Extienda conjuntos de datos en un clúster para lograr la escalabilidad horizontal
- Integre Ignite con RDBMS, NoSQL, Hadoop y procesadores de aprendizaje automático
Audiencia
- Desarrolladores
Formato del curso
- Conferencia de parte, discusión en parte, ejercicios y práctica práctica
Esta capacitación en vivo dirigida por un instructor (en el sitio o remota) está dirigida a ingenieros de software que desean transmitir grandes datos con Spark Streaming y Scala .
Al final de esta capacitación, los participantes podrán:
- Cree aplicaciones Spark con el lenguaje de programación Scala .
- Use Spark Streaming para procesar flujos continuos de datos.
- Procese flujos de datos en tiempo real con Spark Streaming.
Formato del curso
- Conferencia interactiva y discusión.
- Muchos ejercicios y práctica.
- Implementación práctica en un entorno de laboratorio en vivo.
Opciones de personalización del curso
- Para solicitar una capacitación personalizada para este curso, contáctenos para organizarlo.
By the end of this training, participants will be able to use Apache Kafka to monitor and manage conditions in continuous data streams using Python programming.
By the end of this training, participants will be able to:
- Install and configure Talend Open Studio for Big Data.
- Connect with Big Data systems such as Cloudera, HortonWorks, MapR, Amazon EMR and Apache.
- Understand and set up Open Studio's big data components and connectors.
- Configure parameters to automatically generate MapReduce code.
- Use Open Studio's drag-and-drop interface to run Hadoop jobs.
- Prototype big data pipelines.
- Automate big data integration projects.