Workshop Spark de 0 a Intermedio

Descripción

Cada día crece aún más la demanda de profesionales con habilidades en el uso Apache Spark, el framework de programación para procesamiento de datos distribuidos diseñado para ser rápido y de propósito general. Además Apache Spark es parte esencial de muchos proyectos de Big Data y empresas como IBM, MIcrosoft, Amazon, Google lo integran con sus productos de Big Data.

Por esta y muchas más razones hemos querido compartir aprendizajes, desde la comunidad de Apache Spark Bogotá, en nuestro primer Taller Práctico.

Entradas Disponibles

Evento cerrado

El evento 'Workshop Spark de 0 a Intermedio' finalizó el 05-Oct-2019.

Este evento fue organizado con Ticketcode, ver ¿Cómo funciona?

Detalles del Evento

Durante todo un día, el 05 de octubre de 2019, comprenderemos la arquitectura y las herramientas a utilizar para desarrollar aplicaciones de Spark en nuestros proyectos de Big Data.


El taller será dirigido con un enfoque intenso en escritura de código, dirigido mediante diapositivas y escritura de código en vivo, para así avanzar rápidamente con la aplicación de los nuevos conceptos en ejercicios prácticos.


Hora de Inicio: 9:00 am

Hora de finalización: 4:00 pm

Lugar: Oficinas de PayU Calle 99 #14 49, Bogotá

Incluye: Almuerzo

Cupos disponibles: 40



Temas a desarrollar en el Taller:

  • Descripción de Spark

  • Descripción de PySpark

  • Configurando Databricks

  • Introducción e Instalación de entorno de trabajo.

  • Primeros pasos con Spark DataFrames

  • Definición de tablas e importación de conjuntos de datos

  • Consultar marcos de datos con SQL

  • Implementando Operaciones Básicas con Spark

  • Usando Groupby y operaciones agregadas

  • Trabajando con marcas de tiempo y fechas

  • Trabajando con JOINS

  • Trabajando en un ejercicio de proyecto Spark DataFrame

  • Formatos de almacenamiento: JSON / Parquet

  • Introducción a MLlib, para el aprendizaje automático

  • Aprendizaje de la teoría de regresión lineal

  • Implementando un código de evaluación de regresión

  • Trabajando en un ejercicio de regresión lineal de muestra

  • Aprender la teoría de la regresión logística

  • Implementando un Código de Regresión Logística

  • Trabajando en un ejemplo de ejercicio de regresión logística


El taller está dirigido a personas con muchas ganas de aprender. Preferiblemente, pero no indispensable, si tienen con conocimiento en Python. No es requerido conocimiento previo en Machine Learning ni Apache Spark, todo se explicará en el taller.


Gracias a nuestros patrocinadores el taller no tendrá ningún costo. Cabe recordar que Apache Spark Bogotá es una comunidad sin ningún ánimo de lucro. Tanto los organizadores como los instructores somos voluntarios. Tan solo esperamos que nos ayudes a compartir la información con más amigos. Por favor solo regístrate si puedes asistir. Ya que tenemos cupos limitados.


Requerimiento: Es requerido llevar portátil para el desarrollo del taller. No es necesario instalar software, ya que se usarán herramientas cloud.


Agradecemos a nuestros patrocinadores

PayU Latam: Nos proporcionarán el lugar para el taller.

Cloudera: Nos obsequiara camisetas para los asistentes.

OmniBnk: Nos proporcionará almuerzo y un refrigerio. 

 

Importante 
Por favor solo registrarte si puedes asistir, recuerda que tendremos cupos limitados 

Lugar

Ver Mapa

Compartir

facebook sharing button
twitter sharing button
messenger sharing button
whatsapp sharing button
linkedin sharing button
email sharing button

Organizador

Es momento de entrar en sintonia con la era de la información. Este grupo propone reunir a todos los locos por la data y ofrecer propuestas nuevas en torno a la nueva estrella del Big Data: Apache Spark. Machine learning, Analisis de grafos y por supuesto Hadoop, serán algunos de los temas a tratar

VISITAR PERFIL

¿Preguntas acerca del evento?