Cada día crece aún más la demanda de profesionales con habilidades en el uso Apache Spark, el framework de programación para procesamiento de datos distribuidos diseñado para ser rápido y de propósito general. Además Apache Spark es parte esencial de muchos proyectos de Big Data y empresas como IBM, MIcrosoft, Amazon, Google lo integran con sus productos de Big Data.
Por esta y muchas más razones hemos querido compartir aprendizajes, desde la comunidad de Apache Spark Bogotá, en nuestro primer Taller Práctico.
El evento 'Workshop Spark de 0 a Intermedio' finalizó el 05-Oct-2019.
Este evento fue organizado con Ticketcode, ver ¿Cómo funciona?
Durante todo un día, el 05 de octubre de 2019, comprenderemos la arquitectura y las herramientas a utilizar para desarrollar aplicaciones de Spark en nuestros proyectos de Big Data.
El taller será dirigido con un enfoque intenso en escritura de código, dirigido mediante diapositivas y escritura de código en vivo, para así avanzar rápidamente con la aplicación de los nuevos conceptos en ejercicios prácticos.
Hora de Inicio: 9:00 am
Hora de finalización: 4:00 pm
Lugar: Oficinas de PayU Calle 99 #14 49, Bogotá
Incluye: Almuerzo
Cupos disponibles: 40
Temas a desarrollar en el Taller:
Descripción de Spark
Descripción de PySpark
Configurando Databricks
Introducción e Instalación de entorno de trabajo.
Primeros pasos con Spark DataFrames
Definición de tablas e importación de conjuntos de datos
Consultar marcos de datos con SQL
Implementando Operaciones Básicas con Spark
Usando Groupby y operaciones agregadas
Trabajando con marcas de tiempo y fechas
Trabajando con JOINS
Trabajando en un ejercicio de proyecto Spark DataFrame
Formatos de almacenamiento: JSON / Parquet
Introducción a MLlib, para el aprendizaje automático
Aprendizaje de la teoría de regresión lineal
Implementando un código de evaluación de regresión
Trabajando en un ejercicio de regresión lineal de muestra
Aprender la teoría de la regresión logística
Implementando un Código de Regresión Logística
Trabajando en un ejemplo de ejercicio de regresión logística
El taller está dirigido a personas con muchas ganas de aprender. Preferiblemente, pero no indispensable, si tienen con conocimiento en Python. No es requerido conocimiento previo en Machine Learning ni Apache Spark, todo se explicará en el taller.
Gracias a nuestros patrocinadores el taller no tendrá ningún costo. Cabe recordar que Apache Spark Bogotá es una comunidad sin ningún ánimo de lucro. Tanto los organizadores como los instructores somos voluntarios. Tan solo esperamos que nos ayudes a compartir la información con más amigos. Por favor solo regístrate si puedes asistir. Ya que tenemos cupos limitados.
Requerimiento: Es requerido llevar portátil para el desarrollo del taller. No es necesario instalar software, ya que se usarán herramientas cloud.
Agradecemos a nuestros patrocinadores
PayU Latam: Nos proporcionarán el lugar para el taller.
Cloudera: Nos obsequiara camisetas para los asistentes.
OmniBnk: Nos proporcionará almuerzo y un refrigerio.
Es momento de entrar en sintonia con la era de la información. Este grupo propone reunir a todos los locos por la data y ofrecer propuestas nuevas en torno a la nueva estrella del Big Data: Apache Spark. Machine learning, Analisis de grafos y por supuesto Hadoop, serán algunos de los temas a tratar
VISITAR PERFIL¿Preguntas acerca del evento?