Diplomado en Big Data y Ciencia de Datos para Negocios.
El mercado requiere profesionales capaces de comprender e interpretar grandes cantidades de información. Especialízate en el tratamientos de los datos para mejorar las estrategias y crear oportunidades de negocios.
Descripción:
El Diplomado en Big Data y Ciencias de Datos para Negocios aborda herramientas para trabajar con grandes volúmenes de datos, a través del tratamiento y análisis de la información, permitiendo una adecuada interpretación y comunicación de los resultados.
Las clases son tanto expositivas, como aplicadas, donde los alumnos utilizan las herramientas en diversos talleres que se realizan. Todas las actividades buscan potenciar las habilidades analíticas, estratégicas y toma de decisiones con datos en cualquier organización, además del trabajo en equipo.
Dirigido a:
Profesionales que deseen enfrentarse al desafío de sacar el mejor provecho posible a datos de gran tamaño y complejidad, a través de nuevas e innovadoras técnicas, con el objetivo de impactar la toma de decisiones claves en sus negocios. Está orientado a profesionales como ingenieros, economistas, estadísticos, y otros profesionales licenciados y/o con experiencia en áreas afines.
Antecedentes Generales:
- Versión 2°: 26 de agosto de 2019
- Lugar de realización: Campus San Joaquín, metro San Joaquín
- Lunes y miércoles de 18:30 a 21:45 horas.
- 148 horas cronológicas.
Contenidos:
SEMINARIO: INTRODUCCIÓN A BIG DATA, DATA SCIENCE E INTELIGENCIA ARTIFICIAL
– Tendencias Tecnológicas y la estrategia: Big Data, IoT, Análisis de Datos, Inteligencia Artificial y Machine Learning
– Big Data: Definiciones, arquitecturas , Map-Reduce, Hadoop, Spark
– Bases de Datos, Data Warehouses y Data Lakes
ARQUITECTURA E INFRAESTRUCTURA PARA BIG DATA Y DATA SCIENCE
– Tecnologías y servicios en la nube para BI, Big Data y Data Science
– Procesamiento de datos eficiente con tecnologías Big Data
– Diseño de arquitecturas de alta disponibilidad para BI y Big Data
– Diseño y uso de infraestructura de alto rendimiento para algoritmos de Data Science
– Estrategias y mejores prácticas en el desarrollo de componentes para arquitecturas de procesamiento masivo de datos
– Diferencias entre soluciones de datos tradicionales y soluciones de Big Data
– Gestión operativa de la infraestructura en un modelo de servicio continuo
PROGRAMACIÓN EN R PARA CIENCIA DE DATOS
– Conceptos generales de programación en R: variables, estructuras de control, condicionales
– Funciones y paquetes
– Vectores y Matrices
– Listas
– Data Frames
– Importación, limpieza y filtrado de datos
– Dataframes: construcción y mezcla
– Visualización gráfica
– Análisis estadístico de datos con R: población y muestreo, tipos de datos, tablas de frecuencias, estadísticos descriptivos, coeficiente de posición y dispersión, errores de los procesos de medición, aplicaciones
– Distribuciones de probabilidad
– Regresión lineal con R
– Regresión logística con R
– Series de tiempo
MINERÍA DE DATOS
– Introducción: El concepto, el proceso y los problemas en que es relevante
– Análisis de la canasta de mercado y reglas de asociación
– Clasificación: Árboles de Decisión, K-vecinos cercanos
– Clustering: K-Means, Mean-Shift y Clustering aglomerativo
– Selección de modelos (hold out, cross validation
VISUALIZACIÓN DE DATOS
Unidad 1 Teoría sobre Visualización de Datos
– Introducción: breve historia, disciplinas de comunicación gráfica e importancia de visualizar datos
– La “des-Excelización” y democratización de datos en la empresa
– Condiciones necesarias para una visualización: datos y caso
– Objetivos de la visualización: contenido vs usuario, acceso, interacción y actualización
– Fuentes de información: sistemas transaccionales, sistemas web, datos públicos
– Preparación de datos: integridad, calidad, homologación
– Generalidades sobre tipos de datos: medidas, dimensiones
– Atributos a usar en una visualización
– Análisis de los tipos de gráficos más comunes para representar datos
– Exploración visual de datos
– Indicadores, Reportes y Dashboards
– Presentación de las herramientas principales del mercado
– Visualizaciones avanzadas: scripting
Unidad 2: Visualización de Datos Aplicada
– Datos de empresa: reportes transversales a industrias y vistas específicas
– Revisión de casos de uso de Dashboards generales
– Revisión de casos de uso específicos por industrias
– Revisión de casos de uso por niveles de usuarios: analistas vs C-level
CIENCIA DE DATOS Y SUS APLICACIONES
– La evolución de la ciencia de datos y el análisis predictivo para el apoyo a la toma de decisiones
– Las características que definen a una organización data-driven
– Cómo las empresas modernas estás generando productos y servicios analíticos
– Metodologías de análisis de datos y búsqueda de patrones
– Generación de modelos descriptivos, análisis de casos reales y trabajo práctico
– Generación de modelos predictivos y prescriptivos, análisis de casos reales y trabajo práctico
– Cómo interpretar modelos analíticos para tomar mejores decisiones de negocio
FUNDAMENTOS Y APLICACIONES DE MACHINE LEARNING Y DEEP LEARNING
Aprendizaje Automático Supervisado
– Modelos de ML, capacidades y características, así como ejemplos de aplicación.
– Metodología de desarrollo de modelos
– Tratamiento y refinamiento de datos
Aprendizaje Profundo Supervisado
– Conceptos esenciales y diferencias con ML más básico
– Redes Neuronales Convolucionales y Redes Neuronales Recurrentes
– Análisis dimensional, entrenamiento, y tratamiento de grandes datos
Aprendizaje Automático No-Supervisado
– Diferentes modelos como K-Means, HDBSCAN, Restricted Boltzmann Machines, entre otros
Aplicaciones Industriales
– Clasificación, predicción, y recomendación, en contextos industriales y retail
– Procesamiento de lenguaje natural, en atención de clientes y ámbito legal
El futuro Inmediato en ML y DL
– Hacia el razonamiento artificial
Nota: El orden de los cursos dependerá de la programación que realice la Dirección Académica.