Machine Learning en Power BI con R y Python Analítica Avanzada Analítica Predictiva Aprendizaje Automático Para todos Publicación: Julio 2021 Pablo J Moreno Primera Edición Gabriel Gomez www.mlbi.io Este libro contribuye al desarrollo de aplicaciones de código abierto y la educación
Machine Learning en Power BI con R y Python es un libro escrito en lenguaje muy simple con multitud de ejemplos prácticos que permitirá a cualquier usuario de Power BI, amateur o experto, a realizar análisis avanzado de datos, analítica predictiva y aprendizaje automático. No se requiere experiencia previa en programación. En la Sección I conocerá los fundamentos de analítica avanzada y aprendizaje automático, así como los conceptos fundamentales para desarrollar analítica avanzada o predictiva. En la Sección II se enfoca en desarrollar analítica avanzada con R, tanto en visualización como en transformación de datos. La Sección III está dedicada al uso de Python para realizar analítica predictiva y aprendizaje automático. Por último, en la Sección IV se aporta al lector recursos y material adicional para continuar su aprendizaje en estas disciplinas. www.mlbi.io
Motivación y propósito de este libro Power BI Power BI uso habitual Power BI es una herramienta conocida por su gran funcionalidad y versatilidad para reportería, análisis de datos e inteligencia de negocios. Sin embargo, no es muy conocido el enorme potencial que aportan los lenguajes de programación R y Python cuando interactúan con Power BI. Este libro tiene el propósito de acercar e iniciar al usuario de Power BI al uso de estos lenguajes de programación para expandir el uso de Power BI más allá del análisis histórico de datos. No es un libro de programación, ni de ciencia de datos como tal, aunque se cubren los fundamentos necesarios para su implementación, aplicación e interpretación de resultados. Esperamos que este libro ayude al lector a iniciar su andadura en la ciencia de datos a un nivel avanzado. www.mlbi.io
INDICE Sección I - Fundamentos Conceptos fundamentales de Inteligencia de Negocios, Analítica Avanzada, Aprendizaje Automático, Ciencia de Datos e Inteligencia artificial Inteligencia de Negocios Analítica Avanzada Analítica descriptiva Analítica diagnostica Analítica Predictiva Aprendizaje Automático Modelos de regresión Modelos de clasificación Modelos de clustering Modelos de asociación Modelos de control Ciclo de vida de Aprendizaje Automático Ciencia de Datos Inteligencia Artificial Profesionales de los Datos Analista de datos Ingeniero de datos Administrador de Bases de datos Ingeniero de Machine Learning Científico de datos Arquitecto de datos Estadístico Analista de Negocio Big Data Big Data versus Small Data Calidad de Datos Tidy Data www.mlbi.io
Sección II – Analítica Avanzada con R Instalación de R, RStudio y sincronización con Power BI Importar y Exportar datos Importar documentos Importar csv Importar Excel Importar cualquier documento delimitado Importar desde ZIP (sin descomprimir) Importar desde SPSS, STATA y SAS Importar desde MongoDB Importar desde Google Drive Exportar datos (funcionalidad write-back) Exportar como csv Exportar como documento Google (Hoja de Cálculo) Escribir tablas en base de datos (SQL, MySQL, PostgreSQL) Preparación, limpieza y análisis de datos Modificaciones básicas de datos Funciones básicas de dplyr Transformación de datos con dplyr Limpieza de títulos de columnas Tratamiento de valores nulos. Imputaciones Columnas con formulación avanzada Escalado y centrado de valores Desviación sobre la media Porcentaje sobre el total Suma acumulativa de una variable Salto de línea Visualización Entendiendo como funciona ggplot2 Reglas de componentes Estética Geometrías Escalas Facetas Reglas a nivel de grafico Ejemplos de visualización avanzada www.mlbi.io
Gráfico de ridge o área Gráfico de ridge stepped Gráfico de violín con caja Gráfico de regresión múltiple Gráfico de caja con dispersión Gráfico de correlación (múltiples variables) Correlograma Correlograma compuesto Distribución marginal Clustering o Dendrograma Doble Dendrograma Gráfico de densidad Múltiples barras circulares Coordenadas paralelas Gráfico de forecasting (prophet) Gráfico de lollipop Anotaciones en gráficos Formato condicional de color Líneas y áreas de color Analítica avanzada Series temporales y Forecasting Objeto serie temporal Modelos estadísticos Naive Method Simple Exponential Smooth Holt Trend ARIMA TBATS Prophet Regresión Lineal Regresión lineal simple Regresión lineal múltiple Regresión no lineal, monótona y no monótona Generalized additive model (gam) Regresión Logística Poner un modelo predictivo de R en producción con Power BI www.mlbi.io
Sección III – Aprendizaje Automático con Python Instalación de Python y sincronización con Power BI Instalación de Anaconda y Python Configuración de entorno virtual Instalando paquetes en el entorno virtual Sincronización de Python con Power BI Machine Learning con Python Aprendizaje no supervisado Análisis de Clustering Implementación de clustering Aplicación – segmentación de clientes Aplicación – análisis geoespacial Análisis de Asociación, Recomendación y Market Basket Analysis Implementación de asociación, recomendación, market basket analysis Aplicación – análisis de cesta de la compra Aplicación – análisis de solicitudes a TI Detección de anomalías Implementación de detección de anomalías Aplicación – Análisis de producción industrial Aplicación – Análisis de telemetría Aplicación – compras con tarjeta de crédito empresarial Aprendizaje supervisado Análisis de Regresión Implementación de análisis de regresión Estructurar el proceso de predicción Aplicación – Análisis de desviaciones sobre la predicción Aplicación – Aprendizaje automático de regresión Aplicación – Series temporales con regresión Análisis de Clasificación Implementación de análisis de clasificación Estructurar el proceso de predicción Aplicación – Clasificación bi-variable Aplicación – Clasificación multivariable Aplicación – Clasificación bi-variable desbalanceada www.mlbi.io
Evaluación de modelos y validación de resultados Selección del modelo más optimo Regresión Clasificación Ejemplo de selección del modelo mas optimo Validación de resultados Regresión Clasificación Aplicación – validación de resultados – regresión Procesamiento de Lenguaje natural Análisis de texto Procesamiento de palabras Limpieza de texto Análisis de sentimiento de texto Producción Distribuir un modelo en producción como aplicación (app) Metodo de regresión Metodo de clasificación Implementación de un modelo en producción Sección IV – Recursos adicionales Métodos de evaluación de modelos Glosario de términos Ggplot2 – hoja rápida Tidyverse – hora rápida Recursos adicionales Bibliografía www.mlbi.io
Agradecimientos Al Todopoderoso, por la creación y todo lo que nos permite hacer. A todos nuestros familiares y seres queridos, presentes y ausentes. Gracias a todos ellos hoy estamos orgullosos de ser quienes somos y hacer lo que hacemos. A todos nuestros amigos y profesionales que hemos conocido durante nuestra existencia, con especial mención a: Freddy González Moez Ali Pablo Peralta Francisco Mullor Ricardo Rincón Ruben Pertusa Miguel Egea Ana Maria Bisbé Salvador Ramos Didier Atehortúa Y otros muchos que han marcado nuestra vida personal y profesional www.mlbi.io
Sobre los autores Pablo J Moreno Científico de datos con experiencia en inteligencia empresarial, análisis avanzado y aprendizaje automático en múltiples campos comerciales: mercados financieros, finanzas corporativas, marketing digital, operaciones, gestión de riesgos y auditoría interna. Microsoft MVP (Data Platform) desde 2019 Gabriel Gomez Profesional informático especializado en desarrollo e Implementación de software, administración de DB (Base de Datos) SQL e Inteligencia de negocio. Especialista en minería de datos y análisis avanzado de datos, así como manejo de herramientas tecnológicas y generación de reportes. www.mlbi.io
Publicación: Julio 2021 mlbi.io www.mlbi.io
Search
Read the Text Version
- 1 - 11
Pages: