El mundo de los datos data science y machine learning
¿Qué es ciencia de datos y big data? ¿Cómo afectan a mi negocio?
Big Data
- Gran volumen de información.
- Las empresas almacenan información diariamente.
- Información sobre Costos, eficiencia, clientes.
- Solución matemática a un problema de negocio.
¿Qué tipo de información podemos analizar?
- Tipología de datos:
- Personas.
- Transacciones.
- Navegación web.
Machine 2 Machine.
- Biométricos.
¿Cómo crear empresas y culturas data-driven?
- Entender qué componentes son necesarios par crear una cultura
data-driven.
- Crear una cultura de datos.
- Tomar decisiones basadas en datos.
- Recolectar información.
- Medir todo.
- Datos relevantes y precisos.
- Testear y crear hipótesis.
- Desde los
insights de datos a las acciones.
- Cumplir las regulaciones de datos.
- Automatizar.
¿Qué es inteligencia artificial y machine learning?
- Usos:
- Detección de fraudes.
- Búsqueda web.
- Anuncios a tiempo real.
- Análisis de textos.
Next best action.
Herramientas y roles de trabajo en ciencia de datos
Flujo de trabajo en ciencia de datos: fases, roles y oportunidades laborales.
- Ingeniero de datos:
- Base de datos.
- ETLs/APIs.
- SQL y NoSQL.
- Analista
bussiness inteligence
- Extracción y
dashboards.
- Automatización.
- SQL y Excel.
Data Scientist
Machine learning.
- Modelos estadísticos.
- R y Python.
Data Translator.
Data Scientist - Decision makers.
- Destiladores de data.
- Expertos en necesidad de negocio.
Herramientas para cada etapa del análisis de datos
- Extracción de información con SQL.
- Extracción de información.
- Síntesis de base de datos.
- Cuadros de control de la operación.
- Análisis y visualización de datos con R y Python.
Problemas de negocio: análisis
Cómo estructurar un caso de negocio?
- Desglosar un problema de negocio en una hipótesis estructurada.
- Qué?: Problema de negocio → Hipótesis: Partir de una pregunta
específica.
- Por qué?: Clasificar todos los motivos y sistematizarlos en pocas
categorías.
- Cómo?: Estrategia de cómo vamos a diseñar y organizar todo el
análisis.
- Análisis Cuantitativo:
- Debe ir siempre primero ya que es toda la información.
- Hacer una clasificación numérica.
- Análisis Cualitativo:
- Buscar categorías en función de texto.
- Nos ayuda a identificar características, tipos relacionados
con el problema.
- Matriz cuantitativa-cualitativa:
- Poner en conjunto la información.
- Entender los números y explicarlos más a profundidad.
- Acciones de prevención;
- Definir acciones con la información que tenemos.
- Pasar de los
insights a acciones.
- Validación:
- Verificar si nuestro análisis ha servido y si nuestras
acciones de prevención están teniendo efecto.
Problemas de negocio: Implementación
Acciones, algoritmos y toma de decisiones según los resultados del análisis
- Algoritmos usados:
- Minería de datos para clasificación de motivos de contacto.
- Correlaciones y patrones de comportamiento.
- Árboles de decisión y teoría de juegos para predecir y tomar
decisiones
- Validación con bayesianos y MCMC (Cadenas de montecarlo).
- Acciones:
Taggear a los Top Ofenders identificados mensualmente.
- Advertirlos.
- Bloquear usuarios.
- Validación con A/B Test.