El mundo de los datos data science y machine learning

¿Qué es ciencia de datos y big data? ¿Cómo afectan a mi negocio?

  • Big Data
    • Gran volumen de información.
    • Las empresas almacenan información diariamente.
      • Información sobre Costos, eficiencia, clientes.
    • Solución matemática a un problema de negocio.

¿Qué tipo de información podemos analizar?

  • Tipología de datos:
    • Personas.
    • Transacciones.
    • Navegación web.
    • Machine 2 Machine.
    • Biométricos.

¿Cómo crear empresas y culturas data-driven?

  • Entender qué componentes son necesarios par crear una cultura data-driven.
    1. Crear una cultura de datos.
      • Tomar decisiones basadas en datos.
    2. Recolectar información.
    3. Medir todo.
    4. Datos relevantes y precisos.
    5. Testear y crear hipótesis.
    6. Desde los insights de datos a las acciones.
    7. Cumplir las regulaciones de datos.
    8. Automatizar.

¿Qué es inteligencia artificial y machine learning?

  • Usos:
    • Detección de fraudes.
    • Búsqueda web.
    • Anuncios a tiempo real.
    • Análisis de textos.
    • Next best action.

Herramientas y roles de trabajo en ciencia de datos

Flujo de trabajo en ciencia de datos: fases, roles y oportunidades laborales.

  • Ingeniero de datos:
    • Base de datos.
    • ETLs/APIs.
    • SQL y NoSQL.
  • Analista bussiness inteligence
    • Extracción y dashboards.
    • Automatización.
    • SQL y Excel.
  • Data Scientist
    • Machine learning.
    • Modelos estadísticos.
    • R y Python.
  • Data Translator.
    • Data Scientist - Decision makers.
    • Destiladores de data.
    • Expertos en necesidad de negocio.

Herramientas para cada etapa del análisis de datos

  • Extracción de información con SQL.
    • Extracción de información.
    • Síntesis de base de datos.
    • Cuadros de control de la operación.
  • Análisis y visualización de datos con R y Python.

Problemas de negocio: análisis

Cómo estructurar un caso de negocio?

  • Desglosar un problema de negocio en una hipótesis estructurada.
    • Qué?: Problema de negocio Hipótesis: Partir de una pregunta específica.
    • Por qué?: Clasificar todos los motivos y sistematizarlos en pocas categorías.
    • Cómo?: Estrategia de cómo vamos a diseñar y organizar todo el análisis.
      1. Análisis Cuantitativo:
        • Debe ir siempre primero ya que es toda la información.
        • Hacer una clasificación numérica.
      2. Análisis Cualitativo:
        • Buscar categorías en función de texto.
        • Nos ayuda a identificar características, tipos relacionados con el problema.
      3. Matriz cuantitativa-cualitativa:
        • Poner en conjunto la información.
        • Entender los números y explicarlos más a profundidad.
      4. Acciones de prevención;
        • Definir acciones con la información que tenemos.
        • Pasar de los insights a acciones.
      5. Validación:
        • Verificar si nuestro análisis ha servido y si nuestras acciones de prevención están teniendo efecto.

Problemas de negocio: Implementación

Acciones, algoritmos y toma de decisiones según los resultados del análisis

  • Algoritmos usados:
    • Minería de datos para clasificación de motivos de contacto.
    • Correlaciones y patrones de comportamiento.
    • Árboles de decisión y teoría de juegos para predecir y tomar decisiones
    • Validación con bayesianos y MCMC (Cadenas de montecarlo).
  • Acciones:
    • Taggear a los Top Ofenders identificados mensualmente.
    • Advertirlos.
    • Bloquear usuarios.
    • Validación con A/B Test.