08/04/2019 – Business Intelligence II

La clase de este día ha comenzado con la proposición de realizar la definición de varios términos cada uno. En este caso le ha tocado cuatro términos a cada uno y los términos que yo he definido han sido los siguientes:


 

Staging Area: En lo referente al manejo de datos, se refiere al área de almacenamiento intermedio entre las fuentes de información y el almacén de datos (DW) o Data mart (DM). Por lo general, es de naturaleza temporal y su contenido puede borrarse después de que el DW o DM se haya cargado correctamente. Se utilizan durante la fase de transformación de la información.

Fuente: Wikipedia


 

Calidad de datos: La calidad de los datos hace referencia a la cualidad de un conjunto de datos recogidos que reúne entre sus atributos la precisión, integridad, coherencia, totalidad, validez, disponibilidad, representación y unicidad necesarias para resultar útiles a la organización.

Fuente: Transparencias de clase


 

Velocidad de datos: Se trata de una de las cinco dimensiones del big data (5 V’s), la velocidad en big data se refiere al ritmo en que los datos de entrada fluyen desde las diversas fuentes, también hace referencia a la velocidad de acceso a los datos, siendo este un factor importante por ejemplo a la hora de tomar decisiones con datos en tiempo real.

Fuente: Artículo prometeusgs.com, Artículo BAOSS


 

Volumen de datos: Se trata de una de las cinco dimensiones del big data (5 V’s), el volumen en big data hace referencia a la gran cantidad (volumen) de datos que se generan, cantidad que ha crecido de manera exponencial como resultado de que ahora no sean solo las personas las que generan datos sino las máquinas también lo hagan de manera automática. El volumen de datos está directamente relacionado con la capacidad para ser almacenados.

Fuente: Artículo prometeusgs.com, Artículo BAOSS

 


 

A continuación hemos realizado una primer acercamiento al mapa conceptual que deberíamos realizar como tarea para la asignatura. Este mapa lo he usado como base para la realización del mío propio, el cuál se puede encontrar en el portafolio de la asignatura.

En cuanto al contenido de las transparencia subidas este día, he realizado el siguiente resumen.

Este se centra en las fases de BI que nos faltaron por dar en la clase anterior (acceso y explotación):

  • Acceso. Se apoya en una capa, que suele llamarse Middleware, de acceso a los sistesmas de generación de conocimiento. Proporciona una serie de operación con los datos:
    • Básicas. Supone introducir, controlar y almacenar datos. Utilizan BD convencionales.
    • Descriptivas. Supone explicar los datos existentes (Agrupar, sintetizar, descubrir patrones, etc.)
    • Predictivas. Supone preveer para la toma de decisiones.
  • Explotación. Se encarga de generar conocimiento útil a partir de la información almacenada en fases anteriores. Se encuentran las interfaces de usuario y se apoyan en herramientas como los EISS, DSS, Data Mining, OLAP o Inteligencia Artificial y Redes Neuronales.
    • Hacen uso de Metadatos.
    • Proporciona las herramientas para la toma de decisiones.

Herramientas OLAP, son herramientas con la capacidad de procesar consultas en línea con el objetivo de analizar datos de manera rápida, permitiendo el análisis, usando mecanismos de seguridad, concurrencia y compartición de datos, y que permite almacenar y gestionar gran cantidad de datos e información.

Sus objetivos son que los usuarios no dependan del departamento de informática, que se puedan formular nuevas preguntas de forma dinámica, presentar los datos de la manera útil.

Entre sus características se encuentra la multidimensionalidad que se gestiona a partir de cubos en los cuales se realizan como operaciones de trabajo Slice, Dice, Roll-up, Drill down o Drill across que se encadenan. OLAP se divide en:

  • ROLAP
  • HOLAP
  • MOLAP

También están el concepto de Data Mining utilizado para trabajar con gran cantidad de datos o Big Data que son “los activos de información de gran volumen, velocidad y variedad, que demandan formas innovadoras de procesamiento de la información, de manera rentable para conseguir un mayor conocimiento y con ello mejor toma de decisiones.” en base a la definición de Gartner.

 

 

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s