Extractos de Maestria - Rimenri
Extractos de Maestria - Rimenri
Extractos de Maestria - Rimenri
METODOLOGIA BI/DWÆT
EXTRACTO DEL
TRABAJO DE INVESTIGACION PARA OBTENER EL GRADO DE
MAESTRO EN INGENIERIA DE SISTEMAS CON MENCION EN
SISTEMAS DE INFORMACION
AUTOR
RICARDO DARIO MENDOZA RIVERA
1
2
Veamos en forma detallada cada punto:
ROAD MAP: CONSTRUCCION SOLUCION DW/BI
PLANEAMIENTO Plan del Proyecto Visión del Negocio
Equipo de Trabajo
Cronograma
REQUERIMIENTOS Requerimiento Revisión Plan Estratégico
Y ANALISIS Entrevistas
DEL NEGOCIO Revisión Reportes Estadísticos
Datos Transaccionales
Análisis Dimensional Hoja de Gestión
Hoja de Análisis
Cuadro Dimensiones Y Jerarquías
Cuadro de Medidas vs Dimensiones
Análisis Dimensional Final
DISEÑO Diseño Dimensional Definir el Grano
Diseñar Dimensiones y Medidas
Escoger Tabla Hecho
Documentación del Modelo
Diseño de Prototipos Definiendo Interfaz
Ubicando Dimensiones
Ubicando Medidas
Personalización de Reportes Analíticos
CONSTRUCCION DataMart Implementar Dimensiones
Implementar Tabla Hecho
Crear Relaciones
ETL Realizar Mapeo
Diagrama General de Poblamiento
Poblamiento de Dimensiones
Poblamiento de Tabla Hecho
Creación de Programación de Tareas
Creación de Cubos Identificación de Orígenes
Vistas de la Conexión
Creación de Cubos
+ Dimensiones
+ Tabla Hecho
Preparar Interfaces Desarrollo de Aplicaciones
+ Usando herramientas de oficina
+ Usando herramientas visuales
3
2.1 Plan del Proyecto:
Visión del Producto: documento que muestra una idea general de lo que se obtendrá del
producto, su alcance, que es lo que se necesita para ejecutarlo y los posibles riesgos que
podría tener el proyecto. En el Anexo 01 se tiene el formato del documento.
Conformación de Equipos: los integrantes del equipo responsable de la solución, tanto del lado
de los usuarios de gestión como del personal de Tecnología de Información
Representante del Negocio: es la persona que recibe el beneficio directo del producto. El que
toma las decisiones directamente. Generalmente puede ser el gerente o jefe de área.
Experto del Negocio: es el conocedor de la forma como se obtienen los datos o lo que realmente
se desea analizar. Por ejemplo en el caso de tener un indicador de deserción estudiantil, es el que
directamente dirá como calcularlo.
Desarrollador DW/BI: conoce los temas de ETL, construcción de aplicaciones con ADOMD,
manejo de controles para lectura de información con cubos y Lenguaje MDX.
2.2.1 Requerimientos
5
Revisar el Plan Estratégico
Con ayuda del personal involucrada en gestión. Se tendría que revisar el Plan Estratégico
estableciendo indicadores de gestión que permitan determinar el seguimiento de los objetivos
y/o metas establecidas.
Como producto final de los requerimientos debemos obtener los indicadores, bajo el siguiente
formato:
Indicador Medidas
6
mostrar el avance del indicador respecto a una meta establecida. Se
sugiere manejar 3 estados:
o Bueno: indica la parte ideal a ser alcanzada. Es la meta
propiamente dicha.
o Regular: es un estado intermedio el cual nos muestra que
estamos acercándonos a la meta y saliendo del estado negativo.
o Malo: muestra un estado negativo del indicador y un peligro
latente de no alcanzar la meta en los plazos establecidos.
Para los estados mencionados deben de indicar el valor o valores
mínimo y máximo sobre los que
Realizar Entrevistas
Manejaremos 2 tipos de entrevistas:
A los responsables de gestión.
Al personal de Tecnologías de Información, especialmente al experto de la base
de Datos.
Personal de Gestión: las preguntas se clasificarán en:
Conocer la gestión del negocio: Aquí es vital 3 puntos
• Identificar los objetivos
• Conocer las estrategias
• Definir los indicadores y Medidas.
Podríamos resumir, la información obtenida, en la técnica del semáforo mencionada
en el punto anterior.
7
Identificar los requerimientos analíticos. Para ello enfocado en el proceso de
negocios de estudio hay que aplicar la técnica dimensional.
Esto nos lleva a encontrar las dimensiones que son las preguntas pre-concebidas a
realizar (Ver Anexo 04).
8
Fig. 30 Ejemplo Análisis Dimensional Ventas. Medidas y Dimensiones
• Dimensiones
• Niveles
• Jerarquías.
Análisis de Data.
9
Determinar el costo de oportunidad de la obtención de la información, así como
determinar el nivel de dependencia del personal de gestión respecto a las IT. Sería
altamente conveniente ubicar los reportes que IT prepara, claro si los realizan,
para el personal de Gestión.
Disponibilidad de la Data.
Revisión de Reportes Estadísticos
Este reporte tiene más utilidad los Montos Vendidos (100,000) se puede apreciar en
diferentes perspectivas (dimensiones) por ejemplo en el caso del producto: Montos
Vendidos por Marca o Línea, o cuanto se ha vendido a los Clientes Principales.
Nótese que se puede combinar los montos vendidos de los Clientes Regulares en la
Marca Ace de la Sucursal Norte.
10
RESUMEN DE VENTAS. Sucursal Norte
Período : 2008
Tipos de Cliente
Columna1 Principales Regulares Nuevos Total
Aceites
Primor 6,500 2,000 1,500 10,000
Crisol 9,750 3,000 2,250 15,000
SAO 3,250 1,000 750 5,000
** Total Aceite ** 19,500 6,000 4,500 30,000
Detergentes
Ariel 9,750 3,000 2,250 15,000
Bolivar 7,800 2,400 1,800 12,000
Ace 5,200 1,600 1,200 8,000
** Total Detergente ** 22,750 7,000 5,250 35,000
Lacteos
Gloria 13,000 4,000 3,000 20,000
Layve 9,750 3,000 2,250 15,000
** Total Lacteos ** 22,750 7,000 5,250 35,000
** Totales ** 65,000 20,000 15,000 100,000
11
A continuación se plantea una serie de preguntas que pueden ayudar a
encontrar: medidas, dimensiones y jerarquías.
Identificar dimensiones
Visualice la clasificación del cuadro e identifique las cabeceras de las columnas
con menor nivel.
Visualice la clasificación del cuadro e identifique las cabeceras de las filas con
menor nivel.
Visualice el título del reporte e identifique el nivel más bajo
Identificar medidas
Cuál es la intersección entre las columnas y filas de menor nivel.
Identificar Jerarquías
Identifique los acumulados a nivel de Columna
Identifique los acumulados a nivel de Fila
Identifique alguna clasificación en el título
Datos Transaccionales
Aquí es donde debemos incluir el modelo actual de datos, así mismo adjuntar como Anexo la
Documentación respectiva (Ver Anexo 05), a fin de determinar la descripción exacta de los
datos cuando efectuemos el proceso de ETL respectiva.
2.2.2 Análisis
Formato Descripción
12
Permite definir los indicadores y las
Hoja de Gestión medidas respectivas
HOJA DE GESTION
Objetivos: resumir los objetivos del proceso de negocios encontrados propuestos como para
gestionar adecuadamente el proceso.
Estrategias: especificar las acciones que se toman en cuenta con el fin de satisfacer los
objetivos planteados
Ejemplo:
13
Indicador Medidas Estado Inicial Final
HOJA DE ANALISIS
El formato que presentamos (Ver Anexo 07) incluye los items:
Medidas: definir las medidas encontradas a partir de los indicadores de gestión definidos en el
plan estratégico o las entrevistas tenidas. Así mismo si existiera alguna medida más
encontrada en los requerimientos definidos en la etapa anterior también debe ser incluida.
Ejemplo:
Montos Cobrados
Montos Vendidos
Dimensiones y Niveles: incluir las dimensiones encontradas, asi como expresar los puntos de
análisis o niveles encontrados por cada dimensión. No hay ningún orden definido en los
niveles, lo importante es incluir todos los puntos de análisis.
Dimensiones Niveles
CUADRO DIMENSIONES Y JERARQUIAS
Jerarquías: organizar niveles entrados de las dimensiones, para permitir análisis de lo más
genérico a lo detallado o viceversa. Estos niveles son los mismos encontrado en el punto
anterior, pero de una manera organizada. El nivel 1 debe incluir el dato más detallado hasta
alcanzar el más genérico.
JERARQUIAS
Dimensiones
Nivel 1 Nivel 2 Nivel 3 Nivel 4 Nivel 5
RazonSoc TipoClient
Cliente ial e
15
CUADRO DIMENSIONES Y MEDIDAS
DIMENSIONES
Medidas
Cliente Producto Tiempo Personal Forma Medio
Pago Pago
Montos
Vendidos X X X X X
Montos
Cobrados X X X X X
Para efectuar este análisis elegir una medida y definir en qué transacción se genera esta
medida. Luego de ello preguntar si en la transacción hay un dato que represente a la
dimensión o si es factible que la medida sea analizada por tal dimensión.
ANALISIS DIMENSIONAL FINAL
De acuerdo al análisis del cuadro de dimensiones y medidas si no todas las medidas pueden
ser analizadas por dimensiones comunes se procede a crear diferentes análisis finales.
Tomando como muestra el cuadro de dimensiones y medidas del punto anterior tendríamos
dos análisis dimensionales. Ya que la medida Montos Cobrados no es analizada por la
dimensión producto, y en el caso de la medida Montos Vendidos no es analizada por la
dimensión Medio de Pago.
16
Fig. 35. Análisis Dimensional Final. Ejemplo 1
TIEMPO PRODUCTO
Linea
Año Proveedor
Marca
Mes
Descripción
FORMAPAGO
Ciudad Región
PuntoVenta
RazonSocial
Sucursal
TipoCliente
CLIENTE
ORGANIZAC 9 MontoVendido
9 CantidadVendida
2.3 Diseño
Una vez cumplida la etapa de análisis en donde formalmente se definió por el lado del personal
de gestión sus requerimientos estratégicos, ahora el personal de tecnología inicia sus tareas
para ir construyendo el producto basado en el análisis dimensional. En nuestra propuesta
hemos elegido el Modelo Dimensional tipo Estrella, como a continuación describiremos:
17
Constituye en implementar las dimensiones en tablas dimensionales y las
medidas en tablas hecho (fact: término en ingles muy usado) a partir de los análisis
dimensionales finales encontrados, en la etapa de análisis.
DEFINIR EL GRANO
Nivel
Nivel
Dimensión 4 Hechos
Nivel Dimensión 2
Nivel
Dimensión n
Ejemplo:
18
Producto Descripc Tiempo
Fecha
Forma
FormaPago Hechos
Ventas
PuntoVe Organizacion
RazonS
Cliente
DISEÑAR DIMENSIONES
19
Fig. 39. Implementando Dimensión Muestra
RazonSocial TipoCliente
ESCOGER LA TABLA HECHO
20
Una tabla hecho debe contener:
Hecho_Ventas
KeyCliente: int (FK)
KeyProducto: int (FK)
KeyOrganizacion: int (FK)
KeyTiempo: int (FK)
KeyFormaPago: int (FK)
MontosVendidas: char(18)
UnidadesVendidas: char(18)
DISEÑO DIMENSIONAL COMPLETO
Las dimensiones deben unirse con su tabla hecho correspondiente de acuerdo a los
análisis dimensionales presentados anteriormente.
Los componentes recomendados mínimos que deben formar parte de una interfaz son
los siguientes:
21
Fig. 43. Prototipo de una Aplicación de Soporte de Decisiones
a. Barra de Herramientas
Incluye funcionalidad complementaria al Area de Construcción y
Visualización de Reporte Dinámico como:
• Ordenamientos
• Exportaciones a hojas de cálculo,
• Filtros
• impresión de reportes, entre otras
c. Lista de Cubos
El sistema mostrará los cubos a los que tiene acceso el analista
dimensional y en base a ello el sistema mostrará los componentes del
cubo (medidas y dimensiones).
22
• Medidas
• Dimensiones
Ellas dos deben ser arrastradas dentro del Area de Construcción, de
acuerdo al grafico indicado.
f. Area de Dimensiones
Es donde se pueden “arrastrar” o incluir las dimensiones respectivas a
partir de la sección de los componentes del cubo la cual se va
reflejando en el Area de Construcción y Visualización de Reporte
Dinámico, se pueden ubicar en 3 secciones:
• Filas
• Columnas
• Filtros
g. Area de Medidas
Se encuentra ubicada directamente en el Area de Construcción y se
van incluyendo las medidas desde los componentes del cubo.
2.4 Construcción
2.4.1 DataMart
Implementar Dimensiones
23
• La Clave Primaria debe ser un “surrogate key” un valor que no sirva para
interpretación, pero si para unicidad, se recomienda tener un campo con
características auto numéricas. En el caso de SQL Server se maneja la
propiedad IDENTITY.
• En el caso de los “atributos dimensionales” estos deben ser de longitud
variable.
Implementar Tabla Hecho
Considere adicionalmente:
Note que cada dimensión se encuentra presente en la tabla hecho por medio de su
Key, esto permitirá enlazar la medida con la dimensión y niveles respectivos.
24
2.4.2 ETL
Mapeo
Una vez definido nuestra Base de Datos Multidimensional y ya implementado
físicamente en el DBMS respectivo, es necesario comenzar a cargarle los datos
respectivos. Estamos en el proceso ETL, la propuesta que incluimos es la siguiente
DataWareHouse
La información se encontrará disponible en la base de datos multidimensional, lista
para implementar los Servicios OLAP respectivos.
En este lapso utilizaremos la estrategia de Limpieza Total a fin de mantener
consistente los datos y además la información una vez que se encuentra cerrada en el
transaccional ya no es editada por ningún motivo.
25
Esquema General de Poblamiento
a) Poblamiento de Dimensiones
Por cada dimensión se debe definir:
• Origen de datos
• Destino de Datos
• Mapeo respectivo
26
Fig. 47. Mapeo Dimensión Modalidad Ingreso
27
c) Creación de Programación de Tareas
Consiste en programar en una frecuencia de tiempo determinada el momento de
ejecución de la tarea respectiva. Generalmente las herramientas poseen
Agentes de ejecución de Tareas que permiten definir momentos tal como a
continuación se muestra:
28
Cubos
OLAP
Extensiones de
Conex Datos
Data WareHouse,
Data Mart
b) Personalizar esquema
c) Crear Cubo
• Seleccionar tablas dimensionales
• Seleccionar Tabla Hecho
29
Fig. 52. Definiendo Tablas Hecho y Dimensionales
30
Fig. 54. Diseño Final de un Cubo
d) Personalizar Cubo
Va por el lado de la creación de jerarquías. De acuerdo a lo que se ha definido
en el modelo dimensional.
31
Fig. 56. Creando Jerarquías de una Dimensión
e) Procesar Cubo
Desde el punto de vista del rendimiento del cubo sugerimos usar MOLAP
32
Fig. 58. Tipos de Agregaciones
a. Aplicaciones de Oficina
• Crear la conexión al Cubo
33
Fig. 61 Creando Conexión al Analisys Services
34
Fig. 64. Interfaz con Herramientas de Oficina .
B) Herramientas Visuales
• Acceso al Sistema
Es necesario incluir un acceso a la aplicación, asignando el usuario
y password respectivo.
35
Fig. 66. Seleccionando Cubo desde Aplicación
a) Medidas
b) Dimensiones
a) Medidas
36
b) Dimensiones
37
ANEXOS
38
Anexos Maestría en Ingeniería de Sistemas
con mención en Sistemas de Información
(Son los requisitos humanos, materiales y de equipamiento necesario para desarrollar el proyecto y
en el caso del Equipamiento para su operatividad.)
3 Humanos
(Son los recursos humanos que directamente para la consecución del producto – tanto del
lado de Gestión como de Tecnologías Información).
• Gestión
• Tecnologías Información
4 Materiales
39
Ing.Ricardo Mendoza Rivera
Anexos Maestría en Ingeniería de Sistemas
con mención en Sistemas de Información
5 Equipamiento
• Hardware
• Software
• Comunicaciones
(Factores que podrían incidir en la ejecución normal del proyecto – que impidan que
se realice en el tiempo previsto o determinen que un sobrecosto al presupuesto
asignado-)
40
Ing.Ricardo Mendoza Rivera
Tesis Maestria
Introducción
(Discutir los objetivos del proyecto y las metas de las entrevistas)
Analizar Requerimientos
(Definir las necesidades directas basados en los requerimientos analíticos y la técnica de
modelamiento dimensional. Es altamente recomendable haber definido: Que? , Quien? , Como?,
Donde?, De qué forma?, etc )
Introducción
(Discutir los objetivos del proyecto y las metas de las entrevistas)
Proceso
(Definir el nombre del Proceso de Negocios a Implementar)
Objetivos
(Objetivos encontrados del proceso de negocios)
Estrategias
(Estrategias Implementar asociadas a la consecución de los objetivos planteados)
Indicadores
(Permiten realizar un seguimiento de la consecución de los objetivos planteados)
Proceso
(Definir el nombre del Proceso de Negocios a Implementar)
Medidas
(Definir las medidas encontradas en los indicadores y otras de ser requeridas)
Dimensiones
(Incluir las dimensiones encontradas y los puntos de análisis para dimensiones: niveles)
Dimensiones Niveles
Proceso
(Definir el nombre del Proceso de Negocios a Implementar)
JERARQUIAS
( Organizar Niveles para permitir análisis de lo genérico a
Dimensiones lo detallado o viceversa)
Nombre Nombre
Dimensión Nivel
(empezar
desde el
nivel más
detallado)
Proceso
(Definir el nombre del Proceso de Negocios a Implementar)
DIMENSIONES
(Especificar las dimensiones encontradas en la Hoja de
Medidas Análisis)
Nombre
Medida 2
Nombre
Medida n