T Espe 047750
T Espe 047750
T Espe 047750
CERTIFICADO
CERTIFICAN
______________________ ______________________
Ing. Washington Pérez Ing. Andrés de la Torre
DIRECTOR CODIRECTOR
II
DECLARACIÓN DE RESPONSABILIDAD
DECLARAMOS QUE:
___________________________ ______________________
AUTORIZACIÓN DE PUBLICACIÓN
autoría.
__________________________ ______________________
AGRADECIMIENTO
En primer lugar agradezco a nuestro padre Dios por estar vivo con salud y
amigos y compañeros.
por enseñarme a ser más fuerte en la vida y darme los concejos necesarios
y mucho sacrificio.
Holger Cruz
V
DEDICATORIA
siempre han anhelado este paso durante mucho tiempo para continuar
Holger Cruz
VI
AGRADECIMIENTO
Agradezco a Dios por darme la vida y una familia unida que día a día han
Gracias a mis padres por sus consejos y por haberme formado en valores
para ser una persona de bien, agradezco cada sacrificio que han hecho
durante toda mi vida para darme lo mejor, por desvelarse junto a mí en mis
amo.
Ximena Lozada
VII
DEDICATORIA
A mis padres Héctor Lozada e Isabel Peñafiel por ser el pilar fundamental en
toda mi vida, por todo el esfuerzo y sacrificio que siempre han hecho para
aconsejándome, por ser mis mejores amigas y mis segundas madres las
quiero ñañitas.
que mis días sean más felices a su lado, por ser mi inspiración a lo largo de
toda mi carrera.
Ximena Lozada
VIII
ÍNDICE DE CONTENIDOS
CAPÍTULO 1 ...................................................................................................................................... 1
1.1. ANTECEDENTES ................................................................................................................... 1
1.2. PLANTEAMIENTO DEL PROBLEMA............................................................................................. 4
1.3. JUSTIFICACIÓN .................................................................................................................... 5
1.4. OBJETIVOS ........................................................................................................................ 7
1.4.1. OBJETIVO GENERAL .............................................................................................................. 7
1.4.2. OBJETIVOS ESPECÍFICOS ........................................................................................................ 7
1.5. ALCANCE ........................................................................................................................ 7
CAPÍTULO 2 .................................................................................................................................... 10
FUNDAMENTACIÓN TEÓRICA ......................................................................................................... 10
2.1. BASES TEÓRICAS................................................................................................................ 10
2.1.1. DEFINICIONES IMPORTANTES................................................................................................ 10
2.1.1.1. OLTP ........................................................................................................................ 10
2.1.1.2. OLAP........................................................................................................................ 11
2.1.1.3. DATA WAREHOUSING .................................................................................................... 11
2.1.1.4. DATA WAREHOUSE ....................................................................................................... 12
2.1.1.5. OPERATIONAL DATA STORE (ODS) ................................................................................... 13
2.1.1.6. DATA MART. ............................................................................................................... 13
2.2. INTELIGENCIA DE NEGOCIOS (BUSINESS INTELLIGENCE BI) ........................................................... 14
2.2.1. ORÍGENES. ...................................................................................................................... 14
2.2.2. DEFINICIÓN. .................................................................................................................... 17
2.2.3. PROCESO PARA REALIZAR BUSINESS INTELLIGENT. ...................................................................... 18
2.3. BODEGA DE DATOS (DATA WAREHOUSE) ................................................................................ 20
2.3.1. DEFINICIÓN ..................................................................................................................... 20
2.3.2. FUNCIONALIDAD ............................................................................................................... 20
2.3.3. CARACTERÍSTICAS .............................................................................................................. 21
UN DATA WAREHOUSE ES: ............................................................................................................... 21
ORIENTADO AL NEGOCIO. ........................................................................................................ 21
INTEGRADO. ......................................................................................................................... 21
VARIANTE EN EL TIEMPO. ......................................................................................................... 21
NO VOLÁTIL. ......................................................................................................................... 21
REDUNDANTE. ...................................................................................................................... 21
2.3.3.1. ORIENTADA AL NEGOCIO................................................................................................. 21
2.3.3.2. INTEGRADA ................................................................................................................. 22
2.3.3.3. VARIANTE EN EL TIEMPO ................................................................................................. 23
2.3.3.4. NO VOLÁTIL................................................................................................................. 24
2.3.3.5. REDUNDANCIA ............................................................................................................. 25
2.3.4. ESTRUCTURA .................................................................................................................... 26
2.3.5. OLTP VS DW .................................................................................................................. 27
2.4. ARQUITECTURA DATA WAREHOUSING .................................................................................... 29
2.4.1. OLTP............................................................................................................................. 30
2.4.2. LOAD MANAGER ............................................................................................................... 31
2.4.2.1. EXTRACCIÓN ................................................................................................................ 32
2.4.2.2. TRANSFORMACIÓN........................................................................................................ 33
2.4.2.2.1. TIPOS DE DATOS Y MEDIDA ........................................................................................ 34
2.4.2.2.2. CODIFICACIÓN ......................................................................................................... 35
2.4.2.2.3. FUENTES MÚLTIPLES. ................................................................................................ 36
2.4.2.2.4. CONVENCIONES DE NOMBRAMIENTO. ........................................................................... 37
2.4.2.2.5. LIMPIEZA DE DATOS .................................................................................................. 38
IX
2.4.2.3. CARGA ....................................................................................................................... 39
2.4.3. DATA WAREHOUSE MANAGER ............................................................................................. 39
2.4.3.1. BASE DE DATOS MULTIDIMENSIONAL ................................................................................. 41
2.4.3.2. TABLAS DE DIMENSIÓN .................................................................................................. 43
2.4.3.2.1. TABLAS DE DIMENSIÓN TEMPORALIDAD. ........................................................................ 44
2.4.3.3. TABLAS DE HECHOS ....................................................................................................... 45
2.4.4. QUERY MANAGER ............................................................................................................. 47
2.4.5. HERRAMIENTAS DE CONSULTA Y ANÁLISIS. ............................................................................... 48
2.4.6. USUARIOS. ...................................................................................................................... 49
2.4.7. VENTAJAS Y DESVENTAJAS DEL DATA WAREHOUSING ................................................................. 50
2.5. INDICADOR DE GESTIÓN (KPI)............................................................................................... 53
2.5.1. IMPORTANCIA DE LOS INDICADORES DE GESTIÓN EMPRESARIAL .................................................... 53
2.5.2. LA CLAVE DEL PROCESO DE SELECCIÓN DE KPI. ......................................................................... 54
2.5.3. CLASIFICACIÓN. ................................................................................................................ 56
2.5.4. SISTEMA DE INDICADORES ................................................................................................... 57
2.6. ANÁLISIS DE LAS METODOLOGÍAS PARA BUSINESS INTELLIGENCE. .................................................. 59
2.7. METODOLOGÍA HEFESTO. ................................................................................................... 61
2.7.1. CARACTERÍSTICAS. ............................................................................................................. 62
2.7.2. PASOS Y APLICACIÓN DE LA METODOLOGÍA. ............................................................................. 63
2.7.2.1. PASO 1. ANÁLISIS DE REQUERIMIENTOS. ............................................................................ 64
2.7.2.1.1. IDENTIFICAR PREGUNTAS ............................................................................................ 64
2.7.2.1.2. IDENTIFICAR INDICADORES Y PERSPECTIVAS ..................................................................... 66
2.7.2.1.3. MODELO CONCEPTUAL .............................................................................................. 66
2.7.2.2. PASO 2. ANÁLISIS DE LOS OLTP. ...................................................................................... 67
2.7.2.2.1. CONSTRUCCIÓN DE LOS INDICADORES ............................................................................ 67
2.7.2.2.2. ESTABLECER CORRESPONDENCIA. ................................................................................. 69
2.7.2.2.3. NIVEL DE GRANULARIDAD. .......................................................................................... 69
2.7.2.2.4. MODELO CONCEPTUAL AMPLIADO................................................................................ 71
2.7.2.3. PASO 3. MODELO LÓGICO DEL DW ................................................................................... 72
2.7.2.3.1. TIPO DE MODELO LÓGICO. ......................................................................................... 72
2.7.2.3.2. DISEÑO TABLAS DE DIMENSIONES. ................................................................................ 73
2.7.2.3.3. TABLAS DE HECHOS. .................................................................................................. 76
2.7.2.3.4. UNIONES. .............................................................................................................. 79
2.7.2.4. PASO 4. INTEGRACIÓN DE DATOS ..................................................................................... 80
2.8. HERRAMIENTAS. ............................................................................................................... 82
2.8.1. MICROSOFT SQL SERVER .................................................................................................... 82
2.8.2. MICROSOFT VISUAL ESTUDIO ............................................................................................... 83
2.8.3. SQL SERVER MANAGEMENT STUDIO ..................................................................................... 84
2.8.4. DEVEXPRESS SUITE ............................................................................................................ 85
2.8.4.1. DXPERIENCE ENTERPRISE ................................................................................................ 85
2.8.4.2. DXTREME ENTERPRISE ................................................................................................... 85
2.8.5. POWERDESIGNER .............................................................................................................. 85
CAPÍTULO 3 .................................................................................................................................... 87
ANÁLISIS Y DISEÑO DEL PROYECTO ................................................................................................ 87
3.1. METODOLOGÍA HEFESTO. ................................................................................................... 87
3.1.1. ETAPA I). ANÁLISIS DE REQUERIMIENTOS. ............................................................................... 87
3.1.1.1. IDENTIFICAR PREGUNTAS ................................................................................................ 87
3.1.1.2. IDENTIFICAR INDICADORES Y PERSPECTIVAS .......................................................................... 89
3.1.1.3. MODELO CONCEPTUAL .................................................................................................. 90
3.1.2. ETAPA II). ANÁLISIS DE OLTP............................................................................................... 91
3.1.2.1. CONSTRUCCIÓN DE LOS INDICADORES. ............................................................................... 91
3.1.2.1.1. MONTO DE CARTERA VENCIDA RECUPERADA. .................................................................. 91
3.1.2.1.2. MONTO DE CARTERA VENCIDA NO RECUPERADA. .............................................................. 92
X
3.1.2.1.3. PAGOS EFECTUADOS. ................................................................................................ 92
3.1.2.1.4. EFICIENCIA DEL EJECUTIVO EN RECUPERAR LA CARTERA. ...................................................... 92
3.1.2.1.5. EFICIENCIA DEL EJECUTIVO EN CONTACTAR LOS CLIENTES. ................................................... 93
3.1.2.1.6. EFICIENCIA DE LA EMPRESA EN RECUPERAR LA CARTERA. ..................................................... 93
3.1.2.1.7. EFICIENCIA DE LA EMPRESA EN CONTACTAR A LOS CLIENTES. ................................................ 94
3.1.2.2. ESTABLECER CORRESPONDENCIA....................................................................................... 94
3.1.2.3. NIVEL DE GRANULARIDAD ............................................................................................. 104
3.1.2.4. MODELO CONCEPTUAL AMPLIADO. ................................................................................. 110
3.1.3. ETAPA III). MODELO LÓGICO DEL DATA WAREHOUSE. .............................................................. 111
3.1.3.1. TIPO DE MODELO LÓGICO DEL DATA WAREHOUSE. .............................................................. 111
3.1.3.2. TABLAS DE DIMENSIÓN. ................................................................................................ 111
3.1.3.3. TABLAS DE HECHOS. .................................................................................................... 114
3.1.3.4. UNIONES. ................................................................................................................. 115
3.2. ANÁLISIS KPI. ................................................................................................................ 115
3.2.1. DEFINICIÓN DEL OBJETIVO DEL ESTUDIO. ............................................................................... 115
3.2.2. MATRIZ DE KPI............................................................................................................... 117
CAPÍTULO 4 .................................................................................................................................. 118
DESARROLLO Y CONSTRUCCIÓN................................................................................................... 118
4.1. APLICACIÓN METODOLOGÍA HEFESTO. ........................................................................................ 118
4.1.1. ETAPA IV). INTEGRACIÓN DE DATOS. ........................................................................................ 118
4.1.1.1. CARGA INICIAL. ................................................................................................................ 119
4.1.1.1.1 PROCESO 1. CARGA FUENTES EXTERNAS AL ÁREA DE DESEMBARCO. ............................................. 119
4.1.1.1.2 PROCESO 2. CARGA DE LAS TABLAS DE DIMENSIÓN AL ÁREA DEL DWH. ........................................ 131
4.1.1.1.3 PROCESO 3. CARGA DE LA TABLA DE HECHOS AL ÁREA DEL DWH. ............................................... 132
4.1.1.2. ACTUALIZACIÓN. .............................................................................................................. 133
4.1.1.3. CONSTRUCCIÓN DEL CUBO DE RECUPERACIÓN DE CARTERA. ........................................................ 134
4.1.1.3.1 CREACIÓN DEL PROYECTO ANALYSIS SERVICES MULTIDIMENSIONAL. ........................................... 135
4.1.1.3.2 CONFIGURACIÓN DE LA CONEXIÓN A LA BASE DEL DWH. .......................................................... 136
4.1.1.3.3 CONFIGURACIÓN DE LA VISTA BASE DEL CUBO MULTIDIMENSIONAL. ............................................ 137
4.1.1.3.4 CREACIÓN DE LAS DIMENSIONES DEL CUBO MULTIDIMENSIONAL................................................. 138
4.1.1.3.5 CREACIÓN DEL CUBO MULTIDIMENSIONAL. ........................................................................... 141
4.1.1.3.6 CREACIÓN DE JERARQUÍAS. ............................................................................................... 144
4.1.1.3.7 CREACIÓN DE INDICADORES. .............................................................................................. 145
4.1.1.3.8 CREACIÓN DE KPI. .......................................................................................................... 147
4.2. APLICACIONES PARA USUARIOS FINALES. ...................................................................................... 149
4.2.1. TABLERO DE CONTROL. ......................................................................................................... 149
4.2.2. APLICACIÓN WEB. .............................................................................................................. 151
CAPÍTULO 5 .................................................................................................................................. 155
CONCLUSIONES Y RECOMENDACIONES........................................................................................ 155
5.1. CONCLUSIONES ............................................................................................................... 155
5.2. RECOMENDACIONES ........................................................................................................ 156
BIBLIOGRAFÍA .............................................................................................................................. 157
XI
LISTADO DE TABLAS
LISTADO DE FÓRMULAS
LISTADO DE ANEXOS
ANEXO 1
ENTREVISTA DE ANÁLISIS EMPRESA TOPNOTCH BUSINESS
ANEXO 2
MATRIZ DE MAPEO FUENTE A BODEGA
ANEXO 3
LISTADO DE ABREVIATURAS ESTANDARIZADAS PARA EL DESARROLLO
ANEXO 4
MANUAL DE USUARIO SISTEMA SATB - BI - DASHBOARD
ANEXO 5
MANUAL DE USUARIO SISTEMA SATB - BI - WEB
ANEXO 6
MANUAL TÉCNICO SISTEMA SATB
ANEXO 7
MANUAL ADMINISTRACIÓN SISTEMA SATB
XVII
GLOSARIO DE ABREVIATURAS
Palabras Clave:
Inteligencia de Negocio
Indicadores,
Bodega de Datos,
Cuadro de Mando
HEFESTO
XIX
ABSTRACT
allows the indicators and Key Performance Indicators (KPI) analysis of the
situational indicators and company reports. The first part let know us the
objectives, today situation and the scope of the Project. By other hand it
the DWH and the indicators. The methodology selected was HEFESTO 2.0,
The tools used were suite de Microsoft SQL Management SQL 2012, Visual
Keywords:
Business Intelligence
KPI
Data Warehouse
Dashboard
HEFESTO
1
CAPÍTULO 1
1.1. Antecedentes
sus clientes.
1
Nombre propio de la Empresa Consultora dueña del Proyecto.
2
Nombre propio de la Empresa Cliente a la cual va dirigido el Proyecto.
2
La empresa se inició y se mantiene con el manejo de varios tipos de
cartera vencida y cada una de estas se gestionan por uno o varios ejecutivos
para su asignación posterior de los contratos; por lo cual, hace algún tiempo,
recursos.
3
Listado de operaciones de débito o crédito realizadas por una persona en una empresa.
4
Sistema informático que realiza búsquedas de clientes y ejecutivos de la empresa Topnotch Business
3
presentar la información y generar los “Indicadores de Gestión”5 claves de
éxito de la empresa.
reportes gerenciales.
Accionistas
Comité Gerencial
Gerente
General
Gerencia
Supervidor Supervisor
Quito Otra Ciudad
Supervisión A Supervisión B
SQL 2005
Organizaciones
SQL 2008 SQL 2000
Individuos Ejecutivos
Generación Archivo
Cartera Cobranza
Consolidación/Generación
Presentación Reportes Accionistas
Reportes Gerenciales
Toma de decisiones
organización.
empresa a nivel general, de una forma clara y oportuna. Por tal motivo,
6
Key Performance Indicators, los indicadores clave de desempeño son métricas financieras o no
financieras, utilizadas para cuantificar objetivos que reflejan el rendimiento de una organización, y
que generalmente se recogen en su plan estratégico
5
Acorde a esta necesidad la empresa requiere la construcción de un
almacén de datos (Data Warehouse) que permita generar tanto los reportes
1.3. Justificación
usado los datos desde sus sistemas operacionales para atender sus
extraído los datos desde sus bases de datos para combinarlos de varias
aplicaciones/herramientas operacionales.
gestión de la empresa.
6
Importancia Tecnológica. El proyecto SATB 7 , se presenta como
Beneficiarios:
Directos
o Topnotch Business.
Indirectos
o Sociedad en General.
7
Denominación que se le ha dado al proyecto actual de construcción del Data Warehouse e
Indicadores de desempeño de los empleados.
7
1.4. Objetivos
1.5. ALCANCE
funcionales.
continuación:
periodo de tiempo.
periodo de tiempo.
de tiempo.
Archivo Cartera
Rec uperación Movistar
Gerente
Servidor Virtual
Archivos Compartidos Colaboradores
XLS Recuperacion
XLS Recuperacion
Servidor Virtual
Administración y Autenticación
Servidor Virtual
Base de Datos
Relacional
Servidor Virtual
Base de Datos
Multidimensional
CAPÍTULO 2
FUNDAMENTACIÓN TEÓRICA
2.1.1.1. OLTP
ya que suelen ser utilizados por empresas con una red informática
datos (Data Warehouse, en inglés) con el fin de acceder a ellos para dar
manera, sino que se suelen mantener con un mayor nivel de detalle los
2007).
consulta y el análisis.
volumen de datos puede ser muy grande (centenas de terabytes). Las bases
histórica que cubra un amplio período de tiempo. Pero hay ocasiones en las
que no se necesita la historia de los datos, sino sólo sus últimos valores,
pero con una ventana de actualización muy pequeña (del orden de minutos)
2013).
2.2.1. Orígenes.
Gartner. Así como él, los norteamericanos adquirieron fama por el desarrollo
inteligente, uno de los ejemplos señala que a fines del siglo XVI, la reina
15
Isabel I, con el fin de ocupar territorios conquistados, determinó que la base
cuarenta o cincuenta años atrás, durante los años 60 y 70 del siglo XX. En
principal objetivo era establecer una única fuente de datos para todo el
de las empresas.
Entre 1992 y 1993, surgió Data Warehouse, una gran base de datos
proyecciones.
como una evolución del EIS, Executive Information System, creado a fines
Technology-EE.UU.).
17
Con el correr de los años, el término Business Intelligence adquirió
mayor alcance e incluyó una serie de herramientas, como el mismo EIS y las
desea alcanzar - es decir, se debe alinear el proyecto con los intereses y las
2.2.2. Definición.
exploración.
usuarios, así como entender sus diversas necesidades, para que luego en
conjunto con ellos se generen las preguntas que les ayudarán a alcanzar sus
datos que serán necesarios para encontrar las respuestas a las preguntas
requieran las herramientas necesarias, que les permitirán explorar los datos
Figura 4. Fases de BI
2.3.1. Definición
análisis y exploración.
2.3.2. Funcionalidad
Orientada
al Negocio
Data
Warehouse
(Colección de Variante
Integrada en el
datos para el tiempo
soporte de toma
de decisiones)
No
volátil
2.3.3. Características
Orientado al negocio.
Integrado.
Variante en el tiempo.
No volátil.
Redundante.
para evitar recorrer por toda la base de datos cuando se realiza las consultas
de consulta de una forma más rápida y eficaz, con ello poder satisfacer una
transaccional.
2.3.3.2. Integrada
Esta característica implica que todos los datos fuentes producidos por
8
Desnormalización, es el proceso de invertir las transformaciones realizadas durante la
normalización; o sea se debe eliminar las relaciones y redundar la información dentro de una misma
tabla.
23
subprocesos para llevar a cabo sus tareas. Una de estas técnicas son
Warehouse, 2010)
TIEMPO
información.
2.3.3.4. No volátil
cambio, los datos una vez que entran en el Data Warehouse no cambian.
es mucho más simple, debido a que solo existen dos tipos de operaciones:
2.3.3.5. Redundancia
siguiente:
26
Tabla 1. Análisis Data Warehouse no Redundante
No. Consideraciones
2.3.4. Estructura
tabla comparativa entre los dos ambientes, así resumiendo sus diferencias.
28
Tabla 3. OLTP Vs. DWH.
2.4.1. OLTP
las fuentes externas que se extrae información. Entre los OLTP más
Archivos de textos.
Hojas de cálculos.
Hipertextos.
arquitectura
31
realizar aquellas técnicas que analizan los datos para verificar que sean
correctos y válidos.
32
Finalmente se tiene el proceso de Carga de Datos, se agruparán por
principales tareas
2.4.2.1. Extracción
mismos puede ser un tanto más dificultoso, debido a que, por ejemplo, se
procesos ETL.
DWH.
2.4.2.2. Transformación
acciones se llevan a cabo debido a las variadas fuentes de las que se extrae
definiendo estándares para que todos los datos que ingresarán al Data
los siguientes:
Codificación.
Fuentes múltiples.
Convenciones de nombramiento.
Calidad de Datos.
para tal fin, las unidades de depreciación puede ser expresada en años,
datos de los atributos y sus longitudes, para que todas las fuentes de datos
2.4.2.2.2. Codificación
completan su valor con “0” y “1”, otros con “Apagado” y “Encendido”, otros
con “off” y “on”, etc. Lo que se debe realizar en estos casos, es seleccionar o
crear y utilizar la convención para el nombramiento del atributo que sea más
Las acciones más típicas que se pueden llevar a cabo al encontrarse con
1 Ignorarlos. Ignorarlos.
inicial y carga diaria; siendo esta última dividida en dos: la Carga de registros
Actualización o
mantenimiento
periódico
Carga Inicial
•Intervalo de tiempo predefinido para tal operación (Initial Load)
•Identificar si se han producido cambios en las
fuentes originales de los datos recogidos
Models.
calendarizada y planificada.
lento de construir.
nieve consiste en una tabla de hechos central relacionada con una o más
tablas de dimensiones, las que a su vez pueden estar relacionadas con otras
estos son por lo general de tipo texto. Cada tabla de dimensión podrá
cliente.
distintas.
(año, mes, día, etc.) y por hora expresada en (hora, minuto, segundo, etc.),
(Dario B. , 2009)
hasta, mayor que, menor que, etc., de manera sencilla. (Dario B. , 2009)
9
El día juliano se representa a través de un número secuencial e identifica unívocamente cada día.
46
instantáneos en el tiempo; y, permiten al usuario filtrarlos, agruparlos y
alcanzar.
Para el registro del hecho, este debe poseer una clave primaria única
FK_VENTAS_RELAT IONS_LOCALIZA
FK_VENT AS_RELAT IONS_PRODUCT O
LOCALIZACION
PRODUCTO
localizacionId int <pk>
pais varchar(60) productoId int <pk>
provincia varchar(60) nombre varchar(100)
canton varchar(60)
ciudad varchar(60)
parroquia varchar(60) VENT AS
localizacionId int <fk2>
clienteId int <fk3>
temporalidadId int <fk4>
productoId int <fk1>
importeTotal numeric(20,3)
utilidad numeric(20,3)
T IEMPO
temporalidadId int <pk> CLIENT E
anio varchar(4)
semestre varchar(1) clienteId int <pk>
trimestre varchar(1) cedula
FK_VENT AS_RELAT IONS_CLIENT E varchar(14)
mes varchar(2)
FK_VENT AS_RELATIONS_T IEMPO nombreCompleto varchar(250)
dia varchar(2)
Esta función realiza las operaciones, tales como soportar los procesos
indicadores.
48
Page. Presenta el cubo dividido en secciones, a través de los valores
detalle.
a través de una interfaz gráfica y una serie de pasos, los usuarios generan
Dashboards.
Data Mining.
2.4.6. Usuarios.
del negocio; siendo estos parte clave del proceso de análisis inicial en la
ESPACIO EN BLANCO
INTENCIONAL
51
Transforma
Integra y consolida
datos orientados
diferentesafuentes
las aplicaciones
de datos en
(internas
información
y/o externas) y
orientada
departamentos
a la toma deempresariales.
decisiones.
puede gestionar”.
siguientes:
Cumplimiento de planificaciones.
Crecimiento.
Control de costos.
tecnológica.
55
De forma generalizada, los indicadores ayudan a las entidades
correctivas y oportunas.
Para poder definir KPI se suele aplicar el acrónimo SMART, ya que los
eSpecíficos (Specific)
Medibles (Measurable)
Alcanzables (Achievable)
Realista (Realistic)
a Tiempo (Timely)
ESPACIO EN BLANCO
INTENCIONAL
56
2.5.3. Clasificación.
negativos.
58
Indicadores Positivos.- Son aquellos indicadores, que un aumento en su
−
ñ = ∗ 100%
−
−
ñ = ∗ 100%
−
Base.- Nivel Base, refiérase a la métrica inicial o nivel estándar que toma
período del indicador, las cuales se ven afectadas por los efectos de las
iniciativas estratégicas.
un desempeño inaceptable.
Desempeño esperado
Desempeño preocupante
Desempeño inaceptable
Methodology).
partida de gran calidad para entrar en materia. En la segunda parte del libro
completo trabajo.
60
La metodología está orientada a la construcción de DWH para Análisis
Análisis de Requerimientos.
Procesos ETL.
Diseño y modelización.
Implementación.
Revisión.
61
Tabla 5. Comparación metodologías Hefesto vs. SAS.
Metodología más
No. Hefesto SAS adecuada para el
proyecto
1 Tamaño del Proyecto Pequeños - Medianos Medianos-Grandes Hefesto
Tiempo en el análisis Extenso por ser
2 Medio una sola vez Hefesto
y diseño iterativo
Tiempo en
3 Medio Medio Ambos
construcción.
4 Etapa de implantación NO SI SAS
Guías y prácticas se
5 SI Algunas Hefesto
aplican a SQL
Fácil entendimiento
6 SI NO Hefesto
principiantes
Revisión Post
7 NO SI SAS
Implantación
proyecto SATB.
cambios en el negocio.
contener la metodología.
interpretar y analizar.
implementación.
ESPACIO EN BLANCO
INTENCIONAL
64
obtienen las preguntas claves del negocio. Estas puedan llevarse a cabo
observaciones, etc.
65
El objetivo principal de esta fase, es la de obtener e identificar las
eficiente toma de decisiones. Estas necesidades pueden ser guiadas por los
análisis como las ventas por una determinada fecha, se debe tener en
determinado.
determinado.
determinado.
determinado, etc.
66
2.7.2.1.2. Identificar indicadores y perspectivas
2.7.2.1.1.
Unidades
Clientes
facturadas
Unidades de
Publicaciones reposición
Venta
Zonas Unidades
Vendidas
Tiempo Porcentaje
Devolución
Unidades Facturadas:
Unidades Vendidas:
Acreditadas
Porcentaje de Devoluciones:
Reposición)) * 100
Para realizar este paso se debe tener un esquema claro del diagrama del
o indicador.
TIPO BASE DE
TIPO VARIABLE TABLA RUTA CAMPOS FORMULA
FUENTE DATOS
BASE DE
PERSPECTIVA CLIENTES VENDEDORES BANCS BDD=P012BAND
TODOS
ESQUEMA=FNSONLP
DATOS
BASE DE
PERSPECTIVA PUBLICACIONES INGRESOS BANCS BDD=P012BAND
TODOS
ESQUEMA=FNSONLP
DATOS
BASE DE
PERSPECTIVA ZONAS RECORRIDOS BANCS BDD=P012BAND
TODOS
ESQUEMA=FNSONLP
DATOS
UNIDADES BASE DE
INDICADOR HISTORICOS PORTAL BDD=P012BAND
CANTFACT
ESQUEMA=FNSONLP
FACTURADAS DATOS
DEVOLUCION
PORCENTAJE BASE DE i= DEVOLUCION
INDICADOR HISTORICOS PORTAL BDD=P012BAND
CANTFACT
ESQUEMA=FNSONLP
DEVOLUCIÓN DATOS (CANTFACT + RPOSICION)
RPOSICION
campos que contendrá cada perspectiva, ya que será a través de estos por
los que se considera relevantes para consultar los indicadores y cuáles no.
determinará la granularidad del depósito de datos, los datos más típicos que
Año
Semestre
Cuatrimestre
Trimestre
Número de mes
Quincena
Decena
71
Semana
Número de día
Clientes
Unidades facturadas
CodVend
SUM(Uni. Facturadas)
RazonSoc
Publicaciones
Nombre
NumRevista Unidades de reposición
SUM(Uni. Reposición)
Zonas
Venta
Recorridos
Unidades Vendidas
Tiempo SUM( Uni. Facturadas /
Año (Uni. Reposición+ Uni.
Semestre Acreditadas)).
Cuatrimestre
Trimestre
Número de mes
Nombre del mes
Porcentaje Devolución
Quincena
SUM( Uni. Acreditadas /
Decena (Uni. Facturadas + Uni.
Semana Reposición)).
Número de día
Nombre del día
Estación del año
Este paso, modelo lógico10, define cuál será el tipo de esquema que se
de datos.
sus ventajas:
Simplifica el análisis.
Este paso, se aplicará por igual a todos los tipos de esquemas lógicos.
Lo primero que se hará será crear las dimensiones del mismo, para ello se
siguiente proceso:
bastante explicativos.
Perspectiva “Clientes”,
Perspectiva “Publicaciones”,
PUBLICACION
Publicaciones
idPublicacion
Nombre
Publicación
NumRevista Edicion
Perspectiva “Zonas”,
ZONA
Zonas idZona
Recorrido Zona
Tiempo FECHA
Año idFecha
Semestre Anio
Cuatrimestre Semestre
Trimestre Cuatrimestre
Número del mes Trimestre
NumeroMes
Nombre del mes
NombreMes
Quincena
Quincena
Desena Desena
Semana Semana
Número del día NumeroDia
Nombre del mdía NombreDia
Estación del año Estacion
Figura 39. Diseño dimensión Tiempo.
76
2.7.2.3.3. Tablas de hechos.
realizará lo siguiente:
las consultas.
hechos:
siguientes actividades:
intervendrán.
indicadores y dimensiones.
e “idFecha”.
VENTAS
idCliente
idPublicacion
idFecha
idZona
CantFac
CantRep
Importe
PorcDev
Figura 42. Diseño Tabla de Hechos caso de estudio.
2.7.2.3.4. Uniones.
estas relaciones son iguales a las que se realizan en los SGBD. Como se
ETL, etc., se definirán políticas y estrategias para la Carga Inicial del DWH y
su respectiva actualización.
modelo lógico del DWH, para posteriormente definir las operaciones que
datos.
81
Una vez construido el modelo se debe realizar la Carga Inicial y/o
12
Refiérase al punto 2.4.2.3. de este documento donde se explica la carga inicial.
13
Tablas que se usan para almacenar información en forma resumida, con un nivel de agregación
mayor al obtenido inicialmente.
82
Finalmente al concluir todas las etapas de la metodología Hefesto se
2.8. Herramientas.
a continuación.
o sea una plataforma lista para la nube que ayuda a las empresas a construir
requerida para hacerlo. Otra característica del SQL Server 2012 es que
14
Fuente de consulta Wikipedia.
15
Uptime, es una medida en que una máquina, generalmente una computadora, ha trabajado y está
disponible.
16
Downtime, se refiere a periodos de tiempo cuando un sistema no está disponible.
83
disponible y todos sus datos dentro de la misma estén siempre seguros.
TI.
lenguajes de programación tales como Visual C++, Visual C#, Visual J#, y
Visual Basic .NET, al igual que entornos de desarrollo web como ASP.NET.
muchos otros.
aplicaciones web, así como servicios web en cualquier entorno que soporte
entorno. Además, SQL Server Management Studio funciona con todos los
17
Fuente obtenida de la página web oficial de Microsoft.
85
2.8.4. DevExpress Suite
la Web que están preparadas para las nuevas tecnologías del futuro.18
2.8.5. PowerDesigner
datos con todas sus tablas para diferentes motores de la bases de datos
PowerDesigner permite:
la organización.
entornos heterogéneos.
cumplimiento.
CAPÍTULO 3
metodología Hefesto.
de tiempo y zona.
de tiempo.
en un periodo de tiempo.
del Cliente
cartera.
de datos
91
Monto de
cartera
Eficiencia recuperada
del ejecutivo Pagos
en recuperar efectuados
la cartera
Eficiencia de
la empresa
Ejecutivo en recuperar
la cartera
Eficiencia
Zona del ejecutivo
COBRANZA en contactar
los clientes
Eficiencia de
la empresa
Cliente en contactar
los clientes.
Monto de
Tiempo cartera no
recuperada
periodo de tiempo, zona y por todos los ejecutivos. Para saber el monto
Función:
− %
ñ = ∗ 100%
− %
Función:
− %
ñ = ∗ 100%
− %
Función:
− %
ñ = ∗ 100%
− %
Función:
− %
ñ = ∗ 100%
− %
respectiva correspondencia.
TEL_ADR_GRNLR_ID ORG_LCS_TP_ID
TEL_DVC_TP_ID ORG_PPS
CTY_TEL_CODE ORG_PPS_DT
PRIM_CMRCL_NM EMPLEADOS
TEL_CODE
EMPE_ID
LCL_NO RGST_BSN_NM
UNQ_ID_SRC_STM
EXN REG_MCTL_REG_DT
EMP_LCS_TP_ID
FULL_TEL_NO HSG_TNR_TP_ID
EMP_LCS_TP_DT
ELC_ADR_TP_ID LOG_PCS_ID
CITY_ID_CNST EMPE_NO
ADR_TP_ID
ORG_SALE_SEG_ID LOG_PCS_ID
96
Figura 46. Correspondencia entre el Diagrama ER de la base de datos BD_COMUN_TOP y el modelo conceptual.
97
Fuente “CARTERA TOP NOTCH”.- Base de datos que proviene de un
la fuente.
COLUMNAS
MTX CIUDAD_COMP
COD_CLIENTE CEDULA
F_ACT_CUENTA RUC
STATUS_CUENTA VIP_CODE
FORMA_PAGO CICLO
TARJETA DIAS_ACTUAL
CUENTA_TARJETA DIAS_0
BANCO DIAS_30
CUENTA_BANCO DIAS_60
TIPO_CLIENTE DIAS_90
BILLGROUP DIAS_120
COMPANIA DIAS_150
NOMBRES DIAS_180
APELLIDOS DIAS_210
DIRECCION1 DIAS_240
DIRECCION2 DIAS_270
DIRECCION3 DIAS_300
CIUDAD DIAS_330
TEL_CASA DIAS_360
TEL_OFI DIAS_390
FAX DIAS_TOTAL
CONTACTO1 VENCIMIENTO
TEL_CONTACTO1 PAGOS
CONTACTO2 AJUSTES
TEL_CONTACTO2 DIFERENCIA
DIR_COMP1 ASIGNACION
DIR_COMP2 FECHA ASIGNACION
DIR_COMP3 STATUS
Figura 47. Columnas de la fuente CARTERA TOP NOTCH.
“Zona”.
“Clientes”.
“Ejecutivos”.
perspectiva “CLIENTE”.
perspectiva “CLIENTE”.
perspectiva “CLIENTE”.
perspectiva “CLIENTE”.
perspectiva “CLIENTE”.
perspectiva “CLIENTE”.
perspectiva “CLIENTE”.
perspectiva “CLIENTE”.
102
El campo “APELLIDOS de la tabla CARTERA” se relaciona con la
perspectiva “CLIENTE”.
perspectiva “CLIENTE”.
“CLIENTE”.
perspectiva “Zona”.
perspectiva “TIEMPO”.
perspectiva “EJECUTIVO”.
perspectiva “CLIENTE”.
perspectiva “CLIENTE”.
perspectiva “CLIENTE”.
103
El campo “DESCUENTO de la tabla GESTION” se relaciona con la
perspectiva “TIEMPO”.
perspectiva “EJECUTIVO”.
CARTERA”.
CARTERA”.
CLIENTES”.
perspectiva “Zona”.
104
El campo “ANIO de la tabla OTROS MONTOS RECUPERADOS” se
proceso que se utilizó fue examinar la base de datos para intuir los
FUENTE: BD_COMUN_TOP
TABLA: IDENTIFICACIONES
pasaporte o cédula.
105
o IP_ID_NBR: Número de identificación.
TABLA: ORGANIZACIONES
organización.
empresa.
TABLA: INVOLUCRADOS
siguientes:
FUENTE: BD_COMUN_TOP
TABLA: LOCALIZACIONES
los siguientes:
108
FUENTE: BD_COMUN_TOP
FUENTE: EMPLEADOS
debida gestión.
los siguientes:
Año.
Semestre.
Mes.
Semana.
109
o Descripción del campo asociado a la fuente “CARTERA TOP
NOTCH” y a la perspectiva.
ejecutivo la cuenta.
EJECUTIVO” y a la perspectiva.
cobranza.
a los usuarios cuales eran los datos que se consideran de interés para
siguientes:
Perspectiva “Cliente”.
o NOMBRES
o APELLIDOS
o COMPANIA
Perspectiva “Ejecutivo”.
o ASIGNACION
110
Perspectiva “Tiempo”.
Perspectiva “Zona”.
realizar la cobranza.
Clientes
CEDULA
RUC
NOMBRES Monto de cartera vencida no recuperada
APELLIDOS SUM(Monto Recuperado – Monto por Recuperar)
COMPANIA
Pagos efectuados
SUM(MontoRecuperado)
Ciudades
CIUDAD
CEDULA y RUC.
APELLIDOS Y COMPANIA.
Gráficamente:
CLIENTES
IDENTIFICADOR_CLIENTE <pi> DMN_ID_PK <M>
TIPO_IDENTIFICACION Variable characters (15)
NUMERO_IDENTIFICACION Variable characters (13)
NOMBRE_CLIENTE Variable multibyte (200)
IDR_CLI <pi>
Perspectiva Ejecutivo:
ASIGNACION.
Gráficamente:
EJECUTIVOS
IDENT IFICADOR_EJECUTIVO <pi> DMN_ID_PK <M>
CODIGO_ORIGINAL_EJECUTIVO Variable characters (15)
NOMBRE_EJECUTIVO Variable characters (200)
IDR_EJC <pi>
Perspectiva Tiempo:
por ANIO.
Gráficamente:
FECHA
IDENTIFICADOR_FECHA <pi> DMN_ID_PK <M>
ANIO Integer
SEMESTRE Integer
TRIMESTRE Integer
MES Integer
SEMANA Integer
IDR_FEC <pi>
Gráficamente:
CIUDADES
IDENTIFICADOR_CIUDAD <pi> DMN_ID_PK <M>
NOMBRE_CIUDAD Variable characters (100)
IDR_CIU <pi>
diseño:
RECUPERACION_CARTERA
MONTO CARTERA VENCIDA_RECUPERADA DMN_MONTO
MONTO CARTERA VENCIDA NO RECUPERADA DMN_MONTO
EFICIENCIA_RECUPERACION_CARTERA DMN_MONTO
EFICIENCIA_CONTACTO_CLIENTES DMN_MONTO
PAGOS_EFECTUADOS DMN_MONTO
IDR_RCP_CTR <pi>
...
Figura 56. Tabla de Hechos Recuperación Cartera.
3.1.3.4. Uniones.
CLIENTES
EJECUTIVOS
IDENTIFICADOR_CLIENTE <pi> DMN_ID_PK <M>
TIPO_IDENTIFICACION Variable characters (15) IDENTIFICADOR_EJECUTIVO <pi> DMN_ID_PK <M>
Relationship_2 Relationship_1
NUMERO_IDENTIFICACION Variable characters (13) CODIGO_ORIGINAL_EJECUTIVO Variable characters (15)
NOMBRE_CLIENTE Variable multibyte (200) NOMBRE_EJECUTIVO Variable characters (200)
IDR_CLI <pi> IDR_EJC <pi>
... ...
RECUPERACION_CARTERA
MONTO CARTERA VENCIDA_RECUPERADA DMN_MONTO
MONTO CARTERA VENCIDA NO RECUPERADA DMN_MONTO
EFICIENCIA_RECUPERACION_CARTERA DMN_MONTO
EFICIENCIA_CONTACTO_CLIENTES DMN_MONTO
PAGOS_EFECTUADOS DMN_MONTO
IDR_RCP_CTR <pi>
...
FECHA
IDENTIFICADOR_FECHA <pi> DMN_ID_PK <M> CIUDADES
ANIO Integer IDENTIFICADOR_CIUDAD <pi> DMN_ID_PK <M>
SEMESTRE Integer NOMBRE_CIUDAD Variable characters (100)
TRIMESTRE Integer Relationship_3 Relationship_4
IDR_CIU <pi>
MES Integer
...
SEMANA Integer
IDR_FEC <pi>
...
ESPACIO EN BLANCO
INTENCIONAL
117
117
Incrementar la Aumentar la
Comparar el número de % Devolución por Producto Defectuoso =
eficiencia de la eficiencia en
clientes contactos versus el
2 empresa en contactar a los
número total de clientes #
contactar a los clientes en un 3%
asignados.
clientes. semanalmente.
118
CAPÍTULO 4
DESARROLLO Y CONSTRUCCIÓN
Una vez construido el modelo lógico, este tiene que ser probado con los
la Carga Inicial de todo el ambiente del DWH involucra tres fases principales,
que son:
Cartera; el archivo del que se lee tiene el siguiente formato: CARTERA TOP
este proceso:
subtareas:
proceso.
122
Conversión de los campos.- Todos los campos de la
destino “TAB_CTR”.
de procesamiento.
desembarco.
clientes “TAB_CLI”.
subtareas:
desembarco.
la Figura 63.
siguientes subtareas:
Gestión (REPORTE_GESTION_001_dd-mm-yyyy.txt),
proceso.
fecha de procesamiento.
destino “TAB_GES_EJC”.
126
Tabla Destino.- Finalmente se mapean las columnas
área de desembarco.
clientes “TAB_CIU”.
127
o Desembarco Clientes.- Esta tarea contiene las siguientes
subtareas:
destino “TAB_CIU”.
desembarco.
(6_CRG_DCO_RECUPERACION_ADICIONAL).
128
El proceso contiene las tareas para desembarcar la información de los
“RecuperacionNoAsignadaTopNotch_dd-mm-yyyy.txt”.
destino “TAB_RCP_CTR_NO_ASG”.
Figura 67.
130
desembarco.
El proceso contiene las tareas para cargar las tablas que van a servir
que usa son las tablas del área de desembarco. El flujo de tareas que llevan
del DWH.
del DWH.
El proceso contiene las tareas para cargar la tabla que va a servir como
insumo para la construcción de los hechos del cubo, la fuente que usa son
133
las tablas del área de desembarco. El flujo de tareas que llevan a cabo este
en la que se va a procesar.
4.1.1.2. Actualización.
Carga Inicial pero definidas las siguientes políticas de actualización, que han
sido elaboradas a través de las reuniones con los usuarios; y son las
siguientes:
134
La información se actualizará el último día de cada mes.
Warehouse.
el nombre “Data Sources” servirá para crear las conexiones del cubo
de las tablas.
138
dimensión:
en la Figura 81.
Figura 85.
código MDX:
se mencionan a continuación:
Windows ( ).
151
La creación de tableros de control se encuentra en mayor detalle en el
empresa.
visualización.
KPI: Contiene una tabla cruzada que presenta a los dos KPI
construidos.
CAPÍTULO 5
CONCLUSIONES Y RECOMENDACIONES
5.1. Conclusiones
un desfase en la planificación.
la aplicación de escritorio.
157
BIBLIOGRAFÍA