Estadística

TEMA 65.
ESTADÍSTICA
La Estadística estudia la variabilidad, organización, presentación de datos… para sacar conclusiones basadas en el
cálculo de probabilidades
Es útil SOLO cuando su objeto de aplicación es un fenómeno aleatorio que no esté determinado por alguna ley
rígida
Se caracteriza por la inducción a través de una hipótesis. Se utiliza un método inductivo para pasar de lo particular
observado a lo general.
Unidad estadística: dato individual de la observación de un fenómeno. Puede ser:

- Simple: un solo dato (12 vehículos)
- Compleja: más de un dato (8 vehículos tipo coche y 4 vehículos tipo moto)
Población estadística: conjunto de unidades estadísticas (las más interesantes son las variables en el tiempo)
Tamaño: nº de elementos que constituyen la población (finitos o infinitos)
Muestra: porción de la población observada para formular los cálculos estadísticos cuando el tamaño de la
población es inabarcable. Es una selección suficiente para obtener la fiabilidad requerida. Cuanto mayor es la
muestra, más fiables serán los datos.
Variable estadística (xi): variables obtenidas de la observación de cada elemento
- V. cuantitativa: valor = nº contable 1 sólo carácter cuantitativo = variables unidimensionales
- Variable cuantitativa discreta: nº entero
- Variable cuantitativa continua: nº con decimales
- V. cualitativa o atributo: valor no contable
Rango o recorrido: diferencia entre el mayor y el menor de los valores de una variable (nota entre 0 y 10)
Frecuencia absoluta (fi): nº de veces que se repite un resultado.
Distribución absoluta: representación de los resultados en una tabla con dos columnas: xi que serán los posibles
valores observados y fi que será el nº de veces que se repita el valor.
Distribución de frecuencia absoluta acumulada (Fi): suma de la frecuencia absoluta del valor presente y los
anteriores
Frecuencia total (N): suma de todas la frecuencias absolutas. El valor debe coincidir con el último valor de la
frecuencia acumulada.
Frecuencia relativa (hi): frecuencia absoluta de un resultado / frecuencia total (hi = ni / N)
Frecuencias relativas acumuladas (Hi): suma de todas la frecuencias absolutas relativas (hi). El último valor debe
ser 1.
Intervalos de clase: agrupación de variables en intervalos con una amplitud determinada (c) constante o variable
Marca de clase: media entre el valor superior y el inferior de la clase. Punto medio del intervalo.
Densidad (Di) : frecuencia absoluta de cada intervalo / amplitud del intervalo (Di = ni / c). Si la amplitud de los
intervalos es constante, la información que da la frecuencia absoluta es la misma, por lo tanto no hay que
calcularlo. Sirve para conocer el nº de elementos que hay en un intervalo si la amplitud no es constante.
Campo de aplicación de la estadística: método efectivo para describir con exactitud valores de datos económicos,
políticos, sociales, psicológicos, biológicos y físicos, relacionarlos y analizarlos.
El análisis estadístico NO consiste solo en reunir y representar los datos, sino que trata de interpretar toda esa
información.
® MÉTODOS FUNDAMENTALES DE SELECCIÓN DE LA MUESTRA

 Gran encuesta: se observan todas las unidades del conjunto. Es un método muy laborioso. Es posible si el
grupo a investigar es muy reducido
 Encuesta por muestreo: solo se observan determinadas unidades, previamente seleccionadas, del
conjunto de la muestra. Ventaja: ahorro de tiempo, dinero y personal sin perder validez científica.
ESTADÍSTICA DESCRIPTIVA - DEDUCTIVA ESTADÍSTICA INDUCTIVA - INFERENCIAL

Métodos estadísticos que describen y/o caracterizan un Busca deducir y sacar conclusiones sobre situaciones
grupo de datos conocidos generales mas allá del conjunto de datos obtenidos.
Objetivos: Objetivos:
- Caracterizar un grupo de datos - Examinar diferencias entre grupos
- Examinar tendencias o distribuciones - Examinar si las variables están asociadas
- Predecir una variable a partir de otra
Métodos de análisis:
- Medidas de tendencia central: Media / Mediana / Métodos de análisis:
Moda - T-test
- Medidas de variabilidad: Varianza / Desviación - Análisis de varianza
estándar / Rango / Frecuencia - Correlación
- Regresión
® MÉTODOS FUNDAMENTALES DE SELECCIÓN DE LA MUESTRA

 Gran encuesta: se observan todas las unidades del conjunto. Es un método muy laborioso. Es posible si el
grupo a investigar es muy reducido
 Encuesta por muestreo: solo se observan determinadas unidades, previamente seleccionadas, del
conjunto de la muestra. Ventaja: ahorro de tiempo, dinero y personal sin perder validez científica.
® TEORÍA DEL MUESTREO

La imposibilidad o dificultad para investigar a todos los relacionados con el objeto de investigación, obliga a
seleccionar un número reducido de ellos, que conformen una muestra representativa.
El muestreo consiste en limitar la investigación a un número reducido de personas para obtener resultados
representativos del colectivo completo que deseamos estudiar.
Casos en los que procede utilizar la técnica del muestreo:
- Población infinita o inmensa
- Población inaccesible
- Si se quiere hacer un experimento social con grupos de control
- Si hay que hacer un pre-test o estudio piloto.
- Si se quiere hacer el reportaje en poco tiempo
La muestra deberá cumplir tres condiciones básicas:
• REPRESENTATIVIDAD: fiel reflejo de las características del universo o población total del que se ha sacado.
• CONFIANZA: fiabilidad de los datos respecto del universo, y que, en el caso de repetir la investigación con la
misma muestra u otra representativa, los resultados serían los mismos.
• TAMAÑO: determinado número de elementos. El tipo de tamaño de la muestra está condicionado por el tipo y
estilo de investigación (cuantitativa o cualitativa)
Análisis CUANTITATIVO: selecciona unos cuantos casos de muestra y lo observado se generaliza

Análisis CUALITATIVO: profundiza en unos casos concretos que NO son generalizables al resto de la población
Elementos a tener en cuenta para la selección de la muestra:

- Margen de error tolerado (a mayor tamaño, menor margen de error)
- Nivel de confianza exigido (a mayor tamaño, mayor confianza)
- Varianza de la población (a mayor tamaño, mayor varianza y población más heterogénea)
 Tipos de muestra:
1. MUESTRAS PROBABILÍSTICAS:
- Muestra al azar
- Muestra estratificada
- Muestra por conglomeración o en racimo
- Muestra polietápica
- Muestra de panel
2. MUESTRA LOCALIZADA
3. MUESTRAS NO PROBABILÍSTICAS:
- Muestra accidental
- Muestra por cuotas
- Muestra dirigida o razonada
- Muestra por bola de nieve
1. MUESTRAS PROBABILÍSTICAS
Muestra en la que podemos saber a priori la probabilidad que tiene cada uno de los miembros del universo de
salir seleccionado.
La condición fundamental para que la muestra sea probabilística es que exista una Base de sondeo, si no existe, la
muesrta es no probabilística. Una Base de sondeo es el documento escrito o informatizado en el que están
consignados todos los elementos del universo
 Muestra al azar:
Se basa en la presunción de que todos los individuos de la población total tienen la misma probabilidad de ser
elegidos, de acuerdo con las leyes del azar. Consiste en escoger, por medio de un sorteo riguroso, una serie de
elementos de una población, de modo que puedan ser considerados como representativos del total.
- Selección por urna/lotería
Se confecciona una lista de todos los elementos de la población y se numeran. Se introducen en una urna tantas
bolas como elementos haya y se extraen de esa urna “n” elementos.
Muestreo sin reemplazo: cuando un elemento ha sido escogido ya no puede volver a la urna.
Muestreo con reemplazo: cuando el elemento escogido puede volver a serlo posteriormente.
- Selección sistemática
Se selecciona al azar el primer individuo, seleccionando, posteriormente, los restantes a intervalos fijos
determinados según el número de la muestra.
- Tabla de números equiprobables
Tablas de números elaboradas por los matemáticos, extrayendo una serie de números al azar.
 Muestra estratificada:
Es apropiada cuando la población es heterogénea. La población es dividida en grupos (estratos) homogéneos y sus
datos son estudiados por separado. Procedimiento:
1º Se divide el universo en estratos lo más homogéneos posibles
2º Se selecciona un criterio para diferenciar los distintos estratos
3º Se selecciona una muestra al azar en cada estrato
El reparto de la muestra entre los diversos estratos se denomina Afijación de la muestra y puede hacerse por:
- Afijación Simple
Se reparte la muestra total en partes iguales para cada estrato, aunque el tamaño de cada estrato sea diferente.
- Afijación Proporcional
Se reparte la muestra total proporcionalmente entre los diversos estratos. El tamaño de la muestra seleccionada
para cada estrato es proporcional al nº de individuos de que está compuesto cada estrato. Inconveniente: No
considera la varianza de cada estrato.
- Afijación Óptima
Se trata de elegir dentro de cada estrato más o menos elementos, según sea mayor o menor su varianza
 Muestra por conglomerados o racimos (cluster sampling):

La unidad de selección es un grupo en vez de un individuo. Dos tipos:
- Probabilístico: se posee una base de sondeo de todas las unidades del universo
- Semi-probabilístico: no hay una base de sondeo de todas las unidades del universo considerados uno a
uno.
VENTAJAS: ahorro en tiempo de trabajo y coste
INCONVENIENTES: aumento del margen de error
 Muestra polietápica:
Para obtener una muestra se seleccionan al azar cierto número de racimos y después en cada racimo cierto
número de elementos.
La diferencia que hay entre la muestra polietápica y la de racimos, es que en esta se pregunta a una parte de los
miembros de los racimos seleccionados, mientras que en la muestra por racimos se pregunta al total de los
miembros de los racimos seleccionados
 Muestra de panel:
Una vez seleccionada la muestra se compromete a responder a una serie de preguntas que se le van a formular
en varias fases. Permite llevar un seguimiento de las personas. Se utiliza para conocer los índices de audiencia.
2. MUESTRAS LOCALIZADA
Muestra de tipo intermedio entre la muestra probabilística y la no probabilística que se obtiene de seleccionar a
las personas que se encuentran en algún punto concreto o que tienen alguna característica en común. La muestra
se obtiene de dos formas:
- Probabilística: se toma una muestra representativa de la población total y se extrae de esa muestra las
personas que tienen las características que nos interesan para el estudio. Existe base de sondeo.
- No probabilística: se va directamente al colectivo y se le pregunta. No hay base de sondeo.
3. MUESTRAS NO PROBABILÍSTICAS
Los sujetos son elegidos de forma intencional y controlada. No hay base de sondeo, por lo que no se puede
determinar la probabilidad de ser elegido. Idóneo para escoger personas que garanticen la calidad de
información.
 Muestra accidental: muestreo rápido pero no representativo
 Muestra por cuotas: se conoce la distribución del universo en cuotas o estratos y se seleccionan
elementos representativos de cada uno. No hay que confundirla con la muestra estratificada, donde tenemos
base de sondeo individualizada.
 Muestra intencional o dirigida: el investigador selecciona los elementos que por su mayor conocimiento
o representatividad. Su objetividad depende de la objetividad del investigador
 Muestra por bola de nieve: intenta localizar a individuos que presentan unas características especiales y
muy concretas, y estos llevan por familiaridad, conocimiento o facilidad de acceso a nuevos informantes. El
primer informante condiciona al resto de personas de la muestra
® MEDIDAS DE TENDENCIA CENTRAL

Son medidas que tratan de concentrar o centralizar la información de los datos en un solo número que los
represente lo mejor posible. Tienden a situarse en el centro del conjunto de datos ordenados según magnitud.
 Media aritmética
Es la suma de los datos observados, dividida por el número del total de ellos.
Propiedades:
- La suma de las desviaciones de todas las variables respecto a su media aritmética es igual a cero. Σ (Xi – X) =
0
- Si se suma una constante a los datos de una muestra, la media quedará aumentada en dicha constante (igual
si se multiplica)
- La media aritmética de un conjunto de nº positivos siempre es igual o superior a la media geométrica y
armónica
- Media geométrica es la raíz enésima del producto de todos los números
- Media armónica es el inverso de la media aritmética
- Media cuadrática es la raíz cuadrada de la media aritmética
Armónica < Geométrica <

Aritmética < Cuadrática
 Mediana: es el punto medio de los valores cuando estos se han ordenado de forma creciente o
decreciente
 Moda: variable de mayor frecuencia. Puede ser unimodal, bimodal…
 Percentil: índice de posición que indica la posición de una variable dentro del grupo del objeto. El
percentil 10 nos marcaria que elementos están por encima y por debajo del 10 %.
® MEDIDAS DE DISPERSIÓN O VARIABILIDAD

Indican si las puntuaciones se encuentran muy próximas entre sí o muy lejanas.
 Rango o amplitud total: distancia total en la escala numérica a lo largo de la cual varían los puntajes.
Rango excluyente (diferencia entre la mayor y menor puntuación de un grupo) y Rango incluyente
Ejemplo: Nº de hermanos de los estudiantes de un aula = 2,3,5,3,2,5,2,4,2,1,2,4,2. Rango es 4, distancia entre 5 y
1
 Desviación media: media aritmética de los valores absolutos de las diferencias entre los valores de la
variable y su media aritmética. Indica la media de desviación de cada puntuación respecto a la media del grupo
(hasta qué punto varían las puntuaciones)
 Desviación típica: raíz cuadrada de la media de los cuadrados de las desviaciones respecto a la media de
la distribución.
 Varianza: cuadrado de la desviación típica
 Amplitud semi-intercuartil: se usa cuando la distribución de los datos es muy asimétrica y no es
conveniente calcular la media ni la desviación típica. Es la mitad de la distancia entre el tercer cuartil (75%) y el
primer cuartil (25%)
 Coeficiente de variación Pearson : cociente entre la desviación típica y la media multiplicado por 100. Es
un tipo de variable relativa que permite comparar desviaciones típicas de muestras distintas.
® REPRESENTACIONES GRÁFICAS
Imagen que tiene por objeto visualizar mediante una simple ojeada la información recogida en las muestras,
obteniendo una visión de conjunto. Complementan las tablas, NO las sustituyen
VENTAJAS:
- Ponen al descubierto las variaciones anormales
- Detectan errores de cálculo
- Detectan los valores de máximo y mínimo rápidamente
- Permiten contemplar en un mismo gráfico varias tablas estadísticas
- Comparan fenómenos relacionados entre sí
Gráfica de puntos → datos continuos

Gráfica de líneas → evoluciones temporales y diferencias
Diagrama de barras → variables discretas
Histograma de frecuencias → variables continuas
Polígono de frecuencias → unión de los puntos de los histogramas
® FENÓMENOS ALEATORIOS: PROBABILIDAD, ESPERANZA Y VARIANZA

Un fenómeno es aleatorio si puede dar lugar a varios resultados, sin que se pueda anunciar con certeza cual de
ellos va a resultar en la realización del experimento. El conjunto de los resultados posibles es el espacio muestral
(E)
 Probabilidad
Determinar cuantitativamente la posibilidad de que un suceso produzca un determinado resultado.
P = CASOS FAVORABLES / CASOS POSIBLES
Principios fundamentales:
- Probabilidad de un suceso imposible = 0
- Probabilidad de un suceso seguro = 1.
- La probabilidad de un suceso cualquiera está entre 0 y 1 y se expresa en porcentajes entre 0 y 100.
- La probabilidad de la unión de dos sucesos es la suma de las probabilidades de los dos sucesos menos la
intersección de ambos.
- La probabilidad de un suceso contrario de A, es igual a 1 menos la probabilidad de A.
 Esperanza matemática
Representa la cantidad media que se "espera" como resultado de un experimento aleatorio cuando la
probabilidad de cada suceso se mantiene constante y el experimento se repite un elevado número de veces.
 Varianza: es el promedio ponderado por las probabilidades de los cuadrados de las desviaciones de la
variable con respecto a su media aritmética
- Varianza de población.
- Varianza sistemática.
- Varianza experimental o entre grupos
- Varianza del error.
- Covarianza
- Varianza de factores comunes. Es la compartida por dos o más variables en alguno de sus factores.
® INSTRUMENTOS ESTADÍSTICOS DEL MINISTERIO DEL INTERIOR

La Secretaría de Estado de Seguridad (SES), es responsable del Sistema Estadístico de Criminalidad (fichero SEC)
Este sistema sustituyó en 2007 al Programa Estadístico de Seguridad (PES)
Finalidad:
- Tener un conocimiento más profundo de los factores que inciden en la seguridad ciudadana
- Estructurar la obtención, explotación y difusión de datos estadísticos relacionados con las infracciones penales y
contra las leyes de seguridad ciudadana.
Características:
- Objetivo: explotación estadística
- Ámbito poblacional: personas que entren en contacto con el sistema policial
- Temporalidad: año en curso y comparativa con años anteriores.
- Ámbito geográfico: territorio nacional competencia de las FCS
- Periodicidad de la recogida de datos: remisión mensual encriptada en formato xml, 15 días del fin del mes.
- Usos previstos: fines estadísticos para establecer las políticas de seguridad más adecuadas y los planes de
acción preventivos oportunos.
- Personas o colectivos: el origen de los datos son denunciantes, víctimas y presuntos responsables de
determinadas infracciones.
- Procedimiento de recogida de datos: los datos proceden de diligencias, reseñas de detenidos y denuncias.
- Cesión de datos a otros países: solo para elaboración de informes estadísticos.
- Solo a policías autonómicas con competencia integral en Seguridad Ciudadana se cederán números
identificadores (DNI. NIE...)
- Órgano administrativo responsable: Secretaría de Estado de Seguridad.
- Medidas de seguridad exigibles: Alto
® PERFIL GEOGRÁFICO
La perfilación consiste en investigar dónde vive el autor de un crimen o averiguar en qué zona podría cometer su
próximo delito. Se basa en un análisis del comportamiento ambiental que permite obtener conclusiones llamadas
puntos de anclaje. Estos son los lugares mas importantes de su vida espacial (residencia, lugar de trabajo, casa de
un amigo…)
Se cree que las localizaciones de una serie de crímenes pueden reflejar el mapa cognitivo de la persona que los ha
realizado, por ello el FBI utiliza el perfil geográfico partiendo de la base de que el criminal en serie suele vivir cerca
de la zona en la que cometió su primer crimen.
Teoría de los círculos de David Canter: los diferentes escenarios están relacionados con un lugar importante para
el delincuente (domicilio, lugar de trabajo...) Si tomamos los dos escenarios del crimen más alejados entre sí,
uniéndolos por una línea recta y definiendo esta línea como diámetro de un círculo imaginario, la vivienda del
agresor o un punto de anclaje, debería encontrarse próxima al centro de dicho círculo.
Para el análisis de los datos necesarios para establecer los puntos de anclaje del autor de un delito, se suelen
emplear Sistemas de información geográficos llamados SIG (Sistema de Información Geográfica) o GIS
(Geographic Information System). Los más importantes son:
 VICAP: Violent Criminal Aprenhension Program o pPrograma de detención de criminales violentos.
Cálculo estadístico para relacionar diferentes hechos basándose en características como el uso de instrumentos
de comisión, modus operandi y firmas, junto con localización geográfica de lugares de contacto, ataque y
depósito.
 CGT: Criminal Geographic Targeting

Se emplea para delitos en serie y utiliza un modelo matemático desarrollado por Rossmo. Se representa una
superficie tridimensional probabilística, en la que la mayor altura corresponde a un punto determinado que
podría ser el de residencia o el lugar de trabajo del agresor. Se basa en un proceso de cuatro etapas:
1. Delimitación del área de caza del agresor, calculado los lugares del delito.
2. Cálculo de distancias Manhattan, calculando la distancia real recorrida entre puntos utilizando el trazado
hipodámico (manzanas rectangulares)
3. Asignación de un valor a cada punto, basándose en una valoración del recorrido de la distancia.
4. Representación de cada puntuación en el mapa, según la cual la mayor puntuación la obtiene el punto con
mayor probabilidad de corresponderse con el lugar de la casa o del trabajo del delincuente.
 VICLAS: Violent Crime Linkage Analysis System

Creada en Canadá y centrada en 4 ejes principales:
1. Víctima
2. Agresor
3. Escenarios
4. Tipo de agresiones

Estadística

Cargado por

Copyright:

Formatos disponibles

Estadística

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadística

Cargado por

Copyright:

Formatos disponibles

TEMA 65.

Unidad estadística: dato individual de la observación de un fenómeno. Puede ser:

® MÉTODOS FUNDAMENTALES DE SELECCIÓN DE LA MUESTRA

ESTADÍSTICA DESCRIPTIVA - DEDUCTIVA ESTADÍSTICA INDUCTIVA - INFERENCIAL

® MÉTODOS FUNDAMENTALES DE SELECCIÓN DE LA MUESTRA

® TEORÍA DEL MUESTREO

Análisis CUANTITATIVO: selecciona unos cuantos casos de muestra y lo observado se generaliza

Elementos a tener en cuenta para la selección de la muestra:

 Muestra por conglomerados o racimos (cluster sampling):

® MEDIDAS DE TENDENCIA CENTRAL

Armónica < Geométrica <

® MEDIDAS DE DISPERSIÓN O VARIABILIDAD

Gráfica de puntos → datos continuos

® FENÓMENOS ALEATORIOS: PROBABILIDAD, ESPERANZA Y VARIANZA

® INSTRUMENTOS ESTADÍSTICOS DEL MINISTERIO DEL INTERIOR

 CGT: Criminal Geographic Targeting

 VICLAS: Violent Crime Linkage Analysis System

También podría gustarte