Estadística

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 7

TEMA 65.

ESTADÍSTICA
La Estadística estudia la variabilidad, organización, presentación de datos… para sacar conclusiones basadas en el
cálculo de probabilidades
Es útil SOLO cuando su objeto de aplicación es un fenómeno aleatorio que no esté determinado por alguna ley
rígida
Se caracteriza por la inducción a través de una hipótesis. Se utiliza un método inductivo para pasar de lo particular
observado a lo general.

Unidad estadística: dato individual de la observación de un fenómeno. Puede ser:


- Simple: un solo dato (12 vehículos)
- Compleja: más de un dato (8 vehículos tipo coche y 4 vehículos tipo moto)
Población estadística: conjunto de unidades estadísticas (las más interesantes son las variables en el tiempo)
Tamaño: nº de elementos que constituyen la población (finitos o infinitos)
Muestra: porción de la población observada para formular los cálculos estadísticos cuando el tamaño de la
población es inabarcable. Es una selección suficiente para obtener la fiabilidad requerida. Cuanto mayor es la
muestra, más fiables serán los datos.
Variable estadística (xi): variables obtenidas de la observación de cada elemento
- V. cuantitativa: valor = nº contable 1 sólo carácter cuantitativo = variables unidimensionales
- Variable cuantitativa discreta: nº entero
- Variable cuantitativa continua: nº con decimales
- V. cualitativa o atributo: valor no contable
Rango o recorrido: diferencia entre el mayor y el menor de los valores de una variable (nota entre 0 y 10)
Frecuencia absoluta (fi): nº de veces que se repite un resultado.
Distribución absoluta: representación de los resultados en una tabla con dos columnas: xi que serán los posibles
valores observados y fi que será el nº de veces que se repita el valor.
Distribución de frecuencia absoluta acumulada (Fi): suma de la frecuencia absoluta del valor presente y los
anteriores
Frecuencia total (N): suma de todas la frecuencias absolutas. El valor debe coincidir con el último valor de la
frecuencia acumulada.
Frecuencia relativa (hi): frecuencia absoluta de un resultado / frecuencia total (hi = ni / N)
Frecuencias relativas acumuladas (Hi): suma de todas la frecuencias absolutas relativas (hi). El último valor debe
ser 1.
Intervalos de clase: agrupación de variables en intervalos con una amplitud determinada (c) constante o variable
Marca de clase: media entre el valor superior y el inferior de la clase. Punto medio del intervalo.
Densidad (Di) : frecuencia absoluta de cada intervalo / amplitud del intervalo (Di = ni / c). Si la amplitud de los
intervalos es constante, la información que da la frecuencia absoluta es la misma, por lo tanto no hay que
calcularlo. Sirve para conocer el nº de elementos que hay en un intervalo si la amplitud no es constante.
Campo de aplicación de la estadística: método efectivo para describir con exactitud valores de datos económicos,
políticos, sociales, psicológicos, biológicos y físicos, relacionarlos y analizarlos.
El análisis estadístico NO consiste solo en reunir y representar los datos, sino que trata de interpretar toda esa
información.

® MÉTODOS FUNDAMENTALES DE SELECCIÓN DE LA MUESTRA


 Gran encuesta: se observan todas las unidades del conjunto. Es un método muy laborioso. Es posible si el
grupo a investigar es muy reducido
 Encuesta por muestreo: solo se observan determinadas unidades, previamente seleccionadas, del
conjunto de la muestra. Ventaja: ahorro de tiempo, dinero y personal sin perder validez científica.

ESTADÍSTICA DESCRIPTIVA - DEDUCTIVA ESTADÍSTICA INDUCTIVA - INFERENCIAL


Métodos estadísticos que describen y/o caracterizan un Busca deducir y sacar conclusiones sobre situaciones
grupo de datos conocidos generales mas allá del conjunto de datos obtenidos.
Objetivos: Objetivos:
- Caracterizar un grupo de datos - Examinar diferencias entre grupos
- Examinar tendencias o distribuciones - Examinar si las variables están asociadas
- Predecir una variable a partir de otra
Métodos de análisis:
- Medidas de tendencia central: Media / Mediana / Métodos de análisis:
Moda - T-test
- Medidas de variabilidad: Varianza / Desviación - Análisis de varianza
estándar / Rango / Frecuencia - Correlación
- Regresión

® MÉTODOS FUNDAMENTALES DE SELECCIÓN DE LA MUESTRA


 Gran encuesta: se observan todas las unidades del conjunto. Es un método muy laborioso. Es posible si el
grupo a investigar es muy reducido
 Encuesta por muestreo: solo se observan determinadas unidades, previamente seleccionadas, del
conjunto de la muestra. Ventaja: ahorro de tiempo, dinero y personal sin perder validez científica.

® TEORÍA DEL MUESTREO


La imposibilidad o dificultad para investigar a todos los relacionados con el objeto de investigación, obliga a
seleccionar un número reducido de ellos, que conformen una muestra representativa.
El muestreo consiste en limitar la investigación a un número reducido de personas para obtener resultados
representativos del colectivo completo que deseamos estudiar.
Casos en los que procede utilizar la técnica del muestreo:
- Población infinita o inmensa
- Población inaccesible
- Si se quiere hacer un experimento social con grupos de control
- Si hay que hacer un pre-test o estudio piloto.
- Si se quiere hacer el reportaje en poco tiempo
La muestra deberá cumplir tres condiciones básicas:
• REPRESENTATIVIDAD: fiel reflejo de las características del universo o población total del que se ha sacado.
• CONFIANZA: fiabilidad de los datos respecto del universo, y que, en el caso de repetir la investigación con la
misma muestra u otra representativa, los resultados serían los mismos.
• TAMAÑO: determinado número de elementos. El tipo de tamaño de la muestra está condicionado por el tipo y
estilo de investigación (cuantitativa o cualitativa)

Análisis CUANTITATIVO: selecciona unos cuantos casos de muestra y lo observado se generaliza


Análisis CUALITATIVO: profundiza en unos casos concretos que NO son generalizables al resto de la población

Elementos a tener en cuenta para la selección de la muestra:


- Margen de error tolerado (a mayor tamaño, menor margen de error)
- Nivel de confianza exigido (a mayor tamaño, mayor confianza)
- Varianza de la población (a mayor tamaño, mayor varianza y población más heterogénea)

 Tipos de muestra:
1. MUESTRAS PROBABILÍSTICAS:
- Muestra al azar
- Muestra estratificada
- Muestra por conglomeración o en racimo
- Muestra polietápica
- Muestra de panel
2. MUESTRA LOCALIZADA
3. MUESTRAS NO PROBABILÍSTICAS:
- Muestra accidental
- Muestra por cuotas
- Muestra dirigida o razonada
- Muestra por bola de nieve

1. MUESTRAS PROBABILÍSTICAS
Muestra en la que podemos saber a priori la probabilidad que tiene cada uno de los miembros del universo de
salir seleccionado.
La condición fundamental para que la muestra sea probabilística es que exista una Base de sondeo, si no existe, la
muesrta es no probabilística. Una Base de sondeo es el documento escrito o informatizado en el que están
consignados todos los elementos del universo
 Muestra al azar:
Se basa en la presunción de que todos los individuos de la población total tienen la misma probabilidad de ser
elegidos, de acuerdo con las leyes del azar. Consiste en escoger, por medio de un sorteo riguroso, una serie de
elementos de una población, de modo que puedan ser considerados como representativos del total.
- Selección por urna/lotería
Se confecciona una lista de todos los elementos de la población y se numeran. Se introducen en una urna tantas
bolas como elementos haya y se extraen de esa urna “n” elementos.
Muestreo sin reemplazo: cuando un elemento ha sido escogido ya no puede volver a la urna.
Muestreo con reemplazo: cuando el elemento escogido puede volver a serlo posteriormente.
- Selección sistemática
Se selecciona al azar el primer individuo, seleccionando, posteriormente, los restantes a intervalos fijos
determinados según el número de la muestra.
- Tabla de números equiprobables
Tablas de números elaboradas por los matemáticos, extrayendo una serie de números al azar.

 Muestra estratificada:
Es apropiada cuando la población es heterogénea. La población es dividida en grupos (estratos) homogéneos y sus
datos son estudiados por separado. Procedimiento:
1º Se divide el universo en estratos lo más homogéneos posibles
2º Se selecciona un criterio para diferenciar los distintos estratos
3º Se selecciona una muestra al azar en cada estrato
El reparto de la muestra entre los diversos estratos se denomina Afijación de la muestra y puede hacerse por:
- Afijación Simple
Se reparte la muestra total en partes iguales para cada estrato, aunque el tamaño de cada estrato sea diferente.
- Afijación Proporcional
Se reparte la muestra total proporcionalmente entre los diversos estratos. El tamaño de la muestra seleccionada
para cada estrato es proporcional al nº de individuos de que está compuesto cada estrato. Inconveniente: No
considera la varianza de cada estrato.
- Afijación Óptima
Se trata de elegir dentro de cada estrato más o menos elementos, según sea mayor o menor su varianza

 Muestra por conglomerados o racimos (cluster sampling):


La unidad de selección es un grupo en vez de un individuo. Dos tipos:
- Probabilístico: se posee una base de sondeo de todas las unidades del universo
- Semi-probabilístico: no hay una base de sondeo de todas las unidades del universo considerados uno a
uno.
VENTAJAS: ahorro en tiempo de trabajo y coste
INCONVENIENTES: aumento del margen de error

 Muestra polietápica:
Para obtener una muestra se seleccionan al azar cierto número de racimos y después en cada racimo cierto
número de elementos.
La diferencia que hay entre la muestra polietápica y la de racimos, es que en esta se pregunta a una parte de los
miembros de los racimos seleccionados, mientras que en la muestra por racimos se pregunta al total de los
miembros de los racimos seleccionados

 Muestra de panel:
Una vez seleccionada la muestra se compromete a responder a una serie de preguntas que se le van a formular
en varias fases. Permite llevar un seguimiento de las personas. Se utiliza para conocer los índices de audiencia.

2. MUESTRAS LOCALIZADA
Muestra de tipo intermedio entre la muestra probabilística y la no probabilística que se obtiene de seleccionar a
las personas que se encuentran en algún punto concreto o que tienen alguna característica en común. La muestra
se obtiene de dos formas:
- Probabilística: se toma una muestra representativa de la población total y se extrae de esa muestra las
personas que tienen las características que nos interesan para el estudio. Existe base de sondeo.
- No probabilística: se va directamente al colectivo y se le pregunta. No hay base de sondeo.

3. MUESTRAS NO PROBABILÍSTICAS
Los sujetos son elegidos de forma intencional y controlada. No hay base de sondeo, por lo que no se puede
determinar la probabilidad de ser elegido. Idóneo para escoger personas que garanticen la calidad de
información.
 Muestra accidental: muestreo rápido pero no representativo

 Muestra por cuotas: se conoce la distribución del universo en cuotas o estratos y se seleccionan
elementos representativos de cada uno. No hay que confundirla con la muestra estratificada, donde tenemos
base de sondeo individualizada.

 Muestra intencional o dirigida: el investigador selecciona los elementos que por su mayor conocimiento
o representatividad. Su objetividad depende de la objetividad del investigador
 Muestra por bola de nieve: intenta localizar a individuos que presentan unas características especiales y
muy concretas, y estos llevan por familiaridad, conocimiento o facilidad de acceso a nuevos informantes. El
primer informante condiciona al resto de personas de la muestra

® MEDIDAS DE TENDENCIA CENTRAL


Son medidas que tratan de concentrar o centralizar la información de los datos en un solo número que los
represente lo mejor posible. Tienden a situarse en el centro del conjunto de datos ordenados según magnitud.
 Media aritmética
Es la suma de los datos observados, dividida por el número del total de ellos.
Propiedades:
- La suma de las desviaciones de todas las variables respecto a su media aritmética es igual a cero. Σ (Xi – X) =
0
- Si se suma una constante a los datos de una muestra, la media quedará aumentada en dicha constante (igual
si se multiplica)
- La media aritmética de un conjunto de nº positivos siempre es igual o superior a la media geométrica y
armónica
- Media geométrica es la raíz enésima del producto de todos los números
- Media armónica es el inverso de la media aritmética
- Media cuadrática es la raíz cuadrada de la media aritmética

Armónica < Geométrica <


Aritmética < Cuadrática

 Mediana: es el punto medio de los valores cuando estos se han ordenado de forma creciente o
decreciente
 Moda: variable de mayor frecuencia. Puede ser unimodal, bimodal…
 Percentil: índice de posición que indica la posición de una variable dentro del grupo del objeto. El
percentil 10 nos marcaria que elementos están por encima y por debajo del 10 %.

® MEDIDAS DE DISPERSIÓN O VARIABILIDAD


Indican si las puntuaciones se encuentran muy próximas entre sí o muy lejanas.
 Rango o amplitud total: distancia total en la escala numérica a lo largo de la cual varían los puntajes.
Rango excluyente (diferencia entre la mayor y menor puntuación de un grupo) y Rango incluyente
Ejemplo: Nº de hermanos de los estudiantes de un aula = 2,3,5,3,2,5,2,4,2,1,2,4,2. Rango es 4, distancia entre 5 y
1
 Desviación media: media aritmética de los valores absolutos de las diferencias entre los valores de la
variable y su media aritmética. Indica la media de desviación de cada puntuación respecto a la media del grupo
(hasta qué punto varían las puntuaciones)
 Desviación típica: raíz cuadrada de la media de los cuadrados de las desviaciones respecto a la media de
la distribución.
 Varianza: cuadrado de la desviación típica
 Amplitud semi-intercuartil: se usa cuando la distribución de los datos es muy asimétrica y no es
conveniente calcular la media ni la desviación típica. Es la mitad de la distancia entre el tercer cuartil (75%) y el
primer cuartil (25%)
 Coeficiente de variación Pearson : cociente entre la desviación típica y la media multiplicado por 100. Es
un tipo de variable relativa que permite comparar desviaciones típicas de muestras distintas.

® REPRESENTACIONES GRÁFICAS
Imagen que tiene por objeto visualizar mediante una simple ojeada la información recogida en las muestras,
obteniendo una visión de conjunto. Complementan las tablas, NO las sustituyen
VENTAJAS:
- Ponen al descubierto las variaciones anormales
- Detectan errores de cálculo
- Detectan los valores de máximo y mínimo rápidamente
- Permiten contemplar en un mismo gráfico varias tablas estadísticas
- Comparan fenómenos relacionados entre sí

Gráfica de puntos → datos continuos


Gráfica de líneas → evoluciones temporales y diferencias
Diagrama de barras → variables discretas
Histograma de frecuencias → variables continuas
Polígono de frecuencias → unión de los puntos de los histogramas

® FENÓMENOS ALEATORIOS: PROBABILIDAD, ESPERANZA Y VARIANZA


Un fenómeno es aleatorio si puede dar lugar a varios resultados, sin que se pueda anunciar con certeza cual de
ellos va a resultar en la realización del experimento. El conjunto de los resultados posibles es el espacio muestral
(E)
 Probabilidad
Determinar cuantitativamente la posibilidad de que un suceso produzca un determinado resultado.
P = CASOS FAVORABLES / CASOS POSIBLES
Principios fundamentales:
- Probabilidad de un suceso imposible = 0
- Probabilidad de un suceso seguro = 1.
- La probabilidad de un suceso cualquiera está entre 0 y 1 y se expresa en porcentajes entre 0 y 100.
- La probabilidad de la unión de dos sucesos es la suma de las probabilidades de los dos sucesos menos la
intersección de ambos.
- La probabilidad de un suceso contrario de A, es igual a 1 menos la probabilidad de A.
 Esperanza matemática
Representa la cantidad media que se "espera" como resultado de un experimento aleatorio cuando la
probabilidad de cada suceso se mantiene constante y el experimento se repite un elevado número de veces.
 Varianza: es el promedio ponderado por las probabilidades de los cuadrados de las desviaciones de la
variable con respecto a su media aritmética
- Varianza de población.
- Varianza sistemática.
- Varianza experimental o entre grupos
- Varianza del error.
- Covarianza
- Varianza de factores comunes. Es la compartida por dos o más variables en alguno de sus factores.

® INSTRUMENTOS ESTADÍSTICOS DEL MINISTERIO DEL INTERIOR


La Secretaría de Estado de Seguridad (SES), es responsable del Sistema Estadístico de Criminalidad (fichero SEC)
Este sistema sustituyó en 2007 al Programa Estadístico de Seguridad (PES)
Finalidad:
- Tener un conocimiento más profundo de los factores que inciden en la seguridad ciudadana
- Estructurar la obtención, explotación y difusión de datos estadísticos relacionados con las infracciones penales y
contra las leyes de seguridad ciudadana.
Características:
- Objetivo: explotación estadística
- Ámbito poblacional: personas que entren en contacto con el sistema policial
- Temporalidad: año en curso y comparativa con años anteriores.
- Ámbito geográfico: territorio nacional competencia de las FCS
- Periodicidad de la recogida de datos: remisión mensual encriptada en formato xml, 15 días del fin del mes.
- Usos previstos: fines estadísticos para establecer las políticas de seguridad más adecuadas y los planes de
acción preventivos oportunos.
- Personas o colectivos: el origen de los datos son denunciantes, víctimas y presuntos responsables de
determinadas infracciones.
- Procedimiento de recogida de datos: los datos proceden de diligencias, reseñas de detenidos y denuncias.
- Cesión de datos a otros países: solo para elaboración de informes estadísticos.
- Solo a policías autonómicas con competencia integral en Seguridad Ciudadana se cederán números
identificadores (DNI. NIE...)
- Órgano administrativo responsable: Secretaría de Estado de Seguridad.
- Medidas de seguridad exigibles: Alto

® PERFIL GEOGRÁFICO
La perfilación consiste en investigar dónde vive el autor de un crimen o averiguar en qué zona podría cometer su
próximo delito. Se basa en un análisis del comportamiento ambiental que permite obtener conclusiones llamadas
puntos de anclaje. Estos son los lugares mas importantes de su vida espacial (residencia, lugar de trabajo, casa de
un amigo…)
Se cree que las localizaciones de una serie de crímenes pueden reflejar el mapa cognitivo de la persona que los ha
realizado, por ello el FBI utiliza el perfil geográfico partiendo de la base de que el criminal en serie suele vivir cerca
de la zona en la que cometió su primer crimen.
Teoría de los círculos de David Canter: los diferentes escenarios están relacionados con un lugar importante para
el delincuente (domicilio, lugar de trabajo...) Si tomamos los dos escenarios del crimen más alejados entre sí,
uniéndolos por una línea recta y definiendo esta línea como diámetro de un círculo imaginario, la vivienda del
agresor o un punto de anclaje, debería encontrarse próxima al centro de dicho círculo.
Para el análisis de los datos necesarios para establecer los puntos de anclaje del autor de un delito, se suelen
emplear Sistemas de información geográficos llamados SIG (Sistema de Información Geográfica) o GIS
(Geographic Information System). Los más importantes son:
 VICAP: Violent Criminal Aprenhension Program o pPrograma de detención de criminales violentos.
Cálculo estadístico para relacionar diferentes hechos basándose en características como el uso de instrumentos
de comisión, modus operandi y firmas, junto con localización geográfica de lugares de contacto, ataque y
depósito.

 CGT: Criminal Geographic Targeting


Se emplea para delitos en serie y utiliza un modelo matemático desarrollado por Rossmo. Se representa una
superficie tridimensional probabilística, en la que la mayor altura corresponde a un punto determinado que
podría ser el de residencia o el lugar de trabajo del agresor. Se basa en un proceso de cuatro etapas:
1. Delimitación del área de caza del agresor, calculado los lugares del delito.
2. Cálculo de distancias Manhattan, calculando la distancia real recorrida entre puntos utilizando el trazado
hipodámico (manzanas rectangulares)
3. Asignación de un valor a cada punto, basándose en una valoración del recorrido de la distancia.
4. Representación de cada puntuación en el mapa, según la cual la mayor puntuación la obtiene el punto con
mayor probabilidad de corresponderse con el lugar de la casa o del trabajo del delincuente.

 VICLAS: Violent Crime Linkage Analysis System


Creada en Canadá y centrada en 4 ejes principales:
1. Víctima
2. Agresor
3. Escenarios
4. Tipo de agresiones

También podría gustarte