EPIDEMIOLOGIA
EPIDEMIOLOGIA
EPIDEMIOLOGIA
Discretas: Slo pueden tomar un nmero finito de valores enteros, los valores
posibles de estas variables son aislados.
Ejemplos de variables estadsticas cuantitativas discretas
Nmero de hermanos: pueden ser 1, 2, 3 , pero nunca podr ser 3,45.
Nmero de hijos
Nmero de empleados de una fbrica.
Nmero de goles marcados por un equipo de futbol en la liga.
DISTRIBUCION DE FRECUENCIAS
Una distribucin de frecuencias o tabla de frecuencias es
una ordenacin en forma de tabla de los datos estadsticos,
asignando a cada dato su frecuencia correspondiente.
Tipos de frecuencia
Frecuencia absoluta
La frecuencia
absoluta es
el nmero
de
veces que
Frecuencia relativa
La frecuencia relativa es el cociente entre la frecuencia
absoluta de un determinado valor y el nmero total de datos.
Se puede expresar en tantos por ciento y se representa
por n i .
todos
los valores
inferiores
iguales al
valor considerado.
Se representa por F i .
Frecuencia relativa acumulada
La frecuencia
relativa
acumulada es
el cociente entre
Recuento
fi
Fi
ni
Ni
27
0.032 0.032
28
II
0.065 0.097
29
0.194 0.290
30
16 0.226 0.516
31
24 0.258 0.774
32
III
27 0.097 0.871
33
III
30 0.097 0.968
34
31 0.032
31
cada clase se
le
asigna
Lmites de la clase
Cada clase est delimitada por
el lmite
inferior
de
la
fi
Fi
ni
Ni
[0, 5)
2.5
0.025
0.025
[5, 10)
7.5
0.025
0.050
[10, 15)
12.5
0.075
0.125
[15, 20)
17.5
0.075
0.200
[20, 25)
22.5
11
0.075
0.2775
[25, 30)
27.5
17
0.150
0.425
[30, 35)
32.5
24
0.175
0.600
[35, 40)
37.5
10
34
0.250
0.850
[40, 45)
42.5
38
0.100
0.950
[45, 50)
47.5
40
0.050
40
ARREGLOS ORDENADOS
Cuando se obtienen los datos que componen la muestra, los valores
resultantes llegan al analista en la forma en que fueron obtenidos y sin ningn
tipo de ordenacin, constituyendo lo que se denomina "Datos sin Procesar".
Esta forma de presentacin no facilita el anlisis de la informacin, de all que
sea necesario efectuar algn tipo de organizacin de datos. El arreglo
ordenado constituye una de las formas ms sencillas de representarlos, y
consiste simplemente en disponer los valores de las observaciones en un
orden decreciente o creciente. Este tipo de grficas te permite saber el mximo
o el mnimo.
HISTOGRAMAS
En estadstica,
un histograma es
una
representacin grfica de
una variable en forma de barras, donde la superficie de cada barra es
proporcional a la frecuencia de los valores representados, ya sea en forma
diferencial o acumulada. Sirven para obtener una "primera vista" general, o
panorama, de la distribucin de la poblacin, o la muestra, respecto a una
caracterstica, cuantitativa y continua, de la misma y que es de inters para el
observador (como la longitud o la masa). De esta manera ofrece una visin en
grupo permitiendo observar una preferencia, o tendencia, por parte de la
muestra o poblacin por ubicarse hacia una determinada regin de valores
dentro del espectro de valores posibles (sean infinitos o no) que pueda adquirir
la caracterstica. As pues, podemos evidenciar comportamientos, observar el
grado de homogeneidad, acuerdo o concisin entre los valores de todas las
partes que componen la poblacin o la muestra, o, en contraposicin, poder
observar el grado de variabilidad, y por ende, la dispersin de todos los valores
que toman las partes, tambin es posible no evidenciar ninguna tendencia y
obtener que cada miembro de la poblacin toma por su lado y adquiere un
valor de la caracterstica aleatoria-mente sin mostrar ninguna preferencia o
tendencia, entre otras cosas.
En general se utilizan para relacionar variables cuantitativas continuas, pero
tambin se lo suele usar para variables cuantitativas discretas, en cuyo caso es
comn llamarlo diagrama de frecuencias y sus barras estn separadas, esto es
porque en el "x" ya no se representa un espectro continuo de valores, sino
valores cuantitativos especficos como ocurre en un diagrama de barras
cuando la caracterstica que se representa es cualitativa o categrica. Su
utilidad se hace ms evidente cuando se cuenta con un gran nmero de datos
cuantitativos y que se han agrupado en intervalos de clase.
Ejemplos de su uso es cuando se representan franjas de edades o altura de la
muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores
continuos. En los casos en los que los datos son cualitativos (no-numricos),
como sexto grado de acuerdo o nivel de estudios, es preferible un diagrama de
sectores.
Los histogramas son ms frecuentes en ciencias sociales, humanas y
econmicas que en ciencias naturales y exactas. Y permite la comparacin de
los resultados de un proceso.
TIPOS DE HISTOGRAMAS
Polgono de frecuencias
Ojiva porcentual
CONSTRUCCION DE UN HISTOGRAMA
Paso 1
Determinar el rango de los datos. Rango es igual al dato mayor menos el dato menor.
Paso 2
Obtener todos los nmeros de clases, existen varios criterios para determinar el nmero de
clases (o barras) -por ejemplo la regla de Sturgess-. Sin embargo ninguno de ellos es
exacto. Algunos autores recomiendan de cinco a quince clases, dependiendo de cmo
estn los datos y cuntos sean. Un criterio usado frecuentemente es que el nmero de
clases debe ser aproximadamente a la raz cuadrada del nmero de datos. Por ejemplo, la
raz cuadrada de 30 ( nmero de artculos) es mayor que cinco, por lo que se seleccionan
seis clases.
Paso 3
Paso 4
Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los datos en
relacin al resultado del PASO 2 en intervalos iguales.
Paso 5
Graficar el histograma: En caso de que las clases sean todas de la misma amplitud, se
hace un grfico de barras, las bases de las barras son los intervalos de clases y altura son
la frecuencia de las clases. Si se unen los puntos medios de la base superior de los
rectngulos se obtiene el polgono de frecuencias.
1 2 3 4 5 6 7 8 9
Nmero de alumnos 2 2 4 5 6 9 4 4 2
Calculemos la Mediana:
Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla
x i fi
Fi
1 2
2 2
3 4
4 5
13
5 6 19 = 19
6 9
28
7 4
32
36
a las frecuencias absolutas --> Ni-1< n/2 < Ni = N18 < 19 < N19
38
margen derecho).
Si volvemos a utilizar la frmula asociada a la mediana para n par,
9 2
Con lo cual la mediana ser la media aritmtica de los valores de la variable que ocupen el
decimonoveno y el vigsimo lugar.
Propiedades e inconvenientes
Las principales propiedades de la mediana son:
Es menos sensible que la media a oscilaciones de los valores de la variable. Un error de
transcripcin en la serie del ejemplo anterior en, pongamos por caso, el ltimo nmero,
deja a la mediana inalterada.
Como se ha comentado, puede calcularse para datos agrupados en intervalos, incluso
cuando alguno de ellos no est acotado.
No se ve afectada por la dispersin. De hecho, es ms representativa que la media
aritmtica cuando la poblacin es bastante heterognea. Suele darse esta circunstancia
cuando se resume la informacin sobre los salarios de un pas o una empresa. Hay unos
pocos salarios muy altos que elevan la media aritmtica haciendo que pierda
representatividad respecto al grueso de la poblacin. Sin embargo, alguien con el salario
"mediano" sabra que hay tanta gente que gana ms dinero que l, como que gana menos.
Sus principales inconvenientes son que en el caso de datos agrupados en intervalos, su
valor vara en funcin de la amplitud de estos. Por otra parte, no se presta a clculos
algebraicos tan bien como la media aritmtica.
La moda, cuando los datos estn agrupados, es un punto que divide el intervalo modal en
dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que:
Siendo
las frecuencias
1 2 3 4 5 6 7 8 9
Nmero de alumnos 2 2 4 5 8 9 3 4 2
Propiedades
Sus principales propiedades son:
Clculo sencillo.
Inconvenientes
Su valor es independiente de la mayor parte de los datos, lo que la hace muy sensible
a variaciones muestrales. Por otra parte, en variables agrupadas en intervalos, su
valor depende excesivamente del nmero de intervalos y de su amplitud.
Usa muy pocas observaciones, de tal modo que grandes variaciones en los datos
fuera de la moda, no afectan en modo alguno a su valor.
La media aritmtica es el valor obtenido por la suma de todos sus valores dividida entre el
nmero de sumadores.
nota
6,0
5,4
3,1
7,0
6,1
27,6/5=5,52
Definicin formal
Dado un conjunto numrico de datos, x1, x2, ..., xn, se define su media aritmtica como
Propiedades
Las principales propiedades de la media aritmtica son:3
Su clculo es muy sencillo y en l intervienen todos los datos.
Su valor es nico para una serie de datos dada.
Se usa con frecuencia para comparar poblaciones, aunque es ms apropiado acompaarla
de una medida de dispersin.
Se interpreta como "punto de equilibrio" o "centro de masas" del conjunto de datos, ya que
tiene la propiedad de equilibrar las desviaciones de los datos respecto de su propio valor:
Minimiza las desviaciones cuadrticas de los datos respecto de cualquier valor prefijado,
es mnimo cuando
. Este resultado se
conoce como Teorema de Knig. Esta propiedad permite interpretar uno de los parmetros
de dispersin ms importantes: la varianza.
, donde
Inconvenientes de su uso
Este parmetro, aun teniendo mltiples propiedades que aconsejan su uso en situaciones
muy diversas, tiene tambin algunos inconvenientes, como son:
Para datos agrupados en intervalos (variables continuas) su valor oscila en funcin de la
cantidad y amplitud de los intervalos que se consideren.
Es una medida a cuyo significado afecta sobremanera la dispersin, de modo que cuanto
menos homogneos sean los datos, menos informacin proporciona. Dicho de otro modo,
poblaciones muy distintas en su composicin pueden tener la misma media. 4 Por ejemplo,
un equipo de baloncesto con cinco jugadores de igual estatura, 1,95 m, evidentemente,
tendra una estatura media de 1,95 m, valor que representa fielmente a esta poblacin
homognea. Sin embargo, un equipo de jugadores de estaturas ms heterogneas, 2,20
m, 2,15 m, 1,95 m, 1,75 m y 1,70 m, por ejemplo, tendra tambin, como puede
comprobarse, una estatura media de 1,95 m, valor que no representa a casi ninguno de
sus componentes.
En el clculo de la media no todos los valores contribuyen de la misma manera. Los
valores altos tienen ms peso que los valores cercanos a cero. Por ejemplo, en el clculo
del salario medio de un empresa, el salario de un alto directivo que gane 1.000.000
de tiene tanto peso como el de diez empleados "normales" que ganen 1.000 . En otras
palabras, se ve muy afectada por valores extremos.
No se puede determinar si en una distribucin de frecuencias hay intervalos de clase
abiertos.