Conceptos-Estadistica-Parcial-2 EAJA - 1°B

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 7

Unidad 2.

Representación numérica y gráfica de datos

Conceptos: CAPITULO 2
Censos:
Es una técnica de recolección de datos que se aplica a la totalidad de los elementos que
componen la población o universo que se estudia. Un censo debe cumplir dos
condiciones: Universalidad: esto es, se debe tomar en cuenta a todos los elementos de la
población.
Simultaneidad: debe realizarse dentro de un periodo de tiempo limitado.
Encuesta:
Esta técnica se utiliza para recolectar información de una muestra de la población.
Consiste en presentar un conjunto de preguntas abiertas (preguntas que no tienen
respuestaspredeterminadas) o cerradas (preguntas que cuentan con una serie de
respuestas establecidas).
Experimento:

Otra de las técnicas más recurridas en estadística para recolectar información es


losexperimentos, veamos en qué consisten.
Un experimento es una prueba que se realiza para determinar las características
ocomportamientos de una cosa. Por ejemplo, experimentar mediante el sentido del gusto,
qué alimentos nos parecen más salados.
Un experimento, también se define como el proceso que se realiza para verificar una serie
de hipótesis relacionadas con un determinado fenómeno, en el cual se determinan las
características o comportamientos del fenómeno que se analiza. Por ejemplo, un
experimento para determinar la velocidad de la luz en el vacío; donde se está
determinando la velocidad de la luz.
2.1. Organización de datos y distribución de frecuencias
La descripción estadística organiza los datos y los presenta en forma de tablas y gráficas.
Esta área sólo describe, resume, organiza y representa los datos obtenidos de
unapoblación o muestra de dicha población, sin elaborar inferencias ni obtener
conclusiones.
La organización de datos se realiza a través de tablas que se utilizan para simplificar
lapresentación y distribución de estos datos. A continuación, veremos que
existendiferentes tipos de presentación de datos y con base en ellos distintas
clasificaciones defrecuencia, como: frecuencia relativa, frecuencia acumulada y frecuencia
absoluta.
2.1.1. Frecuencias
Dentro de los conceptos básicos para la organización de datos están los que conciernen a
la frecuencia:

• Frecuencia: es el número de veces que se repite un dato, también se le conoce


como frecuencia absoluta.

• Frecuencia acumulada: es la suma de las frecuencias absolutas de las variables


hasta el renglón i. También es conocida como frecuencia absoluta acumulada.

• Frecuencia relativa: es el resultado de dividir la frecuencia entre el número total


de datos (N). Este dato también puede verse como un porcentaje.

• Frecuencia relativa acumulada: es la suma de las frecuencias relativas hasta el


renglón i.

Podemos encontrar las frecuencias organizadas en tablas que estudiaremos más


adelante. Por ahora veamos cómo se representan los tipos de frecuencia que
vimos anteriormente, supongamos que tenemos la siguiente distribución de datos:
18, 41, 23, 47,18, 23, 23, 41, 41, 47, 47, 52, 23, 47, 23, 47, 18, 47, 7, 23, 18, 47, 52,
41, 52, 18, 23, 52, 7, 18, 52, 23.
2.1.2. Intervalos
Intervalo o rango: Conjunto de números comprendidos entre otros dos números dados, conocidos
estos últimos como límites del intervalo.

Intervalo de clase: En estadística, se llama intervalo de clase a la expresión que nombra un


intervalo.

Amplitud del intervalo: Es la diferencia del límite superior menos el límite inferior (Ls -Li).

Fronteras de clase: Son los puntos medios entre los límites de intervalos consecutivos. Las
fronteras de clase se utilizan para recuperar los datos entre el límite superior de un intervalo y el
límite inferior del siguiente

• Marca de clase: Es el punto medio del intervalo y es el resultado de la suma de los límites
inferior y superior del intervalo dividido entre 2. A la marca de clase también se le
denomina punto medio de clase.

• Ejemplo de intervalos
Veamos cómo se representan los conceptos relacionados con los intervalos.Dados los
números 15 y 25, tendríamos que:
El intervalo corresponde a todos los números que se encuentran entre el 15 y el 25. El
intervalo de clase sería: 15-25

Los límites del intervalo son:


Límite inferior = 15
Límite superior = 25

La amplitud del intervalo 15-25 sería: 25 menos 15, es decir 10. Es


recomendable que todos los intervalos tengan la misma amplitud. Para ello podemos restar el
dato menor del dato mayor y dividir este resultado entre el número de intervalos que se deseen.

La frontera de clase: si tomamos los intervalos 4-14, 15-25 y 26-36, las fronteras de clase serían:
3.5 y 14.5, para el primer intervalo, 14.5 y 25.5 para el segundo intervalo, por último, 25.5 y 36.5
para el tercer intervalo.

La frontera de clase no debe coincidir con los datos límites del intervalo, porque sería complicado
identificar el intervalo al que pertenece dicho dato.
Ejemplo: Con en base las fronteras dadas se construyen los nuevos intervalos 3.5-14.5, 14.5-25.5 y
25.5-36.5. Si se tiene el dato 25.5 no se sabría si ponerlo en el segundo o en el tercer intervalo.
Si esta coincidencia sucede deberá moverse el intervalo. Siguiendo con el
ejemplo, moviéndolo un punto a la izquierda tendríamos los intervalos 2.5-13.5, 13.5-24.5 y 24.5-
35.5.
La marca de clase del intervalo 15-25 es igual a:
Es recomendable que la marca del intervalo coincida con alguno de los datos. Esto no es necesario
y no siempre se logra, sobre todo cuando los intervalos tienen la misma amplitud.

2.1.3. Construcción de intervalos de clase


La formación de clases o intervalos de clase, que se representa con (k), dependen,
generalmente, del tamaño del rango de la población o muestra. Lo que se debe hacer para
determinar los intervalos de clase es lo siguiente:

1. Calcular el rango:
Para esto, se identifica el número mayor (Xn) y el número menor (X1) en los datos. El rango es el
resultado de la resta, esto es:

R= Xn-X1
Por ejemplo:
Si en una serie de datos que van desde el 18 hasta el 56, tendríamos lo siguiente:
Xn= 56 y X1= 18, por lo tanto:
R= Xn-X1= 56 18= 38

2. Determinar el número de intervalos que se desea tener:


No existe una regla para determinar el número de intervalos, pero generalmente se suelen crear
entre 5 y 20 intervalos. La decisión la toma el investigador.

Siguiendo con nuestro ejemplo, diríamos que vamos a construir 7 intervalos.


Entonces decimos que K=7.

3. Dividir el rango entre el número de intervalos que se desea tener:


Recordemos que lo recomendable es elegir un número entre 5 y 20 para los intervalos.
Dividimos entre uno menos de los intervalos deseados porque con el número de datos se acumula
un intervalo más.

Siguiendo con el ejemplo, deseo 7, entonces:

Esta será la amplitud de los intervalos. Cuando no es un número entero, se escoge el entero más
cercano, como en este caso, tomamos el rango igual a 5.

Cuando la cantidad de datos es tal que no alcanza para acumular un intervalo más, entonces se
divide entre el número de intervalos que se quieren.
4. Se forman los intervalos:

Los intervalos se forman comenzando un número antes del primer dato:

2.1.4. Tablas de datos


Existen diferentes tipos de tablas para presentar los datos, las más utilizadas son: Tabla de datos,
Tabla de frecuencias, Tabla por intervalos de clase y Tablas de doble entrada.

Veamos en qué consiste cada una:

Una tabla de datos es la forma más sencilla de organizar un conjunto de datos y se utiliza cuando
la información que necesitamos son los datos mismos. Se organizan en columnas o renglones y se
registran las mediciones o datos obtenidos.

2.1.5 Tablas de frecuencias


Esta nos aporta mayor información pues está formada por categorías de la variable que se esté
midiendo y su frecuencia (es decir, el número de ocurrencias de un valor dado).

2.1.6. Tablas por intervalos de clase


En este tipo de tablas los datos son presentados por intervalos de clase y no por los valores
correspondientes a cada variable.

2.2.1. Histograma
Histograma es la representación gráfica de una variable continua. Se elabora en un sistema de
coordenadas rectangulares.

DISTRIBUCIONES
DE FRECUENCIAS
Conceptos
DATOS EN BRUTO
Los datos en bruto son los datos recolectados que aún no se han organizado. Por ejemplo,
las estaturas de 100 estudiantes tomados de la lista alfabética de una universidad.
ORDENACIONES
Ordenación se le llama a los datos numéricos en bruto dispuestos en orden creciente o
decreciente de magnitud. A ladiferencia entre el número mayor y el número menor se le
conoce como el rango de los datos. Por ejemplo, si la estatura mayor en los
100estudiantes es 74 pulgadas (in) y la menor es 60 in, el rango es 74 − 60 = 14 pulgadas
(in).
DISTRIBUCIONES DE FRECUENCIA
Al organizar una gran cantidad de datos en bruto, suele resultar útil distribuirlos en clases
o categorías y determinarla cantidad de datos que pertenece a cada clase; esta cantidad
se conoce como la frecuencia de clase. A la disposicióntabular de los datos en clases con
sus respectivas frecuencias de clase se le conoce como distribución de frecuenciaso tabla
de frecuencias. La tabla 2.1 es una distribución de frecuencias de las estaturas (registradas
a la pulgada máscercana) de 100 estudiantes de la universidad XYZ.

INTERVALOS DE CLASE Y LÍMITES DE CLASE


Al símbolo que representa una clase, como 60-62 en la tabla 2.1, se le conoce
comointervalo de clase. A los númerosde los extremos, 60 y 62, se les conoce como límites
declase; el número menor (60) es el límite inferior de clase, y elnúmero mayor (62) es el
límite superior de clase. Los términos clase e intervalo de clase se suelen usar
indistintamente, aunque el intervalo de clase en realidad es un símbolo para la clase.
Un intervalo de clase que, por lo menos teóricamente, no tenga indicado el límite de clase
superior o el límite declase inferior, se conoce como intervalo de clase abierto. Por
ejemplo, al considerar grupos de edades de personas, unintervalo que sea “65 años o
mayores” es un intervalo de clase abierto

FRONTERAS DE CLASE
Si las estaturas se registran a la pulgada más cercana, el intervalo de clase 60-62
comprende teóricamente todas lasmediciones desde 59.5000 hasta 62.5000 in. Estos
números que se indican brevemente mediante los números exactos59.5 y 62.5 son las
fronteras de clase o los límites de clase reales; el menor de los números (59.5) es la
frontera inferior de clase y el número mayor (62.5) es la frontera superior de clase.
En la práctica, las fronteras de clase se obtienen sumando el límite superior de un
intervalo de clase al límite inferior del intervalo de clase inmediato superior y dividiendo
entre 2.

TAMAÑO O AMPLITUD DE UN INTERVALO DE CLASE


El tamaño, o la amplitud, de un intervalo de clase es la diferencia entre sus fronteras
superior e inferior y se le conocetambién como amplitud de clase, tamaño de clase o
longitud de clase.
LA MARCA DE CLASE
La marca de clase es el punto medio del intervalo de clase y se obtiene sumando los
límites de clase inferior y superiory dividiendo entre 2. Así, la marca de clase del intervalo
60-62 es (60 + 62)/2 = 61. A la marca de clase también sele conoce como punto medio de
clase.

HISTOGRAMAS Y POLÍGONOS DE FRECUENCIAS


Los histogramas y los polígonos de frecuencias son dos representaciones gráficas de las
distribuciones de frecuencias.
1. Un histograma o histograma de frecuencias consiste en un conjunto de rectángulos que
tienen: a) sus bases sobreun eje horizontal (el eje X ), con sus centros coincidiendo con
lasmarcas de clase de longitudes iguales a la amplitud del intervalo de clase, y b)
áreasproporcionales a las frecuencias de clase.
2. Un polígono de frecuencias es una gráfica de línea que presenta las frecuencias de clase
graficadas contra las marcas de clase. Se puede obtener conectando los puntos medios
delas partes superiores de los rectángulos de unhistograma.

DISTRIBUCIONES DE FRECUENCIAS ACUMULADAS Y OJIVAS


A la suma de todas las frecuencias menores que la frontera superior de un intervalo de
clase dado se le llama frecuencia acumulada hasta ese intervalo de clase inclusive.

DISTRIBUCIONES DE FRECUENCIAS ACUMULADAS


RELATIVAS Y OJIVAS PORCENTUALES
La frecuencia acumulada relativa o frecuencia acumulada porcentual es la frecuencia
acumulada dividida entre lasuma de todas las frecuencias (frecuencia total).

También podría gustarte