Estadistica Descriptiva

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 34

Se denomina estadística descriptiva a las cantidades matemáticos (tales como la

media, mediana, desviación estándar) que resumen e interpretan algunas de las


propiedades de un conjunto de datos (muestra), pero que no miden las propiedades
de la población de la que se extrajo la muestra (ocupándose de este extremo
la estadística inferencial).

Las estadísticas descriptivas son coeficientes descriptivos que permiten mostrar


información resumida de un conjunto de datos, que puede ser una representación
de toda la población o una muestra de ella. La estadística descriptiva se
descompone en las medidas de tendencia central y medidas de variabilidad, o
dispersión. Medidas de tendencia central incluyen la media, la mediana y la moda,
mientras que las medidas de la variabilidad incluyen la desviación estándar o la
varianza, el mínimo y el máximo de la variable, y la curtosis y asimetría.
Traducción al inglés de Estadística descriptiva: Descriptive
statistics

Traducción al francés de Estadística descriptiva: Statistique


descriptive

Traducción al alemán de Estadística descriptiva: Deskriptive


Statistik

Compartir

Siguientes definiciones
Estadística inferencial. La estadistica inferencial es el proceso de sacar
conclusiones de datos que estan sujetos a variacion aleatoria...
Estado del bienestar. El estado del bienestar es un sistema politico basado en la
premisa de que el gobierno tiene la responsabilidad de prove...
Estanflación. Situacion economica de estancamiento economico e inflacion
elevada...
Estrategia Comercial. Plan global de comercializacion de un producto o linea de
productos...
Estrategia Competitiva. Plan de accion a largo plazo que esta ideado para ayudar
a una empresa a obtener una ventaja competitiva sobre sus rival...
Estrategia de Marketing. Estrategia global de todo lo relacionado con la imagen
de una empresa y la comercializaciond e sus productos y servicios...

Últimas incorporaciones
Apreciación de la moneda. La apreciacion de una divisa consiste en el aumento
del su valor respecto de otra u otras divisas...
Reaseguro. Reparto por parte de una aseguradora de los riesgos adquiridos con
otras companias a cambio de compartir la prima con el...
Pasivos a largo plazo. Son pasivos a largo plazo las deudas de una empresa que
debe pagar en mas de un año...
Convertibilidad. La convertibilidad es la capacidad que permite al dinero u otros
instrumentos financieros transformarse en otras reservas líquidas de valor...
Exenciones tributarias. La exención de tributos o impuestos consiste en la
exoneración a personas físicas o jurídicas, de los tributos que deberían de pagar si
una determinada transacción o ingreso no dispusiese de esa exenció...
Bienes de consumo. Bienes destinaddos a ser adquiridos por los clientes finales...

DATOS ORDENADOS Y NO ORENADOS

1. DESCRIPCIÓN DE DATOSDatos agrupados y no agrupados.Los datos agrupados son


aquellos datos que pertenecen a un tamaño demuestra mayor a 20 o más elementos,
por lo que para ser analizadosrequieren ser agrupados en clases a partir de ciertas
características. - Su objetivo es resumir la información. - Comúnmente, pertenecen a
una muestra mayor a 20 elementos, por lo cual requieren ser agrupados, esto implica:
ordenar, clasificar y expresar los en una tabla de frecuencias. - Se agrupan los datos,
esto quiere decir que se pueden clasificar de forma coherente y lógica mediante una
tabla de frecuencias. - La agrupación de los datos puede ser simple o mediante
intervalos de clase.Ejemplo:De los empleados de una pizzería se clasifican sus
edades para determinar el rango deedades que tiene mayor número de
empleados.Rango de edades No. De empleados18 – 21 922 – 25 1226 – 30 5De tipo
de moneda que se recibe en mayor cantidad en un banco para determinar cualtiene
mayor circulación.Rango de moneda Cantidad$0.05 – $10.00 $ 156,437.25$20.00 –
$100.00 $ 878,920.00$200.00 –$1000.00 $ 1, 100,200.00Derivado de lo anterior los
datos no agrupados son aquellos datos cuya quepertenecen a una muestra menor a
20 elementos, por lo que para seranalizados, no requieren ser agrupados. - los datos
tal como se recabaron, en bruto (es decir, no se presentan clasificados) - no es
necesario clasificar ni generar una tabla de frecuencias, ya que no tiene “mucho
sentido”. - Muestra menor a 20 Elementos. Aunque contemos con menos de 20
elementos, debe de verificarse que los datos no sean significativos, esto es que la
información no sea “repetitiva”, de esta forma, sabremos que no se podrá clasificar y
por lo tanto se puede presentar la información en una tabla de frecuencias.
2. 2. En caso de que una vez que hayamos ordenado los elementos, se cuente con
datossignificativos. Procedemos a clasificarlos (si es posible, ya que también debemos
debuscar la lógica al clasificar los elementos) para convertirlos en “datos
agrupados”.Ejemplo:Vamos a investigar la edad de los empleados de una pizzería, de
un total de 20empleados (esto es, se enfilan los empleados y proporcionan su edad y
asi como danla edad asi se
registra)19,20,22,24,22,18,20,21,23,22,26,27,22,28,26,19,18,20,24,21De tipo de
moneda que se recibe en mayor cantidad en un banco para determinar cualtiene
mayor circulación.$0.05, $0.50, $1.00, $2.00, $5.00 $10.00, $20.00, $50.00, $100.00,
$200.00,$500.00 y $1000.00 de un total de $2, 355, 557.25Estos son datos no
agrupados porque no se han clasificado. Los datos no agrupadostambién se pueden
ordenar, edad menor a la mayor, no están contabilizados niclasificados.SE PUEDE
CONSULTAR LA SIGUIENTE BIBLIOGRAFÍA."Estadistica", Murray R. SpiguelEditorial
schaum. Segunda edición“Estadística aplicada” SOTY, NORBERTO Guarin
SalazarESTADISTICA PASO A PASO, Howard B. Christense.

QUE ES UNA TABLA DE DISTRIBUCIÓN DE


FRECUENCIA?

Distribución de frecuencias
Ir a la navegaciónIr a la búsqueda
Este artículo tiene referencias, pero necesita más para complementar
su verificabilidad.
Puedes colaborar agregando referencias a fuentes fiables como se indica aquí. El material sin
fuentes fiables podría ser cuestionado y eliminado.
Este aviso fue puesto el 17 de febrero de 2018.
En estadística, se le llama distribución de frecuencias a la agrupación de datos en
categorías mutuamente excluyentes que indican el número de observaciones en cada
categoría.1 Esto proporciona un valor añadido a la agrupación de datos. La distribución de
frecuencias presenta las observaciones clasificadas de modo que se pueda ver el número
existente en cada clase.

Índice

 1Tipos de frecuencias
o 1.1Frecuencia absoluta
o 1.2Frecuencia relativa
o 1.3Frecuencia acumulada
o 1.4Frecuencia relativa acumulada
o 1.5Distribución de frecuencias agrupadas
 2Referencias

Tipos de frecuencias[editar]
Frecuencia absoluta[editar]
La frecuencia absoluta es el número de veces que aparece un determinado valor estadístico.
Se representa por fila. Se suele representar con "n_i".
Frecuencia relativa[editar]
La frecuencia relativa es igual al números de veces que se repite un evento o sea la
frecuencia multiplicado por el 100% y dividida entre el total de la frecuencia.
Ejemplo:
Frecuencia* % = % Total de frecuencia 15* 100% = 1,500 = 60%
Es el total de la frecuencia relativa del 100% o 99% dependiendo de los decimales que uses,
si no te da tu ejercicio tiene algún error.
Frecuencia acumulada[editar]
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores
inferiores o iguales al valor considerado.
La frecuencia acumulada es la frecuencia estadística F(XXr) con que el valor de una variable
aleatoria (X) es menor que o igual a un valor de referencia (Xr).
La frecuencia acumulada relativa se deja escribir como Fc(X≤Xr), o en breve(Xr), y se calcula
de:

Fc (Hr) = HXr / N

donde MXr es el número de datos X con un valor menor que o igual a Xr, y N es número total
de los datos. En breve se escribe:

Fc = M / N
Cuando Xr=Xmin, donde Xmin es el valor mínimo observado, se ve que Fc=1/N, porque M=1.
Por otro lado, cuando Xr=Xmax, donde Xmax es el valor máximo observado, se ve que Fc=1,
porque M=N.
En porcentaje la ecuación es:

Fc(%) = 100 M / N

Frecuencia relativa acumulada[editar]


La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un
determinado valor y el número total de datos. Se puede expresar en tantos por ciento.
Ejemplo:
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas
máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 44
Distribución de frecuencias agrupadas[editar]
La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las
variables toman un número grande de valores o la variable es continua. Se agrupan los
valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le
asigna su frecuencia correspondiente. Límites de la clase. Cada clase está delimitada por el
límite inferior de la clase y el límite superior de la clase.
La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase. La marca
de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo
para el cálculo de algunos parámetros. En caso de que el primer intervalo sea de la forma (-
∞,k], o bien [k,+∞) donde k es un número cualquiera, en el caso de (-∞,k], para calcular la
marca de clase se tomará la amplitud del intervalo adyacente a el (ai+1), y la marca de clase
será ((k-ai+1) +k)/2. En el caso del intervalo [k,+∞) también se tomará la amplitud del intervalo
adyacente a el (ai-1) siendo la marca de clase ((k+ai-1)+k)/2.
Construcción de una tabla de datos agrupados:
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22,
27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.

1. Se localizan los valores menor y mayor de la distribución. En este caso son 3 y 48.
2. Se restan y se busca un número entero un poco mayor que la diferencia y que sea
divisible por el número de intervalos que queramos establecer.
Es conveniente que el número de intervalos oscile entre 6 y 15.
En este caso, 48 - 3 = 45, incrementamos el número hasta 50 : 5 = 10 intervalos.
Se forman los intervalos teniendo presente que el límite inferior de una clase pertenece al
intervalo, pero el límite superior no pertenece al intervalo, se cuenta en el siguiente intervalo.

Intervalo xi ni Ni fi Fi

[0, 5) 2.5 1 1 0.025 0.025


[5, 10) 7.5 1 2 0.025 0.050

[10, 15) 12.5 3 5 0.075 0.125

[15, 20) 17.5 3 8 0.075 0.200

[20, 25) 22.5 3 11 0.075 0.275

[25, 30) 27.5 6 17 0.150 0.425

[30, 35) 32.5 7 24 0.175 0.600

[35, 40) 37.5 10 34 0.250 0.850

[40, 45) 42.5 4 38 0.100 0.950

[45, 50) 47.5 2 40 0.050 1

Total: 40 1

Referencias[editar]
1. ↑ Alvarado Valencia, Jorge Andrés; Juan José Obagi Araújo, (2008). Fundamentos de
inferencia estadística, Ed. Universidad oseeaa Javeriana de Bogotá, pág. 19.
1- Media aritmética
La media aritmética es la suma de todos los datos dividida entre el número total de
datos. Se calculan dependiendo de cómo vengan ordenados los datos.

Ejemplo

¿Cuál es la media de las edades de Andrea y sus primos?

Así, la media de las edades de Andrea y sus amigos:

Media =3+5+6+8+9+9+97=497=7

La media de edad es de 7 años.

La media aritmética de un grupo de datos se calcula así: Se debe multiplicar cada


dato con su respectiva frecuencia, sumar todos estos productos, y el resultado
dividirlo por la suma de los datos.

Ejemplo

Se ha anotado el número de hermanos que tiene un grupo de amigos. Los datos


obtenidos son los siguientes:

Hermanos: 1, 1, 1, 1, 2, 2, 2, 3, 3, 4

Si hacemos el recuento de los datos y seguimos los pasos anteriormente descritos,


tenemos:
Nº de hermanos 1 2 3 4

Nº de veces 4 3 2 1

1º) 1·4+2·3+3·2+4·1= 202º) Nº de datos: 4+3+2+1=10 ⇒20÷10=2La media de los dato


s es 2.

2- Moda
La moda de un conjunto de datos es el dato que más veces se repite, es decir, aquel
que tiene mayor frecuencia absoluta. Se denota por Mo. En caso de existir dos
valores de la variable que tengan la mayor frecuencia absoluta, habría dos modas. Si
no se repite ningún valor, no existe moda.

Ejemplo

¿Cuál es el dato que más se repite en el ejemplo anterior?


El dato que más se repite es el 1, es el que tiene mayor frecuencia absoluta (4
veces).

La moda del número de hermanos es 1

Ejemplo
2, 3, 4, 5 , 6 , 9

En este conjunto de datos no existe ningún valor que se repita, por lo tanto, este
conjunto de valores no tiene moda.

Ejemplo

1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9

Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa


frecuencia es la máxima, la distribución es bimodal o multimodal, es decir, tiene
varias modas.

Ejemplo

0, 1, 3, 3, 5, 5, 7, 8 Mo = 4

Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el


promedio de las dos puntuaciones adyacentes.

3- La mediana
La mediana es el valor que ocupa el lugar central entre todos los valores del conjunto
de datos, cuando estos están ordenados en forma creciente o decreciente.

La mediana se representa por Me.

Calculo de la mediana:

1° Ordenamos los datos de menor a mayor.


- La mediana de un conjunto con un número impar de datos es, una vez ordenados
los datos, el dato que ocupa el lugar central.

Ejemplo

Calcular la mediana del conjunto de datos:


- También podemos usar la siguiente fórmula para determinar la posición del dato
central:

(n + 1) /2 = mediana datos impares.


- La mediana de un conjunto con un número par de datos es, una vez ordenados, la
media de los dos datos centrales.

Ejemplo

Calcular la mediana del conjunto de datos:


Ejemplo

En las tablas se muestran las notas obtenidas por dos séptimos básicos. Las
muestras corresponde a la cantidad de perfumes que se vendieron en 2 tiendas
seleccionadas al azar.

Cantidad de perfumes vendidos en una semana en la tienda A

Lun Mar Mie Jue Vie Sáb Dgo

13 26 18 21 24 33 30

Cantidad de perfumes vendidos en una semana en la tienda B

Lun Mar Mie Jue Vie Sáb Dgo

20 19 24 21 36 60 42

Al ordenar los datos de manera creciente se obtiene:

Tienda A = 13 – 18 – 21 – 24 – 26 – 30 – 33
Valor mínimo: 13
Valor máximo: 33
Rango: 33 – 13 = 20
Mediana: 24

Tienda B = 19 – 20 – 21 – 24 – 36 – 42 – 60
Valor mínimo: 19
Valor máximo: 60
Rango: 60 – 19 = 41
Mediana: 24
En la tienda B, el rango es un valor más grande, lo que indica que hay una mayor
dispersión o diferencia entre el valor mínimo y máximo.

Como puedes observar, a pesar que las variaciones entre ambas muestras son
variadas la mediana es la misma.

4- Rango
El rango da la idea de proximidad de los datos a la media. Se calcula restando el dato
menor al dato mayor.
Este dato permite obtener una idea de la dispersión de los datos, cuanto mayor es
el rango, más dispersos están los datos de un conjunto.

Ejemplo

Se preguntó a 9 familias cuántas bicicletas tenían en total, dieron las respuestas


ordenadas en la siguiente tabla:

Nº de bicicletas 0 1 2 3

Frecuencua absoluta 1 5 2 1

- ¿Cómo hallarías el rango?

Se resta el dato mayor al dato menor: 3 - 0 = 3; Por lo tanto el rango sería 3 en este
caso.

Si el conjunto de datos que se recolecta es muy numeroso, o bien, si el rango es muy


amplio, es conveniente agruparlos y ordenarlos en intervalos o clases.

La amplitud o tamaño de cada intervalo se puede calcular dividiendo el valor del


rango por la cantidad de intervalos que se desean obtener.
5- Determinar las medidas de tendencia central en gráficos
En el gráfico se representa la cantidad de horas diarias que trabaja un grupo de
personas escogidas al azar.

A- Media aritmética
Para calcular la media aritmética a partir de un gráfico, primero multiplicas la
frecuencia absoluta por el valor de cada dato:

6 · 5 = 30
8 · 6 = 48
12 · 7 = 84
16 · 8 = 128
12 · 9 = 108

Luego, sumas los valores y los divides por la cantidad total de datos.

30 +48 + 84 + 128 + 108 54 = 39854 = 7,37 ≈ 7,4


B. Mediana
La mediana es un valor central, por lo tanto, se divide el total de datos por 2 y se
busca la categoría o barra que represente dicha cantidad.

Para saber la cantidad total de datos puedes sumar los valores de la frecuencia
absoluta por cada categoría:

6 + 8 + 12 + 16 + 12 = 54

Entonces, 54 : 2 = 27

El dato número 27 se encuentra en la categoría de 7 horas de trabajo, por esta razón,


la mediana es 7.
C. Moda
La moda en un gráfico es el dato con mayor frecuencia absoluta, en este caso es 8,
ya que tiene una frecuencia de 16.

6- ¿Cómo realizar inferencias a partir de un grupo de


datos?
En las tablas se muestran las edades de 10 personas que asisten a un taller de
guitarra y 10 que asisten al taller de danza.

Edades de personas que asisten al taller de guitarra


25 18 23 25 19

32 45 34 28 21

Edades de personas que asisten al taller de danza

29 28 33 27 20

35 40 34 38 51

A partir de las muestras anteriores se pueden determinar las medidas de tendencia


central:

1- Edades de personas que asisten al taller de guitarra.

Media aritmética: se suman todos los datos y se divide por la cantidad de datos, en
este caso por 10.

25 + 18 + 23 + 25 + 19 + 32 + 45 + 34 + 28 + 21 10 = 2701027010= 27

Moda: Se escoge el dato que más se repite en este caso, 25 años se repite 2 veces.

Mediana: Se registran los datos de manera creciente y como 10 es un número par se


promedian los dos datos intermedios.

18 – 19 – 21– 23 – 25 – 25 – 28 – 32 – 34 – 45
Mediana: 25

Rango: 45 – 18 = 27

2- Edades de personas que asisten al taller de danza.

Edades de personas que asisten al taller de danza


29 28 33 27 18

32 40 34 38 51

Media aritmética:

29 + 28 + 33 + 27 + 18 + 32 + 40 + 34 + 38 + 51 10 = 3301033010= 33

Moda: No hay moda.

Mediana: 18 – 27 – 28 - 29 – 32 – 33 – 34 – 38 – 40 – 51

32 + 332 = 652 = 32,5 ≈ 33

Rango: 51 – 18 = 33

A partir de los datos obtenidos se pueden realizar las siguientes inferencias:

 La media aritmética de la muestra del taller de guitarra es 27 años, por lo


tanto, se infiere que la mayoría de las personas que asisten al taller deben
tener sobre 20.
 La mediana de la muestra del taller de danza es 33, se puede decir que al
taller de danza va gente con mayor edad que en el taller de guitarra.
 Como la mediana de la muestra del taller de danza es 33, se puede decir que
las personas que tienen menos de 20 años son pocas.
 El rango de edad de los asistentes del taller de danza es mayor que los del
taller de guitarra.
 La mediana de los asistentes del taller de guitarra es menor que los de taller de
danza.

En esta situación es recomendable hacer inferencias con la mediana y media


aritmética, ya que la moda no es representativa en ambos casos.

Por su parte, el rango permite conocer la diferencia de edades en los dos talleres y en
cuál de los dos grupos se presenta una mayor distribución.

7- Ejercicios
1- Se le pregunta a un grupo de personas acerca de la cantidad de libros que leyó
durante el año 2015, y las respuestas son: 4; 3; 2; 7; 10; 8; 2; 9; 3; 6; 8; 1; 1; 9; 2. La
moda de la muestra es:

a) 2 b) 3 c) 4 d) 5 e) 9

2- Halla la mediana de las siguientes series estadísticas.

a) 1, 7, 3, 2, 4, 6, 2, 5, 6

b) 4, 2, 1, 3, 8, 5, 3, 1, 6, 7

3- Se tienen dos distribuciones cuyos datos son los siguientes:

Distribución A: 9, 5, 3, 2, 1, 2, 6, 4, 9, 8, 1, 3, 5, 4, 2, 6, 3, 2, 5, 6, 7

Distribución B: 1, 1, 3, 2, 5, 6, 7, 2, 5, 4, 3, 1, 2, 1, 5, 7, 8, 9, 9, 2, 1

a) Halla el rango de ambas distribuciones.

4- Se tiene el siguiente conjunto de datos:


10, 13, 4, 7, 8, 11, 10, 16, 18, 12, 3, 6, 9, 9, 4, 13, 20, 7, 5, 10, 17, 10, 16, 14, 8, 18

a) Obtén la mediana

Respuestas:
1- a

2- a) 1, 2, 2, 3, 4, 5, 6, 6, 7 M=4
b) 1, 1, 2, 3, 3, 4, 5, 6, 7, 8; La mediana es la media aritmética de los dos valores
centrales, M = 3,5.

3- Rango de A: 9 - 1 = 8
Rango de B: 9 - 1 = 8

4- a) Ordenamos los datos de menor a mayor:

3, 4, 4, 5, 6, 7, 7, 8, 8, 9, 9, 10, 10, 10, 10, 11, 12, 13, 13, 14, 16, 16, 17, 18, 18, 20

Como hay 26 valores, la mediana es la media de los dos valores centrales: M= 10 +


10 / 2 = 10

Qué es un histograma o diagrama de barras?

Histograma
Ir a la navegaciónIr a la búsqueda
Histograma

En estadística, un histograma es una representación gráfica de una variable en forma de


barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores
representados. Sirven para obtener una "primera vista" general, o panorama, de la distribución
de la población, o de la muestra, respecto a una característica, cuantitativa y continua (como
la longitud o el peso). De esta manera ofrece una visión de grupo permitiendo observar una
preferencia, o tendencia, por parte de la muestra o población por ubicarse hacia una
determinada región de valores dentro del espectro de valores posibles (sean infinitos o no)
que pueda adquirir la característica. Así pues, podemos evidenciar comportamientos, observar
el grado de homogeneidad, acuerdo o concisión entre los valores de todas las partes que
componen la población o la muestra, o, en contraposición, poder observar el grado de
variabilidad, y por ende, la dispersión de todos los valores que toman las partes, también es
posible no evidenciar ninguna tendencia y obtener que cada miembro de la población toma por
su lado y adquiere un valor de la característica aleatoriamente sin mostrar ninguna preferencia
o tendencia, entre otras cosas.
En el eje vertical se representan las frecuencias, es decir, la cantidad de población o la muestra, según
sea el caso, que se ubica en un determinado valor o subrango de valores de la característica que toma
la característica de interés. Evidentemente, cuando este espectro de valores es infinito o muy grande, se
reduce a solo una parte que muestre la tendencia o comportamiento de la población. En otras
ocasiones, este espectro es extendido para mostrar el alejamiento o ubicación de la población o la
muestra analizada respecto de un valor de interés.

Se utilizan para relacionar variables cuantitativas continuas. Para variables cuantitativas


discretas las barras se dibujan separadas y el gráfico se llama diagrama de frecuencias,
porque la variable representada en el eje horizontal ya no representa un espectro continuo de
valores, sino valores cuantitativos específicos, igual que ocurre en un diagrama de barras,
usado para representar una característica cualitativa o categórica. Su utilidad se hace más
evidente cuando se cuenta con un gran número de datos cuantitativos y que se han agrupado
en intervalos de clase. Ejemplos de su uso es la representación de edades o estaturas de una
población. Por comodidad, sus valores se agrupan en clases, es decir, en intervalos continuos.
En los casos en los que los datos son cualitativos (no numéricos), como cierto grado de
acuerdo o nivel de estudios, es preferible un diagrama de sectores.
Los histogramas son más frecuentes en ciencias sociales, humanas y económicas que en
ciencias naturales y exactas. Y permite la comparación de los resultados de un proceso.

Índice

 1Etimología
 2Tipos de gráficos relacionados con el histograma
 3Construcción de un histograma de frecuencias
 4Ejemplos
 5Un caso especial
 6Otros tipos de representaciones gráficas
 7Vea también
 8Referencias
 9Enlaces externos

Etimología[editar]
El término "histograma" fue acuñado en 1891 por el matemático estadístico inglés Karl
Pearson y es un compuesto de los términos griegos ἱστός (‘histós’, “mástil”) y γράμμα
('gramma', "dibujo, figura")1

Tipos de gráficos relacionados con el histograma[editar]


 Histograma de frecuencias absolutas
Representa la frecuencia absoluta mediante la altura de las barras. Se usa mucho en
educación no universitaria por su sencillez, pero solo se puede aplicar cuando todos
los intervalos son iguales, ya que en ese caso las alturas y las superficies son
proporcionales. En esos niveles educativos se introduce una estadística elemental y
todavía no se puede profundizar en estos detalles.

 Histograma de frecuencias relativas


Representa la frecuencia relativa mediante la altura de las barras. Igual que en el caso
anterior se usa mucho en educación no universitaria. La elaboración del gráfico es
más complicada pues los números ya no son enteros. Como en el caso anterior solo
se puede aplicar cuando todos los intervalos son iguales, ya que en ese caso las
alturas y las superficies son proporcionales.

 Histograma
Representa la frecuencia relativa mediante la superficie de las barras. Aunque esto
sea cierto en todos los histogramas, cuando se agrupan los datos en intervalos
desiguales hay que atender a la superficie de las barras, que no se corresponderá con
la altura como ocurría en los casos anteriores. Es el que se suele usar en educación
universitaria. Para su elaboración debe introducirse el concepto de altura de
histograma, que es un concepto equivalente al de densidad de probabilidad, y que se
calcula dividiendo la frecuencia relativa de ese intervalo (o sea la superficie que
queremos darle) entre la anchura del intervalo (la base del rectángulo). Ahora las
barras tendrán siempre superficie igual a la frecuencia relativa y la suma de todas esas
superficies (de todas las barras) será 1, o sea el 100%.

 Función densidad
Representa la probabilidad mediante la superficie de las barras. Es un gráfico idéntico
al histograma pero aplicado a distribuciones teóricas. El concepto de frecuencia
relativa se cambia por el de probabilidad, pero también se representa por superficies y
la suma de todas esas superficies (de todas las barras) será 1, como en el histograma,
o sea el 100% de probabilidad.

 Curva acumulativa u ojiva


Es un gráfico acumulativo (véase Función_de_distribución) que representa la
frecuencia relativa acumulada hasta cada valor de la variable. Si el rango es finito el
primer valor del rango tiene frecuencia acumulada (anterior) cero y el último tiene
frecuencia acumulada 1 (100%). Así el eje vertical siempre toma valores de cero a uno
y representa frecuencias relativas (o probabilidades si se trata de distribuciones
teóricas). Se utiliza para introducir el concepto y el cálculo de la mediana, los cuartiles,
los deciles y en general los parámetros llamados de posición. Si el rango es infinito,
como suele ocurrir en las distribuciones teóricas (Normal, student, chi-cuadrado, etc.)
el cero puede no alcanzarse y será el valor asintótico por la izquierda, si tampoco se
alcanza el uno también será el valor asintótico derecho, y en muchos casos no se
alcanza ni uno ni otro, teniendo dos asintotas. Este gráfico es la integral del
histograma (cuando trabajamos con distribuciones reales) o de la función densidad
(cuando trabajamos con distribuciones teóricas).

 Curva acumulativa de frecuencias absolutas


Es un gráfico acumulativo que representa la frecuencia absoluta acumulada hasta
cada valor de la variable. Realmente no es un gráfico relacionado con el histograma,
pero es muy parecido a la curva acumulativa y a la función de distribución. Se usa
mucho en enseñanza no universitaria por su sencillez, ya que permite trabajar con
números enteros (frecuencias absolutas) y, como la anterior, permite introducir y
calcular mediana, cuartiles, etc. Esta curva no irá entre cero y uno sino entre cero y el
total de individuos de la muestra.

 Nota
En todos estos diagramas la muestra o la población se divide en intervalos (del
parámetro a estudiar, por ejemplo estatura) y aparece el dilema de si incluir el extremo
del intervalo (por ejemplo 180 cm) en el primer o en el segundo intervalo en los que
aparece. Tradicionalmente se incluye en el segundo y los intervalos quedan abiertos
por la derecha: [170, 180) y [180,190). Sin embargo, dependiendo del problema a
estudiar (problemas en que los extremos salen con mucha frecuencia frente a otros en
que no salen nunca) y de la costumbre, se pueden encontrar otras elecciones.

Construcción de un histograma de
frecuencias[editar]
 Paso 1
Determinar el rango de los datos. Rango es igual al mayor valor
menos el menor valor.

 Paso 2
Obtener todos los números de grupos, existen 4 criterios para
determinar el número de clases (o barras) –por ejemplo, la [[regla
de Sturges]—.

 Paso 3
Establecer la anchura de clase. Si queremos intervalos iguales
tomaremos el rango dividido por el número de clases y comparar
con los resultados obtenidos de la dispersión.

 Paso 4
Construir los intervalos de clases: Los intervalos resultan de
dividir el rango de los datos en segmentos iguales usando la
anchura de clase obtenida en el PASO 3.
 Paso 5
Graficar el histograma: Como todas las clases tienen la misma
amplitud las bases de las barras son los intervalos de clases y la
altura es la frecuencia de las clases.

Ejemplos[editar]

Fotografía con su histograma

El histograma de una imagen representa la frecuencia relativa de


los niveles de gris de la imagen. Las técnicas de modificación del
histograma de una imagen son útiles para aumentar el contraste
de imágenes con histogramas muy concentrados. Sea una
imagen de tamaño N×N, la función de distribución del histograma
es:

Un caso especial[editar]
 La Wikipedia guarda un registro de visitas de cada
artículo y esas visitas se pueden ampliar a 90 días y a
todos y cada uno de los idiomas. En estos casos se
pueden convertir los datos en un histograma donde se
indica, día a día el número de usuarios que han
consultado el artículo. Este enlace llevará a los datos
numéricos y gráficos (histograma) de esas consultas, que
nos pueden dar la información sobre un idioma en
particular o sobre todos los idiomas que tienen una
página con el mismo tema.
 En el caso del artículo Histograma, abriendo el historial
de dicho artículo, se puede consultar el número de visitas
que se han hecho día a día y veremos que existe una
característica que se destaca sobre todas las demás:
este número de visitas tiene un ritmo semanal,
correspondiendo a los días centrales de la semana el
mayor número de visitas (miércoles y jueves, por
ejemplo) y el menor número, en sábado y domingo (y
también el lunes). De esta característica se puede inferir
fácilmente que es un artículo consultado
mayoritariamente por estudiantes. Y la comparación del
artículo en distintos idiomas (el inglés y el español en
primero y segundo lugares y mucho después, el
portugués y otros) también nos relaciona con la
demografía de los países que hablan los distintos
idiomas. Por ejemplo, en el caso del portugués, pesa
mucho la numerosa población joven del Brasil. El enlace
es: [1], y el enlace para el mismo artículo en todos los
idiomas es: [2].

Otros tipos de representaciones


gráficas[editar]
Los histogramas se aplican a variables continuas, aquellas
en las que la variable observada (estatura, peso, edad…)
pueden tomar cualquier valor real, a veces entre dos valores
fijos que determinan su rango. Otros gráficos similares al
histograma son los diagramas de barras, que se suelen
aplicar a variables discretas y a las cualitativas. A diferencia
de las variables continuas aquí los valores intermedios entre
dos barras consecutivas no tienen sentido (un dado puede
salir 1, 2, 3, 4, 5 o 6, pero no 3,7 ni 5/3) o no pueden
observarse (si estudiamos documentos que solo registran
edades enteras deberemos tratarla como variable discreta),
por eso las barras se dibujan separadas. La distinción entre
discreta y continua no siempre es clara. La variable edad se
puede considerar continua pues el tiempo es una variable
continua, pero frecuentemente se considera como un número
entero (la administración no suele considerar edades
fraccionarias) y entonces es una variable discreta. Los
gráficos estadísticos presentarán el mismo problema, y los
mismos datos se podrán representar en diagramas de barras
(separadas) si se considera una variable discreta o en
histograma (barras unidas) si se considera continua. Incluso
la distinción entre cualitativa y cuantitativa puede ser
arbitraria, pues muchas cualidades se pueden representar de
forma numérica, como hacen los ordenadores. El ejemplo
más evidente es el color (ver el ejemplo anterior: histograma
de grises), variable claramente cualitativa que los
ordenadores traducen a números (por ejemplo usando el
código RGB). En las variables cuantitativas y en las
cualitativas ordinales es frecuente representar polígonos de
frecuencia en lugar de histogramas.

Vea también[editar]
 Ecualización del histograma
 Histograma de color

Referencias[editar]
1. ↑ Riaño Rufilanchas, Daniel (2017). «On the origin of Karl
Pearson’s term “histogram”». Revista Estadística
Española 192: 29-35. ISSN 2254-9390.
Qué es un polígono de frecuencia?

DEFINICIÓN DE POLÍGONO DE
FRECUENCIA
Polígono de frecuencia es el nombre que recibe una clase de
gráficoque se crea a partir de un histograma de frecuencia. Estos
histogramas emplean columnas verticales para reflejar frecuencias): el
polígono de frecuencia es realizado uniendo los puntos de mayor altura de
estas columnas.

Es decir, por tanto, podríamos establecer que un polígono de frecuencia es


aquel que se forma a partir de la unión de los distintos puntos medios de las
cimas de las columnas que configuran lo que es un histograma de frecuencia.
Este se caracteriza porque utiliza siempre lo que son columnas de tipo
vertical y porque nunca debe haber espacios entre lo que son unas y otras.

En las ciencias sociales, en las ciencias naturales y también en las


económicas es donde con más frecuencia se hace uso de estos mencionados
histogramas ya que se emplean para llevar a cabo lo que es la comparación
de los resultados de un proceso determinado.

Se conoce como polígonos de frecuencia para datos agrupados a


aquellos que se desarrollan mediante la marca de clase que tiene
coincidencia con el punto medio de las distintas columnas del histograma.
En el momento de la representación de todas las frecuencias que forman
parte de una tabla de datos agrupados, se genera el histograma
de frecuencias acumuladas que posibilita la diagramación del polígono
correspondiente.
Un polígono de frecuencia, por ejemplo, permite reflejar las temperaturas
máximas promedio de una ciudad en un determinado periodo temporal.
En el eje X (horizontal), deben indicarse los meses del año (enero, febrero,
marzo, abril, etc.). En el eje Y (vertical), en cambio, se registran las
temperaturas más altas promedio de cada mes (28º, 26º, 22º…). El polígono
de frecuencia se creará al unir, mediante un segmento, las diversas
temperaturas más elevadas promedio.
Los polígonos de frecuencia se suelen usar cuando se pretende retratar varias
distribuciones distintas o la clasificación cruzada de una variable cuantitativa
continua con una cualitativa o cuantitativa discreta en el mismo dibujo.

El punto de más altura de un polígono de frecuencia equivale a la mayor


frecuencia, mientras que el área que se sitúa debajo de la curva incluye todos
los datos que existen. Cabe recordar que la frecuencia es la repetición
mayor o menor de un evento, o el número de veces que un
acontecimiento periódico se reitera en una unidad temporal.
Dado el valor y la utilidad que tienen los citados polígonos hay que resaltar
que estos se pueden confeccionar de una manera muy sencilla y rápida. En
concreto, se da la oportunidad de acometerlos mediante un programa
informático que se ha convertido en uno de los ejes claves del
funcionamiento de cualquier empresa. Nos estamos refiriendo al software
conocido como Excel.
Este es un programa, de Microsoft Office, que se confeccionó con el claro
objetivo de que sus usuarios pudieran trabajar con lo que son hojas de
cálculo. Por tal motivo, es lógico que también permita la posibilidad de crear
polígonos de frecuencia a la hora de comparar cifras y tomar decisiones en
base a las mismas.

En concreto, para conseguir crear los mismos con Excel se tiene que partir
de la existencia de una serie de gráficos que se hayan confeccionado
previamente para seguidamente desarrollar un conjunto de acciones que den
lugar a aquellos.

DEFINICIÓN SIGUIENTE →

 COMPARTIR


REFERENCIAS

Autores: Julián Pérez Porto y María Merino. Publicado: 2009. Actualizado: 2012.
Definicion.de: Definición de polígono de frecuencia (https://definicion.de/poligono-
de-frecuencia/)
¿Qué es un diagrama circular o de torta?

El diagrama circular (también llamado gráfica circular, gráfica de


pastel o diagrama de sectores) sirve para representar variables cualitativas o
discretas. Se utiliza para representar la proporción de elementos de cada uno de
los valores de la variable.
Consiste en partir el círculo en porciones proporcionales a la frecuencia
relativa. Entiéndase como porción la parte del círculo que representa a cada valor
que toma la variable.

Cálculo de los sectores


Un círculo completo son 360º (o 2π radianes). El ángulo de cada porción
debe ser proporcional a la frecuencia de cada valor. Por ejemplo, si un valor
representa un 50% del total de elementos, su sector del círculo tendrá un ángulo
de 180º (o π radianes).
Sea (X1,X2,…,XN) un conjunto de elementos. La fórmula para calcular
el ángulo de cada sector es la siguiente:

El ángulo de cada sector se calcula como 360º dividido por el total de


sujetos (N) y multiplicado por la frecuencia absoluta (ni), o bien el producto de
la frecuencia relativa (fi) por 360º. También podemos calcular el ángulo
en radianes:

Ejemplo
ANUNCIOS

Los continentes suponen el 29,1% de superficie de la Tierra, el resto es


agua. Supongamos que se pretende representar mediante un diagrama
circular la proporción de superficie de cada continente respecto a la superficie de
todos los continentes.
Para dibujar el diagrama, calcula el ángulo de cada uno de los sectores (que
serán Europa, África, América, Asia, Oceanía, la Antártida). Se obtiene la
siguiente tabla:
Una vez calculados los ángulos, puede representarlos gráficamente.
El diagrama circular será el siguiente:

También podría gustarte