Teoría y Conceptos Jessica Edith Hernandez García
Teoría y Conceptos Jessica Edith Hernandez García
Teoría y Conceptos Jessica Edith Hernandez García
PARTE I
Teoría y conceptos fundamentales de la
Estadística Descriptiva.
Probabilidad y estadística.
Grupo: 6MM1
Ingeniería Mecánica.
OBJETIVO
Conocer y comprender los conceptos fundamentales de la estadística descriptiva para
poder analizar, resolver e interpretar los datos que se presenten.
INTRODUCCIÓN
La estadística es el conjunto de técnicas que se emplean en la recolección,
organización, análisis e interpretación de datos a fin de establecer comparaciones
o variabilidades que permitan comprender un fenómeno en particular.
Se emplea para estudiar una población o muestra sobre la que se pretende
obtener información específica, de esta manera se puede ofrecer una solución a
un problema o ver cómo ha variado una situación en específico. El objetivo de la
estadística es tanto ofrecer un resultado numérico como exponer de qué manera
se ha obtenido dicho resultado.
La estadística se puede dividir en dos ramas principales: descriptiva e inferencial.
Nos enfocaremos a la primera.
ESTADÍSTICA DESCRIPTIVA
Definición:
Es el conjunto de métodos para organizar, resumir y presentar los datos
numéricos de manera informativa. Datos obtenidos tras un estudio o análisis en
particular de los cuales busca describir las características principales evitando
generalizaciones.
Datos:
Son números que representan las modalidades de las variables, es decir. pueden
representar poblaciones o muestras.
Se pueden resumir en agrupados y no agrupados, siendo los segundos el punto de inicio
del análisis.
Variables:
Es una característica o cualidad que puede fluctuar y es susceptible a adoptar diferentes
valores, los cuales pueden ser medidos u observados. Las variables pueden dividirse en
cualitativas y cuantitativas, pudiendo ser estas últimas discretas o continuas.
Variables cuantitativas: Son aquellas que pueden expresarse mediante números. Por
ejemplo: saldo de una cuenta de cheques, edades de un grupo de alumnos, duración de
una vela, número de hijos en una familia o número de operaciones comerciales que
realiza una empresa.
Cuantitativas discretas: Son aquellas que toman valores aislados, es decir, que
no tiene valores intermedios entre dos valores específicos. Por lo general son
resultado de conteos.
Procedimiento:
La estadística descriptiva comprende cuatro pasos:
Tipos de muestras: Se busca que una muestra sea representativa de la población, por lo
que es necesario obtener buenos datos. Hay tres métodos de recolección de datos:
Encuesta: Los datos se obtienen al seleccionar a algunos individuos de la
población.
Presentación de datos: Esta etapa es necesaria para poder leer y describir con
facilidad la información. Hay tres formas de presentar los datos:
Escrito: Los datos se presentan como descripción histórica, como informe o como
resumen.
Tablas: Los datos se presentan por medio de tablas para exposición detallada.
Análisis de datos: En esta etapa se pueden utilizar varios métodos, desde simple
observación hasta métodos matemáticos.
Estadístico simple: Paramétrico (descriptivo o probabilístico) o no paramétrico.
Media:
∑ xi x 1+ x2 +…+ xn
x́= i=1 =
n n
Se utiliza la x con una barra horizontal ( x́ ) para muesas y mu ( μ) para poblaciones.
Mediana:
Es la medida que representa el punto medio de los datos presentados, una vez que se
han ordenado. Es decir, si se tiene un grupo de datos, al momento de dividir en dos partes
iguales dichos datos, el que quede al centro será la mediana. Se representa con Md .
Si hay un número par de datos, la mediana será el promedio de los dos datos centrales.
Moda:
Es la medida que representa el dato más repetido de un conjunto. Es decir, el valor de la
variable con mayor frecuencia absoluta. Se representa con Mo.
MEDIDAS DE DISPERSIÓN
Las medidas de dispersión se utilizan para identificar la distribución de un conjunto
de datos. Son importantes para conocer la variabilidad de las observaciones
alrededor de su valor central.
Rango:
Es el intervalo entre el valor máximo y mínimo. Permite obtener una idea de la dispersión
de los datos. Es la diferencia entre el dato de mayor valor y el de menor valor, y se
conoce también como recorrido de medida.
Se denota con R y su fórmula es:
R=dato mayor−dato menor
Desviación estándar:
√ √
2
∑ ( x i−μ ) ∑ ( x i− x́ )2
i=1 i=1
σ= ó s=
N n−1
Desviación media:
n n
∑| xi −μ| ∑ |x i−x́|
Dm = i=1 = i=1
N n
Varianza:
∑ ( xi −μ )2 ∑ ( xi −x́ ) 2
σ 2= i=1 ó s 2= i =1
N n−1
Coeficiente de variación:
Número de clase:
k =1+3.3 log ( n)
Intervalo de clase:
Es la columna que presenta los valores mínimo y máximo de una clase, estos deben ser
iguales entre cada clase. Se denota con i y su expresión es:
dato mayor−datomenor
i=
k
Son los datos mayores y menores de cada clase. Al haber un intervalo determinado, la
diferencia entre el dato menor (o el mayor) de cada clase deberá ser igual al intervalo.
Para la imagen anterior, entre clase 1 y 2 (de arriba hacia abajo), 13−8=5=i.
Dado que los límites son continuos, es necesario obtener los límites reales, que son el
promedio entre el límite superior de una clase y el inferior de la siguiente. Se denotan con
LRI y LRS , y su expresión es:
Para la imagen, en la clase 1 (de arriba hacia abajo), LRI =7.5 y LRS=¿ 12.5
Marca de clase:
LRI + LRS
MC=
2
Frecuencia absoluta:
Es la cantidad de veces que se presenta un dato dentro de una clase. Se denota por F A,
y para la imagen, en la clase 1, F A=1
Frecuencia relativa:
Es la cantidad relativa de veces que se presenta un dato dentro de una clase, se obtiene
al dividir F A entre el total de datos y se puede expresar como porcentaje. Se denota por
1
F R, y para la imagen, en la clase 1, F R = =3.3333 % .
30
Frecuencia acumulada:
Es la suma de F A de una clase con su siguiente, acumulando su valor hasta llegar al total
de datos de la tabla.
Para la imagen, en la clase 1 y 2, F Acum1 =1+ 0=1 y F Acum 2=1+12=13 .
2
∑ F A ( MC−μ ) ∑ F A ( MC− x́ )2
σ 2= i=1 ó s 2= i=1 ,σ =√ σ 2 ó s=√ s 2
N n−1
GRAFICA DE DISTRIBUCIÓN DE FRECUENCIAS
Cuando se tienen los datos organizados en forma de tabla y separados por clases,
hay diferentes gráficas que se pueden realizar:
Histograma:
30
Polígono de
frecuencia: 25
Es un gráfico de 20
líneas que se 15
obtiene al unir el
punto de MC por 10
medio de una 5
línea continua y
se puede 0
10 15 20 25 30 35
construir sobre
el histograma, considerando que debe partir del punto medio de la clase anterior y
terminar en el punto medio de la clase siguiente ( F A=0 para ambos casos). Para la
imagen presentada anteriormente, el polígono (izquierda) y adjunto al histograma
(derecha) sería:
15 15
10 10
5 5
0 0
0 10 15 20 25 30 35 40 0 10 15 20 25 30 35 40
Ojiva (polígono de frecuencia acumulada:
35
30
25
20
15
10
5
0
10 15 20 25 30 35
Otros:
CONCLUSIONES
La estadística descriptiva es una herramienta muy útil que nos permite tomar
datos de observaciones y convertirlos en objetos de análisis al ordenarlos y darles
ciertas propiedades que nos permitan su simplificación. Estos datos, una vez
ordenados, pueden ser presentados de manera más cómoda, a modo que
podamos interpretarlos y, de esta presentación, hacer inferencias reales.
Dependiendo del método que se utilice, variará la manera de organizar, presentar
y analizar los datos.
BIBLIOGRAFIA
[1] Histograma de frecuencias explicado https://ingenioempresa.com/histograma/