Teoría y Conceptos Jessica Edith Hernandez García

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 13

INSTITUTO POLITÉCNICO NACIONAL

Escuela Superior de Ingeniería Mecánica y Eléctrica


Azcapotzalco

PARTE I
Teoría y conceptos fundamentales de la
Estadística Descriptiva.

Probabilidad y estadística.

Hernández García Jessica Edith


2017360172

Revisó: Aguirre Buitrón Vladimir.

Grupo: 6MM1

Ingeniería Mecánica.

Fecha de entrega: 14 de septiembre del 2021

OBJETIVO
Conocer y comprender los conceptos fundamentales de la estadística descriptiva para
poder analizar, resolver e interpretar los datos que se presenten.

INTRODUCCIÓN
La estadística es el conjunto de técnicas que se emplean en la recolección,
organización, análisis e interpretación de datos a fin de establecer comparaciones
o variabilidades que permitan comprender un fenómeno en particular.
Se emplea para estudiar una población o muestra sobre la que se pretende
obtener información específica, de esta manera se puede ofrecer una solución a
un problema o ver cómo ha variado una situación en específico. El objetivo de la
estadística es tanto ofrecer un resultado numérico como exponer de qué manera
se ha obtenido dicho resultado.
La estadística se puede dividir en dos ramas principales: descriptiva e inferencial.
Nos enfocaremos a la primera.

ESTADÍSTICA DESCRIPTIVA
Definición:
Es el conjunto de métodos para organizar, resumir y presentar los datos
numéricos de manera informativa. Datos obtenidos tras un estudio o análisis en
particular de los cuales busca describir las características principales evitando
generalizaciones.

Datos:

Son números que representan las modalidades de las variables, es decir. pueden
representar poblaciones o muestras.
Se pueden resumir en agrupados y no agrupados, siendo los segundos el punto de inicio
del análisis.

Datos agrupados: Son aquellos que ya se encuentran ordenados, clasificados y


contados.

Datos no agrupados: Son aquellos que no han sido procesados ni organizados.

DATOS NO AGRUPADOSDATOS AGRUPADOS

Variables:
Es una característica o cualidad que puede fluctuar y es susceptible a adoptar diferentes
valores, los cuales pueden ser medidos u observados. Las variables pueden dividirse en
cualitativas y cuantitativas, pudiendo ser estas últimas discretas o continuas.

Variables cualitativas: Se refieren a


características o cualidades que no
pueden ser medidas numéricamente. Por
ejemplo: género, afiliación religiosa,
afiliación política, tipo de automóvil, estado
de nacimiento o color de ojos.
Cualitativas ordinales: Son
aquellas que pueden toman valores
ordenados siguiendo una escaña
establecida, aunque no es
DIVISIÓN DE VARIABLES necesario que tengan un intervalo
uniforme.

Cualitativas nominales: Son aquellas que no pueden tomar un orden específico.

Variables cuantitativas: Son aquellas que pueden expresarse mediante números. Por
ejemplo: saldo de una cuenta de cheques, edades de un grupo de alumnos, duración de
una vela, número de hijos en una familia o número de operaciones comerciales que
realiza una empresa.
Cuantitativas discretas: Son aquellas que toman valores aislados, es decir, que
no tiene valores intermedios entre dos valores específicos. Por lo general son
resultado de conteos.

Cuantitativas continuas: Son aquellas que pueden toman valores intermedios


entre dos valores específicos. Por lo general son resultado de mediciones.

Procedimiento:
La estadística descriptiva comprende cuatro pasos:

Recolección de datos: Primera etapa de la estadística descriptiva, la mayoría de los


estudios se realizan sobre una muestra debido a la dificultad de realizarlo a toda la
población.

Tipos de muestras: Se busca que una muestra sea representativa de la población, por lo
que es necesario obtener buenos datos. Hay tres métodos de recolección de datos:
Encuesta: Los datos se obtienen al seleccionar a algunos individuos de la
población.

Experimento: Los datos se obtienen de un proceso diseñado exclusivamente con


ese fin.

Censo: Los datos se obtienen de un estudio a toda la población.


Organización de datos: Usualmente los datos se encuentran desordenados y su
interpretación resulta difícil, por lo que resulta conveniente ordenarlos y agruparlos.

Presentación de datos: Esta etapa es necesaria para poder leer y describir con
facilidad la información. Hay tres formas de presentar los datos:
Escrito: Los datos se presentan como descripción histórica, como informe o como
resumen.

Tablas: Los datos se presentan por medio de tablas para exposición detallada.

Gráficas: Los datos se presentan dando un valor aproximado. Se pueden


presentar mediante histogramas, polígonos, ojivas, diagramas y pictogramas.

Análisis de datos: En esta etapa se pueden utilizar varios métodos, desde simple
observación hasta métodos matemáticos.
Estadístico simple: Paramétrico (descriptivo o probabilístico) o no paramétrico.

De series de tiempo: Mide cambios en negocios y actividades económicas.

De relaciones: Entre dos o más conjuntos de datos.

MEDIDAS DE TENDENCIA CENTRAL


Las medidas de tendencia central se utilizan para representar a través de un solo
valor una serie de datos. Son valores situados hacia el centro de la distribución de
las observaciones.

Media:

Es la medida que representa el valor característico de una serie de datos. Se obtiene a


partir de la suma de todos los datos, dividida entre el número de datos presentes. Su
ecuación es la siguiente:
n

∑ xi x 1+ x2 +…+ xn
x́= i=1 =
n n
Se utiliza la x con una barra horizontal ( x́ ) para muesas y mu ( μ) para poblaciones.

Mediana:

Es la medida que representa el punto medio de los datos presentados, una vez que se
han ordenado. Es decir, si se tiene un grupo de datos, al momento de dividir en dos partes
iguales dichos datos, el que quede al centro será la mediana. Se representa con Md .
Si hay un número par de datos, la mediana será el promedio de los dos datos centrales.

Moda:
Es la medida que representa el dato más repetido de un conjunto. Es decir, el valor de la
variable con mayor frecuencia absoluta. Se representa con Mo.

MEDIDAS DE DISPERSIÓN
Las medidas de dispersión se utilizan para identificar la distribución de un conjunto
de datos. Son importantes para conocer la variabilidad de las observaciones
alrededor de su valor central.

Rango:

Es el intervalo entre el valor máximo y mínimo. Permite obtener una idea de la dispersión
de los datos. Es la diferencia entre el dato de mayor valor y el de menor valor, y se
conoce también como recorrido de medida.
Se denota con R y su fórmula es:
R=dato mayor−dato menor

Desviación estándar:

Es la raíz cuadrada de la varianza, que es la media aritmética de las desviaciones


cuadradas de los datos. Entre más baja sea esta, más agrupados tienden a estar los
datos con respecto a la media.
Se denota con σ para poblaciones y con s para muestras y su fórmula es:
n n

√ √
2
∑ ( x i−μ ) ∑ ( x i− x́ )2
i=1 i=1
σ= ó s=
N n−1

Desviación media:

Es el promedio de los valores absolutos de las desviaciones con respecto de la media de


los datos. Es un resumen de la dispersión estadística.
Se denota con D m y su fórmula es:

n n

∑| xi −μ| ∑ |x i−x́|
Dm = i=1 = i=1
N n

Varianza:

Es el promedio del cuadrado de desviaciones alrededor de la media para un conjunto de


números. Es decir, el cuadrado de la desviación estándar. Su fórmula es:
n n

∑ ( xi −μ )2 ∑ ( xi −x́ ) 2
σ 2= i=1 ó s 2= i =1
N n−1
Coeficiente de variación:

Es la proporción que hay entre la desviación estándar y la media de un conjunto de datos.


Su resultado se expresa en porcentaje. Su fórmula es:

CV = ( σμ ) ( 100 )=( x́s ) ( 100)


TABLA DE DISTRIBUCIÓN DE FRECUENCIAS
Cuando se presentan los datos en forma de tabla, hay diferentes columnas a
considerar:

Número de clase:

No presente en la imagen, es el número del intervalo que se tiene en la columna x i. Se


puede obtener un número recomendado de clases mediante la expresión:

k =1+3.3 log ⁡( n)

Generalmente se redondea el resultado al entero siguiente.

Intervalo de clase:

Es la columna que presenta los valores mínimo y máximo de una clase, estos deben ser
iguales entre cada clase. Se denota con i y su expresión es:

dato mayor−datomenor
i=
k

Generalmente se redondea al decimal o entero siguiente, dependiendo qué se esté


utilizando. Para la imagen anterior, i=5.
Límites de clase:

Son los datos mayores y menores de cada clase. Al haber un intervalo determinado, la
diferencia entre el dato menor (o el mayor) de cada clase deberá ser igual al intervalo.

Para la imagen anterior, entre clase 1 y 2 (de arriba hacia abajo), 13−8=5=i.

Límites reales de clase:

Dado que los límites son continuos, es necesario obtener los límites reales, que son el
promedio entre el límite superior de una clase y el inferior de la siguiente. Se denotan con
LRI y LRS , y su expresión es:

L .clase a+ L . Inf clase b L. clase b+ L . Inf clase c


LRI = y LRS=
2 2

Para la imagen, en la clase 1 (de arriba hacia abajo), LRI =7.5 y LRS=¿ 12.5

Marca de clase:

Es el valor central de la clase, se obtiene al promediar el LRI y el LRS . Se denota con


MC y su expresión es:

LRI + LRS
MC=
2

Para la imagen, en la clase 1 (de abajo hacia arriba), MC=10 .

Frecuencia absoluta:

Es la cantidad de veces que se presenta un dato dentro de una clase. Se denota por F A,
y para la imagen, en la clase 1, F A=1

Frecuencia relativa:

Es la cantidad relativa de veces que se presenta un dato dentro de una clase, se obtiene
al dividir F A entre el total de datos y se puede expresar como porcentaje. Se denota por
1
F R, y para la imagen, en la clase 1, F R = =3.3333 % .
30

Frecuencia acumulada:

Es la suma de F A de una clase con su siguiente, acumulando su valor hasta llegar al total
de datos de la tabla.
Para la imagen, en la clase 1 y 2, F Acum1 =1+ 0=1 y F Acum 2=1+12=13 .

MEDIDAS DE TENDENCIA CENTRAL DE TABLAS


Cuando se presentan los datos en forma de tabla, y utilizando las columnas antes
descritas tenemos:
n
n
∑ F A∗MC
x́= i=1
n
n
, Md =LRI +
2
(
−F Acumant
F A clase
n
)
(i ) , R=LS máx−LI mín ,

2
∑ F A ( MC−μ ) ∑ F A ( MC− x́ )2
σ 2= i=1 ó s 2= i=1 ,σ =√ σ 2 ó s=√ s 2
N n−1
GRAFICA DE DISTRIBUCIÓN DE FRECUENCIAS
Cuando se tienen los datos organizados en forma de tabla y separados por clases,
hay diferentes gráficas que se pueden realizar:

Histograma:

Es un gráfico de barras que representa la distribución de frecuencias. Es decir, los datos


agrupados en donde cada clase se representa mediante una barra. Se muestran de
manera corrida en el eje horizontal, partiendo del LRI de la primera clase hasta el LRS de
la misma, que es el LRI de la siguiente clase.
Para la imagen presentada anteriormente, el histograma sería:
35

30
Polígono de
frecuencia: 25

Es un gráfico de 20
líneas que se 15
obtiene al unir el
punto de MC por 10
medio de una 5
línea continua y
se puede 0
10 15 20 25 30 35
construir sobre
el histograma, considerando que debe partir del punto medio de la clase anterior y
terminar en el punto medio de la clase siguiente ( F A=0 para ambos casos). Para la
imagen presentada anteriormente, el polígono (izquierda) y adjunto al histograma
(derecha) sería:

15 15

10 10

5 5

0 0
0 10 15 20 25 30 35 40 0 10 15 20 25 30 35 40
Ojiva (polígono de frecuencia acumulada:

Es un gráfico de barras que representa la distribución de frecuencias acumuladas en


donde cada clase se representa mediante una barra. Utiliza los mismos principios que el
histograma y el polígono de frecuencia, sólo que se utiliza la frecuencia acumulada en vez
de la absoluta.
Para la imagen presentada anteriormente, la ojiva sería:

35
30
25
20
15
10
5
0
10 15 20 25 30 35

Otros:

Además de los ya mencionados, los datos agrupados se pueden presentar en gráficas de


pastel (círculo segmentado en porcentajes), diagramas de puntos (puntos en vez de
barras), y pictogramas (dibujos o signos representativos de la variable en vez de barras).

CONCLUSIONES
La estadística descriptiva es una herramienta muy útil que nos permite tomar
datos de observaciones y convertirlos en objetos de análisis al ordenarlos y darles
ciertas propiedades que nos permitan su simplificación. Estos datos, una vez
ordenados, pueden ser presentados de manera más cómoda, a modo que
podamos interpretarlos y, de esta presentación, hacer inferencias reales.
Dependiendo del método que se utilice, variará la manera de organizar, presentar
y analizar los datos.

BIBLIOGRAFIA
[1] Histograma de frecuencias explicado https://ingenioempresa.com/histograma/

[2] Estadística https://www.ecured.cu/Estad%C3%ADstica

[3] Datos agrupados y no agrupados https://es.slideshare.net/sexy_yerania/datos-agrupados-y-no-


agrupados

[4] Conceptos estadísticos https://www.uv.es/webgid/Descriptiva/12_conceptos_estadsticos.html


[5] Media, mediana y moda
https://www.varsitytutors.com/hotmath/hotmath_help/spanish/topics/mean-median-mode

[6] en.wkipedia.org, definicion.de, www.significados.com


PARTE II
Problema de aplicación.
Un profesor comenta que a partir del año 2013 se realizó un cambio en el plan de
evaluación de sus alumnos de pregrado; también comenta que es más fácil para
ellos pasar con el nuevo plan de evaluación por lo que decidió registrar las
calificaciones finales de sus alumnos desde 2008 hasta 2020. El profesor desea
saber si la calificación más frecuente entre sus alumnos es aprobatoria o no.
Calificaciones de alumnos de pregrado durante 13 años
2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020
9 8 10 8 9 10 10 9 9 9 10 9 9
7 9 5 10 10 9 9 9 10 10 8 10 9
7 10 7 9 9 7 10 9 9 9 8 9 9
6 8 7 9 9 10 9 9 9 10 10 8 10
7 9 10 8 8 8 9 10 9 9 8 7 9
8 8 7 9 9 10 9 9 10 9 8 8 9
7 10 9 9 10 10 9 9 9 10 7 10 9
9 6 7 10 8 9 9 9 10 7 8 9 9
6 5 7 8 6 9 9 9 9 9 8 7 9
5 8 8 9 9 9 9 9 9 10 10 9 9
5 6 9 9 9 8 9 9 9 9 8 9 9
8 8 8 10 10 10 10 9 9 9 10 9 9
7 9 7 9 10 10 9 9 10 10 7 9 8
7 9 6 5 10 8 9 9 10 8 8 8
8 7 9 8 9 7 9 10 10 8 10 9
8 8 8 7 9 7 9 9 10 6 8 9
5 9 5 8 8 7 9 9 9 8 10 8
6 7 6 9 10 9 9 9 9 8
4 9 8 10 10 9 9
9 10 8 6 10 9
6 8 9 10 10
8 10 8 10 9
8 9 10
7 6
4

Se tiene un total de 256 calificaciones


Calificación Frecuencia
0 0 # L. Inf L. Sup LRI LRS Frec Abs Frec Acum M. de Clase %
1 0 1 4.00 4.90 3.950 4.950 2 2 4.45 0.7813%
2 0 2 5.00 5.90 4.950 5.950 7 9 5.45 2.7344%
3 0 3 6.00 6.90 5.950 6.950 12 21 6.45 4.6875%
4 2 4 7.00 7.90 6.950 7.950 25 46 7.45 9.7656%
5 7 5 8.00 8.90 7.950 8.950 48 94 8.45 18.7500%
6 12 6 9.00 9.90 8.950 9.950 108 202 9.45 42.1875%
7 25 7 10.00 10.90 9.950 10.950 54 256 10.45 21.0938%
8 48 256 100%
9 108
10 54 Dividiendo las calificaciones con i=1:
256

En promedio, el 42.19% de los alumnos han sacado 9 de calificación, siendo


aprobatoria la calificación más frecuente.
PARTE III
Problemario.

También podría gustarte