Trabajo Presentacion de Estadistica.

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 117

ESTADÍSTICA

DIEGO MONTOYA RAMÍREZ.


        ESTADÍSTICA
Es un conjunto de herramientas matemáticas que sirven para recoger,
organizar y presentar el comportamiento de un grupo de datos (muestra).
Con esta información  se pueden hacer análisis e interpretaciones de los
mismos datos, para hacer deducciones y así sacar las conclusiones  que
ayuden a tomar las decisiones basadas en tal análisis.
LA ESTADÍSTICA SE PUEDE
CLASIFICAR EN DOS RAMAS:
• Estadística descriptiva

• Estadística inferencial
     ESTADÍSTICA
DESCRIPTIVA
Es aquella rama que se encarga de caracterizar y determinar
el comportamiento de un conjunto de datos mediante tablas, gráficas y
medidas de resumen.
Por lo general es la que se encarga de describir los fenómenos o las variables.
      ESTADÍSTICA
INFERENCIAL 
Es aquella rama que se encarga de la descripción de los fenómenos o
variables y utilizando métodos matemáticos se determine el comportamiento
de la población estadística a partir de la muestra, es decir; es la que se
encarga de inferir el comportamiento del fenómeno o de las variables. 
• Población:
Conjunto de elementos que poseen una característica
en común; dado que, sobre esta se realiza el estudio
para obtener las conclusiones válidas y así tomar las
decisiones pertinentes.
La población se puede dividir en finita (número
pequeño) o infinita (número grande).
• Muestra: 
Subconjunto de la población que se extrae para que con los diferentes
estadísticos se analicen sus diversas variables,  y con éstas inferir el
comportamiento de la población. 
Dicha muestra debe ser representativa en cantidad (cálculo del tamaño de la
muestra) como en calidad (tipos de muestreo). 
VARIABLE:  Estrato social
Es una característica o atributo de un (cualitativa)
objeto de interés que toma diferentes
valores sean medibles (cuantitativas) o
no medibles (cualitativas). 

Edad (cuantitativa)
•   Variable cuantitativa :  

Es aquélla que permite diferenciar un objeto de


interés de otro por un valor numérico medible, o
sea, que debe haber un instrumento que permita la
medida, y pueden ser discretas o continuas. 
• Variable cualitativa o categórica:
Es aquélla que permite diferenciar un objeto de
interés  de otro por una característica, cualidad o
atributo, y pueden ser nominales y ordinales. 
FUENTES DE DATOS
• Información secundaria (Existen estudios estadísticos).

• Información primaria (Trabajo de campo).


RESUMEN DE
DATOS CUALITATIVOS
• Tablas de frecuencias.
• Diagramas de barras y pastel.
• Tablas de contingencia (cruce de variables).
RESUMEN DE DATOS
CUANTITATIVOS
• Distribuciones de frecuencias (datos agrupados).
• Diagramas de barras, pastel, polígono de frecuencias y ojiva.
• Medidas de posición.
• Medidas de variabilidad. 
•DISTRIBUCIONES DE FRECUENCIA

Es un método matemático que se utiliza para organizar y resumir un conjunto


de datos (información), y que a través de su clasificación se puede indicar el
número de veces que una variable cumple una característica (frecuencia
absoluta), además de su participación respecto al tamaño total de la
población o la muestra (frecuencia relativa).
• 
VARIABLE
CUALITATIVA
Procedimiento:

• 1er paso: Se cuenta el número de unidades muestrales o experimentales


que cumplan una característica determinada.

Es llamada frecuencia absoluta ).


• 
• 2do paso:
Se suman las unidades de la característica anterior con las unidades de la
característica actual, así:

Llamada frecuencia absoluta acumulada


•  3er paso:
Cada frecuencia absoluta de las características se dividen entre el total
de datos de la población o la muestra así:

Llamada frecuencia relativa .


• 
• 4to paso:

Idem del paso 2do, pero con las frecuencias relativas así:

Llamada frecuencia relativa acumulada .


Ejemplo:
En Colombia las empresas se clasifican en sectores económicos así: sector
primario, sector secundario y sector terciario. Se toma una muestra aleatoria
de 100 empresas, obteniendo los siguientes resultados:
-Sector primario o agrícola: 50
-Sector secundario o industrial: 30
-Sector terciario o prestación de servicios: 20

Construir una distribución de frecuencias


Ejemplo: Distribución de frecuencias
Características Frecuencia Frecuencia Frecuencia Frecuencia relativa
absoluta absoluta relativa absoluta
acumulada
VARIABLE
CUANTITATIVA
Normalmente un conjunto de datos se agrupan cuando la población o la
muestra son grandes y se afirma que es mayor o igual a 30.
• 
Procedimiento:
• 1er paso: Se determina el número de intervalos que se van a analizar, se
utiliza el teorema de Sturges así:

Donde K es el número de intervalos y n es el tamaño de la muestra o


población; siempre se aproximará al entero superior.
•   2do  paso: Se determina el tamaño o la longitud de los intervalos
procurando que sean iguales, así:

Donde es la longitud o tamaño del intervalo, siempre se aproxima al número


por encima, de acuerdo a la aproximación de los datos originales. 
• 
• 3er  paso: Se construyen los intervalos con la siguiente fórmula:
• 4to  paso: Repetir los pasos de la distribución de frecuencia de la variable
cualitativa.

**EJEMPLO EN EXCEL
REPRESENTACIÓN
GRÁFICA
• Variable cualitativa.

• Variable cuantitativa.
Variable cualitativa
• Diagrama de barras: Se grafica
características vs frecuencia relativa
(%).

90%
Título
• Torta o diagrama de pastel: Se
graficaTítulo
de forma circular o pastel,
las frecuencias relativas (%).
Frecuencia relativa

60%
33%
A B

50%
30%
C D

0%
A B C D Características 17%
Variable cuantitativa
• Histograma: Es un gráfico similar al
diagrama de barras. en el eje
horizontal los intervalos y el
vertical frecuencia relativa (hi%).  • Torta o diagrama de pastel: Se
grafica de forma circular o pastel,
las frecuencias relativas (%).

100%
Título
Título 20% 1-2

75%
40% 3-4

50% 5-6
hi

25% 30% 7-8

0% 10%
1-2 3-4 5-6 7-8 intervalos
Variable cuantitativa
• Polígono de frecuencias: Se
grafican los intervalos vs
frecuencias relativas, pero con
puntos, y luego se unen esos puntos. • Ojiva: Se grafica los intervalos vs
frecuencia absoluta acumulada o
frecuencia relativa acumulada.
Título
100% 100%
Título
75% 75%

50% 50%
HI

HI
25% 25%

0% 0%
1-2 3-4 5-6 7-8
intervalos 3-4 7-8 5-6 1-2
intervalos
MEDIDAS DE POSICIÓN
O TENDENCIA
CENTRAL
Con estas medidas se puede determinar la posición de un dato respecto al
resto de los otros datos.
Estas medidas para una población se llaman parámetros o valores
estadísticos y para una muestra se llaman estimadores o estadígrafos.
• MEDIA O PROMEDIO:

Este es un único valor que representa a un conjunto de valores y sirve como


elemento de pronóstico básico.
•  Media Aritmética: 
Se utiliza cuando todas las unidades de análisis son igual de importantes en
el estudio.

-Datos no agrupados -Datos agrupados

: media muestral = marca de clase


• 

 Media Ponderada:
Se utiliza cuando las unidades de análisis tienen diferente importancia en el
estudio.
• 
 Media Geométrica:
Se utiliza cuando los valores son pequeños expresados en porcentajes.
• 
 Media Armónica:
Se utiliza cuando los valores son pequeños expresados en porcentajes
representando cambios de la variable.
• MEDIANA:

Dato que ocupa la posición central y sirve como elemento de pronóstico en


última instancia (Existencia de datos muy alejados del conjunto de datos). 
-Datos agrupados
-Datos no agrupados

Se ordenan de mayor a menor o  


viceversa y se escoge el dato de la 𝑛
mitad, si los datos son pares se ~ ( ) 2
− 𝐹𝑚− 1
escogen los dos de la mitad y se les 𝑥= ℓ 𝓂 + 𝑓𝑚
×ℓ
saca el promedio.
• 
• MODA:
Dato que más se repite.
• 
CUARTIL
Separa a los datos en cuatro conjuntos de datos.
• 
DECIL
Separa a los datos en diez conjuntos de datos.
• 

PERCENTIL
Separa a los datos en cien conjuntos de datos.
MEDIDAS DE
DISPERSIÓN O
VARIABILIDAD
•   VARIANZA: Mide le grado de variabilidad o el grado
de dispersión y determina que tan alejados están los datos unos de otros.

-Datos no agrupados:
-Datos agrupados:

Varianza muestral :varianza poblacional


• 
• Desviación Estándar:
Es el error promedio de datos. Los errores de cada dato respecto a la media.

: Desviación estándar muestral


:Desviación estándar poblacional
• Coeficiente
  de variación:
Es el error relativo de los datos.

Mayor o igual del 20% (muestra heterogénea).

Menor del 20% (muestra homogénea).


Relación entre la media, la mediana y la moda

“Cuando los datos son sesgados es mejor emplear la Md”


MEDIDAS DE FORMA
Son medidas numéricas que permiten determinar la forma que tiene la curva
de los datos, por lo tanto, sirven para corroborar lo que los gráficos
muestran.
Coeficiente de Pearson
-Asimetría
Medidas Coeficiente de Fisher
de forma
-Kurtosis o apuntamiento
• ASIMETRÍA
Permiten estudiar la forma de la curva, dependiendo de cómo se agrupan los
datos.
• KURTOSIS
• Mesocúrtica: grado de concentración medio alrededor de los valores
centrales de la variable.
• Leptocúrtica: grado de concentración elevado.
• Platicúrtica: grado de concentración reducido.
ANÁLISIS
EXPLORATORIO
Identificar datos atípicos.
(Diagrama de Caja y Bigotes).

Analizar la representatividad de
la media muestral. (Estimadores
Robustos y Media Recortada).
PROBABILIDAD
        PROBABILIDAD
La probabilidad es la medición de la incertidumbre o del riesgo.
Posibilidad ≠ Probabilidad
Posibilidad: Probabilidad:
Opción de respuesta de un Medida de la posibilidad de
evento o experimento ocurrencia de un evento
determinado. determinado, normalmente
expresado en porcentaje (%).
• 
PROBABILIDAD
CLÁSICA O ELEMENTAL
TÉCNICAS DE CONTEO
Se utiliza para determinar el número de opciones exitosas o número total de
posibilidades.

• Experimento o evento con repetición.


• Experimento o evento sin repetición.
• 
• EXPERIMENTO O EVENTO CON REPETICIÓN.

Ocurre cuando el experimento se repite y siempre tiene las mismas opciones


de respuesta.

𝑛 : número de opciones de respuesta.


𝑚
 

: número de repeticiones.
• EXPERIMENTO O EVENTO SIN REPETICIÓN.

Ocurre cuando se extrae un subconjunto (muestra) de un conjunto


(población) solamente una vez.

• Combinación (sin orden).

• Permutación (con orden).


• 
• COMBINACIÓN (SIN ORDEN)

Ocurre cuando cada elemento cumple la misma función o tienen igual


importancia.

: Tamaño de la población. : Tamaño de la muestra.


• 
• PERMUTACIÓN (CON ORDEN)

Ocurre cuando cada elemento cumple funciones distintas o tienen diferente


importancia.

: Tamaño de la población : Tamaño de la muestra


PROBABILIDAD DE EVENTOS
INDEPENDIENTES
Dos eventos son independientes cuando no existen elementos que cumplen
con la misma característica.

                                              
 𝑃 ( 𝐴 ∪ 𝐵 ) = 𝑃 ( 𝐴 ) + 𝑃 ( 𝐵 )

P(A) P(B)  𝑃 ( 𝐴 ∩ 𝐵 )= 𝑃 ( 𝐴 ) × 𝑃 ( 𝐵 )
• 
PROBABILIDAD DE EVENTOS
DEPENDIENTES
Dos eventos son dependientes cuando por lo menos existe un elemento con
la misma característica.
 P ( A ∩ 𝐵)

P(A) P(B)
• 
PROBABILIDAD DE
EVENTOS
CONDICIONALES
Dos eventos son condicionales cuando la ocurrencia de un evento condiciona
a otro evento.
TEOREMA DE LA
PROBABILIDAD
Se presenta cuando un conjunto de elementos con ciertas características se
colocan en el mismo sitio sin importar su procedencia.

• Teorema de la probabilidad total. 

• Teorema de Bayes. 
• 
TEOREMA DE LA
PROBABILIDAD TOTAL
Es una probabilidad apriori; que, antes de observar la unidad muestral o
experimental, se calcula la probabilidad de una característica determinada sin
importar la procedencia.
• 
TEOREMA DE BAYES
Es una probabilidad a posteriori; que, después de observar la unidad muestral
o experimental y se desea conocer su procedencia.
DISTRIBUCIÓN DE
PROBABILIDAD
• Variable cualitativa

• Variable cuantitativa (poblacional)


• Variable cualitativa
 Distribuciones discretas.
- Distribución de probabilidad Binomial.
- Distribución de probabilidad Hipergeométrica.
- Distribución de probabilidad de Poisson.

• Variable cuantitativa
 Distribución continua.
- Distribución de probabilidad normal.
•Distribución
  de probabilidad Discreta(variable cualitativa)

• Distribución Binomial :
1. Población grande (n≥30)
2. Estudio previo (%)
3. Muestreo con reemplazo
• Ejemplo: 

La compañía de Investigación de Mercados Nielsen afirma que; por su


experiencia, la participación de mercado de la marca Fruco con el producto
salsa de Tomate es del 60% en Colombia. Se seleccionan 50 hogares al azar,
hallar la probabilidad que:

a) Exactamente 30 consuman la salsa de tomate Fruco. 


b) Como máximo 35 prefieran la salsa de tomate Fruco.
c) Como mínimo 25 no prefieran la salsa de tomate Fruco. 
•Distribución
  de probabilidad Discreta

• Distribución Hipergeométrica:

1. Población pequeña (n< 30)


2. Se conocen las características de la población
3. Muestreo sin reemplazo.
• Ejemplo: 

La empresa Crem Helado desea hacer una investigación de producto para


determinar la viabilidad de lanzamiento de un nuevo sabor de helado. Para
tal fin, se selecciona 20 jóvenes en un colegio donde se venden helados de
esta marca y 15 jóvenes encontraron agradable el nuevo sabor. Si se quiere
repetir la prueba con 10 de esos 20 jóvenes, cuál es la probabilidad que: 

a) A 5 les guste el nuevo sabor


b) A 4 no les guste el nuevo sabor 
c) Menos de 8 les guste el nuevo sabor 
•Distribución
  de probabilidad Discreta

• Distribución Poisson
1. Existe un estudio previo (promedio)
• Ejemplo: 

Debido al creciente incremento de tutelas, denuncias y derechos de petición


de los usuarios de la salud en Colombia, el Ministerio de la Salud y
Protección Social realizó una investigación del nivel de satisfacción de los
usuarios, arrojando un resultado que en promedio 4 de cada 10 usuarios están
satisfechos con el sistema de salud en Colombia. Si se escoge una población
con 400.000 usuarios, hallar la probabilidad que: 

a) Menos de 170.000 estén satisfechos.


b) Más de 240.000 no estén satisfechos. 
Distribución continua (variable cuantitativa)
• Distribución normal

2
  ( 𝑥 − µ)
1 − 2σ2
σ
𝑓 ( 𝑥 )= 𝑒
σ √2 π
X
µ x
• Distribución normal

  𝑋−µ 1
𝑍=
σ
Z
0 z
•  Ejemplo 1:

El propietario de un restaurante ha determinado que; la demanda diaria de


carne molida en su negocio, tiene una media de 240 Kg y una varianza de
529. Si se escoge un día cualquiera hallar la probabilidad que:

a) La demanda sea menor de 250 Kg.


b) La demanda sea como mínimo 270 kg.
• Ejemplo 2: 

El gerente de crédito de un almacén de artículos de electrodomésticos estima


las perdidas por malos clientes durante el año cumplen una distribución
normal con media de $ 600.000. Además que; la probabilidad de ser mayor a
$700.000 es del 30% y la probabilidad de ser menor de $550.000 es del 40%.
¿Cuál es la desviación estándar? 
MUESTREO
Población
Cantidad { Tamaño Muestra.
Muestra
representativa Calidad
{ Métodos de muestreo.

Nivel de confianza
Margen de error
• 
TAMAÑO MUESTRA
• INVESTIGACIÓN CUANTITATIVA
 Población grande: (N ≥ 30)   (Conociendo la varianza poblacional).

: Varianza poblacional
 

: Margen de error
Z : Valor de la curva normal estándar del
nivel de confianza
• 

 Población pequeña (N < 30)   (Desconociendo la varianza poblacional).

: Varianza muestral
 

: Margen de error
: Valor de la curva t student del nivel
de confianza
•   Corrección para la muestra (Conociendo el tamaño de la población).
• 

• INVESTIGACIÓN CUALITATIVA

: Probabilidad o proporción éxito.
 

: Probabilidad o proporción fallo.


• 

 Corrección para la muestra (conociendo el tamaño de la población)


 Métodos de muestreo
• 
DISTRIBUCIONES DE
PROBABILIDAD
MUESTRALES
• Proporción de una población (variable cualitativa)
• Ejemplo: 

ACOPI afirma que el 60 % de los empresarios en Colombia están en contra


de la firma del tratado de libre comercio con China.
Cuál es la probabilidad que en una muestra de 200 empresas den como
resultado que máximo el 70 % de los empresarios no estén de acuerdo con el
tratado. 
• 
• Proporción de dos poblaciones (variables cualitativas)
• Ejemplo: 

Ciertas encuestas a televidentes revelan que el 25% de los hombres y el 33%


de las mujeres ven televisión en la noche.
Cuál es la probabilidad de que en 2 muestras aleatorias de 150 hombres y
100 mujeres, sea respectivamente igual la proporción entre ellos. 
• 
MEDIAS PARA MUESTRAS GRANDES (Con conocido)

• Una población
• Ejemplo: 

Un fabricante de cierto champú para el cabello, distribuye el tamaño


profesional de su producto en salones de belleza de Pereira. Se ha
determinado que el consumo promedio de su producto es de  2.800 cojines
mensuales con una desviación estándar de 280 cojines.
Si se toma una muestra probabilística de 36 salones, ¿cuál es la probabilidad
que el consumo promedio en un mes sea inferior a 2700 cojines?
•  Dos poblaciones
• Ejemplo: 

Una empresa estima en dos sucursales que las ventas mensuales son en
promedio $60 millones y $50 millones respectivamente, con una desviación
estándar de $10 millones y $ 5 millones respectivamente. Si se escoge 80 y
60 facturas respectivamente de un mes al azar.
¿Cuál es la probabilidad que la diferencia entre las ventas medias de ambas
muestras sea mayor a $15 millones?. 
• 
MEDIAS PARA MUESTRAS PEQUEÑAS (Con desconocido) (n<30)

• Una población
• Ejemplo: 

El salario mensual de los directores comerciales en Colombia es de $5


millones en promedio de acuerdo a una estimación presentada por el Director
del DANE.
Se toma una muestra aleatoria de 9 directores comerciales que genera como
resultado una desviación estándar de $1 millón, ¿Cuál es la probabilidad que
el salario exceda a $6 millones? 
• 
• Dos poblaciones
• 
• Ejemplo: 
PRUEBAS DE HIPÓTESIS
PASOS PARA RESOLVER UNA PRUEBA DE HIPÓTESIS

1) Establecer Ha (hipótesis alternativa) con base a lo afirmado o supuesto;


ya que, se desea comprobar su valor de verdad.

2) Determinar Ho (hipótesis nula), es lo contrario a Ha y la Ho es la que se


demuestra.
3) Con Ho y α (Nivel de significancia) se grafica las zonas de aceptación y
rechazo

4) Con el estadístico de prueba se calcula el valor de la distribución de


probabilidad.

5) Se ubicará el valor calculado del punto 4 en la gráfica y se determina la


zona donde se encuentre.

6) Se toma la decisión de aprobar o rechazar Ho y por lo tanto, se acepta o


se rechaza Ha.
•  Ejemplo:

Ha:
Ho:
Nivel de significancia:

ACEPTACIÓ
N 1-α RECHAZO

VALOR
TEÓRICO
•  Ejemplo:

Ha:
Ho:
Nivel de significancia:

ACEPTACIÓ
RECHAZO N

VALOR
TEÓRICO
•  Ejemplo:
Ha:
Ho:
Nivel de significancia:

RECHAZO
ACEPTACIÓ
N RECHAZO
F
VALOR VALOR
TEÓRICO 1 TEÓRICO 2
•  MEDIAS O PROMEDIOS

-Muestras grandes de una población (Conociendo


• ejemplo
• 
-Muestras grandes de dos poblaciones
• ejemplo
• 
-Muestras pequeñas de una población (desconociendo )
• ejemplo
• 
-Muestras pequeñas de dos poblaciones (desconociendo )
• 
• ejemplo
• 
• PROPORCIÓN
(variable cualitativa)

-Una población

-Dos poblaciones
• ejemplo
• ejemplo
• 
• VARIANZAS
-Una población -Dos poblaciones
• ejemplo
• ejemplo

También podría gustarte