01 Guía Estadistica para Ingenieros I A La Semana 8

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 37

UNIVERSIDAD ESTATAL PENÍNSULA DE SANTA ELENA

FACULTAD DE CIENCIAS DE LA INGENIERÍA


CARRERA DE INGENIERÍA CIVIL

ESTADÍSTICA PARA INGENIEROS I


ESTADÍSTICA PARA INGENIEROS I

Bibliografía:

Básica:
Ronald E. Walpole, Probabilidad y estadísticas para ingeniería
y ciencias, novena edición, editorial Pearson, 2012.
Complementaria:
Douglas A. Lind, Estadística aplicada a la administración y
economía, decimoquinta edición, editorial MacGrawHill, 2012.
UNIDAD UNO

INTRODUCCIÓN A LA ESTADÍSTICA PARA


INGENIEROS.
Si revisa el plan de estudios de la universidad, se dará
cuenta de que varios programas universitarios incluyen la
estadística. ¿Por qué razón? ¿Cuáles son las diferencias
entre los cursos de estadística que se imparten en la
Facultad de Ingeniería, los Departamentos de Psicología o
Sociología en la Escuela de Artes Liberales y la Facultad de
Administración? La diferencia principal consiste en los
ejemplos que se utilizan. El contenido del curso es el mismo.
¿Qué se entiende por estadística?

¿Cuál es la definición de estadística? Nos topamos con


ella en el lenguaje cotidiano. En realidad, posee dos
significados: en su acepción más común, la estadística se
refiere a información numérica.
Tipos de estadística
 Estadística descriptiva.
 Estadística inferencial.
Comprender las diferencias entre muestra y
población.

¿Por qué tomar una muestra en lugar de estudiar a


cada miembro de la población?
¿Por qué tomar una muestra en lugar de estudiar a
cada miembro de la población?

 Establecer contacto con toda la población requeriría mucho tiempo.


 El costo de estudiar todos los elementos de una población resultaría
prohibitivo.
 Es imposible verificar de manera física todos los elementos de la
población.
 Algunas pruebas son de naturaleza destructiva.
 Los resultados de la muestra son adecuados.
POBLACIÓN
MUESTRA
Tipos de variables.
Existen dos tipos básicos de variables:
1) cualitativas
2) cuantitativas

 Cuando la característica que se estudia es de naturaleza no


numérica, recibe el nombre de variable cualitativa o
atributo.
 Cuando la variable que se estudia aparece en forma
numérica, se le denomina variable cuantitativa.
Variables
Niveles de medición
Datos de nivel nominal
En el caso del nivel nominal de medición, las
observaciones acerca de una variable cualitativa sólo se
clasifican y se cuentan.

Los datos a nivel nominal tiene las siguientes propiedades:

1. La variable de interés se divide en categorías o resultados.

2. No existe un orden natural de los resultados.


Datos de nivel ordinal
Las propiedades del nivel ordinal de los
datos son las siguientes:

1. Las clasificaciones de los datos se encuentran representadas por


conjuntos de etiquetas o nombres (alto, medio, bajo), las cuales tienen
valores relativos.

2. En consecuencia, los valores relativos de los datos se pueden clasificar u


ordenar.
Datos de nivel de intervalo

El nivel de intervalo de medición es el nivel inmediato


superior. Incluye todas las características del nivel ordinal,
pero, además, la diferencia entre valores constituye una
magnitud constante.

Las propiedades de los datos de nivel de intervalo son las


siguientes:

1. Las clasificaciones de datos se ordenan de acuerdo con el grado que posea


de la característica en cuestión.

2. Diferencias iguales en la característica representan diferencias iguales en las


mediciones.
Datos de nivel de razón

Todos los datos cuantitativos son registrados en el nivel de razón de la


medición. El nivel de razón es el más alto. Posee todas las características
del nivel de intervalo, aunque, además, el punto 0 tiene sentido y la razón
entre dos números es significativa.

Las propiedades de los datos de nivel de intervalo son las siguientes:

1. Las clasificaciones de datos se ordenan de acuerdo con la cantidad de


características que poseen.

2. Diferencias iguales en la característica representan diferencias iguales en los


números asignados a las clasificaciones.

3. El punto cero representa la ausencia de características y la razón entre dos


números es significativa.
UNIDAD DOS
Frecuencia, medidas de dispersión y
análisis de datos.

Bibliografía:
Básica:
Ronald E. Walpole, Probabilidad y estadísticas para ingeniería y
ciencias, novena edición, editorial Pearson, 2012.
Complementaria:
Douglas A. Lind, Estadística aplicada a la administración y
economía, decimoquinta edición, editorial MacGrawHill, 2012.
TABLA DE FRECUENCIAS

Es el primer procedimiento que se emplea para organizar y resumir un


conjunto de datos es una tabla de frecuencias.

Frecuencias relativas de clase


Representación gráfica de datos
cualitativos
ngo
ervalo CONSTRUCCIÓN DE DISTRIBUCIONES
K= DE FRECUENCIAS: DATOS
mplitud R/K = CUANTITATIVOS

RANGO: Es el rango de valores que son posibles encontrar en la clase. Este valor se
obtiene restando el valor superior que se pueden encontrar en la muestra y el valor
inferior. La amplitud o longitud de una clase es el número de valores o variables que
concurren a una clase determinada.

INTERVALO DE CLASES: El número de clases puede ser estimado usando el valor


redondeado de la regla de Sturge, N=1+3,322log(n) N = 1 + 3,322 log ( n ) , donde N
es el número de clases y n es el número de elementos en el conjunto de datos.

AMPLITUD DEL INTERVALO DE CLASE: Es igual al rango para el intervalo de clase (


R/K)

MARCA DE CLASE: Es el punto medio de cada intervalo. La marca de clase es el valor


que representa a todo el intervalo para el cálculo de algunos parámetros como la
media aritmética o la desviación típica.
TABLA DE FRECUENCIAS ABSOLUTA Y RELATIVAS
BATERÍAS TIEMPO DE VIDA

Y-1 Yi M TAB fi fA fr FRA


1,6 2,22 1,91 III 3 3 0,08 0,08
2,22 2,84 2,53 II 2 5 0,05 0,13
2,84 3,46 3,15 IIIIIIIIIIIIIIIII 17 22 0,43 0,55
3,46 4,08 3,77 IIIIIIIIII 10 32 0,25 0,80
4,08 4,7 4,39 IIIIIIII 8 40 0,20 1,00
N= 40 1
Polígono de frecuencias.
También muestra la forma que tiene una distribución y es similar a un
histograma. Consiste en segmentos de recta que conectan los puntos que
forman las intersecciones de los puntos medios de clase y las frecuencias de
clase
Distribuciones de frecuencia acumulativas.

Distribución de frecuencias acumulativas con representación


gráfica de un polígono de frecuencias acumulativas.

BATERIAS_TIEMPO_DE_VIDA
1,2

0,8

0,6

0,4

0,2

0
0 1 2 3 4 5 6 7 8
Descripción de datos
(Media, Mediana, Moda)
Las medidas de localización están diseñadas para brindar al analista algunos valores
cuantitativos de la ubicación central o de otro tipo de los datos en una muestra.
Media ponderada

La media ponderada, que constituye un caso especial de la media aritmética, se


presenta cuando hay varias observaciones con el mismo valor

Mediana

Punto medio de los valores una vez que se han ordenado de menor a mayor o de
mayor a menor.

Moda
Valor de la observación que aparece con mayor frecuencia.
POSICIONES RELATIVAS DE LA MEDIA, LA
MEDIANA Y LA MODA
Gráficas de tallo y hojas

Ejemplo: Edad de 20 personas


36 25 37 24 39 20 36
45 31 31 39 24 29 23
41 40 33 24 34 40

Se seleccionan primero los tallos que en este caso son las cifras de
decenas, es decir 3, 2, 4, que reordenadas son 2, 3 y 4.

A continuación se realiza un recuento «añadiendo» cada hoja a


su tallo
Por último se reordena las hojas

COMPARAR DOS DISTRIBUCIONES


Una segunda distribución 35
39
38
24
32
24
28
34
30
26
29
41
27
29
19
48
48
28
40
22

De ella se elabora sus diagrama de Tallos y Hojas y compararlos


Gráfica de caja y bigote o gráfica de
caja
Otra presentación que es útil para reflejar propiedades de una muestra es la
gráfica de caja y bigote, la cual encierra el rango intercuartil de los datos en una
caja que contiene la mediana representada. El rango intercuartil tiene como
extremos el percentil 75 (cuartil superior) y el percentil 25 (cuartil inferior).

Ejemplo distribución de edades

36 25 37 24 39 20 36
45 31 31 39 24 29 23
41 40 33 24 34 40

Ordenar los datos


Para calcular los parámetros estadístico, lo primero es ordenar la distribución:
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45
Calculo de Cuartiles.
Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la
distribución. Como N = 20 resulta que N/4 = 5; el primer cuartil es la media
aritmética de dicho valor y el siguiente:

Q1=(24 + 25) / 2 = 24,5

Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el


valor de la variable que ocupa el lugar central en un conjunto de datos
ordenados. Como N/2 =10 ; la mediana es la media aritmética de dicho valor
y el siguiente:

me= Q2 = (33 + 34)/ 2 =33,5

Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la


distribución. En nuestro caso, como 3N / 4 = 15, resulta

Q2=(39 + 39) / 2 = 39
GRAFICO DEL DIAGRAMA DE CAJAS

El bigote de la izquierda representa al colectivo de edades ( Xmín, Q1)


La primera parte de la caja a (Q1, Q2),
La segunda parte de la caja a (Q2, Q3)
El bigote de la derecha viene dado por (Q3, Xmáx).
IMPORTANTES OJO
ANÁLISIS
La parte izquierda de la caja es mayor que la de la derecha; ello quiere
decir que las edades comprendidas entre el 25% y el 50% de la población
está más dispersa que entre el 50% y el 75%.

El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha; por


ello el 25% de los más jóvenes están más concentrados que el 25% de los
mayores.

El rango intercuartílico = Q3 - Q1 = 14,5; es decir, el 50% de la población está


comprendido en 14,5 años.

PARA QUE EL ANÁLISIS SEA MAS REPRESENTATIVO ES IMPORTANTE REALIZAR


LA COMPARACIÓN DE DISTRIBUCIONES

En el ejemplo es seria la distribución de edad de un periodo con otro.


MEDIDAS DE DISPERSIÓN
Rango
La medida más simple de dispersión es el rango. Representa la diferencia entre los
valores máximo y mínimo de un conjunto de datos. En forma de ecuación:

Desviación media
Media aritmética de los valores absolutos de las desviaciones con respecto a la media
aritmética.
Varianza
Media aritmética de las desviaciones de la media elevadas al cuadrado.

Desviación estándar
Raíz cuadrada de la varianza.
Desviación estándar de datos agrupados

La desviación estándar normalmente se utiliza como medida para comparar la


dispersión de dos o más conjuntos de observaciones.

INTERPRETACIÓN Y USOS DE LA DESVIACIÓN ESTÁNDAR


Teorema de Chebyshev
La regla empírica

En cualquier distribución de frecuencias simétrica con forma de campana,


aproximadamente 68% de las observaciones se encontrarán entre más y menos
una desviación estándar de la media; cerca de 95% de las observaciones se
encontrarán entre más y menos dos desviaciones estándares de la media y, de
hecho todas (99.7%), estarán entre más y menos tres desviaciones estándares de
la media.
Sesgo estadístico
ANÁLISIS DE TABLAS DE
CONTINGENCIAS

También podría gustarte