01 Guía Estadistica para Ingenieros I A La Semana 8

UNIVERSIDAD ESTATAL PENÍNSULA DE SANTA ELENA
FACULTAD DE CIENCIAS DE LA INGENIERÍA

CARRERA DE INGENIERÍA CIVIL
ESTADÍSTICA PARA INGENIEROS I

ESTADÍSTICA PARA INGENIEROS I
Bibliografía:
Básica:
Ronald E. Walpole, Probabilidad y estadísticas para ingeniería
y ciencias, novena edición, editorial Pearson, 2012.
Complementaria:
Douglas A. Lind, Estadística aplicada a la administración y
economía, decimoquinta edición, editorial MacGrawHill, 2012.
UNIDAD UNO
INTRODUCCIÓN A LA ESTADÍSTICA PARA

INGENIEROS.
Si revisa el plan de estudios de la universidad, se dará
cuenta de que varios programas universitarios incluyen la
estadística. ¿Por qué razón? ¿Cuáles son las diferencias
entre los cursos de estadística que se imparten en la
Facultad de Ingeniería, los Departamentos de Psicología o
Sociología en la Escuela de Artes Liberales y la Facultad de
Administración? La diferencia principal consiste en los
ejemplos que se utilizan. El contenido del curso es el mismo.
¿Qué se entiende por estadística?
¿Cuál es la definición de estadística? Nos topamos con

ella en el lenguaje cotidiano. En realidad, posee dos
significados: en su acepción más común, la estadística se
refiere a información numérica.
Tipos de estadística
 Estadística descriptiva.
 Estadística inferencial.
Comprender las diferencias entre muestra y
población.
¿Por qué tomar una muestra en lugar de estudiar a

cada miembro de la población?
¿Por qué tomar una muestra en lugar de estudiar a
cada miembro de la población?
 Establecer contacto con toda la población requeriría mucho tiempo.

 El costo de estudiar todos los elementos de una población resultaría
prohibitivo.
 Es imposible verificar de manera física todos los elementos de la
población.
 Algunas pruebas son de naturaleza destructiva.
 Los resultados de la muestra son adecuados.
POBLACIÓN
MUESTRA
Tipos de variables.
Existen dos tipos básicos de variables:
1) cualitativas
2) cuantitativas
 Cuando la característica que se estudia es de naturaleza no

numérica, recibe el nombre de variable cualitativa o
atributo.
 Cuando la variable que se estudia aparece en forma
numérica, se le denomina variable cuantitativa.
Variables
Niveles de medición
Datos de nivel nominal
En el caso del nivel nominal de medición, las
observaciones acerca de una variable cualitativa sólo se
clasifican y se cuentan.
Los datos a nivel nominal tiene las siguientes propiedades:
1. La variable de interés se divide en categorías o resultados.
2. No existe un orden natural de los resultados.

Datos de nivel ordinal
Las propiedades del nivel ordinal de los
datos son las siguientes:
1. Las clasificaciones de los datos se encuentran representadas por

conjuntos de etiquetas o nombres (alto, medio, bajo), las cuales tienen
valores relativos.
2. En consecuencia, los valores relativos de los datos se pueden clasificar u

ordenar.
Datos de nivel de intervalo
El nivel de intervalo de medición es el nivel inmediato

superior. Incluye todas las características del nivel ordinal,
pero, además, la diferencia entre valores constituye una
magnitud constante.
Las propiedades de los datos de nivel de intervalo son las

siguientes:
1. Las clasificaciones de datos se ordenan de acuerdo con el grado que posea

de la característica en cuestión.
2. Diferencias iguales en la característica representan diferencias iguales en las

mediciones.
Datos de nivel de razón
Todos los datos cuantitativos son registrados en el nivel de razón de la

medición. El nivel de razón es el más alto. Posee todas las características
del nivel de intervalo, aunque, además, el punto 0 tiene sentido y la razón
entre dos números es significativa.
Las propiedades de los datos de nivel de intervalo son las siguientes:
1. Las clasificaciones de datos se ordenan de acuerdo con la cantidad de

características que poseen.
2. Diferencias iguales en la característica representan diferencias iguales en los

números asignados a las clasificaciones.
3. El punto cero representa la ausencia de características y la razón entre dos

números es significativa.
UNIDAD DOS
Frecuencia, medidas de dispersión y
análisis de datos.
Bibliografía:
Básica:
Ronald E. Walpole, Probabilidad y estadísticas para ingeniería y
ciencias, novena edición, editorial Pearson, 2012.
Complementaria:
Douglas A. Lind, Estadística aplicada a la administración y
economía, decimoquinta edición, editorial MacGrawHill, 2012.
TABLA DE FRECUENCIAS
Es el primer procedimiento que se emplea para organizar y resumir un

conjunto de datos es una tabla de frecuencias.
Frecuencias relativas de clase

Representación gráfica de datos
cualitativos
ngo
ervalo CONSTRUCCIÓN DE DISTRIBUCIONES
K= DE FRECUENCIAS: DATOS
mplitud R/K = CUANTITATIVOS
RANGO: Es el rango de valores que son posibles encontrar en la clase. Este valor se
obtiene restando el valor superior que se pueden encontrar en la muestra y el valor
inferior. La amplitud o longitud de una clase es el número de valores o variables que
concurren a una clase determinada.
INTERVALO DE CLASES: El número de clases puede ser estimado usando el valor

redondeado de la regla de Sturge, N=1+3,322log(n) N = 1 + 3,322 log ( n ) , donde N
es el número de clases y n es el número de elementos en el conjunto de datos.
AMPLITUD DEL INTERVALO DE CLASE: Es igual al rango para el intervalo de clase (

R/K)
MARCA DE CLASE: Es el punto medio de cada intervalo. La marca de clase es el valor

que representa a todo el intervalo para el cálculo de algunos parámetros como la
media aritmética o la desviación típica.
TABLA DE FRECUENCIAS ABSOLUTA Y RELATIVAS
BATERÍAS TIEMPO DE VIDA
Y-1 Yi M TAB fi fA fr FRA

1,6 2,22 1,91 III 3 3 0,08 0,08
2,22 2,84 2,53 II 2 5 0,05 0,13
2,84 3,46 3,15 IIIIIIIIIIIIIIIII 17 22 0,43 0,55
3,46 4,08 3,77 IIIIIIIIII 10 32 0,25 0,80
4,08 4,7 4,39 IIIIIIII 8 40 0,20 1,00
N= 40 1
Polígono de frecuencias.
También muestra la forma que tiene una distribución y es similar a un
histograma. Consiste en segmentos de recta que conectan los puntos que
forman las intersecciones de los puntos medios de clase y las frecuencias de
clase
Distribuciones de frecuencia acumulativas.
Distribución de frecuencias acumulativas con representación

gráfica de un polígono de frecuencias acumulativas.
BATERIAS_TIEMPO_DE_VIDA
1,2
0,8
0,6
0,4
0,2
0
0 1 2 3 4 5 6 7 8
Descripción de datos
(Media, Mediana, Moda)
Las medidas de localización están diseñadas para brindar al analista algunos valores
cuantitativos de la ubicación central o de otro tipo de los datos en una muestra.
Media ponderada
La media ponderada, que constituye un caso especial de la media aritmética, se

presenta cuando hay varias observaciones con el mismo valor
Mediana
Punto medio de los valores una vez que se han ordenado de menor a mayor o de
mayor a menor.
Moda
Valor de la observación que aparece con mayor frecuencia.
POSICIONES RELATIVAS DE LA MEDIA, LA
MEDIANA Y LA MODA
Gráficas de tallo y hojas
Ejemplo: Edad de 20 personas

36 25 37 24 39 20 36
45 31 31 39 24 29 23
41 40 33 24 34 40
Se seleccionan primero los tallos que en este caso son las cifras de
decenas, es decir 3, 2, 4, que reordenadas son 2, 3 y 4.
A continuación se realiza un recuento «añadiendo» cada hoja a

su tallo
Por último se reordena las hojas
COMPARAR DOS DISTRIBUCIONES

Una segunda distribución 35
39
38
24
32
24
28
34
30
26
29
41
27
29
19
48
48
28
40
22
De ella se elabora sus diagrama de Tallos y Hojas y compararlos

Gráfica de caja y bigote o gráfica de
caja
Otra presentación que es útil para reflejar propiedades de una muestra es la
gráfica de caja y bigote, la cual encierra el rango intercuartil de los datos en una
caja que contiene la mediana representada. El rango intercuartil tiene como
extremos el percentil 75 (cuartil superior) y el percentil 25 (cuartil inferior).
Ejemplo distribución de edades
36 25 37 24 39 20 36
45 31 31 39 24 29 23
41 40 33 24 34 40
Ordenar los datos

Para calcular los parámetros estadístico, lo primero es ordenar la distribución:
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45
Calculo de Cuartiles.
Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la
distribución. Como N = 20 resulta que N/4 = 5; el primer cuartil es la media
aritmética de dicho valor y el siguiente:
Q1=(24 + 25) / 2 = 24,5
Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el

valor de la variable que ocupa el lugar central en un conjunto de datos
ordenados. Como N/2 =10 ; la mediana es la media aritmética de dicho valor
y el siguiente:
me= Q2 = (33 + 34)/ 2 =33,5
Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la

distribución. En nuestro caso, como 3N / 4 = 15, resulta
Q2=(39 + 39) / 2 = 39
GRAFICO DEL DIAGRAMA DE CAJAS
El bigote de la izquierda representa al colectivo de edades ( Xmín, Q1)

La primera parte de la caja a (Q1, Q2),
La segunda parte de la caja a (Q2, Q3)
El bigote de la derecha viene dado por (Q3, Xmáx).
IMPORTANTES OJO
ANÁLISIS
La parte izquierda de la caja es mayor que la de la derecha; ello quiere
decir que las edades comprendidas entre el 25% y el 50% de la población
está más dispersa que entre el 50% y el 75%.
El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha; por

ello el 25% de los más jóvenes están más concentrados que el 25% de los
mayores.
El rango intercuartílico = Q3 - Q1 = 14,5; es decir, el 50% de la población está

comprendido en 14,5 años.
PARA QUE EL ANÁLISIS SEA MAS REPRESENTATIVO ES IMPORTANTE REALIZAR

LA COMPARACIÓN DE DISTRIBUCIONES
En el ejemplo es seria la distribución de edad de un periodo con otro.

MEDIDAS DE DISPERSIÓN
Rango
La medida más simple de dispersión es el rango. Representa la diferencia entre los
valores máximo y mínimo de un conjunto de datos. En forma de ecuación:
Desviación media
Media aritmética de los valores absolutos de las desviaciones con respecto a la media
aritmética.
Varianza
Media aritmética de las desviaciones de la media elevadas al cuadrado.
Desviación estándar
Raíz cuadrada de la varianza.
Desviación estándar de datos agrupados
La desviación estándar normalmente se utiliza como medida para comparar la

dispersión de dos o más conjuntos de observaciones.
INTERPRETACIÓN Y USOS DE LA DESVIACIÓN ESTÁNDAR

Teorema de Chebyshev
La regla empírica
En cualquier distribución de frecuencias simétrica con forma de campana,

aproximadamente 68% de las observaciones se encontrarán entre más y menos
una desviación estándar de la media; cerca de 95% de las observaciones se
encontrarán entre más y menos dos desviaciones estándares de la media y, de
hecho todas (99.7%), estarán entre más y menos tres desviaciones estándares de
la media.
Sesgo estadístico
ANÁLISIS DE TABLAS DE
CONTINGENCIAS

01 Guía Estadistica para Ingenieros I A La Semana 8

Cargado por

Copyright:

Formatos disponibles

01 Guía Estadistica para Ingenieros I A La Semana 8

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

01 Guía Estadistica para Ingenieros I A La Semana 8

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD ESTATAL PENÍNSULA DE SANTA ELENA

FACULTAD DE CIENCIAS DE LA INGENIERÍA

ESTADÍSTICA PARA INGENIEROS I

INTRODUCCIÓN A LA ESTADÍSTICA PARA

¿Cuál es la definición de estadística? Nos topamos con

¿Por qué tomar una muestra en lugar de estudiar a

 Establecer contacto con toda la población requeriría mucho tiempo.

 Cuando la característica que se estudia es de naturaleza no

Los datos a nivel nominal tiene las siguientes propiedades:

1. La variable de interés se divide en categorías o resultados.

2. No existe un orden natural de los resultados.

1. Las clasificaciones de los datos se encuentran representadas por

2. En consecuencia, los valores relativos de los datos se pueden clasificar u

El nivel de intervalo de medición es el nivel inmediato

Las propiedades de los datos de nivel de intervalo son las

1. Las clasificaciones de datos se ordenan de acuerdo con el grado que posea

2. Diferencias iguales en la característica representan diferencias iguales en las

Todos los datos cuantitativos son registrados en el nivel de razón de la

Las propiedades de los datos de nivel de intervalo son las siguientes:

1. Las clasificaciones de datos se ordenan de acuerdo con la cantidad de

2. Diferencias iguales en la característica representan diferencias iguales en los

3. El punto cero representa la ausencia de características y la razón entre dos

Es el primer procedimiento que se emplea para organizar y resumir un

Frecuencias relativas de clase

INTERVALO DE CLASES: El número de clases puede ser estimado usando el valor

AMPLITUD DEL INTERVALO DE CLASE: Es igual al rango para el intervalo de clase (

MARCA DE CLASE: Es el punto medio de cada intervalo. La marca de clase es el valor

Y-1 Yi M TAB fi fA fr FRA

Distribución de frecuencias acumulativas con representación

La media ponderada, que constituye un caso especial de la media aritmética, se

Ejemplo: Edad de 20 personas

A continuación se realiza un recuento «añadiendo» cada hoja a

COMPARAR DOS DISTRIBUCIONES

De ella se elabora sus diagrama de Tallos y Hojas y compararlos

Ejemplo distribución de edades

Ordenar los datos

Q1=(24 + 25) / 2 = 24,5

Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el

me= Q2 = (33 + 34)/ 2 =33,5

Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la

El bigote de la izquierda representa al colectivo de edades ( Xmín, Q1)

El bigote de la izquierda (Xmím, Q1) es más corto que el de la derecha; por

El rango intercuartílico = Q3 - Q1 = 14,5; es decir, el 50% de la población está

PARA QUE EL ANÁLISIS SEA MAS REPRESENTATIVO ES IMPORTANTE REALIZAR

En el ejemplo es seria la distribución de edad de un periodo con otro.

La desviación estándar normalmente se utiliza como medida para comparar la

INTERPRETACIÓN Y USOS DE LA DESVIACIÓN ESTÁNDAR

En cualquier distribución de frecuencias simétrica con forma de campana,

También podría gustarte