ESTADÍSTICA
ESTADÍSTICA
ESTADÍSTICA
ndice
Unidad I:
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
Introduccin ................................................................................................. 1
Variables discretas y continuas ....................................................................... 4
Redondeo de datos........................................................................................ 4
Cifras significativas ........................................................................................ 4
Funciones ..................................................................................................... 6
Distribucin de frecuencias - proceso de tabulacin de la informacin ................ 7
6.1.
La representacin de los datos: frecuencias .......................................... 9
6.2.
Tabla de distribucin de frecuencias ................................................... 13
6.3.
Representaciones grficas de la distribucin de frecuencias .................. 15
6.4.
Histogramas de frecuencias ............................................................... 16
6.5.
Polgono de frecuencias ..................................................................... 16
6.6.
Ojivas .............................................................................................. 17
Medidas de tendencia central ....................................................................... 19
7.1.
La media aritmtica........................................................................... 20
7.2.
La mediana ...................................................................................... 22
7.3.
La moda........................................................................................... 25
7.4.
Cuartiles poblacionales y muestrales ................................................... 26
7.5.
Percentiles poblacionales y muestrales ................................................ 26
Medidas de dispersin.................................................................................. 28
8.1.
Rango .............................................................................................. 28
8.2.
Desviacin media .............................................................................. 29
8.3.
Varianza y desviacin estndar .......................................................... 32
8.4.
Coeficiente de variacin (PEARSON) ................................................... 34
Errores ....................................................................................................... 37
9.1.
Clasificacin de errores ...................................................................... 37
9.2.
Cuantificacin de los errores .............................................................. 40
Rechazo de un resultado (valores atpicos, outliners) ...................................... 41
10.1. Prueba de la Q.................................................................................. 41
10.2. Prueba de GRUBBS ........................................................................... 43
Regresin lineal simple. Anlisis de regresin ................................................ 44
11.1. Clculo de las lneas de ajuste y sus ecuaciones. ................................. 45
11.2. Coeficiente de correlacin lineal de PEARSON. ..................................... 48
Unidad II:
1.
2.
3.
Introduccin ............................................................................................... 57
Distribucin de probabilidad continua ............................................................ 59
Modelos de distribucin de probabilidad de variables continuas ....................... 69
3.1.
La distribucin normal ....................................................................... 72
TECSUP - PFR
Unidad IV:
1.
2.
3.
4.
DISEO DE EXPERIMENTOS
TECSUP PFR
UNIDAD I
HERRAMIENTAS ESTADSTICAS DE CONTROL
1.
INTRODUCCIN
La estadstica es una ciencia matemtica que se refiere a la coleccin, estudio e
interpretacin de los datos obtenidos en un estudio. Es aplicable a una amplia
variedad de disciplinas, desde la fsica hasta las ciencias sociales y es usada en la
toma de decisiones en reas de negocios e instituciones gubernamentales.
La Estadstica se divide en dos ramas:
La estadstica descriptiva, que se dedica a los mtodos de recoleccin,
descripcin, visualizacin y resumen de datos originados a partir de los
fenmenos en estudio. Los datos pueden ser resumidos numrica o
grficamente. Ejemplos bsicos de descriptores numricos son la media y la
desviacin estndar. Resmenes grficos incluyen varios tipos de figuras y
grficos.
La inferencia estadstica, que se dedica a la generacin de los modelos,
inferencias y predicciones asociadas a los fenmenos en cuestin teniendo en
cuenta lo aleatorio e incertidumbre en las observaciones. Se usa para modelar
patrones en los datos y extraer inferencias acerca de la poblacin de estudio.
Estas inferencias pueden tomar la forma de repuestas a preguntas si/no
(prueba de hiptesis), estimaciones de caractersticas numricas (estimacin,
pronsticos de futuras observaciones, descripciones de asociacin
(correlacin) o modelamiento de relaciones entre variables (anlisis de
regresin). Otras tcnicas de modelamiento incluyen ANOVA, series de tiempo
y minera de datos.
Ambas ramas (descriptiva e inferencial) comprenden la estadstica aplicada. Hay
tambin una disciplina llamada estadstica matemtica, la cual se refiere a las
bases tericas de la materia. La palabra estadsticas tambin se refiere al
resultado de aplicar un algoritmo estadstico a un conjunto de datos, como en
estadsticas econmicas, estadsticas criminales, etc.
Al aplicar estadstica a un problema cientfico, industrial o social, se comienza con
un proceso o poblacin a ser estudiado. Esta puede ser una poblacin de
personas en un pas, de granos cristalizados en una roca o de bienes
manufacturados por una fbrica en particular durante un periodo dado. Tambin
podra ser un proceso observado en varios instantes y los datos recogidos de
esta manera constituyen una serie de tiempo.
TECSUP PFR
TECSUP PFR
2.
TECSUP PFR
3.
REDONDEO DE DATOS
Es una tcnica que permite, ver o manejar una cifra con una determinada
cantidad de nmeros diferentes de cero.
0,04
4 10 2
4 10 2
4.
CIFRAS SIGNIFICATIVAS
El eslabn ms dbil en la cadena de cualquier anlisis est determinado por la
medicin que se efecte con la menor exactitud. No vale la pena esforzarse en
efectuar otras mediciones del anlisis con mayor exactitud que esta medicin
limitante. El nmero de cifras significativas puede definirse como el nmero de
dgitos necesarios para explicar los resultados de una medicin conforme a la
precisin medida.
TECSUP PFR
Cada dgito representa la cantidad real que especifica. Por ejemplo en el nmero
237 se tiene dos centenas, tres decenas y siete unidades.
El dgito cero puede ser parte significativa de la medicin o usarse simplemente
para sealar el punto decimal. El nmero de cifras significativas en una medicin
es independiente del lugar que ocupa el punto decimal. Por ejemplo, considrese
el nmero 92,067. Este nmero tiene cinco cifras significativas, sin importar el
sitio en que se coloque el punto decimal; por ejemplo 92,067 micrmetros,
9,2067 cm., 0,92067 decmetros y 0,092067 metros tienen todos los mismos
nmeros de cifras significativas. Representan simplemente las distintas maneras
(unidades) de expresar una medicin.
En el ltimo nmero, el cero entre el punto decimal y el 9, se emplean tan slo
para indicar el lugar del punto decimal. No existe duda con respecto a que
cualquier cero que se encuentre despus del punto decimal es significativo, o
que se usa para indicar el lugar del punto decimal. En el nmero 727,0 el cero no
se emplea para indicar el lugar del punto decimal, pero forma parte significativa
del nmero.
Puede haber ambigedad cuando el cero se encuentra otros dos nmeros
enteros distintos de cero; por ejemplo en el caso de 92,067. El nmero 936,600;
es imposible determinar si uno, ambos o ninguno de los ceros se emplean para
indicar el lugar del punto decimal o si son parte de la medicin. En estos casos es
mejor escribir nicamente las cifras significativas de las cuales se tiene certeza y
despus localizar el punto decimal por una expresin de 10 elevado a la potencia
correspondiente.
Son cifras significativas los dgitos necesarios para expresar los resultados de una
medicin con la precisin con que se hizo. No se tienen en cuenta, el nmero de
ceros para situar el punto decimal.
Ejemplo:
TECSUP PFR
11,2169 g.
10,8114 g.
0,04055 g.
Ejemplo:
Peso del frasco ms las muestras
Peso del frasco slo
Peso de las muestras
11,2169 g.
10,81 g.
0,04069 g.
FUNCIONES
Si cada valor que la variable x pueda tomar le corresponde un nico valor de la
otra variable y, decimos que y es funcin de x y escribimos y=f(x), y se lee: y es
igual a f de x.
X es la variable independiente
Y es la variable dependiente
Ejemplo: La poblacin total P del Per es una funcin del tiempo t, y escribimos
p=f(t).
La tensin s de un muelle es funcin del peso w colocado al final del muelle, as:
s=f(w).
6
TECSUP PFR
TECSUP PFR
TECSUP PFR
(escala
de
TECSUP PFR
10
TECSUP PFR
Xn
frecuencias
absolutas
fi
f1
f2
fn
Frecuencias relativas
fi/N
f1/N
f2/N
fn/N
Xn-1-Xn
Marcas de Clases
Xi
X1
X2
Xn
Frecuencias Absolutas
fi
f1
f2
fn
X X
Xi = ------------- = Marca de clases
2
N = fi = Nmero de observaciones
C = X X = Amplitud del intervalo
11
TECSUP PFR
Donde
Por ltimo, en el caso de variables no mensurables, dicha tabla adoptar
una forma como la siguiente:
Tabla 3: Variable Ordinales
Variable
Caracterstica A
Caracterstica B
Caracterstica Z
Frecuencias
fA
fB
fZ
TECSUP PFR
Solucin:
1. Efectuar el arreglo ordenado de la poblacin o muestra:
A= (7.42, 8.15, , , , 90.99, 93.91)
Donde: X1 = valor mnimo = 7.42
Xn= valor mximo = 93.91
2. Encontrar el rengo o recorrido de los datos: R
R = valor mayor valor menor = Xn X1 = 93.91 7.42 = 86.49
13
TECSUP PFR
P.M.
fi
fr
fa
Xi
14.628 10 0.33 10
29.043 4 0.13 14
43.458 5 0.17 19
57.873 3 0.10 22
72.288 3 0.10 25
86.703 5 0.17 30
XXX
30 1.00 XXX
fa
fra
fra
30
20
16
11
8
5
XXX
0.33
0.46
0.63
0.73
0.83
1.00
XXX
1.00
0.67
0.54
0.37
0.27
0.17
XXX
Tabla 4.
Simbologa utilizada:
XI
fi
fr
fa
fa
fra
fra
Nota:
14
TECSUP PFR
6.3.
REPRESENTACIONES
FRECUENCIAS
GRFICAS
DE
LA
DISTRIBUCIN
DE
15
TECSUP PFR
HISTOGRAMAS DE FRECUENCIAS
Un histograma es un grfico que sirve para representar una distribucin
de frecuencias. Este grfico est formado por un conjunto de rectngulos
(caso de variables continuas) que tienen como base un eje horizontal
(generalmente el eje de las abscisas o de las X), y como centro los puntos
medios de las clases. Los anchos de las clases y las reas de los
rectngulos son proporcionales a las frecuencias de las clases. En el caso
de las variables discretas el grfico consiste de un conjunto de barras
verticales en lugar de rectngulos, hallndose cada barra sobre la
observacin respectiva y con una altura proporcional a la frecuencia de la
observacin.
6.5.
POLGONO DE FRECUENCIAS
El polgono de frecuencias es un grfico formado por lneas quebradas,
que tiene los centros de las clases representadas en un eje horizontal (eje
de las X) y las frecuencias de las clases en un eje vertical (eje de las Y).
La frecuencia correspondiente a cada centro de clase se seala mediante
un punto y luego los puntos consecutivos se unen por lneas rectas.
16
TECSUP PFR
6.6.
OJIVAS
Las ojivas se refieren a los grficos que se construyen utilizando una
distribucin acumulativa de frecuencias, el orden de acumulacin se aplica
al cuadro de distribucin de frecuencia y puede ser descendente (fa,
fra) o ascendente (fa, fra). La figura que se forma al unir los puntos
del polgono de frecuencias acumulativas es lo contrario del orden
anunciado (por ejemplo si se utiliz el orden descendente en la
acumulacin de los datos en el cuadro, la ojiva resulta ser ascendente).
17
TECSUP PFR
Ejercicios
Problema 1: Variable Continua
En la siguiente tabla se presentan los pesos de 40 estudiantes de la
Universidad de Panam, con una aproximacin de una libra.
138
146
168
146
161
164
164
126
173
145
150
140
138
142
135
132
147
176
147
142
144
136
163
135
150
125
148
118
153
156
149
152
154
140
145
157
144
165
135
126
4
1
1
1
5
2
2
1
3
1
3
1
2
4
4
5
4
1
1
2
3
1
2
1
3
5
2
3
3
1
3
1
2
5
2
3
4
3
4
5
5
1
3
2
1
Problema 3
Una compaa de transmisiones electrnicas registro como sigue el
nmero de recibos de servicios prestados por cada una de sus 20
sucursales en el ltimo mes:
808
335
641
459
628
727
731
848
641
229
446
347
342
309
545
649
910
575
568
757
18
TECSUP PFR
7.
18
56
58
62
66
63
36
53
62
83
84
50
62
61
63
38
50
62
61
63
54
34
43
52
58
50
44
52
60
61
59
41
53
60
71
7.1.
TECSUP PFR
LA MEDIA ARITMTICA
La medida de tendencia central mas ampliamente usada es la media
aritmtica, usualmente abreviada como media.
Propiedades de la media aritmtica
1. Puede ser calculada en distribuciones con escala relativa e intervalar.
forma de
imposible
queremos
base a la
Donde:
_
X
X
f
fX
n
X = fX
n
20
TECSUP PFR
Ejemplo:
Calcular la media aritmtica de la siguiente distribucin de frecuencia del
nmero de meses de duracin de una muestra de 40 sacos de sulfato de
calcio.
duracin de las
sacos (meses)
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
Nmero
de sacos
2
1
4
15
10
5
3
LI
15
20
25
30
35
40
45
LS
19
24
29
34
39
44
49
X = fx
n
X
17
22
27
32
37
42
47
F
2
1
4
15
10
5
3
n =40
= 1365
40
FX
34
22
108
480
370
210
141
fX = 1365
= 34.12
21
TECSUP PFR
Donde:
X
X
n
Ejemplo:
El peso neto del contenido de cinco botellas de perfume Giorgio
seleccionadas de forma aleatoria de la lnea de produccin son (en
gramos): 85.4, 85.3, 84.9, 85.4, y 84.0. Cul es la media aritmtica de
las observaciones muestreadas?
X = x
n
= 85.4+85.3+84.9+85.4+84.0 =85.0
5
X
N
Donde:
simboliza la media de la poblacin.
N simboliza el tamao de la poblacin, es decir, el nmero total de
observaciones en la poblacin.
As como todas las medidas caractersticas de una muestra son llamadas
estadsticos, las medidas caractersticas de una poblacin se denominan
parmetros.
7.2.
LA MEDIANA
Cuando una serie de datos contiene uno o dos valores muy grandes o
muy pequeos, la media aritmtica no es representativa. El valor central
en tales problemas puede ser mejor descrito usando una medida de
tendencia central llamada mediana.
22
TECSUP PFR
mediana =
Ejemplo:
Una muestra de los volmenes medidos en una titulacin revel estas
cantidades: 35, 29, 30, 25, 32, 35 mililitros. Cul es la mediana?.
25
29
30
32
35
35
mediana
X = 30 + 32 = 31
2
Propiedades de la mediana:
1. Hay solo una mediana en una serie de datos.
23
TECSUP PFR
1. Calcular el valor n / 2
X = LSR +
( n / 2 ) fa
f
( tic )
Ejemplo:
Calcular mediana de la siguiente distribucin de frecuencia del nmero de
meses de duracin de una muestra de 40 sacos de sulfato de calcio.
Duracin de los
sacos (meses)
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
Nmero
de sacos
2
1
4
15
10
5
3
El valor de ( n / 2 ) = 40 / 2 = 20
LS
19
24
29
34
39
44
49
LSR
19.5
24.5
29.5
34.5
39.5
44.5
49.5
X
17
22
27
32
37
42
47
F
2
1
4
15
10
5
3
40
24
FA
2
3
7
22
32
37
40
intervalo mediano
TECSUP PFR
2. Aplicar la frmula:
X = LSR +
7.3.
(n / 2) fa
f
(tic )
= 34.5 +
( 20 22 )
15
(5)
= 33.83
LA MODA
La moda es la medida de tendencia central especialmente til para
describir mediciones de tipo ordinal y nominal.
La moda. Es
frecuentemente.
el
valor
de
la
observacin
que
aparece
ms
Propiedades de la moda
Desventajas de la moda
Ejemplo
El peso neto del contenido de cinco botellas de perfume Giorgio
seleccionadas de forma aleatoria de la lnea de produccin son (en
gramos): 85.4, 85.3, 84.9, 85.4, y 84.0. Cul es la moda de las
observaciones muestreadas?.
Moda = 85.4
La moda para datos agrupados
Para datos agrupados en una distribucin de frecuencia, la moda puede
ser estimada por la marca de clase del intervalo que contenga la
frecuencia de clase ms grande. Si hay dos intervalos contiguos con
frecuencia mxima la moda ser la media aritmtica de las dos marcas de
clase. Si hay dos o ms intervalos no contiguos con frecuencia de clase
mxima habr dos o ms modas que sers las marcas de clase de dichos
intervalos.
25
TECSUP PFR
7.4.
5
10
15
20
25
30
4
3
15
9
10
7
5
10
15
20
25
30
4
8
6
7
8
8
moda = 15
hay dos
modas:
moda = 10
moda = (25+30) / 2
= 27.5
5
10
15
20
25
30
4
4
4
4
4
4
no hay
moda
Figura 4.
q(0,5) = mediana.
26
TECSUP PFR
Figura 5.
27
8.
TECSUP PFR
MEDIDAS DE DISPERSIN
Figura 6.
Una vez que se han recogido los valores que toman las variables de
nuestro estudio (datos), procederemos al anlisis descriptivo de los
mismos. Para variables categricas o cualitativas, como el sexo por
ejemplo, se quiere conocer el nmero de casos en cada una de las
categoras, reflejando habitualmente el porcentaje que representan del
total, y expresndolo en una tabla de frecuencias.
Para variables numricas, en las que puede haber un gran nmero de
valores observados distintos, se ha de optar por un mtodo de anlisis
distinto, respondiendo a las siguientes preguntas:
a)
b)
RANGO
En el caso de datos sueltos se obtiene buscando el mximo y el mnimo
valor entre los datos, que se llaman valores extremos, y se realiza la
diferencia.
28
TECSUP PFR
Desventajas:
8.2.
DESVIACIN MEDIA
En teora, la desviacin puede referirse a cada una de las medidas de
tendencia central: media, mediana o moda; pero el inters se suele
centrar en la medida de la desviacin con respecto a la media, que
llamaremos desviacin media.
Puede definirse como la media aritmtica de las desviaciones de cada uno
de los valores con respecto a la media aritmtica de la distribucin, y de
indica as:
DM
xx
N
29
TECSUP PFR
x
2
2
4
4
4
5
6
7
8
8
xx
-3
3
-1
-1
-1
0
1
2
3
3
3
3
1
1
1
0
1
2
3
3
DM = 1,8
Veamos ahora cmo se calcula la desviacin media en el caso de datos
agrupados en intervalos.
n x
DM
i
Donde observamos que ahora las desviaciones van multiplicadas por las
frecuencias de los intervalos correspondientes.
Adems, las desviaciones son de cada centro, o marca de clase, a la
media aritmtica. Es decir,
DM
n (x
i
30
x)
TECSUP PFR
ni
2
8
8
18
20
18
15
8
3
Clase
ni
xm
ni xm
xx
ni x x
16-20
20-24
24-28
28-32
32-36
36-40
40-44
44-48
48-52
2
8
8
18
20
18
18
8
3
100
18
22
36
176
16,72
33,44
DM = 6,09
La desviacin media viene a indicar el grado de concentracin o de
dispersin de los valores de la variable. Si es muy alta, indica gran
dispersin; si es muy baja refleja un buen agrupamiento y que los valores
son parecidos entre s.
La desviacin media se puede utilizar como medida de dispersin en
todas aquellas distribuciones en las que la medida de tendencia central
ms significativas haya sido la media.
Sin embargo, para las mismas distribuciones es mucho ms significativa la
desviacin tpica, que estudiaremos a continuacin, y eso hace que el uso
de la desviacin media sea cada vez ms restringido.
31
8.3.
TECSUP PFR
Ejemplo:
Calcular la varianza y la desviacin estndar de la siguiente distribucin
de frecuencia del nmero de meses de duracin de una muestra de 40
bateras para coche.
Duracin de las
bateras (meses)
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
Nmero de bateras
2
1
4
15
10
5
3
32
TECSUP PFR
LI
LS
FX
FX2
15
19
17
34
578
20
24
22
22
484
25
29
27
108
2916
30
34
32
15
480
15360
35
39
37
10
370
13690
40
44
42
210
8820
45
49
47
141
6627
n=40
1365
48475
33
TECSUP PFR
Ejemplo:
El peso neto del contenido de cinco botellas de perfume Giorgo
seleccionadas de forma aleatoria de la lnea de produccin son (en
gramos): 85.4, 85.3, 84.9 y 84.0. Cul es la varianza y la desviacin
estndar de las observaciones muestreadas?
X
85.4
85.3
84.9
85.4
84.0
425.0
8.4
X2
7293.16
7276.09
7208.01
7293.16
7056.00
36126.42
CV de la variable talla =
34
TECSUP PFR
60
77
10
71
78
67
79
81
64
83
89
17
32
95
75
54
76
82
57
41
78
64
84
69
74
65
25
72
48
74
52
92
80
88
84
63
70
85
98
62
90
80
82
55
81
74
15
85
36
76
67
43
79
61
1170
1332
1471
1826
1440
1119
1352
1207
1418
1399
1309
1421
1020
1340
1581
1949
1041
1426
1329
1400
1459
35
1319
896
1533
1289
1455
1788
982
1537
1500
1510
695
2051
1501
1981
1849
1671
1760
803
1677
1668
1091
TECSUP PFR
36
72
48
4
66
71
40
78
22
16
3
57
5
28
9
18
67
54
6
72
4
30
15
12
60
3
72
20
14
18
7
10
10
6
8
18
5
9
9
13
7
14
23
13
3
10
15
13
6
32
4
10
12
7
9
27
9
19
10
7
19
6
18
13
10
16
7
24
7
11
8
15
5
4
6
14
4
3
2
2
4
3
1
5
36
3
5
3
5
4
7
3
3
2
6
2
3
4
3
2
3
4
5
1
3
6
4
3
6
8
0
3
2
5
2
4
3
5
4
0
2
TECSUP PFR
98
62
55
66
62
80
79
94
59
79
51
63
90
73
72
71
56
85
ERRORES
Las mediciones que se realizan en la ciencia y la ingeniera tienen por objetivo el
valor numrico de determinada magnitud. Este valor numrico no corresponde al
valor real de la magnitud que se mide porque los resultados que se obtienen en
el proceso de medicin son aproximados debido a la presencia del error
experimental.
Para tratar de manera crtica dichos valores y obtener conclusiones provechosas
es necesario valorar el error asociado a la magnitud en cuestin durante el
proceso de medicin. En la prctica no es posible determinar el error de la
magnitud que se mide. La mayor dificultad radica en que la medicin va
acompaada de la interaccin de gran cantidad de factores que influyen en uno
u otro grado en el resultado de la medicin. Sin embargo, s es posible establecer
los lmites dentro de los cuales se encuentra el verdadero valor de la magnitud
medida. Cuanto ms prximos se encuentren los limites, ms precisa ser la
medida. Es conveniente advertir que el objetivo del experimentador no es solo
procurar que el error experimental sea lo ms reducido posible, sino que sea lo
suficientemente pequeo para no afectar las conclusiones que se puedan inferir
de los resultados experimentales.
9.1.
CLASIFICACIN DE ERRORES
El error experimental es inherente al proceso de medicin, su valor solo
se puede estimar .Dicho error se define como la diferencia entre el valor
verdadero y el valor medido de la magnitud.
Debido a que los errores pueden surgir por muy distintas causas, para
analizarlos los cientficos los han clasificado en dos amplias categoras:
37
TECSUP PFR
1. Errores sistemticos.
2. Errores aleatorios o accidentales.
Errores sistemticos
Los errores sistemticos son los que en principio se pueden evitar,
corregir o compensar. Estos alteran la medida porque no toman en
cuenta alguna circunstancia que afecta al resultado siempre igual, dando
lugar a un alejamiento hacia un sentido del valor verdadero. Se les llama
sistemticos porque son consistentes, pues cuando estn presentes se
obtienen valores que son ms altos o ms bajos que el valor verdadero.
Los errores sistemticos se pueden originar por:
a) Defectos o falta de calibracin de los instrumentos de medicin.
b) El estado del medio ambiente en que se realizan los experimentos.
c) Malos hbitos y forma peculiar de realizar las observaciones por parte
del experimentador.
d) La limitada precisin de las constantes universales de las ecuaciones
que se usan en el diseo y calibracin de los instrumentos.
No obstante, si se conoce la fuente de error sistemtico se puede
considerar su influencia en la magnitud que se mide, y en una serie de
casos se puede excluir total o parcialmente, bien sea eliminando la fuente
que lo provoca, o introduciendo la correccin. Es conveniente sealar que
la eliminacin de los errores sistemticos en los resultados experimentales
se logra en forma eficiente si se toma en cuenta lo siguiente:
a) El experimentador debe esperar y descubrir la existencia de errores
sistemticos.
b) Una vez detectado el error se estimar su influencia en el resultado.
c) La importancia del error se valorar en funcin de la exactitud total
que se desea y del costo y dificultad de las posibles alternativas para
evitarlo.
d) Finalmente se estudian los medios para eliminar o disminuir el error,
para lo cual se deber sustituir el equipo defectuoso, controlar las
condiciones del experimento, cambiar totalmente el mtodo de
medicin.
La deteccin de errores sistemticos es de gran importancia debido a que
la presencia inadvertida de este tipo de errores puede conducir a un
resultado aparentemente digno de confianza.
Algunos errores determinados comunes son:
1. Errores instrumentales. Equipo defectuoso, pesas sin calibrar, material
de vidrio sin calibrar.
38
TECSUP PFR
39
TECSUP PFR
0,09
1000% 2,4ppm
37,06
40
TECSUP PFR
Q
0,94
0,76
0,64
0,56
0,51
0,47
0,44
0,41
0,00
Tabla 5.
41
TECSUP PFR
w
a
42
TECSUP PFR
Gp
(x p x)
s
G1
( x x1 )
s
43
TECSUP PFR
Figura 7.
44
TECSUP PFR
45
TECSUP PFR
Con esta sencilla ecuacin podemos calcular para cualquier punto de una
recta, el valor que tomara Y a partir del conocimiento de su valor X, de la
pendiente de la recta (m) y del punto de corte sobre las ordenadas (b).
As, cuando tenemos una lnea recta convencional, el clculo de la
pendiente m es sencillo, y se obtiene poniendo en relacin el incremento
de las X con el incremento de las Y, para una distancia dada, de la forma:
Donde
e
son las medias de x e y respectivamente. Son datos
conocidos pues proceden de los puntos de muestreo graficados a partir
de las series de datos.
46
TECSUP PFR
Figura 8.
47
TECSUP PFR
48
TECSUP PFR
49
TECSUP PFR
R2 =r2
Es una medida de la proximidad o de ajuste de la recta de regresin a la
nube de puntos. Tambin se le denomina bondad del ajuste.
1-R2 nos indica qu porcentaje de las variaciones no se explica a travs
del modelo de regresin, es como si fuera la varianza inexplicada que es
la varianza de los residuos.
Si el coeficiente de determinacin nos da bajo, el 75,3%, por lo que slo
conseguimos explicar el 75,3 % de las variaciones a travs del ajuste por
medio.
50
TECSUP PFR
Figura 10.
Del diagrama anterior, cabe observar que no todos los puntos estn en la
lnea de regresin. Si todos lo estuvieran y, adems, si el nmero de
observaciones fuera suficientemente grande, no habra ningn error de
estimacin. En ese caso, no habra ninguna diferencia entre el valor
observado y el valor de la prediccin.
Como imaginamos, en los casos reales, las predicciones perfectas son
prcticamente imposibles y lo que necesitamos es una medida que
describa cmo de precisa es la prediccin de Y en funcin de X o,
inversamente, qu inexacta puede ser la estimacin.
A esta medida se le llama error estndar de estimacin y se denota
Syx. El error estndar de estimacin, es el mismo concepto que la
desviacin estndar, aunque sta mide la dispersin alrededor de la
media y el error estndar mide la dispersin alrededor de la lnea de
regresin.
Distribuciones de frecuencia
1. Los resultados siguientes representan las calificaciones del examen
final de un curso de estadstica elemental.
23
80
52
41
60
34
60
77
10
71
78
67
79
81
64
83
89
17
32
95
75
54
76
82
51
57
41
78
64
84
69
74
65
25
72
48
74
52
92
80
88
84
63
70
85
98
62
90
80
82
55
81
74
15
85
36
76
67
43
79
61
TECSUP PFR
1170
1332
1471
1826
1440
1119
1352
d)
e)
f)
1207
1418
1399
1309
1421
1020
1340
1581
1949
1041
1426
1329
1400
1459
1319
896
1533
1289
1455
1788
982
1537
1500
1510
695
2051
1501
1981
1849
1671
1760
803
1677
1668
1091
36
72
48
4
66
71
40
78
22
16
3
57
5
28
9
18
67
54
6
72
4
30
15
12
60
3
72
20
14
18
7
10
10
6
8
18
5
9
9
13
7
14
23
13
3
10
15
13
6
32
4
10
52
12
7
9
27
9
19
10
7
19
6
18
13
10
16
7
24
7
11
8
15
TECSUP PFR
5
4
6
14
4
3
2
2
4
3
1
5
3
5
3
5
4
7
3
3
2
6
2
3
4
3
2
3
4
5
1
3
6
4
3
6
8
0
3
2
5
2
4
3
5
4
0
2
98
62
55
66
62
80
79
94
59
79
51
63
90
73
72
71
56
85
53
TECSUP PFR
54
TECSUP PFR
55
TECSUP PFR
ANOTACIONES
.............................................................................................................................
.............................................................................................................................
.............................................................................................................................
.............................................................................................................................
.............................................................................................................................
.............................................................................................................................
.............................................................................................................................
.............................................................................................................................
.............................................................................................................................
.............................................................................................................................
.............................................................................................................................
.............................................................................................................................
.............................................................................................................................
.............................................................................................................................
.............................................................................................................................
.............................................................................................................................
.............................................................................................................................
.............................................................................................................................
.............................................................................................................................
.............................................................................................................................
.............................................................................................................................
.............................................................................................................................
.............................................................................................................................
.............................................................................................................................
56