Libro Definitivo de Bibliometria

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 93

INTRODUCCIÓN

A LA BIBLIOMETRÍA
PRÁCTICA

FAUSTO FRANCISCO MATOS URIBE


FORTUNATO CONTRERAS CONTRERAS
JULIO CESAR OLAYA GUERRERO

ASOCIACION DE BIBLIOTECÓLOGOS DEL PERU


Introducción a la Bibliometría Práctica

Autores:
©Fausto Francisco Matos Uribe
©Julio César Olaya Guerrero
©Fortunato Contreras Contreras

Editado por
©Asociación de Bibliotecólogos del Perú
Calle Hipólito Bernardette Nº 106 – Barranco

Telef. 997684606
contacto@abp.org.pe
Lima − Perú
Primera edición, marzo 2023
Tiraje: 100 ejemplares

Hecho en depósito Legal en la Biblioteca Nacional del Perú Nº.°2023-01866

ISBN: 978-612-48342-4-0

Se terminó de imprimir en marzo del 2023 en:


Oscar Ricardo Retamozo Ramos
Avenida Ignacio Merino Nº 1738 - Lince
PROLOGO

El presente libro, es producto de las experiencias en la enseñanza del curso de


Bibliometria, que tiene como prerrequisito los cursos de matemática básica,
estadística descriptiva y estadística inferencial, esperando que este material
sirva de ayuda al estudiante y profesional de la carrera de bibliotecología y
ciencia de la información, el cual tiene por objetivo realizar un análisis
bibliométrico de la literatura científica.

El libro se divide en 4 capítulos, acompañado de teoría y práctica para su mejor


compresión.

LOS AUTORES
Índice
Pág.
Capítulo 1
1.1. Bibliometría. 7
1.2. Cienciometría. 8
1.3. Informetría. 8
1.4. Análisis bibliométrico 9

Capítulo 2
2.1. Conceptos matemáticos. 10
2.1.1. Ecuaciones exponenciales, ejercicios resueltos 10
y propuestos.
2.1.2. Logaritmos, ejercicios resueltos y propuestos. 11
2.1.3. Progresión geométrica, ejercicios resueltos y propuestos. 15
2.1.4. Graficas de funciones, ejercicios resueltos y propuestos. 17

2.2. Conceptos estadísticos 18


2.2.1. Media geométrica, ejercicios resueltos y propuestos 18
2.2.2. Media armónica, ejercicios resueltos y propuestos. 19
2.2.3. Hipótesis estadística: Prueba de hipótesis de la media
y proporción poblacional. 20
2.2.4. Medias de asociación. 30
2.2.5. Regresión lineal múltiple y simple, ejercicios resueltos
y propuestos. 37
2.2.6. Coeficiente de determinación, ejercicios resueltos y
propuestos. 41
2.2.7. Regresión lineal con datos codificados, ejercicios
resueltos y propuestos. 44
2.2.8. Regresión no lineal, ejercicios resueltos y
propuestos. 48

Capítulo 3
3.1. Leyes bibliométricas. 54
3.2. Modelo de Price, ejercicios resueltos y propuestos. 54
3.3. Modelo de Lotka, ejercicios resueltos y propuestos. 60
3.4. Modelo de Bradford, ejercicios resueltos y propuestos. 66
3.5. Ley de Zipf, ejercicios resueltos y propuestos 71

Capítulo 4
4.1. Indicadores bibliométricos 74
4.2. El número de citas 74
4.3. Índice H de un investigador. 75
4.4. Índice i10 de un investigador. 77
4.5. Factor de impacto de una revista científica (FI) 77
4.6. Índice de inmediatez de una revista (Ii) 78
4.7. Vida media de un trabajo de investigación (Vm) 79
4.8. Cuartiles 80
4.9. Índice de colaboración (IC) 81
4.10. Grado de colaboración (GC) 81
4.11. Coeficiente de colaboración (CC) 81

Bibliográfica 83

Anexos
Anexo 01: Demostraciones 84
Anexo 02: Tabla estadísticas 86

6
Capítulo I

Los términos bibliometría y cienciometría fueron introducidos casi


simultáneamente por Pritchard y por Nalimov y Mulchenko en 1969. Mientras
que Pritchard explicó el término bibliometría como “la aplicación de métodos
matemáticos y estadísticos a libros y otros medios de comunicación”, Nalimov y
Mulchenko definieron la cienciometría como “la aplicación de aquellos métodos
cuantitativos que se ocupan del análisis de la ciencia vista como un proceso de
información”. De acuerdo con estas interpretaciones, la especialidad de la
cienciometría se restringe a la medición de la comunicación científica, mientras
que la bibliometría está diseñada para tratar con procesos de información más
generales. Los límites de alguna manera difusos entre las dos especialidades
casi se desvanecieron durante las últimas tres décadas, y hoy en día ambos
términos se usan casi como sinónimos. En cambio, la informetría de campo tomó
el lugar de la bibliometría especializada originalmente más amplia. El término
informetría fue adoptado por VINITI (Gorkova, 1988) y representa un subcampo
más general de las ciencias de la información que se ocupa del análisis
estadístico matemático de los procesos de comunicación en la ciencia. En
contraste con la definición original de bibliometría, la informetría también se
ocupa de los medios electrónicos y, por lo tanto, incluye temas como el análisis
estadístico del texto (científico) y los sistemas de hipertexto, las circulaciones de
las bibliotecas, las medidas de información en las bibliotecas electrónicas, los
modelos para los procesos de producción de información y los análisis
cuantitativos. aspectos de la recuperación de información también (Glanzel,
2003: 6)

1.1. Bibliometria

La palabra “bibliometría” deriva de los vocablos griegos biblos: ‘ libro’, y metron:


’medir’. Es la aplicación de las matemáticas y el método estadístico a la publicación
de los resultados de la investigación científica; dicho de otra manera, es la aplicación
de tratamientos cuantitativos a la comunicación escrita, producto tangible de la
investigación. La bibliometría parte de la necesidad de cuantificar ciertos aspectos
de la ciencia para poder comparar, medir y objetivar la actividad científica (Dávila,
et.al, 2009: 320).

El análisis estadístico de la literatura científica comenzó casi 50 años antes de que


se acuñara el término “bibliometría”. En 1926, Alfred J. Lotka publicó su estudio
pionero sobre la distribución de frecuencias de la productividad científica
determinada a partir de un índice decenal (1907-1916) de Chemical Abstracts. Lotka
concluyó que

“el número (de autores) que hacen n contribuciones es aproximadamente 1/n² de los
que hacen una; y la proporción de todos los contribuyentes, que hace una sola
contribución, es de alrededor del 60 por ciento.”

7
Este resultado puede considerarse como una regla empírica incluso hoy, 75 años
después de su publicación.

Casi al mismo tiempo, en 1927, Gross y Gross publicaron su estudio basado en citas
para ayudar a decidir qué publicaciones periódicas de química deberían comprar
mejor las bibliotecas universitarias pequeñas. En particular, examinaron 3633 citas
del volumen de 1926 del Journal of the American Chemical Society. Este estudio se
considera el primer análisis de citas, aunque no es un análisis de citas en el sentido
de la bibliometría actual.

Ocho años después de que apareciera el artículo de Lotka, Bradford (1934) publicó
su estudio sobre la distribución de frecuencia de artículos sobre revistas. Encontró
que

“si las revistas científicas se ordenan en orden de productividad decreciente sobre


un tema dado, pueden dividirse en un núcleo de revistas más particularmente
dedicadas al tema y varios grupos o zonas que contienen el mismo número de
artículos que el núcleo cuando el número de publicaciones periódicas en el núcleo
y las zonas sucesivas será como 1: b : b² …”

Zipf (1949) formuló una ley interesante en bibliometría y lingüística cuantitativa que
derivó del estudio de la frecuencia de palabras en un texto. Según Zipf rf = C, donde
r es el rango de una palabra, f es la frecuencia de aparición de la palabra y C es una
constante que depende del texto analizado. Puede considerarse una generalización
de las leyes de Lotka y Bradford. Formuló el siguiente principio subyacente de su
ley, aunque nunca ha demostrado cómo se aplica este principio a su ecuación. 1

"El Principio del Mínimo Esfuerzo significa... que una persona... se esforzará por
resolver sus problemas de tal manera que minimice el trabajo total que debe realizar
para resolver tanto sus problemas inmediatos como sus probables problemas
futuros...". (Zipf, 1949). (Glanzel, 2003: 6-7).

La Bibliometría estudia el comportamiento de la producción de la literatura


científica (libros, revistas científicas, artículos científicos, autores, etc.) y para tal
objetivo utiliza a las matemáticas y la estadística. La Bibliometria proporciona
información sobre cómo se desenvuelve la producción de la literatura científica
ya sea: local, nacional, nacional e internacional, con el objetivo de tomar
decisiones.
.
1.2. Cienciometría

Es el estudio de la Ciencia como problema multidimensional que reúne a


investigadores + textos + conocimiento. Es decir, es la Ciencia de la Ciencia.
(Amezquita et. al, 2011: 12).

Mide el movimiento de la actividad social y tienen con objetos: el análisis de la


producción, circulación y consumo, de trabajos científicos.

1.3. Informetría

La infometría es ampliamente utilizada para la medición de variables que


intervienen en el análisis del contenido del quehacer investigativo, a través de la
8
implementación de modelos teóricos y medidas de información. Por ello, la las
matemáticas y la modulación son herramientas fundamentales en el proceso de
gestión de la información. (Amézquita et. al, 2011: 19).

Toma en cuenta los dos conceptos anteriores y desarrolla métodos y


procedimientos para medir y analizar los procesos de investigación científicas.

1.4. Análisis bibliométrico

Consiste en realizar el seguimiento de publicaciones científicas y/o autor,


tomando como referencia la materia y el periodo de análisis con el objetivo de
dar solución a un trabajo científico. Utilizando las bases de datos:

• Scopus,
• Web of Science (WOS),
• Google Scholar,
• PubMed
• MEDLINE
• Journal Citation Reports(JCR)
• Science Citation Index Expandel (SCI)
• Current Contents Connect (CC).

Diferencias entre Bibliometría, Cienciometría e Informetría

Fuente: McGrath W. (1989). What bibliometricians, scientometricians and informetricians study;


a typology for definition and classification; topics for discusión (citado por Amezquitam, et al,
2011: 22)

9
Capítulo 2

2.1. Conceptos matemáticos

2.1.1 Ecuaciones exponenciales

Se denomina así aquellas ecuaciones algebraicas, en la cual la incógnita


aparece como exponente.

Ejemplos

1
( ) 2 x+1 = 16
8
4 2 x −1 = 83− x
3
xx = 3
Para resolver una ecuación exponencial nos valemos de algunas propiedades:

a x = am →x=m
x b
x =b →x=b
a x
x =a →x=a

Ejercicios resueltos

Calcular el valor de “x”


2
7 2 x −3 = 49 x + x −6

1
( 2 x −3) 2
(7 2 ) 2 = 49 x + x −6

3
( x− ) 2
+ x −6
49 2
= 49 x
3 9 3
x− = x2 + x − 6 → x2 = → x = ± 2
2 2 2
Calcular el valor de “x”

1 2 x−12
3 x +3 = ( )
27
3 x+3 = (3−3 ) 2 x−12 → 3 x+3 = (3) −3( 2 x−12 ) → x + 3 = −3(2 x − 12)
33
x + 3 = −6 x + 36 → 7 x = 33 → x =
7
10
Ejercicios propuestos

En cada uno de los casos calcular el valor de " x"

2
−7 x +12
1. 9x =1
1 2 x −12
2. 9 x +3 = ( )
81
1
3. ( ) 2 x+1 = 16
8
3
4. xx = 3

2.1.2. Logaritmos

El logaritmo de un número real positivo N > 0 , en una base dada b>0 diferente
de la unidad, es igual a un exponente x , exponente que debe elevarse a la base
para reproducir el número dado.

Log b N = x → b x = N , b > 0, b ≠ 1 N > 0

Ejemplo-1

Hallar el logaritmo de 64 en base 2.

Log 2 64 = x → 2 x = 64 → 2 x = 26 → x = 6

Es decir 6 es el logaritmo de 64 en base 2.

Ejemplo-2

Hallar el logaritmo de 0.001 en base 10

Log10 0.001 = x → 10 x = 0.001 → 10 x = 10 −3 → x = −3

Propiedades de los logaritmos

a. El logaritmo de la unidad es igual a cero, Log b 1 = 0

b. Logaritmo de la base es igual a la unidad, Log bb = 1

c. El logaritmo del producto de varios factores en una base dada, es igual a


la suma de los logaritmos de sus factores en la base dada.

d. Log b N .P.Q = Log b N + Log b P + Log bQ

11
e. El logaritmo del cociente de dos números en una base dada, es igual al
logaritmo de la diferencia del numerador y denominador en la base
dada.

M
f. Log b = Log b M − Log b N
N
r
g. El logaritmo de una potencia N en una base dada, es igual al
exponente multiplicado por el logaritmo del número en la base dada.
r
h. Log b N = r.Log b N

i. Log ( b / a ) (a / b) = −1

j. El cambio de base

El logaritmo de un número "a" en una base dada "b" , es igual a un


cociente, del logaritmo del número "a" y el logaritmo de la base "b"
ambas en una base de interés "c" .
Log c a
Log b a = , c = una base cualquiera
Log c b

Regla de la cadena (del cambio de base)

Log b a. log c b = Log c a

Corolario de la regla de la cadena

si a = c → Log b c. log c b = Log c c = 1

Nota

Log 10 N = Log N , cuando la base es 10 se omite la base

Log e N = Ln N , cuando la base es el número neperiano e=2.718….

Teorema

A ambos lados de una igualdad se puede aplicar logaritmo.

y = ax entonces log y = log a x

Demostración
x log a x
x
y=a entonces log y a = 1 → = 1 → log y = log a x
log y

12
Ejercicios resueltos

Ejemplo-1

Hallar x en: 2
2 x +1
= 500

Solución

log 500
22 x +1 = 500 → log 2 500 = 2 x + 1 → = 2 x + 1 → 8.96578 = 2 x + 1 → x = 3.98289
log 2
Ejemplo-2

Despejar x en:

10 x − 10 − x
y=
2
Solución

2 y = 10 x − 10 − x

1
2 y = 10 x − → 2 y.10 x = 10 2 x − 1 → (10 x ) 2 − 2 y (10 x ) − 1 = 0
10 x
Hacemos que m = 10 x

m 2 − 2 ym − 1 = 0
2 y ± 4 y 2 − 4(1)(−1) 2 y ± 4( y 2 + 1)
m= = = y ± y2 +1
2 2

m = y ± y 2 + 1 → 10 x = y ± y 2 + 1 → x = log( y ± y 2 + 1)

Ejemplo-3

Linealizar el modelo no lineal

y = ab x ,

Para linealizar el modelo no lineal, se aplica logaritmos a ambos lados

Log y = Log ab x
Log y = Log a + Log b x
Log y = Log a + x( Log b)
Z = A + Bx ← (modelo linealizado)

Siendo:

Z = Log y A = Log a B = Log b


13
Ejercicios propuestos

1. Hallar Log 3 2 64

2. Hallar el valor de x en:

12 2 x +3 = 6 x −1
3. Linealizar el siguiente modelo no lineal

a
y=
xb

4. Calcular: log 2 2 3 16
5. Calcular el valor de x en cada caso:

3x +1 = 100

73 x − 5 = 20 x +1
6. Despejar el x en cada caso:

a x +1 = b 2 x −1
e x − e−x
y=
2

7. Si Log 64 = a Log 81 = b , hallar el logaritmo de 2 en base 3

8. Hallar los valores de x e y


 x+ y
3 = 5
 x− y

3 = 7

9. Calcular x en la ecuación: a x+3 = b 2 x−12


10. Hallar los valores de x e y

log 2 ( x + y ) = 2

log 3 ( x − y ) = 3

11. Resolver

log 2 (2 x + 1) + log 3 (2 x + 1) = 1

14
12. Resolver

log 2 x + log 4 x + log 8 x = 11

13. Resolver

log x +1 2 + log x +1 8 = 2

14. Resolver

log 2 x + log 4 x + log 8 x = 11

15. Resolver

3log9 ( x −8) = 2

16. Resolver

1 + log( x − 1) = log x

17. Resolver

2 log 3 ( x + 1) + log 9 ( x − 1) = 2

18. Resolver

7 5 x +3 = 3 x +1 x = −0.54908492

2.1.3. Progresión geométrica (PG)

Es una sucesión de números, en la cual un término cualquiera es igual al


anterior multiplicado por una constante, a esta constante se le llama razón
geométrica (cociente entre dos cantidades). Una PG de n términos tiene
la siguiente forma:

a, ar , ar 2 , ar 3 ,..., ar n−1

Siendo

a = Primer término de la progresión geométrica

r = Razón de la progresión geométrica

ar n−1 = Último término de la progresión geométrica

Nota

Termino del lugar k de una PG

Tk = ar k −1

15
Suma de los términos

a (1 − r n )
S=
1− r

Productos de los términos de una PG


n ( n −1)
P = a n .r 2

Convergencia de una PG cuando la razón {− 1 < r < 1} − {0} . Cuando la


suma de sus términos tiende al infinito.

a
lim S
n →∞
n =
1− r

Ejemplo-1

Sea la progresión geométrica: 3, 3 / 4, 3 / 16, 3 / 48

Calcular: la razón, suma, producto y la suma límite de sus términos.

3 / 4 3 / 16 3 / 48 1
Razón → r = = = =
3 3 / 4 3 / 16 4

3(1 − (1 / 4) 4 )
Suma → S = = 3.984375
1
1−
4
4 ( 4−1)
1
Producto → P = (3) 4 ( ) 2
= 0.01977539
4

3
Suma límite de los infinitos términos → S = =4
1
1−
4

Ejemplo-2

Sea la sucesión de términos, supongamos que es una PG:


5, 11, 20, 41

Calcular la razón geométrica estimada

11 20 41
+ +
→ r = 5 11 20 = 2.023
3

16
2.1.4. Gráfica de funciones

Sea la función matemática de la línea recta

y = 3 + 2x

X=variable independiente e y=variable dependiente, el valor que toma” y”


depende del valor que se asigna a “x”

La función proporciona pares ordenados (X, Y), para obtener estos pares
ordenados , damos valores arbitrario a la variable X y calculamos los
correspondiente valores para Y.

x y
4 11
6 15
8 19
10 23
12 27

Los pares ordenados (X, Y), lo presentamos en un plano cartesiano (nube de


puntos) y tiene por gráfica

Y
30
y = 2x + 3
20
Y
10 Lineal (Y)

0
0 5 10 15

Ejercicios propuestos

Graficar las siguientes funciones:

400
a. y =
x 2.5
2.5
b. y = 1.56 log( )
x
c. y = 1.25(2 x )
20
d. y =
2 + 3x
e. y = x3 + x + 1
17
2.2. Conceptos estadísticos

2.2.1. Media geométrica ( x g )

Se utiliza cuando los datos por su naturaleza, presentan un comportamiento de


una serie en progresión geométrica o los datos provienen de una variación
porcentual.

La fórmula:

Sea un conjunto de n datos positivos, tal que xi > 0


x1 , x2 , x3 ,..., xn

Su valor corresponde a la raíz n − enésima del producto de los n datos

x g = n x1.x2 .x3 ....xn

También se puede expresar por:

1 n
Log ( x g ) = Log ( n x1.x2 .x3 ....xn ) = ∑ Log ( xi ) →
n i =1
1 n
x g = Antig ( ∑ Log ( xi )
n i =1

Ejemplo-1.

Calcular la media geométrica para los siguientes datos:

4, 9, 15, 32

x g = 4 (4)(9)(15)(32) = 4 17280 = 11.465

La media geométrica para los datos es de 11.5

También, por el otro método

log(4) + log(9) + log(15) + log(25)


Log ( x g ) = = 1.059385935
4
x g = 101.059385935 = 11.465

Ejemplo-2.

La información de la tabla corresponde a la producción de artículos científicos en


medicina entre los años 1990 al 2020 de cierto país. Calcular la producción
promedio anual y el incremento anual promedio.

18
Variación=se
divide la
Producción de
producción de
Años revistas científicas
un año
en medicina
cualquiera por
el año anterior
1990 120
1995 150 1.25
2000 187 1.246667
2005 234 1.251337
2010 293 1.252137
2015 366 1.249147
2020 458 1.251366

Calcular la producción promedio de revistas científicas

x g = 7 (120)(150)...(458) = 234.23 articulos

Calcular la variación promedio de la producción de revistas científicas

x g = 6 (1.25)(1.246667)...(1.251366) = 1.25

La variación promedio es de 1.25 (125%) y su incremento promedio cada 5 años


es de 1.25-1=0.25 en porcentaje=25%.

2.2.2. Media armónica ( x a )

Se utiliza cuando con cierta cantidad fija, se generan otras cantidades con dos
unidades: km/hora, monto/articulo, horas/artículos, etc. y se pide calcular el
promedio es esta última.

La fórmula es:

Sea un conjunto de n datos positivos (no cero)

x1 , x2 , x3 ,..., xn
n
xa =
1 1 1 1
+ + + ... +
x1 x2 x3 xn

Ejemplo:

Se tiene 80 nuevos soles y se desea comprar cierto número de revistas


científicas de la misma materia y en tres editoriales, tal como se presenta en la
tabla. Calcular el precio promedio de las revistas.

19
Revistas Cantidad Precio unitario por
Revistas
científicas Cantidad Precio unitario por
revistas=monto/cantidad
científicas
A 5 revistas=monto/cantidad
S/.16=x1
A
B 5
8 S/.16=x1
S/.10=x2
B
C 8
10 S/.10=x2
S/.8=x3
C 10 S/.8=x3

3
xa =
1 31 1 = S / .10.43
xa = + = S / .10.43
1 10
16 1 +1
+ +8
16 10 8
S/.10.43, es el precio promedio de las revistas.
S/.10.43, es el precio promedio de las revistas.

2.2.3. Hipótesis estadística


2.2.3. Hipótesis estadística

Es un supuesto que se hace en la poblacion en estudio, con respecto a la


Es un supuesto
distribución de unaquevariable
se hacealeatoria
en la poblacion en estudio, la
o a sus parámetros, convalidez
respecto a la
de este
distribuciónserá
supuesto, de confrontado
una variableconaleatoria o a sus
una muestra parámetros,
elegida la la
al azar de validez de este
poblacion, un
supuesto, será
estadístico confrontado
de prueba con una
y un nivel muestra elegida
de significación, quealelige
azareldeinvestigador
la poblacion, un
para
estadístico
rechazar de prueba
o no y unque
la hipótesis nivelsede significación,
supone cierta enque elige el investigador
la poblacion para
(hipótesis nula).
rechazar
Se supone o no
quelaeste
hipótesis que se
supuesto supone
lo hace el cierta en la poblacion
investigador (hipótesis nula).
con la experiencia en el
Se supone
campo de suque este supuesto
competencia. Unalohipótesis
hace el investigador
se representacon conlalaexperiencia en el
letra mayúscula
campo de su competencia. Una hipótesis se representa con la letra mayúscula
H.
H.
Ejemplos
Ejemplos
1. La distribución del número de artículos por revistas científica en matemática
1. La distribución
sigue del número
una distribución de artículos por revistas científica en matemática
normal.
sigue una distribución normal.
H : La variable número de artículos por revista científica sigue una distribución
H : La variable número de artículos por revista científica sigue una distribución
normal.
normal.
2. El promedio del número de artículos por revista científica, en matemática es
2. 16
El promedio
artículos. del número de artículos por revista científica, en matemática es
16 artículos. H : µ = 16 Artículos
H : µ = 16 Artículos
3. La variabilidad del número de artículos por revistas con respecto a la media
3. en
La la
variabilidad
poblaciondel esnúmero
de 23.5 de artículos
artículos 2
. por revistas con respecto a la media
en la poblacion es de 23.5 artículos2.
H : σ 2 = 23.5 articulos 2
H : σ 2 = 23.5 articulos 2
La Hipótesis estadística puede ser nula (llamada también planteada)
La Hipótesis
simbolizada por estadística
H p o H 0 y puede ser alternante
la hipótesis nula (llamada también
simbolizada por Hplanteada)
a o H1 .
simbolizada por H p o H 0 y la hipótesis alternante simbolizada por H a o H 1 .
Hipótesis Nula o Planteada ( H 0 )
Hipótesis Nula o Planteada ( H 0 )
Es la hipótesis estadística, sobre la cual el investigador está dispuesto a creer a
Es la como
priori hipótesis estadística,
verdadera, sobre
y cuya la cual
validez seráel sometida
investigador está dispuesto
a comprobación a creerde
a través a
priori como verdadera, y cuya validez será sometida a comprobación a través de
20
una muestra elegida al azar de la poblacion en estudio. La hipótesis nula se
formula con el objetivo de ser rechazada, pero con una probabilidad bien
pequeña (0.1, 0.05, 0.01), en caso de obtener una muestra desafortunada (es
decir con valores muy altos o valores muy bajos).

Hipótesis Alternante ( H a .)

Es la contraparte de la hipótesis nula y representa la creencia o sospecha que el


investigador quiere probar.

Ejemplo

Un bibliotecólogo afirma que el número promedio de artículos por revistas


científicas es 14 artículos, esta afirmación corresponde a la hipótesis nula; la
hipótesis alternante podría ser diferente a 14 artículos, mayor a 14 artículos o
menor a 14 artículos:
H 0 : µ = 14 articulos
H a : µ ≠ 14, H a : µ > 14, H a : µ < 14

TIPOS DE ERRORES

La decisión de rechazar o no rechazar la hipótesis nula, con base a la


información de la muestra aleatoria extraída de la población en estudio, pude
conllevar a decisiones erradas debido a las fluctuaciones del muestreo, y
cometer los siguientes errores.

ERROR TIPO I

Consiste en rechazar la hipótesis nula H 0 a consecuencia de los datos de la


muestra cuando esta es cierta en la población.

ERROR TIPO II

Consiste en no rechazar la hipótesis nula H 0 a consecuencia de los datos de


la muestra cuando esta es falsa en la población.

Para estos dos tipos de errores se presenta el siguiente cuadro

CUADRO

DECISION POBLACION EN ESTUDIO


TOMADA DEBIDO
A LA MUESTRA H 0 ES CIERTA H 0 ES FALSA

H 0 SE ACEPTA DECISION CORRECTA ERROR TIPO II

H 0 SE RECHAZA ERROR TIPO I DECISION CORRECTA

21
Nivel de significación de la prueba α
Es probabilidad de cometer el error tipio I, se denota con el símbolo α , es una
medida de la confiabilidad de la decisión de rechazar la hipótesis nula. Las
probabilidades utilizadas para rechazar la hipótesis nula H 0 para
α = 1%, 5%, 10%

α = P(cometer el error tipo I ) = P(rechazar H 0 / H 0 es cierta)

Nivel de significación β

Es la probabilidad de cometer el error tipio II, se le denota con el símbolo β

β = P(cometer el error tipo II ) = P(aceptar H 0 / H 0 es falsa )

Potencia de la prueba (1 − β )

Es la probabilidad de aceptar la hipótesis alternante dado que esta es verdad

1 − β = P(acepta H 0 / H 0 es cierta)

Supuestos para una prueba estadística

Para realizar una prueba de hipótesis para determinados parámetros de una


poblacion en estudio se requiere el cumplimiento de un conjunto de supuestos,
para dar validez a la decisión que se toma:

a. Los datos de la muestra son elegidos al azar de la poblacion en estudio.


b. La variable de donde proviene el parámetro tiene una distribución normal.
c. Existe pruebas de ciertos parámetros, que requiere que el tamaño de la
muestra debe ser grande.

Prueba de hipótesis

Para evaluar una prueba de hipótesis sobre determinados parámetros, se utiliza


la distribución muestral de la variable aleatoria de donde proviene el parámetro,
datos de una muestra elegida al azar de tamaño n y el nivel de significación α
para rechazar la hipótesis nula H 0 .
Del ejemplo anterior, supongamos la siguiente hipótesis nula y alternante:

H p : µ = 14 articulos
H p : µ ≠ 14 articulos

Suponiendo que el parámetro a evaluar proviene de una distribución normal con


variancia igual a 12.25 articulos2 y el nivel de la significación α = 0.05 , bajo la
hipótesis nula cierta. Planteamos:

22
P (rechazar H 0 / H 0 verdadera en la poblacion) = α
P ( x < a ∪ x > b) = 0.05
x − 14 a − 14 x − 14 b − 14
P( < ) ∪ > ) = 0.05
12.25 / n 12.25 / n 12.25 / n 12.25 / n
a − 14 b − 14
P(Z < ) ∪ Z> ) = 0.05
12.25 / n 12.25 / n
a − 14 a − 14
= −1.96 = 1.96
12.25 / n 12.25 / n
12.25 12.25
a = 14 − 1.96 b = 14 + 1.96
n n

Para un tamaño de muestra n =50. Se tiene:

12.25 12.25
a = 14 − 1.96 b = 14 + 1.96
50 50
a = 13.03 b = 14.97

A los valores 13.03 y 14.97 se le conoce como valores críticos, si la muestra


elegida al azar de tamaño 50 arroja que la media muéstral es de 12 o 16,
entonces se rechaza la hipótesis nula con un nivel de significación del 5%, y se
concluye que hay suficiente evidencia muestral para rechazar la hipótesis nula
con una significación del 5%. Si el valor de la media muéstral se encuentra entre
los dos valores críticos, entonces no se rechaza la hipótesis nula con un nivel de
significación del 5%. Gráficamente se tiene:

13.03 14.0 14.97

Las áreas a la izquierda y derecha de los puntos 13.03 y 14.97, se le llama zona
de rechazo de la hipótesis nula y la zona entre los puntos 13.03 y 14.97 se le
llama zona de no rechazo de la hipótesis nula.

Región critica o de rechazo de H 0

Es la región que contienen los valores muestrales para lo cual se rechaza la


hipótesis nula ( x ≤ 13.03 o x ≥ 14.97)

23
Región aceptación de H p

Es la región que contienen los valores muestrales para lo cual no se rechaza la


hipótesis nula (13.03 < x < 14.97)

En lo sucesivo el procedimiento anterior se puede simplifican estandarizando el


valor obtenido en la muestra y comparando con el valor tabular obtenido del nivel
de significación.

Resumiendo: La prueba es la siguiente

H p : µ = 14 articulos
H p : µ ≠ 14 articulos
Supongamos que para un tamaño de muestra n = 50 , el valor de la media
muestral es x =15.2 y la variancia de la población se conoce σ 2 =12.25 y el nivel
de significación para la prueba es α =0.05. Entonces se estandariza el valor
obtenido para la muestra que es un valor Z, y se compara con la región crítica
determinada por el nivel de significación de la distribución Z. si el valor
estandarizado cae en la zona de rechazo, entonces se rechaza la hipótesis nula
de lo contrario no se rechaza la hipótesis nula. A la fórmula que me permite
estandarizar el valor muestral y tomar la decisión de rechazar o no rechazar la
hipótesis nula, se le llama estadístico de prueba.

15.2 − 14
Zc = = 2.424366
12.25
50
Gráfica de distribución
Normal; Media=0; Desv.Est.=1

0.4

0.3
Densidad

0.2

0.1

0.025 0.025
0.0
-1.960 0 1.960
X

El valor Zc = 2.424366, cae en la zona de rechazo la hipotesis nula, luego se

rechaza la hipotesis nula.

24
Nota:
Otra forma de rechazar o no rechazar la hipótesis nula H 0 , es comparar el nivel
de significación α establecido para la prueba, con la probabilidad de rechazar la
hipótesis nula proporcionado por el estadístico de prueba calculado, valor de
probabilidad que se conoce con el nombre del p valor. Del ejemplo anterior.

α ≥ p → se rechaza la H 0
α < p → se no se rechaza la H 0

La hipótesis nula H 0 se rechaza si:


15.2 − 14 15.2 − 14 15.2 − 14 15.2 − 14
p( zc < − ∪ zc > ) = P( zc < − ) + P( zc > )
12.25 12.25 12.25 12.25
50 50 50 50
P ( zc < −2.424366) + P ( zc > 2.424366) = 0.007668 + 0.007668 = 0.015336 = 0.015
como α = 0.05 > p = 0.015 → se rechaza la H0

Pasos a seguir para probar una hipótesis estadística

a. Plantear la hipótesis nula y alternante en términos del enunciado del


problema
b. Elegir el nivel de significación para la prueba.
c. Región critica (Región de rechazo de la hipótesis planteada Ho)
d. Cálculos del estadístico de prueba, usando los datos de la muestra y bajo
el supuesto de la hipótesis nula cierta.
e. Decisión y conclusión.

Pruebas de hipótesis para la media de una población

Sea una población en estudio, en la cual se define una variable aleatoria de


interés X , supongamos que la variable tiene una distribución normal con media
µ y variancia σ 2 , de dicha población se toma una muestra aleatoria
x1 , x2 ,...xn , obteniéndose la media muestral x . Se demuestra que los
estadísticos:

x−µ
zc = ~ Z (0 ; 1) .
σ/ n
Se usará cuando la variancia de la población se conoce.

x−µ
tc = ~ t ( n−1) gl
s/ n

25
Se usará cuando la variancia de la población no se conoce y el tamaño de la
muestra es menor a 30, para un tamaño de muestra mayor a 30, se puede usar
la distribución Z.

Formulación de las hipótesis:

Pruebas bilaterales Pruebas unilaterales

H p : µ = µo H p : µ ≥ µo H a : µ ≥ µo
H p : µ ≠ µo H a : µ < µo H a : µ < µo

.
Ejemplo-1

Probar con un nivel de significación del 5% que la media del número de artículos
de cierta revista científica es superior a 15 artículos. Una muestra de 21 revistas
elegidas al azar de la poblacion, arroja que la media muestral es de 17 artículos
con una varianza de 46.24 artículos2.

H 0 : µ ≤ 15
H a : µ > 15

Nivel de significación para la prueba α = 0.05 = P(rechazar H 0 / H 0 , cierta)

Región critica para la prueba, como la prueba de hipótesis es unilateral a la


derecha (por la hipótesis alternante) la región critica o de rechazo de la hipótesis
planteada es:

Gráfica de distribución
T; df=20

0.4

0.3
Densidad

0.2

0.1

0.05
0.0
0 1.725
X

Estadístico de prueba: como la variancia de la población no se conoce y el


tamaño de la muestra es menor a 30, el estadístico de prueba para este caso es:

26
x − µo
Tc = ~ t (n − 1) gl / H p Cierta
s/ n
17 − 15
Tc = = 1.348
6.8 / 21

Tc = 1.348 < T( 0.05, 20 ) gl = 1.725 , entonces no se rechaza la hipótesis nula, por lo


tanto no existe la suficiente evidencia estadística para rechazar la hipótesis nula
de que la media poblacional del número de artículos es menor a 15 artículos.

Ejemplo-2

De la pregunta anterior, para que valores del estimador x se rechaza la


hipótesis nula.

Se rechaza la hipótesis planteada siempre y cuando:

x − 15 s
Tc > 1.725 → > 1.725 → x > 1.725. + 15 = 17.56
s/ n n

Se rechaza la hipótesis nula para valores de la media muestral superior a 17.56.

Prueba de hipótesis para una proporción poblacional

x
Sea la proporción muestral pˆ = , siendo " x" el número de elementos con la
n
cualitativa de interés en la muestra y "n" el tamaño de la muestra, si
pˆ − P
n → ∞ (n > 30), entonces Z C = ~ N (0 ; 1) , corresponde al estadístico de
σ pˆ
prueba.

Siendo:

p (1 − p )
σ p2ˆ = Si el muestreo es con reemplazo
n

p (1 − p ) N − n
σ p2ˆ = ( ) Si el muestreo es sin reemplazo
n N −1

Ejemplo-1:

Los datos que a continuación se presenta corresponden a una muestra aleatoria


de la cantidad de artículos publicados por cierta revistas científica en ciencias
matemáticas.

27
13 15 13 12 20 23 10 12
19 24 23 12 14 15 17 13
18 12 13 14 12 17 18 12
14 19 16 25 25 11 13 14
17 21 18 23 15 16 15 15

¿Probar con un nivel de significación del 5% que la proporción de revistas con


más de 15 artículos publicados es superior al 42%?

Hipótesis a probarse

H p : P ≤ 0.42
H A : P > 0.42

1. Nivel de significación de la prueba

α = 0.05 = P(rechazar la H p / H p , cierta, en la población)

2. Estadístico de prueba
pˆ − P
Z= ~ N (0 , 1)
σ pˆ A

3. Supuestos:

a. Las observaciones son elegidas aleatoriamente


b. El tamaño de muestra es grande

4. Criterio de decisión

Gráfica de distribución
Normal; Media=0; Desv.Est.=1

0.4

0.3
Densidad

0.2

0.1

0.05
0.0
0 1.645
X

Se acepta H p , si Z c ≤ 1.645 , en caso contrario se rechaza.

Cálculos, de los datos se tiene:


28
Tamaño
Tamaño de
de la
la muestra
muestra Numero
Numero de
de revistas
revistas con
con
más
más de 15 artículos
de 15 artículos
40
40 18
18

18
Con
Con n 40
= 40 p = 18 =
= 0.45 , se tiene que la
naa = p AA = 40 0.45 , se tiene que la
40

P(1 − P) 0.42(1 − 0.42)


σ = P(1 − P) =
σ pp = = 0.42(1 − 0.42) =
= 00..078038
078038
A
A
nn 40
40

0
0..45 −0
45 − 0..42
42 0.3844
Z
Z cc =
= 0.078038 = = 0.3844
0.078038
Conclusión
Conclusión

Como
Como Z =0
Z cc = 0..3844 <1
3844 < 645 ;; luego
1..645 luego no
no se
se rechaza
rechaza lala hipótesis
hipótesis planteada
planteada yy se
se
concluye, para α = 0 . 05 evidencias muéstrales indican que la
concluye, para α = 0.05 evidencias muéstrales indican que la proporción proporción de
de
revistas
revistas con
con más
más dede 15
15 artículos
artículos no
no es
es superior
superior a
a 0.42.
0.42.
Como
Como para
para todas
todas estas
estas pruebas
pruebas se
se utiliza
utiliza es
es estadístico
estadístico Z,
Z, se
se presenta
presenta la
la
siguiente
siguiente tabla
tabla para
para valores
valores clásicos
clásicos del
del nivel
nivel de
de significación:
significación:

Hipótesis
Hipótesis alternante
alternante Nivel
Nivel de
de significación
significación de
de la
la prueba
prueba
0.01
0.01 (1%)
(1%) 0.05
0.05 (5%)
(5%) 0.1
0.1 (10%)
(10%)
2
2 colas
colas -2.576 y 2.576
-2.576 y 2.576 -1.96 y 1.96
-1.96 y 1.96 -1.645
-1.645 yy 1.645
1.645
1
1 cola
cola a
a la
la derecha
derecha 2.326
2.326 1.645
1.645 1.282
1.282
1
1 cola
cola a
a la
la izquierda
izquierda -2.326
-2.326 -1.645
-1.645 -1.282
-1.282

Ejercicios
Ejercicios propuestos:
propuestos:

a.
a. Probar
Probar con
con un
un nivel
nivel de
de significación
significación del
del 5%
5% que
que la
la edad
edad promedio
promedio dede los
los
usuarios
usuarios que
que concurren
concurren aa un
un centro
centro de
de información
información es
es diferente
diferente a
a los
los 27
27
años.
años. Una
Una muestra
muestra dede 50
50 usuarios
usuarios elegidos
elegidos alal azar,
azar, proporciona
proporciona la la
siguiente
siguiente información:
información:
50 50

∑ ∑
50 50 2
∑ xx i
i = 1624
= 1624 ∑ xx 2
i
i = 55230
= 55230
b.
b.
i =1
i =1
i =1
i =1

c.
c. Probar
Probar con
con un
un nivel
nivel de
de significación
significación del
del 5%
5% que
que el
el número
número promedio
promedio de de
artículos
artículos por revistas en computación es superior a 8 artículos. Una
por revistas en computación es superior a 8 artículos. Una
muestra
muestra dede 15
15 revistas
revistas elegidas
elegidas al
al azar
azar de
de una
una población
población con
con distribución
distribución
normal
normal en cuanto al número de artículos proporciona los siguientes datos:
en cuanto al número de artículos proporciona los siguientes datos:
10
10 8
8 9
9 15
15 17
17 7
7 12
12 14
14 16
16 9
9
8
8 10
10 15
15 12
12 7
7
d.
d. Probar
Probar con
con un
un nivel
nivel de
de significación
significación del
del 5%
5% que
que el
el número
número promedio
promedio de
de
artículos
artículos por revistas en computación es diferente a 18 artículos. Una
por revistas en computación es diferente a 18 artículos. Una
29
muestra de 50 revistas elegidas al azar proporciona la siguiente
información.
x = 21 s 2 = 10
e. Probar con un nivel de significación del 5% que la proporción de revista
científicas en idioma inglés es diferente de 0.24. Una muestra de 100
revistas elegidas al azar proporciona la siguiente información de que 28
están en idioma inglés.

f. Probar con un nivel de significación del 5% que el número promedio de


personas que ingresan a un centro de información durante el día de
atención es diferente a 630, se eligen al azar una muestra de 50 días y se
obtiene por media aritmética 590 personas y desviación estándar 236
personas.

g. Probar con un nivel de significación del 5% que la proporción de revista


científicas en idioma inglés es superior a 0.35. Una muestra de 200
revistas elegidas al azar proporciona la siguiente información de que 80
están en idioma inglés.

h. En una biblioteca desconocemos la proporción de libros escritos en


español. De una muestra aleatoria de 125 libros, 80 de ellos están escritos
en español, y el resto en otros idiomas. Según estos datos, ¿se puede
afirmar que la proporción de libros escritos en español en dicha biblioteca
es mayor a 0.6?. Use un nivel de significación de 0.05.

i. Probar con un nivel de significación del 5% que la proporción de revistas


científicas en idioma inglés en la poblacion es superior a 0.38. De una
muestra elegida al azar de 150 revistas, se encuentra que 60 están en
idioma inglés. Calcular el valor calculado y la decisión tomada.

j. Probar con un nivel de significación del 5% que la proporción de revistas


científica en física escrita en idioma inglés es superior a 0.45. Una muestra
de tamaño 300 elegida al azar de la poblacion de revistas científica en
física, arroja que 165 son revistas en idioma inglés.

2.2.4. Medidas de asociación.

Coeficiente de correlación lineal simple de Pearson

El coeficiente de correlación lineal simple mide la fuerza o grado de asociación


lineal entre dos variables cuantitativas X e Y , que poseen una distribución
normal bivariada. Su valor varía entre [− 1, 1] , un valor próximo a 1 o -1 indica
una alta asociación lineal entre la variable, el valor positivo indica una asociación
lineal directa y un valor negativo indica una asociación lineal inversa, un valor
cercano a cero indica que las variables no están asociadas linealmente.
Supuestos

30
• Las variables X e Y son aleatorias
• Las variables X e Y son aleatorias
• Las variables X e Y tienen distribuciones normales bivariada
• Las variables X e Y tienen distribuciones normales bivariada
• Existe una relación lineal entre las variables X e Y
• Existe una relación lineal entre las variables X e Y
Para calcular este coeficiente, se toma una muestra aleatoria de tamaño “n” de
Para calcular este coeficiente, se toma una muestra aleatoria de tamaño “n” de
datos bivariados (( x , y ) , correspondiente a las variables X e Y ; luego un
datos bivariados xii , y ii ) , correspondiente a las variables X e Y ; luego un
estimador para el parámetro ρ llamado, el coeficiente de correlación lineal
estimador para el parámetro ρ llamado, el coeficiente de correlación lineal
poblacional es dado por:
poblacional es dado por:
n n
(∑ n
xi )(∑ n
y)
n n (∑
i =1 i ∑
x )( i =1 y ii )
∑n
(x
∑ (x i
i
− x)( y i − y )
− x)( y i − y ) ∑ xy
∑x y
n
i
i
i
i

− i =1
n
i =1

r= i =1
= i =1
n (1)
r= n
i =1
n = i =1
n n (1)
∑n
(x
∑ (x i − x)
− x)
2
2 ∑n
(y
∑(y i − y)
− y)
2
2 n
(∑ x )
(∑
n
x)
2
i 2 n
(∑ y )
(∑
n
y)
2
i 2

∑ ∑
i i n 2 i n 2 i
i =1 i =1
x − i =1
y − i =1
i =1 i =1
∑x
i =1
i =1
i2
i − i =1
n
n
∑y
i =1
i =1
i2
i − i =1
n
n

El valor que toma este coeficiente varía en el intervalo − 1 ≤ r ≤ +1


El valor que toma este coeficiente varía en el intervalo − 1 ≤ r ≤ +1
1.
1.
rr =
=+ +11 nos indica que existe una asociación o correlación lineal perfecta
nos indica que existe una asociación o correlación lineal perfecta
positiva; es decir si “X” aumenta “Y” también aumenta; en otras palabras,
positiva; es decir si “X” aumenta “Y” también aumenta; en otras palabras,
todos los puntos están sobre una línea recta de pendiente positiva.
todos los puntos están sobre una línea recta de pendiente positiva.
2. r = −1 , nos indica que existe una asociación o correlación lineal perfecta
2. r = −1 , nos indica que existe una asociación o correlación lineal perfecta
negativa; es decir si “X” aumenta “Y” disminuye y viceversa; en otras
negativa; es decir si “X” aumenta “Y” disminuye y viceversa; en otras
palabras, todos los puntos están sobre una línea recta de pendiente
palabras, todos los puntos están sobre una línea recta de pendiente
negativa.
negativa.
3.
3.
rr == 00 ,, nos indica que no existe relación lineal entre las variables e Y ;
nos indica que no existe relación lineal entre las variables XX eY;
esto no implica que las variables X e Y sean independientes.
esto no implica que las variables X e Y sean independientes.
Ejemplo
Ejemplo
La información de la tabla corresponde a la producción de artículos científicos
La información de la tabla corresponde a la producción de artículos científicos
sobre enfermedades del corazón, durante los años 1990 al 2020
sobre enfermedades del corazón, durante los años 1990 al 2020
X=Años Y=Producción de artículos
X=Años Y=Producción de artículos
científicos
científicos
1990 22
1990 22
1995 30
1995 30
2000 42
2000 42
2005 55
2005 55
2010 62
2010 62
2015 70
2015 70
2020 82
2020 82
¿La producción de artículos científico está asociado linealmente al tiempo?
¿La producción de artículos científico está asociado linealmente al tiempo?
Para el cálculo del coeficiente de correlación lineal, se tiene las siguientes
Para el cálculo del coeficiente de correlación lineal, se tiene las siguientes
sumatorias que aparecen en negrita en la siguiente tabla.
sumatorias que aparecen en negrita en la siguiente tabla.
31
X Y XY X2 Y2
1990 22 43780 3960100 484
1995 30 59850 3980025 900
2000 42 84000 4000000 1764
2005 55 110275 4020025 3025
2010 62 124620 4040100 3844
2015 70 141050 4060225 4900
2020 82 165640 4080400 6724
14035 363 729215 28140875 21641

Aplicando la formula (1)


(14035)(363)
729215 −
7 1400
r= = = 0.99700332
(14035) 2 (363) 2 700 2816.857143
28140875 − 21641 −
7 7

Interpretación: 0.997, este valor indica que los años y la producción de artículos
científicos sobre la enfermedad del corazón están altamente asociados en forma
directa.

Prueba de hipótesis para el coeficiente de correlación lineal

El valor del coeficiente de correlación lineal, por sí solo no es suficiente para


evaluar el grado de asociación existente entre dichas variables. Este valor es
resultado de una muestra elegida al azar de una poblacion, para dar validez a
este coeficiente es necesario establecer una hipótesis con respecto a su
parámetro y poder juzgar la asociación poblacional de las variables X e Y con la
evidencia muestral y un nivel de significación α .

1. Cuando el valor hipotético del coeficiente de correlación población


(parámetro) es cero ρ = 0

Cuando se desea verificar si el coeficiente de correlación estimado es o


no nulo, lo cual sugiere la existencia o no de una asociación significativa
entre las variables en estudio X e Y , se tienen las siguientes hipótesis:

H p : ρ = 0 → ( No hay correlacion lineal entre X e Y )


H a : ρ ≠ 0 → ( hay correlacion lineal entre X e Y )

Nivel de significación α = P (rechazar H p / H p , es cierta)

El estadístico de prueba es:

r n−2
tc = ≈ T( n − 2 ) gl
1− r2

Se rechaza la hipótesis nula, para una prueba de dos colas.


Si tc < T α o t >T
( ,n − 2 ) c α
( ,n − 2)
2 2

32
NOTA

Si no se rechaza Ho entonces nos indica que las evidencias muéstrales expresan


que no existe una correlación lineal significativa entre las variables X e Y . Pero
debe tenerse presente que el no rechazo de Ho no implica que las variables X e
Y sean independientes.

También al rechazar la Ho, indicará que las evidencias muéstrales expresan que
existe una correlación lineal significativa entre las variables X e Y . Debe tenerse
presente que el rechazo de Ho no implica que la relación funcional entre las
variables en estudio sea necesariamente una función lineal. En estos casos es
recomendable obtener una grafico de la dispersión de los datos, para estudiar el
tipo de relación funcional entre las variables.

Ejemplo

Del ejemplo anterior, probar con un nivel de significación del 5% que el


coeficiente de correlación lineal es diferente de cero

Probar si existe una correlación lineal significativa entre las variables X e Y .


Use α = 0.05

H 0 : ρ = 0 → ( No hay correlacion lineal entre X e Y )


H a : ρ ≠ 0 → ( hay correlacion lineal entre X e Y )
α = 0.05
Usando la formula dada en (1) se tiene que r = 0.997
Calculo del estadístico de prueba
r−ρ 0.997 − 0
tc = = = 28.80
1− r2 1 − 0.997 2
n−2 7−2

Región critica para la prueba: como la prueba es bilateral se tiene, se rechaza


la hipótesis planteada si:

Gráfica de distribución
T; df=5
0.4

0.3
Densidad

0.2

0.1

0.025 0.025
0.0
-2.571 0 2.571
X

33
Como t c = 28.80 > 2.776 , entonces se rechaza la Ho. Las variables X e Y
están significativamente asociadas al nivel 5%.

Ejercicio propuesto

La siguiente tabla tiene información sobre el número de artículos publicados en


matemáticas y el número de citas recibidas durante los años 1994 a 2000.

Años
1994 1995 1996 1997 1998 1999 2000
Descripción
N° artículos
20 25 30 40 47 56 70
publicados
N° citas recibidas 4 9 20 14 21 23 28

1. Hallar el coeficiente de correlación.


2. Probar si existe una correlación significativa entre las variables X e Y. Use
α = 0.05 .

Coeficiente de correlación de rangos de Spearman

Su valor mide la asociación entre dos variables X e Y , se usa cuando por lo


menos unas de las variables son ordinal, y no requiere que se cumpla el
supuesto de normalidad bivariada, tiene por formula:

n
6.∑ ( Rxi − Ry i ) 2
rs = 1 − i =1
(1)
n(n 2 − 1)

( Rxi − Ry i ) = Diferencias de los rangos de las variables X e Y

Para una muestra de tamaño n , se tiene ( xi , y i ) , los valores que toman las
variables X e Y , se consideran los órdenes se sus valores en forman
ascendente o descendente, a estos ordenes se le llama rangos, en caso de que
existan empates entre sus órdenes, se toma en cuenta su valor promedio.
.
La interpretación que del valor de rs , es la misma que la del coeficiente de
correlación de Pearson.

La fórmula anterior se usa cuando no hay empates en los rangos (ordenes), de


lo contrario se usa la fórmula más general.

n n n

∑R 2
xi + ∑ R y2i − ∑ ( Rxi − R yi ) 2
rs = i =1 i =1 i =1
(2)
2. R . R y2i
2
xi

34
Donde
g

n
n(n − 1)2 ∑ E (E i i
2
− 1)

i =1
2
R =
xi
12
−Mx Mx = i =1

12
g

n
n(n 2 − 1) ∑ E (E i i
2
− 1)

i =1
2
R =
yi
12
−My My = i =1

12

M x = Es el término de corrección por empates en los rangos de x


M y = Es el termino de corrección por empates en los rangos de y

Supongamos que no hay empates en ambas variables la formula (2) se


convierte en (1)

Ejemplo

Dos jurados evalúan a 12 candidatos para un puesto de trabajo, la calificación


es de 0 a 20. Los datos se presentan en la tabla.

Postulante X=Jurado Y=Jurado Rxi Ry i ( Rxi − Ry i ) ( Rxi − Ry i ) 2


A B
1 12(1) 14(1) 1.5 2.5 -1 1
2 14(4) 14(2) 4 2.5 1.5 2.25
3 15(6) 14(3) 6 2.5 3.5 12.25
4 13(3) 15(5) 3 6 -3 9
5 17(9) 16(8) 9.5 8.5 1 1
6 17(10) 18(12) 9.5 12 -2.5 6.25
7 16(8) 15(6) 8 6 2 4
8 15(5) 17(10) 6 10.5 -4.5 20.25
9 19(12) 17(11) 12 10.5 1.5 2.25
10 18(11) 15(7) 11 6 5 25
11 15(7) 16(9) 6 8.5 -2.5 6.25
12 12(2) 14(4) 1.5 2.5 -1 1
total 90.5
Aplicando la formula (2), calculamos los términos de corrección para x e y
Para el rango de x: existe un grupo con 2 empates (g=1); otro grupo con 2
empates (g=2) y un tercer grupo con 3 empates (g=3).
Para el rango de y: existe un grupo con 4 empates (g=1); otro grupo con 3
empates (g=2), un tercer grupo con 2 empates (g=3) y un cuarto grupo con 2
empates (g=4).

∑ E (E i i
2
− 1)
2(2 2 − 1) + 2(2 2 − 1) + 3(3 2 − 1) 36
Mx = I =1
= = =3
12 12 12
4

∑ E (E i i
2
− 1)
4(4 2 − 1) + 3(3 2 − 1) + 2(2 2 − 1) + 2(2 2 − 1) 96
Mx = I =1
= = =8
12 12 12
35
12
12(12 2 − 1)
∑ Rx2i =
i =1 12
− 3 = 140
n
12(12 2 − 1)
∑R
i =1
2
yi =
12
− 8 = 135

Existe una baja asociación entre ambas calificaciones de los jurados

140 + 135 − 90.5


rs = = 0.671020
2. 140 . 135
Entre las variables X e Y existe una baja correlación o asociación.

Usando la formula (1)


n
6.∑ ( Rxi − Ry i ) 2
6(90.5)
rs = 1 − i =1
= 1− = 0.683566 (1)
n(n 2 − 1) 12(12 2 − 1)
Entre los valores que toma la variable X e Y existe una baja correlación o
asociación entre las opiniones de los jurados..
La correlación de Pearson entre los rangos es igual a 0.671020.

Graficas de las variables X e Y

Y=Jurado B
20

15

10

0
0 5 10 15 20

Prueba de hipótesis

H 0 : ρ = 0 → ( No hay correlacion entre X e Y )


H a : ρ ≠ 0 → ( hay correlacion entre X e Y )

Nivel de significación α = P (rechazar H 0 / H 0 , es cierta)

Se rechaza la hipótesis nula si el valor tabular cumple cualquiera de las


siguientes condiciones:

36
Gráfica de distribución
Gráfica de distribución
T; df=10
T; df=10
0.4
0.4

0.3
0.3

Densidad
Densidad
0.2
0.2

0.1
0.1

0.025 0.025
0.0 0.025 0.025
-2.228 0 2.228
0.0
-2.228 X
0 2.228
X

El estadístico de prueba es:


El estadístico de prueba es:
r n−2
t c = r n − 2 ≈ T( n − 2 ) gl
t c = 1 − r 2 ≈ T( n − 2 ) gl
1− r2
r n − 2 0.671020 12 − 2
t c = rss n − 2 = 0.671020 12 − 2 = 2.862
t c = 1 − r 2 = 1 − 0.671020 2 = 2.862
s
1 − rs2 1 − 0.671020 2

Conclusión se rechaza la hipótesis nula, existe una correlación significativa


Conclusión se rechaza la hipótesis nula, existe una correlación significativa
directa entre las variables.
directa entre las variables.
2.2.5. Regresion lineal múltiple y simple
2.2.5. Regresion lineal múltiple y simple
Regresion lineal múltiple
Regresion lineal múltiple
Estudia la relación funcional entre una variable Y , llamada dependiente o
Estudia la relación
respuesta y un conjuntofuncional entre unallamadas
de k variables Y , llamada dependiente
variable independientes o
(explicativas
respuesta
o y unXconjunto
predictoras), , X ,..., X k variables
de de tal forma llamadas
que la independientes
primera depende (explicativas
de la segunda
1 2, k
o predictoras), X 1 , X 2, ,..., X k de tal forma que la primera depende de la segunda
o dicho de otra forma X 1 , X 2, ,..., X k influye en el comportamiento de Y; con el
o dicho de otra forma X 1 , X 2, ,..., X k influye en el comportamiento de Y; con el
objetivo de:
objetivo de:
• Determinar las variables o factores que influyen en la variable respuesta.
•• Determinar las variables
Modelar la variable o factores
respuesta que influyen
y las variables en la variable respuesta.
independientes
•• Modelar la variable respuesta y las variables independientes
Predecir o estimar la media de Y, conociendo un valor de X.
• Predecir o estimar la media de Y, conociendo un valor de X.
Modelo de regresion lineal múltiple con k variables independientes
Modelo de regresion lineal múltiple con k variables independientes
Yi = β 0 + β1 X 1 + β 2 X 2, +,...,+ β k X k + ε i (1)
Yi = β 0 + β1 X 1 + β 2 X 2, +,...,+ β k X k + ε i (1)
Y = Variable aleatoria
Y = Variable aleatoria
X 1 , X 2, ,..., X k =Variables no aleatorias que influyen en el comportamiento de la
X 1 , X 2, ,..., X k =Variables no aleatorias que influyen en el comportamiento de la
variable Y
variable Y
37
β1 , β 2, ,..., β k =Coeficientes asociados a las variables independientes

ε i =Error aleatorio, se espera de poca influencia en Y, con media cero y varianza


homogénea.

De (1) por el supuesto del error aleatorio

E (Y / X 1 , X 2 ,... X k ) = β 0 + β1 X 1 + β 2 X 2 + ... + β k X k (2)

(2) en (1)

Yi = E (Yi / X 1 , X 2 ,..., X k ) + ε i (3)

Una función f ( X 1 , X 2 ,..., X k ) estima a E (Yi / X 1 , X 2 ,..., X k )

Regresion lineal simple

Para una sola variable independiente

Yi = β 0 + β1 X + ε i

La media de la variable respuesta tomando en cuenta el supuesto de los errores


aleatorios

E (Y / X ) = β 0 + β1 X
Un modelo estimado para E (Y / X ) , es dado por Yˆ = b0 + b1 X

Ejemplo (1)

Y = gastos de las familias(S/.) X = ingresos de los Jefes de familias(S/.)

Para estas dos variables, los gastos de las familias dependen de los ingresos,
matemáticamente. Una muestra elegida al azar de 11 familias.

N°. Ingresos gastos


1 2000 1900
2 2500 2500
3 3000 3100
4 3500 3700
5 4000 3800
6 4500 4600
7 5000 4500
8 5500 5000
9 6000 4500
10 6500 5000
11 7000 6500

38
Gráfica de línea ajustada
Gráfica de línea ajustada
gastos = 786.4 + 0.7364 Ingresos
gastos = 786.4 + 0.7364 Ingresos
7000 S 433.158
7000 S 433.158
R-cuad. 89.8%
R-cuad.
R-cuad.(ajustado) 89.8%
88.7%
R-cuad.(ajustado) 88.7%
6000
6000

5000
5000
gastos
gastos

4000
4000

3000
3000

2000
2000
2000 3000 4000 5000 6000 7000
2000 3000 4000 5000 6000 7000
Ingresos
Ingresos

Yˆ f (X ) = b + b X
Una estimación para E (Y / X ) , es dado por::
Una estimación para E (Y / X ) , es dado por:: Yˆ =
= f ( X ) = b00 + b11 X
Supuestos para un modelo de regresión lineal simple
Supuestos para un modelo de regresión lineal simple
a. Los valores que toma X son fijados por el investigador.
a. Los valores que toma X son fijados por el investigador.

b. Para cada valor de x fijo, se genera una población de valores para Y que
b. Para cada valor de xii fijo, se genera una población de valores para Y que
tienen una distribución Normal con media y variancia, dada por:
tienen una distribución Normal con media y variancia, dada por:
Y
Y≈ N ((
≈N β +β
β 00 + X ii ;; σ
β11 X
2
σ 2 ))
c. Para cada población, la diferencia entre un valor cualquiera yyi y su media
c. Para cada población, la diferencia entre un valor cualquiera i y su media
E (Y / xi ) se le llama error, es decir:
E (Y / xi ) se le llama error, es decir:

yi − E (Y / xi ) = ε i
yi − E (Y / xi ) = ε i

yyi = E (Y / xi ) + ε i
i = E (Y / xi ) + ε i

Si suponemos para la media E (Y / x ) es una recta lineal; es decir que una


Si suponemos para la media E (Y / xii ) es una recta lineal; es decir que una
recta pase por todos los puntos de la media, luego:
recta pase por todos los puntos de la media, luego:
f ( x) = E (Y / xi ) = β 0 + β1 xi
f ( x) = E (Y / xi ) = β 0 + β1 xi
Lo anterior es llamado la Ecuación de Regresión Lineal Poblacional de Y sobre
Lo anterior es llamado la Ecuación de Regresión Lineal Poblacional de Y sobre
X
X
Luego:
Luego:
yyi = β 0 + β1 xi + ε i ((1
1))
i = β 0 + β1 xi + ε i

(1) Se le llama la ecuación de regresión lineal poblacional o modelo de regresión


(1) Se le llama la ecuación de regresión lineal poblacional o modelo de regresión
lineal poblacional.
lineal poblacional.
39
Los errores εi se distribuyen normal e independientemente como media cero
2
(0) y variancia ( σ )

ECUACION DE REGRESION ESTIMADA

Para estimar el modelo (1) se extrae una muestra aleatoria de tamaño “n” y se
registra los valores de los pares ordenados

( x1 , y1 ), ( x2 , y 2 ),..., ( xn , y n ) ,

Con estos pares ordenados planteamos la función de regresión lineal muestral


dada por (2), la que estima a la función de regresión poblacional; es decir:

yi = b0 + b1 xi + ei (2)

La recta estimada es:

yˆ = b0 + b1 x (3)

(3) estima a la E (Y / X ) , es decir:

yˆ → E (Y / xi )

Para estimar los coeficientes de la ecuación de regresión muestral dado por (2),
se hará uso de la Técnica de los Mínimos Cuadros Ordinarios (MCO), técnica
que consiste en calcular los valores de b0 y b1 tal que minimice la suma
de los cuadrados de los errores; es decir de (2), se tiene:

n n

∑e
i =1
2
i = ∑ ( yi − b0 − b1 xi ) 2 = f (b0 , b1 )
i =1

Para obtener los valores que minimiza la función f (b0 , b1 ) derivamos


parcialmente con respecto a b0 y b1 e igualamos a cero; es decir:

∂f (b0 , b1 )
= 0 → b0 = y − b1 x
∂b0
n n

n n
(∑ xi )(∑ yi )

∂f (b0 , b1 ) ∑ (x i − x)( yi − y ) ∑x y i i − i =1

n
i =1

= 0 → b1 = i =1
n
= i =1
n
∂b1
∑ ( xi − x ) 2 n
( ∑ xi ) 2
i =1
∑x
i =1
2
i − i =1

40
2.2.6. Coeficiente de Determinación
2.2.6. Coeficiente de Determinación
Es un valor y mide la proporción o porcentaje de la variación de la variable Y
Es un valoro yatribuible
explicada mide la proporción o porcentaje
al modelo estimado. Se de la variación
calcula de la
aplicando la siguiente
variable Y
explicada o atribuible al modelo estimado. Se calcula aplicando la siguiente
formula.
formula.
n n

∑ (( yyˆˆ
n − y ) 22 b122 ∑ n ( x − x) 2
b1 ∑
=∑
i i 2
− y) i =1 ( xi − x )
R 22 I =1
I n=1
i
*100% = n i =1
*100%
R = *100% = *100%
∑ (( yy
n − y ) 22 ∑ n ( yi − y ) 22
∑ ∑ ( yi − y )
i
I =1 i − y) I =1
I =1 I =1

Su valor varía de 0 al 100%, cuando esta próximo al 100%, indica que la


Su valor varía
ecuación de lade 0 alestimada,
recta 100%, cuando estaopróximo
se ajusta al 100%,
se acomoda indica
lo mejor que laa la
posible
ecuación de la recta estimada, se ajusta o se acomoda lo mejor posible a la
nube de puntos.
nube de puntos.
Para una regresion lineal simple, el coeficiente de determinación se calcula a
Para
travésuna
delregresion lineal
coeficiente simple, el coeficiente
de correlación de Pearson,deelevando
determinación se al
su valor calcula a
través del coeficiente
cuadrado, es decir, de correlación de Pearson, elevando su valor al
cuadrado, es decir,
. R 22 = (rPearson ) 22 . *100%
. R = (rPearson ) . *100%
Ejemplo
Ejemplo
Con la finalidad de estudiar la relación funcional entre la cantidad de docentes y
Con
la la finalidad
cantidad de estudiar
de artículos la relación
científicos funcional
publicados paraentre la cantidad de docentes
11 universidades elegidas aly
la cantidad
azar de país,
de cierto artículos científicos
la tabla publicados
siguiente presentapara 11 universidades
la siguiente elegidas al
información.
azar de cierto país, la tabla siguiente presenta la siguiente información.
Y=N° de
X=N° de Y=N° de
artículos
X=N° de publicados
docentes artículos
docentes
200 publicados
20
200
300 20
30
300
700 30
70
700
1200 70
100
1200
1500 100
150
1500
600 150
50
600
154 50
10
154
136 10
10
136
160 10
18
160
240 18
36
240
500 36
45
500 45
a. Presentar los datos de ambas variables en un plano cartesiano (nube de
a. Presentar
puntos). los datos de ambas variables en un plano cartesiano (nube de
b. puntos). la ecuación de regresión lineal de y sobre x.
Estimar
b.
c. Estimar laelecuación
Calcular dede
coeficiente regresión lineal de
determinación y sobre
para x.
la ecuación estimada.
c.
d. Calcular el coeficiente de determinación para la ecuación
Estimar la cantidad de artículos para una universidad que estimada.
tienen 1000
d. Estimar la cantidad de artículos para una universidad que tienen 1000
docentes.
docentes.
.Para la pregunta (a), se presenta la nube de puntos (X,Y)
.Para la pregunta (a), se presenta la nube de puntos (X,Y)
41
y
160
140
120
100
80
60
40
20
0
0 200 400 600 800 1000 1200 1400 1600

De la nube de puntos, para las universidades en estudio existe una tendencia


lineal positiva entre la Y=cantidad de docentes y la X=cantidad de artículos
publicados.

Para la pregunta (b)

Para calcular los coeficientes de la recta estimada se debe calcular las


siguiente sumatorias, resultados que aparecen en la última fila de la tabla
7 7 7 7

∑x
i =1
i = 5690 ∑y
i =1
i = 539 ∑x y
i =1
i i = 473920 ∑x
i =1
2
i = 5045412
7

∑y
i =1
2
i = 45045

x y x*y x*x y*y


200 20 4000 40000 400
300 30 9000 90000 900
700 70 49000 490000 4900
1200 100 120000 1440000 10000
1500 150 225000 2250000 22500
600 50 30000 360000 2500
154 10 1540 23716 100
136 10 1360 18496 100
160 18 2880 25600 324
240 36 8640 57600 1296
500 45 22500 250000 2025
5690 539 473920 5045412 45045

42
Usando la formula se tiene:

(∑ x)(∑ y ) (5690)(539)
∑ xy − n
473920 −
11
b1 = = = 0.09281537
(∑ x ) 2 (5690) 2
∑x 2

n
5045412 −
11

539 5690
b0 = y − b1 x = − 0.09281537( ) = 0.989140
11 11

Luego la recta de regresión estimada de y sobre x es:

yˆ = b0 + b1 x = 0.98913812 + 0.09281537 x

Interpretación de la pendiente

Por cada docente que se incrementa en las universidades, la cantidad artículos


publicado se incrementa 0.093 en promedio, si el incremento es 20 docentes el
incremento es de 1.86 artículos publicados en promedio.

Calculo del coeficiente de determinación

Aplicando la formula, el valor del coeficiente de determinación es de 97.18%,


este valor indica que, el 97.18% de la variación de los valores que toma Y
(cantidad de artículos publicados), se atribuye a la variación de los valores que
toma la variable (cantidad de docentes).

Y la estimación de la cantidad promedio de artículos publicado para 1000


docentes es de 93.8, este valor se obtiene al reemplazar en la ecuación estimada
el valor de X=1000.

Ejercicios propuestos.

1. La información de la tabla corresponde a la cantidad de artículos


publicados en química, durante los años 1990 hasta 2020. Estimar el
modelo lineal.

y=cantidad de
x=años artículos publicados
1990 13
1995 28
2000 42
2005 58
2010 77
2015 90
2020 110

43
2. Con la información de la pregunta 1. Calcular e interpretar el coeficiente
de determinación.
3. Con la información de la pregunta 1. Estimar la cantidad de artículos
publicados para el año 2022.

2.2.7. Regresión lineal simple con datos codificados para la variable X

Ocurre situaciones en la cual los valores que toma la variable independiente X


están igualmente espaciados, cuando esto acurre los cálculos se simplifican para
obtener el valor del intercepto y la pendiente de la recta de regresión estimada.
Para logar estos objetivos los datos de la variable X deben estar codificados.

Metodología para codificar los valores que toma X

a. Se calcula el valor de − (n − 1) / 2

b. Al valor calculado en el punto (a) se le multiplica por el espaciado "r"


obteniéndose: − r (n − 1) / 2 , convirtiéndose en el primer valor codificado

c. Los restantes valores codificados se obtienen sumándole al valor obtenido


en el punto (b) el valor del espaciado "r" .
n
d. Con los valores codificado se verifica que ∑x
i =1
*
i = 0 , con este resultado

se simplifican los cálculos del intercepto y pendiente.

Nota

Otra forma de obtener lo mismo es utilizar la siguiente relación:

X i* = xi − x

xi* = a + (i − 1) r
r (n − 1)
x=a+
2
r (n − 1) 2r (i − 1) − r (n − 1) r (2i − 2 − n + 1)  − ( n − 2i + 1) 
xi* − x = (i − 1)r − = = = r 
2 2 2  2
 − (n − 2i + 1) 
xi* − x = r  
 2 
r = espacido
i = i − esima observacion
n = tamaño de la muestra
tambien se cumple que :
r n r n(n + 1) r
[ ]
n

∑ (x
i =1
*
i − x) = − ∑ (n − 2i + 1) = − 2 n 2 − 2 2 + n = − 2 n 2 − n 2 − n + n = 0
2 i =1

44
Ejemplo

La información que se presenta en la tabla, corresponde a la producción


de artículos científicos en biológicas durante los años 1990 al 2015.

X=años Y=producción
1990 15
1995 38
2000 54
2005 76
2010 92
2015 115

a. Estimar la ecuación de regresión lineal de Y sobre X

b. Calcular el coeficiente de correlación lineal de x e y

c. Calcular el coeficiente de determinación del modelo

d. Estimar la producción de artículos para el años 2017.

e. Obtener a partir de la ecuación de regresión codificada, la ecuación de


regresión para datos sin codificar.

Regresión parar datos sin codificar

x y x. y x2 y2
1990 15 29850 3960100 225
1995 38 75810 3980025 1444
2000 54 108000 4000000 2916
2005 76 152380 4020025 5776
2010 92 184920 4040100 8464
2015 115 231725 4060225 13225
12015 390 782685 24060475 32050

Cálculos:

b = 3.90857143
a = −7761.91429
r = 0.99877964
R 2 = 99.756
y = −7761.91429 + 3.90857143(2017) = 121.6742843 = 121.67

Codificando los datos

Solución (a):

45
Los valores de la variable x están igualmente espaciado, luego
(6 − 1)
− = −2.5 → 5(−2.5) = −12.5
2

x * = años y = Producción
-12.5 15
-7.5 38
-2.5 54
2.5 76
7.5 92
12.5 115

Calculamos las sumas de las variables y su producto cruzado

N° x* y x*.y (x * ) 2 y2
1 -12.5 15 -187.5 156.25 225
2 -7.5 38 -285 56.25 1444
3 -2.5 54 -135 6.25 2916
4 2.5 76 190 6.25 5776
5 7.5 92 690 56.25 8464
6 12.5 115 1437.5 156.25 13225
Total 0 390 1710 437.5 32050

Cálculos:

∑x y c
1710
b= i =1
6
= = 3.90857
437.5
∑x
i =1
2
c

∑y 390
a= i =1
= = 65
6 6

La ecuación de regresión lineal codificada es:

y = 65 + 3.90857 x *

Solución (b):

Calculo del coeficiente de correlación lineal de x e y

r=
∑ xc . y =
1710
=
1710
= 0.99878
(∑ y ) 2
(390) 2
1712.089367
∑x . ∑y 2
c
2

6
437.5. 32050 −
6

Solución (c):

Coeficiente de determinación

46
R 2 = r 2 (100%) = (0.99878) 2 (100%) = 99.756%

Solución (d):

Para la proyección se debe codificar año 2017 a través de la relación

x * = x − x → xc = 2017 − 2002.5 = 14.5

y = 65 + 3.90857 x * → y = 65 + 3.90857 (14.5) = 121.67

Solución (e):

Reemplazamos en la ecuación de regresión lineal codificada el valor de

x * = x − x → x * = x − 2002.5

Luego:

y = 65 + 3.90857( x − 2002.5) → y = −7761.911425 + 3.90857 x

Este último resultado, también se obtiene si utilizamos los datos originales.

Ejercicios propuestos

1. La información que a continuación se presenta corresponden a la


producción de artículos científicos en química entre los años 1990 a 2020.

X=Años Y=Producción de artículos


científicos
1990 22
1995 30
2000 42
2005 55
2010 62
2015 70
2020 82

a. Estimar la ecuación de regresión lineal de Y sobre X codificada.


b. Calcular el coeficiente de correlación lineal
c. Calcular el coeficiente de determinación
d. Estimar la producción de revistas científicas para el año 2013 (utilizar 2
decimales).
e. Estimar la producción de revistas para el año 2022 (utilizar 2
decimales).
f. Estimar la producción de revistas para el año 2025(utilizar 2 decimales).

47
2.2.8. Regresion no lineal

Sea la información de la tabla

X=años Y=producción
1990 40
1995 60
2000 90
2005 135
2010 203
2015 320
2020 600

Gráfica de la información de la tabla

Y=Producción
700

600

500

400

300

200

100

0
1985 1990 1995 2000 2005 2010 2015 2020 2025

La nube de puntos de la gráfica, nos indica una tendencia no lineal y para


modelar este comportamiento, se busca un modelo matemático que mejor se
ajuste a la nube de puntos.

Modelo no lineal
y = a.b x
Aplicando logaritmo decimal a ambos lado de la igualdad con el objetivo de
linealizar el modelo no lineal y transformarlo en un modelo lineal, modelo que
permite calcular los valores de a y b.

y = ab x → log y = log a.b x → log y = log a + log b x


log y = log a + x(log b) → log y = log a + (log b) x
Z = A + Bx → mod elo lineal

48
Dónde:

Z = log y
A = log a → a = 10 A
B = log b → b = 10 B

Sus ecuaciones para calcular A y B, suponiendo la variable X codificada, son:


n n

∑xz i i ∑z i
B= i =1
n
A= i =1
n
∑x
i =1
2
i

*
Estima la ecuación de regresion no lineal de la forma y = ab x
x*
El modelo no lineal: y = 141.5134851 (1.091719056 )

Estimar la producción de revistas científicas para el año 2022.

Codificando el valor X=2022

X*=X-media de los valores X

X*=2022-2005=17años

y 2022 = 141.5134851(1.091719056)17

Sea el modelo de regresión no lineal

x
Yi = β 0 .β1 i ε i

Haciendo la transformación con el objeto de llevarlo a un modelo lineal.

x
log Yi = log β 0 .β1 i ε i = log β 0 + xi log β1 + log ε i
z i = β 0* + β1* xi + ε i* como E (ε i* ) = 0

Una estimación para E ( Z / X ) = β 0* + β1* xi , es dado por

Zˆ = βˆ0* + βˆ1* X = A + BX
z = A + Bx mod elo linealizado → z = log y A = log βˆ0* B = log βˆ1*

49
Ejemplo
Ejemplo

Sea
Sea la
la información
información de
de la
la tabla
tabla

Y=producción
Y=producción
de
de artículos
artículos
X=años
X=años científicos
científicos en
en
matemática
matemática
1990
1990 5
5
1995
1995 10
10
2000
2000 20
20
2005
2005 40
40
2010
2010 80
80
2015
2015 160
160

a.
a. Estimar
Estimar la
la ecuación
ecuación dede regresión
regresión no
no lineal
lineal yy == ab
x
ab x
b.
b. Calcular
Calcular el
el coeficiente
coeficiente de
de correlación
correlación lineal
lineal de
de x
xeey y
c.
c. Calcular
Calcular el
el coeficiente
coeficiente de
de determinación
determinación del del modelo
modelo
d.
d. Proyectar
Proyectar la
la producción
producción de de artículos
artículos científicos
científicos para
para el
el año
año 2017
2017 y
y 2020
2020
e.
e. Obtener
Obtener a partir de la ecuación de regresión codificada, la ecuación de
a partir de la ecuación de regresión codificada, la ecuación de
regresión
regresión para
para datos
datos sin
sin codificar
codificar

Como
Como los
los datos
datos de
de la variable xx están
la variable están igualmente
igualmente espaciados,
espaciados, entonces
entonces se
se
trabaja
trabaja con
con datos
datos codificados:
codificados:
yy
xx ** = log
zz = log yy
*
zz.x
.x * (x * 2
(x * )) 2 zz 22
-12.5
-12.5 5
5 0.69897
0.69897 -8.73712505
-8.73712505 156.25
156.25 0.48855907
0.48855907
-7.5
-7.5 10
10 1
1 -7.5
-7.5 56.25
56.25 1
1
-2.5
-2.5 20
20 1.30103
1.30103 -3.25257499
-3.25257499 6.25
6.25 1.69267905
1.69267905
2.5
2.5 40
40 1.60205999
1.60205999 4.00514998
4.00514998 6.25
6.25 2.56659622
2.56659622
7.5
7.5 80
80 1.90308999
1.90308999 14.2731749
14.2731749 56.25
56.25 3.6217515
3.6217515
12.5
12.5 160
160 2.20411998
2.20411998 27.5514998
27.5514998 156.25
156.25 4.8581449
4.8581449
0
0 315
315 8.70926996
8.70926996 26.3401246
26.3401246 437.5
437.5 14.2277307
14.2277307

Solución
Solución (a):
(a):

B= ∑ xx zz = 26
26..3401246
c
c 3401246 = 0.060206 → 0.060206 = log b → b = 1.148698
B = = = 0.060206 → 0.060206 = log b → b = 1.148698
∑x x 2
2
c
c
437
437..55
∑ zz = 88..709270
709270
A
A== = = 11..451545
= 451545 →→ 11..451545 = log
451545 = log aa → = 28
→ aa = 28..284272
284272
66 66
El
El modelo
modelo codificado
codificado es:
es:
*
x*
= 28
yy = 28..28424272
28424272 ((1
1..148698
148698)) x

Solución
Solución (b):
(b):

Calculo
Calculo del
del coeficiente
coeficiente de
de correlación entre xxcc ee zz
correlación entre
50
r=
∑ x .z
c
=
26.3401246
=
26.3401246
= 1.0
(∑ z ) 2
(8.70926996) 2
26.3401244
∑x . ∑z
2
c
2

6
437.5. 14.2277307 −
6

Solución (c):

Coeficiente de determinación
R 2 = r 2 (100%) = (1.0) 2 (100%) = 100%

Solución (d):

Para la proyección se debe codificar año 2017 a través de la relación


x * = x − x → xc = 2017 − 2002.5 = 14.5

*
y = 28.284272(1.148698) x → y = 28.284272(1.148698)14.5 = 211.12

Para la proyección se debe codificar año 2020 a través de la relación


x * = x − x → xc = 2020 − 2002.5 = 17.5

*
y = 28.284272(1.148698) x → y = 28.284272(1.148698)17.5 = 320

Solución (e):

Reemplazamos en la ecuación de regresión codificada el valor de

x * = x − x → x * = x − 2002.5 (3)

(1) en (1)

y = 28.284272(1.148698) xc → y = 28.284272(1.148698) ( x−2002.5)

Ejemplos propuestos

1. Los datos que a continuación se presenta, corresponden a la producción


de artículos científicos en matemáticas para los años 1980 al 2005.

Y=producción
de artículos
X= años científicos en
matemática
1980 20
1985 38
1990 60
1995 82
2000 100
2005 122
51
a. Estimar el modelo de regresión lineal de Y sobre X

b. Calcular el coeficiente de correlación lineal de X e Y, interpretar

c. Calcular el coeficiente de determinación, interpretar

d. Estimar la producción promedio del número de artículos científicos para

los años 1992 y 2003

e. Proyectar la producción promedio para el año 2016

2. La información que a continuación se presenta, corresponden a la producción


de artículos científicos científicas en matemáticas para los años 1980 al 2005.

Y=producción
de artículos
X= años científicos en
matemática
(1980-2005)
1980 20
1985 38
1990 80
1995 164
2000 320
2005 642

a. Estimar el modelo de regresión no lineal de Y sobre X ( y = a.b x )


b. Calcular el coeficiente de correlación de X e Y, interpretar

c. Calcular el coeficiente de determinación, interpretar

d. Estimar la producción promedio para los años 1992 y 2003

e. Proyectar la producción promedio para los años 2015 y 2016

ab
3. Sean los datos de la tabla, estimar el modelo de regresion no lineal y = .
a + bx

X Y
2 0.75
4 0.43
6 0.30
8 0.23
10 0.18

4. Con los datos de la pregunta 3, estimar el valor de “y” para x=5


52
a
5. Estimar la ecuación de Lotka y = , para los datos que se presenta a
xb
continuación.

Y=N°
X=N° Autores
Artículos que
publicados publican
1 950
2 174
3 64
4 32
5 18
6 12
7 8
8 6
9 4
10 3
11 3
12 2
13 2
14 1
15 1
16 1

a. Con la información de la pregunta 5. Calcular el coeficiente de

determinación.

b. Con la información de la pregunta 5. Calcular la elite de autores más

productivos e interpretar.

c. Calcular el índice de productividad de autores.

53
Capítulo 3

3.1. Leyes bibliometricas

Estudia el comportamiento estadísticamente regular de la producción y el


consumo de la literatura científica, de una determinada materia y en un periodo
de tiempo determinado.

A través de la ley bibliometricas, se busca un modelo matemático que mejor se


ajuste a la nube de puntos, de tal forma que se pueda modelar y realizar
predicciones.

3.2 Ley de Price (ley del crecimiento exponencial de la literatura científica)

Derek J. de solla Price (1956), constato que el crecimiento de la literatura


científica se produce a un ritmo muy superior respecto a otros fenómenos
sociales, pero muy similar a otros fenómenos observables en contextos
naturales, como los procesos biológicos. Dicho crecimiento de la literatura
científica de una determinada materia, es tal que cada 10 a 15 años la literatura
científica existente se duplica con un crecimiento exponencial, aunque esto
depende en gran medida del área de conocimiento de la que se trate.

Cada materia de estudio tiene una evolución natural, pasando por diversas
etapas:

• Precursores: corresponde a las primeras publicaciones de la materia en


estudio.

• Crecimiento exponencial: la materia de estudio por su necesidad requiere


ser investigado a profundidad.

• El crecimiento lineal: se hace lento la producción de las publicaciones.

• Saturación: ya no existe más producción, ´porque la materia ya es


conocida.
Gráfica

y
0,45
0,4
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
-3,5 -3 -2,5 -2 -1,5 -1 -0,5 0 0,5

54
Para el curso se analiza la parte que tienen un crecimiento exponencial, a través
de un modelo no lineal de la forma:

Modelo Matemático:

y = a.ebx
Dónde:

Y= producción de la literatura científica (revistas, artículos, autores, etc.) de un


tema específico y durante un período de tiempo.
X=años
e=base de logaritmos neperianos=2.718281828…

Gráfica:

y=produccion
700
640
600

500

400

300 320

200
160
100
80
20 40
0
1920 1930 1940 1950 1960 1970 1980 1990

Para estimar el modelo, se dispone de una serie cronológica X=años y Y


=producción de literatura científica de una materia determinada y en un período
de tiempo.
( x1 , y 2 ), ( x2 , y 2 ),...( xn , y n )

Para estimar el modelo exponencial de Price, se linealiza aplicando logaritmos


neperianos ambos lados de la ecuación.

y = a.ebx → mod elo no lineal


ln y = ln aebx
ln y = ln a + ln ebx
ln y = ln a + bx(ln e)
ln y = ln a + bx
Z = A + Bx → mod elo lineal

B= ∑ xz = b
∑x 2

A = ∑ = ln a → a = e
z A
= exp( A)
n
55
ln y = ln a.e bx = ln a + ln .e bx = ln a + bx(ln e)
ln y = ln a + bx
z = A + Bx , siendo :
z = ln y, A = ln a, B = b

Luego las ecuaciones para B y A son:

(∑ x)(∑ z )
∑ xz − n
B=
(∑ x ) 2
∑x 2

n
A = z − Bx
Si los valores x son codificados, entonces ∑x c
= 0 las ecuaciones se
simplifican, quedando:

B=
∑x z =b c

∑x 2
c

A = ln a → a = e A = exp( A)

Luego se calcula el coeficiente de determinación, para conocer la bondad de


ajuste del modelo estimado. Para el modelo codificado:
n
B 2 ∑ ( xi* ) 2
R2 = i=
n
(100%)
n
(∑ z i ) 2
∑z i =1
2
i − i =1

n
o R = (r − Pearson con datos codificados ) 2
2

Ejemplo-1

La producción de artículos científicos de cierta materia, durante los años 1930


al 1980, se presenta en el siguiente cuadro

X =años
Y=producción
de artículos
xc = años z = ln y xc . z xc2
científicos codificado
1930 20 -25 Ln20 -25.Ln20 625
1940 40 -15 Ln40 -15.Ln40 225
1950 80 -5 Ln80 -5.Ln80 25
1960 160 5 Ln160 5.Ln160 25
1970 320 15 Ln320 15.Ln320 225
1980 640 25 Ln640 25.Ln640 625
Total 0 28.37160 121.30075 1750

56
Estimar la parte exponencial del modelo de Price y = ae bx

B=
∑ x z = 121.30075 = 0.06931472 = b
c

∑x 2
c 1750

28.37160
A= z = = 4.72860022 → a = e 4.72860022 = 113.137085
6
*
y = 113.137085.e 0.06931472 x

Calculo del coeficiente de determinación:

rpearson = 1 → R 2 = (rpearson )1 = 1*100% = 100%

El valor del coeficiente de determinación indica un ajuste perfecto del modelo


hacia la nube de puntos.

Estimar la producción de artículos científicos para los años 1975 y 1990.

Para utilizar el modelo estimado codificado, se debe codificar los años 1975 y
1990.

X i* = X − X , X = 1955

Para el año 1975

*
X 1975 = 1975 − 1955 = 20

y = 113.137085.e 0.06931472 ( 20 ) = 452.55


La proyección para 1990, entonces xc = 35

y = 113.137085.e 0.06931472 xc = 113.137085.e 0.06931472 ( 35) = 1280

De otra forma para el año 1990:

z = 4.7286 + 0.06931xc
z = 4.7286 + 0.06931( x − x)
z = 4.7286 + 0.06931(1990 − 1955)
z = 7.15445 → z = ln y = 7.15445 → y = e7.15445 = 1279.788 = 1280

57
Calculo del tiempo de duplicación de la producción de literatura científica para
el modelo exponencial

ln 2 0.69314718
D= = = 10 años
b 0.06931

El tiempo de duplicación de la producción de la literatura científica es cada 10


años.
Indica que cada 10 años en promedio la producción científica se duplica.

Calculo de la tasa de incremento anual (T)

T = 100%(e b − 1) = 100%(e 0.06931 − 1) = 7.176%

Anualmente la producción de la literatura científica crece en promedio en un


7.176%.

Ejemplo-2

La producción de revista científica de cierta materia, durante los años 1930 al


1980, se presenta en la siguiente cuadro

X
Y=producción
de artículos x* = z = ln y x* .z (x* ) 2
=años científicos. años
codificado
1960 20 -30 2.99573227 -89.8719682 900
1970 30 -20 3.40119738 -68.0239476 400
1980 83 -10 4.41884061 -44.1884061 100
1990 155 0 5.04342512 0 0
2000 325 10 5.78382518 57.83825182 100
2010 650 20 6.47697236 129.5394473 400
2020 1270 30 7.14677218 214.4031654 900
13930 2533 0 35.2667651 199.6965425 2800
Calculo del modelo de Price

*
y = 154.1782346 * e 0.071320194 x

Calculo de coeficiente de determinación

R 2 = 99.55%
Buen ajuste del modelo a la nube de puntos

Predecir la producción de la literatura científica para los años 2022 y 2025


Calculo de la media de los años, la media de los años es 1990

58
Años Producción estimada(reemplazando el
Años
codificados
x respectivo año codificado al modelo
x−x estimado)
2022 32 1510.7
2025 35 1871.2

Calculo del tiempo de duplicación de la producción científica

ln 2 ln 2
D= = = 9.7 años
b 0.071320194

Calculo de la tasa de incremento anual

R = 100%(e b − 1) = 100%(e 0.071320194 − 1) = 7.39%

Ley de Price: obsolescencia (envejecimiento) de la producción de la literatura


científica

Price, observa sobre la rapidez con la que la literatura científica de un tema dado
pierde vigencia. Cuanto más tiempo tenga un recurso científico menos se cita
(mención en los trabajos científicos).No es uniforme para todas las disciplina.

Tabla
Nro. De Cantidad del
artículos Número de número de
Índice de Price= es el
Años publicados Referencias referencia de
cociente entre (B/A)
de un tema (B) los 5 años
dado anteriores(B)
2000 300 900 1996,1997,1998 (600/900)100%=66.7%
,1999,2000 Un índice de Price
igual 600 superior a 30% indica
que los artículos serán
obsoletos rápidamente
2001 200 400 2001,2000,1999 (50/400)100%=12.5%
,1998,1997=50

Índice de Price

Cantidad de referencia para los años (t − 5 + 1)


I año t = (100%)
total de referencia hasta el año t

Grafica

Del comportamiento de la producción científica para una determinada materia


59
y
1000
900
800
700
600
500
400
300
200
100
0
1985 1990 1995 2000 2005 2010 2015 2020 2025

3.3 Ley de Lotka (1926)

Ley de la productividad de los autores

Enunciado

Lotka observo que para una determinada materia de estudio y en un determinado


periodo de tiempo, lo siguiente: Muchos autores publican pocos artículos
científicos y pocos autores publican gran cantidad de artículos científicos. La ley
de Lotka relaciona la cantidad de artículos científicos publicados (X) con la
cantidad de autores (Y).

Ejemplo

Supongamos, que un período de 5 años, se ha publicado 78 artículos científicos


sobre física para un total de 665 investigadores.

Tabla: Cantidad de artículos publicados y


Cantidad de autores investigadores
X=cantidad de Y= cantidad de autores
artículos científicos investigadores
1 500
2 88
3 32
4 16
5 9
6 7
7 4
8 3
9 2
10 2
11 1
12 1
78 665
60
Interpretación de la tabla

Un grupo de 500 investigadores durante los 5 años, publicaron 1 solo trabajo


científico, 88 publicaron 2 y un solo autor en ese mismo período de estudio
publico 12 trabajos científico.

Gráfica

y=N° autores
600

500

400

300

200

100

0
0 2 4 6 8 10 12 14

Modelo no lineal de Lotka


a
y=
xb
Dónde:

Y= cantidad de autores (investigadores)


X=cantidad de artículos publicados

Para estimar los valores de a y b del modelo de Lotka, se toma una muestra
de tamaño n y se registran los valores de (X, Y). Como el modelo de Lotka es
no lineal, para calcular los valores de a y b, se linealiza aplicando logaritmos
decimales a ambos miembros de la igualdad.

a a
y= b
→ log y = log( b ) = log a − log x b → log y = log a − b log x
x x
log y = log a + (−b) log x →
Z = A + BW → mod elo lineal (2)
donde : Z = log y W = log x A = log a B = −b

De (2) se calculan A y B:

61
(∑ W )(∑ Z )
∑ WZ − n
B= = −b → b = − B
(∑ x) 2
∑X − 2

A=
∑ Z − B( ∑ W ) = log a → a = 10 A

n n

Gráfica del modelo linealizado de Lotka


a
y= linealizando z = A + Bw
xb
z=log(y)
3

2,5

2
y = -2.4934x + 2.7064
1,5 R² = 0.9962

0,5

0
0 0,2 0,4 0,6 0,8 1 1,2

Calculo del coeficiente de correlación de Pearson

Se calcula en el modelo transformado (2)

n n

n
(∑ wi )(∑ zi )
∑w z i i − i =1
n
i =1

r= i =1
n n

n
(∑ wi ) 2 n
(∑ zi ) 2
∑w
i =1
2
i − i =1
n
* ∑z
i =1
2
i − i =1
n

Si r tiende a -1, los datos de w y z están asociados linealmente en forma inversa,


esta asociación lineal con los datos transformados, también se transmite a las
variables x e y.

Si r tiende a 0 los datos de z y w no están asociados linealmente, esta asociación


lineal, también se transmite a las variables x e y.

Calculo del coeficiente de determinación

R 2 = (coefciente de correlacion de pearson = r ) 2

62
Elite de autores más productivos

Elite de autores es la cantidad de autores que publican más trabajos. Se calcula


a través de la raíz cuadrada del total de autores.

E = total de autores en el periodo de estudio

Para calcular la cantidad de trabajos publicados por los autores más productivos,
se obtiene el acumulado de autores, del más productivo hasta el menos
productivo.

Índice de productividad de autores (IP)

El índice de Lotka, permite identificar a los autores con baja, mediana y alta
productividad, a través de la siguiente relación:

 IP = 0 autores con baja productividad



IP = log( x) = w = 0 < IP < 1 autores con mediana productividad
 IP ≥ 1 autores con alta productividad

Ejemplo aplicativo-1

Los datos que a continuación se presentan corresponden a 526 autores que


durante de 10 han publicado artículos, sobre una determinada materia. La
primera fila de la tabla significa que se encontró a 400 autores que solo
publicaron durante el periodo de estudio un solo artículo, y en la última fila a un
solo autor que público 10 artículos durante el periodo de estudio.

x = N° de artículos
y = N° de autores
x=N° artículos y=N° autores
1 400
2 70
3 26
4 12
5 7
6 4
7 3
8 2
9 1
10 1

Gráfica: artículos publicados versus autores

63
y=N° autores
500

400

300

200

100

0
0 2 4 6 8 10 12

a. Estimar la ecuación de Lotka

b. Calcular el coeficiente de determinación

c. Calcular la elite de autores más productivo

Para calcular la ecuación de Lotka de debe realizar los siguientes

cálculos:

x y
Artículos Autores w = log x z = log y wz w2 z2
1 400 0 2.60205999 0 0 6.7707162
2 70 0.30103 1.84509804 0.55542985 0.09061906 3.4043868
3 26 0.47712125 1.41497335 0.67511386 0.22764469 2.0021496
4 12 0.60205999 1.07918125 0.64973185 0.36247623 1.1646322
5 7 0.69897 0.84509804 0.59069818 0.48855907 0.7141907
6 4 0.77815125 0.60205999 0.46849374 0.60551937 0.3624762
7 3 0.84509804 0.47712125 0.40321424 0.7141907 0.2276447
8 2 0.90308999 0.30103 0.27185717 0.81557152 0.0906191
9 1 0.95424251 0 0 0.91057877 0
10 1 1 0 0 1 0
55 526 6.55976303 9.16662191 3.61453889 5.21515941 14.736815

Calculo de

∑ wz − ∑ 10∑ 3.61453889 −
( w)( z ) (6.55976303)(9.16662191)
10 − 2.398547862
B= = = = −2.629668624 = −b
(∑ w) 2
(6.55976303) 2
0.912110309
∑ w − 2

10
5. 21515941 −
10

b = 2.629668624

A=
∑ z − b( ∑ w ) = 9.16662191 − (−2.629668624)( 6.55976303 = 2.641662493 = log a
10 10 10 10

log a = 2.641662493 → a = 10 2.641662493 = 438.1900311


64
La ecuación de Lotka estimada es:

438.19
y=
x 2.62967
Coeficiente de correlación
r = −0.997887

Coeficiente de determinación

R 2 = (r ) 2 (100%) = 99.58%

Elite de autores que más producen artículos científicos.

Elite = total de autores = 526 = 22.93 = 23 Autores publican 4 o más


artículos
Tabla 01

x=N° acumulados
y=N° autores
artículos IP=log(x) autores
1 400 0 526
2 70 0.30103 126
3 26 0.47712125 56
4 12 0.60205999 30
5 7 0.69897 18
6 4 0.77815125 11
7 3 0.84509804 7
8 2 0.90308999 4
9 1 0.95424251 2
10 1 1 1

Tabla 02

Índice de productividad Autores %


IP=0 400 76.05%
0<IP<1 125 23.76%
IP>=1 1 0.19%
Total 526 100.00%

La tabla 1, la última columna y la fila 5 se interpreta de la siguiente forma: 18


autores publican 5 o más artículos. Para 23 autores, publican 4 o más artículos

La tabla 02, indica la cantidad de autores más productivos y se obtienen a


través del índice de productividad (IP), se calcula utilizando el logaritmo del
número de artículos.

65
 IP = 0 baja productividad

IP = log( x) = 0 < IP < 1 media productividad
 IP ≥ 1 alta productividad

Grafica

autores
450
400
400
350
300
250
200
150 125
100
50
1
0
IP=0 0<IP<1 IP>=1

3.4 Ley de Bradford (1934)

La ley de Bradford relaciona revistas científicas con artículos publicados con el


objetivo de determinar las revistas más productivas sobre un tema dado

Enunciado

Si un conjunto de revistas científicas se ordena asociadas a la productividad


decreciente al número de artículos sobre un tema dado. Estas revistas se pueden
agrupar en zonas que se forman dependiendo aproximadamente de la misma
cantidad de artículos. Mientras que el conjunto de revistas utilizadas para cada
zona aumenta en progresión geométrica
ak 0 , ak 1 , ak 2 , ak 3 ,....siendo a = menor N ° de revistas k = multiplicador = razon

Ejemplo aplicativo

164 revistas científicas se ordenan en forman decreciente a la cantidad de


artículos sobre un tema dado. (tomado del ejemplo de Bradford-Bibliografía de
lubricación-1933)

66
x=acum. y=acum
N° N° total, N°
N° total, N° w=ln(x) w.y w.w
revistas artículos artículos
N° revistas artículos
1 1 22 22 1 22 0 0 0
2 1 18 18 2 40 0.69314718 27.7258872 0.48045301
3 1 15 15 3 55 1.09861229 60.4236759 1.20694896
4 2 13 26 5 81 1.60943791 130.364471 2.59029039
5 2 10 20 7 101 1.94591015 196.536925 3.78656631
6 1 9 9 8 110 2.07944154 228.73857 4.32407713
7 3 8 24 11 134 2.39789527 321.317967 5.74990174
8 3 7 21 14 155 2.63905733 409.053886 6.96462359
9 1 6 6 15 161 2.7080502 435.996082 7.33353589
10 7 5 35 22 196 3.09104245 605.844321 9.55454345
11 2 4 8 24 204 3.17805383 648.322981 10.1000261
12 13 3 39 37 243 3.61091791 877.453053 13.0387282
13 25 2 50 62 293 4.12713439 1209.25037 17.0332382
14 102 1 102 164 395 5.09986643 2014.44724 26.0086376
total 164 395 375 2190 34.2785669 7165.47543 108.171571

Pasos:
1. Calculamos para la 3ra columna: total de artículos por revistas, luego el
total general, que resulta 395
2. Al total general de artículos (395), lo dividimos en 4 zonas:
395
= 98.75 ≈ 99 articulos
4
3. Los grupos de revistas con aproximadamente 99 artículos, los ubicamos
utilizando la 4ta y 5ta columna (acumulado revistas y acumulado total de
artículos) los grupos de artículos acumulados para cada zona serán:
101,196,293 y 395, cantidades que permite identificar las zonas:
a. La primera zona tiene :101 artículos para 7 revistas
b. La segunda zona tiene :196-101=95 artículos para 22-7=15 revistas
c. La tercera zona tiene:293-196=97 artículos para 62-22=40 revistas
d. La cuarta zona :395-293=102 artículos para 164-62=102 revistas
Los resultados anteriores se presentan en el siguiente cuadro

Zonas Total revistas Total artículos


Zona-1 o núcleo: lugar donde se 7 101
concentran las revistas más
productivas en cuanto a la cantidad de
artículos sobre un tema dado
Zona-2 15 95
Zona-3 40 97
Zona-4 :lugar donde se concentran las 102 102
revistas menos productivas
Total 164 395

67
Multiplicador de Bradford=
15 40 102
+ +
k = 7 15 40 = 2.45
3

7(2.45) 0 , 7(2.45)1 , 7(2.45) 2 , 7(2.45)3


7, 17, 42, 103

Gráfica de acumuladas revistas (x) versus acumulados total de artículos (y)

y=AC(Total Art)
450
400
350
300
250
200
150
100
50
0
-50 0 50 100 150 200

X=AC(total revistas)
Ecuación de Brookes

x
y = b ln( )
a

Linealizado la ecuación de Brookes, desarrollando.

x
y = b ln( ) → y = b(ln x − ln a) = b ln x − b ln a = (−b ln a) + b ln x
a
y = c + bw Modelo lineal linealizado,

Dónde:
c
− c
c = −b ln a → a = e b
= exp(− )
b
w = ln x

Sus ecuaciones para calcular b y c son:

∑ wy − ∑ n ∑
( w)( y )
b=
∑w − ∑
2
( w) 2

68
c=
∑ y −b ∑w
n n

Con los totales de la tabla (de la 4ta hasta la 8va columna)

b = 74.3899394
− 25.7128939
−( )
c = −25.7128939 → a = e 74.3899394
= 1.412908227

Luego la ecuación es:

x
y = 74.3899394 ln( )
1.412908227

Calculo del coeficiente de determinación

R 2 = (coeficientedePearson) 2 = (0.97801145) 2 = 0.9565 → 95.65%


Buen ajuste del modelo matemático de Brookes.

y=acum. total articulos


450
400
y = 74,39ln(x) - 25,713
350
R² = 0,9565
300
250 y=acum. total articulos

200
Logarítmica (y=acum.
150 total articulos)
100
50
0
-50 0 50 100 150 200

Ejercicios
Aplicación del modelo matemático de Bradford a la productividad de autores
(datos tomados del informe profesional presentado por el Lic. Elías Reynaldo
Barrenechea Gallardo)

69
Productividad de las revistas citadas en la
Revista Anales de la Facultad de Medicina

Revistas Artículos
1 128
1 90
1 51
1 39
1 35
1 30
1 29
1 28
1 27
1 26
1 25
1 23
1 19
1 12
2 24
2 18
2 17
3 46
3 22
3 20
3 14
4 16
6 15
6 11
8 13
14 10
14 9
20 8
22 6
40 5
52 4
99 3
266 2
1116 1

Fuente: datos tomados del informe profesional presentado por el licenciado


Elías Reynaldo Barrenechea Gallardo (Revista Anales de la Facultad de
Medicina de la UNMSM)

a. Obtener las 4 zonas de Bradford

b. Calcular el multiplicador de Bradford

c. Estimar la ecuación de Brookes.


70
3.5 Ley de Zipf(1902-1950)

Enunciado

En todo documento que se formula en cualquier idioma, existen


palabras cortas que ocurren con mayor frecuencia, en segundo lugar
del ranking la palabra que se repite con mayor frecuencias es la mitad
de la primera; para la tercera palabra que se repite es igual a la tercera
parte de la primera, y así sucesivamente.

Esto se presenta en la siguiente tabla en forma teórica.

Palabras que se
X= Ranking de
repiten en un Y=Frecuencias de las
repetición de las
documento o una palabras
palabras
conversación
‘de 1 400
‘la 2 400(1/2)=200
‘en 3 400(1/3)=133
‘y 4 400(1/4)=100
‘para 5 400(1/5)=80
él 6 400(1/6)=67
´los 7 400(1/7)=57
‘las 8 400(1/8)=50
‘a 9 400(1/9)=44
‘por 10 400(1/10)=40

Gráfica

Y=Frecuencia de la palabra
450
400
350
300
250
200
150
100
50
0
0 1 2 3 4 5 6 7 8 9 10 11

71
Modelo matemático de Zipf
C
X ..Y = C → Y =
X

C= Valor constante
X=Ranking de las palabras que se repiten con la mayor frecuencia
Y=frecuencia de las palabras que se repiten.

Para un documento cualquiera se registran los datos (X ; Y), para estimar el


modelo de Zipf, se linealiza aplicando logaritmo decimal..

C C
Y= → log y = log( ) → log y = log C + (−)(log x)
X x
Z = A + BW → mod elo linealizado
Z = log y
W = log x
A = log C → C = 10 A
B = −1

Para que se cumpla la ley de Zipf, el coeficiente de determinación( la bondad


de ajuste) debe ser próximo al 100%, y el valor de B debe aproximar por la
derecha o por la izquierda al valor -1.

Ejemplo aplicativo.

X=Ranking Y=frecuencias W=LOG(X) Z=LOG(Y) WZ WW


1 240 0 2.38021124 0 0
2 120 0.30103 2.07918125 0.62589592 0.09061906
3 80 0.47712125 1.90308999 0.90800468 0.22764469
4 60 0.60205999 1.77815125 1.07055373 0.36247623
5 48 0.69897 1.68124124 1.17513719 0.48855907
6 40 0.77815125 1.60205999 1.24664499 0.60551937
7 34 0.84509804 1.53147892 1.29424983 0.7141907
8 30 0.90308999 1.47712125 1.33397341 0.81557152
9 27 0.95424251 1.43136376 1.36586815 0.91057877
10 24 1 1.38021124 1.38021124 1
11 22 1.04139269 1.34242268 1.39798916 1.08449872
12 20 1.07918125 1.30103 1.40404717 1.16463216
13 18 1.11394335 1.25527251 1.39830246 1.24086979
14 17 1.14612804 1.23044892 1.41025201 1.31360947
15 16 1.17609126 1.20411998 1.41615499 1.38319065
16 15 1.20411998 1.17609126 1.41615499 1.44990493
17 14 1.23044892 1.14612804 1.41025201 1.51400455
18 13 1.25527251 1.11394335 1.39830246 1.57570906
19 13 1.2787536 1.11394335 1.42445907 1.63521077
20 12 1.30103 1.07918125 1.40404717 1.69267905
18.3861246 29.2066915 24.4805006 19.2694686

72
(18.3861246)(29.3861246)
(24.4805006 −
B= 20 = −1.00101528
(18.3861246) 2
19.2694686 −
20

29.3861246 18.3861246
A= − 1.00101528( ) = 2.38057416 → C = 10 2.38057416 = 240.2000638
20 20
R 2 = 99.98%

Por las estadísticas calculadas los datos de la tabla, cumple con la ley de Zipf.

73
Capítulo 4

4.1. Indicadores bibliométricos

Son medidas que proporcionan información sobre los resultados de la


producción científica. Existe herramientas bibliometricas tales como: Web
Science, Scopus, Google académico y Dimensions, que proporcional tales
indicadores.

Los indicadores bibliométricos más importantes son:

4.2. El número de citas recibidas por los artículos publicados en una revista

Su valor indica el número de veces que una revista o artículo publicado ha


sido reconocido por otro autor. Su valor se obtiene haciendo un recuento de
cuantas veces un artículo o revista fue citado en un trabajo de investigación y
está publicado.

Ejemplo-1:

Un biólogo durante los años 2015 al 2022, ha publicado 5 artículos, el cuadro


muestra la cantidad de citas que ha recibido por parte de otros profesionales.

Artículos
cantidad de
publicados
citas
(trabajos de
recibidas
investigación)
A 2
B 6
C 5
D 10
E 1

Gráfica: cantidad de citas recibidas por sus trabajos publicados durante los
años 2015 al 2022

cantidad de citas recibidas


12 10
10
8 6
6 5
4 2
2 1
0
A B C D E

74
El número de citas:

Mide cómo influye o cómo impacta un trabajo científico en la comunidad


científica (consumidor).

El número de citas es un reconocimiento del trabajo realizado por un científico.

El número de citas se para determinar otros indicadores, tales como el factor


de impacto (FI), índice h, índice i10, etc.

Aporte del número de citas

Indica la repercusión de una investigación en la comunidad científica.

Mide el interés y la influencia, aunque no siempre sea positiva.

Limitaciones

No debe utilizarse como un indicador de calidad

No debe usarse como una medida de reputación positiva para los


investigadores individuales.

4.3. El índice H de un investigador.

El índice h o también llamado índice de Hirsch fue propuesto en el año 2005


por Jorge E Hirsch, físico de la universidad de California en San Diego.

Es un indicador numérico que evalúa la producción científica de un


investigador, utilizando la cantidad de publicaciones con el número de citas
recibidas.

Cálculo del índice h

a. En una tabla de frecuencias se colocan todas las publicaciones de un


autor, con su correspondiente número de citas recibidas por sus trabajos.

b. Las publicaciones se ordenan tomando como referencia a las citas de


mayor a menor (orden decreciente de las citas recibidas).

c. A las publicaciones del punto anterior, se enumera de menor a mayor,


empezando por el número uno.

d. Se compara al número de citas con la numeración dada en el punto


anterior, comparación que debe ser mayor o igual.

e. Cuando se encuentra una publicación cuyo número de citas sea inferior al


número de orden; el índice h para el autor será el orden inmediatamente
anterior.

75
Del ejemplo-1, calcular el índice h para el investigador e interpretarlo.

Cantidad de
Artículos
citas
publicados
recibidas a
a la fecha
la fecha
A 2
B 6
C 5
D 10
E 1

Para su cálculo del índice h, de un autor, se ordenan sus artículos publicados


por el autor, tomando en cuenta a la cantidad de citas recibida en forma
decreciente. La cantidad de citas recibida debe ser mayor o igual al nuevo orden
de los artículos, el primero de los artículos publicado que no cumple la condición,
entonces el anterior orden de los artículos publicados es el índice h para el autor.

Artículos publicados ordenados cantidad de


tomando en cuenta a la citas criterio
cantidad de citas recibidas recibidas
10>1er
D(1) 10 orden(Verdad)
6> 2do
B(2) 6 orden(Verdad)
5>3er
C(3) 5 orden(Verdad)
2>=4to
A(4) 2 orden(Falso)
1>=4to
E(5) 1 orden(Falso)

El índice h para el autor o investigador es igual a 3, significa que tres trabajos


científicos publicados por el investigador (Artículos: D, B, C) han recibido 3 o más
citas

Ventajas

Combina en un único indicador una medida de cantidad y otra de impacto de la


producción científica.

Detecta los investigadores más destacados de un área de conocimiento.

Favorece las carreras científicas más dilatadas, investigadores genios.

Limitaciones

No es adecuado para comparar investigadores de diferentes áreas (biólogos


publican más que los matemáticos)

Perjudica a los investigadores con actividad científica reciente.


76
Depende del número total de publicaciones. El índice h nunca podrá ser superior
al número total de documentos.

Penaliza a los autores que publican menos, pero publican mejor

Notas:

Las bibliotecas universitarias, de hospitales y centro de investigación cuentan


con profesionales que ayudan a:

Conocer las citas recibidas por su investigación.

Calcular el índice h.

Crear perfiles “profesionales” con indicador bibliométrico.


.
Asesorar sobre evaluación de la investigación, revistas en los que publican,
artículos muy citados, comparativos, etc.

4.4. El índice i10 de un investigador.

Su valor que indica el número de trabajos científicos que un autor ha escrito y a


la fecha recibió 10 a más citas. La base de datos que proporcionan este índice
es Google Scholar.

Ejemplo
La tabla presenta 4 trabajos publicados por un investigador y las citas
recibidas.
N° de trabajos científicos N° de citas recibidas por
publicados a la fecha los trabajos publicados a
la fecha.
A 3
B 9
C 12
D 10

De la tabla el índice i10 para el autor es 2 (trabajos: C y D), existen 2 trabajos


que recibieron 10 a más citas

4.5. Factor de impacto de una revista científica (FI)

El factor de impacto de una revista se utiliza para comparar la importancia de


dicha revistas con otras, en el mismo campo científico. El factor de impacto de
una revista en un año determinado, se calcula como el cociente del total de

77
citas recibidas por las publicaciones en los dos años anteriores y el total de
citas recibidas
trabajo por en
publicados las esos
publicaciones
dos años.enEllos dos años
resultado delanteriores y el
cociente se total de
interpreta
trabajo
como elpublicados en esos
promedio anual dos años.
de citas El resultado
de artículos delrevista:
por una cociente se interpreta
como el promedio anual de citas de artículos por una revista:
.
. FI x = factor de impacto por la revista en el año x
FI x = factor Citas
de impacto por la revista en el año x
recibidas por la revistas en los años ( x − 2, x − 1)
FI x =
FI x = Total
Citasariculos
de recibidas por la por
publicados revistas los( x −años
en los enaños
la revista 2, x (−x1−) 2, x − 1)
Total de ariculos publicados por la revista en los años ( x − 2, x − 1)
Ejemplo
Ejemplo
Calcular el factor de impacto de una determinada revista científica para el
Calcular el factor de impacto de año
una2020.
determinada revista científica para el
año
Total de2020.
artículos Total de citas
Total de artículos
publicados por la Total de
recibidas encitas
el 2020
2 años anteriores publicados por la recibidas en el 2020
2 años anteriores revista en los años por los artículos
al año 2020 revista
al año 2020 2018eny los
2019años por los artículos
publicados en los
2018 y 2019 años 2018 yen
publicados los
2019
2018 20 años 2018
500 y 2019
2018
2019 20
50 500
800
2019 50 800
Citas recibidas por la revistas en los años (2018,2019)
FI 2020 = Citas recibidas por la revistas
FI 2020 = Total de ariculos publicados por la los(2018
en los enaños
revista ,2019
años ) ,2019)
(2018
Total de ariculos
500 + 800 1300 publicados por la revista en los años (2018,2019)
FI 2020 = 500 + 800 = 1300 = 18.57
FI 2020 = 20 + 50 = 70 = 18.57
20 + 50 70
Interpretación:
Interpretación:
En promedio en el año 2020, la revista científica recibió 18.57 citas, por cada
En promedio
artículo en el año 2020, la revista científica recibió 18.57 citas, por cada
publicado.
artículo publicado.

4.6. Índice de inmediatez de una revista (Ii)


4.6. Índice de inmediatez de una revista (Ii)
Es un valor que nos muestra que tan rápido es citada una revista científica. Se
Es un valor
calcula que nos
dividiendo el muestra que tan
total de citas rápido
recibida esun
por citada unapublicado
artículo revista científica.
en un año Se
calcula dividiendo
determinado el total
y el total de citas recibida
de artículos por un
que público artículoen
la revista publicado
ese año.en un año
determinado y el total de artículos que público la revista en ese año.
Total de citas que reciben en un año los articulos publicados
Ii = Total de citas que reciben en un año los articulos publicados
Ii = Total de articulos publicados por esa revista en ese año
Total de articulos publicados por esa revista en ese año
Ejemplo
Ejemplo
La revista científica ABC, tienen los siguiente datos con respecto al número de
La revistaque
artículos científica
publicoABC,
y altienen los siguiente
número de citas datos
que haconrecibido
respecto al número
desde de
que fue
artículos
publicadaque
parapublico y al
el mismo año.número deelcitas
Calcular que
índice de ha recibidopara
inmediatez desde que
cada fue
año.
publicada para el mismo año. Calcular el índice de inmediatez para cada año.
años artículos publicados citas recibidas Índice de Inmediatez Ii
años artículos publicados citas recibidas Índice de Inmediatez Ii
2000 150 80 0.53
2000
2001 150
100 80
200 0.53
2.00
2001
2002 100
120 200
120 2.00
1.00
2002 120 120 1.00
78
80
Ii (2000) = = 0.53 citas / articulos
150
200
Ii (2001) = = 2.0 citas / articulos
100
120
Ii (2002) = = 1.0 citas / articulos
120

Interpretación

Para el año 2000, el valor 0.53, indica que por cada 2 artículos publicados en
las revistas ABC, se recibió 1 cita.

Para el año 2001, el valor 2, indica que por cada artículo publicado en la revista
ABC, se recibió 2 cita.

Para el año 2002, por cada artículo publicado en la revista ABC, se recibió una
cita.

4.7. Vida media de un trabajo de investigación (Vm)

La vida media de un documento publicado sobre un tema dado, se refiere al


tiempo durante el cual fue publicada la mitad de la literatura activa o circulante.
Para calcular la vida media toma en cuenta el tiempo de circulación de un
documento y las citas recibidas. Se utiliza la fórmula:

0.5 − a
Vm = k +
b−a

k=número de años que toma acumular el 50% de las citas recibidas.


a=Proporción del número de citas acumuladas antes del 50% de citas
recibidas.
b= Proporción del número de citas acumuladas después del 50% de citas
recibidas.

Ejemplo

Calcular la vida media de un artículo publicado sobre matemática, entre los


años 2000 al 2020.

Citas Acumuladas citas recibidas


Años
recibidas en forma decreciente
2000 0 302
2001 2 302
2002 8 300
2003 12 292
2004 26 280
2005 42 254
2006 30 212
2007 56 182
2008 70 126

79
Citas Acumuladas citas recibidas
Años recibidas en forma decreciente
2009 15 56
2010 10 41
2011 7 31
2012 5 24
2013 4 19
2014 4 15
2015 3 11
2016 2 8
2017 2 6
2018 2 4
2019 1 2
2020 1 1
Total 302

El artículo desde que se publicó 2000 al 2020 recibió un total de 302 citas, el
50% es 302/2=151, en la tabla este valor se busca en las frecuencias
acumuladas de citas, encontrándose entre 126 menor número de citas y 182
mayor número de citas. El valor entero ( k ) es igual al número de años
transcurrido desde el menor número de citas hasta el último año de estudio (
2008 hasta 2020) el valor de k=13 años. El valor de a es igual al menor número
de citas recibidas antes de 50%, dividido por el total de citas recibidas (302) y
b es igual al mayor número de citas recibidas después del 50%, dividido por
el total de citas (302), es decir,

126 182
a= = 0.41721854 y b= = 0.60264901
302 302

0.5 − a (0.5 − 126 / 302)


Vm = k + = 13 + = 13.45 años
b−a (182 / 302 − 126 / 302)

Interpretación: 13.45 años, es la vida media del artículo publicado en el


periodo de 2000 a 2020.

4.8. Cuartil

Es una medida de posición de una revista científica en comparación con todas


las revistas las de sus áreas. Se obtiene al ordenar a las revistas de mayor a
menor factor de impacto, al total de revistas ordenadas la dividimos en 4
partes iguales, cada una de estas partes será un cuartil. Las revistas con el
factor de impacto más alto pertenecen al primer cuartil, los cuartiles medios
serán el segundo y tercer cuartil y las revistas de bajo impacto pertenecen al
cuarto cuartil.

80
4.9. Índice de colaboración (IC)

La colaboración científica se define como un proceso social de investigadores


que se juntan con el propósito de realizar un nuevo trabajo de investigación,
compartiendo sus recursos intelectuales y materiales. Se calcula, dividiendo
el total de firmas (autores) por número de trabajos publicados en un período
de estudio; para una tabla de frecuencias se tiene:
k

∑x .f i i
IC = i =1

xi = Es el número de autores de un documento publicado.


f i = Es la cantidad de documentos publicados para el i-ésimo número de
autores
n = Es el total de documentos publicados en el período de estudio.
.
Se interpreta como el promedio de colaboradores en la formulación de
documentos en el período en estudio.

La colaboración puede ser local, nacional e internacional

Para medir y mostrar las relaciones que se establecen entre los productores
en la investigación puede aplicarse el análisis de las redes sociales científicas.
Los indicadores de las redes nos permiten analizar el grado de conectividad
de la red, número de interacciones de actores, así como el acercamiento entre
éstos a través de sus interacciones. De estos indicadores se desprende que
autores son más influyentes para establecer trabajos en colaboración.

4.10. El grado de colaboración (GC)

Su valor se interpreta como el aporte de cada grupo de autores, se calcula a


través de la formula

fi
GC i = xi ( )
n
4.11. Coeficiente de colaboración (CC)
k
1
∑ ( x ). f
i =1
i

CC = 1 − i

Ejemplo aplicativo

Ejemplo durante los años 2010 al 2015, una Universidad publico 18 trabajos
científicos, tal como se detalla en la siguiente tabla. Calcular el índice de
colaboración, el grado de colaboración y coeficiente de colaboración de
autores.

81
Tabla: Cantidad de autores y cantidad de trabajos publicados
durante 2010-2015.

f i =número 1
xi = N° ( ). f1
de xi . f i GC xi
autores(colaboradores)
documentos
1 1 1 0.06 1.00
2 4 8 0.44 2.00
3 6 18 1.00 2.00
4 5 20 1.11 1.25
5 2 10 0.56 0.40
Total 18 57 3.17 6.65

Para el índice de colaboración IC:


k

∑x .f i i
57
IC = i =1
= = 3.17 autores
n 18

Durante los años 2010 al 2015 el promedio de colaboradores para los 18


documentos formulados es de 3.17 autores.

Calculo del grado de colaboración

1i
GC = 1.( ) = 0.06 → 6.0%
18
6.0%, es el grado de participación para 1 autor

4
GC = 2.( ) = 0.44 → 44.0%
18
44.0%, es el grado de participación para 2 autores

6
GC = 3.( ) = 1.0 → 100.0%
18
100.0%, es el grado de participación para 3 autores

5
GC = 4.( ) = 1.111 → 111.1%
18
111.1%, es el grado de participación para 4 autores

2
GC = 5.( ) = 0.556 → 55.6%
18
55.6%, es el grado de participación para 5 autores

Calculo del coeficiente de colaboración

k
1
∑ ( x ). f
i =1
i
6.65
CC = 1 − i
= 1− = 0.631
n 18
82
Bibliografía

ARDANUY, J. (2012). Breve Introducción a la Bibliometria. Barcelona:


Universidad de Barcelona.
AMEZQUITA, J., ET AL (2011). Bibliometría, informetría y cienciometría.
https://repositorio.unicartagena.edu.co/bitstream/handle/11227/245/modu
lo%20%20CTS%20No4-cienciometria.pdf?sequence=1
DAVILA, M. et al (2009). Bibliometría: conceptos y utilidades par el estudio
médico y la formación profesional.
https://www.redalyc.org/pdf/817/81712365011.pdf
EVANS, M., ROSENTHAL, J. (2014). Probabilidad y Estadística, La Ciencia de
la Incertidumbre. Barcelona: Editorial Reverte.
GORBEA, P. (1996). El modelo Matemático de Bradford. México: Centro
Universitario de Investigaciones bibliotecológicas.
GRANZEL, W. (2003). Bibliometrics as a research field. A course on theory and
application of bibliometrics indicators.
https://www.cin.ufpe.br/~ajhol/futuro/references/01%23_Bibliometrics_M
odule_KUL_BIBLIOMETRICS%20AS%20A%20RESEARCH%20FIELD.p
df
HINES, W. Y OTROS (2009). Probabilidad y Estadística para Ingeniería. México:
Grupo Editorial Patria.
HOEL, P., BARBANCHO, A. (1976). Introducción a la estadística Matemática.
Barcelona: Editorial Ariel.
LEVINE, D., KREHBIEL, T., BERENSON, M. (2014). Estadística para
Administradores. México: Pearson Educación.
MARIN, J. (2008). Estadística Aplicada a las Ciencia de la Documentación.
Madrid: Diego Marín.
MARTIN-PLIEGO, F., MONTERO, J., RUIZ-MAYA, L. (1998). Problemas de
Probabilidad. Madrid: Paraninfo S.A.
MONTGOMERY, D., PECK, E., VINING, G. (2004). Introducción al Análisis de
Regresión Lineal. México: Compañía Editorial Continental.
QUEZADA, N. (2017). Estadística con SPSS 24. Lima: Editorial MACRO.
RODRIGUEZ, L., TOMEO, V., JUAREZ, I., (2011). Métodos Estadísticos para
Ingeniería. Madrid: Garceta grupo editorial.
URBIZAGASTEGUI, R. (2014). La bibliometría en el Perú.
http://revista.letras.unmsm.edu.pe/index.php/le/article/view/269/265
URBIZAGASTEGUI, R. (2022). Bibliometría para bibliómetras.
https://www.revistaotlet.com/bibliometria-para-bibliometras/
URBIZAGASTEGUI, R. (2016). El crecimiento de la literatura sobre la ley
Bradford. http://rev-ib.unam.mx/ib/index.php/ib/article/view/54595/48539
URBIZAGASTEGUI, R. (2011). La ley Zipf y el punto de transición de Goffman
en la indización automática.
http://rev-ib.unam.mx/ib/index.php/ib/article/view/27482/25470
URBIZAGASTEGUI, R. (2022). La productividad científica de los autores: un
modelo de aplicación de la ley de lotka por el método del poder inverso
generalizado.
http://revistascientificas.filo.uba.ar/index.php/ICS/article/view/904/881
WALPOLE, R. Y OTROS (2012). Probabilidad y Estadística para ingeniería y
ciencias. México: Pearson Educación.

83
Anexos-1

1. Demostrar que: log b M .N = log b M + log b N

Sean dos números:

M >0 , N > 0 ∧ b ≠1> 0 →


log b M = x → b x = M
log b N = y → b y = N
b x+ y = M .N → log b M .N = x + y → log b M .N = log b M + log b N demostrado

x
2. Demostrar que: log b log a N = x → N = a b

x
log b log a N = x → b x = log a N → N = a b demostrado

3. Gráfica de un modelo no lineal linealizado

y = ab x ← mod elo no lineal


log y = log a + (log b) x z = A + Bx ← mod elo no lineal linealizado
Modelo No lineal Modelo linealizado

y
150

100
y
50

0
0 5 10 15

z=logy
2,5
2
1,5
1 z=logy
0,5
0
0 5 10 15

4. Estimación de los parámetros β o y β1 , por mínimo cuadrados ordinarios


(MCO)

Sea el modelo de regresion lineal

yi = β o + β1 xi + ε i

84
Para estimar los parámetros β o y β1 , se extrae una muestra aleatoria de
tamaño n y se toman las medidas ( xi ; yi ) i = 1,2,3,..., n
Sea el modelo estimado yi = bo + b1 xi + ei . Siendo
bo estima β 0 ; b1 estima β1 y ei estima ε i , el método por mínimo
cuadrados ordinarios (MCO) consiste en minimizar la suma de cuadrados de los
residuos:
n n

∑e = ∑(y
i =1
2
i
i =1
i − b0 − b1 xi ) 2 = f (b0 , b1 )

∂f (b0 , b1 )
= 0 → b0 = y − b1 x
∂b0
n

∂f (b0 , b1 ) ∑ (x i − x)( yi − y )
= 0 → b1 = i =1
n
∂b1
∑ (x
i =1
i − x) 2

5. Coeficiente de determinación R 2

y i = b0 + b1 xi + ei → y i = y − b1 x + b1 xi + ei → y i − y = b1 ( xi − x) + ei
n n n n

∑(y
i =1
i − y ) 2 =b12 ∑ ( xi − x) 2 + ∑ ei2
i =1 i =1
dividiendo por ∑(y
i =1
i − y) 2
n n n n
b12 ∑ ( xi − x) 2 + ∑ ei2 b12 ∑ ( xi − x) 2 ∑e 2
i
1= i =1
n
i =1
= n
i =1
+ n
i =1

∑(yi =1
i − y) 2 ∑(y
i =1
i − y) 2 ∑(y
i =1
i − y) 2
n n
b12 ∑ ( xi − x) 2 ∑e 2
i
2 2
Sea R = n
i =1
→ R =1− n
i =1

∑(y
i =1
i − y) 2 ∑(y
i =1
i − y) 2
n
Si ∑e
i =1
2
i ≈ 0 → R 2 ≈ 1 → un buen ajuste del mod elo estimado

6. Demostrar que R 2 = [r ]
2

n n n
b12 ∑ ( xi − x) 2 ∑ (x i − x)( y i − y ) ∑ (x i − x) 2
Como R2 = n
i =1
= ( i =1 n
) 2 .( i =1
n
)=
∑(y
i =1
i − y) 2 ∑ (x
i =1
i − x) 2 ∑(y i =1
i − y) 2

n 2 n n 2

(∑ ( xi − x)( y i − y )) 2
∑ (x i − x) 2
(∑ ( xi − x)( y i − y )) 2
1
R2 = i =1
n
.( i =1
n
)= i =1
n
.( n
)
(∑ ( x i − x) ) 2 2
∑(y i − y) 2
∑ (x i − x) 2
∑(y i − y) 2
i =1 i =1 i =1 i =1
2
n 2
 n 2

(∑ ( xi − x)( y i − y )) 2  ∑ (x i − x)( y i − y ) 
1   = [r ]2
R2 = i =1
.( n )= i =1
demostrado
n  n n 
∑ ( xi − x) 2 ∑ ( yi − y) 2  ∑ (x i − x) 2 ∑ ( yi − y) 2 
i =1 i =1  i =1 i =1 

85
Anexo-2

Las siguientes tablas estadísticas han sido obtenidas por el autor, mediante el
paquete estadístico MINITAB Y MICROSOFT EXCEL

1. NORMAL ESTANDAR

2. T-STUDENTS

86
N° 1
PROBABILIDADES ACUMULADAS DE LA DISTRIBUCION NORMAL ESTANDAR
(PARA VALORES POSITIVOS DE Z)
Z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,00 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,10 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,20 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,30 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,40 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,50 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,60 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,70 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,80 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8079 0,8106 0,8133
0,90 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,00 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,10 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,20 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,30 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,40 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,50 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,60 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,70 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,80 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,90 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,00 0,9773 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,10 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,20 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,30 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,40 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,50 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,60 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,70 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,80 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,90 0,9981 0,9982 0,9983 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,00 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,10 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,20 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,30 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,40 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,50 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
3,60 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,70 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,80 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 1,0000
3,90 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
4,00 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
Profesor: Fausto Matos Uribe de la Universidad Nacional Mayor de San Marcos

87
PROBABILIDADES ACUMULADAS DE LA DISTRIBUCION NORMAL ESTANDAR
(PARA VALORES NEGATIVOS DE Z)
-0,0900 -0,0800 -0,0700 -0,0600 -0,0500 -0,0400 -0,0300 -0,0200 -0,0100 0,0000 Z
0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 -4,0
0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 -3,9
0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 -3,8
0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 -3,7
0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0002 0,0002 -3,6
0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 -3,5
0,0002 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 -3,4
0,0003 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0005 0,0005 0,0005 -3,3
0,0005 0,0005 0,0005 0,0006 0,0006 0,0006 0,0006 0,0006 0,0007 0,0007 -3,2
0,0007 0,0007 0,0008 0,0008 0,0008 0,0008 0,0009 0,0009 0,0009 0,0010 -3,1
0,0010 0,0010 0,0011 0,0011 0,0011 0,0012 0,0012 0,0013 0,0013 0,0014 -3,0
0,0014 0,0014 0,0015 0,0015 0,0016 0,0016 0,0017 0,0018 0,0018 0,0019 -2,9
0,0019 0,0020 0,0021 0,0021 0,0022 0,0023 0,0023 0,0024 0,0025 0,0026 -2,8
0,0026 0,0027 0,0028 0,0029 0,0030 0,0031 0,0032 0,0033 0,0034 0,0035 -2,7
0,0036 0,0037 0,0038 0,0039 0,0040 0,0041 0,0043 0,0044 0,0045 0,0047 -2,6
0,0048 0,0049 0,0051 0,0052 0,0054 0,0055 0,0057 0,0059 0,0060 0,0062 -2,5
0,0064 0,0066 0,0068 0,0069 0,0071 0,0073 0,0075 0,0078 0,0080 0,0082 -2,4
0,0084 0,0087 0,0089 0,0091 0,0094 0,0096 0,0099 0,0102 0,0104 0,0107 -2,3
0,0110 0,0113 0,0116 0,0119 0,0122 0,0125 0,0129 0,0132 0,0136 0,0139 -2,2
0,0143 0,0146 0,0150 0,0154 0,0158 0,0162 0,0166 0,0170 0,0174 0,0179 -2,1
0,0183 0,0188 0,0192 0,0197 0,0202 0,0207 0,0212 0,0217 0,0222 0,0228 -2,0
0,0233 0,0239 0,0244 0,0250 0,0256 0,0262 0,0268 0,0274 0,0281 0,0287 -1,9
0,0294 0,0301 0,0307 0,0314 0,0322 0,0329 0,0336 0,0344 0,0351 0,0359 -1,8
0,0367 0,0375 0,0384 0,0392 0,0401 0,0409 0,0418 0,0427 0,0436 0,0446 -1,7
0,0455 0,0465 0,0475 0,0485 0,0495 0,0505 0,0516 0,0526 0,0537 0,0548 -1,6
0,0559 0,0571 0,0582 0,0594 0,0606 0,0618 0,0630 0,0643 0,0655 0,0668 -1,5
0,0681 0,0694 0,0708 0,0721 0,0735 0,0749 0,0764 0,0778 0,0793 0,0808 -1,4
0,0823 0,0838 0,0853 0,0869 0,0885 0,0901 0,0918 0,0934 0,0951 0,0968 -1,3
0,0985 0,1003 0,1020 0,1038 0,1057 0,1075 0,1093 0,1112 0,1131 0,1151 -1,2
0,1170 0,1190 0,1210 0,1230 0,1251 0,1271 0,1292 0,1314 0,1335 0,1357 -1,1
0,1379 0,1401 0,1423 0,1446 0,1469 0,1492 0,1515 0,1539 0,1562 0,1587 -1,0
0,1611 0,1635 0,1660 0,1685 0,1711 0,1736 0,1762 0,1788 0,1814 0,1841 -0,9
0,1867 0,1894 0,1922 0,1949 0,1977 0,2005 0,2033 0,2061 0,2090 0,2119 -0,8
0,2148 0,2177 0,2207 0,2236 0,2266 0,2297 0,2327 0,2358 0,2389 0,2420 -0,7
0,2451 0,2483 0,2514 0,2546 0,2578 0,2611 0,2643 0,2676 0,2709 0,2743 -0,6
0,2776 0,2810 0,2843 0,2877 0,2912 0,2946 0,2981 0,3015 0,3050 0,3085 -0,5
0,3121 0,3156 0,3192 0,3228 0,3264 0,3300 0,3336 0,3372 0,3409 0,3446 -0,4
0,3483 0,3520 0,3557 0,3594 0,3632 0,3669 0,3707 0,3745 0,3783 0,3821 -0,3
0,3859 0,3897 0,3936 0,3974 0,4013 0,4052 0,4090 0,4129 0,4168 0,4207 -0,2
0,4247 0,4286 0,4325 0,4364 0,4404 0,4443 0,4483 0,4522 0,4562 0,4602 -0,1
0,4641 0,4681 0,4721 0,4761 0,4801 0,4840 0,4880 0,4920 0,4960 0,5000 0,0
Profesor: Fausto Francisco Matos Uribe
Universidad Nacional Mayor de San Marcos.

88
PROBABILIDADES ACUMULADAS DE LA DISTRIBUCION T-STUDENTS
GL. 0.005 0.01 0.025 0.05 0.1 0.2 0.3 0.7 0.8 0.9 0.95 0.975 0.99 0.995
1 -63.6567 -31.8205 -12.7062 -6.3138 -3.0777 -1.3764 -0.7265 0.7265 1.3764 3.0777 6.3138 12.7062 31.8205 63.6567
2 -9.92484 -6.96456 -4.30265 -2.91999 -1.88562 -1.06066 -0.61721 0.61721 1.06066 1.88562 2.91999 4.30265 6.96456 9.92484
3 -5.84091 -4.5407 -3.18245 -2.35336 -1.63774 -0.97847 -0.58439 0.58439 0.97847 1.63774 2.35336 3.18245 4.5407 5.84091
4 -4.6041 -3.74695 -2.77645 -2.13187 -1.53321 -0.94096 -0.56865 0.56865 0.94096 1.53321 2.13187 2.77645 3.74695 4.6041
5 -4.03215 -3.36493 -2.57058 -2.01505 -1.47592 -0.91954 -0.55943 0.55943 0.91954 1.47592 2.01505 2.57058 3.36493 4.03215
6 -3.70745 -3.14267 -2.44691 -1.94318 -1.43976 -0.9057 -0.55338 0.55338 0.9057 1.43976 1.94318 2.44691 3.14267 3.70745
7 -3.49948 -2.99795 -2.36463 -1.89459 -1.41492 -0.89603 -0.54911 0.54911 0.89603 1.41492 1.89459 2.36463 2.99795 3.49948
8 -3.35539 -2.89646 -2.306 -1.85955 -1.39682 -0.88889 -0.54593 0.54593 0.88889 1.39682 1.85955 2.306 2.89646 3.35539
9 -3.24985 -2.82144 -2.26216 -1.83311 -1.38304 -0.8834 -0.54348 0.54348 0.8834 1.38304 1.83311 2.26216 2.82144 3.24985
10 -3.16928 -2.76378 -2.22814 -1.81246 -1.3722 -0.87906 -0.54153 0.54153 0.87906 1.3722 1.81246 2.22814 2.76378 3.16928
11 -3.10582 -2.71808 -2.20099 -1.79589 -1.36343 -0.87555 -0.53994 0.53994 0.87555 1.36343 1.79589 2.20099 2.71808 3.10582
12 -3.05456 -2.681 -2.17882 -1.78229 -1.35622 -0.87261 -0.53862 0.53862 0.87261 1.35622 1.78229 2.17882 2.681 3.05456
13 -3.01228 -2.65031 -2.16037 -1.77093 -1.35017 -0.87015 -0.5375 0.5375 0.87015 1.35017 1.77093 2.16037 2.65031 3.01228
14 -2.97686 -2.6245 -2.1448 -1.76131 -1.34503 -0.86805 -0.53655 0.53655 0.86805 1.34503 1.76131 2.1448 2.6245 2.97686
15 -2.94672 -2.60248 -2.13145 -1.75305 -1.34061 -0.86625 -0.53573 0.53573 0.86625 1.34061 1.75305 2.13145 2.60248 2.94672
16 -2.92078 -2.58349 -2.11991 -1.74589 -1.33679 -0.86467 -0.53501 0.53501 0.86467 1.33679 1.74589 2.11991 2.58349 2.92078
17 -2.89824 -2.56694 -2.10982 -1.73961 -1.3334 -0.86328 -0.53438 0.53438 0.86328 1.3334 1.73961 2.10982 2.56694 2.89824
18 -2.87844 -2.55238 -2.10093 -1.73407 -1.3304 -0.86205 -0.53382 0.53382 0.86205 1.3304 1.73407 2.10093 2.55238 2.87844
19 -2.86095 -2.53948 -2.09303 -1.72914 -1.32773 -0.86095 -0.53331 0.53331 0.86095 1.32773 1.72914 2.09303 2.53948 2.86095
20 -2.84534 -2.52798 -2.08598 -1.72473 -1.32534 -0.85997 -0.53286 0.53286 0.85997 1.32534 1.72473 2.08598 2.52798 2.84534
21 -2.83137 -2.51765 -2.07963 -1.72075 -1.3232 -0.85908 -0.53246 0.53246 0.85908 1.3232 1.72075 2.07963 2.51765 2.83137
22 -2.81878 -2.50832 -2.0739 -1.71715 -1.32124 -0.85828 -0.53209 0.53209 0.85828 1.32124 1.71715 2.0739 2.50832 2.81878
23 -2.80734 -2.49987 -2.06866 -1.71388 -1.31946 -0.85755 -0.53175 0.53175 0.85755 1.31946 1.71388 2.06866 2.49987 2.80734
24 -2.79694 -2.49217 -2.0639 -1.71089 -1.31784 -0.85686 -0.53144 0.53144 0.85686 1.31784 1.71089 2.0639 2.49217 2.79694
25 -2.78744 -2.48511 -2.05954 -1.70814 -1.31635 -0.85624 -0.53115 0.53115 0.85624 1.31635 1.70814 2.05954 2.48511 2.78744
26 -2.77871 -2.47863 -2.05553 -1.70562 -1.31499 -0.85567 -0.53089 0.53089 0.85567 1.31499 1.70562 2.05553 2.47863 2.77871
27 -2.77068 -2.47266 -2.05183 -1.70331 -1.3137 -0.85514 -0.53065 0.53065 0.85514 1.3137 1.70331 2.05183 2.47266 2.77068
28 -2.76326 -2.46714 -2.04841 -1.70113 -1.31253 -0.85465 -0.53043 0.53043 0.85465 1.31253 1.70113 2.04841 2.46714 2.76326
29 -2.75639 -2.46202 -2.04523 -1.69914 -1.31143 -0.85419 -0.53023 0.53023 0.85419 1.31143 1.69914 2.04523 2.46202 2.75639
30 -2.75000 -2.45726 -2.04227 -1.69726 -1.31042 -0.85377 -0.53002 0.53002 0.85377 1.31042 1.69726 2.04227 2.45726 2.75
31 -2.74406 -2.45282 -2.03951 -1.69552 -1.30946 -0.85337 -0.52984 0.52984 0.85337 1.30946 1.69552 2.03951 2.45282 2.74406

89
32 -2.73848 -2.44869 -2.03693 -1.6939 -1.30857 -0.853 -0.52967 0.52967 0.853 1.30857 1.6939 2.03693 2.44869 2.73848
33 -2.73328 -2.4448 -2.03453 -1.69236 -1.30774 -0.85265 -0.5295 0.5295 0.85265 1.30774 1.69236 2.03453 2.4448 2.73328

PROBABILIDADES ACUMULADAS DE LA DISTRIBUCION T-STUDENTS


GL. 0.005 0.01 0.025 0.05 0.1 0.2 0.3 0.7 0.8 0.9 0.95 0.975 0.99 0.995
34 -2.72839 -2.44116 -2.03225 -1.69092 -1.30695 -0.85232 -0.52935 0.52935 0.85232 1.30695 1.69092 2.03225 2.44116 2.72839
35 -2.72381 -2.43774 -2.03011 -1.68957 -1.30621 -0.85201 -0.52921 0.52921 0.85201 1.30621 1.68957 2.03011 2.43774 2.72381
30 -2.75000 -2.45726 -2.04227 -1.69726 -1.31042 -0.85377 -0.53002 0.53002 0.85377 1.31042 1.69726 2.04227 2.45726 2.75
31 -2.74406 -2.45282 -2.03951 -1.69552 -1.30946 -0.85337 -0.52984 0.52984 0.85337 1.30946 1.69552 2.03951 2.45282 2.74406
32 -2.73848 -2.44869 -2.03693 -1.6939 -1.30857 -0.853 -0.52967 0.52967 0.853 1.30857 1.6939 2.03693 2.44869 2.73848
33 -2.73328 -2.4448 -2.03453 -1.69236 -1.30774 -0.85265 -0.5295 0.5295 0.85265 1.30774 1.69236 2.03453 2.4448 2.73328

PROBABILIDADES ACUMULADAS DE LA DISTRIBUCION T-STUDENTS


GL. 0.005 0.01 0.025 0.05 0.1 0.2 0.3 0.7 0.8 0.9 0.95 0.975 0.99 0.995

90
34 -2.72839 -2.44116 -2.03225 -1.69092 -1.30695 -0.85232 -0.52935 0.52935 0.85232 1.30695 1.69092 2.03225 2.44116 2.72839
35 -2.72381 -2.43774 -2.03011 -1.68957 -1.30621 -0.85201 -0.52921 0.52921 0.85201 1.30621 1.68957 2.03011 2.43774 2.72381
36 -2.71948 -2.4345 -2.02809 -1.6883 -1.30552 -0.85172 -0.52908 0.52908 0.85172 1.30552 1.6883 2.02809 2.4345 2.71948
37 -2.71541 -2.43145 -2.0262 -1.68709 -1.30486 -0.85144 -0.52895 0.52895 0.85144 1.30486 1.68709 2.0262 2.43145 2.71541
38 -2.71156 -2.42857 -2.02439 -1.68596 -1.30424 -0.85118 -0.52883 0.52883 0.85118 1.30424 1.68596 2.02439 2.42857 2.71156
39 -2.70791 -2.42585 -2.02269 -1.68488 -1.30364 -0.85094 -0.52871 0.52871 0.85094 1.30364 1.68488 2.02269 2.42585 2.70791
40 -2.70446 -2.42326 -2.02108 -1.68385 -1.30308 -0.8507 -0.52861 0.52861 0.8507 1.30308 1.68385 2.02108 2.42326 2.70446
41 -2.70118 -2.4208 -2.01954 -1.68288 -1.30254 -0.85048 -0.5285 0.5285 0.85048 1.30254 1.68288 2.01954 2.4208 2.70118
42 -2.69807 -2.41847 -2.01808 -1.68195 -1.30204 -0.85026 -0.5284 0.5284 0.85026 1.30204 1.68195 2.01808 2.41847 2.69807
43 -2.6951 -2.41625 -2.01669 -1.68107 -1.30155 -0.85006 -0.52831 0.52831 0.85006 1.30155 1.68107 2.01669 2.41625 2.6951
44 -2.69228 -2.41413 -2.01537 -1.68023 -1.30109 -0.84987 -0.52822 0.52822 0.84987 1.30109 1.68023 2.01537 2.41413 2.69228
45 -2.68959 -2.41212 -2.0141 -1.67943 -1.30065 -0.84968 -0.52814 0.52814 0.84968 1.30065 1.67943 2.0141 2.41212 2.68959
46 -2.68701 -2.41019 -2.0129 -1.67866 -1.30023 -0.84951 -0.52805 0.52805 0.84951 1.30023 1.67866 2.0129 2.41019 2.68701
47 -2.68456 -2.40835 -2.01174 -1.67793 -1.29982 -0.84934 -0.52798 0.52798 0.84934 1.29982 1.67793 2.01174 2.40835 2.68456
48 -2.6822 -2.40658 -2.01063 -1.67722 -1.29944 -0.84917 -0.5279 0.5279 0.84917 1.29944 1.67722 2.01063 2.40658 2.6822
49 -2.67995 -2.40489 -2.00958 -1.67655 -1.29907 -0.84902 -0.52783 0.52783 0.84902 1.29907 1.67655 2.00958 2.40489 2.67995
50 -2.67779 -2.40327 -2.00856 -1.67591 -1.29871 -0.84887 -0.52776 0.52776 0.84887 1.29871 1.67591 2.00856 2.40327 2.67779
51 -2.67572 -2.40172 -2.00758 -1.67528 -1.29837 -0.84873 -0.52769 0.52769 0.84873 1.29837 1.67528 2.00758 2.40172 2.67572
52 -2.67373 -2.40022 -2.00665 -1.67469 -1.29805 -0.84859 -0.52763 0.52763 0.84859 1.29805 1.67469 2.00665 2.40022 2.67373
53 -2.67182 -2.39879 -2.00575 -1.67412 -1.29773 -0.84846 -0.52757 0.52757 0.84846 1.29773 1.67412 2.00575 2.39879 2.67182
54 -2.66998 -2.39741 -2.00488 -1.67356 -1.29743 -0.84833 -0.52751 0.52751 0.84833 1.29743 1.67356 2.00488 2.39741 2.66998
55 -2.66822 -2.39608 -2.00404 -1.67303 -1.29713 -0.84821 -0.52745 0.52745 0.84821 1.29713 1.67303 2.00404 2.39608 2.66822
60 -2.66028 -2.39012 -2.0003 -1.67065 -1.29582 -0.84765 -0.5272 0.5272 0.84765 1.29582 1.67065 2.0003 2.39012 2.66028
65 -2.6536 -2.3851 -1.99714 -1.66864 -1.29471 -0.84719 -0.52698 0.52698 0.84719 1.29471 1.66864 1.99714 2.3851 2.6536
70 -2.6479 -2.38081 -1.99444 -1.66691 -1.29376 -0.84679 -0.5268 0.5268 0.84679 1.29376 1.66691 1.99444 2.38081 2.6479
75 -2.64298 -2.3771 -1.9921 -1.66543 -1.29294 -0.84644 -0.52664 0.52664 0.84644 1.29294 1.66543 1.9921 2.3771 2.64298
80 -2.63869 -2.37387 -1.99006 -1.66412 -1.29222 -0.84614 -0.5265 0.5265 0.84614 1.29222 1.66412 1.99006 2.37387 2.63869
85 -2.63491 -2.37102 -1.98827 -1.66298 -1.29159 -0.84587 -0.52637 0.52637 0.84587 1.29159 1.66298 1.98827 2.37102 2.63491
90 -2.63157 -2.3685 -1.98667 -1.66196 -1.29103 -0.84563 -0.52626 0.52626 0.84563 1.29103 1.66196 1.98667 2.3685 2.63157
95 -2.62858 -2.36624 -1.98525 -1.66105 -1.29053 -0.84542 -0.52616 0.52616 0.84542 1.29053 1.66105 1.98525 2.36624 2.62858
100 -2.62589 -2.36422 -1.98397 -1.66023 -1.29007 -0.84523 -0.52608 0.52608 0.84523 1.29007 1.66023 1.98397 2.36422 2.62589
150 -2.609 -2.35146 -1.97591 -1.65508 -1.28722 -0.84402 -0.52552 0.52552 0.84402 1.28722 1.65508 1.97591 2.35146 2.609
200 -2.60063 -2.34514 -1.9719 -1.65251 -1.2858 -0.84342 -0.52524 0.52524 0.84342 1.2858 1.65251 1.9719 2.34514 2.60063
250 -2.59564 -2.34136 -1.9695 -1.65097 -1.28495 -0.84306 -0.52507 0.52507 0.84306 1.28495 1.65097 1.9695 2.34136 2.59564

PROBABILIDADES ACUMULADAS DE LA DISTRIBUCION T-STUDENTS


GL. 0.005 0.01 0.025 0.05 0.1 0.2 0.3 0.7 0.8 0.9 0.95 0.975 0.99 0.995
300 -2.59232 -2.33884 -1.9679 -1.64995 -1.28438 -0.84282 -0.52496 0.52496 0.84282 1.28438 1.64995 1.9679 2.33884 2.59232
95 -2.62858 -2.36624 -1.98525 -1.66105 -1.29053 -0.84542 -0.52616 0.52616 0.84542 1.29053 1.66105 1.98525 2.36624 2.62858
100 -2.62589 -2.36422 -1.98397 -1.66023 -1.29007 -0.84523 -0.52608 0.52608 0.84523 1.29007 1.66023 1.98397 2.36422 2.62589
150 -2.609 -2.35146 -1.97591 -1.65508 -1.28722 -0.84402 -0.52552 0.52552 0.84402 1.28722 1.65508 1.97591 2.35146 2.609
200 -2.60063 -2.34514 -1.9719 -1.65251 -1.2858 -0.84342 -0.52524 0.52524 0.84342 1.2858 1.65251 1.9719 2.34514 2.60063
250 -2.59564 -2.34136 -1.9695 -1.65097 -1.28495 -0.84306 -0.52507 0.52507 0.84306 1.28495 1.65097 1.9695 2.34136 2.59564

PROBABILIDADES ACUMULADAS DE LA DISTRIBUCION T-STUDENTS


GL. 0.005 0.01 0.025 0.05 0.1 0.2 0.3 0.7 0.8 0.9 0.95 0.975 0.99 0.995
300 -2.59232 -2.33884 -1.9679 -1.64995 -1.28438 -0.84282 -0.52496 0.52496 0.84282 1.28438 1.64995 1.9679 2.33884 2.59232
400 -2.58818 -2.33571 -1.96591 -1.64867 -1.28367 -0.84252 -0.52482 0.52482 0.84252 1.28367 1.64867 1.96591 2.33571 2.58818
500 -2.5857 -2.33383 -1.96472 -1.64791 -1.28325 -0.84234 -0.52473 0.52473 0.84234 1.28325 1.64791 1.96472 2.33383 2.5857
600 -2.58405 -2.33258 -1.96393 -1.6474 -1.28296 -0.84222 -0.52468 0.52468 0.84222 1.28296 1.6474 1.96393 2.33258 2.58405
700 -2.58287 -2.33169 -1.96336 -1.64703 -1.28276 -0.84214 -0.52464 0.52464 0.84214 1.28276 1.64703 1.96336 2.33169 2.58287
800 -2.58199 -2.33102 -1.96293 -1.64676 -1.28261 -0.84207 -0.52461 0.52461 0.84207 1.28261 1.64676 1.96293 2.33102 2.58199
900 -2.5813 -2.3305 -1.9626 -1.64655 -1.28249 -0.84202 -0.52459 0.52459 0.84202 1.28249 1.64655 1.9626 2.3305 2.5813
1000 -2.58075 -2.33008 -1.96234 -1.64638 -1.2824 -0.84198 -0.52457 0.52457 0.84198 1.2824 1.64638 1.96234 2.33008 2.58075
2000 -2.57829 -2.32821 -1.96115 -1.64562 -1.28198 -0.8418 -0.52448 0.52448 0.8418 1.28198 1.64562 1.96115 2.32821 2.57829

91

También podría gustarte