Estadistica para La Investigacion Cientifica I Mhs
Estadistica para La Investigacion Cientifica I Mhs
Estadistica para La Investigacion Cientifica I Mhs
investigacin Cientfica I
La Estadstica y la
Investigacin cientfica
La Investigacin cientfica es
Conjunto de Actividades
Que se realizan de manera sistemtica
y organizada para
Crear y construir
Conocimiento cientfico
aplicando
Mtodos cuantitativos
(Mtodos Estadsticos)
Mtodos cualitativos
ESTADSTICA:
Ciencia encargada de desarrollar mtodos,
tcnicas y procedimientos para la obtencin del
conocimiento a partir de los datos obtenidos en
la investigacin cientfica y facilitar as la toma
de decisiones en condiciones de incertidumbre.
Qu Informacin
estadstica hay
en
antecedentes?
Tcnicas de
recoleccin de
datos?
Mtodos
de anlisis
estadstico?
Se requiere
apoyo de la
ciencia
Estadstica
La Estadstica en la
formulacin de la Hiptesis
Con qu tcnicas
estadsticas se
contrastar?
Ho: = o
La Estadstica en el diseo de
contrastacin
La Estadstica forma parte de los
diseos de investigacin experimental
Diseos de investigacin
Una sola casilla
Clsico
GE. Antes
GE. Despus
GC. Antes
GC. Despus
Estmulo creciente
G.E. 1
GE. Despus
G.E. 2
G.E. 3
La estadstica en las
investigaciones cuantitativas
Paradigma positivista
Concepto =
Conocimiento
cientfico.
Mtodo Cientfico
Objeto de
estudio
Sujeto
investigador
El conocimiento
es objetivo,
elimina
cualquier
influencia o
prejuicio
personal
Enfoque cualitativo
Paradigma dialctico
Interaccin hermenutica
y dialctica
Sujeto investigador:
Sujeto investigado
Muchos investigadores interpretativos o
crticos, en algn momento de su proceso
analtico, recurren a tcnicas estadsticas,
para complementar o contrastar las
conclusiones obtenidas por otras vas
El conocimiento es construido a
travs de la interaccin
hermenutica y dialctica entre el
investigador y los investigados
Limitaciones intrnsecas de la
Estadstica
Problema
Hiptesis
Deduccin de
consecuencias
verificables
Diseo de
investigacin
Mtodo Estadstico
1. Planeamiento
2. Recopilacin de datos
3. Organizacin y presentacin de datos
4. Anlisis e interpretacin de resultados
5. Obtencin de conclusiones y
preparacin del informe
Realidad
Conocimiento
El mtodo estadstico
Planeamiento
Recopilacin de datos
Organizacin y
Presentacin de datos
Anlisis e interpretacin
de resultados
Obtencin de conclusiones y
preparacin del informe
Conceptos bsicos de la
estadstica
Poblacin
Es el conjunto de todas las unidades de
anlisis cuyas caractersticas se van a
estimar
Ejemplo de poblacin
Estudiantes de
la UNSP de
Chimbote
matriculados
en el ciclo
acadmico
2012-I.
Marco muestral
El Marco Muestral es la relacin de unidades de la
poblacin indicando plenamente su identificacin.
La poblacin a quien se desea investigar se denomina Poblacin
Objetivo
La poblacin contenida en el marco muestral se denomina Poblacin
Muestral o bajo muestreo.
Un buen marco muestral es aquel que hace que la poblacin muestral
sea lo ms cercana posible a la poblacin objetivo
Poblacin Objetivo
Poblacin muestral
Contenida en el Marco
Muestral
1. La gua telefnica
2. Padrn de empresas pblicas y privadas
3. Un plano de la ciudad.
4. Mapa de un pas.
5. El listado de alumnos.
6. rea de un terreno de cultivo.
Muestra
Es un subconjunto de la poblacin que tiene
dos cualidades fundamentales:
- Representativa
- Tamao adecuado
Variable
Variable:
temperatura
T = 28 C
(Dato)
2.
Cuantitativas
1.
2.
ESCALAS DE MEDICIN
Escalas mtricas
ESCALA DE
RAZON
Escalas no mtricas
ESCALA DE INTERVALO
ESCALA ORDINAL
ESCALA NOMINAL
D
E
S
C
R
I
P
C
I
Los nmeros u
otros smbolos se
usan simplemente
para clasificar,
para identificar los
grupos a los cuales
pertenecen los
objetos, las
personas o unas
caractersticas.
Esta escala solo
permite
CLASIFICAR
Los nmeros o
smbolos que se
usan no slo
clasifican a los
objetos o personas,
sino adems, existe
una relacin de
orden.
Esta escala permite
CLASIFICAR Y
ORDENAR
Los nmeros,
adems de
tener todas las
propiedades de
una escala de
intervalo, posee
un cero real,
no arbitrario,
es decir que
indica la
ausencia de la
caracterstica
que se
pretende
medir.
Escalas no mtricas
ESCALA DE
INTERVALO
ESCALA ORDINAL
ESCALA NOMINAL
P
R
O
P
I
R
D
A
D
E
S
Propiedades:
Equivalencia
Operaciones
Aritmticas
admisibles: ninguna.
Slo es posible
contar
Propiedades:
Relacin de Orden
< , >,
Operaciones
aritmticas
admisibles:
ninguna.
Slo es posible
contar y ordenar los
valores
Propiedades:
0 (cero) arbitrario,
Relacin de orden <
Equivalencia
Operaciones
aritmticas
admisibles: Todas,
excepto la divisin.
Propiedades:
0 (cero) absoluto,
Relacin de orden
< >, ,
Equivalencia,
Operaciones
aritmticas
admisibles: Todas.
OBJETOS
CARACTERSTICA
INSTRUMENTO
PROCESO
Personas
Peso
Balanza
Pesado
Personas
Estado civil
Cuestionario
Clasificacin
Personas
Cociente
Intelectual
Test de IQ
Personas
Ingreso mensual
Cuestionario
Cuantificacin del
ingreso en unidades
monetarias
Hogares
Nmero de
miembros
Cuestionario
Hogares
Gasto mensual en
educacin
Cuestionario
Cuantificacin en
unidades
monetarias
Comunid
ades
Porcentaje de
catlicos
cuestionario
Conteo
QUE ES LA MEDICIN?
Es un proceso de asignacin de nmeros u otros signos a las
caractersticas de los objetos (unidades de anlisis), de acuerdo
con ciertas reglas especificadas con anticipacin
Usar un instrumento
Contar
Registrar
categoras
QUE ES UN DATO
ESTADSTICO?
Dato estadstico. Es el resultado de practicar una medicin del
valor de una variable cuantitativa o el resultado
de determinar la modalidad si la variable es cuantitativa,
en una unidad de anlisis.
Operacionalizacin de variables
Definicin
conceptual
DIMENSIONES
Definicin operacional
de cada dimensin
INDICADORES
Variable
Terica
OPERACIONALIZACIN
CONCEPTO
Variable
Emprica
Categoras de la Variable:
A:
B:
C:
D:
.
.
Cuadro de categorizaciones de
la variable principal a partir de
los indicadores
DIMENSIN
INDICADOR
(Variable Emprica)
I1: Nmero de aos de estudio
del jefe del hogar
Nivel Socioeconmico
Es el entorno en que el
(NSE):
Valores o
cualidades
Nmero
En nuevos soles
En nuevos soles
I8: Vehculos
INDICADOR
(dominante)
% de hogares en
Lima Metropolitana
A1
A2
B1
B2
C1
C2
Alto
Medio
superior
Medio
Tpico
Medio
inferior
Bajo
superior
Bajo
inferior
Muy Bajo
Bajo
Extremo
0.8
3.5
6.5
8.8
10.9
21.5
36.1
11.9
Superior
universitaria /
Postgrado
17.5
Aos de estudio del
Superior
universitaria
Superior
universitaria
Superior
Superior no
universitaria /
universitaria /
no universitaria secundaria
15.1
13.1
Secundaria
Pequeo
comerciante /
Trabajador
Especializado
10.6
Secundaria /
Primaria
8.8
Primaria /
Secundaria
16.8
16.7
6.2
Profesional
Independiente /
Dependiente
Profesional
Independiente /
Dependiente
Trabajador
especializado /
Profesional
Independiente
+ us$ 5,000
+ us$ 2,800
Us$ 1,000
Us$ 780
Us$ 400
Us$ 320
Us$ 230
Us$ 150
Us$ 750
Us$ 450
Us$ 280
Us$ 235
Us$ 180
Us$ 150
Us$ 135
Us$ 105
100%
100%
92%
82%
77%
61%
42%
16%
100%
100%
96%
92%
73%
56%
25%
7%
100%
100%
67%
32%
8%
2%
1%
0%
Del ao
De 1 ao
De 3 aos
De 4 aos
Empresario /
Gerente
General
Pequeo
comerciante /
Trabajador
Especializado
Empleado
Obrero
poco
eventual /
especializado ambulante
/ Obrero
Muestreo
Probabilstico
Estratificado
Proporcional
ptimo
Neyman
Conglomerado
Una etapa
Dos etapas
Multirtpicas
nico
Tipos de
Muestreo
Sistemtico
Doble
Mltiple
Secuencial
No
Probabilstico
Casos tpicos
Conveniencia
Voluntarios
Bola de nieve
Con reemplazo
Sin reemplazo
Poblacin N
Parmetro
Inferencia:
Muestreo
Muestra
Estimador
Confianza:
1-
Precisin:
( z )
2
d
2
( z ) pq
2
d2
( z ) pq
2
Por ejemplo:
Ho: 1 = 2
Ha: 1 2
( z z ) ( 2 )
2
Significancia:
Potencia
:1-
2
1
1 2
Ho: 1 = 2
Ha: 1 < 2
Ha: 1 > 2
( z z ) (
2
2
1
2)
2
1 2
Significancia:
Potencia
:1-
Ho: = o
Ha: o
( z z )
2
Significancia:
Potencia
:1-
Ho: = o
Ha: < o
Ha: > o
( z z )
2
Significancia:
Potencia
:1-
Ho: P = P0
Ha: P P0
( z
P0 (1 P0 ) z
( p P0 )
Significancia:
Potencia
:1-
p(1 p ) 2
Ho: P = Po
Ha: P < Po
Ha: P > Po
( z P0 (1 P0 ) z
( p P0 )
Significancia:
Potencia
:1-
p(1 p )
Ho: P1 = P2
Ha: P1 P2
( z
( p1 p2 )(q1 q2 ) / 2 z
( p1 p2 ) 2
Significancia:
Potencia
:1-
p1q1 p2 q2 ) 2
( z1
2 p(1 p) z1
( p1 p2 ) 2
p1q1 p2 q2 )
Ho: P1 = P2
Ha: P1 < P2
Ha: P1 > P2
( z ( p1 p2 )(q1 q2 ) / 2 z
n
( p1 p2 ) 2
Significancia:
Potencia
:1-
p1q1 p2 q2 ) 2
N1
Poblacin:
Nh
NL
1-
n1
nh
Muestra estratificada: n
nL
st
WS
n
W S
h
2
h
2
h
Asignacin de la
muestra a los estratos
Wh Sh
nh
n
2
Wh Sh
Tamao general de
muestra con
asignacin de Neyman
Asignacin de la
muestra a los
estratos
ph qh
2
W
h ph qh
Wh ph qh
nh
n
Wh ph qh
Qu elementos Seleccionar?
Poblacin N
1 Etapa
2 Etapa
Muestra n
Manzana: 1
2
3
4
5
6
7
8
Tamao : 114 222 525 308 205 191 414
210
Por ejemplo;
n = 200,
m = 4 y c = 50.
Pasos
1.
Tamao acumulado Di
114
114
222
336
525
861
308
1169
205
1374
191
1565
414
1979
210
2189
2 Calcular el intervalo de
seleccin I.
N
I
m
En el ejemplo I = 547,25 547
3. Seleccionar un nmero
aleatorio R entre 1 e I.
Z2 =R+I,
Z3 = R+2I . Zm = R+(m-1)I
Manzanas seleccionadas
Manzana i Tamao N i
1
2
3
4
5
6
7
8
114
222
525
308
205
191
414
210
Tamao
acumulado
Di
114
336
861
1169
1374
1565
1979
2189
Indicador de
seleccin de
la UPE: Zi
369
916
1463
2010
Tcnicas estadsticas
descriptivas
Lugar de Procedencia
Chiclayo
= 1 Lambayeque= 2 N Personas por
Ferreafe = 3 Cajamarca = 4
hogar
Piura
= 5 Otros
=6
1
1
6
1
2
1
1
1
1
2
1
1
3
1
1
2
4
1
1
2
1
3
6
1
4
2
2
3
3
4
3
2
5
2
2
4
5
3
4
4
Edad (aos)
Peso (Kgr.)
Cuenta
42
39
35
41
50
39
33
30
26
32
35
26
43
40
30
46
47
38
38
45
66.6
59
69.2
73
66.3
58.6
67.5
66.1
63.1
55.8
69.1
53.9
64.4
72.2
64.4
68.1
73.2
60.5
66.4
61.9
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
Lugar de
procedencia
N de jefes de
hogar
Proporcin de
jefes de hogar
% de jefes de
hogar
Chiclayo
25
0.625
62.5
Lambayeque
0.175
17.5
Ferreafe
0.075
7.5
Cajamarca
0.05
5.0
Piura
0.025
2.5
Otros
0.050
5.0
Total
40
100
N de Proporcin
hogares de hogares
N
% de Acumulado
hogares
de
hogares
0.0500
5.00
0.1750
17.50
12
0.3000
30.00
10
0.2500
25.00
0.1500
15
6
3
0.0750
7.5
Total
40
1
100
Fuente: Encuesta a hogares, Marzo 2011
%
Acumulado
de
hogares
N
Acumulado
de
hogares
%
Acumulado
de
hogares
5.00
40
100
22.50
38
95
21
52.50
31
77.5
31
77.50
19
47.5
37
92.50
22.5
40
100.00
7.5
m 1 3.322Log(n)
3 Paso: Calcular la amplitud de clase C
R
C
m
Mx.
Clases
IIII
IIIII IIIII II
= 12 = n2
IIIII II
7 = n3
III
3 = n4
Total
4 = n1
16 = n
30
C=5
35
40
45
50
55
Conteo manual
Edad
(aos)
[ 25 - 30)
[30 - 35)
[35 - 40)
[40 - 45)
[45 - 50)
[50 - 55)
Total
=
=
=
=
=
=
n1 = 4
n2 = 10
n3 = 12
n4 = 8
n5 = 4
n6 = 2
n = 40
Edad (aos)
cumulative
lower
25
30
35
40
45
50
percent
10.0
25.0
30.0
20.0
10.0
5.0
40
100.0
frequency percent
4
10.0
14
35.0
26
65.0
34
85.0
38
95.0
40 100.0
N de
jefes Proporcin
de de jefes de
hogar hogar
% de
jefes
de
hogar
N
%
N
%
Acumulado Acumulado Acumulado Acumulado
de jefes de jefes de jefes
de jefes de
de hogar
de hogar
de hogar
hogar
4
10
40
100
0.10
10
[30 - 35)
10
0.25
25
14
35
36
90
[35 - 40)
12
0.30
30
26
65
26
65
[40 - 45)
0.20
20
34
85
14
35
[45 - 50)
0.10
10
38
95
15
[50 - 55)
0.05
40
100
Total
40
100
a
80.0
60.0
70.6
b
% 40.0
20.0
a
b 6.6
a
1.6
Aguadita
San Nicols
General
0.0
Prevalenc.
Incid. Posit.
Indices
Moda
M o LRI
1 C
1 2
Quintiles
in
Fi1 C
qi LRI
fi
Mediana
n
Fi 1 C
2
M e LRI
fi
Deciles
in
Fi 1 C
10
Di LRI
fi
Cuartiles
in
Fi 1 C
Qi LRI
fi
Percentiles
in
Fi 1 C
100
Pi LRI
fi
Moda:
Mo
Moda para
datos
agrupados
Mediana:
Me
Mediana
D1
D9
Coeficiente de asimetra
Desviacin
Estndar
Coeficiente de
correlacin
Coeficiente
de variacin
Coeficiente de curtosis
Ejemplo de Medidas de
resumen de la variable: Edad
(Salida del Excel)
Edad (aos)
Media
37.35
Error tpico
1.080
Mediana
Moda
Desviacin estndar
36.5
35
6.833
Varianza de la muestra
46.695
Curtosis
-0.224
Coeficiente de asimetra
0.315
Rango
29
Mnimo
25
Mximo
54
Suma
Cuenta
1494
40
Nota:
Si utilizamos
tablas y grficos
de frecuencia
adems de las
medidas de
posicin y de
resumen, ya es
posible realizar un
anlisis descriptivo
ANLISIS DE CORRELACIN
Dos variables medidas con escala nominal
Variables dicotmicas
Tipos de Coeficientes
De correlacin
Coeficiente Phi
Coeficiente de Yule
Variables politmicas
Coeficiente de:
. Contingencia
. Cramr
. Kappa
. Lambda
ANLISIS DE CORRELACIN
Coeficiente de correlacin:
. De Spearman
. De Kendall
. Parcial de Kendall
. De Concordancia de Kendall
. De Acuerdo de Kendall
. De Somers
. Gamma
ESTIMACIN DE PARMETROS
Pruebas paramtricas
PRUEBAS DE HIPTESIS
Pruebas no paramtricas
PRUEBAS DE HIPTESIS
Tcnicas paramtricas
Prueba:
. Normal Z
. Chi-cuadrado
. T de Student
Prueba:
. Normal Z
. F de Fisher
. T de Student
Prueba:
. Anova
. De Levene
. De Cochran
.
PRUEBAS DE HIPTESIS
Tcnicas no paramtricas
Prueba
. Chi-cuadrado
. Binomial
. Kolmogorov- S.
. De aleatoriedad
. Del momento
de cambio
Prueba:
. Del cambio de McNemar
. De signos de Wilcoxon
. Le las permutaciones
. De Fisher
. De independencia
. De la mediana
. De Mann-Whitney
. De SidneyTukey
. De Moses
Prueba:
. Q de cochran
. Anlisis de varianza
de Friedman
. De Page
. Ji-C de homogeneidad
. De la mediana Ext.
. Anova de Krusksl-Vallis
. De Jhonckeere
Tcnicas multivariantes
Dependencia
Qu tipo de relaciones
Estn siendo
examinadas
Interdependencia
Es la estructura
de relaciones
entre:
Cuntas variables
Estn prediciendo
o explicando?
Mltiples relaciones de
variables dependientes e
independiente
Varias variables
dependientes en
una relacin nica
Cul es la escala
De medida de las
Var. Dependientes?
Modelo de
Ecuaciones
estructurales
Mtrica
Una variable
dependiente
en una
relacin nica
Cul es la escala
de medida de las
Var. Dependientes?
Cul es la
Escala de
Medida de las
Var. Predictor?
Anlisis de
Correlacin
cannica
Casos
Encuestados
Anlisis
Factorial
Anlisis
Cluster
Objetos
Cmo
son los
atributos?
No mtrica
Mtrica
Mtrica
Variables
Anlisis de
Correlacin
Cannica con
Var. ficticias
No mtrica
Anlisis multivariante
De variables
No
Mtrica
Mtrico
Regresin
mltiple
Anlisis
Discriminante
mltiple
Anlisis
Multidimensional
No
Mtrico
Anlisis de
correspondencias
gracias