Conceptos Elementales

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 11

Capítulo 1

Conceptos elementales

En este primer capítulo vamos a explicar los primeros conceptos elemen-


tales de la estadística descriptiva. Estudiaremos las nociones de población,
muestra y variable. Explicaremos también algunas formas de clasificar las
variables y mencionaremos las escalas de medición que se pueden usar para
cada variable.

Población y muestra
Cotidianamente el término población se usa para referirse a un determinado
grupo de personas o seres vivos. Mediante la siguiente definición ampliaremos
su significado en la estadística: por población entenderemos un conjunto
arbitrario de objetos. Estos objetos deberán tener ciertas características de
acuerdo al estudio que deseemos llevar a cabo.

Una población es un conjunto de personas, objetos o eventos, de los


cuales nos interesa estudiar algunas de sus características.

En un estudio estadístico la población debe especificarse los más completa-


mente posible dependiendo de lo que se desee o se pueda estudiar u obser-
var, y de cómo sea posible medir las características de nuestro interés. Como
ejemplos de posibles poblaciones para algún estudio tenemos los siguientes:
un conjunto de personas mayores a 18 años que son fumadoras, un conjunto
de artículos producidos por una maquinaria, un conjunto de velocidades a

1
2 1. Conceptos elementales

las que viajan automovilistas en un cierto punto de una avenida, un conjunto


de los números de semillas en las naranjas de cierta especie cultivadas en una
región en una cierta temporada, un conjunto de votantes en una elección,
un conjunto de pacientes con una cierta enfermedad, etc. Como puede verse
el concepto de población es realmente muy amplio.

Para un estudio estadístico, además de tener definida una población, es


conveniente establecer también una unidad de observación.

Una unidad de observación es un grupo de elementos de una pobla-


ción, de la cual se tiene, o es posible obtener, su información de manera
conjunta.

Así, las unidades de observación son aquellas personas, objetos, o grupos


de éstos, sobre los cuales es posible obtener información para llevar a cabo
el estudio estadístico. La determinación de la unidad de observación depen-
derá del problema a tratar y de la manera en la que la información pueda
ser obtenida o que esté disponible. Por ejemplo, en un análisis cuantitativo
sobre los resultados de un proceso electoral, la información puede estar dis-
ponible por casillas electorales, y en este caso las casillas electorales (grupos
de votantes) pueden ser consideradas como las unidades de observación. En
contraparte, si el estudio trata acerca de la intención del voto previo a la
elecciones, entonces cada votante puede ser considerado como una unidad
de observación.

Observemos que es posible considerar también a la población en un estudio


como la totalidad de las unidades de observación, sean estas entes indivi-
duales o agrupamientos.

Nos interesa conocer ciertas características de una población y al ejercicio


cuando se llevan a cabo mediciones en toda la población se le llama cen-
so. En este caso el análisis estadístico y sus conclusiones se refieren a la
población completa. Sin embargo, por muy diversas razones (económicas,
técnicas, imposibilidad, etc.) no es posible llevar a cabo mediciones en todos
los elementos de la población, de modo que debemos escoger únicamente
algunos elementos y de éstos obtener sus características. Por ejemplo, si el
3

proceso de control de calidad de ciertos productos involucra su destrucción


parcial o total, entonces no es razonable aplicar ese proceso a la totalidad de
los productos. Así, a un subconjunto tomado de la población le llamaremos
muestra, y a las mediciones que se hagan o que se tengan de una muestra
les llamaremos datos.

Una muestra es cualquier subconjunto de una población. Al número de


elementos de la muestra se le llama tamaño de la muestra.

Población Muestra

Figura 1.1: Una muestra es un subconjunto de una población.

Observemos que en el caso de un censo, la muestra está compuesta por la


totalidad de la población. Además, si se concibe a la población como la to-
talidad de las unidades de información, entonces un muestra es cualquier
colección de unidades de información.

En la Figura 1.1 se presenta de manera gráfica y simple la noción de mues-


tra como un subconjunto de una población. Regularmente las muestras se
toman mediante un mecanismo azaroso, pero tales procedimientos dependen
de lo que se desee estudiar, de la forma en la que puedan medirse las varia-
bles de interés y de la estructura o agrupación que posea la población como
conjunto. Reservaremos la letra n para denotar el tamaño de una muestra.

Debemos mencionar además que en ocasiones es necesario definir dos o más


poblaciones para llevar a cabo estudios comparativos de ciertas característi-
4 1. Conceptos elementales

cas de interés, o bien obtener dos o más muestras de una misma población.
También puede presentarse la necesidad de incorporar la variable tiempo en
el estudio y estudiar la evolución de una característica a lo largo del tiempo.

Variables y datos

A lo que nos interesa medir y registrar en cada elemento de una población


le llamaremos variable. En general, una variable es una característica que
varía de un elemento a otro de la población.

Una variable es una característica de interés que posee cada elemento


de una población y que podemos medir.

Una variable también puede considerarse como una pregunta que se le hace a
cada elemento de la población, produciendo una respuesta en cada caso. Por
ejemplo, en una población humana, podemos considerar la variable (pregun-
ta) ¿Usted fuma? y obtener como respuesta “si” o “no”. Para una población
compuesta por un conjunto de tornillos podemos considerar la variable (pre-
gunta) “Longitud del tornillo” y obtener como resultado de la medición un
valor dentro del intervalo p0cm, 5cmq, por ejemplo.

Mediante el término datos se entiende al conjunto de observaciones de


una o varias variables de interés para todos los elementos de una muestra.

Generalmente un conjunto de datos se organiza y almacena en una compu-


tadora en formato de una tabla como la que se muestra en la Tabla 1.1. En
esta tabla cada renglón representa una observación. En este caso tenemos a
5 personas para quienes se han registrado cuatro variables: edad, sexo, peso
en kilogramos y estatura en centímetros.
5

Núm. Edad Sexo Peso (kg.) Estatura (cm.)


1 25 M 65 170
2 30 F 60 160
3 27 F 55 168
4 23 M 70 173
5 25 F 63 165

Tabla 1.1: Ejemplo de información tabulada.

De acuerdo al tipo de posibles respuestas que se obtengan es que las variables


se pueden clasificar en varios tipos. Estudiaremos esto en la siguiente sección.

Clasificación de variables
Una primera clasificación de variables establece que éstas pueden ser cuan-
titativas o cualitativas. Como estos nombres lo indican, la primera se refiere
a una cantidad mientras que la segunda se refiere a una cualidad.

Una variable es cuantitativa si sus valores son números y representan


una cantidad.

Por ejemplo, el número de hijos en una familia, la longitud de un tornillo, la


cantidad de desperfectos de un artículo o el número de años cumplidos son
ejemplos de variables cuantitativas.

Una variable es cualitativa si sus valores representan una cualidad, un


atributo o una categoría. Se les llama también variables categóricas.

Por ejemplo, la religión de una persona, su sexo, o su preferencia por algún


candidato en un proceso de elección son variables cualitativas pues sus va-
lores son atributos de las personas. El lugar de nacimiento de una persona
es otro ejemplo de variable cualitativa o categórica.

Observe que se pueden usar números para etiquetar los valores de una varia-
6 1. Conceptos elementales

ble cualitativa pero éstos no representan cantidades sino que se usan dichos
símbolos para denotar alguna cualidad. Por ejemplo, para clasificar la cali-
dad de un producto se pueden usar los símbolos: 2 (bueno), 1 (regular), 0
(malo). En este caso los símbolos numéricos se usan para clasificar la calidad
de un producto y no se trata realmente de valores numéricos.

Regresemos a las variables cuantitativas, éstas pueden clasificarse, además,


en dos categorías de acuerdo al tipo de valores que toman, pueden ser dis-
cretas o continuas. Véase la Figura 1.2.

cualitativa

Variable discreta

cuantitativa

continua

Figura 1.2: Clasificación de variables.

Una variable cuantitativa es discreta si el conjunto de todos sus po-


sibles valores tiene un número finito de elementos, o bien es infinito,
pero se pueden numerar uno por uno de acuerdo al conjunto de número
naturales.

Por ejemplo, la colección t0, 1, 2, . . . , 120u puede ser el conjunto de valores


de una variable cuantitativa discreta pues este conjunto tiene un número
finito de elementos. Puede corresponder al número de hijos de una persona
o el número de años promedio que le quedan por vivir a una persona.

Como otro ejemplo tenemos el conjunto t0, 1, 2, . . .u, que aunque es infinito
7

es discreto puesto que claramente sus elementos se pueden numerar uno por
uno de acuerdo al conjunto de números naturales. Los elementos de este
conjunto pueden representar el número aproximado de cigarrillos que una
persona fumadora ha consumido en toda su vida hasta el momento del es-
tudio.

Una variable cuantitativa es continua si puede tomar todos los valores


dentro de un intervalo pa, bq de números reales y no toma valores aislados.

Por ejemplo, el tiempo que le toma a una persona llegar a su lugar de trabajo
o escuela puede tomar valores continuos en el intervalo p0, 8q. Más general-
mente, el tiempo que le toma a una persona completar una cierta actividad
puede tomar este conjunto de valores.

Pueden existir variables cuantitativas cuyos valores son todos los números
dentro de un intervalo pa, bq y además algunos otros puntos aislados fuera de
este intervalo. Estas variables se llaman mixtas, sin embargo, por simplicidad
no las consideraremos. Supondremos que nuestras variables cuantitativas son
únicamente de dos tipos: discretas o continuas.

Finalmente mencionaremos que a una variable que puede tomar únicamente


dos valores se le llama variable dicotómica. Este término se aplica tanto
para variables cualitativas como cuantitativas. Por ejemplo, el sexo de una
persona es una variable dicotómica pues puede tomar los valores masculino
o femenino.

Escalas de medición
De acuerdo al tipo de valores que pueden tomar las variables, se pueden
clasificar éstas de la siguiente manera. Para las variables cualitativas, las
escalas de medición pueden ser de dos tipos: nominal u ordinal, mientras
que las variables cuantitativas pueden medirse usando dos tipos de escalas:
de intervalo o de razón. Explicaremos a continuación cada una de estas
escalas. Empezaremos con el caso de las variables cualitativas.
8 1. Conceptos elementales

Se dice que una variable cualitativa se mide mediante una escala no-
minal, o es de tipo nominal, si sus valores son etiquetas o atributos y
no existe un orden entre ellos.

Por ejemplo, si nos interesa estudiar la variable cualitativa “sexo” en una


población humana, sus dos posibles valores son: Masculino y Femenino. Es-
tos dos valores son etiquetas, no existe un orden entre ellos y por lo tanto
se trata de una variable de tipo nominal. Por otro lado, la variable cualita-
tiva “Nacionalidad” también es un ejemplo de una variable de tipo nominal
pues sus posibles valores: Argentina, Española, etc. son atributos y no existe
un orden entre ellos. Por simplicidad consideramos en este ejemplo que ca-
da persona tiene una única nacionalidad principal. Como un tercer ejemplo
considere la variable cualitativa “religión”, sus posibles valores son: Budista,
Musulmana, Católica, etc. y es claro que corresponde a una variable de tipo
nominal pues no hay ningún orden natural entre estos valores.

Veamos ahora la definición de la escala ordinal.

Se dice que una variable cualitativa se mide mediante una escala or-
dinal, o es de tipo ordinal, si sus valores son etiquetas o atributos pero
existe un cierto orden entre ellos.

Por ejemplo, podemos considerar que la variable cualitativa “estado en el


que se encuentra un artículo” tiene como posibles valores: Malo, Regular y
Bueno. Es claro que estos valores son atributos de un artículo y que existe
un cierto orden entre estos valores, por lo tanto, se trata de una variable de
tipo ordinal.

Como un segundo ejemplo considere las siguientes calificaciones finales para


un alumno en un curso: No Acreditado (NA), Suficiente (S), Bien (B) y
Muy Bien (MB). Estos valores son etiquetas pero es claro que existe un
orden entre estos valores, los hemos escrito en orden ascendente. Por lo
tanto, esta variable, medida en el sentido indicado, es un ejemplo de una
variable cualitativa de tipo ordinal.
9

Escala
nomimal
Variable
cualitativa
Escala
ordinal

Figura 1.3: Escalas de medición para variables cualitativas.

En la Figura 1.3 se muestran gráficamente los dos tipos de escala que se


usan para variables cualitativas: nominal y ordinal. Observe la contención
de conjuntos que se muestra en esta figura. Esta contención significa que
toda variable de tipo ordinal puede considerarse como una variable de tipo
nominal, ello se logra cuando no se contempla o se ignora el orden entre los
valores de la variable. La consideración contraria, sin embargo, no es posible:
sin información o hipótesis adicionales, no es posible crear un orden entre
los valores de una variable de tipo nominal. En la sección de ejercicios se
encuentran algunos otros ejemplos de variables cualitativas con escalas de
medición nominal y ordinal.

Ahora consideraremos el caso de variables cuantitativas. Recordemos que


éstas pueden ser discretas o continuas, sin embargo, en las siguientes defini-
ciones no hay ninguna distinción a este respecto, son las mismas en ambos
casos. También recordemos que los valores de una variable cuantitativa son
números, y por lo tanto existe ya un orden entre estos valores. Agregaremos
ahora algunas condiciones adicionales a los valores numéricos de una variable
cuantitativa para definir dos nuevos tipos de escalas de medición: la escala
de intervalo y la escala de razón. Véase la Figura 1.4 en donde se muestra
la relación general que guardan estos dos tipos de escalas. Veamos primero
la definición de escala de intervalo.
10 1. Conceptos elementales

Se dice que una variable cuantitativa se mide mediante una escala de


intervalo si existe una noción de distancia entre los valores de la va-
riable, aunque no se pueden realizar operaciones numéricas y no existe
necesariamente el valor natural cero.

De esta manera no sólo la relación de orden entre los valores de una variable
cuantitativa, sino que dados cualesquiera dos de sus valores podemos saber la
distancia entre ellos. Por ejemplo, la escala Celsius (o Fahrenheit) para medir
la temperatura es de tipo intervalo, pues existe una noción de distancia entre
dos temperaturas, pero claramente no existe el valor cero natural o absoluto
(el cero depende de la escala que se use, la temperatura 0˝ C no es la misma
que 0˝ F). Ahora veamos la definición de escala de razón.

Se dice que una variable cuantitativa se mide mediante una escala de


razón si los valores de la variable tienen un sentido físico y existe el cero
absoluto.

Por ejemplo, la variable cuantitativa (discreta) “edad en años cumplidos de


una persona” tiene como posibles valores: 0,1,. . . ,150. Por cuestiones de fini-
tud hemos considerado una edad máxima posible de 150 años. Es claro que
puede considerarse que esta variable puede medirse mediante una escala de
razón pues la variable puede tomar el valor cero absoluto y existe la noción
física del lapso de 1 año entre un valor y el siguiente en esta escala de me-
dición.

Como un segundo ejemplo considere la variable cuantitativa (podemos su-


poner discreta) “peso” de un bebé al nacer. Puesto que siempre existe una
precisión finita con la que se efectúan las mediciones, podemos considerar
que el conjunto de valores de esta variable cuantitativa es un conjunto con
un número finito de elementos y puede considerarse que el valor cero está
incluido. Esta variable entonces se puede medir mediante una escala de ra-
zón.
11

Escala
de intervalo
Variable
cuantitativa
Escala
de razón

Figura 1.4: Escalas de medición para variables cuantitativas.

En la Figura 1.4 se muestran gráficamente los dos tipos de escala que se


usan para variables cuantitativas. Observe nuevamente que también aquí
tenemos una contención de conjuntos. Esta contención significa que toda
variable con escala de medición de tipo razón puede considerarse como una
variable con escala de medición de tipo intervalo, esto se consigue cuando no
se contempla el sentido físico de la variable y/o no existe el cero absoluto.
La consideración contraria no es posible.

Advertencia. Antes de concluir esta sección se debe mencionar que no exis-


te una clasificación única y absoluta para una variable dada. Su tipificación
dependerá del tratamiento y uso que de ella se haga. Tal vez la separación
más fuerte se encuentre entre variables cualitativas y cuantitativas. De las
segundas, por cuestiones de precisión numérica, una variable continua bien
puede considerarse discreta.

Agrupamiento de valores
Para una variable cualitativa cualquiera tenemos una cierta cantidad de ca-
tegorías C1 , C2 , . . . , Ck como sus posibles valores. Estas categorías pueden
agruparse en un número menor de categorías uniendo algunas de las catego-
rías originales. Por otro lado, para variables cuantitativas se pueden agrupar
sus valores en grupos de valores C1 , C2 , . . . , Ck (estamos usando la misma
notación que para el caso de categorías). Estos grupos de valores deben ser

También podría gustarte