0% encontró este documento útil (0 votos)
23 vistas329 páginas

Tesis Doctoral

Descargar como pdf o txt
Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1/ 329

Departamento de Economía Aplicada I

Universidad de Sevilla

MEDIDAS ESTADÍSTICAS DERIVADAS


DE INDICADORES DE DESIGUALDAD

TESIS DOCTORAL

José Enrique Romero García


Sevilla, Marzo de 2015
Departamento de Economía Aplicada I
Universidad de Sevilla

MEDIDAS ESTADÍSTICAS DERIVADAS


DE INDICADORES DE DESIGUALDAD

Trabajo realizado para optar al Grado de


Doctor por la Universidad de Sevilla

Doctorando Director
José Enrique Romero García Dr. Jesús Basulto Santos

Sevilla, Marzo de 2015


“El concepto de desigualdad es, simultáneamente, muy simple y
muy complejo. A cierto nivel, es el más simple de los conceptos y ha
movido a los pueblos con un atractivo directo no superado por ningún
otro. A otro nivel, sin embargo, es una noción extremadamente compleja
que hace muy problemáticos los juicios sobre la desigualdad y, por tanto,
ha sido objeto de investigación para filósofos, estadísticos, teóricos de
la política, sociólogos y economistas.” (Sen, 1973, página. 9)

V
Agradecimientos

Como todo en esta vida, no hay ningún logro alcanzado por un individuo que se
deba en exclusiva a él mismo. Las personas y el entorno que han formado parte
de su vida, actual o pasada, son fundamentales para alcanzar cualquier meta; es
justo agradecerles a ellos su contribución.

En primer lugar, expreso mi gratitud al Doctor Jesús Basulto Santos,


director del trabajo, por su búsqueda incesante de artículos y fuentes históricas.
Sus indicaciones han sido claves para la elaboración del presente trabajo.

Quiero agradecer al Director del Departamento de Economía Aplicada I


por su implicación en la finalización de este trabajo, a los compañeros del
Departamento que me han aportado comentarios y sugerencias, como el profesor
Luis M. Sánchez-Reyes Fernández, y a los de otros departamentos, de la
Universidad de Sevilla y de otras universidades, por sus apoyos constantes.

También quiero mostrar mi agradecimiento al Dr. Javier Gamero Rojas


por su colaboración inestimable en todo momento.

Igualmente quiero expresar mi agradecimiento a mi mujer, hijos,


hermanos, amigos y a toda mi familia, por su cariño y apoyo a lo largo del
tiempo. A mis padres que me han inculcado el valor del esfuerzo, la constancia y
los principios; en especial a mi madre, por sus desvelos continuos y abnegados,
por darlo todo por su familia sin esperar nada a cambio. Su preocupación por los
demás, su fortaleza ante las adversidades, su espíritu de esfuerzo y la búsqueda
del bien de todos, sin perseguir recompensa alguna, son una muestra de los
cimientos que contribuyen a crear un mundo mejor.

Sevilla, Marzo de 2015

VII
ÍNDICE

CAPÍTULO 1 INTRODUCCIÓN 1
1.1. Introducción. Contexto histórico...…………….………………. 3
1.2. Objetivos………………………………………………………… 7
1.3. Organización del trabajo…………………………………………….. 8

PARTE I. PARETO Y LA MEDICIÓN DE LA DESIGUALDAD 11

CAPÍTULO 2 EL ORIGEN DE LA MEDICIÓN DE LA


DESIGUALDAD. PARETO 13
2.1. Introducción.................................………………………………. 15
2.2. La distribución de la renta según Pareto. Modelo de Pareto... 16
2.3. El concepto de Pareto sobre “la disminución de la
desigualdad”……………………………………………………. 34
2.4. Medición alternativa de “la disminución de la
desigualdad”…………………………………………………… 54
2.5. Concepto de desfavorecimiento……………………………….. 58

CAPÍTULO 3 RELACIÓN ENTRE MEJORAS EXPUESTAS EN


ESCRITOS DE PARETO Y TIPOS DE DOMINANCIAS 63
3.1. Introducción…………………………………………………….. 65
3.2. Funciones de evaluación social. Dominancia…………………. 66
3.3. Dominancia Lorenz…………………………………………….. 80
3.4. Dominancia estocástica de primer grado…………………….. 84
3.5. Dominancia estocástica de segundo grado……………………. 91

CAPÍTULO 4 LA DISTRIBUCIÓN PARETO VS LA DISTRIBUCIÓN


PARETO-CUADRÁTICA 101
4.1. Introducción…………………………………………………….. 103
4.2. Algunas propiedades de la distribución de Pareto………….. 104
4.2.1 Única distribución, de soporte infinito, con función de
supervivencia de elasticidad constante. ………………………. 104

IX
ÍNDICE

4.2.2 Única distribución, con soporte infinito, libre de escala…….. 105


4.2.3 Regla del 80/20. ………………………………………………… 110
4.2.4 Propiedad de un solo cruce…………………………………….. 113
4.3. Justificación de la distribución Pareto-cuadrática. …………… 114
4.4. Algunas propiedades de la distribución Pareto-cuadrática…... 141
4.4.1. Funciones de distribución y de densidad. Momentos ..……… 141
4.4.2. Elasticidad…………………………………………………….. 151
4.4.3. Propiedad de un solo cruce…………………………………… 154
4.4.4. Tasa de cambio de la pequeñez de una empresa……………. 155
4.4.5. Aproximación local por la distribución paretiana …………. 157

PARTE II GINI Y LA MEDICIÓN DE LA DESIGUALDAD 163

CAPÍTULO 5 EL ÍNDICE δ DE GINI VS. EL ÍNDICE α DE PARETO 165


5.1. Introducción…………………………………………………….. 167
5.2. Índice δ de Gini para medir la concentración………………… 171
5.3. El índice δ de Gini versus el índice α de Pareto……………... 182
5.4. Diferencias entre los conceptos de la desigualdad de Gini y
Pareto……………………………………………………………... 186

CAPÍTULO 6 LA CONSOLIDACIÓN DE LA MEDIDA DE LA


DESIGUALDAD. GINI 189
6.1. Introducción…………………………………………………….. 191
6.2. Caso de datos no agregados. …………………………………... 196
6.3. Caso de agregación en frecuencias…………………………… 207
6.4. Caso de agregación en intervalos…………………………… 210
6.5. Relación entre la Razón de concentración R de Gini y la
curva de concentración de Lorenz…………………………… 222
6.6. Relación entre R y la diferencia de medias……………………. 231
6.7. Otra formulación del índice R para datos agregados en
frecuencias absolutas………………………………………….. 236

X
ÍNDICE

6.8. Dominancia de Lassalle e índice de desigualdad…………….. 240


6.9. Dominancia de Beaulieu e índice de bienestar……………….. 242

CAPÍTULO 7 MEDIDAS DE LOCALIZACIÓN CENTRAL BASADAS


EN PONDERACIONES DE GINI 261
7.1. Introducción…………………………………………………….. 263
7.2. El índice de Gini y las medias equivalentes como medias
ponderadas…………………………………………………….. 266
7.3. Medidas de localización basadas en medias equivalentes ……. 271
7.4. Simulaciones…………………………………………………….. 277
7.5. Ejemplos aplicados……………………………………………... 278
7.6. Familia uniparamétrica Gλ-medias…………………………… 281
7.7. Simulaciones con una familia de modelos generadores ……... 285
7.7.1 Modelos generadores………………………………………… 285
7.7.2 Simulación……………………………………………………. 287

CAPÍTULO 8 CONCLUSIONES 291


8.1. Introducción……………………………………………………. 293
8.2. Conclusiones de la parte I…………………………………….. 293
8.3. Conclusiones de la parte II…………………………………….. 294

BIBLIOGRAFÍA 299

ANEXOS 307

XI
CAPÍTULO 1

OBJETIVOS Y ESTRUCTURA

1.1. INTRODUCCIÓN. CONTEXTO HISTÓRICO

1.2. OBJETIVOS

1.3. ESTRUCTURA DEL TRABAJO


Capítulo 1 Objetivos y Estructura

1.1. INTRODUCCIÓN. CONTEXTO HISTÓRICO

En el presente trabajo se pretende combinar el análisis de textos originales de


Pareto y Gini sobre desigualdad, con desarrollos estadísticos formales originales
y aplicaciones prácticas realizadas a partir de ellos.

Una mirada a los orígenes de las distintas técnicas y coeficientes para


medir la desigualdad puede ayudarnos a comprender mejor el funcionamiento de
dichas técnicas y a diseñar otras nuevas para medir la propia desigualdad u otras
características de la distribución analizada.

El concepto de desigualdad, tal como indica Sen (1973) es simple y


complejo, a la vez; depende como se defina puede ocurrir que la desigualdad
aumente o disminuya. Nosotros entenderemos por desigualdad la diferencia o
variabilidad entre los valores.

Un avance importante en el desarrollo de las medidas de dispersión,


variabilidad o desigualdad entre caracteres surgieron a finales del siglo XIX y
comienzos del siglo XX, favorecidas por los problemas que planteaba contrastar
empíricamente la teoría de la evolución de las especies de Darwin. En concreto,
el surgimiento de la variabilidad como mecanismo de selección natural.

“La primera condición necesaria para que cualquier proceso de selección


natural pueda iniciarse, en una raza o especie, es la existencia de diferencia
entre sus miembros” (Biométrika, Nº 1, pág. 1, 1901 Editorial: The Scope of
Biometrika.).

Las teorías evolucionistas de Darwin (1809-1882) tuvieron una gran


influencia en los trabajos de su primo Galton (1822-1911), el cual medía la

3
Capítulo 1 Objetivos y Estructura

variación entre observaciones en función de la distancia entre cuartiles y a quien se


le atribuye la ley logarítmico normal.

Weldon (1860-1906), fue nombrado en 1889 profesor titular de la Cátedra


Jodrell de Zoología en el University College de Londres. A Weldon, que había
tenido formación matemática, le pareció muy interesante el enfoque estadístico
iniciado por Galton en sus estudios sobre la evolución. Aunque la medida de la
variación usada por Weldon seguía siendo la distancia entre cuartiles, se propuso
demostrar la evolución Darwiniana por teorías estadísticas; lo que resultó decisivo
para que Karl Pearson (1857-1936) se interesará por estos temas. Pearson ocupaba
la cátedra de Matemáticas Aplicada y Mecánica en el mismo University College
que Weldon.

Pearson quedó impresionado por las posibilidades que, se percató, se abrían


con la aplicación de la estadística al estudio de los fenómenos biológicos de la
herencia y la evolución, y que Galton había iniciado; más allá de sus aplicaciones a
los juegos de azar y al estudio de la física que hasta ese momento habían sido los
campos de aplicación de esta ciencia.

Pearson contribuyó a la solución de estos problemas durante los años 1893-


1901 de una manera asombrosa en cuanto a la cantidad y calidad de sus trabajos.
Uno de sus objetivos fundamentales en esa época fue el desarrollo de una teoría que
arrojase luz sobre la influencia de la selección natural en la variabilidad de los
órganos.

En 1894 Pearson publica un primer documento de la serie que luego se tituló


“Contribuciones Matemáticas a la Teoría de la Evolución”. Introduce el método
de los momentos como medio para ajustar una curva teórica a los datos
experimentales, da la definición de desviación típica, e introduce el símbolo σ
para notarla. En 1895, Pearson publica la memoria sobre “Variación Asimétrica

4
Capítulo 1 Objetivos y Estructura

en Material Homogéneo”, que posteriormente desarrolló en dos suplementos,


uno publicado en 1901 y otro en 1916.

Por otro lado, la desigualdad económica-social ha sido un tema que a lo


largo de los tiempos ha preocupado a filósofos y economistas (Aristóteles,
Platón, Kant, Stuart Mill, …), aunque no se han obtenido expresiones
matemáticas para medirla hasta finales del siglo XIX.

A finales del siglo XIX y principios del XX en diversos países europeos (y


en Estados Unidos) se estaban desarrollando rápidamente técnicas de análisis
estadístico. Hasta cierto punto, en este desarrollo hubo una “especialización” en
diferentes países; así, por ejemplo, en Inglaterra se estaban desarrollando los
campos aplicados a la psicología, biología, ciencias sociales, etc; en Francia y en
Rusia, por otra parte, existían considerables aportaciones con un enfoque más
teórico, y en Italia hubo una escuela de estadísticos aplicados al campo de la
economía y concretamente al campo de las cantidades “macro” de los Estados.
Ni que decir tiene que esta descripción esquemática no tiene vocación de ser
exhaustiva en absoluto.

En este contexto es donde aparecen figuras como las de Pareto, Benini,


Gini, Pietra, etc. que estudian, entre otras temas, la distribución y concentración
de magnitudes relevantes para la macroeconomía (rentas, riqueza de individuos,
tamaño de familias, créditos, …).

Nos vamos a centrar en dos autores, Pareto y Gini; en concreto en sus


indicadores más importantes y obtendremos medidas estadísticas a partir de ellos.
Estos dos autores fueron, sin duda, los más significativos y los indicadores que
elaboraron han perdurado hasta nuestros días.

5
Capítulo 1 Objetivos y Estructura

Nuestro interés por Vilfredo Federico Dámaso Pareto (1848-1923), radica


en que Pareto fue el primer investigador en determinar una expresión analítica
explícita del modelo de probabilidad para el estudio de la distribución de la renta
en una población. Por otro lado, la universalidad de la ley de Pareto se encuentra
en la gran cantidad de fenómenos que siguen una ley paretiana.

Se analizará la relación entre la “mejora” de Pareto y las de Lassalle y


Leroy-Beaulieu. Para entender los planteamientos de Ferdinand Lassalle (1825-
1864) y Pierre Paul Leroy-Beaulieu (1843-1916), es importante reseñar que
Lassalle trabajó y colaboró con Marx, mientras que Leroy-Beaulieu (a quién en
adelante denominaremos solamente como Beaulieu) fue un férreo defensor del
liberalismo económico.
Por su parte, Corrado Gini (1884-1965) es ampliamente conocido en la
práctica actual de la Estadística por el índice de concentración que lleva su
nombre. Sin embargo, aparte de establecer dicha medida, Gini estuvo
considerando otras posibilidades, algunas de ellas relacionadas con las ideas de
Pareto y su ley de distribuciones de rentas.

Nuestro estudio, por lo que respecta a Gini, se centra en dos de sus índices
más conocidos; en concreto, el coeficiente δ, su problemática y sus
implicaciones, que aparece en su artículo “Indici di Concentrazione e di
dipendenza” de 1910 y el índice o razón de concentración de Gini, que aparece
en su artículo “Sulla misura della concentrazione e della variabilità dei
caractteri” de 1914.

Como indica Lambert (2012), aunque en los últimos años han aparecido
muchas expresiones del índice de Gini, parte de las fórmulas originales son
bastante desconocidas y, en este trabajo, se muestran algunas de ellas.

6
Capítulo 1 Objetivos y Estructura

1.2. OBJETIVOS

A partir del análisis de las diferentes acepciones que Pareto utiliza del término
“menor desigualdad”, se establecerá el concepto de desfavorecimiento de un
individuo que tiene un cierto ingreso y el de tasa de cambio de desfavorecimiento
de ese individuo.

Seguidamente se van a relacionar los diferentes criterios de “mejora” que


aparecen en los escritos de Pareto con los criterios actuales de Dominancia u
ordenaciones parciales de distribuciones, y se mostrará la equivalencia entre
ellos.

Utilizaremos una extensión cuadrática a la ley de Pareto para el caso del


tamaño de las empresas. Esta extensión cuadrática, que mejora
considerablemente la relación paretiana, la denominaremos distribución Pareto-
cuadrática.

Daremos algunas propiedades de interés de esta distribución Pareto-


cuadrática y de su distribución truncada, en especial la posibilidad de estudiar el
“nivel de desigualdad” de manera local, en lugar de globalmente como se hace
con la distribución Pareto.

De forma similar al concepto de desfavorecimiento, definiremos el


concepto de “pequeñez” de una empresa y calcularemos la tasa de cambio del
nivel de pequeñez de la empresa.

Dado que, en términos generales, la media aritmética no es un buen


estimador del valor central de una distribución, es de interés encontrar
estimadores muestrales con un mejor comportamiento que la media muestral en
ciertos escenarios. Se construirán, a partir de ciertas expresiones alternativas para

7
Capítulo 1 Objetivos y Estructura

el índice de Gini y de las medias equivalentes, algunos de esos estimadores, los


cuales presentarán diversos niveles de robustez.

1.3. ORGANIZACIÓN DEL TRABAJO

Este trabajo se divide en dos partes, una dedicada a cada uno de los dos autores
anteriormente reseñados, Pareto y Gini. La primera comprende los capítulos 2 al
4, y la segunda los capítulos 5 al 7.

En el capítulo 2 se detallan los razonamientos que llevaron a Pareto a


postular su modelo de distribución de ingresos, se analiza el concepto de lo que
Pareto denomina “disminución de la desigualdad” y la relación entre esa
“mejora” de Pareto y las de Lassalle y Beaulieu, se analiza el procedimiento
alternativo para comparar “desigualdades” que usa Pareto y se establecerá el
concepto de desfavorecimiento.

Las cuantificaciones de las definiciones de “mejora social”, dadas por


Lassalle (menor desigualdad, menor dispersión) y Beaulieu (mejor eficiencia), se
realizarán introduciendo la cuantificación monetaria en los razonamientos de
Pareto.

Pareto pasará de una concepción de mejora basada en la cuantificación de


las cantidades monetarias asignadas a los valores de la distribución, disminución
de la dispersión de los valores (Lassalle), y posición de mejora absoluta de los
valores (Beaulieu), a una concepción basada exclusivamente en la ordenación.

Pareto usa varios procedimientos para medir la desigualdad; entre ellos


uno geométrico y otro basado en las funciones de supervivencia o,
equivalentemente, de distribución, pero no son los únicos. Apoyados en uno de

8
Capítulo 1 Objetivos y Estructura

los procedimientos alternativos para comparar las “desigualdades” de dos


distribuciones, definiremos el nivel de desfavorecimiento de un individuo que
tiene un cierto ingreso y la tasa de cambio de desfavorecimiento de ese individuo
al aumentar su nivel de ingreso.

En el capítulo 3, se mostrará la equivalencia de los diferentes criterios de


“mejora” que aparecen en los escritos de Pareto con los criterios actuales de
ordenaciones parciales o dominancia estocástica de distribuciones que se basan
en las Funciones de Evaluación Social.

Se mostrará que la dominancia de Lorenz coincide con la mejora de


Lassalle. La dominancia estocástica de primer grado con el criterio original de
mejora de Pareto, y la dominancia estocástica de grado dos con el criterio de
mejora de Beaulieu.

Como consecuencia de trabajos de investigación realizados por este


doctorando con un equipo de trabajo de la Universidad de Sevilla, sobre
innovación y competitividad de empresas, al analizar la distribución del número
de trabajadores de las empresas se ha podido comprobar que dicha distribución
no suele seguir una ley paretiana, sino que sigue la ley que hemos denominado
Pareto-cuadrática, y ello independientemente del año y del país investigado. Esta
ley será estudiada en el capítulo 4.

En el capítulo 5 analizamos el trabajo de Gini denominado “Indici di


concentrazione e di dipendenza”, en el que Gini señala la disparidad entre la idea
de "desigualdad" de Pareto y la suya de “concentración”.

En el capítulo 6 mostramos otra formulación del índice de concentración


R de Gini para datos agregados en frecuencias absolutas, una expresión
alternativa a la original dada por Gini. También se probará que un indicador

9
Capítulo 1 Objetivos y Estructura

natural de la desigualdad global de la distribución, siguiendo el criterio de


Lassalle, es el índice de Gini.

Igualmente, en este capítulo, se incluye la conexión entre dominancia de


Beaulieu y Bienestar, en general y en los casos particulares de las distribuciones
de Pareto y Pareto-cuadrática.

En el capítulo 7, basándonos en las ideas de G-media y media equivalente,


se consideran un conjunto de medidas estadísticas definidas usando esquemas de
ponderación relacionados con el índice de desigualdad de Gini.

Haciendo uso del concepto de media equivalente, se define una medida de


localización central que, en ciertas distribuciones simétricas con alta o baja
curtosis, es mejor estimador de la media poblacional, mediante una función de
pérdida cuadrática, que el estimador media muestral.

Para terminar, el capítulo 8 se destinará para un resumen de las


conclusiones, resultados más importantes obtenidos y futuras líneas de
investigación.

10
PARTE I

PARETO Y LA MEDICIÓN DE LA DESIGUALDAD

“Pareto era producto de un sector de la civilización francoitaliana


extraordinariamente alejado de las corrientes de pensamiento inglés y
americano. Dentro de dicho sector, además, su gran figura se levanta casi
aislado. Es imposible encasillarle. No rindió culto a “ismo” alguno, y
ningún credo o partido puede reclamarle como suyo, aun cuando muchas
veces unos y otros se hayan apropiado fragmentos de ese vasto campo
intelectual que fue su dominio”. Schumpeter (1949, página 160)
CAPÍTULO 2

EL ORIGEN DE LA MEDICIÓN DE LA
DESIGUALDAD. PARETO

2.1. INTRODUCCIÓN

2.2. LA DISTRIBUCIÓN DE LA RENTA SEGÚN PARETO.


MODELO DE PARETO

2.3. EL CONCEPTO DE PARETO SOBRE


“LA DISMINUCIÓN DE LA DESIGUALDAD”

2.4. INTERPRETACIÓN ALTERNATIVA DE


“LA DISMINUCIÓN DE LA DESIGUALDAD”

2.5. CONCEPTO DE DESFAVORECIMIENTO


Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

2.1. INTRODUCCIÓN

Pareto investigó el equivalente a lo que hoy en día denominamos las


declaraciones del impuesto de la renta de los contribuyentes en varios países, con
organizaciones económicas diferentes y en distintos períodos de tiempo, y
observó que, a partir de determinados ingresos, los puntos del plano cuyas
coordenadas eran los logaritmos de los ingresos y los logaritmos de los números
de individuos con rentas superiores a ellos se distribuían sobre una línea recta.

Esto le llevó a proponer una ley que explicaba el fenómeno de la


distribución de la renta en su cola de la derecha, por dos razones: una, que no se
deben usar las rentas pequeñas, porque son fáciles de disimular ante hacienda;
dos, porque las estadísticas de su época solo reflejaban los ingresos de los
contribuyentes efectivos; es decir, aquellos que superaban unos niveles mínimos
de renta.

Pareto, como hemos indicado anteriormente, se preocupó de modelizar la


parte alta de dicha de distribución de renta. Posteriormente, otros autores han
usado otras funciones de probabilidad como la Lognormal, la Gamma, la
Weibull, etc; u otras funciones no de probabilidad, como la curva de Lorenz y la
curva de Lorenz generalizada para analizar la distribución de la renta en todo su
conjunto; e incluso se han empleado distintos indicadores numéricos, entre los
que destaca el índice de Gini, que analizaremos en capítulos siguientes, para
estudiar características asociadas a la distribución.

En el apartado 2, se detallan los razonamientos que llevaron a Pareto a


postular su modelo de distribución de ingresos.

15
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

En el apartado 3, se analiza el concepto de lo que Pareto denomina


“disminución de la desigualdad” y la relación entre esa “mejora” de Pareto y las
de Lassalle y Beaulieu.

En el apartado 4, se analiza un procedimiento alternativo para comparar


“desigualdades” que usa Pareto.

Por último, en el apartado 5, se establecerá el concepto de


desfavorecimiento, que será ampliado posteriormente en el capítulo 4.

2.2. LA DISTRIBUCIÓN DE LA RENTA SEGÚN PARETO. MODELO DE


PARETO

Pasamos a continuación a detallar los razonamientos que llevaron a Pareto a


postular su modelo. Las leyes propuestas por Pareto para la distribución de la
renta fueron publicadas en dos de sus libros: Cours d’Économie politique. Tomo
II (1897), y Manuel d’Economie politique (1909).

Pareto (1897), Figura 2.1, en su Cours D'Economie politique, Apartado


957, pag 304, expone que el reparto de la riqueza puede depender de la propia
naturaleza humana, de la organización social o del azar.

Figura 2.1: Pareto, 1897, Apartado 957, pag 304

16
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

Continúa diciendo, Figura 2.2, que va a intentar averiguar cuál es la


verdadera causa del reparto de la riqueza; y que, si este reparto de riqueza, varía
poco entre ciudades, épocas y organizaciones sociales diferentes, ello quiere
decir que es debido a la propia naturaleza humana.

Figura 2.2: Pareto, 1897, Apartado 957, pag 304

¿Pero qué quiere decir Pareto con que la naturaleza del hombre es la causa
de ese fenómeno?. ¿Se está refiriendo a la relación logarítmica?.

Es cierto que muchos fenómenos relacionados con la naturaleza, humana y


no humana, siguen una ley logarítmica. Nosotros pensamos que la forma del
reparto de la riqueza es un caso particular que surge a partir de las propiedades de
la función logarítmica.

Así, hay muchos sucesos que no tienen nada que ver con la naturaleza
humana y que siguen una ley paretiana, tales como la intensidad de las
llamaradas solares o el diámetro de los cráteres de la luna; otros muchos, aunque
humanos, no tienen nada que ver con la distribución de la renta: la frecuencia de

17
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

las palabras usadas, el número de citas recibidas por artículos científicos, la


intensidad de las guerras, el tamaño de las ciudades, etc.

Por otra parte, como se ha indicado anteriormente, existen otras


distribuciones, diferentes a la Pareto, que representan bien a la distribuciones de
la renta; por ejemplo, la Lognormal (Gibrat, 1931), la Doble-potencial (Fréchet,
1939), la Fisk o Log-logística (Fisk, 1961), la Gamma (Salem y Mount,1974) y la
Weibull (Bartles y Metelel, 1975).

Análogamente, hay otras distribuciones, también diferentes a la Pareto,


que reflejan el comportamiento de otros fenómenos humanos, tales como la
Exponencial. Por ejemplo, el nº de entradas en las libretas de direcciones de
email (Newman, Forrest y Balthrop, 2002)

Todas estas distribuciones tienen en común que la función logarítmica está


implícita en ellas de alguna manera.

La explicación de por qué la ley logarítmica está subyacente en tales


fenómenos hay que buscarlas en causas diversas:

• Ley de Proporcionalidad: Muchas variables cuyo valor mínimo es


el cero, poseen escalas proporcionales (multiplicativas) en lugar de
escalas de intervalos (aditivas). Así, la problemática de una
empresa de 30 trabajadores es más parecida a la de una empresa de
300 que a la de una empresa de 1 trabajador; ello, a pesar de estar
“más cerca intervalarmente” el valor 30 de 1 que de 300. Es decir,
la relación es proporcional y no es de intervalo. Digamos que, en
estos casos, 30 es “más parecido” a 300 que a 1.

18
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

Estas distribuciones suelen tener sesgo positivo y dado que la


función logarítmica comprime las escalas en valores grandes y la
expande para los valores pequeños, consigue dotar de cierta
regularidad a la nueva escala, regularidad que somos capaces de
detectar.

Cierto es que hay otras transformaciones que comprimen las escalas


en valores grandes y la expanden en valores pequeños, pero lo que
verdaderamente caracteriza a la función logarítmica es que
transforma relaciones multiplicativas en relaciones aditivas,
permitiendo usar la ley Normal.

• Modelización por ecuaciones diferenciales: La evolución de


muchos fenómenos pueden modelizarse por ecuaciones
diferenciales en cuyas soluciones aparece la función logarítmica.
En concreto, la ley paretiana aparece cuando, dada un valor x de
variable X, la variación de una magnitud, f(x), dependiente de ella,
df(x), es proporcional al valor de la magnitud en el momento de
producirse el cambio, f(x), y a la variación experimentada por la
variable X, e inversamente proporcional a dicho valor x de la
variable:

1 df ( x) dx
df ( x) = kf ( x) dx → =k →
x f ( x) x

∫ ∫
 df ( x)  1
 =k dx → Lnf ( x) = kLn( x) + a
 f ( x )  x

Igualmente, hay diversos mecanismos que pueden explicar la aparición de las


distribuciones paretianas (Kleiber y Kotz, 2003; Newman, 2006; Basulto y
Arribas, 2012).

19
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

Siguiendo con los razonamientos de Pareto, sea N x c el número de


contribuyentes de un país, con renta igual o superior a la renta x . Pareto (Cours,
apartado 958, pag 304 y 305), Figura 2.3 a Figura 2.5, observó que, para valores

( )
grandes de la renta, si representamos en el eje de ordenadas los log N x c , y en

el eje de abscisa los log ( x ) , entonces la gráfica de esos puntos es, prácticamente,

una línea recta con pendiente negativa, digamos −α . Es decir, que la ecuación
de esta recta puede ser representada por:

log N x c = C − α log x

En efecto, Pareto escribió:

Figura 2.3: Pareto, 1897, Apartado 958, pag 304

Y continúa en la página siguiente:

20
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

Figura 2.4: Pareto, 1897, Apartado 958, pag 305

21
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

Figura 2.5: Pareto, 1897, Apartado 958, pag 305

Ahora, si hacemos C=log(A), entonces nos queda

( )
log N x c = log ( A) − α log ( x ) , de donde podemos expresar:

A
N xc = α
= Ax −α ∝ x −α , A > 0, x ≥ h, α > 1, h > 0 (2.1)
x

Que representa el modelo de la distribución o reparto de la renta llamado


Modelo de Pareto, donde h suele tomarse como la renta mínima obtenida
empíricamente, a partir de la cual se verifica esa igualdad. Verdaderamente, basta
con que el parámetro α cumpla la condición α > 0 ; el poner α > 1 es para que
exista la media.

En concreto, Figura 2.6, Pareto escribió:

22
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

Figura 2.6: Pareto, 1897, Apartado 958, pag 306

La distribución de Pareto también es llamada distribución potencial o ley


de potencia con soporte infinito.

Pareto, Figura 2.7, Cours Apartado 959, pag 310, afirmaba, como ya
señalábamos anteriormente, que no se debían usar las rentas pequeñas, porque
son muy fáciles de disimular ante el fisco:

Figura 2.7: Pareto, 1897, Apartado 959, pag 310

Nosotros añadiremos que no es aconsejable usar valores pequeños porque


en ellos la función logarítmica se distorsiona mucho.

23
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

Pareto observó que la forma de la curva variaba poco en el tiempo; así,


Figura 2.8, para Bâle obtuvo los siguientes resultados:

Figura 2.8: Pareto, 1897, Apartado 959, pag 310

Ahora, Figura 2.9 y Figura 2.10, hace comparaciones para diversos países:

Figura 2.9: Pareto, 1897, Apartado 959, pag 311

24
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

Figura 2.10: Pareto, 1897, Apartado 959, pag 312

En los casos anteriores, analizados por Pareto, los valores de α eran muy
estables, variaban entre un mínimo de 1.13 y un máximo de 1.89. Esto indujo a
Pareto (Cours d’Économie politique. Tomo II, 1897, Apartado 960, pag 312) a
decir, Figura 2.11, que la distribución de la riqueza variaba poco en situaciones
económicas o épocas diferentes:

Figura 2.11: Pareto, 1897, Apartado 960, pag 312

Es en este momento, Figura 2.12, cuando Pareto, al referirse a lo que


contará más adelante en el apartado 965, comete su primera imprecisión:

25
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

Figura 2.12: Pareto, 1897, Apartado 960, pag 312

Como veremos en el siguiente apartado, la disminución de α lo que


produce es una “mejora” de la distribución, en el sentido que se indicará en un
momento posterior de este trabajo, pero no una “disminución de la desigualdad”
como Pareto indica en su texto. Por el contrario, la disminución de α produce
un aumento de la desigualdad en el sentido de dispersión relativa.

Obsérvese que el parámetro α tiene que ver con la dispersión. De hecho,


al disminuir α aumenta la dispersión, tal como se muestra en las gráficas de las
funciones de supervivencia de las distribuciones P1 ∼ P(α = 3, h = 2) y
P2 ∼ P(α = 9, h = 2) , Figura 2.13:

Funciones de Supervivencia de distribuc. paretianas

1,2

0,8

Sup. de P(3,2)
0,6
Sup. De P(9,2)

0,4

0,2

0
0 2 4 6 8 10 12 14

Figura 2.13: P1 ∼ P(α = 3, h = 2); P2 ∼ P (α = 9, h = 2)

26
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

A mayor valor de α , se obtiene una mayor acumulación de densidades de


frecuencia en las proximidades del valor mínimo h; es decir, menos dispersión
relativa. En concreto, a mayor α , menor es la proporción de personas que
alcanzan niveles altos de renta.

La representación gráfica de la curva dada por Pareto para la distribución


de la renta aparece en la pág 313 de su Cours, Tomo II, Figura 2.14 y Figura
2.15:

Figura 2.14: Pareto, 1897, Apartado 961, pag 313

Figura 2.15: Pareto, 1897, Apartado 961, pag 313

En la página 314 indica el por qué hasta ahora no se había observado, a su


parecer, que las curvas de rentas son estables a cambios geográficos. Así, señala
que todavía no se había dado una expresión analítica a ella, lo que ha impedido

27
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

observar que dicha curva de rentas es poco diferente de unos países a otros.
Pareto añade que hay algunos autores que opinan que la curva de rentas no tiene
un corte tan pronunciado en la parte inicial, Figura 2.16 y Figura 2.17:

Figura 2.16: Pareto, 1897, Apartado 961, pag 314

Figura 2.17: Pareto, 1897, Apartado 961, pag 314

Pero insiste, Figura 2.18, en que toda persona, por pobre que sea, tiene que
tener un ingreso mínimo que le permita vivir, ya sea por el fruto de su trabajo,
entregado por alguna entidad benéfica o de cualquier otra manera, y opina que la
curva que mejor se adapta a las distribuciones de la renta analizadas era la
propuesta por él:

28
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

Figura 2.18: Pareto, 1897, Apartado 961, pag 315

Pareto indicó, Figura 2.19, como hemos señalado anteriormente, que su


fórmula de la distribución de la renta era válida únicamente para la parte derecha
de la distribución de la renta y que, además, era sólo una primera aproximación
para toda la distribución. (pag 316, apartado 963):

Figura 2.19: Pareto, 1897, Apartado 963, pag 316

29
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

Pareto descubrió, como hemos indicado, que, para rentas suficientemente


altas, la nube de puntos se ajustaba casi perfectamente a una función de tipo
potencial, concretamente hiperbólica.

Existen diversas explicaciones sobre la razón de la asimetría a la derecha


en el modelo de la distribución de los ingresos:

• Las habilidades propias de las personas, decía Pareto.


Aquellos con grandes habilidades tenderán a ubicarse en una
determinada posición en la sociedad y obstaculizarán la redistribución
de los ingresos. Digamos que aquellos que realmente están en
disposición de cambiar las cosas porque tienen el poder y ocupan una
posición elevada en las estructuras organizativas no tienen interés en
cambiar esa situación.

• La riqueza presenta un efecto acumulativo; de manera que a


mayor nivel de ingreso, mayor probabilidad de incrementarlo. Sólo las
personas que poseen un cierto nivel de ingreso mayor a un ingreso
mínimo están en condiciones de multiplicar los ingresos. Podríamos
decir que para que una persona prospere en una sociedad basta con
darle un pequeño impulso inicial. (Red, 2000)

• Nosotros aportamos la que hemos denominamos “Ley de


Proporcionalidad” que hemos detallado anteriormente.

En lo que sigue de este apartado, vamos a formalizar algunas expresiones


conocidas de la distribución paretiana.

30
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

Si notamos N hc al nº total de contribuyentes (individuos con renta superior


a la renta mínima h), tendremos que la proporción de individuos con rentas
inferior a x viene dada por:

Nx N hc − N xc N xc Ax −α
F ( x) = = = 1 − = 1 −
Nhc N hc N hc N hc
Es decir:
Ax −α
F ( x) = 1 − (2.2)
N hc

Ah −α
Ahora, dado que F(h) = 0, se tiene que F(h) = 1− = 0 , luego:
N hc

N hc
A = −α = N h c hα (2.3)
h

Por tanto, sustituyendo (2.3) en (2.1):


A
N xc = α
= N h c hα x −α
x

Por consiguiente:

α
N c h
S ( x) = x c = hα x −α =  
Nh  x
Y sustituyendo (2.3) en (2.2) se tiene que, dada la renta mínima, un valor h
positivo, la función de distribución F ( x ) de la variable aleatoria X de Pareto,

también denominado modelo I de Pareto o ley de Pareto tipo I, viene definida


por:

31
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

  h α
1 − x ≥ h > 0, α > 0
F ( x ) =   x  (2.4)
0 en 0, h
 [ )

Y la función de supervivencia S ( x) se expresa en la forma:


α
h
S ( x) =   (2.5)
 x

De donde, operando fácilmente, y representando por CV, CA, CC e IG al,


coeficiente de variación, coeficiente de asimetría de Fisher, coeficiente de
curtosis de Fisher e índice de desigualad de Gini, respectivamente, se obtienen
los siguientes resultados bien conocidos:
α ⋅ hα
f ( x) = ,x > h
xα +1
1
Me X = h ⋅ 2 α

αh
E[X ] = ,α > 1
α −1
α h2
E  X 2  = ,α > 2
α −2
α hm
E  X m  = ,α > m
α −m
α h2
Var [ X ] = ,α > 2
(α − 1)2 (α − 2 )
1
CV [ X ] = ,α > 2
α (α − 2 )

2 (α + 1) α − 2
CA [ X ] = γ 1 = ,α > 3
α −3 α

CC [ X ] = γ 2 =
(
3 (α − 1) 3α 2 + α + 2 ) ,α > 4
α (α − 3)(α − 4 )

32
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

1
IG [ X ] = ,α > 1
2α − 1

La Ley formulada por Pareto se asentaba sobre la constatación empírica de


sus observaciones, pero tienen que pasar muchos años hasta que Cantelli (1921,
1929), Champernowne (1952, 1953) y Mandelbrot (1960) sientan las bases
probabilísticas de esa ley de Pareto (Kleiber y Kotz, 2003)

Es interesante reseñar la denominada “Ley débil de Pareto”, enunciada


por Maldebrot y reiterada posteriormente por Dagum (1977), que afirma que toda
función de probabilidad que represente una distribución de renta tiene que
converger asintóticamente a la Ley de Pareto. Es decir, se está asumiendo que la
ley que mejor representa la cola derecha de la distribución de ingresos, la
distribución de altos ingresos, es la ley de Pareto.

Es decir, que se ha de cumplir que si X es la variable que representa la


distribución de la renta y S(x) es su función de supervivencia entonces:

S ( x)
lim −α
= 1, α > 0
x→+∞
x (2.6)
 
h

Esta propiedad de convergencia a la Ley de Pareto implica tener una cola


pesada; esto es, que las distribuciones que verifiquen dicha ley han de converger
lentamente a cero cuando la variable renta tiende a infinito; por lo cual han de
tener pocos momentos finitos. Por ello, las distribuciones Lognormal y Gamma,
que poseen momentos finitos de todos los ordenes, convergen rápidamente a cero
y no se ajustan bien a la cola de la distribución.

33
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

Seguidamente, vamos a analizar las reflexiones seguidas por Pareto sobre


cómo “mejorar” una distribución de ingresos y veremos que, en sus escritos,
aparecen los conceptos actuales de dominancia.

2.3. EL CONCEPTO DE PARETO SOBRE “LA DISMINUCIÓN DE LA


DESIGUALDAD”

Como se observará en adelante, Pareto establece su concepto de mejora en base a


la proporción de individuos que superan un umbral de renta y no a partir del
valor en sí de la renta de cada individuo. Es decir, se basa en la ordinalidad más
que en la cardinalidad. Esto se debe a que Pareto, aunque comparte la opinión
sobre la conveniencia de realizar comparaciones interpersonales de utilidad en
cuestiones prácticas, cree que, con rigor científico, no es posible realizarlas.
Pueden hacerse, pero empleando juicios de valor y, por ello, en tal caso, no es
posible obtener de tales comparaciones premisas positivas.

En este sentido, hay que señalar que el propio Bentham, fundamentador


del utilitarismo, en su obra La psicología del hombre económico, pag. 17, indica
que el criterio de la igualdad de las funciones de utilidad como base de las
comparaciones interpersonales de utilidad es vago e inexacto, pero que está más
cerca de la verdad que cualquier otro.

Esta idea sobre las comparaciones interpersonales la expone Pareto


(Cours, Tomo II, pag. 47), Figura 2.20, al hablar de la comparación de las
ofelimidades, donde por ofelimidad entiende las satisfacciones obtenidas de
causas económicas:

34
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

Figura 2.20: Pareto, 1897, Apartado 645, pag 47

Pareto (Cours, Tomo II, pag. 48), Figura 2.21, es de la opinión que solo
entre individuos que no se separan de un tipo medio es posible, en rigor, hacer
comparaciones de bienestar:

Figura 2.21: Pareto, 1897, Apartado 645, pag 48

Pareto, en Cours d’Économie politique. Tomo II (1897), apartado 964,


pag 318, Figura 2.22, hace las siguientes reflexiones sobre el estudio del reparto
de las rentas, reflexiones que, podríamos decir, coinciden esencialmente con lo
actualmente aceptado sobre riqueza, pobreza y desigualdad:

35
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

Figura 2.22: Pareto, 1897, Apartado 964, pag 318

Obsérvese que Pareto ha dicho que la curva MNst representa a una


población con gran desigualdad de las rentas, mientras que la curva mnst
representa a una con muy poca desigualdad. Por consiguiente, dado que en el
primer caso hay valores muy diferentes entre si, mientras que en el segundo caso
los valores tienden a ser parecidos; de momento, la noción de “desigualdad de
rentas” de Pareto parece ser equivalente a la que tomaremos nosotros,
“desigualdad o diferencia entre los valores”, sin ningún contenido ético con
relación a la equidad. Acepción adoptada por Gini (1912) y Kuznets (1953).
Concepto que también entenderemos por dispersión.

De la misma manera, cuando hablemos de “igualdad de rentas”, nos


referiremos al caso en el que todos los individuos tienen los mismos ingresos, el

36
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

ingreso medio, situación opuesta a aquella en la que un individuo lo tiene todo y


los demás no tienen nada.

No obstante, Pareto ha distinguido claramente entre pobreza y


desigualdad. Para él son dos cosas completamente diferentes. Esto va a ser
fundamental para entender más adelante su concepto de “disminución de la
desigualdad”.

Así, podemos decir que Pareto establece una relación de equivalencia


entre las distribuciones paretianas, de manera que dos distribuciones paretianas
son “desigualmente equivalentes” o “equivalentes en desigualdad” sii tienen el
mismo parámetro de forma α , independientemente del parámetro de localización
h. El parámetro de localización h afectará a la media, pero no a la desigualdad, a
la dispersión relativa.

El único parámetro que afecta a la forma de la distribución de Pareto es


α , como queda reflejado en el hecho que tanto el coeficiente de asimetría, como
el de curtosis sólo dependan de α .

Esta relación de equivalencia estará bien definida para el propósito de


comparar las desigualdades según Pareto, pues la distribución truncada de una
Pareto vuelve a ser, como veremos seguidamente, otra distribución de Pareto,
con el mismo α , pero con distinto h.

En efecto, sea X ∼ P(α , h) . Sea X* la distribución de X truncada para

valores x ≥ h* > h ; entonces, veremos que X * ∼ P (α , h*) .

Como la función de supervivencia de X* es:

37
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

S X ( x) 1 − FX ( x)
S X * ( x) = =
S X (h*) 1 − FX (h*)

La función de distribución de la variable X* será:

S X ( x) 1 − FX ( x) FX ( x) − FX (h*)
FX * ( x) = 1 − S X * ( x) = 1 − = 1− =
S X (h*) 1 − FX (h*) 1 − FX (h*)

Luego, la función de distribución de la variable X*, viene dada por:

 FX ( x) − FX (h*)
 x ≥ h*
FX * ( x ) =  1 − FX (h*) (2.7)
0 en [ 0, h *)

Pero,
  h α    h α  α α
1 −    − 1 −     h  −  h 
FX ( x) − FX (h*)   x     h *    h *   x 
α
 h*
= = α
= 1−  
1 − FX (h*)   h α   h   x 
1 − 1 −     
   h*
  h* 

Luego, X * ∼ P (α , h*) .

A continuación, Figura 2.23, se muestran las gráficas de una distribución


paretiana P (α = 3, h = 2) y de la distribución truncada en h=4.

38
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

Funciones de Supervivencia de distribuciones paretiana y truncada

Sup. de P(3,2) Sup. truncada de P(3,2) para h*=4


1,2

0,8

0,6

0,4

0,2

0
0 2 4 6 8 10 12 14 16

Figura 2.23: Distribución P (α = 3, h = 2) y truncada en h*=4 .

Ahora Pareto pretende aclarar el concepto de “disminución de la


desigualdad”, Figura 2.24 y Figura 2.25:

Figura 2.24: Pareto, 1897, Apartado 964, pag 318

39
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

Figura 2.25: Pareto, 1897, Apartado 964, pag 319

De la frase anterior parece que, de momento, para Pareto “menor


desigualdad” es menor dispersión relativa y que además, tal como comentó
anteriormente, la desigualdad no depende del primer valor de la distribución, no
depende de h.

Siguiendo la terminología actual, nosotros entenderemos que el concepto


de disminución de la desigualdad representa el de “disminución de la dispersión
relativa”.

Es el concepto de “disminución de la desigualdad” que muestra


posteriormente Pareto, el que sus coetáneos entendieron que no estaba bien
definido; nosotros pensamos que lo que sucede es que no estaba bien expresado
lo que el pretendió decir.

Seguidamente, lo que quiere Pareto es decir qué entiende por “mejora” y,


como justificaremos más adelante, no tiene por qué significar una verdadera
disminución de la desigualdad. Es decir, cuando habla de “disminución de la
desigualdad”, está intentando decir cuándo se produce una situación de “mejora”
en la distribución.

40
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

En lo que sigue, vamos a suponer que las dos distribuciones son del
mismo tamaño; cosa que se puede hacer por el principio de replicación.

Para aclarar su idea de la “disminución de la desigualdad”, mejor


expresado sería decir de “mejora”, Pareto expone la opinión de otros autores, la
de Leroy Beaulieu frente a la de Lassalle; aunque, finalmente, adoptará una
posición diferente a la de ambos. Además, hay que reseñar en este punto, que
tanto Lassalle como Beaulieu incorporan la cuestión ética de la desigualdad.
Estas opiniones son recogidas por Pareto en su Cours, tomo II, pag 319, Figura
2.26.

Para Lassalle:

Figura 2.26: Pareto, 1897, Apartado 964, pag 319

41
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

Es decir, que, para Lassalle, la situación de un grupo o clase de un


colectivo hay que medirlo con relación al resto de ese colectivo en ese instante de
tiempo concreto y no con relación a la situación del grupo en tiempos pasados.

No importa que, por ejemplo, en la actualidad la clase trabajadora tenga


cubierta las necesidades básicas de educación, sanidad, haga viajes de
vacaciones, etc. Por consiguiente, Lassalle está manteniendo una opinión sobre la
“situación relativa” de unos individuos con otros en ese instante de tiempo, en
esa situación concreta; mientras que Leroy Beaulieu dice que importa la
“situación absoluta”, la distancia con respecto al origen.

La mejora de Lassalle es una mejora exclusivamente en igualdad, en


dispersión relativa.

Existen muchas formas de cuantificar la mejora de Lassalle, la mejora en


igualdad, en dispersión relativa, que las rentas inferiores se aproximen a las
superiores.

El primer paso, dadas dos distribuciones iniciales, X e Y, será, tal como


decía Lassalle, eliminar el efecto del contexto en que se encuentre y, para ello,
X Y
consideraremos las distribuciones con relación a su media, e .
x y

Una vez realizado esto, considerar las subpoblaciones formadas por los
individuos más pobres, al igual que hace Pareto.

Ahora, tomaremos el equivalente a lo que hace Pareto pero haciendo uso


de la utilidad e identificando la utilidad del ingreso con el propio ingreso. Es
xi
decir, en lugar de considerar el número de individuos cuyas rentas no superan
x

42
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

un ingreso determinado (criterio de Pareto no usando la utilidad), consideraremos


xi
la utilidad total que les reporta esos ingresos , o la utilidad media de los
x
mismos (Criterio de Pareto usando la utilidad más simple, la función identidad).

El camino para determinar cuál de las dos presenta más igualdad, menos
desigualdad ( y diremos que X es mejor que Y según Lassalle, X ≥ Y ) será el
LAS

de las medias parciales, las utilidades medias, las rentas per capita de cada
X Y
subpoblación relativizada a su propia media; que sean mayores en que en :
x y
j j
x y
∑ xi ∑ yi
i =1 i =1
≥ , ∀j = 1,.., N .
j j
Es decir,

* *
x  y
X ≥ Y sii   ≥   (2.8)
LAS  x i  y i

El Criterio de Lassalle, cuando las rentas relativas inferiores se aproximan a las


rentas relativas superiores, veremos que coincidirá con el Criterio de Lorenz.
Será el llamado Principio de Elección Social.

Así, para Lassalle, en el siguiente ejemplo (Tabla 2.1), la distribución X


sería mejor que la Y; puesto que hay más igualdad aunque vivan peor (lo

podríamos cuantificar de la forma


( xi )* ≥ ( yi )* ):
x y

43
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

( yi )* ( xi )*
yi xi ( yi )
*
( xi ) *

y x
5 4 5 4 0.42857 0.8
10 5 7.5 4.5 0.64286 0.9
20 6 11.67 5 1 1
Tabla 2.1: Ilustración para Lassalle

Obsérvese que, con este criterio, las rentas inferiores se aproximan a las
superiores, pero no tienen por qué mejorar. Incluso la inferior puede empeorar.

Asimismo, Leroy Beaulieu, pag 320, Figura 2.27, según indica Pareto,
también identifica menor desigualdad con menor dispersión:

Figura 2.27: Pareto, 1897, Apartado 964, pag 320

Por tanto, Leroy Beaulieu observa que el progreso de las clases inferiores
ha sido más rápido que el de las otras clases, lo que lleva a una aproximación
(rapprochemet) entre ellas y por consiguiente a una menor desigualdad (moindre
inégalité), a una menor dispersión, parece querer indicar, que la que había
anteriormente, una “menor desigualdad entre las fortunas”, dice en el texto.

Del razonamiento de Leroy Beaulieu sobre Lassalle, parece desprenderse


que para Beaulieu es necesario mirar la situación en la que se encuentra un
colectivo con relación a la situación que tenia en el pasado (medición del
incremento absoluto), hay que mirar la distancia con relación al origen, la
eficiencia de los individuos del colectivo.

44
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

Por tanto, según el criterio de Beaulieu habría primero que considerar las
subpoblaciones formadas por los individuos más pobres, al igual que hace Pareto.

Ahora, al igual que antes, tomaremos el equivalente a lo que hace Pareto


pero haciendo uso de la utilidad e identificando la utilidad del ingreso con el
propio ingreso. Es decir, en lugar de considerar el número de individuos cuyas
rentas no superan un ingreso determinado (criterio de Pareto no usando la
utilidad), consideraremos la utilidad total que les reporta sus ingreso, o la utilidad
media de esos ingresos (criterio de Pareto usando la utilidad).

Así pues, el criterio de Beaulieu lo podemos cuantificar en la siguiente


forma:

Dadas dos distribuciones iniciales, X e Y. Considerar las subpoblaciones


formadas por los individuos más pobres. Diremos que X es mejor que Y según
Beaulieu , X ≥ Y , si se cumple que las medias parciales, las utilidades medias,
BEA

las rentas per cápita de cada subpoblación, son mayores en X que en Y:


j j
∑ xi ∑ yi
i =1 i =1
≥ , ∀j = 1,.., N .
j j
Es decir,

X≥ Y sii xi* ≥ yi* , ∀i = 1,⋯ , N . (2.9)


BEA

El criterio de Beaulieu es un criterio de Mejora de la eficiencia, un Principio de


Elección Económica, que veremos será equivalente al Criterio de la curva de
Lorenz generalizada, que a su vez coincidirá con la Dominancia estocástica de
segundo orden y que, a su vez, coincidirá con el criterio de Shorrocks.

45
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

Así, para Beaulieu, en el siguiente ejemplo (Tabla 2.2), la distribución X


sería mejor que la Y; puesto que se mejoran las eficiencias de los distintos
colectivos acumulados (lo podríamos cuantificar en la forma:

xi* ≥ yi* , ∀i = 1,⋯ , N , que será el criterio de Shorrocks):

yi xi yi* xi*
5 7 5 7
10 9 7.5 8
20 70 11.67 28.67
Tabla 2.2: Ilustración para Beaulieu

Obsérvese que, con este criterio, las rentas de cada clase no tienen por qué
mejorar, que las rentas inferiores no tienen por qué aproximarse a las superiores,
que el individuo más desfavorecido siempre mejora y que, en cada tramo, las
mejoras de las clases inferiores superan a las perdidas de las clases superiores,
supuesto que haya habido perdidas en esas clases superiores (veremos que esto
significará que las curvas de Lorenz generalizadas no se cortan).

Las cuantificaciones de las definiciones de “mejora”, dadas por Lassalle


(menor desigualdad, menor dispersión) y Leroy Beaulieu (mejor eficiencia), las
entenderemos en el sentido que hemos indicado anteriormente.

La cuestión surge con la formalización que da Pareto de “menor


desigualdad” pues, al formalizarla, se queda con una medición no basada en la
cuantificación de los ingresos, en la utilidad de los mismos, sólo en la ordenación
de ellos; una posición diferente a la de Lassalle (criterio relativo), pero también
diferente a la de Beaulieu (criterio absoluto), que sí se basan en la cuantificación
de los ingresos y en una medida de la utilidad de los mismos.

Pareto, Figura 2.28, en lugar de tomar esas definiciones tal cuales, toma
una algo diferente. Pareto afirma:

46
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

Figura 2.28: Pareto, 1897, Apartado 964, pag 320

Y prosigue:

Figura 2.28 bis: Pareto, 1897, Apartado 964, pag 320

Obsérvese que hay un pequeño error en el texto anterior, y que


correctamente tendría que decir:

“En général, lorsque le nombre des personnes ayant un revenu supérieur


(“inférieur” dice por error) à x augmente par rapport au nombre des personnes
ayant un revenu inférieur (“supérieur” dice por error) à x, nous dirons que
l'inégalité des revenus diminue.”

Por tanto, como se verá en el capítulo siguiente, la frase:

47
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

“lorsque le nombre des personnes ayant un revenu supérieur à x


augmente par rapport au nombre des personnes ayant un revenu inférieur à x”

llevará parejo lo que denominaremos mejora por rangos, que conllevará


que las personas en las nuevas condiciones vivan “mejor”, bajo el principio del
anonimato, en términos absolutos, que las personas con las condiciones iniciales,
pero no necesariamente que haya menos desigualdad, menos dispersión, con las
nuevas condiciones que con las iniciales.

Por consiguiente, a partir del capítulo siguiente, cuando se produzca la


situación comentada por Pareto, diremos que se ha producido una “mejora por
rangos” y no una “disminución de la desigualdad”, no una “disminución de la
dispersión”.

Por tanto, Pareto ha pasado de una concepción de mejora basada en la


cuantificación de las utilidades asignadas a los valores, disminución de la
dispersión de los valores (Lassalle), y posición de mejora absoluta de los valores
(Beaulieu), a una concepción basada exclusivamente en la ordenación.

Pareto, al percatarse que su definición no fue muy bien acogida, la


modificó ligeramente e intentó aclararla posteriormente en 1909, en su Manuel,
pag 389, Figura 2.29:

48
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

Figura 2.29: Pareto, 1909, pag 389

Y pone un ejemplo para entenderlo:

Figura 2.30: Pareto, 1909, pag 389

Distinguiendo entre ricos y pobres, Figura 2.31:

49
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

Figura 2.31: Pareto, 1909, pag 390

Ahora indica, Figura 2.32:

Figura 2.32: Pareto, 1909, pag 390

Lo que verdaderamente se produce es una disminución de la


proporción de individuos que están en peores condiciones, en rentas
inferiores. De ahí que, entendemos nosotros, Pareto dijera que se producía
una “disminución de la desigualdad de la proporción de rentas”, porque
disminuían los que se encontraban en condiciones más desfavorables,
digamos “más desiguales”, los más pobres, por así decirlo; aquellos que no
tienen acceso a determinados niveles de ingreso. Por tanto, Pareto está
tomando en este momento una concepción “ética” del término “desigualdad”.

50
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

Es decir, que, en terminología de Pareto, la “desigualdad de la proporción


de las rentas” disminuye cuando el número de personas que tienen una renta
inferior a x disminuye en relación al número de personas que tienen una renta
superior a x. Dicho de otra manera: por “desigualdad de la proporción de las
rentas” o “desigualdad de las rentas” Pareto entiende la relación que exista entre
las funciones de distribución o, lo que es equivalente, entre las funciones de
supervivencia.

Esta última definición de 1897, apartado 965, pag 320, la formaliza a


partir de la función u x , definida por

N xc
ux = ,x>h (2.10)
Nhc

Donde Nxc es el total de individuos con rentas superiores a la renta x, x ≥ h > 0 ,


y Nhc es el total de individuos con rentas mayores o iguales a la renta mínima h.

Por tanto ux da, para cada renta x , la proporción de individuos con renta
mayor que la renta x . Pareto (1897, pag 320) interpreta su definición de
desigualdad diciendo que la desigualdad disminuye cuando el cociente dado por
u x aumenta para todo x > h .

El ejemplo que puso Pareto puede simplificarse en la siguiente Tabla 2.3:

c c
valores A ni Ni Si valores B ni Ni Si
1000 9 1 0.10 1000 1 9 0.9
1000<x<10000 1 0.10 1000<x<10000 9 0.9
10000 1 0 0 10000 9 0 0
Tabla 2.3: Ejemplo de Pareto

51
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

Cuando se produzca este tipo “disminución de desigualdad”, en la


terminología de Pareto, la disminución de los que se encuentran en peores
condiciones, será lo que, en el capítulo siguiente, denominaremos como “una
mejora por rangos de Pareto”, tal como justificaremos en su momento.

Obsérvese que la expresión (2.10) puede ponerse en la forma

N x c N hc − N x N
ux = c = c
= 1 − xc = 1 − F ( x ) (2.11)
Nh Nh Nh

donde F ( x ) es la función de distribución de la variable renta; siendo por tanto

u x la función de supervivencia de dicha variable renta y que denominaremos


desde ahora en adelante S(x).

Es decir, Pareto parte de la función de supervivencia de la variable renta:

α
N xc N h
S ( x) = c = 1 − xc = 1 − F ( x ) =   (2.12)
Nh Nh x

Expresión que coincide con la obtenida al sustituir (2.3) en (2.1).

A menor α , pueden obtener niveles altos de renta una mayor proporción


de individuos; por ello, podemos decir que a menor α “mejor” es esa sociedad,
en el sentido que más individuos alcanzan elevados niveles de renta.

Por consiguiente, podríamos decir que, para Pareto, X es una mejora de


Y, si una vez ordenadas las rentas se produce una mejora en cuanto a que
aumenta la proporción de personas que acceden a rentas superiores:

52
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

Nic ( X ) Nic (Y )
≥ , ∀i = 1,.., n (2.13)
NX NY
En cuyo caso, diremos que se ha producido una mejora de Supervivencia y
pondremos X ≥ S Y .
En esta mejora, que es la mejora que propuso Pareto al decir que se
producía una “disminución de la desigualdad”, lo que verdaderamente se
produce es una disminución de la proporción de individuos que no alcanzan
determinados niveles de renta:

N N
∑ I (xj ≤ t) ∑ I ( yj ≤ t) (2.14)
j =1 j =1
≤ , ∀t > 0
NX NY

De ahí que Pareto dijera, como hemos indicado varias veces, que se producía
una “disminución de la desigualdad”, porque disminuían los que se
encontraban en peores condiciones, en condiciones más desiguales; aquellos
que no tienen acceso a determinados niveles de ingreso.

No obstante, llegados a este punto, es necesario hacer una precisión.


Conviene recordar que Pareto trabaja con las distribuciones que hemos
denominado “desigualmente equivalentes” o “equivalentes en desigualdad”;
por tanto, dadas dos distribuciones X, Y; para comparar la desigualdad
presente en cada una de ellas, no las compara directamente, sino que procede
de la siguiente manera:

i. Sean X ∼ P(α1, h1 ) , Y ∼ P(α 2 , h2 ) . Supongamos, sin pérdida de


generalidad, que h1 ≤ h2 .

ii. Ahora considera la distribución X * ∼ P (α1, h2 ) “equivalente en


desigualdad” a X ∼ P(α1, h1 ) .

53
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

iii. Ahora compara la desigualdad en las distribuciones


X * ∼ P (α1, h2 ) , Y ∼ P(α 2 , h2 ) , que ya tienen el mismo h. Esta
comparación, se reduce a comparar los α .

2.4. MEDICIÓN ALTERNATIVA DE “LA DISMINUCIÓN DE LA


DESIGUALDAD”

Los dos procedimientos usados hasta ahora para medir la desigualdad paretiana,
uno geométrico y otro basado en la comparación de las funciones de
supervivencia o, equivalentemente, de distribución, no son los únicos
procedimientos para comparar “desigualdades” que Pareto usa.

Argumenta Pareto, que solo tratará casos medios y generales (Course,


tomo II, pag 321), Figura 2.33:

Figura 2.33: Pareto, 1897, Apartado 965, pag 321

Y, con relación a los ingresos argumenta, Figura 2.34 y Figura 2.35:

54
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

Figura 2.34: Pareto, 1897, Apartado 965, pag 321

Figura 2.35: Pareto, 1897, Apartado 965, pag 322

Para medir ahora la “disminución de la desigualdad” de las rentas, Pareto


S´( x)
(Cours,tomo II, pag. 321) considera la función , Figura 2.36:
S ( x)

Figura 2.36: Pareto, 1897, Apartado 965, pag 321

Y mediante ella, prueba la proposición enunciada en la página 320, Figura


2.37:

Figura 2.37: Pareto, 1897, Apartado 965, pag 320

55
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

Pero esta proposición puede dar lugar a diversas interpretaciones. Pueden


consultarse los trabajos de Barbut (2003), Basulto y Busto (2010), Basulto, Busto
y Sánchez (2011), entre otros.

Nosotros daremos aquí una interpretación diferente a la dada en los


trabajos previamente citados. Trabajaremos con la distribución de Pareto tipo I,
aunque él lo hacía con la tipo II (más general).

Tendremos en cuenta que, según la interpretación de Pareto, la


desigualdad, varía en el mismo sentido que lo hace α , pues trabaja con lo que
hemos denominado distribuciones “desigualmente equivalentes”. En este sentido,
conviene indicar que si para medir la desigualdad usamos el coeficiente de
variación, el índice δ de Gini o el índice de concentración de Gini (que veremos
en los siguientes capítulos) observamos que solo dependen de α , no dependen
de h, tal como argumentaba Pareto.

Por tanto, y puesto que, además, la media de la distribución de Pareto


αh α
viene dada por la expresión E [ X ] = = δ h, α > 1; δ = , y que esta
α −1 α −1
expresión aumenta al disminuir α , y al aumentar h, es fácil ver que la
proposición formulada por Pareto es cierta en los términos comentados, con la
interpretación de Pareto sobre la disminución de la desigualdad. En concreto, se
cumple:

• Si la desigualdad de las rentas no cambia (es decir si α permanece


constante) y la renta mínima h aumenta, entonces la renta media
aumenta.
• Si la desigualdad de las rentas disminuye (es decir si α disminuye) y
la renta mínima h no cambia, entonces la renta media aumenta.

56
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

• Si la desigualdad de las rentas disminuye (es decir si α disminuye) y


la renta mínima h aumenta, entonces la renta media aumenta.

En la página 322 del Cours, tomo II, Figura 2.38, Pareto comienza a enunciar la
inversa de esa proposición:

Figura 2.38: Pareto, 1897, Apartado 965, pag 322

Que termina de enunciar en la página 323, Figura 2.39:

Figura 2.39: Pareto, 1897, Apartado 965, pag 323

αh α
En concreto, y dado que E [ X ] = = δ h, α > 1; δ = , se cumple que:
α −1 α −1

57
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

• Si la renta media aumenta y la desigualdad de las rentas no cambia


(es decir si α permanece constante), entonces la renta mínima h
aumenta.
• Si la renta media aumenta y la renta mínima h no cambia, entonces
la desigualdad de las rentas disminuye; es decir α disminuye.

Aunque Pareto enuncia estas proposiciones para la denominada ley de


Pareto tipo II, nosotros hemos trabajado con la ley de Pareto tipo I, para seguir
mejor los razonamientos.

2.5. EL CONCEPTO DE DESFAVORECIMIENTO

Basándonos en el procedimiento alternativo para comparar las “desigualdades”


de dos distribuciones comentado en el apartado anterior, podemos considerar
que S ( x) representa el nivel de desfavorecimiento de un individuo que tiene un
ingreso x, puesto que es la proporción entre el nº de individuos en mejor
situación que él y el nº de individuos totales. Por tanto, dS ( x) representa el
dS ( x)
cambio en el desfavorecimiento de un individuo que tiene un ingreso x, y
S ( x)
es la tasa de cambio de desfavorecimiento de ese individuo.

Pareto sólo estudió el equivalente al cambio en el desfavorecimiento, lo


que él denominó “variación de la desigualdad”, cuando cambia la sociedad; es
decir, cuando cambia α y/o cuando cambia la “renta mínima”, h. Nosotros
incorporamos además el cambio en el ingreso del individuo. Por tanto, el cambio
de desfavorecimiento será:

∂S ( x) ∂S ( x) ∂S ( x)
dS ( x) = dx + dh + dα (2.15)
∂x ∂h ∂α

58
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

Y, la tasa de cambio de desfavorecimiento sería:

dS ( x) S ´X ( x) Sh´ ( x) Sα´ ( x)
= dx + dh + dα (2.16)
S ( x) S ( x) S ( x) S ( x)

dS ( x)
Veamos seguidamente como influye cada uno de los términos de en su
S ( x)
evolución.
* Supongamos primero que la sociedad, globalmente considerada no cambia
(h y α permanecen constante) y el individuo modifica su renta.

S ( x + 1) − S ( x)
Obviamente, representa el decremento relativo que
S ( x)
experimenta el nivel de desfavorecimiento, de un individuo cuando pasa de ganar
x a ganar x+1. Pero, dado que
α
α −α h
S ( x) = h x = 
x
Se tendrá que:

S ( x + 1) − S ( x) S X ´( x) −α hα x −α −1 1
≈ = = −α
S ( x) S ( x) hα x −α x
Por consiguiente, la disminución del nivel de desfavorecimiento cuando el
individuo aumenta su renta y pasa al nivel superior, la tasa con la que cambia su
nivel de desfavorecimiento al cambiar su renta, se mide por:

S X ´( x) 1
= −α (2.17)
S ( x) x

Por tanto, fijado el nivel de renta x, a mayor α mayor decremento de la tasa del
nivel de desfavorecimiento al pasar de ese nivel de renta al inmediato superior;

59
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

luego, se puede decir, en ese sentido, que a mayor α , mayor nivel relativo de
desfavorecimiento, de los individuos de la distribución original. Mejor se
encuentra el individuo después del cambio. Más difícil le ha resultado al
individuo pasar del estado inicial al nuevo, más difícil subir ese escalón salarial,
más difícil crecer.

Dicho de otra forma, el nivel de dificultad para crecer, progresar, de un


individuo con un ingreso x, será mayor mientras mayor sea α , y menor,
mientras menor sea α . Por tanto, α puede interpretarse como un indicador para
medir el nivel de dificultad, aversión, contención, obstaculización o freno al
crecimiento de los ingresos de los individuos.

En este sentido, mientras mayor sea α , más difícil progresar en esa


sociedad y esto es, quizás, otro argumento para la afirmación de Pareto de
sociedad “más desigual”. Es decir, que el “más desigual” en la terminología de
Pareto, nosotros lo identificaremos con “más dificultad para progresar”.

Esta interpretación del parámetro α , en el sentido anteriormente descrito,


ya fue mostrada por Sorel (1897) y, se podría decir, que recogida posteriormente
por Basulto y Arribas (2012), aunque con una explicación matemática diferente.

Además, obsérvese que esa disminución, aumento o invariabilidad del


nivel de desfavorecimiento, en los términos anteriormente indicados, solo
depende de α , no depende de h.

* Supongamos ahora que la sociedad varía su denominada “renta mínima”, h;


que no cambia la desigualdad ( α permanecen constante) y tampoco el ingreso
del individuo.

En tal caso, la tasa de desfavorecimiento vendrá dada por

60
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

S h+1 ( x) − Sh ( x) Sh´ ( x) α x −α h −α −1 α
≈ = =
Sh ( x) Sh ( x) x −α hα h

Es decir, la tasa de desfavorecimiento será:

S h´ ( x) α
= (2.18)
S h ( x) h

Luego, fijado el nivel de “renta mínima”, h, a mayor α más aumenta la tasa de


desfavorecimiento. Peor se encuentra el individuo después del cambio.

* Supongamos ahora que en la sociedad varía la desigualdad ( α varía); su


denominada “renta mínima”, h, no cambia y tampoco cambia el ingreso del
individuo.

En tal caso, la tasa de desfavorecimiento vendrá dada por


−α
x x
(−1)   Ln   dα
Sα + dα ( x) − Sα ( x) Sα ( x) ⋅ dα
´
h h  x
≈ = −α
= (−1) Ln   dα
Sα ( x) Sα ( x)  x h
 
h
Es decir, por:

Sα´ ( x) ⋅ dα  x
= (−1) Ln   dα (2.19)
Sα ( x) h

Por tanto, si α crece, la tasa de desfavorecimiento es negativa, luego el


desfavorecimiento se hace menor; es decir es menor ahora que antes del cambio,

61
Capítulo 2 El Origen de la Medición de la Desigualdad. Pareto

luego el individuo mejora (sin cambiar su ingreso x). Y por el contrario, si


α decrece, la tasa de desfavorecimiento es positiva, luego el desfavorecimiento
se hace mayor y, por tanto, el individuo empeora.

62
CAPÍTULO 3

RELACIÓN ENTRE MEJORAS EXPUESTAS EN


ESCRITOS DE PARETO Y TIPOS DE DOMINANCIAS

3.1. INTRODUCCIÓN

3.2. FUNCIONES DE EVALUACIÓN SOCIAL.


DOMINANCIA

3.3. DOMI NANCIA LORENZ

3.4. DOMINANCIA ESTOCÁSTICA DE PRIMER GRADO

3.5. DOMINANCIA ESTOCÁSTICA DE SEGUNDO GRADO


Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

3.1. INTRODUCCIÓN

En el presente capítulo, vamos a relacionar los diferentes criterios de “mejora”


que aparecen en los escritos de Pareto con los criterios actuales de Dominancia u
ordenaciones parciales de distribuciones.

Llevaremos a cabo un breve resumen de las equivalencias de esos criterios


de dominancia y se mostrará la equivalencia con la mejora que aparece en los
escritos de Pareto y que han sido comentadas en el capítulo 2.

En el apartado 2 se definirán las Funciones de Evaluación Social, que se


emplearán para ordenar distribuciones según el bienestar global.

En el apartado 3 se demostrará que la dominancia de Lorenz coincide,


entre otras equivalencias, con la mejora de Lassalle.

En el apartado 4 se mostrará igualmente que la dominancia estocástica de


primer grado coincide con el criterio original de mejora de Pareto.

En el apartado 5 se expondrá la equivalencia, entre otras, de la


dominancia estocástica de grado dos y el criterio de mejora de Beaulieu.

Algunas representaciones gráficas para ejemplificar las dominancias se


realizarán a partir de los tamaños de las empresas españolas y alemandas, otras
serán hechas en base a distribuciones paretianas teóricas.

La descripción completa de las fuentes de datos se realiza en el capítulo 4,


que es donde se analizan detalladamente las distribuciones de los tamaños de las
empresas en España, Alemania y Reino Unido.

65
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

3.2. FUNCIONES DE EVALUACIÓN SOCIAL. DOMINANCIA

Dadas dos distribuciones X, Y, con la terminología moderna, ¿cuándo se dirá que


X es una “mejora” sobre Y? Para decidir cuándo se produce una mejora, o
dominancia; es decir, para decidir cuándo una distribución X es mejor que otra
distribución Y, en algún sentido que se precisará más adelante, trabajaremos con
funciones de bienestar o funciones de evaluación social (FES). Se partirá del
hecho que se desconoce la FES específica real, pero se asumirá que verifica
ciertas propiedades “éticas” que son generalmente aceptadas.

Una FES, o función de bienestar social, será una función W ( X ) = W ( x1,… , xN ) ,

que asocia a cada distribución de observaciones un valor que “supuestamente”


será el bienestar del conjunto de la sociedad que esa distribución produce.

La pregunta inmediata es cómo definir una FES. El Teorema General de


Imposibilidad de Arrow (1963, 1974) indica que no se pueden combinar
preferencias ordinales individuales para obtener una función de evaluación global
que nos mida el bienestar del conjunto de la población, lo que viene a reforzar el
planteamiento de que, una vez establecido dos óptimos de Pareto, es imposible
decidir cuál es mejor, a no ser que se introduzcan criterios adicionales.

Si se quisiera que hubiese una relación de orden total entre las diferentes
distribuciones de ingreso de una sociedad dada, habría que introducir algunos
criterios adicionales. Para esta finalidad, se trabajará con funciones de bienestar
social definidas sobre las utilidades que asignan los individuos a sus ingresos,
que ya tienen un significado cardinal; aunque como dijimos anteriormente,
Pareto creía que, objetivamente, esto tampoco podía hacerse. La preferencia de
la sociedad vendrá plasmada por la forma de combinar esas utilidades
individuales cardinales. Es decir, la finalidad de la FES es precisamente pasar de
una ordenación de cuasi-orden a una ordenación social total.

66
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

En este sentido, resulta interesante reseñar que, entre otros muchos autores
positivistas como Pareto, el premio Nobel de Economía, Buchanan, piensa que el
concepto de bienestar social es inadmisible, solamente hay elección individual,
pero no social.

Por otro lado, no se pretende en este trabajo hacer disquisiciones


filosóficas o lingüísticas sobre la acepción y alcance de los términos “función de
bienestar social” o “función de elección social”, cuando autores de la talla que
hemos reseñado y otros más, como Bergson y Samuelson, ya se han ocupado de
ello. Lo que se pretende es mostrar la equivalencia entre los criterios de “mejora”
que aparecen en los trabajos de Pareto y los criterios de dominancia estocásticas
que se basan en las FES. Un análisis detallado de las diversas teorías normativas
y positivas sobre la redistribución de la renta puede verse en Bandrés (1993).

Veamos cuales son las propiedades básicas aceptadas de la desigualdad,


de la eficiencia y del bienestar que, bajo condiciones de regularidad, generan la
mayor unanimidad entre todos los investigadores:

• Axioma de Simetría (anonimato o imparcialidad)

Dos distribuciones que se diferencien únicamente en una permutación


entre sus individuos presentan la misma desigualdad, la misma eficiencia y el
mismo bienestar.

• Invarianza a réplicas de la población (principio de Dalton )

Los valores de esas medidas no dependen del número de individuos que


presentan cada realización de la variable, sino de la proporción entre ellos.

• Principio de las Transferencia de Pigou-Dalton

67
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

Una transferencia de renta de un individuo más rico a uno más pobre


(transferencia progresiva, TP), que no altera sus posiciones, disminuye la
desigualdad, no afecta a la eficiencia y aumenta el bienestar.

• La desigualdad en una distribución es cero si y sólo si todos los


valores de la distribución son iguales.

Ya sabemos que una forma de comparar dos distribuciones es mediante


sus parámetros de localización, dispersión y forma, pero puede ocurrir que no
obtengamos suficiente información con esos parámetros. Una forma más
completa de hacer esas comparaciones entre distribuciones es mediante sus
correspondientes funciones de distribución, que será lo que denominaremos
dominancias estocásticas.

Es claro que la maximización del valor monetario esperado no es la


alternativa que elegirían la mayoría de las personas en muchas ocasiones.
Supongamos las dos alternativas siguientes: A1= Obtener un regalo seguro de un
millón de Euros, A2= Nada, si al lanzar una moneda sale cara, y 3 millones de
Euros si sale cruz. El valor esperado de A2 es 1.5 millones de Euros, mientras
que el de A1 es 1 millón de Euros; no obstante, la mayoría de las personas
seguramente elegirían la alternativa A1.

Obviamente, cada individuo puede tener sus propias preferencias entre las
distintas consecuencias correspondientes a las posibles elecciones que puede
presentarse, más allá del simple valor monetario que estas tengan.

En el siguiente gráfico, Figura 3.1, se muestra como, para un caso de


variable dicotómica como el A2 anterior (obtener 0 ó 3 millones) , el valor de
U  E ( X )  es superior al de E U ( X )  , donde µ = E [ X ] = 1.5 , σ X = h = 1.5 .

68
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

En efecto, P [ X = µ − h ] = P (0) = 0.5 , P [ X = µ + h ] = P(3) = 0.5 ,

P [U ( µ − h) ] = P [U (0)] = P [ X = 0] = 0.5 ,

P [U ( µ + h)] = P [U (3) ] = P [ X = 3] = 0.5 y la E U ( X )  es, por consiguiente, el

punto medio de las dos utilidades correspondientes a los dos valores que se
U ( µ − h) + U ( µ + h) U (0) + U (3)
pueden presentar; es decir, E U ( X )  = = , que
2 2
se observa, puesto que suponemos que U es cóncava, es inferior a la utilidad del
punto medio de los dos valores posibles, a la utilidad de 1.5 en este caso.

Esto justifica el que muchas personas se inclinasen por elegir la


alternativa de una cantidad fija igual o superior a la media, 1.5 en este caso, e
incluso algo inferior a esa cantidad.

Figura 3.1: E U ( X )  vs. U  E ( X ) 

El origen de la Dominancia Estocástica se remonta, según Bawa (1982), a


Daniel Bernoulli, pues fue el primero en investigar la toma de decisiones en
función de la utilidad asociada a las posibles alternativas en vez de en función del

69
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

valor monetario esperado. Es decir, planteó que las decisiones que un individuo
tomaba eran consecuencia de su objetivo de maximizar la utilidad esperada, y no
para maximizar el valor monetario esperado.

La Dominancia Estocástica, en su forma actual, surge de los trabajos de


Quirk y Saposnik (1962), Hadar y Russell (1969), Hanoch y Levy (1969) y
Rothschild y Stiglitz (1970).

Seguidamente vamos a mencionar algunos de los criterios de dominancia


más usados para ordenar distribuciones. Estos criterios de dominancia se
emplearán para ordenar distribuciones según el bienestar global.

Consideraremos U i ( xi ) , la utilidad que el individuo i-ésimo da a su nivel

de ingreso xi; es decir, U i ( xi ) nos indica la intensidad de la preferencia de cada

individuo, o lo que es igual, el bienestar asociado al ingreso xi. Por tanto, al


considerar que la utilidad puede expresarse como un valor numérico que mide la
intensidad de la preferencia del individuo, estamos suponiendo que pueden
hacerse comparaciones interpersonales de utilidad.

Supondremos Ui, la utilidad del individuio i-ésimo, dependiendo


solamente de su nivel de ingreso xi; es decir, U i ( xi ) = U ( xi ) . La base de que las

funciones de utilidad individuales, U i ( xi ) , pueden considerarse iguales, U ( xi ) ,


se asienta en las opiniones de Hobbes:

“La naturaleza ha hecho a los hombres tan iguales en sus facultades


corporales y mentales ………, cuanto todo se toma en conjunto, la diferencia
entre hombre y hombre no es lo bastante considerable……” (Hobbes, 1651, pág.
221).

70
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

Consideremos la función de bienestar social individualista, es decir,


basada en los valores de las utilidades de cada individuo, de manera que la
utilidad de cada individuo no depende de la de los demás. Representaremos por
W dicha función de preferencia social que nos indica cómo combinar, de alguna
manera, esas utilidades individuales para obtener el bienestar, la utilidad, global
de la sociedad, y que se representa en la forma W ( X ) = W (U ( x1 ) ,..,U ( xN ) )

cuando se considera que es función de las utilidades individuales o en la forma


W ( X ) = W ( x1,⋯ , xN ) si se piensa como función de las propias rentas o valores

individuales, con lo cual no se impone una forma concreta a las funciones de


utilidad individuales, siendo W simétrica en todo momento.

Si W ( X ) ≥ W (Y ) para toda función W, con las características que se


consideren en cada momento, se dirá que X ≥ Y ; es decir, que X domina
W

socialmente a Y.

Trabajaremos con funciones de utilidad individuales y FES cóncavas; que


además siempre serán crecientes en el sentido vectorial, pues la utilidad
individual y el bienestar global, al tener más renta cada individuo, se considera
que será mayor que en el caso de tener menos renta cada uno de ellos. Dicho de
otro modo, si aumenta la renta de algún/os individuo/s sin empeorar la de los
demás, el bienestar social ha de aumentar. Esta propiedad se denomina
monotonía.

Podemos ver analíticamente la relación entre concavidad de la función de


utilidad y grado de aversión al riesgo del individuo. En efecto, desarrollando por
Taylor la función de utilidad U, en un entorno de la media µ = E [ X ] , se tendrá:

U ´´( µ )
U ( x) = U ( µ ) + U ´( µ ) ⋅ ( x − µ ) + ⋅ ( x − µ )2 + ⋯
2

71
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

U ´´( µ ) 
E [U ( X )] ≃ E [U ( µ ) ] + U ´( µ ) ⋅ E [ ( X − µ ) ] + ⋅ E ( X − µ ) 2  =
2
U ´´( µ ) 2
= U (µ ) + ⋅σ X
2

U ´´( µ ) 2
E [U ( X )] ≃ U ( µ ) + ⋅σ X (3.1)
2

Si la función es estrictamente cóncava, U ´´< 0 , entonces E [U ( X )] < U ( E [ X ]) ,

que es la conocida como desigualdad de Jensen.

Por tanto, el valor esperado de las utilidades es inferior a la utilidad del


valor medio del ingreso y por ello, un individuo con aversión al riesgo, elegiría
quedarse con el valor medio del ingreso en lugar arriesgarse a un ingreso
incierto, pues el valor medio de esa decisión es superior al valor medio de los
posibles resultados que pueden presentarse.

El valor U ´´( µ ) se denomina coeficiente de aversión al riesgo, y mide la

aversión intrínseca del individuo. El valor σ X2 , la varianza de los posibles

U ´´( µ ) 2
resultados, mide la incertidumbre del entorno. El valor ⋅ σ X mide la
2
aversión del individuo ante la situación.

Por consiguiente, la aversión al riesgo del individuo ante una situación


dada, medida como la pérdida de utilidad esperada por causa de la existencia de
incertidumbre, sería el producto de dos factores, la aversión al riesgo del
individuo, medida como la derivada segunda de su función de utilidad, y el grado
de incertidumbre de la situación, medido con la varianza de los posibles
resultados.

72
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

Por ejemplo, un individuo ante una situación económica de gran


incertidumbre tendría una aversión a emprender decisiones de inversión o de
consumo en función de su nivel de aversión al riesgo personal. De igual manera,
una sociedad con un carácter más emprendedor, con más asunción de los riesgos,
con más tolerancia al fracaso, tendría una utilidad con menos concavidad, una
menor perdida de utilidad esperada provocada por un escenario económico con
incertidumbre y, por tanto, estaría más dispuesta, aún en presencia de esa
incertidumbre, a tomar decisiones de inversión, consumo, etc.

La concavidad está relacionada con la utilidad marginal decreciente (la


inclinación de las rectas tangentes va disminuyendo, derivada segunda negativa);
por lo que a mayor grado de concavidad, mayor aversión al riesgo, mayor
impacto tiene la variación de los ingresos más pequeños y, por consiguiente, es
más beneficioso mejorar éstos, aún a costa de ingresos mayores, por lo que
conviene mejorar la igualdad entre los individuos para maximizar el bienestar
global.

Gráficamente, Figura 3.2, la concavidad de una función real de variable


real significa que dada una recta secante a la curva entre dos puntos, los valores
de la curva siempre están por encima de los valores de la recta secante:

f (λ x + (1 − λ ) xɵ ) ≥ λ f ( x) + (1 − λ ) f ( xɵ ), ∀λ ∈ [ 0,1] , ∀ x, xɵ (3.2)

Es decir, el valor de la función en la combinación convexa de los puntos


siempre es mayor o igual que el valor medio correspondiente de lo que vale la
función en esos dos puntos ( U ´´ ≤ 0 ). Si eliminamos la posibilidad del “=” en la
desigualdad, se dirá estrictamente cóncava.

73
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

Figura 3.2: Función cóncava

El concepto de utilidad marginal decreciente de la renta se asocia a Daniel


Bernoulli, quien afirmó:

“La utilidad resultante de cualquier pequeño incremento en la riqueza


será inversamente proporcional a la cantidad de bienes previamente poseída”
(Daniel Bernoulli, 1738, pág.25).

Este principio es la base de la opinión de que es mejor una distribución


más igualitaria, pues las rentas de los pobres satisfacen necesidades más vitales
que las de los ricos. Entenderemos por función de bienestar cóncava aquella que
verifica que, dadas dos distribuciones X e Y, el bienestar asociado a una media
ponderada de dichas distribuciones no es inferior a la correspondiente media
ponderada de los bienestares proporcionados por cada una de ellas:

W (tX + (1 − t )Y ) ≥ tW ( X ) + (1 − t )W (Y ), ∀t ∈ [ 0,1] (3.3)

Por otro lado, si definimos matriz biestocástica, o doblemente estocástica,

{ }
PNxN = pij ; i, j = 1,.., N como toda matriz P ∈ Μ NxN en las que cada una de las

74
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

filas y columnas son una distribución de probabilidad; es decir que verifica las
siguientes condiciones:

i) 0 ≤ pij ≤ 1, ∀i, j = 1,.., N


N
ii) ∑ pij = 1, ∀j = 1,.., N
i =1 (3.4)
N
iii) ∑ pij = 1, ∀i = 1,.., N
j =1

y consideramos que dadas dos distribuciones X, Y, ∃ una matriz P tal que


X=PY, con P matriz doblemente estocástica que no es una matriz permutación,
se verificará (Muirhead, 1903; Hardy, Littlewood y Pólya, 1952; Dasgupta, Sen y
Starrett, 1973), que las componentes de X son combinaciones lineales convexas
de las de Y, lo que equivale a decir que X se obtiene de Y por medio de
transferencias progresivas, con lo que se disminuye la desigualdad, se mantiene
el valor medio y, por tanto, aumenta el bienestar. Lo notaremos por X ≥ Y.
BIE

Obsérvese que las características de concavidad de las funciones de


utilidad individuales y de las FES, reflejan la tendencia a preferir una mayor
igualdad en el sentido que, mientras menos ingreso tenga el individuo favorecido
por la transferencia progresiva, mayor será el aumento del bienestar global; lo
que se denomina también aversión a la desigualdad (para la FES).

La concavidad de la utilidad individual significaría la aversión al riesgo


del individuo; mientras que la concavidad de la FES significaría la aversión de la
sociedad a la desigualdad.

75
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

Hay bastante conexión entre los conceptos de aversión al riesgo del


individuo y de aversión de la sociedad a la desigualdad. Si las utilidades
individuales, sean idénticas o no, son cóncavas y su agregación formase la FES,
entonces esta FES sería también cóncava y por tanto aversión individual al riesgo
implica aversión social a la desigualdad. La implicación recíproca también es
cierta cuando la FES sea la agregación de idénticas utilidades individuales. En
cambio, en general, la concavidad de la FES no implicaría necesariamente la
concavidad de las utilidades individuales cuando no sean idénticas y la FES no
sea la agregación de dichas utilidades individuales; es decir la aversión a la
desigualdad de la sociedad no implicaría la aversión al riesgo de los individuos.

La Figura 3.3 muestra varias funciones con distinto grado de concavidad.

Figura 3.3: Diversos grados de aversión al riesgo y a la desigualdad.

La curva superior de la Figura 3.3, que se representa con más detalle en la


Figura 3.4, corresponde a una función de utilidad en la que el único cambio de
utilidad se produce en un punto “c”.

76
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

En la Figura 3.4, a la derecha y a la izquierda del punto “c” no hay ningún


cambio en la utilidad al variar el valor de los ingresos. Por tanto, sería óptimo el
recolocar a la mayor cantidad de individuos desde el punto “c-“ al punto “c+”. Es
el caso de máxima aversión a la desigualdad, e indica que únicamente se produce
un aumento del bienestar cuando se beneficia al/los individuos con menos
recursos que el valor “c” fijado y pasan a tener más recursos que dicho valor “c”.
La función de utilidad en este caso es de tipo “escalón” con salto en el valor c.

Figura 3.4: Función de utilidad tipo “escalón”

La curva de la parte central del gráfico de la Figura 3.3, y que se


representa detalladamente en la Figura 3.5, es un caso general de grado de
concavidad intermedia.

En esta Figura 3.5 se observa que la ganancia en utilidad de un individuo


cuando incrementa su ingreso es menor a medida que su nivel de ingreso inicial
es mayor y por tanto, si se transfiere una cantidad, h , desde un individuo con
más ingresos, x2 , a uno con menos ingresos, x1 , sin alterar sus posiciones,
x1 + h < x2 − h , la ganancia en utilidad del de menos ingresos, ∆U ( x1 ) , es

77
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

superior a la pérdida de utilidad del de nivel de ingreso superior,


∆U ( x2 ) = −∆U ( x2 − h) , ∆U ( x2 ) < ∆U ( x1 ) .

Esta función representaría la idea de Bentham al afirmar:

“Por una partícula de riqueza, si se agrega a la riqueza del que tiene


menos, se producirá más felicidad, que si se agrega a la riqueza del que tiene
más (…). Por la substracción de una partícula de la materia de riqueza, se
producirá una substracción menor de felicidad, si ésta se hace del que tiene la
materia de la abundancia más que si se hace de la riqueza del que solamente
tiene la materia de subsistencia” (Bentham, 1952, 1954, pp. 186-187).

Figura 3.5: Función de utilidad cóncava

La curva inferior, la línea recta de la Figura 3.3, que se representa de


forma individualizada en la Figura 3.6, es el caso en que la utilidad de cada
unidad monetaria, la utilidad marginal, es constante, independientemente de los
ingresos de cada individuo.

78
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

En la Figura 3.6, se aprecia que esta es la situación de mínima aversión, de


indiferencia, a la desigualdad, pues cualquier redistribución de ingresos dejaría
invariante el bienestar total, ∆U ( x2 ) = −∆U ( x2 − h) = −∆U ( x1 ) .

El bienestar total sólo variaría al variar la renta media. Al comparar dos


posibles distribuciones, la distribución que proporcionará el mayor bienestar
social es la que tenga mayor renta media, independientemente de la desigualdad
existente entre las rentas de los individuos.

Figura 3.6: Función de utilidad lineal

Por otro lado, si a la función de bienestar social, como función de los


valores de las rentas individuales, sólo se le impone la condición que sea
creciente; es decir, que el bienestar global de la sociedad aumente si se produce
incremento en la renta de algún individuo, siempre que no disminuya ninguna, y
que sea lineal, entonces cualquier redistribución de los ingresos dejaría invariante
el bienestar social.

79
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

Por tanto, en este último caso, en el que sólo se impone la condición de


crecimiento, el bienestar social sólo aumentaría si aumentase la riqueza media.
Es decir, la desigualdad no influye para nada y hay preferencia absoluta por la
eficiencia.

3.3. DOMINANCIA LORENZ

Dadas dos distribuciones X, Y diremos que la distribución X domina por Lorenz a


la distribución Y , y lo notaremos por X ≥ Y , sii LX ( p ) ≥ LY ( p ) , ∀p ∈ [ 0,1] ;
L

j
∑ xi
donde, dado p j = : L( p j ) = i =1 .
N Nx

Es decir, X se dice que domina por Lorenz a Y sii la Curva de Lorenz de X


(Lorenz, 1905) no queda nunca por debajo de la de Y.
j j
∑ xi ∑ yi
Pero LX ( p ) ≥ LY ( p), ∀p ∈ [ 0,1] si y sólo si i =1
≥ i =1
si y sólo si
Nx Ny
j j
x y
∑ xi ∑ yi
i =1 i =1
≥ , ∀j = 1,.., N , que es el criterio de Lassalle (lo notaremos
j j
X≥ Y ).
LAS

Es decir,

X ≥ Y sii X ≥ Y (3.5)
L LAS

Shorrocks y Foster (1988), relacionan las funciones de bienestar social y


los índices de desigualdad, y muestran que todo índice de desigualdad simétrico

80
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

que cumpla el principio de las transferencias de Pigou-Dalton genera una


ordenación idéntica a la proporcionada por la curva de Lorenz:

X ≥ Y sii I(X) ≤ I(Y) , ∀I simétrico que cumpla el principio de Pigou-Dalton.


L

Cuando se cumpla que I(X) ≤ I(Y) , ∀I de desigualdad, simétrico que


cumpla el principio de Pigou-Dalton, lo notaremos por X ≥ Y.
IPD

Por tanto, se tienen las siguientes equivalencias

X ≥ Y sii X ≥ Y sii X ≥ Y (3.6)


L LAS IPD

Así, Figura 3.7, la distribución del tamaño de las empresas españolas en 2006
domina por Lorenz a la distribución del tamaño de las empresas de 2012, lo que
significa que en 2006 las empresas eran de tamaños más parecidos entre sí que en
2012. Además, obsérvese que la diferencia entre esos años no se produce en
cuanto a las empresas de pequeño tamaño, sino en las empresas situadas a partir
del tamaño mediano, lo que significa que son estas precisamente las que han
modificado la estructura de la distribución.

Por consiguiente, queda claro que, según Lassalle, dominancia Lorenz,


hay más igualdad entre las empresas españolas, en cuanto al número de
empleados por empresa, en 2006 que en 2012.

81
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

Curvas de Lorenz España


1
0,9
0,8
0,7
0,6
0,5 España 2006
0,4
España 2012
0,3
0,2
0,1
0
0 0,2 0,4 0,6 0,8 1

Figura 3.7: España 2006 domina por Lorenz a España 2012

Este criterio de dominancia Lorenz, no permite comparar dos


distribuciones cuyas curvas de Lorenz se corten, como es el caso de las
distribuciones del número de empleados por empresa en España y Alemania en
2014, Figuras 3.8 y 3.9.

Para poder hacer las comparaciones en estas situaciones, se necesitará


establecer el criterio de Lorenz Generalizado o Dominancia Estocástica de grado
2. Pero antes, definiremos el criterio de Dominancia Estocástica de grado 1.

82
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

Curvas de Lorenz de España y Alemania 2014


1
0,9
0,8
0,7
0,6
0,5 España 2014
0,4
Alemania 2014
0,3
0,2
0,1
0
0 0,2 0,4 0,6 0,8 1

Figuras 3.8 : España, Alemania 2014

Curvas de Lorenz de España y Alemania 2014


1

0,9

0,8

0,7 España 2014


Alemania 2014
0,6

0,5

0,4
0,96 0,97 0,98 0,99 1

Figuras 3.8 : Tramo final de las distribuciones España, Alemania 2014

83
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

3.4. DOMINANCIA ESTOCÁSTICA DE PRIMER GRADO (DEP)

Dadas dos distribuciones X, Y, diremos que la distribución X domina en primer


grado a la distribución Y sii FX ( t ) ≤ FY ( t ) , ∀t ≥ 0 . Lo notaremos por X ≥ Y .
1

Es decir, X domina en primer grado a Y sii la función de distribución de X,


no está nunca por encima de la de Y; lo que significa que, fijado un nivel de
ingresos z, la proporción de los que no superan esos ingresos (los que tienen
déficit de ingresos) en X, FX ( z ) , siempre es menor o igual a la correspondiente

proporción que hay en Y, FY ( z ) .

Veamos algunas gráficas para el caso particular de la distribución de


Pareto.

La gráfica siguiente, Figura 3.10, refleja las funciones de distribución


para P1 ∼ P(α = 3, h = 2); P2 ∼ P (α = 9, h = 2) , y la dominancia de primer grado
de P1 sobre P2.

P(3,2) P(9,2)
1,2

0,8

0,6

0,4

0,2

0
0 2 4 6 8 10 12 14

Figura 3.10: P1 ∼ P(α = 3, h = 2); P2 ∼ P (α = 9, h = 2)

84
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

Esta otra de P1 ∼ P(α = 3, h = 2); P2 ∼ P (α = 2, h = 4) , Figura 3.11, la


dominancia de primer grado de P2 sobre P1.

P(3,2) P(2,4)
1,2

0,8

0,6

0,4

0,2

0
0 2 4 6 8 10 12 14

Figura 3.11: P1 ∼ P(α = 3, h = 2); P2 ∼ P (α = 2, h = 4)

En este sentido, Figura 3.12, la distribución del número de trabajadores


por empresa en Alemania 2014, domina en primer grado a la de España 2014.

ESPAÑA 2014 ALEMANIA 2014

1
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
0 500 1000 1500

Figura 3.12: Funciones de distribución España y Alemania 2014.

85
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

Obsérvese que si x j ≤ z < x j +1 , entonces la proporción de individuos de la

población con déficit de ingresos; es decir, con ingresos iguales o inferiores a z


j
es FX (z) = .
N

j
El valor z se denomina línea de ingresos y FX (z) = se denomina índice
N
de recuento de déficit de ingresos para la línea de ingresos fijada, que representa
la extensión del déficit de ingresos y se suele notar por H X (z) .

En el caso del tamaño de las empresas en España y Alemania en 2014, se


puede decir que fijado un tamaño de empresa z, la proporción de empresas que
no superan ese umbral, ese número de trabajadores, siempre es mayor en España
que en Alemania.

Otra forma de ver esa dominancia de primer grado es que cualquier


medida de posición de X, va a ser superior a la correspondiente medida de
posición de Y. En concreto, esa definición equivale, Quirk y Saposnik (1962), a
que E X [U ] ≥ EY [U ] , ∀U función real de variable real monótona no decreciente

(no necesariamente cóncava), donde E X [U ] = ∫ U ( x) f ( x)dx en el caso continuo

Card {i / x(i ) = t}
y E X [U ] = ∑ U (t ) f (t ), f (t ) = , X = { x(1),.., x( N )} en el caso
x (i ) N

discreto; es decir, equivale a que la utilidad esperada de X no sea menor que la


utilidad esperada de Y, para toda función de utilidad U no decreciente y, en tal
caso, se dirá que X domina a Y en utilidad ( X ≥ Y ).
U

Obsérvese que, dado que la función de supervivencia es la


complementaria de la función de distribución, se tendrá que X domina en primer

86
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

grado a Y sii S X ( t ) ≥ SY ( t ) , ∀t ≥ 0 , que es el criterio original de mejora de

Pareto (“disminuye la desigualdad”, recordemos decía Pareto), y lo notaremos


por X ≥ Y.
OP

Como además, la media de una distribución coincide con el área que está
encerrada entre el valor 1 y el de la función de distribución empírica; se deduce
entonces que µ X ≥ µY .

Podemos pensar que esta dominancia en utilidad, la mejora en media para


toda función de utilidad no decreciente, es una de las razones por las que
argumentaba Pareto que para conseguir que la distribución de la renta sea más
favorable a los pobres no hay más que un medio, aumentar la producción y así
que crezca la riqueza más que lo hace la población; es decir, que aumente la
renta media.

Por otro lado, sean X= {x1,….,xn} con x1 ≤ ⋯ ≤ x n e Y = {y1,….,yn} con


y1 ≤ ⋯ ≤ y n , dos distribuciones de rentas ordenadas, correspondientes a n
individuos. Se dice que X es una mejora por rangos de Pareto de Y, y lo
notaremos por X ≥ R Y , sii xk ≥ yk , k = 1,.., n , siendo estricta para algún k. Es
decir, cuando ningún individuo de la primera distribución ordenada tiene peor
situación que el que ocupa su misma posición en la segunda distribución
ordenada (se comparan los individuos que están en la misma posición en las dos
distribuciones). Veremos que esto coincide con la Dominancia Estocástica de
primer grado y que coincidirá con el concepto de mejora original de Pareto.

Saposnik (1981, 1983) y Thistle (1989) muestan que la condición de


dominancia estocástica de primer grado, FX ( t ) ≤ FY ( t ) , ∀t ≥ 0 , es equivalente a

87
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

que X es una mejora por rangos, dominancia por rangos de X sobre Y; que
también se denomina mejora anónima o criterio débil de Pareto
(X≥ Y ≡ X≥ Y ). Es decir:
R AP

X ≥ Y sii X ≥ Y (3.7)
1 R

Por otro lado, la inversa de la función de distribución, la función cuantil, se


define como FX−1 ( p ) = inf{x : F(x) ≥ p}, p∈[0,1). Dado que X tiene dominancia

estocástica de grado 1 sobre Y sii FX ( t ) ≤ FY ( t ) , ∀t > 0 , y que se verifica la

siguiente equivalencia (Muliere y Scarsine, 1989):

FX ( t ) ≤ FY ( t ) , ∀t ⇔ FX−1 ( p ) ≥ FY−1 ( p ) , ∀p (3.8)

entonces, según el criterio original de Pareto, la distribución X es “menos


desigual”, en palabras de Pareto, que la distribución Y, es mejor, la domina, si y
sólo si S X ( t ) ≥ SY ( t ) , ∀t ≥ 0 , si y sólo si la distribución X domina en primer

grado a la distribución Y si y sólo si FX ( t ) ≤ FY ( t ) , ∀t > 0 , si y sólo si

FX−1 ( p ) ≥ FY−1 ( p ) para todo p∈[0,1) (Dominancia estocástica inversa de grado

1) si y sólo si W ( X ) ≥ W (Y ), ∀ función de bienestar W definida por

W = ∫ U ( x) f ( x)dx, U ´> 0 ; es decir, para toda función de bienestar social

simétrica, separable aditivamente como función de las rentas individuales y con


U no decreciente.
En resumen, se tienen las siguientes seis equivalencias:

88
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

1. X ≥ Y
1

2. X ≥ Y . Supervivencia ( X ≥ Y )
OP S

3. X ≥ Y . ∀ utilidad esperada , U no decreciente


U
(3.9)
4. X ≥ Y
R

5. X ≥ Y
AP

6. H X ( z ) ≤ H Y ( z ) , ∀z

Nótese que, a veces, se dice que una FES de ese tipo es consistente con el criterio
anónimo de Pareto.

Pero que FX ( t ) ≤ FY ( t ) , ∀t > 0 , no implica que la sociedad con

distribución X sea menos desigual que la sociedad con distribución Y; lo que


implica es que la sociedad X es más eficiente, “mejor en el sentido de la
eficiencia” que la sociedad Y; es decir µ X ≥ µY . Es, por tanto, un criterio de
bienestar absoluto.

Además, Si X tiene Dominancia Estocástica de grado 1 sobre Y, ello

{ }
significará adicionalmente que Min { xi } ≥ Min y j y, en caso de igualdad, que

ese mínimo común ocurre con menos frecuencia en X que en Y (también, se

{ }
cumple que Max { xi } ≥ Max y j ). Esto es, el individuo más pobre en X tiene

mayor o igual renta que el más pobre de Y, y en caso de tener la misma renta, la
proporción de de individuos con esa mínima renta es menor en X que en Y. Pero
esto, es la aproximación no utilitarista de Rawls (1971), conocido leximin de
Rawls (Lambert, 1989) o mínimax de Rawls (Sen, 1973). Por tanto, la DEP
implica la dominancia Rawlsiana.

89
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

Como hemos indicado anteriormente, la dominancia estocástica de primer


grado sólo mide aspectos de eficiencia, pero no aspectos de igualdad. Esos
aspectos de igualdad serán contemplados en la dominancia estocástica de
segundo orden que, como veremos más adelante, combinará tanto eficiencia
como igualdad.

Igualmente, este criterio de dominancia estocástica de orden 1, no permite


comparar dos distribuciones cuyas curvas de las funciones de distribución se
corten. Para poder hacer esta comparación, será necesario el criterio de la
Dominancia Estocástica de grado 2, que coincidirá con el criterio de Lorenz
Generalizado.

El tamaño de las empresas españolas de 2006 no tiene dominancia


estocástica de primer grado sobre el tamaño de las empresas españolas de 2012,
ni el de 2012 sobre el de 2006, Figura 3.13.

Figura 3.13: Funciones de distribución España 2006 y 2012.

90
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

3.5. DOMINANCIA ESTOCÁSTICA DE SEGUNDO GRADO

Dadas dos distribuciones X, Y. Diremos que la distribución X domina en segundo


s s
grado a la distribución Y sii ∫ FX ( t )dt ≤ ∫ FY ( t )dt , ∀s ≥ 0 , lo que notaremos por
0 0

X ≥ Y . Es decir,
2

s s
X ≥ Y sii ∫ FX ( t )dt ≤ ∫ FY ( t )dt , ∀s ≥ 0 (3.10)
2
0 0

Así, Figura 3.14, la P(9,4) tiene dominancia estocástica de grado 2 sobre la


P(2,2).

P(9,4) P(2,2)
1,2

0,8

0,6

0,4

0,2

0
0 2 4 6 8 10 12 14

Figura 3.14: Funciones de distribución P(9,4) y P(2,2).

Es decir, X domina en segundo grado a Y sii el área acumulada por debajo


de la función de distribución de X no es nunca superior a la acumulada por
debajo de la de la función de distribución de Y.

91
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

Nótese, Figura 3.15, que la P(9,3) no tiene dominancia estocástica de


grado 2 sobre la P(1.5,2).

P(9,3) P(1.5,2)

1,2

0,8

0,6

0,4

0,2

0
0 2 4 6 8 10 12 14

Figura 3.15: Funciones de distribución P(9,3) y P(1.5,2)

Que X domina en segundo grado a Y, lo que significa es que, fijada una


línea de ingresos, la magnitud del déficit de ingresos en X, siempre será menor o
igual a la que hay en Y:

MDI X ( z ) ≤ MDIY ( z ) , ∀z (3.11)

donde la magnitud del déficit de ingresos, para una línea de ingresos z, MDI(z),
está definida como: MDI ( z ) = H ⋅ IDI , donde H representa la extensión del
déficit de ingresos e IDI es un indicador, denominado brecha o intensidad del
déficit de ingresos, que mide el nivel de carencia de los que ganan menos que ese
nivel de ingresos establecido con relación a la línea de ingresos z, x j ≤ z ≤ x j +1 :

H= j
N

92
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

j
∑ xi
i =1
1 j ( z − xi )
(3.12)
1 j xi j xj
IDI = ∑ = 1− ∑ = 1− = 1−
j i =1 z j i =1 z z z

Pues, Figura 3.16, obsérvese que el área por debajo de la función de distribución
z
de X, hasta el valor z, ∫ F ( x)dx , viene dada en el caso discreto, x j ≤ z ≤ x j +1 ,
0

por el área de rectángulo de base z y altura F(xj), zF(xj), menos el área por arriba
de F(x) hasta el nivel F(xj); es decir, ese área es la que aparece sombreada en la
figura inferior:

Figura 3.16: Área bajo la función de distribución.

93
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

j  j ( j − 1) x − x + ⋯ 1 x − x  =
z −  x1 +
N N N
( 2 1)
N
j j −1  ( )

j j

1 j  ∑ ( z − xi ) jz
∑ ( z − xi )
=  jz − ∑ xi  = i =1
= i =1
=
N i =1  N N jz
j  1 j ( z − xi ) 
=  ∑  z = H ⋅ IDI ⋅ z
N  j i =1 z 

Y, por tanto, la expresión para el área queda:

Área= H ⋅ IDI ⋅ z (3.13)

En concreto, esa definición equivale a que E X [U ] ≥ EY [U ] , ∀U función real de

variable real monótona creciente y cóncava ( Hadar y Russell (1969), Hanoch y


Levy (1969), Rothschild y Stiglitz (1970)). Lo que significa que X tiene
dominancia en utilidad media sobre Y, X ≥ Y.
UC

Ese criterio coincide con el de Atkinson (1970), pues éste define una
función de bienestar social W = ∫ U ( x) f ( x)dx como una función de bienestar

social simétrica, separable aditivamente como función de las rentas individuales


y con U estrictamente creciente (U´>0) y cóncava ( U ´´≤ 0 ) y, mediante ella,
ordena las distribuciones.

El que U sea cóncava ( U ´´≤ 0 ), significa, como hemos indicado


anteriormente, que la utilidad marginal del ingreso ha de ser una función
decreciente de dicho ingreso, lo que significa aversión al riesgo.

Por tanto, dado que, a su vez, el criterio de dominancia en utilidad media


coincide con el criterio de dominancia de bienestar de Atkinson, se tiene:

94
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

X ≥ Y sii X ≥ Y (3.14)
2 UC

Por otro lado, la curva de Lorenz generalizada (Shorrocks, 1983),


LG X ( p ) = µ X LX ( p ), ∀p ∈ [ 0,1] , además de contemplar el nivel de igualdad

medido mediante la curva de Lorenz, tiene en cuenta la eficiencia de la


distribución, medida mediante la renta media. En este sentido, si
LG X ( p ) ≥ LGY ( p ), ∀p ∈ [ 0,1] , con al menos una desigualdad estricta para algún

p, se dice que X tiene dominancia Lorenz Generalizada sobre Y, X ≥ Y:


LG

X≥ Y sii LG X ( p ) ≥ LGY ( p ), ∀p ∈ [ 0,1] (3.15)


LG

Lambert (1989, 1993 y 2001) demuestra la equivalencia de la dominancia en


utilidad media cóncava y creciente con la dominancia Lorenz generalizada:

X≥ Y sii LG X ( p ) ≥ LGY ( p ), ∀p ∈ [ 0,1] (3.16)


UC

Luego, de 3.14 y 3.16 se tiene que:

X ≥ Y sii LG X ( p ) ≥ LGY ( p ), ∀p ∈ [ 0,1] (3.17)


2

Obsérvese, Figuras 3.17 y 3.18, que España 2006 no tiene dominancia Lorenz
generalizada sobre España 2012, pero sí sobre España 2010; y que España 2012
tiene dominancia Lorenz generalizada sobre 2010.

Pero que LG X ( p ) ≥ LGY ( p ), ∀p ∈ [ 0,1] , no implica que la sociedad con

distribución X sea menos desigual que la sociedad con distribución Y; lo que

95
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

implica, al igual que en la dominancia de primer grado, es que la sociedad X es


más eficiente, “mejor” que la sociedad Y, en el sentido que µ X ≥ µY . Vuelve a
ser, fundamentalmente, un criterio de bienestar absoluto.

Curvas generalizadas de Lorenz. España


53

43

33
España 2006
23 España 2010
España 2012
13

-7 0 0,2 0,4 0,6 0,8 1

Figura 3.17: Curvas generalizada de Lorenz. España, 2006-2012

Curvas generalizadas de Lorenz. España

22

España 2006
España 2010
España 2012

17
0,86 0,87 0,88 0,89 0,9

Figura 3.18: Detalle último tramo CLG. España, 2006-2012

96
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

j
Si notamos p j = , entonces
N
j j
∑ xi ∑ xi
i =1 i =1
L( p j ) = ⇒ x ⋅ L( p j ) =
Nx N

con lo cual se tendrá que

j j j j
∑ xi ∑ yi ∑ xi ∑ yi
LG X ( p ) ≥ LGY ( p ), ∀p ∈ [ 0,1] sii i =1
≥ i =1
sii i =1
≥ i =1
, ∀j = 1,.., N
N N j j

que es el criterio de Beaulieu.

Siguiendo a Rothschild y Stiglitz (1973), podemos definir una


transferencia regresiva como aquella en la que un rico obtiene lo que pierde un
pobre, y regresiva ineficiente como aquella en la que un rico obtiene menos que
lo que pierde un pobre. Notaremos X ≥ Y si Y puede ser obtenida de X por una
TR

secuencia finita de transferencias regresivas, y X ≥ Y si Y puede ser obtenida


TRI

de X por una secuencia finita de transferencias regresivas ineficientes.

Rothschild y Stiglitz muestran la equivalencia de las siguientes


condiciones:

X≥ Y sii X ≥ Y (3.18)
LG TRI

En resumen, se tienen las siguientes seis equivalencias:

97
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

1. X ≥ Y
2

2. X ≥ Y , ∀ utilidad esperada, U creciente y cóncava


UC

3. X ≥ Y
LG
(3.19)
4. X ≥ Y
TRI

5. X ≥ Y
BEA

6. MDI X ( z ) ≤ MDIY ( z ) , ∀z

Reformulando las conclusiones de Atkinson, basándonos en los resultados de


Rothschild y Stiglitz (1970) y en el principio de las transferencias de Pigou-
Dalton, llegamos a las siguientes 6 equivalencias:

1. X ≥ Y
LAS

X Y
2. ≥
X BEA Y
3. X ≥ Y
L

X Y
4. ≥ (3.20)
X 2Y
X Y
5. ≥
X ATK Y
X Y
6. puede ser obtenida de mediante un número finito
X Y
de transferencias progresivas de Pigou-Dalton.

X Y X
El que la dominancia ≥ es equivalente a que puede ser obtenida
X 2Y X
Y
de mediante un número finito de transferencias progresivas de Pigou-Dalton
Y

98
Capítulo 3 Relación entre Mejoras en Escritos de Pareto y Dominancias

puede considerarse un resultado ya obtenido por Muirhead (1903) y por Hardy,


Littlewood y Pólya (1952).

X Y
Nótese que, por un lado, los comentarios realizados para e , son
X Y
trasladables al caso X e Y, cuando ambas distribuciones tengan la misma media y,
por otro lado, que dominancia estocástica de primer orden implica dominancia de
segundo orden, pero no al revés.

Obsérvese que, como se indicó anteriormente, X ≥ Y sii la función


2

s
D ( s ) = ∫ ( FY ( t ) − FX ( t ) )dt ≥ 0, ∀s ≥ 0 , lo que significa que el área acumulada
0

entre FY y FX,, hasta cualquier valor s, es siempre positiva; dicho de otra manera,
que la suma de las áreas positivas, cuando FX ≤ FY , sea mayor que la suma de
las áreas negativas, cuando FY ≤ FX . Lo que significa que, en términos
monetarios, en cada tramo acumulado, y siempre que no se alteren las posiciones,
las mejoras de las clases inferiores superan a las pérdidas de las clases
intermedias y superiores.

Esta función D(s) es extensamente estudiada por Lambert (1989, 1993 y


2001) para el análisis de la Dominancia Estocástica de grado 3. Dominancia que
es también estudiada por Shorrocks y Foster (1988), pero que, como no tiene
relación directa con los escritos de Pareto, no es tratada en el presente trabajo.

99
CAPÍTULO 4

LA DISTRIBUCIÓN PARETO VS

LA DISTRIBUCIÓN PARETO-CUADRÁTICA

4.1. INTRODUCCIÓN

4.2. ALGUNAS PROPIEDADES DE LA DISTRIBUCIÓN


DE PARETO
4.2.1. Única distribución, de soporte infinito, con función de
supervivencia de elasticidad constante.
4.2.2. Única distribución, con soporte infinito, libre de escala.
4.2.3. Regla del 80/20.
4.2.4. Propiedad de un solo cruce

4.3. JUSTIFICACIÓN DE LA DISTRIBUCIÓN PARETO-


CUADRÁTICA

4.4. ALGUNAS PROPIEDADES DE LA DISTRIBUCIÓN


PARETO-CUADRÁTICA
4.4.1. Función de distribución y de densidad. Momentos
4.4.2. Elasticidad
4.4.3. Tasa de cambio de la pequeñez de una empresa
4.4.4. Propiedad de un solo cruce
4.4.5. Aproximación local por la distribución paretiana
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

4.1. INTRODUCCIÓN

Contratos realizados por este doctorando con un equipo de trabajo de la


Universidad de Sevilla, con empresas públicas y privadas, han facilitado
interesarse por el tamaño de las empresas.

La variable nº de trabajadores es clave en el estudio de muchas


características relacionadas con la actividad empresarial; de hecho suele
considerarse como una variable de control en gran parte de los estudios. Las
manifestaciones públicas de responsables políticos, de entidades bancarias y de
organismos internacionales sobre la comparación de los tamaños de las empresas
españolas con la de otros países europeos y la diferencia de niveles de
competitividad e internacionalización entre ellas son constantes.

En el capítulo 2 hemos visto que la Distribución de Pareto se aplica a un


gran número de situaciones; no obstante, al analizar la distribución del número de
trabajadores de las empresas podemos considerar que, si notamos por S ( x) la
proporción de empresas con un nº de trabajadores superior a x, se ha podido
comprobar que los puntos (Ln xi, Ln Si) , no se encuentran sobre una línea recta,
sino sobre una línea curva; y ello, independientemente del año y del país
investigado, lo que sugiere que el ajuste adecuado no es el paretiano.

En el apartado 2 se formularán algunas propiedades, importantes para


nuestro trabajo, de la distribución de Pareto.

En el apartado 3 se procederá a encontrar una relación cuadrática que


relaciona (Ln xi, Ln Si), que mejora la relación paretiana en este caso, a la que
denominaremos distribución Pareto-cuadrática (PC). De los trabajos de Kleiber
y Kotz (2003) y Kleiber (2013), puede considerarse que este planteamiento tiene

103
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

antecedentes en trabajos de Benini (1905, 1907), Bresciani Turroni (1914) y


Mortara (1917, 1949).

En el apartado 4 se mostrarán algunas propiedades de interés de esta


distribución Pareto-cuadrática, en especial la posibilidad de estudiar el nivel de
desfavorecimiento de manera local, en lugar de globalmente como se hace con la
distribución Pareto.

4.2. ALGUNAS PROPIEDADES DE LA DISTRIBUCIÓN DE PARETO

Seguidamente vamos a ver algunas propiedades relevantes de la distribución de


Pareto, adicionales a la del cambio de escala que puede verificarse fácilmente (si
X ∼ P(α , h) , entonces Y = kX ∼ P(α , kh) ).

4.2.1. Única distribución, de soporte infinito, con función de supervivencia


de elasticidad constante

α
α −α h
En efecto, si consideramos la función de supervivencia S ( x) = h x =   , se
x
tendrá que la elasticidad es:
dS ( x) x −α hα x
Ex = = α +1 α −α = −α
dx S ( x) x h x

Es decir, que la elasticidad es constante e igual a −α :


E x = −α
Por tanto, el parámetro −α puede interpretarse como la elasticidad de la función
de supervivencia del ingreso, o lo que es igual, la reducción porcentual del
número de perceptores de ingresos, ante un incremento del ingreso en 1%.

104
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

El parámetro α también puede ser usado, como hemos indicado


anteriormente y veremos más adelante, para calcular un indicador de la
“desigualdad” de la sociedad, pues está relacionado con el índice de desigualdad
definido posteriormente por Gini.

Recíprocamente, supongamos que la elasticidad de la función de


dS ( x) x
supervivencia es constante: E x = = k ; entonces:
dx S ( x)
dS ( x) dx
=k
S ( x) x

∫ ∫
 dS ( x)  1
 =k dx
 S ( x )  x

LnS ( x) = kLn( x) + c

S ( x) = ec x k → S ( x) = Ax k c.q.d.

4.2.2. Única distribución, con soporte infinito, libre de escala

La distribución de Pareto es la única distribución de escala libre, o libre de la


escala; es decir, que su función de densidad cumple la propiedad de que para dos
valores cualesquiera x1, x2 , si la relación entre sus densidades es f (x1) = kf (x2 ) ,
entonces para cualquier cambio de escala Y = bX, al considerar y1 = bx1, y2 = bx2 ,
se verifica que f ( y1 ) = kf ( y2 ) ; es decir, la razón entre los valores de la función
de densidad en dos puntos cualesquiera sólo depende de la propia razón entre
f ( x1 ) f (bx1 )
dichos puntos: = ; es decir que existe una función g de manera que
f ( x2 ) f (bx2 )

f ( x1 ) x 
= g 1  .
f ( x2 )  x2 

105
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

Esto lo que significa es que si, por ejemplo, en una sociedad las personas
que ganan 2000 € son 1/3 de las que ganan 1000 €, entonces las que ganan 20000
€ son 1/3 de las que ganan 10000 €, las que ganan 200000 € son 1/3 de las que
ganan 100000€, y así sucesivamente.

También puede verse en el sentido que, independientemente del rango de


valores que se analice, la proporción entre las frecuencias de aparición de los
valores pequeños y grandes es la misma o, equivalentemente, como que la
pendiente de cualquier rango del gráfico logarítmico (logaritmos de valores vs.
Logaritmo de frecuencias) es la misma.

α ⋅ hα
En efecto, sea f ( x) = α +1
= α hα x −α −1 y sea x1, x2 ≥ h . Entonces,
x
−α −1
f ( x1 ) α hα x1−α −1  x1 
= = 
f ( x2 ) α hα x2 −α −1  x2 

 f ( x1 )   x1 
ln   = ( −α − 1) ln  
 f ( x2 )   x2 

 f ( x1 ) 
ln  
 f ( x2 )  = −α − 1
x 
ln  1 
 x2 

ln ( f ( x1 ) ) − ln ( f ( x2 ) )
= −α − 1
ln ( x1 ) − ln ( x2 )

Por tanto, esa relación se mantiene en cualquier lugar de la cola de la


distribución.

106
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

Vamos a ver primeramente que si la función de densidad de una


distribución cumple la propiedad f (bx) = g (b) f ( x) , entonces dicha distribución
es libre de escala y recíprocamente.

Proposición. Una distribución X es libre de escala sii su función de densidad


cumple que f (bx) = g (b) f ( x), ∀b, ∀x / x, bx ∈ soporte( X ) .

Demostración. Vamos a ver primeramente que si la función de densidad


de una distribución cumple la propiedad f (bx) = g (b) f ( x) , entonces dicha
distribución es libre de escala.

En efecto, sea la variable X, verificando su función de densidad que


f (bx) = g (b) f ( x) , y supongamos que f ( x1 ) = kf ( x2 ) .

Ahora hacemos un cambio de escala Y = bX. Consideremos


y1 = bx1, y2 = bx2 .

Tenemos que ver que se verifica que f ( y1 ) = kf ( y2 ) :

f ( y1 )
f ( y1 ) = f (bx1 ) = g (b) f ( x1 ) → g (b) =
f ( x1 )

f ( y2 )
f ( y2 ) = f (bx2 ) = g (b) f ( x2 ) → g (b) =
f ( x2 )
Ahora, igualando esas dos expresiones, tendremos:

f ( y2 ) f ( y1 ) f ( x1 ) f ( y1 )
= →k = = ; f ( y1 ) = kf ( y2 ) c.q.d.
f ( x2 ) f ( x1 ) f ( x2 ) f ( y2 )

107
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

Recíprocamente, sea X una distribución libre de escala, entonces

f ( x1 ) x 
= g  1  , por lo que si dado x tomamos x2 = x, x1 = bx , tenemos que
f ( x2 )  x2 
f (bx)
= g ( b ) , luego f (bx) = g (b) f ( x) c.q.d.
f ( x)

Lema. Si X es una distribución libre de escala, entonces Y = kX es libre de escala.

Demostración. Dada X, sea Y=kX, entonces


y y 1
FY ( y ) = FX ( ) → fY ( y ) = f X ( ) ⋅
k k k
de donde
by 1 y 1 y 1
fY (by ) = f X ( ) ⋅ = f X (b ⋅ ) ⋅ = g (b) f X ( ) ⋅ = g (b) fY ( y )
k k k k k k

luego, fY (by ) = g (b) fY ( y ) .

Es decir, Y es libre de escala. c.q.d.

Con este lema se consigue además que, en caso de ser necesario, el valor x=1
pueda considerarse que está dentro del soporte de definición de la función de
densidad.

Obviamente, la distribución de Pareto, verifica la propiedad f (bx) = g (b) f ( x) .


Veámoslo en la siguiente proposición.

Proposición. Si X sigue una distribución de Pareto, entonces verifica la


propiedad f (bx) = g (b) f ( x) .

Demostración. En efecto, sea X una distribución de Pareto. En ese caso:

108
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

α ⋅ hα −α −1
f ( x) = α +1
= α hα x −α −1 → f (bx) = α hα ( bx ) = b −α −1α hα x −α −1 →
x
f (bx) = b −α −1 f ( x) = g (b) f ( x), g (b) = b −α −1 c.q.d.

Además, veamos que la distribución de Pareto es la única distribución libre de


escala.

Proposición. La única distribución que es libre de escala es la distribución de


Pareto.

Demostración. En efecto, supongamos que una distribución verifica la


propiedad de ser libre de escala; es decir, su función de densidad verifica que
f (bx) = g (b) f ( x), ∀b .

f (b)
Entonces, tomando x=1, se tiene f (b) = g (b) f (1) → g (b) = ,
f (1)
f (b) f ( x)
luego f (bx) = g (b) f ( x) = y, por tanto:
f (1)
f (b) f ( x)
f (bx) =
f (1)
Derivando ahora respecto de b, llamando t al argumento de f y aplicando la regla
de la cadena en el lado izquierdo, nos queda:

df (bx) dt f ( x) df (b)
⋅ =
dt db f (1) db
df (bx) f ( x) df (b)
x =
dt f (1) db

Ahora, tomando b = 1, obtenemos:

109
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

df ( x) f ( x) f ( x) f ´( x) 1 f ´(1)
x = f ´(1) → xf ´( x) = f ´(1) → =
dx f (1) f (1) f ( x) x f (1)
Integrando esa ecuación diferencial de primer orden:
f ´(1)
ln f ( x) = ln x + C
f (1)
Hacemos x = 1 para determinar la constante y obtenemos C = ln f (1) . Luego
la solución de la ecuación diferencial queda:
f ´(1)
ln f ( x) = ln x + ln f (1)
f (1)
Ahora, tomado exponenciales, obtenemos:
f ´(1) f ´(1)
ln f ( x) =
f ´(1)
f (1)
( )
ln x + ln f (1) → f ( x) = eln x f (1) e ln f (1)
→ f ( x) = x f (1)
f (1)

f ´(1)
Luego, poniendo = −α − 1 , queda:
f (1)

f ( x) = x −α −1 f (1)
Es decir,
f ´(1)
f ( x) = x −α −1 f (1),α = − −1
f (1)
Que es la función de densidad de una distribución de Pareto; y, por consiguiente,
la distribución paretiana es la única que verifica el criterio de libre escala.

4.2.3. Regla del 80/20

Esta conocida regla viene a decir que, aproximadamente, el 80% de los


individuos con menos ingresos acumulan solamente un 20% de los ingresos
totales o, lo que es igual, que el 20% de los individuos más ricos acumulan el
80% de la riqueza total. Lo que pretendemos hacer en este apartado es mostrar la
justificación matemática de esta regla.

110
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

Veremos que la cantidad acumulada de rentas cuyos valores individuales


son inferiores a una cierta renta, x, viene dada por la expresión

α −1 
α ⋅ h N hc   h 
Tx = 1 − 
α − 1   x  

En efecto, dada una renta x, la frecuencia absoluta de los individuos con


rentas en el intervalo [x,x+dx] la notaremos nx . La frecuencia relativa de esos

nx n
individuos es c
, y su densidad de frecuencia relativa es f ( x) = c x . Por
Nh N h ⋅ dx
tanto, su frecuencia absoluta viene dada por:

nx = f ( x ) ⋅ N hc ⋅ dx = α ⋅ hα x −α −1 ⋅ N hc ⋅ dx .

La renta total correspondiente a los individuos con una renta determinada x en el


intervalo [x,x+dx] viene dada por

t x = x ⋅ nx = xα ⋅ hα x −α −1 ⋅ N hc ⋅ dx = α ⋅ hα x −α ⋅ N hc ⋅ dx

tx
La densidad de la renta total absoluta de esos individuos es h( x) = . Luego,
dx

h( x)dx = t x = α ⋅ hα x −α ⋅ N hc ⋅ dx .

La cantidad total de todas las rentas cuyos valores individuales son superiores a
+∞ +∞
una renta dada x viene dada por Txc = ∑ ts = ∑ h( s)ds . La expresión integral
x x

sería:

111
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

+∞ +∞
x −α +1
Txc = ∫ h( s )ds = ∫( )
α ⋅ hα s −α ⋅ N hc ds = α ⋅ hα N hc
α −1
x x

α ⋅ hα N hc x −α +1
Txc = (4.1)
α −1

Y por tanto, se obtiene que el ingreso total es:

α ⋅ hN hc
Thc =
α −1

La cantidad total de todas las rentas cuyos valores individuales son inferiores a
una renta dada x viene dada por la expresión

α ⋅ hN hc α ⋅ hα N hc x −α +1
Tx = Thc − Txc = − , luego:
α −1 α −1
α −1 
α ⋅ h N hc   h 
Tx = 1 − 
α − 1   x  

Veamos ahora qué proporción del ingreso total, Qxc , está en manos de la
población más rica con ingresos superiores a un x dado (donde x ≥ h ). Puede
verse, por (4.1), que:
x −α +1
Txc
α ⋅ hα N hc −α +1
c −α + 1 x
Qx = c = −α +1
=  (4.2)
Th α c h h
α ⋅ h Nh
−α + 1

α
x h
Ahora, despejando en S ( x) =   y sustituyendo en (4.2), se obtiene:
h x
α −1
Qxc = S ( x ) α (4.3)

112
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

Es decir, obtenemos una fórmula que informa sobre qué proporción del ingreso
total es controlada por la proporción más rica de la sociedad.

De aquí, la regla de Pareto del “80/20”, para la cual, Qc = 0.8 y S = 0.2 se


obtienen cuando el parámetro toma el valor α = 1.16.

Igualmente, la ordenada de la curva de Lorenz en la distribución de Pareto


viene dada por :
α −1 α −1 1
1−
Qx = 1 − Qxc = 1 − S ( x ) α = 1 − (1 − F ( x ) ) α = 1 − (1 − F ( x ) ) α

1
1−
Qx = 1 − (1 − F ( x ) ) α (4.4)

Es decir, la relación entre Q(x) y F(x) sólo depende de α .

4.2.4. Propiedad de un solo cruce

Veamos que dos funciones de distribución paretianas se cruzan, a lo más, una


vez.

En efecto, sean X 1 ∼ P(α1, h1 ) , X 2 ∼ P(α 2 , h2 ) . Si sus funciones de


distribución se cruzan se ha de verificar que
α1 α2 1/ (α1 −α 2 )
h  h  h1α1 α1 −α 2  h1α1 
1−  1  = 1−  2  ⇒ α =x ⇒ x =  α 
x  x h2 2  h2
2

1/ (α1 −α 2 )
 h α1 
x =  1α  (4.5)
 h2 
2

Donde, ese valor de x obtenido ha de ser mayor que h1 y h2.

113
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

Realmente, la única posibilidad para que se crucen una vez en algún punto
intermedio es cuando se da que h1 > h2 y α1 > α 2 , en cualquier otro caso no se
cruzan en ningún punto intermedio.

Esta propiedad será importante a la hora de establecer un criterio


suficiente de dominancia estocástica de segundo orden, como será visto en el
capítulo 6.

4.3. JUSTIFICACIÓN DE LA DISTRIBUCIÓN PARETO-CUADRÁTICA

Tal como hemos comentado anteriormente, la distribución del número de


trabajadores de las empresas, los puntos (Ln xi, Ln Si), no se encuentran sobre
una línea recta sino sobre una línea curva, independientemente del año y del país
investigado.

Nos proponemos determinar un modelo que relacione Ln xi y Ln Si, pues


el disponer, a priori, de una función de densidad que modele las diferentes curvas
del números de trabajadores, a partir de datos empíricos, permitirá interpolar
dentro de los intervalos de trabajadores que suelen aparecer en los estudios
empíricos y extrapolar para valores diferentes a los obtenidos en dichos estudios;
permitiendo obtener conclusiones significativas con relación al número de
empresas con un cierto rango de trabajadores.

Los parámetros de dichas distribuciones, que se pueden estimar por


diversos métodos, pueden usarse para obtener, a partir de ellos, indicadores de
posición, de dispersión, de forma y de velocidad de cambio de las distribuciones
estudiadas. Esto permitirá comparar distribuciones diferentes de forma simple y
eficaz.

114
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

Han sido analizados los datos de empresas españolas en los períodos


anteriores a la crisis económica de 2007 (2006), en plena crisis (2010), y en una
fase final de la crisis (2012). También han sido estudiados los datos de 2014 para
España, Alemania y Reino Unido (UK). Se han estudiado las empresas que
tienen como mínimo 10 trabajadores.

Los datos del número de trabajadores para España en los años 2006, 2010
y 2012 han sido tomados de la base de datos sobre información financiera de
empresas denominada SABI (Sistema de Análisis de Balances Ibérico),
especializada en España y Portugal. Los datos para 2014, de España, Alemania y
Reino Unido han sido extraídos de la base de datos Lexis-Nexis de cobertura
internacional.

Los datos, una vez obtenidos, han sido tratados convenientemente para ser
dispuesto en tablas de distribuciones de frecuencias, que son las que finalmente
aparecen en el presente trabajo.

Con relación al tamaño de las plantillas, dado un número x de


trabajadores, Fx representa el número de empresas que tienen, a lo más, ese
número de trabajadores y, por tanto, Sx representa el número de empresas que
tienen más de ese número de trabajadores (unas veces será en términos absolutos
y otras en términos relativos). En las gráficas que se muestran a continuación
aparecen, por un lado, los datos observados, y por otro, la recta de regresión
lineal obtenida al considerar el modelo de Pareto, es decir, la regresión lineal de
Ln (Si ) frente a Ln( xi), Ln( Si ) = a + bLn( xi ) y, también, la curva obtenida al
hacer la regresión cuadrática de Ln (Si) frente a Ln(xi),
Ln( Si ) = a + bLn( xi ) + cLn 2 ( xi ) .

115
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

En el caso de España, Tabla 4.1 (Anexo 1), la distribución del nº de


trabajadores de las empresas para el año 2006 es:

[Li-1 Li] Fi Si LnLi LnSi


9 0 149217 2.19722458 11.9131569
10 13 43710 105507 2.56494936 11.5665326
14 19 78227 70990 2.94443898 11.1702943
… … …. …. …. ….

15136 20479 149214 3 9.92715525 1.09861229


20480 30271 149216 1 10.3179454 0
30272 40959 149217 0 10.6203268

Tabla 4.1: Distribución del nº de trabajadores de las empresas españolas, 2006

En la siguiente gráfica, Figura 4.1, se muestran, para el año 2006, los


datos observados y, como se ha indicado antes, la recta y la curva obtenidas al
hacer la regresión lineal y cuadrática de Ln (Si ) frente a Ln( xi ).

Figura 4.1: Regresiones de Ln (Si ) frente a Ln( xi ). España 2006.

116
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

El resumen de los dos modelos y las estimaciones de sus parámetros para


este año 2006, Tabla 4.2, son:

Resumen del modelo Estimaciones de parámetro


Ecuación R
F gl1 gl2 Sig. Constante b1 b2
cuadrado
Lineal 0.99082 2374.927 1 22 .000 15.568 -1.413
Cuadrático 0.99902 10682.679 2 21 .000 13.601 -.674 -.059

Tabla 4.2: Coeficientes de regresiones de Ln (Si ) frente a Ln( xi ). España 2006

La distribución del nº de trabajadores de las empresas para España en el


año 2010 (Anexo 2), Tabla 4.3, es:

[Li-1 Li] Fi Si LnLi LnSi


9 0 123832 2.19722458 11.7266811
10 13 37483 86349 2.56494936 11.3661525
14 19 65800 58032 2.94443898 10.9687499
… … …. …. …. ….

15136 20479 123828 4 9.92715525 1.38629436


20480 30271 123829 3 10.3179454 1.09861229
30272 40959 123832 0 10.6203268

Tabla 4.3: Distribución del nº de trabajadores de las empresas españolas, 2010

En la gráfica, Figura 4.2, se muestran, para España en el año 2010, la


recta y la curva obtenidas al hacer la regresión lineal y cuadrática:

117
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

Figura 4.2: Regresiones de Ln (Si ) frente a Ln( xi ). España 2010.


El resumen de los dos modelos y las estimaciones de sus parámetros para
el año 2010, Tabla 4.4, son:

Resumen del modelo Estimaciones de parámetro


R
Ecuación cuadrado F gl1 gl2 Sig. Constante b1 b2
Lineal 0.99455 4015.702 1 22 .000 15.090 -1.334

Cuadrático 0.9993 15018.962 2 21 .000 13.679 -.804 -.042

Tabla 4.4: Coeficientes de regresiones de Ln (Si ) frente a Ln( xi ). España 2010

118
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

La distribución del nº de trabajadores de las empresas para España en el


año 2012 (Anexo 3), Tabla 4.5, es:

[Li-1 Li] Fi Si LnLi LnSi


9 0 100070 2.19722458 11.5136252
10 13 30136 69934 2.56494936 11.1553072
14 19 53272 46798 2.94443898 10.7535957
… … …. …. …. ….

20480 30271 100068 2 10.3179454 0.69314718


30272 40959 100069 1 10.6203268 0
40960 60543 100070 0 11.0111091

Tabla 4.5: Distribución del nº de trabajadores de las empresas españolas, 2012

En la gráfica, Figura 4.3, se muestran las regresiones lineal y cuadrática ,


para España en el año 2012:

Figura 4.3: Regresiones de Ln (Si ) frente a Ln( xi ). España 2012.

119
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

El resumen de los dos modelos y las estimaciones para el año 2012, Tabla
4.6, son:

Resumen del modelo Estimaciones de parámetro


R
Ecuación cuadrado F gl1 gl2 Sig. Constante b1 b2
Lineal 0.99071 2452.687 1 23 .000 15.024 -1.351
Cuadrático 0.99877 8951.022 2 22 .000 13.138 -.657 -.054

Tabla 4.6: Coeficientes de regresiones de Ln (Si ) frente a Ln( xi ). España 2012

Seguidamente se muestran las gráficas conjuntas de las funciones de


distribución, de densidad y de supervivencia de los 3 años mencionados para el
caso del nº de trabajadores de las empresas españolas:

Funciones de densidad. Nº trabajadores


ESPAÑA 2006 ESPAÑA 2010 ESPAÑA 2012
0,05

0,04

0,03

0,02

0,01

0
15 25 35 45 55 65 75 85 95

Figura 4.4: Funciones de densidad empíricas. España.

120
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

LN de Funciones de densidad vs X (escala Log)

ESPAÑA 2006 ESPAÑA 2010 ESPAÑA 2012

-1
10 100
-1,5

-2

-2,5

-3

-3,5

-4

Figura 4.5: Funciones de densidad emp.(menos de 100 trabajadores).

LN de Funciones de densidad vs X (escala Log)


ESPAÑA 2006 ESPAÑA 2010 ESPAÑA 2012

-2 100 1000 10000 100000

-4

-6

-8

-10

-12

Figura 4.5 bis: Funciones de densidad emp.( más de 100 trabajadores).

121
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

Funciones de densidad. Nº Trabajadores 10 a 19


ESPAÑA 2006 ESPAÑA 2010 ESPAÑA 2012
0,078

0,058

0,038

0,018
10 20

Figura 4.6: Funciones de distribución empíricas. España. 10 a 19 trabaj.

Funciones de densidad. Nº Trabajadores 20 a 55


ESPAÑA 2006 ESPAÑA 2010 ESPAÑA 2012
0,03

0,02

0,01

0
20 30 40 50 60 70

Figura 4.7: Funciones de densidad empíricas. España. 20 a 55 trabaj.

122
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

Funciones de densidad. Nº Trabajadores de 56 en adelante


ESPAÑA 2006 ESPAÑA 2010 ESPAÑA 2012
0,004

0,003

0,002

0,001

0
60 70 80 90 100 110 120

Figura 4.8: Funciones de distribución empíricas. España. +55 trabaj.

Estos gráficos permiten observar que hay tres zonas claramente


diferenciadas, y podemos obtener las siguientes conclusiones:

• La proporción de empresas cuyo número de trabajadores es


inferior a 20 en 2006 es menor que en 2012 (Figuras 4.5 y 4.6). Nótese
que a partir del segundo punto de las gráficas (de valor 23.5) la marca de
clase del tercer intervalo, de 20 a 27 trabajadores, las gráficas comienzan a
cruzarse. Antes de ese punto, permanece España-2006 por abajo, y luego
por arriba.
• La proporción de empresas cuyo número de trabajadores
oscila entre 20 y 55 trabajadores ha ido descendiendo a lo largo de esos
años. En 2006 es mayor que en 2010 y en éste mayor que en 2012
(Figuras 4.4, 4.5 y 4.7). Nótese que a partir de la marca de clase del sexto
intervalo de 56 a 79 trabajadores (de valor 67.5), las gráficas se vuelven a
cruzar y se invierte el proceso.

123
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

• La proporción de empresas, a partir de 56 trabajadores, ha


ido aumentando a lo largo de esos años. En 2006 es menor que en 2012
(Figuras 4.4, 4.5 y 4.8).

Para corroborar estadísticamente estas afirmaciones vamos a hacer varios


contrastes de hipótesis.

Para el caso de las empresas de hasta 19 trabajadores, si definimos;


1 si la i − esima empresa del año t tiene 19 trabajadores o menos
X i ,t = 
0 en otro caso
las Xi,t son distribuciones de Bernoulli:

Xi,06 es de parámetro p06 = p[X06 = 1], cuya estimación muestral

es 
p06 =78227/149217=0.52

Xi,10 es de parámetro p10= p[X10 = 1], cuya estimación muestral

es 
p10 = 65800 = 0.35
123832

Xi,12 es de parámetro p12= p[X12 = 1], cuya estimación muestral

es 
p12 = 53272 = 0.13
100070

Pretendemos hacer los tres contrastes siguientes para cada una de las tres
zonas señaladas anteriormente:

H 0 : p06 = p10

H 0 : p10 = p12

H 0 : p06 = p12

124
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

Dado que el intervalo de confianza para la diferencia de medias de dos


distribuciones normales, µ1 − µ 2 , viene dado por la expresión:

 
σ 12 σ 22
(  
)
µ1 − µ2 ± z1−α / 2 ⋅ +
n1 n2

el intervalo asintótico para la diferencia de dos proporciones en el caso de la


población con distribución de Bernoulli (la media muestral coincide con la
proporción observada) es:

 
( 
p1 −  )
p2 ± z1−α / 2 ⋅
p1 q1 p2 q2
n1
+
n2
(4.6)

El resumen de los nueve contrastes sobre las diferencias de proporciones


de empresas para los distintos años, para cada tamaño de empresa indicado
anteriormente, Tabla 4.7, al nivel de significación del 5%, es:

IC p06-p10 p10-p12 p06-p12


Nº trab. Extr_inf. Extr_sup. Extr_inf. Extr_sup. Extr_inf. Extr_sup.
10 a 19 -0.012 -0.002 -0.007 0.005 -0.014 -0.003
20 a 55 0.007 0.019 0.001 0.014 0.014 0.027
más 55 -0.013 0.001 -0.014 0.001 -0.020 -0.005

Tabla 4.7: Contrastes sobre las diferencias de proporciones. España

Luego, para las empresas de 10 a 19 trabajadores se tiene que puede


considerarse que p12 > p06 , p10 > p06 , pero la hipótesis H 0 : p10 = p12 , no se
puede rechazar.

125
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

Resumiendo, la proporción de empresas de 10 a 19 trabajadores ha


aumentado de 2006 a 2010 y de 2006 a 2012, pero se ha mantenido constante
entre 2010 y 2012 (realmente significa que no se puede rechazar esa hipótesis).

Para las empresas de 20 a 55 trabajadores se tiene que puede considerarse


que p12 < p10 < p06 , es decir, la proporción de empresas de 20 a 55 trabajadores
ha disminuido de 2006 a 2010 y de 2010 a 2012, por tanto ha disminuido entre
2006 y 2012.

Para las empresas de más de 55 trabajadores se tiene que sólo puede


considerarse que p12 > p06 , es decir, la proporción de empresas de más de 55
trabajadores ha aumentado de 2006 a 2012.

De los resultados anteriores, la conclusión que podemos extraer del


análisis de los datos empíricos es que la crisis ha afectado fundamentalmente a
las empresas de tamaño intermedio y, en mucha menor medida, a las empresas
pequeñas y grandes.

Seguidamente, para ver la bondad del ajuste propuesto, en comparación


con otros habituales en distribuciones asimétricas a la derecha haremos la
comparación de la distribución Pareto-cuadrática con la distribución de Pareto y
la Logaritmo Normal, mediante el cálculo de la distancia de Kolmogorov, para el
caso de España 2006, 2010 y 2012.

Para España, 2006, 2010 y 2012 (Anexos 4 al 6) tenemos las tablas que se
muestran a continuación, Tabla 4.8 a Tabla 4. 13, donde, para cada año aparecen
dos tablas, la primera de ellas corresponde a los errores de la estimación de la
función de supervivencia por los tres ajustes, Pareto, Pareto-cuadrático y

126
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

Lognormal, y la segunda tabla al máximo error que se pueden obtener en el


cálculo de la probabilidad de un intervalo.

[Li-1 Li] Si empíricas errorlineal errorcuad. error_LogN


9 1 0 0 0.04662347
10 13 0.70707091 0.11231181 0.00320365 0.11814707
14 19 0.47575008 0.12784358 -0.00601624 0.11009948
… … …. …. …. ….

15136 20479 2.0105E-05 2.0568E-06 -1.567E-06 -6.7016E-06


20480 30271 6.7016E-06 -3.6884E-06 -3.7404E-06 0
30272 40959 0

Tabla 4.8: Ajuste de Pareto, Pareto-cuadrático y Lognormal. España.2006

lineal cuadrático Lognormal


max(error+) 0.12784358 0.00320365 0.11814707
max(error -) -3.6884E-06 -0.02592238 -0.02623735
MaxErrInterv 0.12784727 0.02912603 0.14438442

Tabla 4.9: Resumen ajustes. España.2006

[Li-1 Li] Si empíricas errorlineal errorcuad. error_LogN


9 1 0 0 0.05019799
10 13 0.69730764 0.08508119 0.00602039 0.1232238
14 19 0.46863492 0.09965161 0.00195948 0.11983429
… … …. …. …. ….

15136 20479 3.2302E-05 -8.6363E-07 -6.7301E-06 -2.4226E-05


20480 30271 2.4226E-05 4.537E-06 3.7781E-06 0
30272 40959 0

Tabla 4.10: Ajuste de Pareto, Pareto-cuadrático y Lognormal. España.2010

127
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

lineal cuadrático Lognormal


max(error+) 0.09965161 0.00602039 0.1232238
max(error -) -8.6363E-07 -0.01355485 -0.02799861
MaxErrInterv 0.09965247 0.01957524 0.15122241

Tabla 4.11: Resumen ajustes. España.2010

[Li-1 Li] Si empíricas errolineal errorcuad. error_LogN


9 1 0 0 0.04813892
10 13 0.6988508 0.0855842 -0.01565917 0.12807015
14 19 0.46765264 0.09739437 -0.02973588 0.12444857
… … …. …. …. ….

20480 30271 1.9986E-05 -4.5549E-07 5.936E-08 -9.993E-06


30272 40959 9.993E-06 -3.681E-06 -1.6127E-06 0
40960 60543 0

Tabla 4.12: Ajuste de Pareto, Pareto-cuadrático y Lognormal. España.2012

lineal cuadrático Lognormal


max(error+) 0.09739437 0.00010065 0.12807015
max(error -) -3.681E-06 -0.03597633 -0.02912104
MaxErrInterv 0.09739805 0.03607698 0.15719119

Tabla 4.13: Resumen ajustes. España.2012

Obteniendo las siguiente tablas, Tabla 4.14 y Tabla 4.15 , para el caso de
España, donde se resume la bondad del ajuste Pareto-cuadrático.

128
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

En la Tabla 4.14 se muestra claramente que el ajuste Pareto-cuadrático


produce menores errores que el de Pareto y el Lognormal.

ESPAÑA. Nº TRABAJADORES errolineal errorcuad error_logN


2006
Máximo error + 0.12784358 0.00320365 0.11814707
Máximo error - -3.6884E-06 -0.02592238 -0.02623735
Máximo error en intervalo=
max(error+)-max(error -) 0.12784727 0.02912603 0.14438442
Máximo error en un intervalo (%) 12.7847268 2.91260296 14.438442
2010
Máximo error + 0.09965161 0.00602039 0.1232238
Máximo error - -8.6363E-07 -0.01355485 -0.02799861
Máximo error en intervalo=
max(error+)-max(error -) 0.09965247 0.01957524 0.15122241
Máximo error en un intervalo (%) 9.96524707 1.95752393 15.122241

2012
Máximo error + 0.09739437 0.00010065 0.12807015
Máximo error - -3.681E-06 -0.03597633 -0.02912104
Máximo error en intervalo=
max(error+)-max(error -) 0.09739805 0.03607698 0.15719119
Máximo error en un intervalo (%) 9.73980543 3.60769827 15.719119

Tabla 4.14: Errores lineal, cuadrático y lognormal. España 2006 a 2012

En la Tabla 4.15 aparece la relación que existe entre la proporción de


varianza no explicada por los dos modelos directamente competidores, el Pareto
y el Pareto-cuadrático, mostrando claramente la sustancial mejora que aporta el
Pareto-cuadrático.

1-R2 lineal cuadrático lineal/cuadrático %


2006 0.00918 0.00098 9.36734694 936.734694
2010 0.00545 0.0007 7.78571429 778.571429
2012 0.00929 0.00123 7.55284553 755.284553

Tabla 4.15: Relación entre las proporciones de varianza no explicada. España

129
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

Parecidas tablas y conclusión se obtiene para el caso del tamaño de las


plantillas de las empresas de España, Alemania y Reino Unido en 2014.

La distribución del nº de trabajadores de las empresas para España en el


año 2014 (Anexo 7), Tabla 4.16, es:

[Li-1 Li] Si relativo LnLi LnSi_relat


9 1 2.19722458 0
10 14 0.66929524 2.63905733 -0.40153
15 20 0.45751848 2.99573227 -0.78193801
…. …. …. …. ….
30273 40960 4.5061E-05 10.6203513 -10.0074871
40961 60544 1.1265E-05 11.0111257 -11.3937815
60545 81920 0 11.3134984

Tabla 4.16: Distribución del nº de trabajadores. España, 2014

Pero para que la estimación no salga distorsionada por las últimas


categorías, en las que hay muy pocas empresas, eliminaremos estas últimas
categorías, quedando la tabla para España 2014, Tabla 4.17, con los siguientes
datos:

[Li-1 Li] Si relativo LnLi LnSi_relat


9 1 2.19722458 0
10 14 0.66929524 2.63905733 -0.40153
15 20 0.45751848 2.99573227 -0.78193801
…. …. …. …. ….
7569 10240 0.00061959 9.2340569 -7.38644832
10241 15136 0.00039429 9.62483129 -7.83843344
15137 20480 0.00023657 9.92720408 -8.34925907

Tabla 4.17: Distribución recortada del nº de trabajadores. España, 2014

130
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

El resumen de los modelos correspondientes se muestra en la Tabla 4.18 y


la Figura 4.9:

Estimaciones de
Resumen del modelo parámetro
Ecuación R cuadrado F gl1 gl2 Sig. b1 b2
Lineal 0.99986 154782.297 1 22 .000 -1.054
Cuadrático 0.99991 111369.403 2 21 .000 -1.025 -.005

Tabla 4.18: Coeficientes de regresiones de Ln (Si ) frente a Ln( xi ). España 2014

Figura 4.9: Regresiones de Ln (Si ) frente a Ln( xi ). España 2014.

La distribución del nº de trabajadores de las empresas para Alemania en el


año 2014 (Anexo 8), Tabla 4.19, es:

131
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

[Li-1 Li] Si relativo LnLi LnSi_relat


9 1 2.19722458 0
10 14 0.73609558 2.63905733 -0.30639531
15 20 0.53947766 2.99573227 -0.6171539
…. …. …. …. ….
40961 60544 5.28E-05 11.0111257 -9.84899777
60545 81920 4.8E-06 11.3134984 -12.246893
81921 100000 0 11.5129255

Tabla 4.19: Distribución del nº de trabajadores. Alemania 2014

Quitando los últimos datos nos queda, Tabla 4.20:

[Li-1 Li] Si relativo LnLi LnSi_relat


9 1 2.19722458 0
10 14 0.73609558 2.63905733 -0.30639531
15 20 0.53947766 2.99573227 -0.6171539
…. …. …. …. ….
15137 20480 0.0004464 9.92720408 -7.71429355
20481 30272 0.0002064 10.3179785 -8.48569292
30273 40960 0.0001248 10.6203513 -8.9887965

Tabla 4.20: Distribución recortada del nº de trabajadores. Alemania 2014

El resumen de los modelos correspondientes, Tabla 4.21 y Figura 4.10, es:

Estimaciones de
Resumen del modelo parámetro
Ecuación R cuadrado F gl1 gl2 Sig. b1 b2
Lineal 0.99238 3127.564 1 24 .000 -.944
Cuadrático 0.99966 33632.742 2 23 .000 -.630 -.049

Tabla 4.21: Coeficientes de regresiones de Ln (Si ) frente a Ln( xi ). Alemania


2014

132
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

Figura 4.10: Regresiones de Ln (Si ) frente a Ln( xi ). Alemania 2014.

La distribución del nº de trabajadores de las empresas para Reino Unido

en el año 2014 (Anexo 9), Tabla 4.22, es:

[Li-1 Li] Si relativo LnLi LnSi_relat


9 1 2.19722458 0
10 14 0.74833909 2.63905733 -0.28989907
15 20 0.56275478 2.99573227 -0.57491131
…. …. …. …. ….
40961 60544 9.1685E-05 11.0111257 -9.29715301
60545 81920 2.1158E-05 11.3134984 -10.7634901
81921 100000 0 11.5129255
Tabla 4.22: Distribución del nº de trabajadores. Reino Unido, 2014

Quitando los últimos datos, nos queda para Reino Unido 2014, Tabla 4.23:

133
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

[Li-1 Li] Si relativo LnLi LnSi_relat


9 1 2.19722458 0
10 14 0.74833909 2.63905733 -0.28989907
15 20 0.56275478 2.99573227 -0.57491131
…. …. …. …. ….
15137 20480 0.00081811 9.92720408 -7.10851218
20481 30272 0.00046548 10.3179785 -7.67244763
30273 40960 0.00024684 10.6203513 -8.30675431

Tabla 4.23: Distribución recortada del nº de trabajadores. Reino Unido, 2014

El resumen de los modelos correspondientes, Tabla 4.24 y Figura 4.10, es:

Estimaciones de
Resumen del modelo parámetro
Ecuación R cuadrado F gl1 gl2 Sig. b1 b2
Lineal 0.99175 2885.443 1 24 .000 -.862
Cuadrático 0.99948 21901.573 2 23 .000 -.567 -.046
Tabla 4.24: Coeficientes de regresiones de Ln (Si ) frente a Ln( xi ). R.U, 2014

Figura 4.10: Regresiones de Ln (Si ) frente a Ln( xi ). Reino Unido 2014.

134
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

La tabla 4.25 muestra de nuevo la optimalidad del modelo Pareto-


cuadrático, al disminuir considerablemente con él la proporción de varianza no
explicada.

(1-R2 lineal)/(1-R2 cuadrático) %


España. 2014 1.55555556 155.555556
Alemania. 2014 22.4117647 2241.17647
Reino Unido. 2014 15.8653846 1586.53846

Tabla 4.25: Relación entre las proporciones de varianza no explicada.2014

Esto nos ha llevado a proponer la denominada distribución “Pareto-


cuadrática”, con el objetivo de mejorar el ajuste a la nube de puntos en estas
situaciones. Es decir, proponemos el ajuste:

Ln( Si ) = a + bLn( xi ) + cLn 2 ( xi ) (4.7)

Cuando la distribución sea de ese tipo, diremos que X sigue una


distribución Pareto-cuadrática de parámetros a, b y c, y lo notaremos por
X ∼ PC (a, b, c) . Si bien, posteriormente se verá que sólo hay dos verdaderos
parámetros, pues uno depende de los otros dos.

A continuación se muestran los gráficos con las funciones de distribución,


de supervivencia y de densidad empíricas de los tamaños de las plantillas de las
empresas, para el año 2014, de los tres países (España, Alemania y Reino Unido),
Figuras 4.11, 4.12 y 4.13:

135
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

Funciones de distribución. Nº Trabajadores. 2014


ESPAÑA 2014 ALEMANIA 2014 REINO UNIDO 2014
1,2

0,8

0,6

0,4

0,2

0
0 500 1000 1500

Figura 4.11: Funciones de distribución empíricas, 2014.

Funciones de Supervivencia. Nº Trabajadores. 2014


ESPAÑA 2014 ALEMANIA 2014 REINO UNIDO 2014
1,2

0,8

0,6

0,4

0,2

0
0 10 20 30
-0,2

Figura 4.12: Funciones de supervivencia empíricas, 2014.

136
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

Funciones de densidad empíricas. 2014

ESPAÑA 2014 ALEMANIA 2014 REINO UNIDO 2014


0,09
0,08
0,07
0,06
0,05
0,04
0,03
0,02
0,01
0
10 20 30 40 50 60 70 80 90 100

Figura 4.13: Funciones de densidad empíricas, 2014.

Funciones de densidad empíricas. 2014


(X escala logarítmica)
ESPAÑA 2014 ALEMANIA 2014 REINO UNIDO 2014

0,0145
0,0125
0,0105
0,0085
0,0065
0,0045
30

Figura 4.13 bis: Funciones de densidad empíricas, 2014

A continuación aparecen las funciones de supervivencia y de densidad


paretianas y pareto-cuadráticas estimadas, Figura 4.14 a Figura 4.17:

137
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

Función de Supervivencia Paretiana Estimada 2014

ESPAÑA 2014 ALEMANIA 2014 REINO UNIDO 2014


1

0,8

0,6

0,4

0,2

0
0 200 400 600 800 1000

Figura 4.14: Funciones de supervivencia paretianas, 2014.

Función de Supervivencia Pareto-cuadrática Estimada. 2014


ESPAÑA 2014 ALEMANIA 2014 REINO UNIDO 2014
1

0,8

0,6

0,4

0,2

0
0 200 400 600 800 1000

Figura 4.15: Funciones de supervivencia paretoecuadráticas, 2014

138
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

Funciones de densidad Paretianas estimadas. 2014


(X escala logarítmica)

ESPAÑA 2014 ALEMANIA 2014 REINO UNIDO 2014


0,1
0,08
0,06
0,04
0,02
0
10 100

Figura 4.16: Funciones de densidad paretianas, 2014

Funciones de densidad Pareto-cuadráticas estimadas. 2014


(X escala logarítmica)

ESPAÑA 2014 ALEMANIA 2014 REINO UNIDO 2014

0,1
0,08
0,06
0,04
0,02
0
10 100

Figura 4.17: Funciones de densidad pareto-cuadráticas, 2014

139
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

Las conclusiones que se pueden obtener son:

• Dado que el punto donde se cortan las funciones de densidad


está entre 30 y 40, punto del cuarto intervalo, eso quiere decir que las
empresas de, a lo sumo, 28 trabajadores (el extremo superior del intervalo
anterior) son más frecuentes proporcionalmente en España que en
Alemania y Reino Unido (Figura 4.13).

• El resultado anterior queda mejor plasmado con el ajuste


Pareto-cuadrático que con el ajuste Pareto (Figuras 4.13, 4.16 y 4.17),
pues en el Pareto-cuadrático las curvas están más claramente separadas.

• Fijado un nº de trabajadores, la proporción de empresas que


superan ese nº de trabajadores en Reino Unido es mayor que en Alemania,
y en esta mayor que en España, Figura 4.11 y Figura 4.12, pues se observa
que Alemania y Reino Unido dominan en grado I, en función de
distribución, a España, y que Reino Unido domina a Alemania.

• El coeficiente α en el ajuste de Pareto, Figura 4.14, para


España será más negativo que en Alemania y en Alemania más negativo
que en Reino Unido, pues la inclinación en los primeros valores es más
acusada en esa ordenación de países. Ello significa, por la relación del
coeficiente α con el índice de Gini, que los tamaños de las empresas
españolas son más parecidos entre sí que los de las alemanas, y los de
éstas son más parecidos entre sí que los de las británicas.

Seguidamente se muestran algunas propiedades de la distribución Pareto-


cuadrática.

140
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

4.4. ALGUNAS PROPIEDADES DE LA DISTRIBUCIÓN PC

Vamos a mostrar algunas propiedades de la distribución Pareto-cuadrática; es


decir, aquella cuya función de supervivencia viene dada por el ajuste
Ln( S ) = a + bLn( x) + cLn 2 ( x) . En principio, tal como hemos comentado
anteriormente, parece poseer tres parámetros a, b y c; por ello la notaremos
X ∼ PC (a, b, c); b, c < 0 .

4.4.1. Funciones de distribución y de densidad. Momentos

Dado que se parte del ajuste cuadrático


Ln( S ) = a + bLn( x) + cLn 2 ( x)
Se tendrá que la función de supervivencia, viene dada como:
c
( )
b ( Ln ( x ) )2 
2 a Ln ( x )
Ln( S ) = a + bLn( x) + cLn ( x) → S = e e e  →
 
Ln ( x ) c
S ( x) = e a
( x) b
 e

( Ln ( x )
)  → S ( x) = e x x

a b cLn ( x )
= e a xb+cLn( x ) = Axb+cLn( x )

Es decir, la función de supervivencia viene dada por la expresión:

S ( x ) = Axb+cLn( x ) , A = ea (4.8)

Luego, la función de distribución será:

F ( x ) = 1 − S ( x ) = 1 − Axb+cLn ( x ) , A = e a (4.9)

Y por tanto, derivando, obtenemos que su función de densidad, Figura 4.18, tiene
la forma:

141
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

f ( x ) = F´( x ) = − Axb+cLn( x )−1 ( b + 2cLn( x) ) , A = ea (4.10)

Figura 4.18: Función de densidad de la distribución PC

Calculemos seguidamente el punto inicial del soporte de definición y el valor


modal.

El punto inicial del dominio de esa distribución es donde la expresión


asignada a la función de densidad corta al eje OX; es decir, cuando
−b
f ( x) = 0 → x = e 2c
−b
(4.11)
x= e 2c

−b
Obsérvese, que dado que b y c son negativos, se tiene que e 2c < 1 ; es decir, el
valor “natural” de arranque de la distribución PC es inferior a 1.

Como la función de supervivencia, S ( x ) = ea xb+cLn ( x ) , en el punto inicial ha de

valer uno, se tendrá que cumplir:

142
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

−b
b+ cLn ( e 2 c ) b2
 −b   −b  a− b2
S  e 2c  = 1 → ea  e 2c  =1→ e 4c =1→ a =
    4c
   

b2
a= (4.12)
4c

Y, por consiguiente, la distribución PC no es triparamétrica, sino biparamétrica,


sus únicos parámetros son b y c. Por tanto, la notaremos X ∼ PC (b, c); b, c < 0 .
Su función de supervivencia será:

 b2 −
b
e 4c xb+cLn( x ) x≥e 2c
S ( x) =  (4.13)
b
 −
 1 x≤e 2c

El valor modal se obtiene en el punto en el que la derivada de la función de


densidad se anula; es decir, dado que:

(
f ´( x ) = − Axb+cLn ( x )−2 4c 2 Ln 2 ( x) + 2(2b − 1)cLn( x) + b 2 − b + 2c )

Tenemos que:
1− 2b − 1−8c
f ´( x ) = 0 → M o = e 4c

Es decir,

1− 2b − 1−8c
(4.14)
Mo = e 4c

143
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

En las situaciones prácticas que han sido analizadas, la moda siempre es


inferior al valor x=1. Veamos, en general, qué condición ha de cumplirse para
que la moda sea mayor que uno.

Dado que c siempre es negativa, la condición anterior equivale a

1 − 1 − 8c 1 + 1 − 8c
M o ≥ 1 ↔ 1 − 2b − 1 − 8c ≤ 0 ↔ ⋯ ↔ b 2 − b + 2c ≤ 0 ↔ ≤b≤
2 2

Y puesto que b siempre es negativo, se tendrá que el lado derecho de la


desigualdad anterior, por ser positivo, no aporta nada, con lo que se tiene que

1 − 1 − 8c
Mo ≥ 1 ↔ ≤b
2
Ahora, como c es próximo a cero, -0.1<c<0, desarrollando en serie de Taylor la
expresión anterior en un entorno de c=0, se tiene que
1 − 1 − 8c 1 − (1 − 4c)
≃ = 2c
2 2
luego, para que la moda sea superior a uno se tendría que cumplir, de una
manera aproximada, que b ≥ 2c ; es decir, −0.2 ≤ b < 0 , que no se ha dado en
ninguno de los casos analizados.

Con respecto a la media, dado que:

−b
+∞ +∞ e 2c +∞ b2
µ= ∫ (1 − F ( x) )dx = ∫ S ( x)dx = ∫ 1dx + ∫
−b
e 4c xb+cLn( x ) dx
0 0 0 e 2c

se obtiene:

144
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

1+ 2b
−   1 
b πe 4c
1 + Erf  

  2 −c   (4.15)
µ= e c2 +
2 −c

Donde Erf ( x) es la función error, definida como:

x
2 −t 2
π ∫
Erf ( x) = e dt (4.16)
0

Cuya gráfica aparece en la Figura 4.19:

Figura 4.19: Gráfica de la función Erf(x)

Los demás momentos pueden calcularse teniendo en cuenta que se cumple que

+∞

∫ x (1 − F ( x) )dx
k −1
µk = E  X k  = k (4.17)
0

con lo que:

145
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

 e− b 2 c +∞ b
2

 k −
µk = E  X  = k ∫ x dx + ∫ e 4c x
k 1 k −1+ b + cLn ( x )
dx 
 −b

 0 e 2c 

k ( k + 2b )
−   k 
kb π ke 4c
1 + Erf  

  2 −c   (4.18)
µk = E  X k  = e 2c +
2 −c

Por otro lado, puede observarse que la distribución Pareto-Cuadrática no cumple


la ley de Mandelbrot-Dagum; esto es, no cumple la propiedad de converger
asintóticamente a la ley de Pareto:
S ( x)
lim −α
≠ 1, α > 0
x →+∞
x
 
h

Con relación a los cambios de escala, puede comprobarse que:

X ∼ PC (b, c) → Y = kX ∼ PC ( B = b − 2cL n ( k ) , C = c) (4.19)

Es decir, su función de supervivencia verifica la ecuación:

Ln( SY ) = A + BLn( y ) + CLn 2 ( y )

donde A = a − bL n ( k ) − cL n 2 ( k ) , B = b − 2cL n ( k ) , C = c y donde también se

B2
verifica que A = .
4C
−b
Y, por tanto, el soporte de la distribución pasaría del intervalo (e 2c , +∞) al
−b −B
intervalo (ke 2c , +∞) ; es decir al intervalo (e 2C , +∞) .

146
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

Otro caso se presenta cuando queremos que el punto inicial no sea el valor
−b −b
natural x = e 2c , sino que queremos que sea otro valor, digamos x = h, h > e 2c .
En tal caso estaremos trabajando con una distribución PC truncada (PCT) en el
punto h , Figura 4.20, que será una distribución triparamétrica:

Figura 4.20: Función de densidad de la distribución PCT

Un caso particular de este truncamiento será cuando tomemos h = 1. Como


la Moda suele ser menor a 1, significa que, en tales casos, nos estaremos
quedando solamente con la parte decreciente de la función de densidad de la PC,
Figura 4.21.

En general, la función de supervivencia de la PCT tiene la forma explicita


que se verá seguidamente. Sea X ∼ PC(b,c) . Sea X* la distribución de X truncada
en x = h. La notaremos como X * ∼ PCT (h,b,c). Entonces,

S X ( x) ea ⋅ xb+c ln( x )
S X * ( x) = = a b+c ln( h ) = h −[b+c ln( h )] xb+c ln( x )
S X ( h) e ⋅ h

Es decir, S X * ( x) = h −[b+c ln( h)] xb+c ln( x ) , x ≥ h y, tomando logaritmos, nos queda :

147
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

Ln S X * ( x) = (−b Ln(h) − c Ln 2 (h)) + bLn( x) + cLn 2 ( x), x ≥ h

Figura 4.21: Función de densidad de la distribución PCT(1,b,c)

Por tanto, si X ∼ PCT (h, b, c)

h −[b+c ln( h )] xb+c ln( x ) x≥h


S ( x) =  (4.20)
 1 x≤h

Ln S X ( x) = (−b Ln(h) − c Ln 2 (h)) + bLn( x) + cLn 2 ( x), x ≥ h (4.21)

En el caso h = 1, X * ∼ PCT (h = 1,b,c) , se tiene S X * ( x) = xb+c ln( x ) , x ≥ 1 y

LnS X * ( x) = bLn( x) + cLn 2 ( x), x ≥ 1 .

Luego:

148
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

 xb+c ln( x ) x ≥1
X ∼ PCT (h = 1, b, c) → S ( x ) =  (4.22)
 1 x ≤1

X ∼ PCT (h = 1, b, c) → LnS X ( x) = bLn( x) + cLn 2 ( x), x ≥ 1 (4.23)

Además, si una PCT experimenta un cambio de escala, la distribución resultante


sigue siendo otra PCT.

En efecto, supongamos que X ∼ PCT (h = 1, b, c) , con soporte el intervalo


[1, +∞) . Consideremos Y=kX. Calculemos la forma de la función de
supervivencia de Y.
 y y
FY ( y ) = P [Y ≤ y ] = P [ kX ≤ y ] = P  X ≤  = FX ( ) , con lo que
 k k
y y y y y
SY ( y ) = S X ( ) → Ln SY ( y ) = LnS X ( ) = bLn( ) + cLn 2 ( ), ≥ 1
k k k k k
Por tanto,

Ln SY ( y ) = bLn( y ) − b Ln(k ) + c [ Ln( y ) − Ln(k ) ] =


2

= bLn( y ) − b Ln(k ) + cLn 2 ( y ) + c Ln 2 (k ) − 2cLn( y ) Ln(k ) =


= (−b Ln(k ) + c Ln 2 (k )) + ( b − 2c Ln(k ) ) Ln( y ) + cLn 2 ( y )
Luego,

Ln SY ( y ) = (−b Ln(k ) + c Ln 2 (k )) + ( b − 2c Ln(k ) ) Ln( y ) + cLn 2 ( y ), y ≥ k

Si ahora denominamos A = − B Ln(k ) + CLn 2 (k ), B = b − 2c Ln(k ), C = c , se tiene

que A = − ( b − 2c Ln(k ) ) Ln(k ) + cLn 2 (k ) = −b Ln(k ) + cLn 2 (k ) y, por

consiguiente

Ln SY ( y ) = (− B Ln(k ) + CLn 2 ( y )) + BLn( y ) + CLn 2 ( y ), y ≥ k

149
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

Es decir, Y = k X ∼ PCT (k , B = b − 2c Ln(k ), C = c) , con soporte el intervalo


[k , +∞) .

X ∼ PCT (h = 1, b, c) → Y = k X ∼ PCT (k , B = b − 2c Ln(k ), C = c) (4.24)

En consecuencia, si X ∼ PCT (h = 1, b, c) como la media admite la expresión


+∞ +∞ 1 +∞

∫ (1 − F ( x) )dx = ∫ S ( x)dx = ∫1dx + ∫ x


b + cLn ( x )
µ= dx
0 0 0 1

puede probarse que

(1+b )2
−   1 + b 
+∞ πe 4c
1 + Erf  
  2 −c   (4.25)
µ= ∫ (1 − F ( x) )dx = 1 + 2 −c
0

Para los demás momentos dado que


+∞

∫ x (1 − F ( x) )dx
k −1
µk = E  X  = k
k
(4.26)
0

 1 k −1 +∞ 
se tiene que µk = E  X  = k  ∫ x dx + ∫ x k −1+b+cLn ( x ) dx  , luego
 k

 0 1 

( k +b )2
−   k + b 
π ke 4c
1 + Erf  
  2 −c   (4.27)
µk = E  X k  = 1 +
−c

150
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

En el caso general, cuando X ∼ PCT (h, b, c) , se tendrá que su media viene dada
+∞ h +∞
−( b+ cLn ( h ) ) b + cLn ( x )
por la expresión µ = ∫ S ( x)dx = ∫1dx + ∫ h x dx , con lo que:
0 0 h

(1+b )2
− − b+ cLn ( h ) )   1 + b + 2cLn(h)  
+∞ πe 4c h ( 1 + Erf  
  2 −c  (4.28)
µ= ∫ S ( x)dx = h +
2 −c
0

Seguidamente vamos a calcular la elasticidad de la función de supervivencia, que


será común a las distribuciones PC(b,c) y a las PCT(h,b,c), donde los parámetros
b y c correspondientes a las dos distribuciones son los mismos.

4.4.2 Elasticidad

Dado que la función de supervivencia viene dada por:

S ( x ) = Axb+cLn ( x )

Se tendrá que:

dS x cLn( x) b+cLn ( x ) x
ES = = A[( b + cLn( x) ) ⋅ xb+cLn( x )−1 + x ] =
dx S x S
x
= Axb+cLn ( x )−1 ( b + cLn( x) + cLn( x) ) b+cLn ( x ) =
Ax
= b + 2cLn( x)

Y por tanto, la elasticidad viene dada por:

ES ( x ) = b + 2cLn( x) (4.29)

151
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

Es decir, la reducción porcentual del nº de empresas cuando el tamaño de ellas


crece un 1% sigue la expresión anterior.

Por tanto, se deduce que la relación entre los incrementos de la elasticidad


de la función de supervivencia y los incrementos de los logaritmos de los valores
es constante:
∆ES
∆ES = 2c∆Ln( x) → = 2c
∆Ln( x)
∆ES
= 2c (4.30)
∆Ln( x)

Es decir, la tasa de variación de la elasticidad, con relación al incremento


logarítmico de los valores, es constante.

Igualmente, se obtiene que el incremento de la elasticidad permanece


constante ante cambios de escala:

( (
∆ES kX = 2c∆Ln(kx) = 2c ( Ln(k ) + Ln( xi ) ) − Ln(k ) + Ln( x j ) = ))
= 2c∆Ln( x) = ∆ES X

∆ES kX = ∆ES X (4.31)

Por último, vamos a ver que la relación logarítmica existente entre los ratios de la
función de supervivencia y los ratios de los valores de los datos es lineal en los
logaritmos de esos datos. En concreto, se puede expresar en la forma:

152
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

S 
Ln  i 
 S j  = b + cLn( x x )
i j
x 
Ln  i 
 xj 
En efecto, como

b c
Si xib+cLn ( xi ) x   x Ln( xi ) 
= = i   i 
Sj b + cLn ( x j )  xj  x Ln (xj )

xj    j 

se tiene que:

)) =
S  x 
Ln  i
 Sj

 = bLn  i
  xj 
( ( Ln ( x )
 + c Ln xi i − Ln x j j )
Ln ( x )
(
x 
= bLn  i
 xj (
 + c Ln ( xi ) − Ln x j =
2 2
( ))
 
x 
= bLn  i
 xj ( ( )) (
 + c Ln ( xi ) + Ln x j Ln ( xi ) − Ln x j = ( ))
 
x  x  x 
= bLn  i
 xj ( )
 + cLn xi x j Ln  i  = Ln  i  b + cLn xi x j ( ( ))
   xj   xj 
Luego,

S  x 
Ln  i
 Sj  = Ln  i (
 b + cLn xi x j ( ))
   xj 

Por tanto, se obtiene que:

153
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

S 
Ln  i 
 Sj 
 xi 
i j ( )
  = b + cLn x x = b + cLn x + cLn x
( i) j ( ) (4.32)
Ln  
 xj 
 

4.4.3. Propiedad de un solo cruce

Dos funciones de distribución pareto-cuadráticas truncadas con el mismo


soporte, se cruzan, a lo más, una vez.

Si las dos distribuciones tienen el mismo soporte, podemos considerar que


los ajustes Ln( Si ) = bLn( xi ) + cLn 2 ( xi ) comienzan en el punto
( Ln( x) = 0, Ln( S ) = 0) , con lo que, como Ln( x) = 0 , estamos suponiendo que el
rango común comienza en h = 1 . Así, la función de distribución queda en la
forma: F ( x ) = 1 − S ( x ) = 1 − xb+cLn( x ) .

Por tanto, si dos funciones de distribución pareto-cuadráticas truncadas se


cruzan, tendrán la forma FX ( x ) = 1 − xb+cLn ( x ) , FY ( x ) = 1 − x d +eLn( x ) y, por

consiguiente, se tendrá que verificar que:

1 − xb+cLn ( x ) = 1 − x d +eLn( x ) ⇒ xb+cLn ( x ) = x d +eLn( x ) ⇒


⇒ xb−d = x eLn ( x )−cLn( x ) ⇒ xb−d = x(
e −c ) Ln ( x )

b−d
⇒ b − d = ( e − c ) Ln( x) ⇒ x = e e −c

b−d
(4.33)
x= e e −c

154
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

Para que se crucen, ese valor ha de ser superior a 1, el valor de inicio y, en tal
caso, se cruzan en un solo punto. Por tanto, ha de cumplirse que b > d , c < e , o
bien que b < d , c > e

Al igual que en el caso de la distribución Pareto, esta propiedad será


importante a la hora de establecer un criterio suficiente de dominancia estocástica
de segundo orden, como se mostrará en el capítulo 6.

4.4.4. Tasa de cambio de la pequeñez de una empresa

Podemos interpretar S ( x) como el nivel de pequeñez de una empresa que tiene


un nº de trabajadores x, pues representa la proporción entre el nº de empresas con
más trabajadores que ella y el nº de empresas totales. Por tanto, dS ( x) mide el
cambio en la pequeñez de una empresa que tiene un nº de trabajadores x, y
dS ( x)
representa la tasa de cambio de pequeñez de esa empresa.
S ( x)

S ( x + 1) − S ( x)
La expresión representa el decremento relativo que
S ( x)
experimenta el nivel de pequeñez, de una empresa cuando pasa de tener x a tener
x+1 empleados. Pero, dado que
S ( x + 1) − S ( x) S´( x)

S ( x) S ( x)
Se tendrá que:

S ( x + 1) − S ( x) S´( x) 1
≈ = [b + 2cLn( x)] (4.17)
S ( x) S ( x) x

155
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

Por consiguiente, la disminución del nivel de pequeñez cuando la empresa


aumenta su plantilla y pasa al nivel superior, la tasa con la que cambia su nivel de
pequeñez al aumentar su plantilla, se mide por:

S´( x) 1
= [b + 2cLn( x) ]
S ( x) x

Llamando α ( x) = − [b + 2cLn( x) ] , se tiene que

S´( x) 1
= −α ( x ) , α ( x) = − [b + 2cLn( x) ] (4.18)
S ( x) x

Por tanto, fijado el tamaño de la plantilla x, a mayor α ( x ) mayor decremento del

nivel de pequeñez al pasar de ese tamaño de plantilla al inmediato superior;


luego, se puede decir, en ese sentido, que a mayor α ( x ) , mayor nivel relativo de

pequeñez de la empresa en la distribución original. Mayor tasa de cambio del


nivel de pequeñez de la empresa. En mejor posición se encuentra la empresa
después del cambio. Más difícil le ha resultado a la empresa pasar del estado
inicial al nuevo, más difícil subir ese escalón, más difícil crecer.

Dicho de otra forma, el nivel de dificultad para crecer, de una empresa con
una plantilla de x trabajadores, disminuye sii α ( x ) decrece, aumenta sii α ( x )

crece y se mantiene constante sii α ( x ) no varia. Por tanto, α ( x ) puede

interpretarse como un indicador para medir el nivel de dificultad, aversión,


contención, obstaculización o freno al crecimiento; mientras que el término -2c
indica la velocidad con la que se produce el cambio de ese nivel de dificultad al
crecimiento al aumentar el tamaño de la empresa.

156
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

Por la misma razón, −α ( x ) puede interpretarse como un indicador para

medir el nivel de facilidad, estimulo, apoyo, capacidad, tendencia, disposición o


preferencia por el crecimiento o progreso de la empresa.

4.4.5. Aproximación local por la distribución paretiana

Toda curva puede ser aproximada localmente por la recta tangente en el punto en
cuestión, cuya pendiente es la derivada en ese punto. Por tanto, teniendo en
cuenta que la distribución Pareto-cuadrática tiene la forma:

Ln( Si ) = a + bLn( xi ) + cLn 2 ( xi )


Se tendrá que la pendiente de la recta tangente es la derivada de esa expresión,
respecto a la variable independiente, que en este caso es Ln( x) y, por tanto, esta
pendiente será:

m ( x ) = b + 2cLn( x) (4.19)

Que, como puede apreciarse, coincide con la elasticidad de la función de


supervivencia calculada en el apartado anterior.

Pero, en un entorno centrado en el punto (Ln(x), PC (Ln(x))) , la


aproximación lineal a los puntos (Ln(x), Ln(S(x))) , una vez reescalados, es la
recta de Pareto.

Por tanto, la recta local de Pareto es paralela a la recta tangente en la


distribución Pareto-cuadrática y, en consecuencia, tienen la misma pendiente.

157
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

Esto significa que la pendiente de la recta local de Pareto, que es la


elasticidad de la función de supervivencia, −α ( x) , coincide con
m ( x ) = b + 2cLn( x)

Por tanto, b + 2cLn( x) = −α ( x) → α ( x) = −b − 2cLn( x)

α ( x) = −b − 2cLn( x) (4.20)

Y los razonamientos que se hacían para medir el nivel de dificultad para crecer
en función de α se pueden aplicar de nuevo, con el añadido que ahora son
válidos localmente; mientras que antes sólo indicaban un valor global, general,
del nivel de dificultad de crecimiento en la distribución.

Es decir, se ha obtenido un método para analizar el nivel de dificultad para


crecer o progresar (aumentar los ingresos en el caso de la renta y aumentar el
tamaño en el caso de la empresa) presente en una distribución por tramos, y no
sólo globalmente.

De los modelos anteriores, se tiene que las pendientes de las tangentes


quedan para España, Alemania y Reino Unido, Tabla 4.26:

Pendientes de las tangentes(derivada)


( Ln ( S ( x) ) = a + bLn( x) )
a b PAISES
-1.054
España
-1.025 -0.01
-0.944
Alemania
-0.63 -0.098
-0.862
Reino Unido
-0.567 -0.092

Tabla 4.26: Pendientes de las tangentes. 2014

158
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

Los gráficos de esas pendientes, Figura 4.18, Figura 4.19 y Figura 4.19bis,

son:

Figura 4.18: Pendientes de las tangentes paretianas, 2014

Figura 4.19: Pendientes de las tangentes pareto/cuadráticas, 2014

159
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

Figura 4.19 bis: Pendientes de las tangentes pareto/cuadráticas, 2014

Como puede observarse gráficamente, las pendientes de Pareto son medias


de las pendientes de la distribución Pareto-cuadrática correspondiente.

Teniendo en cuenta a su vez la relación que hay entre pendiente,


elasticidad y tasa de pequeñez, y dado que las pendientes de Pareto,

α EP = 1.054;α AL
P
= 0.944;α RU
P
= 0.862 , verifican la relación: α EP > α AL
P
> α RU
P
; en
general, a las empresas les resulta más difícil crecer en España que en Alemania,
y en Alemania más que en Reino Unido.

Eso es cierto globalmente, pero no permite hacer un estudio local por


tamaños; que es lo que nos permitirá hacer las pendientes de las distribuciones
Pareto-cuadráticas:

160
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

• Donde se produce el corte de las gráficas correspondientes a


España y Alemania, Figura 4.19, es un poco antes del extremo superior del
intervalo de 641 a 896 trabajadores. En él que se verifica que α EPC > α AL
PC
> α RU
PC
,
luego a las empresas de menos de unos 800 trabajadores les resulta más fácil
crecer en Reino Unido que en Alemania y en ésta que en España.

• En las empresas mayores de 2560 trabajadores, que es donde se


produce el corte de las gráficas correspondientes a España y Reino Unido, Figura
4.19, es un poco antes del extremo superior del intervalo de 1893 a 2560
trabajadores. A partir de ahí, se cumple α AL
PC
> α RU
PC
> α EPC , luego a las empresas
mayores de unos 2500 trabajadores les resulta más fácil crecer en España que en
Reino Unido y en éste que en Alemania.

• En las empresas de tamaños intermedios entre los anteriores, entre


800 y 2500 trabajadores, aunque α AL
PC
> α EPC > α RU
PC
, la diferencia, al ser mínima,
carece de valor significativo. Luego a esas empresas les resulta aproximadamente
igual de fácil o difícil crecer en los tres países.

• Como todas las pendientes de los ajustes PC son negativas, Figura


4.19, en todos los países es más difícil el crecimiento del tamaño empresarial a
medida que las empresas son mayores; pero la velocidad con la que crece el
obstáculo a ese crecimiento del tamaño empresarial es mayor en Alemania que
en Reino Unido y en ese mucho mayor que en España, pues las pendientes de los
ajustes pareto-cuadráticos siguen esa ordenación decreciente.

Si entendemos que la situación de Reino Unido y Alemania es mejor que


en España, ello conllevaría la idea de que en España habría que realizar una
política tendente a producir cambios en los tamaños de las empresas, de manera

161
Capítulo 4 Distribución Pareto vs. Distribución Pareto-cuadrática

que se favorezca el crecimiento de empresas de hasta unos 800 trabajadores y se


desincentive el crecimiento de empresas mayores de unos 2500 trabajadores.

162
PARTE II

GINI Y LA MEDICIÓN DE LA DESIGUALDAD

“A pesar de las numerosas formulaciones del índice de Gini que han


aparecido en la literatura en los últimos años, las formulaciones originales
son en gran parte desconocidas” (Lambert, 2012, página 419 )
CAPÍTULO 5

EL ÍNDICE δ DE GINI VERSUS


EL ÍNDICE α DE PARETO

5.1. INTRODUCCIÓN

5.2. ÍNDICE δ DE GINI PARA MEDIR LA


CONCENTRACIÓN

5.3. EL ÍNDICE δ DE GINI VERSUS EL ÍNDICE α DE


PARETO

5.4. DIFERENCIAS ENTRE LOS CONCEPTOS DE LA


DESIGUALDAD ENTRE GINI Y PARETO
Capítulo 5 El Índice δ de Gini vs. el Índice α de Pareto

5.1. INTRODUCCIÓN

Corrado Gini es un ejemplo de investigador en el que, en un primer período,


trabajó la estadística como un instrumento y una metodología, para pasar, a
partir de la primera guerra mundial, a trabajar la estadística como Ciencia
Estadística.

Gini es de interés por contribuir a las primeras estimaciones de ciertas


magnitudes económicas de los países o grupos de países, mucho antes de crearse
la Contabilidad Nacional.

Igualmente, Gini es reconocido como el inventor, en parte, del método


estadístico para medir las paridades del poder de compra que usan los Institutos
de Estadística Europeos.

Gini también contribuyó a las largas discusiones sobre el uso del muestreo
de poblaciones finitas, que tuvieron lugar en las distintas reuniones del Instituto
Internacional de Estadística.

Como señalamos, en la pequeña biografía que recogemos más abajo, los


trabajos de Gini fueron realizados en los campos de la llamada ciencia social y de
la estadística.

Corrado Gini (1884-1965) estudió Derecho, Estadística y Economía en la


Universidad de Bolonia, también estudió Matemáticas y Biología. Sus trabajos
científicos fueron realizados, principalmente, en los campos de las ciencias
sociales y la estadística. Gini estudió a Bernoulli, Lexis y Czuber, así como a
Bodio, Messedaglia y Benini, maestros italianos de la ciencia estadística. En
1910 accedió a la cátedra de estadística en la Universidad de Cagliari, y el

167
Capítulo 5 El Índice δ de Gini vs. el Índice α de Pareto

período hasta el final de la primera guerra mundial será el más importante por la
relevancia de sus contribuciones a la metodología estadística.

En 1911 fue elegido miembro del Consejo Superior de Estadística, en


1913 Gini tomó posesión de la cátedra de estadística en Padua y en 1919 fue
profesor en las Universidades de Cagliari y Padua, dando clases de Economía
Política, Derecho Constitucional, Demografía y Estadística Económica. En 1920
fundó METRON, la revista internacional de estadística, que dirigió hasta su
muerte.

En 1923 se trasladó a la Universidad de Roma, comenzando un período de


nueve años dedicado a actividades públicas; así puso en marcha la Escuela de
Estadística para la formación de funcionarios en estadística, y en ese mismo año
de 1923 fundó la Facultad de Estadística, Demografía y Ciencias Actuariales. En
1926 fundó la revista La Vita Economica Italiania que fue cerrada en 1943. En
1929 Gini fundó el Comité Italiano para el estudio de los problemas de la
población, y fundó la revista GENUS en 1934.

Gini fue uno de los más activos y distinguidos miembros del Instituto
Internacional de Estadística, llegando a ser miembro honorario en 1939.

Gini, el mismo año de su muerte (1965), recogió en su artículo “On the


Characteristics of Italian Statistics” publicado por Journal of the Royal Statistical
Society, páginas 89 a 109, lo que para él era la Ciencia Estadística. Reseñamos
aquí algunas de sus frases, Figuras 5.1 a 5.4, sin buscar mayor profundidad por
no ser ahora nuestro objetivo.

“Una característica especial de los estadísticos italianazos…. es describir


cuantitativamente, por medio de series de constantes, los aspectos de fenómenos
colectivos completos…”:

168
Capítulo 5 El Índice δ de Gini vs. el Índice α de Pareto

Figura 5.1: Gini, 1965, pág. 93

“para mí, el principio fundamental…, al formular métodos estadísticos,


es, primero, tener en cuenta la naturaleza de los fenómenos a los que son
aplicados con relación al objeto de la investigación y sólo, en segundo lugar,
considerar sus propiedades formales…”:

Figura 5.2: Gini, 1965, pág. 94

169
Capítulo 5 El Índice δ de Gini vs. el Índice α de Pareto

“…la mayoría de los índices introducidos por la escuela italiana, no


dependen del tipo de modelos que sigan los datos…”:

Figura 5.3: Gini, 1965, pág. 95

Este artículo venía a completar a otro, “The Contributions of Italy to


Modern Statistical Methods”, de 1926, publicado también en Journal of the
Royal Statistical Society, Vol, 89, páginas 703 a 724, en el que mostraba
claramente su opinión sobre el uso de las Matemáticas en la Estadística:

Figura 5.4: Gini, 1926, pág. 707

En 1909 se publicó su trabajo “Il diverso acrecimiento delle classi socialiti


e la concentrazione della ricchezza” en Giornale degli Economisti.

Como indicamos en el capítulo 1, nuestro estudio se centrará en dos de


sus índices: el coeficiente δ, que analizaremos en este capítulo, y el índice o
razón de concentración R de Gini, que analizaremos en el capítulo siguiente.

170
Capítulo 5 El Índice δ de Gini vs. el Índice α de Pareto

5.2 . ÍNDICE δ DE GINI PARA MEDIR LA CONCENTRACIÓN

En su artículo Indici di Concentrazione e di dipendenza, de 1910 y publicado en


Biblioteca dell’Economista , Gini (1910, parte primera, capítulo II, pág. 5),
Figura 5.5, comienza diciendo qué entiende por concentración, y cómo medirla.
Afirma que la riqueza está muy concentrada, cuando gran parte de ella es poseída
por pocas personas:

Figura 5.5: Gini ,1910, parte primera, capítulo II, pág. 5

En cuanto a cómo medir esa concentración, Gini considera que


disponemos de n valores ordenados {ai, i=1,..,n} de una variable estadística
cuantitativa no negativa; es decir, a1≤... ≤ an; por tanto, la media de los n valores
será menor que la media de los últimos m valores:
a1 + a2 + ⋯ an an− m+1 + an− m+ 2 + ⋯ an
< , ∀m < n
n m
Y por tanto,
m an− m+1 + an−m+ 2 + ⋯ an
< < 1, ∀m < n
n a1 + a2 + ⋯ an

171
Capítulo 5 El Índice δ de Gini vs. el Índice α de Pareto

De aquí se define δ m como el valor que satisface la siguiente relación:


δ
m  an−m+1 + an− m+ 2 + ⋯ an 
m

=  ,m<n
n  a1 + a2 + ⋯ an 

En efecto, Gini ((1910, parte primera, capítulo II, pág. 6), Figura 5.6, afirma:

Figura 5.6: Gini, 1910, parte primera, capítulo II, pág. 6.

Gini, Figura 5.7, afirma que cuánto más fuertes sean esas desigualdades,
mayor diremos que es la concentración de la variable. Si encontramos una
constante que relacione esas desigualdades para todo m, se dirá que esa constante
es el Índice de Concentración:

172
Capítulo 5 El Índice δ de Gini vs. el Índice α de Pareto

Figura 5.7: Gini, 1910, parte primera, capítulo II, pág. 6.

Es decir, se trata de obtener la relación, Figura 5.8:


δ
m  an−m+1 + an− m+ 2 + ⋯ an 
=  , ∀m < n
n  a1 + a2 + ⋯ an 
con δ constante, independiente de m:

Figura 5.8: Gini, 1910, parte segunda, capítulo IV, pág. 16.

Usando la notación más establecida, llamando Pi a la frecuencia relativa


acumulada en el individuo i-ésimo y Qi a la cantidad relativa acumulada en ese
mismo individuo i-ésimo (supuesto que los individuos están ordenados de menor

173
Capítulo 5 El Índice δ de Gini vs. el Índice α de Pareto

a mayor renta), se trata de encontrar un δ constante, independiente de i, que


verifique:

1-Pi=(1-Qi)δ (5.1)

Si esta relación se mantuviese cierta para todo “i” con un mismo δ, naturalmente,
como hemos indicado, este valor podría ser un indicativo de concentración de
rentas en individuos. Con esta suposición, Gini calcula su coeficiente de
concentración δ como un “valor medio” entre todos los “deltas” δi que se irán
obteniendo para los diferentes individuos o clases “i”.

Gini, volviendo a la página 16 de su texto, obtiene, inicialmente, el valor


de δ por medio de ejemplos.

Así, para Austria, 1904, Figura 5.9, obtiene los siguientes datos:

Figura 5.9: Gini, 1910, parte segunda, capítulo IV, pág. 16

174
Capítulo 5 El Índice δ de Gini vs. el Índice α de Pareto

Y de ahí encuentra los valores δ m , Figuras 5.10:

Figura 5.10: Gini, 1910, parte segunda, capítulo IV, pág. 17.

Ahora, obtiene δ como media de los δ m , Figura 5.11:

175
Capítulo 5 El Índice δ de Gini vs. el Índice α de Pareto

Figura 5.11: Gini, 1910, parte segunda, capítulo IV, pág. 17.

Entendemos que este hallar el "valor medio" es un "ajuste" de la


distribución observada al modelo (5.1); y así, en la pág. 18, Gini indica, Figura
5.12:

Figura 5.12: Gini, 1910, parte segunda, capítulo IV, pág. 18.

Es decir, que tomando logaritmos se obtiene la tabla, Figura 5.13:

176
Capítulo 5 El Índice δ de Gini vs. el Índice α de Pareto

Figura 5.13: Gini, 1910, parte segunda, capítulo IV, pág. 19.

Pudiendo obtenerse δ de la relación logarítmica que liga N y A, Figura


5.14:

Figura 5.14: Gini, 1910, parte segunda, capítulo IV, pág. 19.

A continuación, Gini va a relacionar su índice de concentración δ con el


índice, α , de la distribución de la renta de Pareto.

Siguiendo las ideas de Pareto y considerando las relaciones empíricas que


observó con los datos disponibles de reparto de rentas en diferentes territorios y
periodos de tiempo, Gini (pág. 40) indica, Figura 5.15:

177
Capítulo 5 El Índice δ de Gini vs. el Índice α de Pareto

Figuras 5.15: Gini, 1910, parte segunda, capítulo IV, pág. 40.

Y continúa en la pág. 41, Figura 5.16:

Figura 5.16: Gini, 1910, parte segunda, capítulo IV, pág. 41.

Gini, pág. 41, parte de la relación de Pareto log N = log H − α log x ,


Figura 5.17:

Figura 5.17: Gini, 1910, parte segunda, capítulo IV, pág. 41.

178
Capítulo 5 El Índice δ de Gini vs. el Índice α de Pareto

Y obtiene, haciendo operaciones aritméticas y alguna aproximación, que


se verifica la relación:
α
log A = log T − (α − 1) log x, T = H
α −1
Combinando esas dos relaciones anteriores, ya obtiene su fórmula
aproximada que liga N, A y δ :

log N = δ log A − log K

Así, en la pág 42, Figura 5.18, indica:

Figura 5.18: Gini, 1910, parte segunda, capítulo IV, pág. 42.

Este enfoque presenta el lógico problema de que no es adecuado cuando la


relación (1) no es correcta, en el sentido de que para cada “i” hubiese valores
“delta” claramente distintos, y peor aún, cuando los valores delta cambian según
un patrón al crecer “i”. En realidad, sólo si la distribución de las rentas es de tipo
Pareto, los valores delta serían teóricamente iguales. Con distribuciones tipo
LogNormal o Gamma, por ejemplo, los delta disminuyen sistemáticamente según
crece “i”. En otros casos, como el propio Gini observará en la distribución del
número de hijos por familia, los deltas crecen sistemáticamente. A continuación ,

179
Capítulo 5 El Índice δ de Gini vs. el Índice α de Pareto

Figuras 5.19 y 5.20, incluimos unos gráficos con los valores δi para diferentes
supuestos distribucionales y ejemplos.

Figura 5.19: Distribución LN(0'5,1)

Figura 5.20: Distribución g(4,1)

Figura 5.21: Gráfica asociada al ejemplo de Gini de pág..16

180
Capítulo 5 El Índice δ de Gini vs. el Índice α de Pareto

Figura 5.22: Gráfica asociada al ejemplo de Gini de pág.. 18

Los dos últimos gráficos, Figuras 5.21 y 5.22, corresponden a los ejemplos
analizados por Gini en su tratado Indici di concentrazione e di dependenza en las
páginas 16 y 18. Puede observarse que sólo en el tercer gráfico de los cuatro
anteriores, Figura 5.21, el valor δi es estable y, por tanto, en ninguno de los
otros casos puede hablarse de un único δ que represente a la distribución.

En el caso de una distribución tipo Pareto el gráfico de la Figura 5.21


hubiese sido aproximadamente horizontal (con las posibles fluctuaciones
muestrales, en su caso), por tanto la no horizontalidad viene a reflejar la
diferencia de la distribución analizada con la Pareto. Así, veríamos que el primer
ejemplo de Gini es el más próximo a un caso paretiano.

Por tanto, en un amplio abanico de posibilidades realistas, no se puede


hablar de “un” valor de δ que ligue Pi y Qi, y por consiguiente el propósito de
este índice queda desvirtuado, excepto en distribuciones paretianas.

181
Capítulo 5 El Índice δ de Gini vs. el Índice α de Pareto

5.3. EL ÍNDICE δ DE GINI VERSUS EL ÍNDICE α DE PARETO

Aunque apoyado en la distribución de Pareto, este índice δ tiene, sin embargo, a


ojos de Gini, varias ventajas sobre el índice α de Pareto. En lo que sigue
exponemos las supuestas ventajas indicadas por Gini, en las páginas 48 y 49 de
su trabajo y, posteriormente, un comentario nuestro.

Figura 5.23: Gini, 1910, parte segunda, capítulo IV, pág. 48.

Es decir, que para Gini,, Figura 5.23, el índice α sólo se puede aplicar a
rentas por encima de cierto punto (debido a las características de la distribución
de Pareto), mientras que δ puede aplicarse a la distribución completa de la renta.

Este comentario es criticable en el sentido de lo que hemos señalado


anteriormente: δ es plenamente satisfactorio si la distribución es paretiana, pero
si lo es, aparece el mismo problema de límite inferior de rentas que caracteriza a
esta distribución. Es decir, la justificación plena de δ reside en la propia
distribución de tipo Pareto.

Otra de las ventajas, Figura 5.24, que dice Gini tener su índice δ es que el
índice α se aplica en un caso más restringido que el índice δ:

182
Capítulo 5 El Índice δ de Gini vs. el Índice α de Pareto

Figura 5.24: Gini, 1910, parte segunda, capítulo IV, pág. 48.

Pero, en realidad, Gini aplica δ a casos donde no es del todo satisfactorio


(cuando los deltas no son constantes para todo i) y eso sería equivalente a aplicar
α a distribuciones que no son exactamente paretianas. Como hemos apuntado
anteriormente, en el fondo el procedimiento de cálculo “promedio” de Gini para
δ es similar a "ajustar" α a distribuciones que no sean tipo Pareto.

Ahora, Figura 5.25, indica que el índice δ es más sensible que α en la


medición de la concentración:

Figura 5.25: Gini, 1910, parte segunda, capítulo IV, pág. 49.

Es decir, se afirma que |δ'(α)| > 1. Es interesante observar que α y δ son


"autoinversos", Figura 5.26, o sea que δ(α) es funcionalmente igual a α(δ) (o, lo
que es lo mismo, que esas funciones son simétricas respectos a la primera
bisectriz). Por tanto, en sí, α y δ, globalmente, son igualmente sensibles pero, y
en esto Gini está en lo cierto, en el tramo habitualmente observado (δ > 2), δ es
más “sensible” que α.

183
Capítulo 5 El Índice δ de Gini vs. el Índice α de Pareto

Figura 5.26: Gráfico de d(a) y a(d)

Sobre este mismo punto, conviene señalar que Gini encuentra una
refutación de la "ley" que Pareto creyó encontrar sobre la distribución de la
riqueza. Pareto observó que la distribución de la riqueza en diferentes territorios
y épocas tendía a seguir una distribución paretiana con un parámetro α similar; a
ese tal valor α le quiso dar un significado de "ley" universal.

Gini refuta eso señalando que los valores "similares" de α corresponden a


valores bastante distintos de δ debido a las relación funcional antes señalada
entre ambos parámetros. A su vez, valores algo distintos de δ implican
concentraciones muy distintas. Citamos dos párrafos del estadístico italiano al
respecto:

En la pág. 39, Gini indica cómo a una pequeña variación de δ le


corresponde una gran variación de la distribución de la riqueza, Figura 5.27:

184
Capítulo 5 El Índice δ de Gini vs. el Índice α de Pareto

Figura 5.27: Gini, 1910, parte segunda, capítulo IV, pág. 39.

Expresamos seguidamente en la Tabla 5.1 , el porcentaje de individuos


que tienen un porcentaje de riqueza dada, según diversos valores de δ , para
observar mejor la variación en la concentración :
Pi c

λ \ Qic 1/2 1/3 1/4 …. 1/m ….

2 1/4 1/9 1/16 …. 1/m2 ….

3 1/8 1/27 1/64 …. 1/m3 ….

Tabla 5.1: Porcentaje de individuos vs. porcentaje de riqueza, según δ

Proseguimos con la exposición del resto de puntos sobre la comparativa de


Gini entre su coeficiente y el de Pareto, Figura 5.28:

Figura 5.28: Gini, 1910, parte segunda, capítulo IV, pág. 49.

185
Capítulo 5 El Índice δ de Gini vs. el Índice α de Pareto

Por tanto, Gini dice que el índice δ tiene una interpretación sencilla e
intuitiva. Pero α, añadimos nosotros, por supuesto también la tiene: nos da
precisamente la distribución y los cuantiles de la renta en forma sencilla.

A través de estos breves comentarios a las apreciaciones de Gini sobre su


propuesta de índice en comparación con la medida de concentración de Pareto,
podemos observar que no está fundamentada una significativa ventaja de δ sobre
α. Aquí conviene traer a colación lo señalado en la sección 1 sobre la relativa
desconfianza del estadístico veneciano respecto a la matemática teórica.
Posiblemente si Gini hubiese profundizado en el análisis matemático de su
coeficiente δ, se hubiese convencido de que no aportaba ventajas significativas y
quizás, entrando ahora en lo hipotético, hubiese acelerado su adhesión definitiva
al coeficiente que lleva su nombre, y que analizamos en el capítulo siguiente

5.4. DIFERENCIAS ENTRE LOS CONCEPTOS DE LA DESIGUALDAD


DE GINI Y PARETO

Pareto, aunque nacido en París y de madre francesa, cursó sus estudios y se


formó en Italia y puede considerarse perteneciente culturalmente a este país.
Pareto fue de una generación anterior a Gini (36 años mayor) y es natural que
éste tuviese como referencia relativa el trabajo de aquél. En Indici di
concentrazione e di dependenza Gini señala la disparidad entre la idea de
"desigualdad" de Pareto y la suya de “concentración”.

Primero indica, pág. 49, que el concepto de desigualdad de Pareto es el


contrario al de Benini, Figura 5.29:

186
Capítulo 5 El Índice δ de Gini vs. el Índice α de Pareto

Figura 5.29: Gini, 1910, parte segunda, capítulo IV, pág. 49.

Y, a continuación, Gini indica que su significado de concentración es el


correcto, Figura 5.30 y 5.31:

Figura 5.30: Gini, 1910, parte segunda, capítulo IV, pág. 49.

187
Capítulo 5 El Índice δ de Gini vs. el Índice α de Pareto

Figura 5.31: Gini, 1910, parte segunda, capítulo IV, pág. 50.

Es interesante señalar que en la visión de Pareto hay mucha concentración


(en rentas) cuando una gran cantidad de personas tienen rentas pequeñas y un
reducido número de personas tienen rentas mucho mayores. Aquí, Pareto
interpreta la concentración como "concentración de rentas parecidas" (dispersión
relativa pequeña). En términos "modernos", siguiendo a Gini, esa situación se
consideraría como "concentración pequeña" (dispersión relativa pequeña). Es
decir, en términos de Gini "concentración" y dispersión (relativa) son conceptos
paralelos, no opuestos.

188
CAPÍTULO 6

LA CONSOLIDACIÓN DE LA MEDIDA DE
LA DESIGUALDAD. GINI

6.1. INTRODUCCIÓN

6.2. CASO DE DATOS NO AGREGADOS.

6.3. CASO DE AGREGACIÓN EN FRECUENCIAS

6.4. CASO DE AGREGACIÓN EN INTERVALOS

6.5. RELACIÓN ENTRE LA RAZÓN DE


CONCENTRACIÓN R DE GINI Y LA CURVA DE
CONCENTRACIÓN DE LORENZ

6.6. RELACIÓN ENTRE R Y LA DIFERENCIA DE


MEDIAS

6.7. OTRA FORMULACIÓN DEL ÍNDICE R PARA


DATOS AGREGADOS EN FRECUENCIAS
ABSOLUTAS

6.8. DOMINANCIA DE LASSALLE E ÍNDICE DE


DESIGUALDAD.

6.9. DOMINANCIA DE BEAULIEU E ÍNDICE DE


BIENESTAR
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

6.1. INTRODUCCIÓN

El famoso índice denominado Razón de Concentración de Gini, R, aparece


desarrollado en su artículo de 1914 titulado “Sulla misura della concentrazione e
della variabilità dei caractteri”, que surgió fruto del artículo “Indici di
Concentrazione e di dipendenza” de 1910 y la memoria “Variabilità e
Mutabilità” de 1912, publicada por Facoltá di Giurisprudenza della R.
Universitá dei Cagliari. El análisis de este trabajo de 1914 constituye los
apartados del 6.2 al 6.6 de este capítulo.

El artículo “Sulla misura della concentrazione e della variabilità dei


caractteri”, publicado por Atti del R. Istituto Veneto di Scienze, Lettere ed Arti
(1914), no fue traducido nunca al inglés ni al castellano, ni comentadas sus
secciones, hasta que apareció en castellano el trabajo titulado “Acerca de Sulla
misura della concentrazione e della variabilità de Corrado Gini” (Basulto y
Romero, 2003), que es una versión comentada de varias secciones del trabajo de
Gini, en el que además de comentarios y aclaraciones, se hacen demostraciones
alternativas a las del trabajo original.

Posteriormente, en 2005, apareció una traducción literal en lengua inglesa,


“On the measurement of concentration and variability of characters”, en
METRON - International Journal of Statistics. Más tarde apareció el artículo
“Gini’s concentration ratio (1908–1914)” en Journ@l électronique d’Histoire
des Probabilités et de la Statistique (Basulto y Busto, 2010), donde se analizan
algunos de los trabajos publicados por Gini entre 1908 y 1914 y, que en lo
concerniente a “Sulla misura della concentrazione e della variabilità dei
caractteri”, es complementario del trabajo de Basulto y Romero (2003).

Un resumen de las fórmulas de este capítulo son las que se muestran


seguidamente:

191
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

Para datos sin agregar:

n−1
∑ ( Pi − Qi )
i =1
R= n −1 (11)
∑ Pi
i =1

n −1 (12)
2
( n − 1) An ∑
R = 1− Ai
i =1

n
2∑ ( i − 1) ai (12bis)
i =1
R= −1
( n − 1) An

Para datos agregados en frecuencias:

s
∑ ( Nl −1 + Nl − 1) xl nl (13)
l =1
R= −1
( n − 1) An

Datos agregados en intervalos:

r r  Nk 
∑  k ( k −1 k ) ∑ ∑ ki ki 
 S N + N − 1  + 2  ε δ (14)
k =1  i = N k −1 +1
k =1   − 1
R=
( n − 1) An

192
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

 r 
 ∑ k k −1
S ( N + N )
k  − nA n
 k =1  (15)
R′ =
( n − 1) An

r
∑  Sk ( N k −1 + N k ) (15bis)
k =1
R2′ = −1
nAn

 r  
R′′ =
1
( n − 1) An  k =1 
1 2
6
( )
 ∑  S k ( N k −1 + N k − 1) + nk − 1 ( lk − lk −1 )   − 1
 (17)

1  r  1 2 
R2′′ =  ∑  Sk ( N k −1 + N k ) + nk ( lk − lk −1 )   − 1 (17bis)
nAn  k =1  6 

r
∑ ( N k −1 + N k − 1) nk ( lk + lk −1 ) + 3 ( nk 2 − 1) ( lk − lk −1 )
 1 
k =1
R′′′ = r
−1 (18)
( n − 1) ∑ ( lk −1 + lk )nk
k =1

r
∑ ( Nk −1 + N k ) nk ( lk + lk −1 ) + 3 ( nk 2 ) ( lk − lk −1 )
 1 
k =1
R2′′′ = r
−1 (18bis)
n∑ ( lk −1 + lk )nk
k =1

Datos con valores nulos:

n −1 (19)
Rt = R p ⋅ m + (1 − m ) , m =
n + v −1

193
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

Relacionándolo con la curva de Lorenz para datos desagregados:

 r 
 ∑ S k ( N k −1 + N k )  − nA n
ACA =  k =1 
2nAn
(20)
 r 
 ∑ Sk ( N k −1 + N k )  − nA n
IGG =  k =1 
nAn

Relacionándolo con la diferencia media para datos desagregados:


R=
2M

n +1
n n 2
∑∑ ai − a j 2 ∑ ( n + 1 − 2i ) ( an+1−i − ai )
i =1
∆= = (21)
n ( n − 1) n ( n − 1)

n+1
2
∑ ( n + 1 − 2i ) ( an+1−i − ai )
i =1
R=
n ( n − 1) An

Relacionándolo con la diferencia media para datos agrupados en intervalos:

r
∑ nk ( nk − 1) ∆ k (23)
k =1
∆′ = ∆ −
n ( n − 1)

194
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

∆′
R′ =
2M

r (24)
∑ nk ( nk − 1) ∆ k
R ' = R − k =1
2 M ⋅ n ( n − 1)

Gini, en la sección 2 de su trabajo, define su coeficiente de concentración


como una media aritmética ponderada de las denominadas desigualdades
relativas. La formula que propone Gini la limita a datos desagregados y,
posteriormente, la modifica tanto para datos agregados en frecuencias como para
datos agregados en intervalos. En la sección 6 de su trabajo, Gini estudia la
relación de su fórmula con la curva de concentración de Lorenz (1905),
señalando la aproximación entre su fórmula y el doble del área de Lorenz a
medida que el número de observaciones, n, crece; y en la sección 8 relaciona el
doble del área de Lorenz con su formula, observando que se diferencian en el
n −1
factor . En la sección 9, Gini prueba la relación entre la medida denominada
n
media de las diferencias sin reposición con su coeficiente de concentración. De
las trece secciones que constituyen el trabajo original de Gini, en este capítulo se
analizan las diez primeras.

A partir de aquí, recogemos en el apartado 2 la razón de concentración


para datos desagregados en frecuencias unitarias, generalizando dicha razón a
datos agregados en frecuencias no unitarias, apartado 3, y a datos agregados en
intervalos, apartado 4. En el apartado 5, relacionamos la razón de concentración
con la curva de Lorenz. En el apartado 6, relacionamos la razón de concentración
con la diferencias de media.

195
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

En el apartado 7 mostramos otra formulación del índice R para datos


agregados en frecuencias absolutas, una expresión alternativa a la original dada
por Gini, numerada como (13).

En el apartado 8 mostramos la conexión entre dominancia de Lassalle e


Índice de Gini. Cabe señalar que, de acuerdo con el criterio de Lassalle, un
indicador natural de la desigualdad global de la distribución, podría considerarse
que es el índice de Gini.

En el apartado 9 se incluye también la conexión entre dominancia de


Beaulieu y Bienestar, en general y en los casos particulares de las distribuciones
de Pareto y Pareto-cuadrática.

Hemos usando, para representar el tamaño, la notación “n” de Gini y la


nuestra “N” , simultáneamente. Terminamos esta introducción indicando que
hemos usado dos tipos de numeración de las fórmulas, una la ordinal, (1), (2),....,
que se corresponde con la dada por Gini, y otra que va precedida del número del
capítulo, (6.1), (6.2),...., que es la usada por nosotros.

6.2. CASO DE DATOS NO AGREGADOS

En la sección 1 de su artículo de 1914, Página 413 de la reproducción de


su artículo original, Gini, Figura 6.1, comienza diciendo que va a retomar los
conceptos de concentración e índice de concentración, de forma algo diferente a
como lo había realizado en su trabajo previo “Indici di concentrazione e di
dipendenza”, de 1910.

Figura 6.1: Gini, 1914, Página 413

196
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

Gini, considera que disponemos de n valores ordenados {ai, i=1,..,n} de


una variable estadística cuantitativa no negativa; es decir, a1≤... ≤ an.

i
Define las variables Ai = ∑ ak , cantidad acumulada del carácter hasta el
k =1

A
∑ ak
k =1
lugar i-ésimo. Con lo cual, la variable Qi = i = n
constituye la proporción
An
∑ ak
k =1

que representa la cantidad acumulada del carácter hasta el lugar i, Ai, respecto a
i
la cantidad total presente del carácter. Mientras que la variable Pi = denota la
n
proporción de observaciones hasta el lugar i respecto al número de observaciones
totales.

Tomando dos rangos i,l, tal que i<l, se tiene que ai≤ al, y evidentemente,
por las propiedades de la media aritmética,
1 i 1 l
∑ k l ∑ ak ,
i k =1
a ≤
k =1

con lo que
i
∑ ak i
k =1
l
≤ ,
l
∑ ak
k =1

y, tomando l=n, se verifica que


i
∑ ak i
k =1
n
≤ ;
n
∑ ak
k =1

es decir,

197
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

Qi ≤ Pi

Gini afirma, página 413, Figura 6.2, “la concentración del carácter será tanto
más fuerte cuanto más fuerte sean las n-1 desigualdades Qi < Pi , i=1,..,n-1” (4)

Figura 6.2: Gini, 1914, Página 413

La concentración del carácter será perfecta si sus intensidades son todas


nulas, salvo una: ai=0, i=1,..,n-1 y an=An. Dicho de otra forma, cuando Qi=0,
i=1,..,n-1; o también, cuando Pi -Qi= Pi , i=1,..,n-1. La concentración será nula
cuando Qi= Pi , i=1,..,n-1; en tal caso se dirá que hay equidistribución del
carácter.

A continuación, Gini se plantea buscar una medida o índice de


concentración del carácter, a partir de las n-1 desigualdades (4).

En el trabajo de 1910, Figura 6.3:

Figura 6.3: Gini, 1914, Página 41

198
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

Gini define la medida de concentración basándose en la suposición de que


la distribución del carácter sigue un modelo paramétrico determinado; en
concreto supone la existencia de ciertas relaciones entre los pares {(Pi, Qi),
i=1,..,n}, como por ejemplo 1-Pi=(1-Qi)δ.

Por el contrario, en este trabajo de 1914, página 415, Figura 6.4, que es
del que nos ocupamos en este capítulo, Gini afirma que el objetivo es proponer
una medida de concentración que sea independiente de la curva de distribución
del carácter.

Figura 6.4: Gini, 1914, Página 415

Las diferencias de (4), Pi-Qi ,representan la proporción, respecto a la


intensidad total de todo el colectivo, que ha de transferirse al colectivo de los Pi
casos con intensidad más baja, para eliminar la desigualdad presente en los
mismos respecto al conjunto del colectivo.

En efecto, si notamos por Qi* la proporción de riqueza que acumula el


colectivo de los Pi casos con intensidad más baja después de la transferencia, se
tendrá que:
i n

Ti
* ∑ t k + (Pi − Qi )∑ t k
k =1 k =1
Qi =
*
*
= n
=
Tn
∑t
k =1
k

= Qi + (Pi − Qi ) = Pi .

199
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

La desigualdad (4) es tanto más fuerte, en valor absoluto, cuanto mayor sea la
diferencia Pi -Qi; y , dado que el valor máximo de Qi es Pi, tanto más fuerte en
valor relativo cuanto más alta es la razón

Pi − Qi
Ri = .
Pi

Ri representa, en términos de proporción respecto a la intensidad media de todo


el colectivo, la intensidad constante en que hay que aumentar la intensidad del
carácter de cada uno de los Pi casos con intensidad más baja, para eliminar la
desigualdad presente en los mismos respecto al conjunto del colectivo.

En efecto, si en lugar de considerar los valores a1,..,ai , que constituyen la


proporción Pi de observaciones, se consideran los valores transformados b1,..,bi,
donde b j = a j + Ri ⋅ M , j = 1,.., i , y donde M es la media de todas las

intensidades originales del carácter, se verifica que la media de esos nuevos


valores transformados coincide con M, pues

i i
∑ b j ∑ ( a j + Ri ⋅ M )
b j =1 j =1
M = = =
i i
i i
∑aj MRi ⋅ i
∑aj
j =1 j =1
= + = + MRi ,
i i i

de donde

200
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

i i
∑aj Pi − Qi
∑aj Qi
j =1 j =1
Mb = +M = +M −M =
i Pi i Pi
i
∑aj
j =1
i N N
∑aj ∑aj ∑aj
j =1 j =1 j =1
= +M − =
i N i
N
i i
∑aj ∑aj
j =1 j =1
= +M − = M.
i i

En el caso de equidistribución, la proporción acumulada del carácter, Qi , sería


Pi − Qi
igual a la proporción acumulada de individuos, Pi; luego el cociente Ri =
Pi
tendría que ser cero. Por el contrario, en el caso de máxima desigualdad, la
proporción acumulada del carácter, Qi, sería igual a cero, luego Pi − Qi = Pi y el

Pi − Qi
cociente Ri = tendría que ser uno. Así pues, el valor de Ri varía entre 0,
Pi
en caso de equidistribución, y uno, en caso de concentración perfecta y, por ello,
puede considerarse un indicador de la concentración del carácter que se presenta
entre los Pi casos que poseen intensidad más baja en el carácter en estudio.

Dado que ese indicador de la concentración del carácter afecta a la


proporción Pi de casos, es por lo que Gini señala que como medida de la
concentración del carácter podremos asumir la media ponderada de los n-1
valores de Ri, donde cada uno de los Ri entra con un peso proporcional al valor
Pi, Figura 6.4, página 416.

201
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

Figura 6.4: Gini, 1914, Página 416

Tal medida será

n−1 n−1 n−1


P −Q
∑ Ri Pi ∑ i P i Pi ∑ ( Pi − Qi )
i =1 i =1 i =1
R= n −1
= i
n −1
= n−1
;
∑ Pi ∑ Pi ∑ Pi
i =1 i =1 i =1

es decir,
n−1
∑ ( Pi − Qi )
i =1
R= n −1
(11)
∑ Pi
i =1

Esa medida es la que Gini denomina Razón de Concentración.

También, para concentración perfecta, Qi=0, i=1,..,n-1, con lo que

n−1 n −1
∑ ( Pi − Qi ) = ∑ Pi ,
i =1 i =1

luego R=1, y para equidistribución, Pi=Qi, con lo que R=0.

202
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

Igualmente, a medida que las desigualdades Qi < Pi son más fuertes,


entonces R aumenta.

La razón de concentración es por lo tanto, indica Gini, un índice de


concentración que verifica las condiciones siguientes:

a) Crece al crecer la concentración


b) Toma como valor más alto uno en el caso de máxima concentración
c) Toma su valor más pequeño, 0, en el caso de mínima
concentración.

A continuación, veremos cómo se calcula en la práctica el valor de R. La


formula que presentamos, equivalente a la mostrada en (11), es la que propone
Gini al comienzo de su sección 3, Figura 6.5.

Figura 6.5: Gini, 1914, Página 41

Dado que

n−1 n −1
i 1 n−1 1 ( n − 1) ⋅ n ( n − 1)
∑ Pi = ∑ n
= ∑i =
n n 2
=
2
,
i =1 i =1 i =1

203
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

se tiene que

n−1 n−1 n−1 n −1 n−1


Ai
∑ ( Pi − Qi ) ∑ Pi − ∑ Qi ∑ Qi ∑ An 2 n−1

( n − 1) An ∑
i =1 i =1 i =1 i =1 i =1
R= = = 1− = 1− = 1− Ai
n −1 n−1 n−1
( n − 1)
∑ Pi ∑ Pi ∑ Pi 2
i =1

i =1 i =1 i =1

y obtenemos la siguiente formulación para R:

n −1
2
( n − 1) An ∑
R = 1− Ai . (12)
i =1

Pero Gini, seguidamente, propone una formulación alternativa, Figura 6.6.

Figura 6.6: Gini, 1914, Página

En efecto, si tenemos en cuenta que

n−1 n −1 i
∑ Ai = ∑ ∑ ak ,
i =1 i =1 k =1

y que esa expresión , observando la tabla siguiente, Tabla 6.1,

204
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

i
i Ai = ∑ ak
k =1
1
1 A1 = ∑ ak a1
k =1
2
2 A2 = ∑ ak a1+ a2
k =1
3
3 A3 = ∑ ak a1+ a2+ a3
k =1
⋮ ⋮ ⋮
n −1
n-1 An−1 = ∑ ak a1+ a2+ a3+..+an-1
k =1
Tabla 6.1: Sumas parciales

coincide con

n−1 n −1 i n−1
∑ Ai = ∑ ∑ ak =(n-1) a1+ (n-2) a2+..+(n-(n-1))an-1= ∑ ( n − i ) ai ,
i =1 i =1 k =1 i =1

se cumplirá que
n −1

n −1 ( n − 1) An − 2∑ Ai
2
( n − 1) An ∑
i =1
R = 1− Ai = =
i =1 ( n − 1) An
n n −1
( n − 1) ∑ ai − 2∑ ( n − i ) ai
i =1 i =1
= ,
( n − 1) An
con lo que
n n n −1 n −1
n∑ ai − ∑ ai − 2∑ nai + 2∑ iai
i =1 i =1 i =1 i =1
R= =
( n − 1) An
n n n n −1 n−1
n∑ ai − 2∑ ai + ∑ ai − 2∑ nai + 2∑ iai
i =1 i =1 i =1 i =1 i =1
= ;
( n − 1) An

205
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

y de ahí,
n n n−1  n−1 n 
n∑ ai + ∑ ai − 2∑ nai + 2  ∑ iai − ∑ ai 
R = i =1 i =1 i =1  i =1 i =1 =
( n − 1) An
n n n−1  n n 
n∑ ai + ∑ ai − 2∑ nai + 2  ∑ iai − nan − ∑ ai 
= i =1 i =1 i =1  i =1 i =1 =
( n − 1) An
n n n−1
 n n 
n∑ ai + ∑ ai − 2n∑ ai − 2nan + 2  ∑ iai − ∑ ai 
= i =1 i =1 i =1  i =1 i =1 =
( n − 1) An
n n n  n n 
n∑ ai + ∑ ai − 2n∑ ai + 2  ∑ iai − ∑ ai 
= i =1 i =1 i =1  i =1 i =1 .
( n − 1) An

Por tanto,
n n n
( n − 2n ) ∑ ai + ∑ ai + 2∑ ( i − 1) ai
i =1 i =1 i =1
R= =
( n − 1) An
n n
( n − 2n + 1) ∑ ai + 2∑ ( i − 1) ai
i =1 i =1
= =
( n − 1) An
n
− ( n − 1) An + 2∑ ( i − 1) ai
i =1
= ,
( n − 1) An

de donde,
n
2∑ ( i − 1) ai
i =1
R= −1 . (12 bis)
( n − 1) An

206
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

6.3. CASO DE AGREGACIÓN EN FRECUENCIAS.

Gini, continuando con su sección 3, Figura 6.7, página 418, se plantea obtener
una expresión de su razón de concentración, R, para el caso que los n valores
estén agrupados en frecuencias absolutas; es decir, que de los n datos solo haya s
valores diferentes xl, l=1,..,s, y cada valor xl se repite nl veces ( él los llama fl ).

Figura 6.7: Gini, 1914, Página 418

Para obtener la fórmula, Gini define los valores Nl, como el número total
de individuos con valores menores o iguales a xl, y Nl-1 , como el número de
individuos con valores menores a xl , es decir menores o iguales a xl-1 ( él los
llama il e il-1); y por tanto, es claro que Nl-1= Nl - nl.

Observando la siguiente tabla de correspondencias, Tabla 6.2:

a1,.., an1 an1 +1,.., an1 + n2 an2 +1,.., an2 + n3 ... ans −1 +1 ,.., ans −1 + ns
a1,.., a N1 aN1 +1,.., aN 2 aN 2 +1,.., aN3 ... aN s −1 +1 ,.., aN s
x1 x2 x3 . xs
T
abla 6.2: Correspondencia con valores diferentes

se tiene que la expresión de (6.1)

207
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

n N1 N2 Ns
∑ ( i − 1) ai = ∑ ( i − 1) ai + ∑ ( i − 1) ai + ⋯ + ∑ ( i − 1) ai (6.1)
i =1 i =1 i = N1 +1 i = N s −1 +1

se podrá poner en este caso como:


n N1 N2 Ns
∑ ( i − 1) ai = ∑ ( i − 1) ai + ∑ ( i − 1) ai + ⋯ + ∑ ( i − 1) ai =
i =1 i =1 i = N1 +1 i = N s −1 +1
N1 N2 Ns
= x1 ∑ ( i − 1) + x2 ∑ ( i − 1) + ⋯ + xs ∑ ( i − 1) =
i =1 i = N1 +1 i = N s −1 +1
s Nl
= ∑ xl ∑ ( i − 1).
l =1 i = Nl −1 +1

Luego,
n s Nl
∑ ( i − 1) ai = ∑ xl ∑ ( i − 1) ;
i =1 l =1 i = N l −1 +1

n
2∑ ( i − 1) ai
i =1
y, en consecuencia, la expresión (12 bis), R = − 1 , se reduce a:
( n − 1) An
s Nl
2∑ xl ∑ ( i − 1)
l =1 i = Nl −1 +1
R= −1.
( n − 1) An
Pero como,
Nl
∑ ( i − 1) = ( Nl −1 + 1 − 1) + ( Nl −1 + 2 − 1) + ⋯ + ( Nl −1 + nl − 1) =
i = N l −1 +1

=
( Nl −1 + 1 − 1) + ( Nl −1 + nl − 1) n =
( Nl −1 + Nl − 1) n ;
l l
2 2
es decir,
Nl
( N l −1 + N l − 1)
∑ ( i − 1) = 2
nl , (6.2)
i = N l −1 +1

se tiene que:

208
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

s
∑ ( Nl −1 + Nl − 1) xl nl
l =1
R= − 1. (13)
( n − 1) An
Para el caso de frecuencias unitarias, nl=1, esta última fórmula coincide con la
expresión (12 bis), ya que se tiene que s=n, xl=al y Nl-1+Nl-1= (Nl-nl)+ Nl-1=
(Nl-1)+ Nl-1= 2(Nl-1).
Para casos de frecuencias no unitarias, es claro que la fórmula (13) no coincide
con la (12 bis).

En muchos manuales de estadística, se utiliza la fórmula (11) de Gini con


datos agregados en frecuencias; y es claro que (11) es igual a (12 bis) y que esta
no coincide con (13) en estos casos de datos agregados en frecuencias no
unitarias.

Una explicación de este error puede deberse, de alguna manera, al hecho


que en el libro de Gini “Curso de Estadística”, de 1935, traducido por el
estadístico y economista J.A. Vandellos, sólo se recogía la formula (11).

En efecto, consideremos el siguiente ejemplo numérico en el que se


aprecia claramente los diferentes resultados que aportan ambas expresiones,
Tabla 6.3. Calculemos en primer lugar R mediante (13):

xi ni Ni Si=xini Ni-1+Ni -1 (Ni-1+Ni -1)xini


5 15 15 75 14 1050
80 90 105 7200 119 856800

105 7275 857850

R= 0.133822363

Tabla 6.3: Ejemplo de cálculo de R mediante (13)

209
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

Se obtiene un valor para R de 0.13, indicando que hay poca concentración,


cosa lógica pues hay pocos individuos con ingresos pequeños y muchos
individuos con elevados ingresos.

Si ahora calculamos R usando la fórmula (6.1), Tabla 6.4, se obtiene:

xi ni Ni Si=xini Ai Pi Qi
5 15 15 75 75 0.142857143 0.01030928
80 90 105 7200 7275 1 1

105 7275

R*= 0.927835052

Tabla 6.4: calculamos R usando la fórmula (6.1)

Que indica concentración muy elevada, cosa que, obviamente, no ocurre.

6.4. CASO DE AGREGACIÓN EN INTERVALOS.

Continuando con la sección 3 del artículo de Gini, Figura 6.8, página 420, este
afronta la extensión de la fórmula (12 bis) a situaciones donde los datos han sido
agregados en r clases, con límites Ik=[lk-1, lk], k=1,..,r.

Figura 6.8: Gini, 1914, página 420

210
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

n
Para ver en qué se traduce, en este caso, la expresión 2∑ ( i − 1) ai que
i =1

aparece en la fórmula (12 bis), Gini define las frecuencias acumuladas Nk y Nk-1,
donde Nk es el número total de datos con valores menores o iguales que lk , y Nk-1
el total de datos con valores inferiores o iguales a lk-1. Igualmente define Sk como
la cantidad total del carácter que está presente en la clase k-ésima.

Para cada uno de los intervalo Ik, k=1,..,r se considera:

• Para cada uno de los nk valores ai, i=Nk-1+1,..Nk-1+nk, que caen


dentro del intervalo Ik, las diferencias entre ellos y su valor medio en dicho
Sk
intervalo, :
nk

Sk
δ ki = ai − , i=Nk-1+1,..Nk-1+nk,
nk
con lo que

Sk (6.3)
ai = δ ki +
nk

Igualmente, para cada uno de los nk rangos i, i=Nk-1+1,..Nk-1+nk, que caen


dentro del intervalo Ik, se consideran las diferencias entre los valores i-1 y el
valor medio de estas expresiones en dicho intervalo,
Nk
∑ ( i − 1) ( N k −1 + Nk − 1) nk ( N k −1 + N k − 1) ;
i = N k −1 +1 2
= =
nk nk 2
es decir, las diferencias

ε ki = ( i − 1) −
( N k −1 + N k − 1) ,
2
con lo que

211
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

( N k −1 + N k − 1) (6.4)
( i − 1) = ε ki +
2

Como la suma de las desviaciones de los valores de una magnitud respecto a su


media es cero, se tendrá que para cada uno de los intervalo Ik, k=1,..,r, se
verifica:
Nk
∑ δ ki = 0
i = N k −1 +1

Nk
∑ ε ki = 0
i = N k −1 +1

Por otro lado,


n N1 N2 Nr r Nr
∑ ( i − 1) ai = ∑ ( i − 1) ai + ∑ ( i − 1) ai + ⋯ + ∑ ( i − 1) ai = ∑ ∑ ( i − 1) ai
i =1 i =1 i = N1 +1 i = N r −1 +1 k =1 i = N r −1 +1

luego:

n r Nr
2∑ ( i − 1) ai = ∑ 2 ∑ ( i − 1) ai (6.5)
i =1 k =1 i = N r −1 +1

y, si sustituimos en la expresión anterior el valor obtenido en (6.3):

Nk Nk
 S 
2 ∑ ( i − 1) ai = 2 ∑ ( i − 1)  δ ki + nk  =
i = N k −1 +1 i = N k −1 +1  k 
(6.6)
Nk Nk
S
= 2 ∑ ( i − 1) δ ki + 2 k ∑ ( i − 1)
i = N k −1 +1 nk i = N k −1 +1

212
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

Pero, por (6.2):


Nk
( N k −1 + N k − 1)
∑ ( i − 1) = 2
nk
i = N k −1 +1

y, por otro lado, por (6.4):

Nk Nk
 ( Nl −1 + Nl − 1)  δ =
∑ ( i − 1) δ ki = ∑  ε ki +
2
 ki
i = N k −1 +1 i = N k −1 +1  
Nk
( Nl −1 + Nl − 1) Nk
= ∑ ε kiδ ki +
2
∑ δ ki =
i = N k −1 +1 i = N k −1 +1
Nk
= ∑ ε kiδ ki ,
i = N k −1 +1

luego,
Nk Nk
∑ ( i − 1) δ ki = ∑ ε kiδ ki
i = N k −1 +1 i = N k −1 +1

Y, sustituyendo en (6.6), se tiene:

Nk Nk
2 ∑ ( i − 1) ai = 2 ∑ ε kiδ ki + Sk ( N k −1 + N k − 1)
i = N k −1 +1 i = N k −1 +1

Por consiguiente, la expresión (6.5), queda:

n r Nr  Nk r 
2∑ ( i − 1) ai = ∑ 2 ∑ ( i − 1) ai = ∑  2 ∑ ε kiδ ki + Sk ( N k −1 + N k − 1)  =
i =1 k =1 i = N r −1 +1 k =1 
 i = N k −1 +1 
r r  Nk 
= ∑  Sk ( N k −1 + N k − 1)  + 2∑  ∑ ε kiδ ki ;
k =1 k =1 
i = N k −1 +1 

es decir,

213
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

n r r  Nk 
2∑ ( i − 1) ai = ∑  S k ( N k −1 + N k − 1)  + 2∑  ∑ ε kiδ ki 
i =1 k =1  i = N k −1 +1
k =1  

Con esto, la fórmula (12 bis) se expresa en la forma:

n r r  Nk 
2∑ ( i − 1) ai ∑  k ( k −1 k ) ∑  ∑ ki ki 
 S N + N − 1  + 2 ε δ
k =1  i = N k −1 +1
k =1   − 1
R = i =1 −1 =
( n − 1) An ( n − 1) An

En conclusión, para el caso de valores agrupados en intervalos:


r  Nk r 
∑  k k −1 k  ∑ ∑ ki ki 
 S ( N + N − 1 )  + 2  ε δ
k =1 k =1 
 i = N k −1 +1 
R= − 1 (14)
( n − 1) An

r  Nk 
2∑  ∑ ε kiδ ki 
k =1 
 i = N k −1 +1 
Como el término es pequeño, la formula anterior conduce a
( n − 1) An
esta otra fórmula aproximada:

r  r 
∑  Sk ( N k −1 + N k − 1)  ∑ Sk ( N k −1 + N k )  − nA n
R′ = k =1 − 1 =  k =1  (15)
( n − 1) An ( n − 1) An
Y, si además n es grande, esa formula (15) puede aproximarse por
r
∑  Sk ( N k −1 + N k )
k =1
R2′ = − 1, (15 bis)
nAn
verificándose que
n −1
R2' = R′ .
n

214
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

Como tanto los δ ki , como los ε ki crecen dentro de cada clase Ik, se tiene que
Nk r  Nk 
∑ ε kiδ ki > 0 , y por tanto ∑  ∑ ε kiδ ki  > 0 ; de donde se obtiene que:
i = N k −1 +1 k =1 
i = N k −1 +1 

R’<R. (16)

A continuación, Gini busca aproximar el término

r  Nk 
2∑  ∑ ε kiδ ki  (6.7)
 i = N k −1 +1
k =1  
( n − 1) An

y para ello, la primera hipótesis que considera es que los nk valores de la


intensidad del carácter en la clase Ik siguen una progresión aritmética; lo cual es
un caso particular del generalmente asumido en que los valores del carácter se
distribuyen, dentro de cada clase, de forma uniforme.

Si llamamos b, aunque en realidad habría que llamarle bk, a la diferencia


entre los términos de esa progresión aritmética, podemos considerar varias
posibilidades:

1. Que ninguno de los dos extremos de cada intervalo sea un valor


lk − lk −1
observado, con lo que se tendrá que b =
nk + 1
2. Que los dos extremos de cada intervalo sean un valor observado, con
lk − lk −1
lo que se tendrá que b =
nk − 1

215
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

3. Que sólo uno de los dos extremos de cada intervalo sea un valor
lk − lk −1
observado, por ejemplo el superior, con lo que se tendrá que b =
nk

Por simplificar los cálculos, nos ceñiremos a este caso (que es compatible
con la forma Ik=(lk-1, lk] para los intervalos) , con lo cual el primer valor que
aparece en el intervalo Ik será lk-1+b, y el último será lk-1+ nk b, que coincidirá con
lk.
Calcularemos los valores tanto de δ ki , como de los ε ki , para
posteriormente sustituirlos en la expresión
r  Nk 
∑ ∑ ki ki 
 ε δ
k =1 
i = N k −1 +1  (6.8)

que forma parte de (6.7).

Sk
Por (6.3), δ ki = ai − . Pero, a su vez, de la tabla siguiente, Tabla 6.5:
nk

Ik=(lk-1, lk], i=Nk-1+1


ai=lk-1+b
ai+1=lk-1+2b

ai +( nk −1) =lk-1+ nk b

Tabla 6.5: Valores dentro del intervalo I k

se deduce que
Sk= lk-1nk+(1+2+..+nk)b= lk-1nk + b nk( nk+1)/2,
y, por tanto,

216
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

Sk b ( nk + 1)
= lk −1 + ,
nk 2
luego
Sk b ( nk + 1)
δ ki = ai − = a i −lk −1 − , i=Nk-1+1,..Nk-1+nk,
nk 2
y, en consecuencia,
b ( nk + 1)
δ k , N k −1 +l = aN k −1 +l − lk −1 − =
2
b ( nk + 1)  n +1
= ( lk −1 + lb ) − lk −1 − = bl − k  , l = 1,.., nk .
2  2 

Es decir,

 nk + 1  (6.9)
δ k , N k −1 +l = b  l − , l = 1,.., nk
 2 

Análogamente, por (6.4):

ε ki = ( i − 1) −
( N k −1 + N k − 1) = ( N k −1 + N k −1 + nk − 1) =
( i − 1) −
2 2
n −1
= ( i − 1) − N k −1 − k ,
2
con lo que
nk − 1
ε ki = ( i − 1) − N k −1 − , i=Nk-1+1,..Nk-1+nk ;
2
y, por tanto,
nk − 1 n +1
ε k , N k −1 +l = ( N k −1 + l − 1) − N k −1 − =l− k , l = 1,.., nk .
2 2

Es decir,

217
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

nk + 1 (6.10)
ε k , N k −1 +l = l − , l = 1,.., nk
2

Por (6.9) y (6.10), se verifica que:

ε k , N k −1 +l = bε k , N k −1 +l , l = 1,.., nk .

Luego,
r  Nk  r  nk 
∑  ∑ ε kiδ ki  = ∑ ∑ ε k , Nk −1 +lδ k , Nk −1 +l  =
k =1 
i = N k −1 +1  k =1  l =1 
r  nk  r  nk 
= ∑  ∑ ε k , N k −1 +l ⋅ bε k , N k −1 +l  = ∑ b  ∑ ε 2 k , N k −1 +l ;
k =1 
 l =1  k =1  l =1 
es decir,

r  Nk  r  nk 2  (6.11)
∑ ∑ ki ki ∑ ∑ k , Nk −1+l 
 ε δ  = b ε
k =1 
i = N k −1 +1  k =1  l =1 

Pero, como por (6.10):


nk + 1 n +1
ε k , N k −1 +l = l − = ( l − 1) + 1 − k =
2 2
n −1
= ( l − 1) − k , l = 1,.., nk ,
2
se tiene que
nk − 1
ε k , N k −1 +l = ( l − 1) − , l = 1,.., nk ;
2
luego,

218
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

2 nk 
nk − 1 
nk nk 2
 nk − 1  2  nk − 1 
∑ε 2
k , N k −1 +l = ∑  ( l − 1) −  = ∑  ( l − 1) +   − 2 ( l − 1)
2 
=
l =1 l =1  2  l =1   2 
nk nk nk 2
 nk − 1 
= ∑ ( l − 1) + ∑   − ( nk − 1) ∑ ( l − 1).
2

l =1 l =1  2  l =1

N N ( N + 1)( 2 N + 1)
Y, como sabemos que ∑ i2 = 6
, se tendrá que:
i =1

nk nk nk nk 2
 nk − 1 
∑ε = ∑ ( l − 1) + ∑   − ( nk − 1) ∑ ( l − 1) =
2 2
k , N k −1 +l
l =1 l =1 l =1  2  l =1

( nk − 1) nk  2 ( nk − 1) + 1
 nk − 1 
2
( nk − 1) nk =
= +  nk − ( nk − 1)
6  2  2
( n − 1) nk [ 4nk − 2 + 3nk − 3 − 6nk + 6] = ( nk − 1) nk [ nk + 1] =
= k
12 12

=
(
nk nk 2 − 1 )
12

Es decir,
nk
(
nk nk 2 − 1 ).
∑ε 2
k , N k −1 +l =
12
l =1

Sustituyendo esa expresión en (6.11), se tiene que:

r Nk  r  nk 2 2
 r nk nk − 1 ( ) (6.12)
∑  ∑ ε kiδ ki  = ∑ b ∑ ε k , Nk −1+l  = ∑ 12 b
k =1 
i = N k −1 +1  k =1  l =1  k =1

Por tanto,
r  Nk 
2∑  ∑ ε kiδ ki  2∑ k k
r n n 2 −1
b
( )
 i = N k −1 +1  = k =1
r
k =1 

( n − 1) An
12
( n − 1) An
=
1

6 ( n − 1) An k =1
nk nk 2 − 1 b . ( )

219
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

lk − lk −1
Así pues, si tomamos b bajo el supuesto que dijimos, b = ,se tendrá que
nk

r Nk 
2∑  ∑ ε kiδ ki 
k =1   l −l
r
 i = N k −1 +1
( n − 1) An
=
1

6 ( n − 1) An k =1
(
nk nk 2 − 1 k k −1 =
nk
)
r
=
1

6 ( n − 1) An k =1
( )
nk 2 − 1 ( lk − lk −1 ).

Es decir,

r  Nk 
2∑  ∑ ε kiδ ki  (6.13)
k =1   r
 i = N k −1 +1
( n − 1) An
=
1

6 ( n − 1) An k =1
( )
nk 2 − 1 ( lk − lk −1 )

Sustituyendo esa expresión en (14), se tiene que, en el caso de agrupación en


intervalos, y bajo el supuesto establecido de progresión aritmética, la expresión
aproximada de R es:

r r  Nk 
∑  k ( k −1 k ) ∑ ∑ ki ki
 S N + N − 1  + 2  ε δ 
k =1 i = N k −1 +1
k =1   − 1 =
R′′ =
( n − 1) An
 r  
=
1 1 2
( )
 ∑  Sk ( N k −1 + N k − 1) + nk − 1 ( lk − lk −1 )   − 1.
( n − 1) An  k =1  6 

Es decir,
 r  
R′′ =
1 1 2
( )
 ∑  S k ( N k −1 + N k − 1) + nk − 1 ( lk − lk −1 )   − 1 (17)
( n − 1) An  k =1  6 
Igualmente, si n es suficientemente elevado, esa formula puede aproximarse por:

1  r  1 2 
R2′′ =  ∑ k k −1S ( N + N ) + n ( l − l )
k −1   − 1 , (17 bis)
nAn  k =1 
k k k
6 

220
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

existiendo la siguiente relación entre ambas:


n −1 lr − l0
R2′′ = R′′ + .
n 6 ( n − 1) An

Obsérvese, que las fórmulas (15), (15 bis), (17) y (17 bis) suponen que
conocemos los totales, Sk, las frecuencias absolutas, nk, y los extremos de cada
una de las clases Ik. Pero, no siempre es así:

a) En algunas aplicaciones, no se conoce el extremo inferior de la


primera clase y tampoco el extremo superior de la última clase. En estos casos,
una hipótesis que podemos usar es:
S k lk −1 + lk
= .
nk 2
b) En otras ocasiones, sucede que, para cada clase, solamente
conocemos sus frecuencias absolutas y desconocemos los valores de Sk. En tal
caso podemos usar también la hipótesis dada en a), con lo que
c)
lk −1 + lk
Sk = nk
2
r
1 r
An = ∑ S k = ∑ ( lk −1 + lk )nk .
k =1 2 k =1

Para tales situaciones, Gini, sustituyendo en (17) las expresiones anteriores, halla
su última aproximación a R:
r
∑ ( N k −1 + N k − 1) nk ( lk + lk −1 ) + 3 ( nk 2 − 1) ( lk − lk −1 )
 1 
k =1
R′′′ = r
−1 , (18)
( n − 1) ∑ ( lk −1 + lk )nk
k =1

que a su vez, cuando n es muy elevado, puede aproximarse por:

221
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

r
∑ ( Nk −1 + N k ) nk ( lk + lk −1 ) + 3 ( nk 2 ) ( lk − lk −1 )
 1 
k =1
R2′′′ = r
− 1. (18 bis)
n∑ ( lk −1 + lk )nk
k =1

A partir de este momento, Gini dedica su sección 4 a recoger varias aplicaciones


de R en diferentes ciencias.

En su sección 5, Gini plantea la situación en la que el carácter cuantitativo


tiene un número v de valores nulos y un número n de valores positivos,
estableciendo que

n −1
Rt = R p ⋅ m + (1 − m ) , m = , (19)
n + v −1

donde Rp es la razón de concentración calculada en los valores exclusivamente


positivos del carácter, y donde Rt es la razón de concentración para el conjunto de
todos los valores del carácter.

6.5. RELACIÓN ENTRE LA RAZÓN DE CONCENTRACIÓN R DE GINI


Y LA CURVA DE CONCENTRACIÓN DE LORENZ.

En la sección 6 del artículo, Gini, trabajando con datos desagregados con


n −1
∑ ( Pi − Qi )
i =1
frecuencias absolutas unitarias, prueba que se aproxima al área de
n
concentración, área entre la recta de equidistribución y la curva de concentración
de Lorenz, cuando n es suficientemente elevado.

222
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

n −1
∑ Pi
i =1
Igualmente, demuestra que se aproxima, para n suficientemente
n
grande, al área del triangulo formado por la recta de equidistribución, la base y el
lado derecho del cuadrado que delimita la curva de concentración.

Así pues, Gini prueba que, para n suficientemente grande, la razón de


n−1
∑ ( Pi − Qi )
i =1
concentración, R = n −1
, se aproxima al cociente entre las dos áreas
∑ Pi
i =1

citadas anteriormente.

En sus secciones 7 y 8, Gini propone usar métodos aproximados para


calcular el área de concentración. Pero recalca, que para al cálculo aritmético la
fórmula de R’’ que aparece en (17) es una buena aproximación al valor de R.

En la sección 8, construye una curva de concentración con datos


agregados en intervalos de clase. A continuación une los puntos de cambio de la
curva de concentración por segmentos. Así aproxima la curva de concentración
por una poligonal y luego calcula la aproximación al área de concentración como
el área existente entre la recta de equidistribución y la poligonal.

Veamos seguidamente la fórmula que obtiene. Puede comprobarse


fácilmente que el área de concentración aproximada, ACA, para el caso en que la
curva de concentración se aproxime por una poligonal, tiene la siguiente
expresión:
r  r 
∑  k k −1 k  1
 S ( N + N )   ∑ S k ( N k −1 + N k )  − nA n
ACA = k =1
− =  k =1  . (20)
2nAn 2 2nAn

223
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

Ahora, para calcular una media aproximada de la concentración, Gini divide ese
área entre el área del triangulo inferior que determina la gráfica de la curva de
concentración, que como sabemos es ½. Luego la medida aproximada de la
concentración que obtiene Gini a partir de este método gráfico, que llamaremos
índice de Gini Geométrico y notaremos por IGG , es:
r  r 
∑  k k −1 k 
 S ( N + N )   ∑ k k −1
S ( N + N )
k  − nA n
IGG =
ACA
= 2 ACA = k =1 −1 =  k =1 
1 nAn nAn
2

expresión que se relaciona con la fórmula de R’, hallada en (15) ( a R’ le


llamaremos IGT, índice de Gini Teórico) que aproximaba a la razón de
n −1
concentración R, pues coincide con el valor R′ .
n

Obviamente, si Gini hubiese dividido el área de concentración


aproximada, ACA, por el área correspondiente a la situación de máxima
concentración ( que está determinada por el triángulo de vértices (0,0), ((n-
n −1
1)/n,0) y (1,1)), que es , se hubiese obtenido, según (20):
2n
 r    r 
  ∑ k ( k −1
S N + N k ) − nA n  ∑ Sk ( N k −1 + N k )  − nA n
ACA ACA 2n   k =1   =  k =1 
= =
ACM n − 1 n −1  2nAn  ( n − 1) An
 
2n  
,
expresión que coincide con el valor de R’ dado en (15).

En consecuencia, la aproximación R’ de R, que llevamos a cabo en (15)


procede de haber realizado la aproximación de la verdadera curva de
concentración, que es la poligonal dada para datos desagregados en frecuencias

224
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

unitarias ( o no unitarias, pues coinciden en ambos casos) por la poligonal


obtenida al agregar los datos en intervalos.

Por tanto, la aproximación R’ de R será peor a medida que la verdadera


curva de concentración poligonal se aleje de la nueva forma poligonal que le
hemos asignado; y por consiguiente, mientras más acentuados sean los cambios
de pendiente de la curva de concentración verdadera, mientras menor sea el
número de clases que hemos establecido y mientras mayor dispersión haya en el
interior de cada clase.

El propio Gini, recoge un ejemplo, original de Pietra, de la propiedad de la


tierra en manos privadas en el estado de Victoria, sobre la influencia del número
de clases en los valores de R’ y R”. Exponemos seguidamente los resultados
obtenidos, Tabla 6.6:
Número de clases Valor de R’ Valor de R”
30 69.0% 69.1 %
25 68.9 % 69.2 %
20 68.8 % 69.2 %
15 68.4 % 69.1 %
10 67.8 % 69.2 %
8 66.5 % 69.1 %
6 65.8 % 69.6 %
5 64.6 % 69.3 %
4 58.1 % 71.1 %

Tabla 6.6: Gini, 1914, ejemplo de Pietra

Como se observa, la formula R” es una muy buena aproximación al valor


verdadero de R, y es la que permanece más estable, independientemente del
número de clases que se consideren.

225
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

Han sido realizadas pruebas adicionales, Tabla 6.7, para verificar la


estabilidad de R”. A continuación mostramos algunos resultados.

datos ni Ni (Ni-1 +Ni -1)xi ni datos ni Ni (Ni-1 +Ni -1)xi ni


61 2 2 122 102 10 189 374340
68 3 5 1224 103 5 194 196730
69 2 7 1518 104 4 198 162656
70 2 9 2100 105 6 204 252630
71 2 11 2698 106 1 205 43248
72 4 15 7200 107 2 207 87954
73 4 19 9636 108 1 208 44712
74 2 21 5772 109 5 213 228900
75 1 22 3150 110 4 217 188760
76 3 25 10488 111 4 221 194028
77 3 28 12012 113 2 223 100118
78 5 33 23400 114 1 224 50844
79 3 36 16116 115 3 227 155250
80 3 39 17760 118 3 230 161424
81 6 45 40338 119 1 231 54740
82 6 51 46740 120 3 234 167040
83 3 54 25896 121 1 235 56628
84 8 62 77280 122 1 236 57340
85 6 68 65790 123 1 237 58056
86 4 72 47816 125 1 238 59250
87 6 78 77778 126 2 240 120204
88 5 83 70400 127 1 241 60960
89 13 96 205946 128 1 242 61696
90 8 104 143280 129 2 244 125130
91 9 113 176904 130 1 245 63440
92 6 119 127512 132 3 248 194832
93 6 125 135594 136 600 848 89352000
94 7 132 168448 137 600 1448 188649000
95 5 137 127300 140 600 2048 293580000
96 6 143 160704 150 600 2648 422550000
97 5 148 140650 551 600 3248 1948887000
98 3 151 87612
99 7 158 213444 3248 2949301278
100 9 167 291600
101 12 179 418140 691827
R= 0.31292326

Tabla 6.7: Datos desagregados

226
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

Hemos obtenido que el verdadero valor de R es R=0.31

Si ahora agrupamos en 5 intervalos, obtenemos, Tablas 6.8 y 6.9:

Intervalos Nk Sk Nk-1+Nk -1 Sk (Nk-1+Nk -1) Pk Qk


x<=79 36 2635 35 92225 0.01108374 0.00380876
79<x<=97 112 9955 183 1821765 0.0455665 0.01819819
97<x<=115 79 8222 374 3075028 0.06988916 0.03008267
115<x<=133 21 2615 474 1239510 0.07635468 0.03386251
133<x<=551 3000 668400 3495 2336058000 1 1

2342286528 0.20289409 0.08595212


R' = 0.042702043 R*= 0.5763695

Tabla 6.8: Agrupando en 5 intervalos

lk –lk-1 Nk Ak Sk(Nk-1+Nk-1)+(nk2-1)*(lk-lk-1)/6
18 36 2635 96110
18 148 12590 1859394
18 227 20812 3093748
18 248 23427 1240830
418 3248 691827 2963057930

2969348012

R''=0.32184735

Tabla 6.9: Agrupando en 5 intervalos

Por lo que hemos obtenido los resultados: R’=0.04, R”=0.32, R*=0.57.

Si agrupamos en 10 intervalos, obtenemos, Tablas 6.10 y 6.11:

227
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

Nk Sk Nk-1+Nk -1 Sk (Nk-1+Nk -1) Pk Qk


I<=70 9 604 8 4832 0.00277094 0.00087305
70-79 27 2031 44 89364 0.01108374 0.00380876
79-88 47 3955 118 466690 0.02555419 0.0095255
88-97 65 6000 230 1380000 0.0455665 0.01819819
97-106 57 5786 352 2036672 0.06311576 0.02656155
106-115 22 2436 431 1049916 0.06988916 0.03008267
115-124 10 1199 463 555137 0.07296798 0.03181576
124-133 11 1416 484 685344 0.07635468 0.03386251
1800 247800 2295 568701000 0.63054187 0.39204454
1200 420600 5295 2227077000 1 1
3248 2802045955 0.99784483 0.54677253

R'= 0.24737047 R*= 0.45204653

Tabla 6.10: Agrupando en 10 intervalos

lk –lk-1 Nk Ak Sk(Nk-1+Nk-1)+(nk2-1)*(lk-lk-1)/6
9 9 604 4952
9 36 2635 90456
9 83 6590 470002
9 148 12590 1386336
9 205 18376 2041544
9 227 20812 1050640.5
9 237 22011 555285.5
9 248 23427 685524
9 2048 271227 573560999
409 3248 691827 2325236932

2905082670

R”=0.29323872

Tabla 6.11: Agrupando en 10 intervalos

Así pues, hemos obtenidos, siendo R=0.31 el verdadero, los siguientes


resultados, Tabla 6.12:

228
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

Nº intervalos R’ R” R*
5 intervalos 0.042 0.32 0.57
10 intervalos 0.24 0.29 0.45

Tabla 6.12: Diferentes valores aproximados de R

Que confirman la estabilidad de R”, la falta de precisión de R* y el


alejamiento de R’ del verdadero R al disminuir el número de clases que hemos
establecido.

En resumen, hemos obtenido las siguientes conclusiones sobre la


aplicabilidad de las diversas fórmulas:

1. Para datos desagregados con frecuencias unitarias:


n−1
∑ ( Pi − Qi )
i =1
• R= n −1
(11)
∑ Pi
i =1

n
2∑ ( i − 1) ai
i =1
• R= − 1 (12 bis)
( n − 1) An
Tanto las fórmulas (11) como la (12 bis) son fórmulas exactas. La (12 bis) es más
operativa.

2. Para datos agregados en frecuencias absolutas:


s
∑ ( Nl −1 + Nl − 1) xl nl
l =1
• R= − 1 (13)
( n − 1) An

229
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

s −1
∑ ( Pi − Qi )
* i =1
• R = s −1
(6.14)
∑ Pi
i =1

La fórmula (13) es exacta. La fórmula (6.14) es una aproximación que aparece en


muchos libros de textos, pero que en ocasiones tiene un comportamiento bastante
deficiente.

3. Para datos agregados en intervalos:

Aproximando la verdadera curva de concentración, que es la poligonal


dada para datos desagregados en frecuencias unitarias (o no unitarias, pues
coinciden en ambos casos) por la poligonal obtenida al agregar los datos en
intervalos.

r
∑  Sk ( N k −1 + N k − 1) ACA
k =1
• R′ = −1 = (15)
( n − 1) An ACM

ACA
∑  Sk ( Nk −1 + N k )
k =1
• IGG = = 2 ACA = −1 (6.15)
1 nAn
2

 r  
• R′′ =
1
( n − 1) An  k =1 
1 2
6
( )
 ∑  S k ( N k −1 + N k − 1) + nk − 1 ( lk − lk −1 )   − 1 (17)


r −1
∑ ( Pi − Qi )
* i =1
• R = r −1
. (6.16)
∑ Pi
i =1

230
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

Igual que en el caso de agrupación de frecuencias, la aproximación R* que


aparece en algunos libros de texto puede comportarse bastante mal.

La fórmula R” es una muy buena aproximación al valor verdadero de R, y


es la que permanece más estable independientemente del número de clases que se
consideren. La aproximación R’ de R será peor a medida que la verdadera curva
de concentración poligonal se aleje de la nueva forma poligonal que le hemos
asignado; y por consiguiente, mientras más acentuados sean los cambios de
pendiente de la curva de concentración verdadera, mientras menor sea el número
de clases que hemos establecido y mientras mayor dispersión haya en el interior
de cada clase.

6.6. RELACIÓN ENTRE R Y LA DIFERENCIA DE MEDIAS

En su sección 9, Gini prueba, partiendo de la fórmula (12), para datos


desagregados en frecuencias absolutas unitarias, que la diferencia media relativa
sin reemplazamiento coincide con la razón de concentración. Es decir,

R= ,
2M
donde M es la media aritmética, y donde,
n +1
n n 2
∑∑ ai − a j 2 ∑ ( n + 1 − 2i ) ( an+1−i − ai )
i =1
∆= = ,
n ( n − 1) n ( n − 1)

y donde el valor (n+1)/2 hay que cambiarlo por n/2 en caso que n sea par,
obteniendo:

231
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

En su sección 10, Gini relaciona, para el caso de datos agregados en


intervalos de clase, la diferencia de medias con la aproximación de R que
notamos por R’, y que aparecía en la formula (15).

Si los n valores del carácter cuantitativo se agrupan en r clases, denotamos


por ∆k la diferencia media para los nk valores del carácter dentro de la clase Ik, y
por ∆’ la diferencia media de la agrupación que se obtiene en el colectivo en
conjunto al sustituir los nk valores de cada una de las clase Ik por su
correspondiente media aritmética. Se verifica que:
r
∑ nk ( nk − 1) ∆ k
∆′ = ∆ − k =1 (23)
n ( n − 1)

Ahora, Gini indica, aunque no lo demuestra, que de forma análoga a como



demostró que R = , se prueba que
2M
∆′
R′ = .
2M
Veámoslo por otro camino.

Para datos agregados en frecuentas absolutas, es conocido que también se



verifica la relación R = ; luego, al sustituir los nk valores de cada una de las
2M
clase Ik por su correspondiente media aritmética, denominémosla xk , se verifica
que la razón de concentración de estos nuevos datos, llamémosla R*, vendrá
dada por
∆′
R* = (6.17)
2M

Pero, si agregamos en frecuencias absolutas, por (13), el valor de R* será

232
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

r
∑ ( N k −1 + Nk − 1) xk nk
* k =1
R = −1
( n − 1) An
r
∑  Sk ( N k −1 + N k − 1)
k =1
que coincide con R′ = − 1 , la expresión aproximada de R
( n − 1) An
para el caso de agrupación de intervalos, establecida en (15), pues xk nk = Sk , al
ser xk la media aritmética de la clase Ik, luego, R’=R* , y , por (6.17), se verifica:

∆′
R′ = R* =
2M
Es decir,
∆′
R′ =
2M
que es lo que queríamos probar.
r
∑ nk ( nk − 1) ∆ k
Si ahora volvemos a (23), ∆′ = ∆ − k =1 , y dividimos los dos
n ( n − 1)

miembros de la igualdad entre 2M, se tiene que:

r
∑ nk ( nk − 1) ∆ k r r

∆′
∆ − k =1
n ( n − 1) ∆
∑ nk ( nk − 1) ∆ k ∑ nk ( nk − 1) ∆ k
= ⇒ R' = − k =1 = R − k =1
2M 2M 2M 2Mn ( n − 1) 2 Mn ( n − 1)

luego,
r
∑ nk ( nk − 1) ∆ k
R ' = R − k =1 (24)
2 M ⋅ n ( n − 1)

233
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

r
∑ nk ( nk − 1) ∆ k (6.18)
R = R′ + k =1
2 M ⋅ n ( n − 1)

Por (14) y (15), se tenía que:

 Nk
r 
2∑  ∑ ε kiδ ki 
k =1 
i = N k −1 +1 
R = R′ + ,
( n − 1) An

por tanto, teniendo en cuenta (6.18), se verifica que:

r  Nk  r
2∑  ∑ ε kiδ ki  ∑ nk ( nk − 1) ∆ k
k =1 
 i = N k −1 +1  k =1
(6.19)
=
( n − 1) An 2 Mn ( n − 1)

Calculemos seguidamente una aproximación al término

r
∑ nk ( nk − 1) ∆ k
k =1
2M ⋅ n ( n − 1)

Si ahora suponemos que los valores del carácter cuantitativo, dentro de cada
lk − lk −1
clase, siguen una progresión aritmética de diferencia bk = , Gini obtiene
nk
que
nk + 1
∆k = bk
3
y, por tanto,

234
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

r r
n +1 r
l −l
∑ nk ( nk − 1) ∆ k ∑ nk ( nk − 1) k 3 bk ∑ nk ( nk − 1)( nk + 1) k n k −1
k =1
= k =1 = k =1 k
=
2M ⋅ n ( n − 1) An
2 ⋅ n ( n − 1) 6 An ( n − 1)
n
r
∑ ( nk 2 − 1) ( lk − lk −1 )
k =1
=
6 An ( n − 1)

es decir,
r r
∑ nk ( nk − 1) ∆ k ∑ ( nk 2 − 1) ( lk − lk −1 ) (6.20)
k =1 k =1
=
2M ⋅ n ( n − 1) 6 An ( n − 1)

y sustituyendo en (6.18), se obtiene que, en el caso de agrupación en intervalos, y


bajo el supuesto de progresión aritmética, la expresión aproximada para R es:

r
∑ ( nk 2 − 1) ( lk − lk −1 )
k =1
R′′ = R′ +
6 An ( n − 1)

que coincide con la dada en (17).

Además, en esta situación, se verifica, por (6.19) y (6.20), que


r  Nk  r r
2∑  ∑ ε kiδ ki 
k =1  
∑ nk ( nk − 1) ∆k ∑ ( nk 2 − 1) ( lk − lk −1 )
 i = N k −1 +1 = k =1
= k =1
( n − 1) An 2 Mn ( n − 1) 6 An ( n − 1)

y por tanto,
r  Nk  r
2∑  ∑ ε kiδ ki 
 i = N k −1 +1
∑ ( nk 2 − 1) ( lk − lk −1 )
k =1   = k =1
( n − 1) An 6 An ( n − 1)

valor que también habíamos obtenido anteriormente en (6.13)

235
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

6.7. OTRA FORMULACIÓN DEL ÍNDICE R PARA DATOS


AGREGADOS EN FRECUENCIAS ABSOLUTAS

En este apartado se va a hallar una expresión alternativa a la dada por Gini en


(13). Para ello, partiremos de su fórmula original,

n −1

∑ (P − Q )
i =1
i i
R= n −1
.
∑P
i =1
i

Si tenemos en cuenta que sólo hay s valores diferentes, podemos expresar

n−1
∑ ( Pi − Qi ) en la forma
i =1

n−1 n n n
∑ ( Pi − Qi ) = ∑ ( Pi − Qi ) = ∑ Pi − ∑ Qi =
i =1 i =1 i =1 i =1
s Ni s Ni s s s
=∑ ∑ Pi − ∑ ∑ Qi = ∑ Li − ∑ M i = ∑ ( Li − M i )
i =1 j = N i −1 +1 i =1 j = N i −1 +1 i =1 i =1 i =1

donde hemos considerado las sumas parciales

N i −1 + ni
Li = ∑ Pj
j = N i −1 +1

N i −1 + ni
Mi = ∑ Qj
j = Ni −1 +1

Calculemos seguidamente la expresión simplificada de cada Li a partir de su

correspondiente Pi:

236
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

N i −1 + ni N i −1 + ni N i −1 + ni
j 1
Li = ∑ Pj = ∑ = ∑ j=
j = N i −1 +1 j = N i −1 +1 N N j = N i −1 +1

1
( N i −1 + 1) + ( Ni −1 + 2 ) + ⋯( i ) ⋯ + ( Ni −1 + ni )  =
n
=
N 
1 1 n ⋅ ( n + 1) 
= ( ni ⋅ Ni −1 + (1 + 2 + ⋯ + ni ) ) =  ni ⋅ Ni −1 + i i =
N N 2 
n  ( n + 1)  = ni  N + n − n + ( ni + 1)  =
= i  N i −1 + i   i −1 i i 
N 2  N 2 

=
ni  ( ni + 1)  = ni  N − ni − 1  = n  Ni − ni − 1  = n  P − ni − 1 
 N i − ni +   i  i  i i 
N 2  N 2  N 2N   2N 

Luego,

N i −1 + ni
 ( n − 1) 
Li = ∑ Pj = ni  Pi − i
2N 
 (6.21)
j = N i −1 +1 

Igualmente, calculemos la expresión simplificada de cada Mi a partir de su

correspondiente Qi:

N i −1 + ni N i −1 + ni
( n1x1 + n2 x2 + ⋯ + ni −1xi−1 + ( j − Ni−1 ) xi ) =
Mi = ∑ Qj = ∑ T
j = N i −1 +1 j = Ni −1 +1

=∑
ni
( n1x1 + n2 x2 + ⋯ + ni −1xi −1 + jxi ) =
j =1 T
ni
n x
= i ( n1x1 + n2 x2 + ⋯ + ni −1xi −1 ) + i
T T
∑i =
j =1

ni x n ( n + 1)
= ( n1x1 + n2 x2 + ⋯ + ni −1xi−1 ) + i i i =
T T 2
n  n x + xi 
= i ( n1 x1 + n2 x2 + ⋯ + ni −1xi −1 + ni xi ) − ni xi + i i =
T  2 
 Ti ( n − 1) xi   ( ni − 1) xi 
= ni  − i  = ni  Qi − 
T 2T   2T 

237
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

Es decir,

N i −1 + ni
 ( ni − 1) xi 
Mi = ∑ j i i Q = n Q −
2T 
 (6.22)
j = N i −1 +1 
Además,

n − 1 n−1  n−1  n s
= ∑ Pi =  ∑ Pi + Pn  − Pn = ∑ Pi − 1 = ∑ Li − 1 ,
2 i =1  i =1  i =1 i =1

con lo que

n−1 s
∑ ( Pi − Qi ) ∑ ( Li − M i )
i =1 i =1
R= n −1
= s
=
∑ Pi ∑ Li − 1
i =1 i =1
s s
∑ Li ∑ Mi
i =1 i =1
= s
− s
∑ Li − 1 ∑ Li − 1
i =1 i =1

Por tanto,

s s
∑ Li − 1 1
∑ Mi
i =1 i =1
R= s
+ s
− s
=
∑ Li − 1 ∑ Li − 1 ∑ Li − 1
i =1 i =1 i =1
s

1
∑ Mi
i =1
= 1+ − =
( n − 1) ( n − 1)
2 2
s
n + 1 − 2∑ M i
i =1
=
n −1

238
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

Es decir,

s
n + 1 − 2∑ M i
R= i =1
 ( n − 1) xi 
, M i = ni Qi − i
(6.23)

n −1  2T 

Igualmente, hemos obtenido que una expresión de R a partir exclusivamente de


los Pi y Qi de los s valores diferentes presentes en los n datos originales viene
dada por:

∑ n (Pˆ − Qˆ )
s

i i i
2  s 1 s 
R= i =1
=  ∑ n ( P − Q ) + ∑ ni (q i − pi ) ,
(N − 1) N − 1  i =1
i i i
2 i =1 
2
donde,
pi n
Pˆi = Pi − , pi = i
2 N
q xn .
Qˆ i = Qi − i , qi = s i i
2
∑ x jnj j =1

Si ahora calculamos la razón de concentración mediante (6.23), Tabla 6.13:

xi ni Ni ti=xini Ai Qi Mi
5 15 15 75 75 0.010309278 0.08247423
80 90 105 7200 7275 1 45.9587629

105 7275 46.0412371

R= 0.133822363
Tabla 6.13: Razón de concentración mediante (6.21)

Es decir, hemos obtenido el mismo valor que el calculado usando la


fórmula (13).

Otra formulación diferente puede verse también en Montero (2001).

239
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

6.8. DOMINANCIA DE LASSALLE E ÍNDICE DE DESIGUALDAD

En el capítulo 2 y 3 mostramos que dadas dos distribuciones X e Y, se decía que

* *
x  y
X ≥ Y sii   ≥   (2.8)
LAS  x i  y i

Por consiguiente, una distribución será mejor, tendrá más igualdad, mientras

mayores sean las medias parciales


( xi )* , ∀i ; es decir cuanto más se aproximen a
x
1; que es el valor máximo, mientras que la distribución será peor, tendrá más

desigualdad, cuanto mayores sea las diferencias 1 −


( xi )
*
, ∀i .
x

Por tanto, una medida de la desigualdad global de la distribución, obtenida


a partir del criterio de Lassalle, podría considerarse que es la media ponderada
de esas diferencias, con ponderaciones la proporción de individuos a la que le
afecta cada diferencia:

 *
1 − ( xi )  (6.24)
 x 
 

 xi ) 

Veamos ahora pues, que el IG se puede expresar en la forma 1 −
( *
. Para
 x 
 
n −1

∑ (P − Q )
i =1
i i
ello, partiremos de la expresión R = n −1
, y veamos qué significado tienen
∑P
i =1
i

240
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

las diferencias Pi - Qi, es decir, las diferencias entre la curva de Lorenz y la línea
de equidistribución..

i xi*
Obsérvese que Qi puede expresarse en la forma Qi = , pues se tiene
N x
que

i
i ∑ xj
∑ xj j =1
xi* xi* xi* i xi*
j =1 j
Qi = k
= k
= k
=i k
=i =
N k N x
∑ xj ∑ xj ∑ xj ∑ xj ∑x
N j =1 j
j =1 j =1 j =1 j =1
j j
i xi*
Qi =
N x

Luego,

i xi* i i xi* i  xi* 


Pi-Qi= Pi- = − =  1 −  ; es decir,
N x N N x N x 

i  xi* 
Pi-Qi= 1 −  (6.25)
N x 

Donde xi* es la cantidad media de la magnitud (riqueza) que poseen todos


los individuos que se encuentran en la categoría i o en las inferiores.
Pero obsérvese que, como hemos indicado cuando nos referíamos a la
i
dominancia estocástica de grado dos, representa la proporción de individuos a
N

241
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

xi*
los que se les está midiendo la desigualdad y 1 − representa la intensidad de
x
desigualdad con respecto a la media de ese colectivo considerado.

i  xi* 
Luego, Pi-Qi= 1 −  proporciona información tanto de la intensidad
N x 

de la desigualdad del colectivo formado por todos los individuos hasta la
categoría i, como de la extensión de esa desigualdad.

n−1 n −1
i
Además, por ser ∑ Pi = ∑ n , puede considerarse que una medida natural
i =1 i =1

de la desigualdad global que se obtendría usando el criterio de Lassalle coincide


con el índice de Gini.

6.9. DOMINANCIA DE BEAULIEU E ÍNDICE DE BIENESTAR.

En los capítulos 2 y 3, hemos establecido que:

X≥ Y sii xi* ≥ yi* , ∀i = 1,⋯ , N (2.9)


BEA

Por tanto, una distribución será mejor, según el criterio de Beaulieu (que
realmente podría denominarse de Beaulieu-Pareto), cuanto mayores sean sus

medias parciales xi* , ∀i = 1,⋯ , N . Por consiguiente, una medida de la bondad


global de esa distribución podría cuantificarse como la media ponderada de esas

medias parciales xi* ; es decir, como (x ) .


i
*

Desde el punto de vista social, un aumento en una magnitud de renta,


como por ejemplo la renta nacional, no implica necesariamente un aumento del

242
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

bienestar del conjunto de la comunidad, por cuanto ese aumento de renta puede
haberse debido sólo al aumento de la renta de muy pocos individuos.

Igualmente, una disminución de la desigualdad tampoco lleva aparejada


necesariamente un aumento en el bienestar, pues puede ocurrir que aunque las
desigualdades hayan disminuido, la renta de cada individuo también lo haya
hecho.

Por tanto, el concepto de desigualdad es diferente al concepto de bienestar.


Una medida del bienestar global de un colectivo, W, se obtendrá combinando, de
algún modo, el aspecto de eficiencia (medido por el nivel, digamos de renta
media) con el aspecto de equidad (medido como lo contrario a la desigualdad, la
igualdad), de manera que sea creciente en el nivel de renta y decreciente en el
nivel de desigualdad; y, por tanto, si crece la eficiencia y la equidad, lógicamente
ha de crecer el bienestar, y si los dos aspectos decrecen también decrece el
bienestar, W = W ( µ , I ) . Por tanto, estamos suponiendo que en caso de dos

distribuciones con igual renta se prefiere la distribución menos desigual y en caso


de dos distribuciones con la misma desigualdad se prefiere la de mayor renta.

Blackorby y Donalson (1978), entre otros, sugieren que si I es un índice


relativo de desigualdad, la expresión que relaciona bienestar social con eficacia y
equidad, viene dada por:

W= x (1-I) (6.26)

No obstante, a la hora de medir la desigualdad en la distribución de rentas,


es importante analizar el equivalente en renta de la pérdida de bienestar social
debida a la dispersión de dichas rentas. El cociente entre la cantidad de renta que
distribuida igualitariamente nos proporciona el mismo bienestar que la renta

243
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

original , y el número de individuos, es lo que se denomina renta equivalente, xe ,


y desempañará un papel importante en el capítulo 7.

xe
Con esto, si I puede expresarse en la forma I=1- , se tendrá que el
x
bienestar es

  x 
W = x (1 − I ) = x  1 − 1 − e   = xe (6.27)
 x  
 

xe es la renta igualitaria que tendrían que tener todos los individuos para que se

produzca el mismo bienestar social que con la distribución de rentas original. Por
tanto, x - xe nos mide la renta per cápita que se perdería para conseguir la

igualdad, la cantidad de renta per cápita a la que estaríamos dispuestos a


renunciar para conseguir la igualdad en la distribución de la renta. Es decir, la
xe
cantidad de renta socialmente mal utilizada debido a la dispersión; e I=1-
x
mide lo mismo, pero en términos relativos en lugar de absolutos.
n −1

∑ (P − Q )
i =1
i i
Veamos seguidamente otra forma de expresar el IG, R = n −1
.
∑P
i =1
i

Los sumandos Pi – Qi, que vimos era la proporción de intensidad total que
ha de transferirse al colectivo de los Pi casos con intensidad más baja para
eliminar la desigualdad presente en los mismos, pueden expresarse en la forma:

∑ ( x − xk ) 1 N
k ≤i
Pi − Qi =
x
En efecto, como

244
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

i
i ∑ x jn j
∑ x jn j j =1
N xi
j =1
Qi = k
= k
=
x
∑ x jn j ∑ x jn j
j =1 j =1
N

xi
Qi = (6.28)
x

se verifica que Pi − Qi puede ponerse como

∑( x − x j ) 1N
1
1
∑ x j 1N x∑ − ∑ xj 1
N j ≤i N
j ≤i j ≤i j ≤i
Pi − Qi = ∑ − = =
j ≤i N x x x

∑( x − x j ) 1N
j ≤i (6.29)
Pi − Qi =
x

De donde se obtiene:

N −1 N −1 ∑ ( x − xk ) 1 N 1  N −1 N −1 
∑ ( Pi − Qi ) = ∑ k ≤i x
=  ∑ ∑ x − ∑ ∑ xk  =
N x  i =1 k ≤i
i =1 i =1 i =1 k ≤i 
1  N −1 N −1 N −1  1  x ( N − 1) N N −1 
=  ∑ xi − ∑ ∑ xk  =  − ∑ xk ( N − 1 − k + 1)  =
N x  i =1 k =1 i ,i ≥ k  N x  2 k =1 
1  x ( N − 1) N N −1  1  xN 2 − N x N −1 
=  − ∑ xi ( N − i )  =  − ∑ xi ( N − i ) 
N x  2 i =1  N x  2 i =1 

245
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

Por consiguiente,

N −1
1  2 N N 
∑ ( Pi − Qi ) = 2 N x  xN − N x − 2 N ∑ xi + 2∑ ixi  =
i =1  i =1 i =1 
1  2 N 
= 
2N x 
xN − N x − 2 xN 2
+ 2 ∑ ixi  =
i =1 
1  N 
= 
2N x 
− N x − xN 2
+ 2 ∑ ixi  =
i =1 
1  N  1 N 
= 
2N x 
− N ( N + 1) x + 2 ∑ ixi =  ∑ xi ( 2i − N − 1) 
i =1  2 xN  i =1 

Por tanto, se tiene que

N −1
1 N 
∑ ( Pi − Qi ) =  ∑ xi ( 2i − N − 1) 
2 xN  i =1
(6.30)
i =1 

n−1 n −1
i ( n − 1) , se tendrá que el índice de Gini puede ponerse
Y como ∑ Pi = ∑ n = 2
i =1 i =1

como:

N −1
∑ ( Pi − Qi ) 1 N 
 ∑ xi ( 2i − N − 1) 
i =1
R= = (6.31)
N −1
xN ( N − 1)  i =1 
∑P
i =1

N −1
Por consiguiente, IGG = IG puede expresarse en la forma:
N

246
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

N
 2i − N − 1  N
 2i − N − 1 
1  N ∑
 i =1  N
 xi

∑  N2 
 xi
(6.32)
 ∑ xi ( 2i − N − 1)  =
i =1
IGG = =
xN 2  i =1  xN x

Y, operando, se tiene que

N
  1 
∑ wi xi  N − i − 2 
 
, wi = 
xe i =1
IGG = 1 − , donde xe = N (6.33)
x N
∑ wi
i =1

Cada peso wi representa la proporción ajustada de individuos por encima de la


observación i-ésima; es decir, la media equivalente es la media aritmética
ponderada de los valores, cuyas ponderaciones se corresponden con la
proporción de personas, tramos, que se encuentran en mejor situación que el
considerado.

Además, puede probarse que

 N

1
∑ wi xi − M e
 x − i =1 si N par
 2 N
 ∑ wi
N
 2i − N − 1  
xe = x − ∑ 
i =1
2  xi = 
i =1  
N 
N (6.34)
 ∑ wi xi − M e
N 2 − 1 1 i =1
x − N
si N impar
 N 2
 ∑ wi
 i =1

247
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

2i − N − 1
Con wi = , que representa el valor absoluto de la diferencia
N
entre la proporción de individuos por debajo y la proporción de individuos por
encima; es decir, si llamamos di al nº de tramos que separan el valor xi de la
mediana:

 2
 N di si N impar
wi = 
 2 ( d + 1) si N par
 N i

Es decir, la media equivalente es la media aritmética menos una


penalización.

Con ello, se tiene que, en caso de trabajar con el índice de Gini


geométrico, el bienestar social se mide por la expresión:

N
 1
∑ wi xi N − i − 
WIGG = xe = i =1
, wi =  2
N (6.35)
N
∑ wi
i =1

Vamos a ver seguidamente que la medida de la bondad global de la


distribución, que fue cuantificada como la media ponderada de las medias

parciales xi* , ( x ) , coincide, para N suficientemente grande, con la media


i
*

equivalente de Gini.

En efecto,

248
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

( )
N N N i x
1 i 1 2
xi* = N ∑ N xi* = N ∑ i ⋅xi* = ∑ i ⋅∑
N ( N + 1) i =1 j =1 i
j
=
∑ iN i =1
∑ i i=1
i =1 i =1
N i
2 2
= ∑∑
N ( N + 1) i =1 j =1
xj =  x1 + ( x1 + x2 ) + ⋯ ( x1 + ⋯ + xN )  =
N ( N + 1) 
2
=  Nx1 + ( N − 1) x2 + ⋯ + 2 xN −1 + 1xN  =
N ( N + 1) 
N
2
= ∑ ( N − i + 1) xi
N ( N + 1) i =1

Y, por otro lado,

N N
 1 1
∑ ( N − i + 1) xi = ∑  N − i + 2 + 2  xi =
i =1 i =1
N N N
 1 1  1 1
= ∑  N − i +  xi + ∑   xi = ∑  N − i +  xi + N x
i =1  2 i =1  2  i =1  2 2

Con lo que se obtiene:

(x ) N  
N
2 2 1 1
i
*
= ∑
N ( N + 1) i =1
( N − i + 1) xi =  ∑  N − i +  xi + N x  =
N ( N + 1)  i =1  2 2 
N2 N
 1 
2
 2 ∑  N − i + 2  xi 1

=  i =1
+ N x =
N ( N + 1)  N2 2 
 2 
 
 N  1 
 ∑  N − i +  xi 
N 2 2  i =1  2 1  N  1 
= + x = x + x
N  N + 1  N 
2 N ( N + 1)  e
N2
 2 
 

249
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

Por tanto,

( x ) = NN+ 1  x + N1 x = N1+ 1  N x + x =


i
*
e e

1   N
 2i − N − 1   
= 
N + 1 
x + N  x − ∑ 
 2  xi   =

 i =1 N  
1  N
 2i − N − 1  
= 
N +1 
( N + 1) x − N ∑ 
 2  xi  =

i =1 N 
N N  2i − N − 1  N
 2i − N − 1 
= x− ∑ 
N + 1 i =1  N 2  xi ≃ x − ∑ 
 N2 
 xi = xe
i =1 

Es decir, que tal como queríamos probar:

(x ) ≃ x
i
*
e (6.36)

Veamos seguidamente la interpretación geométrica de ese coeficiente de


bienestar.

IGG=2 AL= 2  1 − D  =1 – 2D, siendo D el área que hay bajo la curva de


2 

Lorenz, ABL ; de donde un indicador de la Igualdad será1-IGG=2D. Es decir, la


igualdad, 1- IGG, se mide por dos veces el área que hay bajo la curva de Lorenz,
2 ABL . Figura 6.9:

250
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

Figura 6.9: Área de Lorez y bajo la curva de Lorenz

IGG=2 AL= 2  1 − D  =1 – 2D (6.37)


2 

1-IGG=2D (6.38)

Luego, el bienestar , entendido como el producto de la eficiencia por la


igualdad, queda W = x (1- IGG)= x 2D=2 (D x )= 2ABLG, donde ABLG es el área
por debajo de la curva de Lorenz generalizada, 0 ≤ W ≤ x . Figura 6.10. Es decir,
una medida del bienestar coincide con dos veces el área por debajo de la curva
de Lorenz generalizada.

251
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

Figura 6.10: Área de Lorez generalizada y bajo la curva de Lorenz generalizada

Bienestar = x (1- IGG)= x 2D=2 (D x )= 2ABLG (6.39)

Figura 6.11: Curva de Lorez generalizada y media equivalente

252
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

Por otro lado, la diferencia de niveles de bienestar que proporciona la


distribución estudiada respecto a la resultante tras un reparto igualitario, resulta
ser:
W1= x (1-0)

W2= x (1-IGG)

∆ ∆
Luego W1 – W2= x IGG= x = , la mitad de la diferencia media, que es
2x 2
una medida de dispersión absoluta, que se denomina Índice absoluto de Gini,
IGA.
∆ ∆
W1 – W2= x IGG= x = (6.40)
2x 2

Geométricamente, Figura 6.10, esa expresión W1-W2, se corresponde con


el doble del área por debajo de la línea generalizada de equidistribución
generalizada menos el doble del área por debajo de la curva de Lorenz
generalizada ; es decir, el doble del área de Lorenz generalizada.

Es decir, un indicador de la pérdida de bienestar social como consecuencia


de la desigualdad viene dado por:

IGA= = 2ALG = 2 xAL = 2 ALG (6.41)
2

Si se define el Índice Geométrico Absoluto de Gini como IGGA= x ·IGG,



es decir , se verifica que
2

1 N 2i − N − 1 N
IGGA = ∑ ci xi − M e , ci = , ∑ ci = 1 (6.42)
2 i =1 N2 i =1
2

253
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

Yitzhaki (1982) prueba que una condición necesaria para que X domine en
primer grado a Y es:

+∞ n +∞

∫ (1 − FX ( t ) ) dt ≥ ∫ (1 − FY ( t ) ) dt , ∀n = 1, 2,..
n
(6.43)
0 0

y para que la dominancia sea en segundo grado:

+∞ n +∞

∫ (1 − FX ( t ) ) dt ≥ ∫ (1 − FY ( t ) ) dt , ∀n = 2,3,..
n
(6.44)
0 0

∑∑ xi − x j
i j
Pero, ∆= puede expresarse en el caso continuo como
N2
+∞ +∞ +∞
∆= ∫ ∫ x − y f X ( x ) fY ( y ) dxdy = 2 ∫ F ( x ) (1 − F ( x ) ) , con lo que
0 0 0

+∞ +∞

2
= ∫ F ( x ) (1 − F ( x ) ) y por tanto, dado que µ = ∫ (1 − F ( x ) )dx , se tiene que
0 0

+∞ 2

µ− =
2 ∫ (1 − F ( x ) ) dx (6.45)
0

Por lo tanto, la condición necesaria para n=2 se traduce en que


∆X ∆ ∆X
µX − ≥ µY − Y ; es decir, xe ≥ ye (pues µ X − = xe ) , la media
2 2 2
equivalente de X es mayor o igual a la de Y.

xe ≥ ye (6.46)

254
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

Veamos seguidamente la expresión de las medias equivalentes para el


caso de las distribuciones Pareto, PC y PCT.

αh
En el caso de X ∼ P(α , h) , se tiene que E [ X ] = , α > 1 y que
α −1
∆ 1 ∆ µ
IG [ X ] = = , α > 1 , de donde = y, por tanto:
2µ 2α − 1 2 2α − 1

∆ µ  1 
xe = µ − =µ− = µ 1 − =
2 2α − 1  2α − 1 
αh  1  2α h
= 1 − =
α − 1  2α − 1  2α − 1

∆ 2α h
X ∼ P(α , h) , xe = µ − = (6.47)
2 2α − 1

En el caso de X ∼ PC (b, c) , se tendrá que:


−b
e 2c +∞

∫ (1 − F ( x) ) dx
2
xe = ∫ 1+
−b
0 e 2c

(1+ 2b )2
π −   1 
1 + Erf
e 8c
  (6.48)
−b 2   2 2 −c  
xe = e 2c +
2 −c

Si X ∼ PCT (h, b, c) , se tiene:


1 +∞

∫ (1 − F ( x) ) dx
2
xe = ∫ 1 +
0 1

255
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

(1+ 2b )2
−   1 + 2b + 4cLn(h)  
πe 8c h −2(b+cLn( h )) 1 + Erf   (6.49)
  2 2 −c 
xe = h +
2 2 −c

En el caso concreto de X ∼ PCT (h = 1, b, c) , se tendrá:

(1+ 2b )2
−   1 + 2b  
πe 8c
1 + Erf   (6.50)
  2 2 −c  
xe = 1 +
2 2 −c

Si las funciones de distribución se cruzan a lo sumo una vez, como es el


caso de las distribuciones de Pareto y la PCT, entonces las condiciones anteriores
son suficientes para la dominancia estocástica de segundo grado, DES
(Yitzhaki,1982).

Hanoch y Levy (1969) prueban otra condición suficiente de DES para el


caso de que las funciones de distribución se crucen a lo sumo una vez: si
µ X ≥ µY y FX cruza, a lo sumo, una vez a FY, y la cruza por abajo, entonces
X ≥ LG Y .

Nótese el significado de que FX cruza, a lo sumo, una vez a FY, y la cruza


por abajo es el siguiente: soporte( X ) ⊆ soporte(Y ) ≡ [ a, b ] ,

∃k ∈ [ a, b ] / FX ( s ) ≤ FY ( s ) , ∀s ∈ [ a, k ] ; FX ( s ) ≥ FY ( s ) , ∀s ∈ [ k , b ] .

Veamos en qué se traduce esta última condición suficiente en el caso de


dos distribuciones paretianas:

Sean X ∼ P(α1, h1 ) , Y ∼ P(α 2 , h2 ) .

256
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

• Supongamos h fijo y consideremos que α1 < α 2 , entonces,


X ≥ DEP Y y, por tanto, X ≥ LG Y , Figura 6.12.

αh
Obsérvese que dado que E [ X ] = , α > 1 es decreciente en α se tiene
α −1
que E [ X ] ≥ E [Y ] .

Funciones de distribución
P(3,2) P(9,2)
1,2

0,8

0,6

0,4

0,2

0
0 2 4 6 8 10 12 14

Figura 6.12: h fijo y α1 < α 2 . DEP. DLG

• Supongamos α fijo y consideremos que h2 < h1 , entonces,


X ≥ DEP Y y, por tanto, X ≥ LG Y , Figura 6.13.

αh
Obsérvese que dado que E [ X ] = , α > 1 es creciente en h se tiene que
α −1
E [ X ] ≥ E [Y ] .

257
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

Funciones de distribución
P(3,4) P(3,2)
1,2

0,8

0,6

0,4

0,2

0
0 2 4 6 8 10 12 14

Figura 6.13: α fijo y h2 < h1 . DEP. DLG

• Consideremos ahora el caso general y, consideremos que h2 < h1 ;


es decir que soporte( X ) ⊆ soporte(Y ) y, por tanto, es seguro que

∀s ∈ [ h2 , h1 ] : FX ( s ) ≤ FY ( s ) .

αh
Dado que E [ X ] = , α > 1 es decreciente en α , se tendrá que si
α −1
α1 ≤ α 2 , entonces E [ X ] ≥ E [Y ] . Además, X ≥ DEP Y y, por tanto, en esas
condiciones, se tendrá que X ≥ LG Y . Figura 6.14.

258
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

Funciones de distribución. Si DLG.


P(2,4) P(3,2)
1,2

0,8

0,6

0,4

0,2

0
0 2 4 6 8 10 12 14

Figura 6.14: α1 ≤ α 2 y h2 < h1 . DEP. DLG

Obsérvese que en el caso que h2 < h1 y α1 > α 2 , unas veces hay DLG,
Figura 6.15, y otras veces no la hay, Figura 6.16:

Funciones de distribución. Sí DLG

P(9,4) P(2,2)
1,2

0,8

0,6

0,4

0,2

0
0 2 4 6 8 10 12 14

Figura 6.15: h2 < h1 y α1 > α 2 . Sí DLG.

259
Capítulo 6 La Consolidación de la Medida de la Desigualdad, Gini

Funciones de distribución. No DLG.


P(9,3) P(1.5,2)
1,2

0,8

0,6

0,4

0,2

0
0 2 4 6 8 10 12 14

Figura 6.16: h2 < h1 y α1 > α 2 . No DLG.

260
CAPÍTULO 7

MEDIDAS DE LOCALIZACIÓN CENTRAL


BASADAS EN PONDERACIONES DE GINI

7.1. INTRODUCCIÓN

7.2. EL ÍNDICE DE GINI Y LAS MEDIAS EQUIVALENTES


COMO MEDIAS PONDERADAS

7.3. MEDIDAS DE LOCALIZACIÓN BASADAS EN MEDIAS


EQUIVALENTES

7.4. SIMULACIONES

7.5. EJEMPLOS APLICADOS

7.6. FAMILIA UNIPARAMÉTRICA Gλ-MEDIAS

7.7. SIMULACIONES CON UNA FAMILIA DE MODELOS


GENERADORES
Capítulo 7 Medidas de Localización Central basadas en ponderaciones del Índice de Gini

7.1. INTRODUCCIÓN

En este capítulo, basándose en las conocidas ideas de G-media y media


equivalente, se consideran un conjunto de medidas estadísticas definidas usando
esquemas de ponderación relacionados con el Índice de desigualdad de Gini.
Empleando el concepto de media equivalente, se define una medida de
localización central que, en ciertas distribuciones simétricas con alta curtosis, es
mejor estimador de la media poblacional, mediante una función de pérdida
cuadrática, que el estimador media muestral. También se mostrará que la G-
media de Berrebi y Silber, la cual puede también expresarse a partir de medias
equivalentes, es un mejor estimador de la media poblacional que el estimador
media muestral en ciertas distribuciones simétricas con baja curtosis.

Como hemos indicado en el capítulo 1, en términos generales, la media


aritmética no es un buen estimador del valor central de una distribución en el
caso de distribuciones simétricas con curtosis alta o con baja curtosis. Por lo
tanto, sería de interés encontrar estimadores muestrales con un mejor
comportamiento que la media muestral en estas situaciones. En este capítulo se
desarrollarán algunos de esos estimadores.

Estas medidas pueden organizarse en una familia uniparamétrica de las


mismas, denominada familia G-medias. Se definirá esta familia uniparamétrica
de tal forma que algunos de los estadísticos usuales sean casos particulares de
ella, y donde el valor del parámetro indique en qué grado se
sobrepondera/infrapondera las zonas centrales y extremas de la distribución de
valores observados.

En este capítulo, utilizaremos los términos “robusto” o “anti-robusto” para


referirnos a medias ponderadas que infraponderen o sobreponderen
(respectivamente) los valores extremos de la distribución observada. El motivo

263
Capítulo 7 Medidas de Localización Central basadas en ponderaciones del Índice de Gini

de ello es que, incorporando algunos valores outliers a una distribuciones de


curtosis moderada se obtiene, en general, una distribución con alta curtosis. En
estas distribuciones de alta curtosis, una media ponderada que infrapondere los
valores extremos es, usualmente, un estimador robusto en terminología clásica.

Empleamos el término ad hoc “anti-robusta” para expresar la situación


contraria: medidas de localización central que sobreponderen los valores
extremos.

Como hemos indicado, veremos que, en curtosis elevada, es favorable


para la estimación del parámetro central la infraponderación de los valores
extremos; mientras que, en curtosis pequeña, resulta más adecuado la
sobreponderación de dichos valores extremos. Igualmente, se verá que, en ciertas
familias de distribuciones, para cada valor de curtosis, existe una media óptima
de la familia para estimar el valor central de la distribución.

Consideraremos unos valores { xi }i =1 ordenados de menor a mayor,


N

posiblemente con elementos repetidos y por tanto, considerado cada xi con


frecuencia unitaria. Supondremos siempre que N es par, en caso que fuera impar
se duplicaría cada observación, con lo cual el número total de observaciones sería
2N, par. Como las medidas estadísticas que calcularemos dependen solamente de
las frecuencias relativas, nuestros resultados no se verán alterados por esta
suposición.

Representaremos por x la media y por Me la mediana de la variable


analizada.
En el contexto habitual de los estudios de desigualdad/concentración, los
valores xi son ingresos o rentas o quizás riqueza de cada miembro de una

264
Capítulo 7 Medidas de Localización Central basadas en ponderaciones del Índice de Gini

población humana. El análisis que planteamos es, sin embargo, generalizable a


cualquier variable no negativa.

En el apartado 2, consideramos el Índice geométrico de Gini (Gini, 1914)


como el doble del área de Lorenz y establecemos una expresión de la media
equivalente, xe , como una media ponderada de las observaciones.

A continuación, se introduce el concepto de media equivalente


complementaria.

En el apartado 3, se construyen medidas de localización central usando las


medias equivalentes y las medias equivalentes complementarias, analizando las
propiedades de robustez.

En el apartado 4 presentamos algunas situaciones simuladas para ilustrar


que las medidas que han sido propuestas tienen ventajas con respecto a la media
muestral (y otros estimadores usuales) para estimar la media poblacional.

En el apartado 5, se muestran, con la misma finalidad, algunos ejemplos


aplicados.

En el apartado 6, se define la familia de estadísticos de localización, de


manera que G-media, la Gc-media, la media, la mediana y el punto medio sean
casos particulares de ella.

En el apartado 7, se muestran algunas situaciones simuladas para ilustrar


que las medidas propuestas en este capítulo tienen ventajas sobre la media
muestral ( y otros estimadores usuales), cuando estimamos la media poblacional.

265
Capítulo 7 Medidas de Localización Central basadas en ponderaciones del Índice de Gini

7.2. EL ÍNDICE DE GINI Y LAS MEDIAS EQUIVALENTES COMO


MEDIAS PONDERADAS

En este apartado se mostrará que el Índice de Gini y las medias equivalentes


pueden ser expresadas como medias ponderadas, y que el Índice de Gini también
puede ser escrito a partir de las medias equivalentes. Esta expresión de las
medias equivalentes como medias pesadas será fundamental para definir las
medidas de localización en este capítulo.
Si consideramos el Índice Geométrico de Gini (IGG) como el doble del
área de Lorenz, este puede expresarse (Gini,1914) como

∆/2
∑∑ | xi − x j | (7.1)
i j
IGG = , ∆=
x N2

A partir de la relación ∑∑ | xi − x j | = ∑ ∑ ( xi − x j ) + ∑ ∑ ( x j − xi ) ,
i j i j , j ≤i i j , j >i

se sigue que ∑∑ | xi − x j | = 2∑ xi ( 2i − N − 1) , y usando (7.1), el IGG puede


i j i

reescribirse en la forma:

N N
∑ ( 2i − N − 1) xi ∑ di xi 2i − N − 1 (7.2)
i =1 i =1
IGG = = , di =
xN 2 x N2

Y entonces, como hemos indicado en el capítulo 6, puede probarse fácilmente


que el IGG puede también expresarse como sigue:

266
Capítulo 7 Medidas de Localización Central basadas en ponderaciones del Índice de Gini

N
  1 
∑ wi xi  N − i − 2 
 
, wi = 
xe i =1
IGG = 1 − , donde xe = N (7.3)
x N
∑ wi
i =1

La media equivalente (Atkinson, 1970; Kolm, 1969; Sen, 1973; Sen, 1997) o
ingreso equivalente igualmente distribuido (EDE), xe , es la renta igualitaria que
tendrían que tener todos los individuos para que se produzca el mismo nivel de
bienestar social agregado que con la distribución de rentas original. El valor de
xe expresado en (7.3) es para el caso que la desigualdad se mida por el índice de
Gini.

Es decir, como también indicamos en el capítulo 6, la media equivalente


es la media aritmética ponderada de los valores, cuyas ponderaciones se
corresponden con la proporción ajustada de personas, tramos, que se encuentran
en mejor situación, que tienen mayor ingreso, que el considerado. Así, los pesos

N−1 1
van decreciendo desde 2 , para el individuo más pobre, hasta 2 , para el
N N
individuo más rico. Este esquema de ponderación, junto con otros esquemas
similares que se mostrarán más adelante, serán un factor clave en este capítulo.

Hay muchas representaciones alternativas de los Índices de Desigualdad y


del Índice de Gini en particular. Expresiones de ese tipo pueden verse en Kolm
(1969), Atkinson (1970), Sen (1973, 1997), Blackorby y Donaldson (1978),
Dodalson y Weymark (1980), Kakwani (1980), Weymark (1981), Chakravarty
(1990), Chakravarty y Muliere (2003), entre otros muchos; pero para el propósito
de este capítulo, la expresión (7.3) es la más apropiada.

267
Capítulo 7 Medidas de Localización Central basadas en ponderaciones del Índice de Gini

Definición 1. Media Equivalente Complementaria. La media equivalente


complementaria, xec , se define como:

N
 1
∑ wi xi i − 
, wi = 
i =1 2
xec = N (7.4)
N
∑ wi
i =1

Esto significa que la media equivalente complementaria es la media aritmética


ponderada de los valores, cuyas ponderaciones se corresponden con la
proporción ajustada de personas, o tramos, que se encuentran en peor situación,
con menor nivel de ingresos, que el considerado; es decir, que la observación de
referencia en el sumatorio.
1
Así, los pesos van incrementándose desde 2 , para el individuo más
N

N−1
pobre, hasta 2 , para el individuo más rico.
N

Proposición 1. Existe la siguiente relación entre media, media equivalente y


media equivalente complementaria:

xe + xec
=x (7.5)
2

Esto significa que, la media equivalente, respecto a la media, es complementaria


a la media equivalente complementaria.

Demostración. Observando que media equivalente y media equivalente


complementaria pueden expresarse en la forma:

268
Capítulo 7 Medidas de Localización Central basadas en ponderaciones del Índice de Gini

  1 
N  N − i − 2 
 
xe = ∑ bi xi , bi =  2
(7.6)
i =1 N
2

1
N i−
xec = ∑ bc ,i xi , bc,i = 2 (7.7)
i =1 N2
2

Y observando que bi + bc,i = 2/N, se tiene lo que pretendíamos.

Considerando que la mediana divide el conjunto de valores {xi} en dos


partes iguales:
N N
X1 = { xi / i ≤ }, X2 = { xi / i ≥ + 1}
2 2
y usando las medias equivalente y equivalente complementaria, se pueden
construir las siguientes cuatro medidas.

Definicion 2. Media Equivalente Parcial y Media Equivalente


Complementaria Parcial. Se definen las medias equivalentes de cada una de
las dos partes en que la mediana divide a la distribución como:

N /2
N  1
1
∑ 1wi xi − i − 
2  2
i =1 1
xe = N / 2 , wi =
N
∑ wi1
2
i =1

N (7.8)

N
2
wi xi  1
N − i − 
i= +1
2
; xe = 2
, 2 wi =  2
N N

N
2
wi 2
i= +1
2

269
Capítulo 7 Medidas de Localización Central basadas en ponderaciones del Índice de Gini

Igualmente, definimos las medias equivalentes complementarias en ambas partes


como:

N /2

1
∑ 1wc,i xi i−
1
xec = i =1
, 1wc ,i = 2
N /2 N
∑ 1wc,i 2
i =1

N (7.9)
∑ 2
wc ,i xi  1 N
N
i= +1 i −  −
, wc ,i = 
2 2 2 2
xec = 2
N N

N
2
wc ,i 2
i= +1
2

Donde las ponderaciones representan la proporción de tramos u observaciones


que, en cada una de las dos partes, se encuentran en mejor situación (en peor
situación, en caso que sean las medias equivalentes complementarias) que el
considerado; es decir, que la observación de referencia en el sumatorio.

Así, la media equivalente de la primera y la segunda parte de la


distribución tienen esquemas de ponderación decrecientes, mientras que las
medias equivalentes complementarias de la primera y la segunda parte de la
distribución tienen esquemas de ponderación crecientes.

Combinando estos cuatro esquemas de ponderación de diferentes maneras,


podemos construir los esquemas de ponderación necesarios para el propósito de
este capítulo.

270
Capítulo 7 Medidas de Localización Central basadas en ponderaciones del Índice de Gini

7.3. MEDIDAS DE LOCALIZACIÓN BASADAS EN MEDIAS


EQUIVALENTES

A partir de la siguiente expresión del Índice Geométrico de Gini

N
∑ ci xi − Me 2i − N − 1 N
IGG = i =1
2x
, ci =
N 2
, ∑ ci = 1 (7.10)
i =1
2

Berrebi y Silber (1987) definen la G-media de las observaciones {xi} como:

N 2i − N − 1 N
xG = ∑ ci xi , ci = , ∑ ci = 1 (7.11)
i =1 N2 i =1
2

Esos coeficientes ci pueden expresarse en la forma


wi 2i − N − 1 N N2
ci = N
, wi = ,∑ wj = donde los wi representan el nº de tramos,
2 4
∑ wj j =1

j =1

o individuos, en situación menos extrema que el considerado; es decir, el nº de


tramos que separan la observación considerada de la Mediana.

Veremos ahora otra definición alternativa de G-media, usando la media


equivalente y la media equivalente complementaria.

Definición 3. G- media. La G- media definida por Berrebi y Silber (1987) puede


ser redefinida como la media aritmética entre la media equivalente de la primera
parte y la media equivalente complementaria de la segunda parte en que la
distribución es dividida por la mediana.

271
Capítulo 7 Medidas de Localización Central basadas en ponderaciones del Índice de Gini

1 2
x + xec
xG = e (7.12)
2

Lo que esta definición implica es que el esquema de ponderación de la G-Media


tiene forma de “V”, Figura 7.1, con lo que la máxima ponderación ocurre en los
individuos extremos, aquellos más favorecidos o aquellos más desfavorecidos, y
que las mínimas ponderaciones corresponden a los individuos medianos. En este
esquema de ponderación, el punto de cambio de decreciente a creciente es la
Mediana de la distribución. Es decir, que la G-Media es una medida que
sobrepondera los valores extremos.

Ponderaciones de la G-media

1 2 3 4 5 6 7 8

Ordenación

Figura 7.1: Ponderaciones de G-Media

Ahora, demostraremos la equivalencia entre nuestra definición de G- media


y la dada por Berrebi y Silber (1987).

Proposición 2. La anterior definición 3 de G-media es equivalente a la


definición de Berrebi y Silber (1987).

272
Capítulo 7 Medidas de Localización Central basadas en ponderaciones del Índice de Gini

Demostración. Puede mostrarse que cuando consideramos observaciones


N
xi en la primera parte X1 , X1={xi/i≤ }, se verifica que
2

N
i< , y entonces 2i − N − 1 = N + 1 − 2i = N − (2i − 1) ; y cuando
2
N
consideramos observaciones xi en la segunda parte X2, X2 ={xi/i ≥ + 1}, se
2
verifica que

N
i> , y entonces 2i − N − 1 = 2i − N − 1 = (2i − 1) − N .
2
N /2 N
N
Teniendo en cuenta también que ∑ 1
wi = ∑ 2
wc ,i =
4
, ya se obtiene
i =1 N
i= +1
2

la equivalencia de las dos definiciones.

Puede observarse que la G-media es la media ponderada de los valores


observados usando los pesos ci. Estos pesos tienen la propiedad de ser mayores
en las posiciones más alejadas de la mediana y menores en las posiciones
cercanas a la mediana.

Estos pesos indican que la xG será una media que sobreponderará los
valores extremos y que infraponderará los valores medios. Este comportamiento
es el opuesto a las usualmente consideradas medias ponderadas robustas en las
cuales se infraponderan los valores extremos para evitar un exceso de
sensibilidad con valores outliers.

Berrebi y Silber sugieren que la G-media es una especie de combinación


de media aritmética y mediana, y que estaría entre ellas. En realidad la G -media

273
Capítulo 7 Medidas de Localización Central basadas en ponderaciones del Índice de Gini

es, como media ponderada, no un intermedio entre mediana y media aritmética


sino que estaría fuera del intervalo, por así decirlo, determinado por ellas. Es
decir, tomando la media aritmética como referencia equiponderada, la mediana
estaría en una “dirección” (infraponderar los extremos) y la G -media en otra
“dirección” opuesta (sobreponderar los extremos).

De manera similar podemos construir la G-media Complementaria usando


las otras dos medidas vistas anteriormente en la Definición 2. Esto significa que
tendríamos pesos “complementarios” u opuestos a los de la G-media. Esto
infraponderaría en los dos extremos. En conclusión, podemos establecer la
siguiente definición.

Definición 4 G-media Complementaria. La G-media complementaria, o xGc ,


de las observaciones {xi} se define como:

1 2
x + xe
xGc = ec (7.13)
2

Lo que esta definición implica es que el esquema de ponderación de la G-Media


Complementaria tiene forma de “ Λ ”, Figura 7.2, con lo que la mínima
ponderación corresponde a los individuos extremos, aquellos más favorecidos o
aquellos más desfavorecidos, y que las máximas ponderaciones corresponden a
los individuos medianos. En este esquema de ponderación, el punto de cambio en
el esquema de ponderación de creciente a decreciente es la Mediana de la
distribución. Es decir, que la G-Media Complementaria es una medida que
infrapondera los valores extremos y sobrepondera los valores centrales.

274
Capítulo 7 Medidas de Localización Central basadas en ponderaciones del Índice de Gini

Ponderaciones Gc-media

1 2 3 4 5 6 7 8

Ordenación

Figura 7.2: Ponderación de la GC-Media

El papel de xGc and xG como medidas robustas o “antirobustas” es el


siguiente: en general, una media robusta (es decir, que infrapondere los
extremos) es mejor estimador del valor central de una distribución simétrica que
la media aritmética si la distribución tiene curtosis elevada (hablando en términos
generales) y una media “antirobusta” (que sobrepondera los valores extremos) es
mejor que la media aritmética en distribuciones con escasa curtosis .

Puede verse que la G-media complementaria, o xGc , de las observaciones


{xi} admite la expresión:
N N
xGc = ∑ di xi , ∑ di = 1
i =1 i =1

  1 N
*  i − 2  si i ≤
wi    2 N
N2
Y donde, di = N *
, wi =  ,∑ wj =
*

 N −  i − 1  si i > N j =1 4
∑ wj *
 
 2

2
j =1

Es decir, que los wi* representan el nº de tramos, o individuos, en situación más


extrema que el considerado; es decir, el nº de tramos que separan la observación

275
Capítulo 7 Medidas de Localización Central basadas en ponderaciones del Índice de Gini

considerada del extremo en que se encuentre, en los dos tramos en que la


Mediana divide a la distribución.

Proposición 3. Entre media, G-media y G-media Complementaria existe la


siguiente relación:

xG + xGc
=x (7.14)
2

Es decir, la G-media Complementaria, respecto a la media, es la complementaria


de la G-media.

Demostración. Es suficiente con mostrar que la Gc-media puede


expresarse en la forma:

N N
2
xGc = ∑ di xi , di = − ci , ∑ di = 1 (7.15)
i =1 N i =1

Veremos seguidamente que al igual que la media es el resultado óptimo de un


problema de minimización de una función de pérdida cuadrática, la G-media y la
Gc-media son también resultados óptimos de problemas similares.

Proposición 5. La G-media y la Gc-media minimizan las expresiones


N N
∑ ci ( xi − a ) y ∑ di ( xi − a )
2 2
cuadráticas , respectivamente.
i =1 i =1

Demostración. La demostración es similar a la conocida para la media


aritmética.

276
Capítulo 7 Medidas de Localización Central basadas en ponderaciones del Índice de Gini

7.4. SIMULACIONES

Para ilustrar los puntos vistos en los apartados anteriores, consideraremos


simulaciones para dos tipos de distribuciones teóricas. El primer caso, Tabla 7.1,
es una distribución simétrica platicúrtica, representada por una β ( 3,3) ; el

segundo caso, Tabla 7.2, es una distribución simétrica leptocúrtica, representada


por una t-Student con 4 grados de libertad. En cada caso mostraremos que los
estadísticos considerados en los apartados anteriores tienen un menor Error
Cuadrático Medio (ECM) respecto a la media poblacional en comparación con
los usuales estadísticos muestrales de medidas de localización, tales como la
media muestral, la mediana o el punto medio.
En cada caso, el procedimiento ha consistido en la extracción de 1000
muestras de tamaño 100 en cada una de las distribuciones teóricas. En cada
muestra, se ha calculado el estadístico y el ECM. El procedimiento es repetido
para cada estadístico.

Seguidamente se muestran los ratios comparativos entre los diferentes


ECM y los valores de los ECM para la G-media y la Gc-media para una mejor
apreciación de sus rendimientos comparativos.

Estadístico ECM Incremento (%)


Media Muestral 0.000345 +14.2%
Punto Medio 0.000639 +111.6%
G-media 0.000302 --

Tabla 7.1: β(3,3) media poblacional µ=0.5

Por tanto, el uso de la Media muestral produce un incremento del 14.2 %

en el valor del ECM en comparación con el uso de la G-media.

277
Capítulo 7 Medidas de Localización Central basadas en ponderaciones del Índice de Gini

Estadístico ECM Incremento (%)

Media Muestral 0.021 +45.8%

Punto Medio 0.0174 +20.8%

Gc-media 0.0144 --

Tabla 7.2: t-Student t4 media poblacional µ=0

Es decir, el uso de la Media muestral y la Mediana produce,


respectivamente, un incremento de un 45.8% y un 20.8% en el valor del ECM, en
comparación con el uso de la Gc-media.

7.5. EJEMPLOS APLICADOS

Dos ejemplos empíricos específicos, para dos tipos de distribuciones simétricas,


una leptocúrtica y otra platicúrtica, se muestran a continuación para ilustrar
algunos de los resultados previos.

El primer caso, Figura 7.3, está basado en datos de 80000 empresas. En


ellas, se analiza el Retorno sobre el Capital Empleado. La fuente estudiada es
SABI (2009) Iberian database.

Figura 7.3: Retorno sobre el Capital Empleado

278
Capítulo 7 Medidas de Localización Central basadas en ponderaciones del Índice de Gini

Este conjunto de 80000 datos tiene unos valores de asimetría y curtosis de


-0.24 y 30.19, respectivamente, y esos datos serán considerados la población en
este ejemplo. De esta población, extraeremos 800 muestras de tamaño 100.
Tomaremos como “media poblacional”, la media del conjunto de las 80000
empresas, y esta media será el “objetivo” para las 800 estimaciones de las
muestras de tamaño 100. El ECM de esos 800 valores con relación a la media
poblacional será la “medida” de la bondad como estimador. Este procedimiento
será repetido con algunos estimadores usuales para construir una tabla
comparativa.

La segunda aplicación, Figura 7.4, consiste en las temperaturas (ºF)


durante 330 días en la ciudad de Los Ángeles en 1976.

Figura 7.4: Temperaturas (ºF) durante 330 días en Los Angeles en 1976

Este conjunto de 330 datos tiene unos valores de asimetría y curtosis de


0.008 y -0.593, respectivamente. En este caso, los 330 datos serán remuestreados
hasta obtener un conjunto de 80000 valores (para obtener un conjunto de
muestras como en el caso anterior). Entonces, un procedimiento similar será
usado para obtener los valores de los ECM para un conjunto adecuado de
estimadores.

279
Capítulo 7 Medidas de Localización Central basadas en ponderaciones del Índice de Gini

En las tablas, Tablas 7.3 y 7.4, se observa que los estadísticos propuestos
en este capítulo tienen un menor error cuadrático medio (ECM) con relación a la
media poblacional que los estimadores usuales; es decir, son “mejores”
estimadores de la media poblacional.

Estadístico ECM Incremento (%)

Media Muestral 113.23 190.6%

Mediana 100.2 157.1%

Punto Medio 27259.1 69854.3%

G-media 364.34

Gc-media 38.967
Tabla 7.3: Retorno sobre el Capital Empleado (SABI2009)
En este caso, el ECM de la Gc-media muestra que es el mejor estimador
para la media poblacional que los otros estimadores de la tabla.

Estadístico ECM Incremento (%)

Media Muestral 2.087 10.7%

Mediana 3.821 102.7%

Punto Medio 4.159 120.6%

G-media 1.885

Gc-media 2.615

Tabla 7.4: Temperatura ºF (Los Angeles, 1976)

La G-media tiene un menor ECM que los otros estimadores y entonces,


en este caso, es la mejor estimación de la media poblacional.

280
Capítulo 7 Medidas de Localización Central basadas en ponderaciones del Índice de Gini

Se hubiera podido utilizar, en lugar del ECM, una función de pérdida


cuadrática con esquemas de ponderaciones en “V” o en “ Λ ”, con lo que el
resultado hubiese sido mucho más claro a favor de la G-media y de la Gc-media,
puesto que dicha función de pérdida es más cercana a la función cuadrática que
esos estimadores optimizan. Sin embargo, al haber usado el ECM como medida
de la performance de los diferentes estimadores de la media poblacional, el
resultado obtenido es incluso más interesante ya que el ECM es una función
cuadrática no ponderada de las observaciones, que es más parecida a la función
cuadrática optimizada por la media muestral; y, por tanto, en principio,
favorecería a la media muestral como mejor estimador.

7.6. FAMILIA UNIPARAMÉTRICA Gλ-MEDIAS

Definamos una familia paramétrica de estadisticos de localización de tal forma


que la G-media, la media, la mediana, el punto medio y la Gc-media sean casos
particulares de ella, y tal que el valor del parámetro indique en qué grado se
sobrepondera/infrapondera las zonas centrales y extremas de la distribución de
valores observados.

Definición 2. Sea w={wi: wi= 2i − N − 1 , i=1,..,N} el vector de ponderaciones no

normalizado de la G-media de Berrebi y Silber, y sea λ un valor real. Se define


la familia de las Gλ-medias como la media ponderada cuyo vector de
ponderaciones no normalizado, h, es:

{ { ( )}
h= hi : hi = Max 0, N + λ wi − N ⋅ 1[0,+∞ ) ( λ ) , i = 1,.., N } (7.16)

Nótese que la G en “Gλ-medias” hace referencia a que Gλ se obtiene a partir de


los pesos de la G-media y del Índice de Gini.

281
Capítulo 7 Medidas de Localización Central basadas en ponderaciones del Índice de Gini

El uso de la familia de Gλ-medias está justificado pues generaliza varias


de las medidas de localización central conocidas, como se indica en la siguiente
proposición.

Proposición 1. La Gλ-medias generaliza a varias medidas de localización


central. Se obtienen las siguientes equivalencias:
λ = 0 → media aritmética
λ = 1 → G-media
λ = –1 → Gc-media
λ = ∞ → punto medio ∀λ , λ ≥ N 3

λ = –∞ → mediana ∀λ , λ ≤ − N 3

Demostración.
Si λ = 0, por (7.16), se tiene que hi =max {0, N}=N, que es constante y,
por ello, proporcional a 1/N, el peso de la media aritmética. Por tanto, para λ = 0
se obtiene la media aritmética.

Para λ = 1, se tiene , por (7.16), que hi =max {0,N +wi-N}= wi, que es el
vector de pesos de la G-media. Por tanto, para λ = 1 se obtiene la G-media..

Análogamente, por (7.16), para λ = –1, se concluye que hi =max{0,N -


wi}= N- wi =N- 2i − N − 1 , que es, por (7.15), el vector no normalizado de

ponderaciones de la Gc-media. Luego, la Gc-media es obtenida.

Si λ → +∞ , para que la Gλ sea el punto medio, ha de ocurrir que todas las


ponderaciones sean nulas salvo las dos extremas, h1 y hN. Dado que las
ponderaciones son monótonas de h1 a hN y de h N a hN, y que son simétricas
2 +1
2

282
Capítulo 7 Medidas de Localización Central basadas en ponderaciones del Índice de Gini

N
respecto a + 1 , basta con que h2 sea cero. Por ello, si se nota por w2 la segunda
2
coordenada del vector w, se obtendrá seguidamente el valor límite de λ para que
h2 sea 0.

Por (7.16), N + λ ( w2 − N ) = 0 ; por tanto, puesto que w2 = N − 3 , se tiene

que λ = N ( N − w2 ) = N 3 .

Si λ → −∞ , para que la Gλ sea la mediana, ha de ocurrir que todas las


ponderaciones sean nulas salvo las dos centrales, hN y h N . Por el mismo
2 +1
2

razonamiento que en el caso λ → +∞ , ahora basta con que h N = 0. A


−1
2

continuación se obtendrá el valor límite de λ para que h N sea 0 (el valor menos
−1
2

negativo de λ ).

De (7.16), N + λ wN = 0; luego, como wN = 3, se tiene que


−1 −1
2 2

λ = − N wN =− N 3.
−1
2

Con esto concluye la demostración.

Un gráfico representando los esquemas de ponderación según varios


valores de λ es el siguiente, Figura 7.5:

283
Capítulo 7 Medidas de Localización Central basadas en ponderaciones del Índice de Gini

λ = −2
λ = −1
λ=0
λ=1
λ=2

Figura 7.5: Esquemas de ponderación para varios valores de λ

Proposición 2. Entre la media, la Gλ-media, y su G-λ-media, existe la siguiente


relación:

Gλ + G− λ
= x, ∀λ ∈ [ −1,1] (7.17)
2

Es decir, la G-λ-media, respecto a la media (G0), es complementaria a la Gλ-


media.
Demostración. Es suficiente mostrar que cuando λ ∈ [− 1,1], por (7.16), los

pesos de Gλ y de G − λ son siempre positivos, y su suma es (2 − λ ) N 2


2 , lo que

significa que hay que dividir por ese factor para normalizarlos.

Por tanto, la suma de cada elemento de los vectores de pesos


normalizados de Gλ y G-λ, λ ∈ [− 1,1], es 2/N; luego, la normalización de esos
nuevos pesos dará 1/N, que son los pesos de la media aritmética.

284
Capítulo 7 Medidas de Localización Central basadas en ponderaciones del Índice de Gini

7.7. SIMULACIONES CON UNA FAMILIA DE MODELOS


GENERADORES

7.7.1. Modelos generadores

Con el fin de medir la idoneidad de las Gλ-medias como estimadores en


diferentes escenarios, de mayor a menor curtosis, vamos a construir una familia
uniparametrica de distribuciones continuas de forma que su curtosis dependa
monótonamente del parámetro. Esta familia incluye distribuciones que van desde
leptocúrticas a platicúrtica, siendo la distribución normal un miembro de dicha
familia.

Definición 4. Asumiremos que Z ∼ N(0,1) , y definiremos el modelo generador

sig ( Z ) (1 + Z ) − 1
r

  , r ∈ 0, +∞ .
Hr como la variable aleatoria Y = ( )
r

Las características más notables de los modelos de esta familia son:

• Son variables simétricas, con punto de simetría situado en 0.

• A mayor valor del parámetro “r”, mayor curtosis. Cuando r = 1,


Y=Z y la curtosis es, obviamente normal.

• El espacio muestral de Y es toda la recta real.

Para cada valor del parámetro r (r = 0, 0.2, 0.4,….4), hemos simulado una
muestra de 100.000 elementos, calculando su curtosis, tal como aparece en el
gráfico que se muestra a continuación, Figura 7.6:

285
Capítulo 7 Medidas de Localización Central basadas en ponderaciones del Índice de Gini

Figura 7.6: Curtosis del Modelo Hr

Hemos comprobado que existe una fácil relación analítica aproximada


entre el parámetro r y la curtosis del modelo generador Hr:

Ln(g2 -1) ≅ – 0.160 + 0.901 r, R2=0,9948,

donde g2 es el coeficiente de curtosis de Fisher, y R2 el coeficiente de bondad del


ajuste.

Con lo que obtenemos la siguiente expresión:

g2 ≅ 1+ 0.852 · 2.463r (7.18)

286
Capítulo 7 Medidas de Localización Central basadas en ponderaciones del Índice de Gini

7.7.2. Simulación

Para cada valor de r (r = 0, 0.2, 0.4,….4) se han generado mil muestras de


tamaño 100, y a cada una se le ha calculado el estimador del valor central. En el
modelo generador, el valor central es cero. Para diferentes valores del parámetro
λ (en particular –∞, –1,0,1) se han calculado las correspondientes 1000
estimaciones, las 1000 Gλ-medias, y la desviación típica de esas 1000
estimaciones. Esto nos dará, a su vez, una estimación de la desviación típica del
estimador.

En el siguiente gráfico, Figura 7.7, representamos, para cada valor de λ,


las desviaciones típicas del estimador Gλ-media correspondiente a los diferentes
valores del parámetro r de la familia generadora.

–– media, - - - mediana, …… G-media, -.-.- Gc-media

Figura 7.7: Desviaciones típicas de las Gλ-medias

287
Capítulo 7 Medidas de Localización Central basadas en ponderaciones del Índice de Gini

Se observa como para valores pequeños del parámetro r, curtosis pequeña,


los estimadores G-media y media, mejoran a los estimadores Gc-media y
mediana, pues las desviaciones al parámetro son menores en los primeros casos
que en los segundos. Para valores grandes del parámetro r la ordenación de la
bondad de los estimadores queda invertida.

Esto pone de manifiesto que en curtosis elevada es favorable, para la


estimación del parámetro central, la infraponderación de los valores extremos,
mientras que en curtosis pequeña resulta más adecuado la sobreponderación de
dichos valores extremos.

La idea que se obtiene del gráfico precedente es que, para cada valor de r,
y por tanto para cada valor de curtosis, exista una Gλ-media óptima de la familia.
Para constatar este hecho, hemos calculado, para una serie de valores de r, qué
Gλ-media tiene menor desviación típica respecto al parámetro, usando en cada
caso mil muestras de tamaño 100.

Para hallar la λ óptima, calculamos las desviaciones típicas para los


valores λ = –20, –19.75, –19.5,…,3.75, 4. El óptimo lo hemos calculado
mediante una aproximación parabólica según el mejor valor observado, el
anterior y el posterior.

En el gráfico siguiente, Figura 7.8, representamos el λ óptimo calculado


para cada valor del parámetro “r”.

288
Capítulo 7 Medidas de Localización Central basadas en ponderaciones del Índice de Gini

Figura 7.8: Óptimo valor de λ vs. r

En el siguiente gráfico, Figura 7.9, aparecen esos valores óptimos en


función de la curtosis implicada por cada valor “r” según la expresión analítica
aproximada (7.18) expuesta anteriormente.

Figura 7.9: Óptimo valor de λ vs. curtosis

289
CAPÍTULO 8

CONCLUSIONES

8.1. INTRODUCCIÓN

8.2. CONCLUSIONES DE LA PARTE I

8.3. CONCLUSIONES DE LA PARTE II


Capítulo 8 Conclusiones

8.1. INTRODUCCIÓN

La desigualdad, los criterios de dominancia estocástica y la búsqueda de


estimadores de una distribución son temas de interés en Estadística en general, y
en la Economía, la Empresa y las Finanzas en particular.

Partiendo de los resultados de dos de los más importantes autores en el


estudio de la desigualdad, Pareto y Gini, hemos profundizado en sus ideas y
obtenido resultados novedosos de interés tanto teórico como práctico. Incluso
hemos obtenidos algunos indicadores que, de alguna forma, podrían orientar en
la toma de decisiones sobre políticas de crecimiento empresarial.

8.2. CONCLUSIONES DE LA PARTE I

Hemos comprobado que Pareto utiliza de diferentes maneras el término “menor


desigualdad”, no siendo equivalentes entre ellas aunque Pareto no hace diferencia
entre las mismas.

La tercera de esas acepciones es la que nos ha permitido establecer el


concepto de desfavorecimiento de un individuo con un cierto nivel de ingreso y
la tasa de cambio de desfavorecimiento de ese individuo.

Hemos probado que los criterios actuales de dominancia estocástica de


primer grado se corresponden con el propio criterio de Pareto (una de las
acepciones que Pareto da de “menor desigualdad”). Igualmente, hemos mostrado
que la dominancia Lorenz y la dominancia estocástica de segundo grado son
equivalentes, respectivamente, al criterio de Lassalle y al de Beaulieu expuestos
en los escritos de Pareto (incorporándoles la función de utilidad identidad).

293
Capítulo 8 Conclusiones

Hemos encontrado que una distribución que mejora sustancialmente a la


paretiana, en el caso del tamaño de las empresas, es la que se consigue mediante
una relación cuadrática, a la que en este trabajo hemos denominado distribución
Pareto-cuadrática. Igualmente, se ha estudiado la distribución que denominamos
Pareto-cuadrática truncada, que es la que realmente se ha presentado en los casos
prácticos investigados.

Hemos analizado algunas propiedades de interés de estas distribuciones


Pareto-cuadrática y Pareto-cuadrática truncada, en especial la posibilidad de
estudiar el nivel de desfavorecimiento en un colectivo de manera local, en lugar
de globalmente como se hace con la distribución Pareto.

Igualmente, para el caso de la distribución de los tamaños de las empresas,


ha sido definido el concepto de “pequeñez” de una empresa y se ha calculado la
tasa de cambio del nivel de pequeñez de la empresa.

Por último, en esta parte I, se ha deducido la diferencia de dificultad de


crecimiento de las empresas, según el tamaño, en varios países de nuestro
entorno; lo que puede, de alguna forma, ayudar a tomar decisiones políticas
favorecedoras o desincentivadora del crecimiento, en ciertos tramos, de las
empresas.

8.3. CONCLUSIONES DE LA PARTE II

En sus trabajos sobre medición de la concentración distribucional de diversas


magnitudes (rentas, riqueza, número de hijos,...), Gini fue elaborando a lo largo
de los años una serie de coeficientes para determinar numéricamente tal cantidad.
En estos sucesivos coeficientes podemos ver antecesores y "parientes" de los
índices hoy corrientemente usados.

294
Capítulo 8 Conclusiones

Nos hemos centrado en esta segunda parte del trabajo en los índices δ y R
de Gini. El índice δ está especialmente relacionado con los trabajos de su
antecesor Pareto e indirectamente relacionado con lo que conocemos como
Curva de Lorenz.

Gini se refiere al economista y matemático italo-francés en varias


ocasiones para comparar sus descubrimientos y progresos en el campo. Así
asevera, en su momento, que su coeficiente δ es superior al coeficiente α de
Pareto y lo utiliza para refutar la "ley de Pareto" de igualdad de concentración
entre los Estados.

De alguna forma, también polemiza con las ideas de su antecesor en lo


referente a la idea misma de "concentración" razonando sobre el significado de α
y δ, tal como hemos observado. Sin embargo, hemos podido señalar que el
coeficiente δ no poseía todas las virtudes que Corrado Gini creía ver en él.

Cabe señalar que Gini, consciente de algunas limitaciones de su


coeficiente δ, propuso simultáneamente otras variantes para diferentes
aplicaciones. Todo ello formó parte del proceso que llevó a Gini y a otros a
construir las medidas de concentración actualmente en uso, y que siguen en
proceso de evolución.

Por otro lado, en este trabajo, haciendo uso de los conceptos de media
equivalente y media equivalente complementaria, hemos definido los conceptos
de media equivalente parcial y media equivalente complementaria parcial. A
partir de ellas, hemos obtenido dos medidas de localización central: la G-media y
la G-media complementaria, o Gc-media. En ciertas situaciones, esas medias
pueden ser mejores estimadores del valor central de la distribución que la media
muestral. Concretamente, en distribuciones leptocúrticas, el uso de la Gc-media,

295
Capítulo 8 Conclusiones

y en distribuciones platicúrticas, el uso de la G-media, en lugar de la Media


Muestral, pueden hacer disminuir el valor del ECM. Asimismo, estas medidas de
localización central verifican propiedades cuadráticas de optimización similares a
las verificadas por la media aritmética.

Se ha definido una familia uniparamétrica de estadísticos de localización


de tal forma que la G-media de Berrebi y Silber, su media complementaria, la
Gc-media, la media, la mediana y el punto medio son casos particulares de ella, y
donde el valor del parámetro indica en qué grado se sobrepondera/infrapondera
las zonas centrales y extremas de la distribución de valores observados.

Una media ponderada es un estimador adecuado de la media de la


distribución si se escoge el esquema de ponderación adecuado (la relación de
ponderación entre los valores centrales y los valores extremos) según la curtosis
del modelo poblacional de los datos.

En concreto, para cierta familia de distribuciones continuas simétricas


generadas en función de un parámetro que indica el nivel de curtosis, hemos
comprobado por simulación que, dentro de la familia de las Gλ-medias, hay unas
ciertas ponderaciones que resultan óptimas para una curtosis dada. La
infraponderación de valores extremos es más deseable a medida que la
leptocurtosis aumenta y, recíprocamente, en caso de platicurtosis, el óptimo se
obtiene al sobreponderar los extremos.

En el presente estudio se ha trabajado con simulaciones de muestras de


tamaño 100, por considerar que representan bien a muestras de tamaño
intermedio.

De manera similar al procedimiento seguido en este trabajo, con un


mayor desarrollo del uso de este tipo de esquema de ponderación, podríamos

296
Capítulo 8 Conclusiones

construir estadísticos para la estimación de otros parámetros poblacionales, tales


como, por ejemplo, medidas de localización no central.

297
BIBLIOGRAFÍA
Bibliografía

BIBLIOGRAFÍA

Arrow, K.J. (1963). Social Choice and Individual Values, Wiley, NewYork.
Atkinson, A.B. (1970). On the Measurement of Inequality, Journal of Economic
Theory, 2, 244-263
Bandrés, E. (1993). Economía y Redistribución, Centro de Publicaciones.
Ministerio de Trabajo y Seguridad Social, Madrid.
Barbut M. (2003). Ideología, Matemáticas y Ciencias Sociales : V. Pareto, G.
Sorel y la ambigüedad en la comparación de las desigualdades, Empiria
6, p. 11-29.
Bartels, C..A., van Metelen, H. (1975). Alternative Probability Density
Functions of Income, Vrije University Amsterdam, Documentos de
trabajo 29.
Basulto J., Busto J.J. ( 2010). Gini’s Concentration Ratio (1908–1914) ,
Journ@l électronique d’Histoire des Probabilités et de la Statistique, vol.
6, n° 1, Juin
Basulto J., Arribas J.J. ( 2012). Les Recherches de Marc Barbut sur la Mesure
des Inégalités, Math. Sci. hum / Mathematics and Social Sciences (50e
année, n° 200, 2012(4), p. 49-66)
Basulto J., Busto J.J., Sánchez R. (2011). El concepto de desigualdad en Vifredo
Pareto (1848.1923), Capítulo 4, en Historia de la Probabilidad y la
Estadística (V), J. M. Riobóo eI. Riobóo (editores).
Basulto J., Romero J.E. (2003). Acerca de “Sulla misura della concentrazione e
della variabilitá” de Corrado Gini. XVII Reunión ASEPELT. Almeria.
Bawa, V.S. (1982). Stochastic Dominance: A Research Bibliography.
Management Science, 28, 698-712.
Bentham, J. (1952,1954). Filosofía de la ciencia económica en Bentham J.
Escritos Económicos. Fondo de Cultura Económica, pp. 167-191.
Bentham, J. (1952,1954). La psicología del hombre económico en Bentham J.
Escritos Económicos. Fondo de Cultura Económica, pp. 1-27

301
Bibliografía

Bergson , A. (1954). On the concept of social welfare, Quartely Journal of


Economics, 68, pp. 233-252.
Bernouilli, D. (1738). Exposition of a new theory on the measurement of risk,
Econometrica, 22, 1954, pp. 23-36.
Berrebi, Z. M., Silber, J. (1987). Dispersion, asymmetry and the Gini index of
inequality, International Economic Review, 28 (2), 331-338.
Bishop, J.A., Formby, J.P. (1994). A Dominance Evaluation of Distributions of
Income and the Benefits of Economic Growth, en The Changing
Distribution of Income in a Open U.S. Economy, J.H. Bergstrand et. al.
Eds., Chapter 3.
Bishop, J.A., Formby, J.P., Thistle, P.D. (1991). Rank dominance and
international comparisons of income distributions, European Economic
Review, 35, pp. 1399-1409.
Blackorby, C., Donaldson, D. (1978). Measures of Relative Equality and Their
Meaning in Terms of Social Welfare, Journal of Economic Theory 18, 59-
80.
Chakravarty, S.R. (1990). Ethical Social Index Numbers, Springer Verlag, New
York.
Chakravarty, S.R., Muliere, P. (2003). Welfare indicators: A review and new
perspectives .1. Measurement of inequality, Metron, LXI (3), 457-497.
Champernowne D.G. (1953), A Model of Income Distribution, Economic Journal
63, June, pp. 318-351.
Champernowne, D.G. (1952). The Graduation of Income Distributions,
Econometrica, vol 20, 4
Dagum, C. (1977). A New Model Personal Income Distribution: Specification
and Estimation, Economie Appliquée, 30 (3). 413-437
Dalton, H. (1920). The measurement of inequality of incomes, Economic Journal
30, 348-361.
Dasgupta P., Sen A. y Starrett D. (1973). Notes on the measurement of
inequality, J. Econ. Theory 6, 180-187.

302
Bibliografía

Donaldson, D., Weymark, J.A. (1980). A Single Parameter Generalization of the


Gini Indices of Inequality, Journal of Economic Theory 22, 67-86.
Fisk, P.R. (1961). The Graduation of Income Distribution. Econometrica, vol
29,2.
Fréchet M. (1939). Sur les formules de répartition des revenus, Revue de
l’Institut international de statistique 3, p. 321-338.
Gastwirth, J.L. (1971). A general definition of the Lorenz curve. Econometrica,
39, 1037–1039.
Gibrat(1931). Les Inegalites economiques. Sirely. Paris.
Gini, C, (1935). Curso de Estadística. Con un apéndice Matemático por Luigi
Galvani. Editorial Labor.
Gini, C. (1910). Indici di Concentrazione e di dipendenza, Biblioteca
dell’Economista. Turín:Utet.
Gini, C. (1912). Variabilità e Mutabilità, Studi Economico-Giuridici dell’Univ.
Di Cagliari, 3, part 2, pp.1-158.
Gini, C. (1914), Sulla misura della concentrazione e della variabilità dei
caractteri, Atti del R. Istituto Veneto di Scienze, Lettere ed Arti, Tomo
LXXIII, pp. 1203-1248.
Gini, C. (1926). The Contributions of Italy to Modern Statistical Methods,
Journal of the Royal Statistical Society, Vol. 89, No. 4., pp. 703-724.
Gini, C. (1965), On the Characteristics of Italian Statistics, J.R. Statist. Soc.
Serie A, Volume 128, 89-109.
Gini, C. (2005). On the measurement of concentration and variability of
characters, METRON - International Journal of Statistics.
H. Guitton (eds.), Public Economics. London. Macmillan.
Hadar, J., Russell, W.R. (1969). Rules for ordering uncertain prospects.
American Economic Review 59: 25-34.
Hanoch, G., Levy, H. (1969). The efficiency analysis of choice-involving risk.
Reiew of Economic Studies 36: 335-346.

303
Bibliografía

Hardy, G.H.; Littlewood, J.E., Polya, G. (1952). Inequalities. 2ª ed. Cambridge


University Press.
Hobbes, T. (1651). Leviatán, Madrid, Editora Nacional, 2ª edic., 1983.
Kakwani, N. C. (1980). On a class of poverty measures, Econometrica 48, 437-
446.
Kleiber, C. (2013). On moment indeterminancy of the Benini income distribution,
Statistical Papers, 54, 1121-1130.
Kleiber, C., Kotz, S. (1963). Statistical Size Distributions in Economics and
Actuarial Sciences, Wiley, Hoboken.
Kolm, S. Ch. (1969). The optimal production of social justice. En J. Margolis and
Kuznets, S. (1953). Share of upper income groups in income and savings.
National Bureau of Economic Research. New York.
Lambert, P.J. (1989, 2001). The Distribution and Redistribution of Income.
Blackwell.
Lorenz, M. O. (1905). Methods of measuring the concentration of wealth,
Journal of the American Statistical Association, 9, 209-219.
Mandelbrot, B. (1960). The Pareto-Levy Law and the Distribution of Income,
International Economic Review, 1, 2
Marshall, A.W. Y Olkin, I. (1979). Inequalities: Theory of Majorization and its
Applications. Academic Press. New York.
Montero, J.M. (2001). E-Index for measuring concentration. 52nd International
Atlantic Economic Conference. Athens.
Muirhead, R.F. (1903). Some methods applicable to identities and inequalities of
symmetric algebraic functions of n letters. Proceedings of Edinburgh
Mathematical Society, 21, 144-157.
Muliere, P., Scarsini, M. (1989). A note on stochastic dominance and inequality
measures. Journal of Economic Theory, 49, 314-323.
Newman (2006). Power laws, Pareto distributions and Zipf’s law, Contemporary
Physics 46, 323 (2005).

304
Bibliografía

Newman, J., Forrest, S., Balthrop, J. (2002) Email networks and the spread of
computer viruses. Phys. Rev. E 66, 035101.
Nygard, F., Sandstrom, A. (1981). Measuring Income Inequality. Amqvist &
Wiksell International. Stockholm.
Pareto, V. (1896a). La courbe de la répartition de la richesse. Université de
Lausanne. Faculté de Droit à l’occasion de l’Exposition nacional suisse,
Genève, Lausanne, CH. Viret-Geton Impr., p.373-387.
Pareto, V. (1896b). La courbe des revenus. Le monde économique, 25 juillet,
p.127-137.
Pareto, V. (1897). Cours d’économie politique. Tomo II, Rouge, Lausanne.
Pareto, V. (1909). Manuel d’Economie politique. Traducción del libro Manuel di
economia politica con una introduzione alla sienza social (1906). Società
Editrice Libraria.
Paul D. Thistle (1989). Ranking distribution with generalizad Lorenz curves,
Southern Economic Journal, 56, 1-12
Pigou, A.C. (1920). La economía del bienestar. Madrid. Agular, 1946.
Quirk, J.P., Saposnik, R. (1962). Admissibility and measurable utility functions,
Reiew of Economic Studies 29: 140-146.
Rawls, J. (1971). Teoría de la justicia, México, Fondo de Cultura Económica,
1979.
Reed, W. (2004). On Pareto´s Law and the determinants of Pareto exponents. J.
Income Distribution 13:7-17
Reed, W. J. (2003). The Pareto law of incomes - an explanation and an
extension, Physica A 319:469-486.
Romero, J.E., Gamero, J. (2009). Consideraciones sobre la medida de la
concentración por Gini, Capítulo 33, en Historia de la Probabilidad y la
Estadística (IV), J. Basulto Santos y J.J. García del Hoyo (editores).
Rothschild, M., Stiglitz, J. (1970). Increasing risk I: A definition, J. Econ. Theory
2, 225-243.

305
Bibliografía

Rothschild, M., Stiglitz, J.E. (1973). Some Further Results on the Measurement
of Inequality, Journal of Economic Theory 6, pp. 188-204.
Salem, A.B., Mount, T.M. (1974). A Convenient Descriptive Modelo f Income
Distribution: The Gamma Density. Econometrica, 42, pp. 1115-1127.
Saposnik, R. (1981). Rank-Dominance in income distributions, Public Choice,
36(1), pp. 147-151.
Saposnik, R. (1983). On evaluating income distributions: Rank-Dominance, the
Suppes-Sen grading principles of justice, and Pareto optimality, Public
Choice, 40, pp. 329-336.
Sen, A. K. (1973). On Economic Inequality, Clarendon Press, Oxford.
Sen, A. K. (1997). On Economic Inequality (Expanded Edition), Oxford
University, Oxford.
Shorrocks, A. F. (1983). The impact of income components on the distribution of
family incomes. Quartely Journal of Economics, 98, 311-326.
Shorrocks, A. F., Foster, J. E. (1988). Transfer sensitive inequality measures.
Review of Economics Studies, 54, 485-497.
Sorel G. (1897). La loi des revenus, Le devenir social, 3e année, nº 7, p. 578-
607.
Weymark, J.A. (1981). Generalised Gini Inequality Indices, Mathematical Social
Sciences, 1, 409-430.
Yitzhaki, S. (1982). Association Stochastic Dominance, Mean Variance, and
Gini's Mean Difference, The American Economic Review, Vol. 72, No. 1
(Mar., 1982), pp. 178-185

306
ANEXOS
Anexos

ANEXO 1

[Li-1 Li] Fi Si LnLi LnSi


9 0 149217 2,19722458 11,9131569
10 13 43710 105507 2,56494936 11,5665326
14 19 78227 70990 2,94443898 11,1702943
20 27 101799 47418 3,29583687 10,7667572
28 39 118921 30296 3,66356165 10,318771
40 55 130376 18841 4,00733319 9,84379063
56 79 136694 12523 4,36944785 9,43532223
80 111 140990 8227 4,7095302 9,01517671
112 159 143809 5408 5,0689042 8,59563462
160 223 145700 3517 5,40717177 8,16536363
224 319 147019 2198 5,7651911 7,69530313
320 447 147815 1402 6,10255859 7,24565507
448 639 148327 890 6,45990445 6,79122146
640 895 148674 543 6,79682372 6,29710932
896 1279 148891 326 7,1538338 5,78689738
1280 1891 149036 181 7,54486107 5,19849703
1892 2559 149091 126 7,84737184 4,83628191
2560 3783 149154 63 8,23827262 4,14313473
3784 5119 149180 37 8,54071439 3,61091791
5120 7567 149199 18 8,93155197 2,89037176
7568 10239 149205 12 9,23395924 2,48490665
10240 15135 149211 6 9,62476522 1,79175947
15136 20479 149214 3 9,92715525 1,09861229
20480 30271 149216 1 10,3179454 0

30272 40959 149217 0 10,6203268

Tabla 4.1: Distribución del nº de trabajadores, España 2006

309
Anexos

ANEXO 2

[Li-1 Li] Fi Si LnLi LnSi


9 0 123832 2.19722458 11.7266811
10 13 37483 86349 2.56494936 11.3661525
14 19 65800 58032 2.94443898 10.9687499
20 27 85294 38538 3.29583687 10.5594
28 39 98904 24928 3.66356165 10.1237469
40 55 107483 16349 4.00733319 9.70192201
56 79 112782 11050 4.36944785 9.31018571
80 111 116366 7466 4.7095302 8.91811466
112 159 118851 4981 5.0689042 8.51338595
160 223 120495 3337 5.40717177 8.11282748
224 319 121695 2137 5.7651911 7.66715826
320 447 122450 1382 6.10255859 7.231287
448 639 122969 863 6.45990445 6.76041469
640 895 123270 562 6.79682372 6.33150185
896 1279 123480 352 7.1538338 5.86363118
1280 1891 123639 193 7.54486107 5.26269019
1892 2559 123705 127 7.84737184 4.84418709
2560 3783 123768 64 8.23827262 4.15888308
3784 5119 123798 34 8.54071439 3.52636052
5120 7567 123812 20 8.93155197 2.99573227
7568 10239 123819 13 9.23395924 2.56494936
10240 15135 123824 8 9.62476522 2.07944154
15136 20479 123828 4 9.92715525 1.38629436
20480 30271 123829 3 10.3179454 1.09861229

30272 40959 123832 0 10.6203268

Tabla 4.3: Distribución del nº de trabajadores, España 2010

310
Anexos

ANEXO 3

[Li-1 Li] Fi Si LnLi LnSi


9 0 100070 2.19722458 11.5136252
10 13 30136 69934 2.56494936 11.1553072
14 19 53272 46798 2.94443898 10.7535957
20 27 68570 31500 3.29583687 10.3577428
28 39 79354 20716 3.66356165 9.93866163
40 55 86215 13855 4.00733319 9.53640146
56 79 90529 9541 4.36944785 9.16335358
80 111 93540 6530 4.7095302 8.78416222
112 159 95669 4401 5.0689042 8.38958707
160 223 97116 2954 5.40717177 7.99091546
224 319 98142 1928 5.7651911 7.56423848
320 447 98794 1276 6.10255859 7.15148546
448 639 99254 816 6.45990445 6.70441435
640 895 99541 529 6.79682372 6.27098843
896 1279 99748 322 7.1538338 5.77455155
1280 1891 99881 189 7.54486107 5.24174702
1892 2559 99947 123 7.84737184 4.81218436
2560 3783 100009 61 8.23827262 4.11087386
3784 5119 100037 33 8.54071439 3.49650756
5120 7567 100055 15 8.93155197 2.7080502
7568 10239 100061 9 9.23395924 2.19722458
10240 15135 100064 6 9.62476522 1.79175947
15136 20479 100065 5 9.92715525 1.60943791
20480 30271 100068 2 10.3179454 0.69314718
30272 40959 100069 1 10.6203268 0

40960 60543 100070 0 11.0111091


Tabla 4.5: Distribución del nº de trabajadores, España 2012

311
Anexos

ANEXO 4

[Li-1 Li] Si empíricas errorlineal errorcuad. error_LogN


9 1 0 0 0.04662347
10 13 0.70707091 0.11231181 0.003203652 0.11814707
14 19 0.47575008 0.12784358 -0.006016243 0.11009948
20 27 0.31777881 0.10602909 -0.016254483 0.06343995
28 39 0.20303317 0.0770931 -0.021136835 0.02328209
40 55 0.12626577 0.04878317 -0.025922378 -0.01405578
56 79 0.08392475 0.03747451 -0.015767138 -0.02571624
80 111 0.05513447 0.02640734 -0.010934583 -0.02623735
112 159 0.03624252 0.018954 -0.005903893 -0.02047619
160 223 0.0235697 0.01285017 -0.003653728 -0.01397747
224 319 0.01473023 0.00826665 -0.002160717 -0.00922693
320 447 0.00939571 0.00538295 -0.001228845 -0.00593538
448 639 0.00596447 0.00354258 -0.000442957 -0.0036343
640 895 0.003639 0.00213447 -0.000283992 -0.00218417
896 1279 0.00218474 0.00127626 -0.00011404 -0.00121295
1280 1891 0.001213 0.00069017 -4.52459E-05 -0.0008444
1892 2559 0.00084441 0.00050344 6.47479E-05 -0.0004222
2560 3783 0.0004222 0.00022594 8.80826E-06 -0.00024796
3784 5119 0.00024796 0.00011995 -1.96227E-06 -0.00012063
5120 7567 0.00012063 4.6942E-05 -7.72908E-06 -8.042E-05
7568 10239 8.042E-05 3.2356E-05 4.71078E-06 -4.021E-05
10240 15135 4.021E-05 1.2541E-05 2.54766E-06 -2.0105E-05
15136 20479 2.0105E-05 2.0568E-06 -1.56705E-06 -6.7016E-06
20480 30271 6.7016E-06 -3.6884E-06 -3.74044E-06 0

Tabla 4.8: Errores de estimación España 2006

312
Anexos

ANEXO 5

[Li-1 Li] Si empíricas errorlineal errorcuad. error_LogN


9 1 0 0 0.05019799
10 13 0.69730764 0.08508119 0.00602039 0.1232238
14 19 0.46863492 0.09965161 0.00195948 0.11983429
20 27 0.31121196 0.08033539 -0.00965023 0.07247621
28 39 0.20130499 0.05995625 -0.0131022 0.0258808
40 55 0.13202565 0.04267774 -0.01355485 -0.01252568
56 79 0.0892338 0.03412164 -0.00655905 -0.02644953
80 111 0.06029136 0.02528253 -0.00372141 -0.02799861
112 159 0.04022385 0.01855036 -0.00114603 -0.02290473
160 223 0.0269478 0.0131468 -0.00021232 -0.01618884
224 319 0.01725725 0.00869778 4.0108E-05 -0.01089857
320 447 0.01116028 0.00570333 6.519E-05 -0.00691903
448 639 0.00696912 0.00358164 7.5111E-05 -0.00452939
640 895 0.00453841 0.00237748 0.00017969 -0.00284132
896 1279 0.00284256 0.00150054 0.00018885 -0.00155845
1280 1891 0.00155856 0.00076209 3.6334E-05 -0.00102557
1892 2559 0.00102558 0.00049363 4.4019E-05 -0.00051683
2560 3783 0.00051683 0.00020107 -3.364E-05 -0.00027457
3784 5119 0.00027457 6.3656E-05 -7.4225E-05 -0.00016151
5120 7567 0.00016151 3.6306E-05 -2.9712E-05 -0.00010498
7568 10239 0.00010498 2.1348E-05 -1.4072E-05 -6.4604E-05
10240 15135 6.4604E-05 1.4954E-05 7.9947E-07 -3.2302E-05
15136 20479 3.2302E-05 -8.6363E-07 -6.7301E-06 -2.4226E-05
20480 30271 2.4226E-05 4.537E-06 3.7781E-06 0

Tabla 4.10: Errores de estimación España 2010

313
Anexos

ANEXO 6

[Li-1 Li] Si empíricas errorlineal errorcuad. error_LogN


9 1 0 0 0.04813892
10 13 0.6988508 0.0855842 -0.01565917 0.12807015
14 19 0.46765264 0.09739437 -0.02973588 0.12444857
20 27 0.31477965 0.08272921 -0.03597633 0.07758426
28 39 0.20701509 0.0647063 -0.03290403 0.03002211
40 55 0.13845308 0.04835546 -0.02755626 -0.01052354
56 79 0.09534326 0.03967568 -0.01574595 -0.02624106
80 111 0.06525432 0.02983711 -0.00994702 -0.02912104
112 159 0.04397921 0.0220165 -0.00514235 -0.02431136
160 223 0.02951934 0.01551231 -0.00296297 -0.01778973
224 319 0.01926651 0.0105649 -0.00141998 -0.01236118
320 447 0.01275107 0.00719485 -0.00060039 -0.00807277
448 639 0.00815429 0.00469949 -0.00013062 -0.0052702
640 895 0.0052863 0.003079 6.946E-05 -0.00321528
896 1279 0.00321775 0.00184466 6.4642E-05 -0.00188842
1280 1891 0.00188868 0.0010723 0.00010065 -0.0012291
1892 2559 0.00122914 0.00068313 8.926E-05 -0.00060957
2560 3783 0.00060957 0.00028489 -1.8282E-05 -0.00032977
3784 5119 0.00032977 0.00011259 -6.157E-05 -0.0001499
5120 7567 0.0001499 2.0739E-05 -5.9461E-05 -8.9937E-05
7568 10239 8.9937E-05 3.5429E-06 -3.7639E-05 -5.9958E-05
10240 15135 5.9958E-05 8.5768E-06 -6.3272E-06 -4.9965E-05
15136 20479 4.9965E-05 1.5595E-05 1.0476E-05 -1.9986E-05
20480 30271 1.9986E-05 -4.5549E-07 5.936E-08 -9.993E-06
30272 40959 9.993E-06 -3.681E-06 -1.6127E-06 0

Tabla 4.12: Errores de estimación España 2012

314
Anexos

ANEXO 7

[Li-1 Li] Si Si relativo LnLi LnSi_relat


9 88768 1 2.19722458 0
10 13 59412 0.66929524 2.63905733 -0.40153
14 19 40613 0.45751848 2.99573227 -0.78193801
20 27 29001 0.32670557 3.33220451 -1.11869591
28 39 18996 0.21399603 3.68887945 -1.54179779
40 55 12991 0.14634778 4.02535169 -1.92176941
56 79 9055 0.10200748 4.38202663 -2.28270913
80 111 6304 0.07101658 4.71849887 -2.64484187
112 159 4358 0.04909427 5.07517382 -3.01401299
160 223 3073 0.03461833 5.41164605 -3.36337194
224 319 2070 0.02331921 5.768321 -3.75847762
320 447 1457 0.01641357 6.10479323 -4.1096467
448 639 994 0.01119773 6.46146818 -4.4920443
640 895 714 0.00804344 6.79794041 -4.82289854
896 1279 491 0.00553127 7.15461536 -5.19733738
1280 1891 334 0.00376262 7.54538975 -5.58264051
1892 2559 252 0.00283886 7.84776254 -5.86435242
2560 3783 159 0.00179119 8.23853693 -6.3248773
3784 5119 113 0.00127298 8.54090972 -6.66639368
5120 7567 70 0.00078857 8.93168411 -7.14528626
7568 10239 55 0.00061959 9.2340569 -7.38644832
10240 15135 35 0.00039429 9.62483129 -7.83843344
15136 20479 21 0.00023657 9.92720408 -8.34925907
20480 30271 11 0.00012392 10.3179785 -8.99588623
30272 40959 4 4.5061E-05 10.6203513 -10.0074871
40961 60544 1 1.1265E-05 11.0111257 -11.3937815
60545 81920 0 0 11.3134984
Tabla 4.16: Distribución del nº de trabajadores, España 2014

315
Anexos

ANEXO 8

[Li-1 Li] Si Si relativo LnLi LnSi_relat


9 208333 1 2.19722458 0
10 13 153353 0.73609558 2.63905733 -0.30639531
14 19 112391 0.53947766 2.99573227 -0.6171539
20 27 92811 0.44549351 3.33220451 -0.80857259
28 39 67956 0.32618932 3.68887945 -1.12027732
40 55 53034 0.25456361 4.02535169 -1.36820454
56 79 38940 0.1869123 4.38202663 -1.67711576
80 111 29581 0.14198903 4.71849887 -1.9520055
112 159 21284 0.10216336 5.07517382 -2.28118214
160 223 15900 0.07632012 5.41164605 -2.57281865
224 319 11303 0.05425449 5.768321 -2.91406958
320 447 8391 0.04027686 6.10479323 -3.21197806
448 639 5695 0.02733604 6.46146818 -3.59954916
640 895 4106 0.01970883 6.79794041 -3.92668844
896 1279 2822 0.01354562 7.15461536 -4.30169191
1280 1891 1852 0.00888961 7.54538975 -4.72287162
1892 2559 1281 0.00614881 7.84776254 -5.09149674
2560 3783 856 0.00410881 8.23853693 -5.49462266
3784 5119 613 0.0029424 8.54090972 -5.8285281
5120 7567 374 0.0017952 8.93168411 -6.32263724
7568 10239 251 0.0012048 9.2340569 -6.7214401
10240 15135 150 0.00072 9.62483129 -7.23625775
15136 20479 93 0.0004464 9.92720408 -7.71429355
20480 30271 43 0.0002064 10.3179785 -8.48569292
30272 40959 26 0.0001248 10.6203513 -8.9887965
40961 60544 11 5.28E-05 11.0111257 -9.84899777
60545 81920 1 4.8E-06 11.3134984 -12.246893
81921 100000 0 0 11.5129255
Tabla 4.19: Distribución del nº de trabajadores, Alemania 2014

316
Anexos

ANEXO 9

[Li-1 Li] Si Si relativo LnLi LnSi_relat


9 141790 1 2.19722458 0
10 13 106107 0.74833909 2.63905733 -0.28989907
14 19 79793 0.56275478 2.99573227 -0.57491131
20 27 66708 0.47047041 3.33220451 -0.7540222
28 39 51299 0.36179561 3.68887945 -1.01667583
40 55 40799 0.28774244 4.02535169 -1.24568952
56 79 30988 0.21854856 4.38202663 -1.52074706
80 111 23558 0.16614712 4.71849887 -1.79488162
112 159 17431 0.12293533 5.07517382 -2.09609686
160 223 13102 0.09240426 5.41164605 -2.3815822
224 319 9547 0.06733197 5.768321 -2.69812012
320 447 7295 0.05144933 6.10479323 -2.96715791
448 639 5276 0.03720996 6.46146818 -3.29117885
640 895 4009 0.02827421 6.79794041 -3.56580526
896 1279 2949 0.02079836 7.15461536 -3.87288096
1280 1891 2095 0.01477537 7.54538975 -4.21479354
1892 2559 1489 0.01050145 7.84776254 -4.55624234
2560 3783 1007 0.00710205 8.23853693 -4.94737148
3784 5119 670 0.0047253 8.54090972 -5.35482466
5120 7567 465 0.0032795 8.93168411 -5.72006496
7568 10239 300 0.00211581 9.2340569 -6.15831989
10240 15135 173 0.00122011 9.62483129 -6.70881077
15136 20479 116 0.00081811 9.92720408 -7.10851218
20480 30271 66 0.00046548 10.3179785 -7.67244763
30272 40959 35 0.00024684 10.6203513 -8.30675431
40961 60544 13 9.1685E-05 11.0111257 -9.29715301
60545 81920 3 2.1158E-05 11.3134984 -10.7634901
81921 100000 0 0 11.5129255
Tabla 4.22: Distribución del nº de trabajadores, Reino Unido 2014

317

También podría gustarte