Introduccion A La Optimizacion No Lineal

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 181

Índice general

Prefacio xi
Reconocimientos xv
Capı́tulo 1. Introducción 1
Capı́tulo 2. Rn como un espacio vectorial 5
2.1. Cestas, precios, puntos y vectores 6
2.2. Rn como espacio métrico 10
2.3. Aplicaciones 13
2.4. Rn Como espacio topológico 15
2.5. Sucesiones 20
2.6. Conjuntos compactos y conexos 21
2.7. Aplicación 23
2.8. Continuidad de funciones 24
2.9. Aplicaciones 29
Capı́tulo 3. Conjuntos afines, y convexos 33
3.1. Conjuntos afines 34
3.2. Conjuntos convexos 36
3.3. Teoremas de separación 40
3.4. Aplicación: Conjuntos de producción 43
3.5. Ejercicios 45
Capı́tulo 4. Funciones cóncavas y cuasi-cóncavas 49
4.1. Aplicación 54
4.2. Funciones cóncavas de variable real 55
4.3. Funciones cóncavas de n variables. 57
4.4. Ejercicios 61
4.5. Derivadas direccionales y subgradientes 62
4.6. Funciones cuasi-cóncavas y cuasi-convexas 68
4.7. Conjuntos extremos 69
vii
viii ÍNDICE GENERAL

4.8. Maximizadores de funciones cuasi-convexas y cuasi-cóncavas 71


4.9. Ejercicios 74
4.10. Aplicaciones 75
4.11. Apéndice: Funciones mitcóncavas 77
Capı́tulo 5. Dualidad y optimización 81
5.1. Dualidad en problemas de distancias mı́nimas 82
5.2. Funcionales y conjuntos conjugados 86
5.3. Interpretación geométrica del conjugado 87
5.4. Ejercicios y Aplicaciones 89
5.5. Problemas duales de optimización 89
5.6. Optimización lineal 91
5.7. Dualidad y teorı́a de juegos 93
Capı́tulo 6. La programación no lineal 97
6.1. Programación cóncava. Punto silla 99
6.2. Un teorema previo al de Kuhn-Tucker 101
6.3. El teorema de Kuhn-Tucker 102
6.4. Caracterización por las condiciones de primer orden 104
6.5. Condiciones de cualificación 107
6.6. Aplicaciones 113
Capı́tulo 7. Teorema de Lagrange 117
7.1. Restricciones de igualdad y desigualdad 122
7.2. Condiciones de segundo orden 122
7.3. Ejercicios 123
Capı́tulo 8. Desarrollos de la programación no lineal 127
8.1. Programación cuasi-cóncava 127
8.2. Teoremas de Arrow-Enthoven 129
8.3. Programación multi-objetivo 134
Capı́tulo 9. Economı́a y optimización no lineal 137
9.1. Dos aplicaciones 138
9.2. El problema del consumidor: La demanda 142
9.3. La microeconomı́a y el teorema de separación de convexos 143
9.4. El segundo teorema del bienestar económico 146
Capı́tulo 10. Análisis de sensibilidad 149
10.1. Teorema de la envolvente 150
10.2. Aplicaciones a la microeconomı́a 152
10.3. La envolvente de las curvas de costo en el corto plazo 153
ÍNDICE GENERAL ix

10.4. Ejercicios 155


Capı́tulo 11. Apéndices 157
11.1. Apéndice I. Topologı́as equivalentes 157
11.2. Apéndice II. Continuidad de funciones 158
11.3. Apéndice III. Teorema de Heine-Borel 159
11.4. Apéndice IV. Lema de Zorn 160
11.5. Apéndice V. Teorema de la función implı́cita 161
11.6. Apéndice VI. Programación lineal 164
Bibliografı́a 167
Índice alfabético 169
Prefacio
El presente material no pretende ni mucho menos, sustituir la lectura de
buenos libros de texto de economı́a o de matemática, necesidad impostergable
para todo estudiante que aspire a entender con rigor y profundidad la teorı́a
que presentamos aquı́ de manera introductoria y lo más autocontenida posible.
Es este trabajo más bien una guı́a para posteriores lecturas más profundas, las
que deberán ir acompañadas por la realización de ejercicios: En la construc-
ción del conocimiento, el aprendizaje de la teorı́a y la resolución de problemas
deben ir juntos. Aunque parezca muchas veces escueto y descarnado, pretende
mostrar el espı́ritu general de un curso de matemática con énfasis en aplica-
ciones económicas tratadas de manera rigurosa, claro está, advirtiendo de la
necesidad de no confundir rigoris logicus con rigoris mortis.
La justificación de la matemática en la economı́a es, a esta altura del
desarrollo de ambas ciencias, ociosa. No obstante a modo de justificación para
este trabajo hacemos el siguiente comentario:
El estudio cientı́fico de la realidad económica, en la medida en que las
hipótesis puedan ser planteadas de manera formalmente correcta, aparece co-
mo generador de problemas desafiantes para la matemática cuya resolución
supone un avance posterior para la teorı́a económica. Ciertamente, no pare-
ce sensato justificar la necesidad del estudio de la matemática por parte del
economista, en la posibilidad de resolver triviales ejercicios de matemática
disfrazados de economı́a, presentados en el apéndice de un libro de matemáti-
cas para economistas. Estas elementales aplicaciones, descontextualizadas,
oscurecen la verdadera relación entre ambas ciencias y son ciertamente des-
alentadoras tanto para el buen estudiante de ciencias económicas con gusto
por las matemáticas, como para el buen estudiante de matemáticas con gus-
to por la economı́a. Diversas áreas de la teorı́a económica presentan unifor-
midades formales, que muestran la existencia de principios generales uni-
ficadores, posibles de ser expresados en un lenguaje matemático único que
adquirirá, una vez devuelto al entorno original, una expresión particular lógi-
camente correcta, y accesible a la discusión cientı́fica, y principalmente, con
xi
xii PREFACIO

inmenso valor heurı́stico para la teorı́a económica. Volviendo al principio del


parágrafo, es necesario resaltar, que la validez empı́rica o fecundidad de los
teoremas, en los que la realidad se expresa, no puede superar la de la hipótesis
original.
El autor de este trabajo, es totalmente contrario a la opinión de quienes
proponen presentar la matemática para los estudiantes de ciencias económi-
cas, como una matemática de segundo nivel, eufemı́sticamente llamada para
economistas, como si existera una matemática diferente según el área de in-
vestigación. Creemos si, que debe presentarse a los estudiantes de economı́a,
una matemática de profundo contenido y rigor, enseñada como se enseña a
los estudiantes de las llamadas ciencias exactas. De forma tal que ayude
a realizar aplicaciones y resolver problemas, con verdadero sentido económi-
co y que rebasen el nivel del ejercicio simplificado, sin connotación verdadera
en la teorı́a económica. Ciertamente, si diferenciar cabe, es entre buena y mala
matemática.
Es totalmente justificable que los estudiantes de ciencias económicas es-
tudien matemática en la facultad de ciencias y con matemáticos profesionales.
Indudablemente, el programa elegido debe comprender aquellos temas de la
matemática, de los que la teorı́a económica moderna se vale con mayor in-
tensidad. Estos temas, una vez elegidos, deben ser estudiados con rigor y
comprendidos en su profundidad, sea para desarrollar la teorı́a económica
dentro de su esquema actual, o sea para criticarla y presentar una alternativa
valedera. Encarada la matemática en cualquier carrera propia de las ciencias
económicas de manera trivial, como una matemática de poco nivel, da lugar a
la pregunta ingenua y muchas veces tendenciosa, no obstante justificada en el
neófito, que ha sufrido de este tipo de cursos: ¿para qué sirve la matemática
en las ciencias económicas?
El rechazo de la matemática como herramienta o como fuente del pensa-
miento económico por parte de algunos economistas, en base a la afirmación
de que la realidad escapa a cualquier modelo no es de recibo, como no lo es en
ninguna ciencia, pues la trivialidad de la afirmación es clara y de valor univer-
sal y se convierte en una mutilación de la posibilidad del pensamiento creador.
Lamentablemente, en América Latina aún perviven en algunas universidades,
núcleos de economistas que rechazan la matemática como herramienta de valor
para el pensamiento económico. Tras una aparente declaración de principios
se justifica la mediocridad y la incapacidad para abordar todo pensamiento
creador. Aunque afortundamente esta situación se revierte dı́a a dı́a, aún hoy
en la mayorı́a de las facultades de economı́a del continente es escaso el rigor
con el que se enseña esta ciencia a los estudiantes de economı́a. Muchas veces
PREFACIO xiii

la responsabilidad está en el limitado y anticuado conocimiento, escondido


y justificado en supuestas posiciones ideológicas, que de la teorı́a económica
moderna tienen los profesores de estas facultades. El ciclo de profesor con
poco conocimiento que engendra estudiantes, luego profesores, igualmente
mediocres, no es fácil de romper.
La alta formalización alcanzada por la moderna teorı́a económica, en
particular a partir de los trabajos de G. Debreu, y la ductilidad lograda por
la matemática a partir de D. Hilbert, permiten una simbiosis rica y fecunda
en descubrimientos e interacciones. Por otra parte, la potencialidad de la
interdisciplinariedad se pierde tanto cuando se rechaza a la matemática como
instrumento y fuente del pensamiento económico, como cuando se asume
la matemática primero y luego se buscan las posibles aplicaciones. Estas dos
malas maneras de concebir la interdisciplinariedad, encorsetan la investigación
cientı́fica en un marco fijado a priori y por lo tanto empobrecido respecto
a la realidad a la que aspira. La matemática se aplica para la resolución
de problemas originados en la realidad económica, luego formalizados por
el pensamiento del economista y del matemático. Llegado a este nivel de
abstracción, el problema es un desafı́o que puede o no ser resuelto de manera
completa, en forma más o menos inmediata; pero que, en todo caso pasa, si es
de interés, al cuerpo de la teorı́a y de manera más o menos indirecta al terreno
de las aplicaciones.
¿Qué matemática o qué rama de la matemática debe enseñarse a los
estudiantes de ciencias económicas? y ¿con qué profundidad debe dictarse un
curso para dichos estudiantes? son preguntas de gran interés, con respuestas
diferentes en su contenido. Para la primera no hay una respuesta clara, pues
en tanto que herramienta del descubrimiento no puede fijarse a priori, en todo
caso podemos ayudarnos conociendo el tipo actual de problemas que la ciencia
económica se plantea, los que dan una pauta de los problemas del porvenir. Para
la segunda la respuesta es clara: con toda la profundidad que la matemática
requiere para ser bien utilizada, lo que naturalmente no implica confundir
formación en economı́a, con formación en matemática. Entendemos si, que
sólo un economista bien formado en alguna disciplina matemática es capaz
de alcanzar un conocimiento profundo de su ciencia. Si el comportamiento
humano puede modelarse, aunque sólo sea parcialmente, no es ciertamente
posible de hacerse con una herramienta trivial. La gran cantidad de malos
trabajos en economı́a fundados en un conocimiento pobre en matemática es
un hecho que nos debe alertar. La paradoja se cierra: la mejor herramienta de
que disponemos para entender los hechos concretos, es la mejor abstracción.
Pedro Uribe lo decı́a en términos más pedestres, respondiendo a quienes le
xiv PREFACIO

criticaban por enseñar a sus estudiantes una economı́a altamente formalizada


y lo conminaban a que “aterrizase” les respondı́a con una pregunta: ¿Cómo
pueden aterrizar si aún no han despegado? Es claro que, para aterrizar, hay
primero que al menos, haber iniciado el vuelo.
Nos guı́a en el proceso de elaboración de este trabajo el pensamiento de
Hilbert según el cual, en matemática, no importa la naturaleza exacta de las en-
tidades estudiadas, son las relaciones entre dichas entidades las que por sı́ solas
son importantes. Pero en este caso, la dirección del pensamiento es la inversa,
partimos de lo especı́fico, es decir desde la formalización económica, donde
los entes matemáticos aparecen disfrazados, y llegamos a lo abstracto, a la ma-
temática en donde los conceptos aparecen sin disfraces, conceptos primitivos y
axiomas. En lugar de cestas de bienes, sistema de precios, preferencias, habla-
mos aquı́ de puntos, funcionales, y conjuntos convexos. Purgados los axiomas
de palabras, la validez de la estructura lógica es la misma. No obstante en
diferentes partes del trabajo presentamos aplicaciones de la teorı́a expuesta
a la economı́a. Algunas aplicaciones dejadas como ejercicios ayudarán a no
olvidarnos del origen de nuestro pensamiento.
La axiomatización de la teorı́a económica postdebreuriana, permite usar la
abstracta matemática posthilbertiana de manera rica y creadora. La generalidad
de los conceptos primitivos aceptados en matemática deja lugar, una vez
sustituı́dos estos convenientemente, a la especificidad de la teorı́a económica,
dándole a ésta el rigor que requiere para su comprensión cabal y su crı́tica. Una
vez hecha una traducción correcta la teorı́a económica está apta para enfrentar
nuevos desafı́os.
En base a la forma actual de la teorı́a económica elegimos la optimización
como tema central de este trabajo. La justificación de tal elección la encon-
tramos en la presentación de la economı́a y la administración como ciencias
que se refieren a la asignación de recursos escasos con eficiencia. Importantes
temas de la microeconomı́a como: el equilibrio general, la teorı́a del agente y
el principal, la teorı́a de la firma, la teorı́a de los contratos, ası́ como la mo-
derna teorı́a del crecimiento sustentable y otros tantos, se refieren de manera
directa a este tema. Claro está, que no es el único tema de las matemática que
requiere de un estudio riguroso por parte del economista, pero es sin duda
básico y unificador y no sólo del pensamiento económico formalizado propio
de diversas áreas de la teorı́a económica, sino también, del surgido en diversas
disciplinas cientı́ficas.
RECONOCIMIENTOS xv

Reconocimientos
El trabajo pudo concretarse gracias a las facilidades que me fueron otorgadas
por la Facultad de Economı́a de la UASLP, en especial por su director, Lic.
David Vega Niño, quien está convencido de la necesidad de elevar el rigor en la
enseñanza de la teorı́a económica. Quisiera agradecer también a los profesores,
Ramón Garcia-Cobbian y Loretta Gasco por haberme invitado a participar de
las actividades de la Sección de Matemáticas de La Universidad Católica de
Perú, durante los meses de abril, mayo y junio de 2004. Perı́odo este, en el cual
estas notas fueron escritas en su primera aproximación. Este agradecimiento
es extensivo a profesores y funcionarios de dicha sección por el apoyo y
hospitalidad que me brindaron. Deseo agradecer también al Dr. Leobardo Plata,
al Dr. Guillermo Pastor y a dos anónimos evaluadores cuyos comentarios y
sugerencias hicieron posible una mejora sustancial del texto. La participación
del Ing. Ricardo Hernández Medina del Laboratorio de Cómputo de la Facultad
de Economı́a de la UASLP fue decisiva para la presentación general del texto
y en particular para el diseño de las gráficas y figuras que se adjuntan. A Juan
Carlos Yañez, también ingeniero del Laboratorio de Cómputo de la Facultad
de Economı́a de la UASLP, por su colaboración con la compilación de este
material.
La colaboración de la Dra. Luz de Teresa, editora de la serie Aportacio-
nes Matemáticas, la paciencia de Gabriela Sanginés para corregir decenas de
errores de tipografı́a, ası́ como en general la colaboración de todo el personal
que edita Aportaciones Matemáticas de la Sociedad Matemática Mexicana, ha
sido una necesidad de primer orden para la edición de este libro.
Naturalmente que los errores que en este trabajo persisten son de res-
ponsabilidad exclusiva del autor, y toda sugerencia u observación tendiente a
superarlos y en general a mejorar el trabajo, serán agradecidas.
Capı́tulo 1
Introducción

Cuando era estudiante estaba de moda dar cursos llamados


“Matemáticas elementales desde un punto de vista supe-
rior". . . Pero lo que yo necesitaba eran unos cuantos cursos
llamados “Matemáticas superiores desde un punto de vista
elemental".
Joel Franklin.

El objetivo principal de este libro es presentar el teorema de Khun-Tucker,


el que entendemos central para la comprensión de la teorı́a económica mo-
derna. Desarrollaremos en el camino, la herramienta necesaria para su demos-
tración y cabal comprensión. Prestaremos especial atención a aquellos puntos
que entendemos son de mayor importancia para quienes pretenden conocer
la teorı́a económica moderna, como por ejemplo el teorema de separación de
convexos. A lo largo del texto una serie de ejercicios ayudará a quienes los
resuelvan, a entender la teorı́a presentada y sus aplicaciones. Una referencia
clásica para la introducción de la concavidad y la convexidad, temas que abor-
daremos en este libro, y la optimización en forma rigurosa en economı́a, tema
central de nuestro trabajo, es [Maden, P.] cuya presentación es inspiradora del
presente texto.
Comenzaremos este trabajo con unas breves consideraciones sobre la es-
tructura vectorial y topológica de Rn . Las mismas pueden encontrarse en
cualquier texto de topologı́a o de análisis en Rn , como por ejemplo [Lima, L.]
y en el más avanzado texto [Kelley, J.]. La lectura de cualquier texto moderno
de microeconomı́a como [Mas-Colell et al], [Varian, H.] o como [Luember-
guer, D. (b)], convencerá al lector de la importancia de conocer este espacio.
Luego haremos algunas consideraciones sobre convexidad en Rn , la referencia
clásica es [Rockafellar, T.]. Muchos de las definiciones y resultados presen-
tados pueden ser llevados a espacios más generales que Rn . ver por ejemplo
[Luenberger, D. (a)]. Hacemos en el texto referencia a esta posibilidad, no
1
2 1. INTRODUCCIÓN

obstante, la dificultad del tema que nos convoca, es suficiente para que en
esta primera aproximación nos contentaremos con trabajar sólo en Rn . Pe-
ro si, sin violentar demasiado la intuición podemos generalizar, lo haremos.
Intentaremos siempre, motivar al estudioso a lecturas más profundas y gene-
rales, las que le habilitarán a una comprensión de otros temas propios de la
teorı́a económica, los que aún siendo una extensión natural de temas trata-
dos en este libro, la matemática involucrada en su modelado, sobrepasa los
lı́mites del material reunido en este libro1. Al interesado en conocer algu-
nas de estas generalizaciones lo remitimos a los siguientes textos [Duffie, D.]
y [Aliprantis, C.D.; Brown, D.J.; Burkinshaw, O.]. En general, los problemas
más interesantes en teorı́a económica, más “realistas” si se quiere, son los
que requieren de una matemática más sofisticada para su justa comprensión
y resolución. La axiomatización proporciona una estructura dentro de la cual
el pensamiento lógico puede moverse, dejando en claro contradicciones y ra-
zonamientos incorrectos. Ciertamente la economı́a no termina aquı́, pero las
estructuras vacı́as de rigor lógico no tienen valor en la economı́a ni en ninguna
ciencia. Cada vez que introducimos nuevos axiomas en una teorı́a debemos
mostrar la no contradicción del nuevo sistema axiomático, es decir que en
un número finito de pasos lógicos no llegamos a resultados contradictorios a
partir de la axiomática prestablecida. Pero si bien, la lógica es la higiene de
la teorı́a, no es su única ni la principal fuente de alimento, es sobre los grandes
desafı́os y problemas que resuelve y que se plantea como propios, que florece.
Al decir de Hilbert, “Una rama de la ciencia está llena de vida mientras ofrez-
ca abundancia de problemas, una carencia de problemas es signo de muerte.”
La construcción de nuevas teorı́as que enfoquen nuevos aspectos y pongan
en descubierto carencias de las anteriores, pueden negar las teorı́as existentes,
pero para poder hacerlo necesitan ser rigurosamente correctas.
Dedicaremos entonces, el principo de este trabajo a definir las estructuras
abstractas, que servirán de andamios a lo largo de los que nos moveremos en
esta obra en proceso, para llegar al teorema de Kuhn-Tucker y sus posibles
aplicaciones en economı́a. Es este teorema, una generalización del método de
los multiplicadores de Lagrange, cuya aplicación en economı́a nos lleva a la
formalización de importantes intuiciones económicas tales como por ejemplo,
el de la no saciedad local2. Las referencias básicas son [Takayama, A.] y para
1Para un resumen de las principales dificultades con que se enfrenta la teorı́a económi-
ca, cuando intenta trabajar con espacios más generales que Rn ver [Accinelli, E. (03)], o
[Mas-Colell, A, and Zame, W.R.].
2
Se dice que las preferencias de un consumidor son localmente no saciables, cuando tan
próximo como se quiera, a toda cesta de consumo, existe otra cesta estrictamente preferible a
la primera.
1. INTRODUCCIÓN 3

todo lo referente al estudio de la convexidad [Rockafellar, T.]. El teorema de


Kuhn-Tucker da condiciones necesarias para la existencia de la solución de un
programa no lineal de optimización, que representa en un determinado contex-
to, la demanda del consumidor que maximiza sus preferencias, o bien en otro,
el plan óptimo de un productor que maximiza sus beneficios. Este programa,
bajo cualquiera de sus apariencias, representa el problema central de la teorı́a
económica que se preocupa de la asignación óptima de recursos escasos. Ori-
ginalmente conocido como teorema de Karush-Kuhn-Tucker, se populariza
como teorema de Kuhn-Tucker una vez que es presentado en una conferencia
en Berkeley en 1951. El trabajo es publicado en los “proceeding” de la con-
ferencia antes que en revistas [Kuhn,H.W.; Tucker, A. W.]. Completaremos el
trabajo con una discusión sobre algunos temas clásicos de la optimización
y desarrollos de la optimización cuasi-cóncava de interés profundo en teorı́a
económica. El temario es conocido pero está disperso en diversos textos y
artı́culos publicados en revistas especializadas. El principal mérito de este li-
bro, si es que tiene alguno, es el de presentar (o pretenderlo al menos) una
visión completa y autocontenida de este teorema y de algunas de sus aplica-
ciones. Presentación esta, realizada a partir de las necesidades más corrientes
de los economistas, sin esconder los problemas y dificultades que su compren-
sión conlleva. Finalmente, en los apéndices discutiremos temas conexos con
el temario desarrollado en el texto y que fueron abordados y utilizados más o
menos indirectamente en el texto, pero que no fueron considerados centrales
para comprender el temario desarrollado, no obstante entendemos que son de
interés para comprender la teorı́a presentada en su totalidad y profundidad.
Capı́tulo 2
Rn como un espacio vectorial

Al ocuparnos de problemas matemáticos, un rol más im-


portante que la generalización es jugado, yo creo, por la
especialización.
David Hilbert.

La estructura matemática existente en el concepto de espacio vectorial y


en particular de Rn como espacio vectorial, es básica y convoca a diferentes
áreas del pensamiento teórico de diversas disciplinas cientı́ficas, de allı́ el por
qué comenzar con ella.
Los economistas piensan en cestas de bienes, restricciones presupuestarias
y precios, en forma análoga a como los fı́sicos piensan en partı́culas, campos,
y trayectorias. Este hecho, no debe llevarnos a la falaz conclusión de que los
modelos económicos y los modelos fı́sicos se construyen de igual manera.
La teorı́a económica y la fı́sica parten de realidades y formas de pensar muy
diferentes. No deja de ser sorprendente entonces, que la matemática logre
expresar en un lenguaje común estos dos mundos tan diferentes. Conceptos
tales como punto, variedades diferenciales, y operadores duales, sirven tanto
al fı́sico como al economista1. Ciertamente hay que saberlos encontrar tras sus
avatares, pero la lógica de su interacción es la misma aunque claro está, los
economistas deben partir de problemas de la economı́a, y los fı́sicos de los de
la fı́sica. Es al formalizar las intuiciones elementales que el investigador se
encuentra con la crudeza del concepto matemático. Los fı́sicos al formalizar
conceptos como velocidad y partı́cula, llegan al de derivada o punto, los
economistas llegan a dichos conceptos matemáticos a partir de, por ejemplo:
elasticidades, productos o utilidades marginales, precios, etc. Este proceso
de abstracción, permite descubrir, detrás de las relaciones matemáticas entre
abstractos conceptos primitivos propios de la matemática, relaciones hasta
1En [Balasko, Y. (09)] el lector encontrará un amplio y fructı́fero uso del concepto de
variedad diferenciable en la teorı́a económica.

5
6 2. Rn COMO UN ESPACIO VECTORIAL

entonces veladas a los ojos del investigador, entre los conceptos primitivos
propios de cada ciencia particular. Desde allı́, unos y otros viajan nuevamente
a sus realidades particulares las que ahora serán, a los ojos de los investigadores,
más ricas.

2.1. Cestas, precios, puntos y vectores


Las cestas de bienes definidas en la teorı́a económica, no son otra cosa que
listas finitas de números, que expresan las unidades de cada bien de la eco-
nomı́a, presentes en una cesta de consumo. Si l es la cantidad de bienes
diferentes existentes, una cesta de bienes será un vector del espacio Rl , cuya
primera coordenada representa la cantidad asignada en la cesta al bien uno, y
ası́ sucesivamente hasta la l-ésima. Generalmente, estas cestas se limitan a un
subconjunto del espacio en el que están definidas. Por ejemplo (si asumimos
que los bienes sólo pueden adquirirse en cantidades positivas), no pueden te-
ner los vectores que las representan, coordenadas negativas, lo que las ubican
en el cono positivo de dicho espacio vectorial. Llamaremos a este subcon-
junto, conjunto de consumo generalmente representado por Rl+ es decir el
cono positivo de Rl . Los precios unitarios de los bienes, forman también una
lista de l coordenadas, los representamos en general por p = (p1 , . . . , pl ).
Veremos que estos precios son, en términos matemáticos, un funcional li-
neal definido en el conjunto de consumo. Las cestas de bienes se suman y
se multiplican siguiendo las reglas de las sumas de vectores y las del pro-
ducto de vectores por números. El valor de una cesta x, no es otra cosa que
el valor que asume el funcional dual p, evaluado en x. En el caso particular
que tratamos px = p1 x1 +. . . , pl xl . Si n es el número de agentes de la economı́a
y l el número de bienes, las asignaciones de recursos son listas en el espacio
producto de n factores Rl × Rl × · · · × Rl , es decir Rnl x = (x1 , . . . , xn ) donde
xi ∈ Rl representa una cesta para el i-ésimo consumidor.
Un problema no menor en economı́a, es el de conseguir cestas próximas
(sustitutas) a una deseada, cuando ésta no se encuentra fácilmente. Las cestas
de bienes están próximas en gustos y valores si distan poco entre sı́. Intro-
duciremos en la siguiente sección, un concepto de distancia entre puntos de
Rl para aproximarnos al de cestas próximas en el gusto del consumidor. Nos
interesa entonces conocer las reglas con las que podemos operar en Rl en for-
ma coherente, pues en definitiva, operar con cestas o valuar cestas, será, como
veremos, equivalente a operar con puntos o vectores, del espacio vectorial Rl .
Estas reglas serán las que nos permiten formalizar el concepto de agregación o
2.1. CESTAS, PRECIOS, PUNTOS Y VECTORES 7

de valor de las cestas de consumo. En definitiva, nos interesan las caracterı́sti-


cas de Rl como espacio vectorial y las reglas con las que en él se opera, las que
pasamos a presentar a continuación, pues reflejan las reglas de la economı́a.
Si bien el concepto de espacio vectorial es muy abstracto, en este trabajo,
nos limitaremos en general, al caso del espacio vectorial real de dimensión
finita al que representaremos como Rn , siendo n el número de coordenadas,
(en general usaremos n = l para referirnos al número de bienes diferenciados
existentes en una economı́a). No obstante si es posible sin violentar demasiado
la intuición generalizar, lo haremos.
Sea R el conjunto de los números reales y n un número natural. El espacio
vectorial real n-dimensional es el producto cartesiano de n factores iguales a R,
al que representamos por Rn = R × R ×· · ·× R. Los puntos de Rn son las n-uplas
(o n-listas) de números reales x = (x1 , x2 , . . . , xn ). Estos elementos serán lla-
mados vectores o puntos de Rn . El i-ésimo elemento de x se llama i-ésima coor-
denada y la representamos por xi . Diremos que dos vectores x = (x1 , . . . , xn )
e y = (y1 , . . . , yn ) en Rn son iguales y escribimos x = y si y solamente si, son
iguales sus respectivas coordenadas, es decir: x1 = y1 , . . . , xn = yn . Definimos
la suma de dos vectores de Rn x = (x1 , x2 , . . . , xn ), e y = (y1 , x2 , . . . , yn ),
cualesquiera, al vector z cuya i-esima coordenada resulta de la suma de las
correspondientes de x e y. Definimos también la multiplicación por un esca-
lar es decir, de un número α ∈ R por un vector x ∈ Rn al elemento w de Rn
obtenido mediante la multiplicación de cada coordenada de x por el número
α. Es decir w = αx = (αx1 , . . . , αxn ).
• z = x + y; es el vector de Rn , cuyas coordenadas son z1 = x1 +
y1 , . . . , zn = xn + yn . Es decir que la suma de vectores es un función
S definida en el producto cartesiano de Rn consigo mismo en Rn , es
decir S = Rn × Rn → Rn , definida como S (x, y) = x + y.
• Mientras que el producto de un vector por un número, es una función
w cuyo dominio es el producto cartesiano de R con Rn en Rn definida
como w : R × Rn → R definida como w(α, y) = αy es decir el
vector cuyas coordenadas (w1 , w2 , . . . , wn ) verifican las igualdades
w1 = αy1 , . . . , wn = αyn .
Con las operaciones definidas de esta forma Rn es un espacio vectorial
sobre R.
NOTA 2.1. El concepto de espacio vectorial es un concepto abstracto, muy
amplio, cuya definición involucra a dos conjuntos y dos operaciones. Uno de
ellos el conjunto de los llamados vectores, al que representamos por X, el otro,
el de los escalares C que tiene la estructura de cuerpo. Dado que en nuestro
trabajo nos limitaremos a los reales (es decir que C = R), no insistiremos
8 2. Rn COMO UN ESPACIO VECTORIAL

en analizar las caracterı́sticas que definen a un cuerpo en general, las que


ciertamente el conjunto de lo reales tiene. Las dos operaciones son: la suma
de vectores y el producto de un vector por un escalar. La operación de suma es
una función que a dos vectores le asocia un tercero, es decir es cerrada en X.
De forma tal que dicha operación debe ser asociativa, conmutativa, debe tener
definido un neutro (el vector nulo) y un inverso, (es decir para que x ∈ X debe
existir y ∈ X tal que x + y = 0). Generalmente este inverso es representado
como − x. La operación producto, relaciona escalares y vectores. El conjunto
de escalares puede pensarse como el conjunto de los números reales, con las
operaciones de suma y multiplicación habituales. En este caso diremos que
estamos ante un espacio vectorial real. La operación producto de un escalar
por un vector, asocia a cada par (x, α) ∈ X × C un segundo vector y = αx, que
será el mismo vector x, si α es el neutro de la operación producto, definida en
los escalares, en el caso de los reales el 1. Esta operación debe ser, conmutativa
αx = xα, distributiva frente a la suma de vectores α(x + y) = αx + αy y tal que
si α = 0 al producto de 0 · x para todo x ∈ X, le corresponde el vector nulo.
Además si α, β y γ, son escalares y x un vector se verifica que (α+β)x = αx+βx
y α(βγ)x = (αβ)γx. Además si α = 1 entonces para todo vector x αx = x.

Recomendamos al lector que no conozca esta definición, la consulta de


cualquier texto de álgebra lineal que la contenga.

EJERCICIO 2.2. Pruebe que si el conjunto de vectores es Rn y el de escalares


es R con las operaciones de suma y producto anteriormente definidas, entonces
Rn forma un espacio vectorial real, (es decir, un espacio vectorial donde los
escalares son los números reales).

Asumidas las operaciones anteriormente indicadas en Rn , consideremos


el conjunto de vectores B = {e1 , . . . , en } de Rn , donde ei , i = 1, . . . , n es un
vector tal que, con excepción de la i-ésima coordenada que vale 1, todas las
demás son cero. Puede verse que, entonces, todo P vector x = (x1 , . . . , xn ) de
Rn puede escribirse de manera única como x = ni=1 xi ei , es decir como una
combinación lineal de los vectores ei , i = 1, . . . , n. Decimos que el conjunto B
forma una base de vectores Rn
Dados dos elementos x = (x1 , . . . , xn ) e y = (y1 , . . . , yn ) de Rn definimos
el producto de x por y como el número real que se obtiene en la siguiente
operación:
n
X
(1) h x, yi = xy = xi yi .
i=1
2.1. CESTAS, PRECIOS, PUNTOS Y VECTORES 9

FIGURA 1. Ortogonalidad

Obsérvese que el producto ası́ definido es una función P : Rn × Rn → R con


dominio en el producto cartesiano de Rn consigo mismo y recorrido en los
números reales, es decir que a dos vectores de Rn les asocia un número real
P(x, y) = xy, de acuerdo a la operatoria definida en (1). Este producto se llama
producto interno o escalar.
EJERCICIO 2.3. Verificar que el producto interno satisface las siguientes
propiedades para todo x, y, z ∈ Rn , α, β ∈ R:
(1) h x, yi = hy, xi.
(2) h(αx + βy), zi = αh x, zi + βhy, zi.
(3) h x, xi ≥ 0 y h x, xi = 0 si y sólo si x = 0.
En general dado un espacio vectorial X se llama producto interno a
una función P : X × X → R que verifica las propiedades anteriormen-
te mencionadas2. El caso particular n
Pn en el que X = R , el producto interno
n n
P : R × R → R definido como i=1 xiyi se denomina producto euclidiano.
DEFINICIÓN 2.4. Sea X un espacio vectorial, diremos que dos vectores x
e y son ortogonales o perpendiculares si P(x, y) = 0.
Observe que el producto P(x, y) = xy puede ser nulo, sin que ni x ni y sean
cero, ver figura 1.
2No debe confundirse esta operación con el producto definido anteriormente entre escalares
y vectores el que se define por una función p : E × X → X donde E es el cuerpo de escalares y
X el espacio vectorial. En el caso en que X = Rn , y E = R, se define el producto interno
P : R × Rn → Rn , como un producto entre vectores de Rn . Mientras que p(α, x) = α · x,
representa el vector (αx1 , . . . , αxn ).
10 2. Rn COMO UN ESPACIO VECTORIAL

NOTA 2.5. En una economı́a con l bienes, cada cesta se representa por un
vector x ∈ Rl y los precios unitarios de los bienes por un vector p ∈ Rl . Luego
el producto interno px de estos dos vectores, representa el valor de la cesta x,
a precios p. Por otra parte, las cestas de bienes se agregan siguiendo las reglas
de suma y producto propias del espacio vectorial Rn , en este caso n = l.

2.2. Rn como espacio métrico


A continuación definiremos la función distancia o métrica. Podremos enton-
ces decir cuando dos cestas de bienes son próximas o no.
DEFINICIÓN 2.6. Sea X espacio vectorial. Decimos que la función
d : X × X → R es una distancia si verifica que:
(1) d(x, y) ≥ 0, con igualdad si y sólo si x = y,
(2) d(x, z) ≤ d(x, y) + d(y, z), llamamos a esta desigualdad triangular.
(3) d(x, y) = d(y, x).
Un espacio vectorial X en el que hay definida una función distancia se llama
espacio métrico y se representa por (X, d).
EJERCICIO 2.7. Verifique que las siguientes funciones de Rn × Rn → R
son funciones distancia.
(
1 x 6= y
(1) d1 (x, y) =
0 x=y
Pn
(2) d2 (x, y) = i=1 | xi − yi |.

(3) d3 (x, y) = supi{| xi − yi |}.


pPn
2
(4) d(x, y) = i=1 (xi − yi ) . Esta distancia se suele llamar distancia
usual o euclidiana.

NOTA: Para la demostración de que esta función define una dis-


tancia, es necesitará de la desigualdad de Cauchy-Schwartz, es decir
2.2. Rn COMO ESPACIO MÉTRICO 11

FIGURA 2. Métricas diferentes

que dados dos puntos de Rn x e y se verifica que ( ni=1 xi yi )2 ≤


P
Pn 2 Pn 2 2
i=1 xi i=1 yi equivalentemente que (h x, yi) ≤ h x, xihy, yi. La
demostración puede ser encontrada en [Apostol, T.].
En la figura 2, se representan las distancias definidas en los numerales, 2,
3 y 4.
Demostración de la propiedad triangular (4): Definamos u = z − x;
v = y − z; w = y − x. Observe que hu, ui = d2 (x, z); hv, vi = d2 (y, z) y que
hw, wi = d2 (y, x). Queremos probar entonces que
1 1 1
(hw, wi) 2 ≤ (hu, ui) 2 + (hv, vi) 2 .
Elevando al cuadrado ambos miembros de la desigualdad obtenemos que la
desigualdad a probar es:
1
hw, wi ≤ hu, ui + hv, vi + 2(hu uihv, vi) 2 .
Siendo w = u + v se sigue que
hw, wi = hu + v, u + vi = hu, ui + hv, vi + 2hu, vi.
1
Por la desigualdad de Cauchy-Schwarz, hu vi ≤ (hu, uihv vi) 2 . De donde se
sigue la desigualdad triangular. 
Decimos que la métrica o distancia proviene de un producto interno si
p
d(x, y) = h x − y, x − yi.
Definiremos ahora la función norma.
DEFINICIÓN 2.8. Sea X espacio vectorial. Una función N : X → R es una
norma en X desde que dicha función verifique las siguientes propiedades:
12 2. Rn COMO UN ESPACIO VECTORIAL

(1) N(x) ≥ 0 con igualdad si y solamente si x = 0,


(2) N(x) + N(y) ≥ N(x + y),
(3) N(αx) = |α|N(x).
q(X, N) se llama espacio normado.
Si en X se define una norma N entonces
En particular si X = Rn la función N(x) = x21 + · · · + x2n define, como elector
verificará una norma.
La siguiente definición será de gran utilidad en particular a partir de la sec-
ción siguiente en la que introduciremos la definición de espacios topológicos,
se trata de la definición de normas equivalentes.
DEFINICIÓN 2.9. Decimos que dos normas N1 y N2 son equivalentes
cuando existen constantes A > 0 y B > 0 tales que N1 (x) ≤ AN2 (x) y
N2 (x) ≤ BN1 (x).
Un hecho notable es que en el espacio vectorial Rn todas las normas son
equivalentes3. Esta observación nos permite utilizar en Rn cualquier norma, en
particular la habitual, sin perder generalidad.
EJERCICIO 2.10. Sea X un espacio vectorial,
(1) Muestre que todo espacio normado es un espacio métrico,
(2) pero que el recı́proco no es cierto.
(3) ¿Qué propiedades debe verificar una función distancia para ser una
norma?
(a) Muestre que con la distancia usual d(x, 0) define una norma a la
que representaremos con k xk.p
(b) Verifique que k xk = d(x, 0) = h x, xi.
(c) >Define la distancia d1 del ejercicio (2.7) una norma?
Sea (X, d) un espacio métrico. Consideremos x0 ∈ X y definamos como
bola abierta centrada en x0 de radio r al conjunto Br (x0 ) definido como
Br (x0 ) = { x : x ∈ X, d(x, x0 ) < r} ,

3Para ver la equivalencia de las normas consideremos N como una norma cualquiera
2
N, mientras que sea N1 la norma del supremo Ns (x) = max{x1 , . . . , xn }. Observe que si ei , i =
1, . . . , n P Rn la siguiente cadena de desigualdades se sigue:
son los vectores de la base canónica deP
N(x) ≤ i=1 |xi |N(ei ) ≤ BNs (x), siendo B = ni=1 N(ei ). Se sigue entonces que |N(x)−N(y)| ≤
n

N(x − y) ≤ BNs (x − y). Por lo tanto N : Rn → R es una función continua en (X, Ns ) y por
lo que alcanza su máximo y su mı́nimo en el conjunto compacto V = {x ∈ Rn : Ns (x) = 1} es
decir existen A y B tales que A ≤ N(x) ≤ B, ∀x ∈ V. Luego escribiendo y = Nsy(y) Ns (y) se
sigue que ANs (y) ≤ N(y) = N( Nsy(y) )Ns (y) ≤ BNs (y). Es decir que, dadas dos normas N1 y N2
existen unas constantes A y B tales que AN1 (x) ≤ N2 (x) ≤ BN1(x).
2.3. APLICACIONES 13

donde r es algún número positivo y d se refiere a la distancia. Llamaremos


bola cerrada de radio r y centro en x0 al conjunto
B̄r (x0 ) = { x : x ∈ X, d(x, x0 ) ≤ r} .
EJERCICIO 2.11. Sea X = Rn considere las distancias definidas en el ejerci-
cio (2.7). Represente gráficamente, para cada una de ellas, las correspondientes
bola abierta y cerradas centradas en el cero de radio r.
DEFINICIÓN 2.12. Decimos que un subconjunto A de un espacio métrico
(X, d) es un conjunto acotado si existe r ≥ 0 tal que A ⊆ Br (0).
Es también posible definir subconjunto acotado en un espacio normando
(X, N) Basta para esto decir que un suconjunto A del espacio normado está aco-
tado, si existen m1 y m2 números reales, tales que m1 ≤ N(x) ≤ m2 ∀ x ∈ A.
Es inmediato concluir a partir de acá que si un conjunto está acotado bajo
una norma, lo estará bajo cualquier norma equivalente.

2.3. Aplicaciones
EJERCICIO 2.13. Considere una economı́a con l = 2 bienes. Su espacio
de consumo, el cono no negativo de R2 (es decir el conjunto de vectores con
2 coordenadas no negativas), generalmente representado por R2+ . Sean x e y
dos cestas de bienes y suponga que los precios, están dados por un vector p
de R2+ . Recuerde las definiciones de espacio vectorial, producto euclidiano y
distancia dadas en el texto.
(1) ¿Qué significa en términos de las operaciones definidas en R2 como
espacio vectorial que, el valor de la cesta x es α?
(2) ¿Qué significa (en el mismo sentido que anteriormente) que la cesta
x es más cara que la cesta y?
(3) ¿Qué significa que la cesta x tiene el mismo valor que la cesta y?
Relacionar la respuesta con la definición 2.4.
(4) Suponga que un agente tiene un ingreso igual a I unidades monetarias.
¿Cuál será, en función de los precios, la cesta de norma máxima a
que el agente puede aspirar? ¿Cuál será la más costosa que puede
comprar?
(5) Encuentre todas las cestas cuya distancia a la cesta x = (1, 2) es 1.
(6) ¿Cómo actuarı́a una inflación de precios con ı́ndice e en esta eco-
nomı́a y qué repercusiones tendrı́a sobre el consumo de un agente
cuyo ingreso I se mantiene fijo?
14 2. Rn COMO UN ESPACIO VECTORIAL

FIGURA 3. Restricción presupuestaria

(7) ¿Qué medidas tomarı́a para que el consumo del agente no se vea
afectado?
(8) Muestre que, si los precios son estrictamente positivos, entonces la
región presupuestaria es un subconjunto acotado de R2 . ¿Qué pasarı́a
si algún precio fuese igual a cero?
La figura 3 representa la restricción presupuestaria como un subconjunto de
R2+ , cuando los precios son estrictamente positivos.

EJERCICIO 2.14. Suponga una economı́a con dos agentes y l bienes, sea
w1 y w2 las dotaciones iniciales de cada uno de los agentes. Suponga que
los precios están dados por p ∈ Rl estrictamente positivos. Suponga que los
agentes son localmente no saciables. Muestre que la ley de Walras equivale a
firmar que el vector de precios es ortogonal al vector exceso de demanda.
2.4. Rn COMO ESPACIO TOPOLÓGICO 15

2.4. Rn Como espacio topológico


Si bien centraremos nuestra atención en Rn , los conceptos que en esta sec-
ción consideraremos son generalizables a cualquier conjunto. En particular
el concepto de topologı́a puede ser introducido en conjuntos cualesquiera,
lo que permite construir espacios topológicos muy generales. Esto posibilita
entre otras cosas, definir el concepto de continuidad de funciones en forma
muy amplia. Interesantes aplicaciones a la economı́a de los conceptos de
continuidad en espacios más generales que Rn se encuentran por ejemplo en
[Aliprantis, C.D.; Brown, D.J.; Burkinshaw, O.].
DEFINICIÓN 2.15. Dado un conjunto cualquiera X decimos que una familia
F de subconjuntos de X es una topologı́a para X si
(1) X ∈ F y ∅ ∈ F ,
(2) Vi ∈ F i = 1, 2, . . . , n entonces ∩ni=1 Vi ∈ F ,
(3) Vα ∈ F ∀α ∈ A entonces ∪α∈A Vα ∈ F .
Llamaremos a (X, F ) espacio topológico.
Obviamente en un mismo conjunto X pueden definirse distintas topologı́as.
Decimos que la topologı́a F ′ es más fina que la topologı́a F si F ⊂ F ′ . No
todas las topologı́as son comparables. Como ejemplo de topologı́as extremas
definibles en X, considere la formada solamente por el conjunto total y el
conjunto vacı́o (llamada trivial) y por otra parte, la formada por todos los
subconjuntos posibles del conjunto X, (llamada discreta).
Sea A ⊂ X, decimos que un subconjunto B de X es el complemento de A
y lo representamos por Ac , cada vez que A ∪ Ac = X y además A ∩ Ac = ∅.
DEFINICIÓN 2.16. Dada una topologı́a F en X, los elementos de la fami-
lia F son llamados conjuntos abiertos mientras que, sus complementos, se
llaman cerrados.
Observe que un subconjunto arbitrario de un espacio topológico no tiene
por qué ser abierto o cerrado, más aún un subconjunto de un espacio topológico
puede ser a la vez abierto y cerrado.
DEFINICIÓN 2.17. Llamaremos entorno abierto o simplememte entorno
de un punto x ∈ X a todo conjunto abierto que contenga a x. Diremos entonces
que un conjunto A es abierto si y solamente si es un entorno de cada uno de
sus puntos.
DEFINICIÓN 2.18. Diremos que una topologı́a en X es de Hausdorff si
separa puntos. Es decir, si cada vez que x, y ∈ X siendo x 6= y existen entornos
V y U que contienen a x y a y respectivamente con U ∩ V = ∅.
16 2. Rn COMO UN ESPACIO VECTORIAL

Nótese que no toda topologı́a satisface esta condición, por ejemplo la


formada sólo por el conjunto vacı́o y el total, nunca separa puntos. Es decir
que para tener esta propiedad la topologı́a debe ser suficientemente fina o
equivalentemente, tener una cantidad de conjuntos abiertos considerable.
DEFINICIÓN 2.19. Diremos que un punto x ∈ X es:
• Un punto interior a A ⊂ X si y solamente si, existe un entorno
abierto U x de x tal que U x ⊆ A. El conjunto de los puntos interiores
al subconjunto A es representado por A0 .
• Un punto frontera de A ⊂ X si y solamente si, para todo entorno
abierto U x de x se verifica que U x ∩ A 6= ∅ y U x ∩ Ac 6= ∅. El
conjunto de los puntos frontera de A se denomina frontera de A y lo
representaremos por f rA.
DEFINICIÓN 2.20. Llamaremos base de una topologı́a F en X, a una
subfamilia B de F tal que todo elemento U de F es unión de elementos de B .
Y llamaremos subbase de la topologı́a F en X a una subfamilia S de F tal
que la colección de todas las intersecciones finitas de elementos de S forman
una base para la topologı́a F .
DEFINICIÓN 2.21. Una base local en x, es una familia de entornos de x,
tal que todo entorno del punto, contiene un elemento de la familia.
Un espacio topológico, cumple con el llamado primer axioma de numera-
bilidad, si y solamente si, tiene una base numerable. Mientras que si existe una
base local numerable se dirá que verifica el segundo axioma de numerabilidad.

Los espacios que satisfacen el segundo axioma de numerabilidad juegan


un importante papel en la teorı́a económica. En [Debreu, G. (b)]) se demuestra
el siguiente teorema:
TEOREMA 2.22. Toda relación de preferencia continua, en un espacio
que satisface el segundo axioma de numerabilidad, es representable por una
función de utilidad continua.
Entendemos por relación de preferencias en un conjunto X un preorden
completo4, al que representaremos por . Decimos que el par (x, y) ∈  para x
e y en X si y solamente si, x es al menos tan bueno cuanto y, equivalentemente
escribimos x  y. Decimos que la preferencia es representable por una función
4Decimos que una relación binaria  es un preorden en X si  es transitiva y reflexiva.
El preorden es completo si dados dos elementos x e y en X se verifica que (x, y) ∈  o bien
(y, x) ∈ .
2.4. Rn COMO ESPACIO TOPOLÓGICO 17

de utilidad, es decir una función real con dominio en X el conjunto de consumo


de la economı́a u : X → R cuando x  y si y solamente si u(x) ≥ u(y).
Un factor muy importante, para el desarollo del análisis matemático es,
como veremos más adelante, luego de la definición de lı́mite de una sucesión,
que una topologı́a tenga suficientes abiertos como para separar puntos, ver
definición 2.18.
Topologı́as definidas a partir de métricas y normas: En un espacio
métrico (X, d) es posible definir una topologı́a a partir de la métrica, para esto
procedemos de la siguiente manera.
(1) Consideramos la familia de las bolas abiertas posibles de definir en
X con la métrica d
(2) Definimos la familia de abiertos de Rn como aquellos subconjuntos
A de X tales que para todo x ∈ A existe r > 0 tal que Br (x) ⊆ Rn .
(3) Decimos que esta topologı́a es generada por la métrica d.
DEFINICIÓN 2.23. Sea A ⊂ X, decimos que el conjunto A es denso en X
si en todo conjunto abierto U de X existe x ∈ A ∩ U.
DEFINICIÓN 2.24. Decimos que X es un conjunto separable si existe un
subconjunto A en X denso y numerable.
Por ejemplo con la topologı́a generada por la distancia habitual, (o cual-
quiera equivalente) el conjunto de los racionales es denso en R
EJERCICIO 2.25. Verifique que:
La familia de abiertos definidos como anteriormente forma una topologı́a.
El conjunto de las bolas abiertas con centro x ∈ X y radio r > 0 forman una
base local de esta topologı́a.
Consecuentemente, todo espacio métrico verifica el segundo axioma de nu-
merabilidad.
Si existe un conjunto denso numerable N ⊂ X entonces X verifica el primer
axioma de numerabilidad.
Es también posible definir una topologı́a en un espacio normado (X, N) a
partir de la norma N allı́ definida. Esta será la topologı́a definida por la norma.
Procedemos de la siguiente forma:
(1) Definimos las bolas abiertas de radio ǫ > O centradas en cero como
los subconjuntos de X
B0 (ǫ) = {y ∈ X : N(y) < ǫ }
(2) Consideramos como conjuntos abiertos en X a aquellos subconjuntos
A, tales que para todo x ∈ A, existe V x = x + B0 (ǫ) que verifica
18 2. Rn COMO UN ESPACIO VECTORIAL

la propiedad V x ⊆ A. Donde V x = {z ∈ X : z = x + y, y ∈ B0 (ǫ)}


define un entorno de x.
En el ejercicio anterior se demuestra que la familia de las bolas abiertas
Br (x0 ) ∀ x0 ∈ X, r ∈ R
definen una base de la topologı́a. Mientras que, a la vez, para cada x ∈ X, la
familia de bolas abiertas centradas en x, y representadas por Br (x0 ) r ∈ R,
define una base local de x. Se concluye entonces que los espacios métricos y,
consecuentemente, los normados satisfacen el primer axioma de numerabili-
dad.
NOTA 2.26. Todas las topologı́as en Rn generadas por normas, definen los
mismos abiertos5.
Esta afirmación resulta del hecho de que en Rn todas las normas son
equivalentes.
EJERCICIO 2.27. Demuestre que las topologı́as generadas por normas equi-
valentes, definen los mismos abiertos.
EJERCICIO 2.28. En R2 considere la métricas d2 , d3 y d definidas en el
ejercicio 2.7. Muestre que son métricas equivalentes y dibuje las correspon-
dientes B0 (r).
EJERCICIO 2.29. Verifique las siguientes afirmaciones:
(1) El conjunto vacı́o y el total son cerrados.
(2) Una unión finita de conjuntos cerrados es un conjunto cerrado.
(3) La intersección arbitraria de conjuntos cerrados es cerrada.
(4) Sea F = {∅, X } entonces (X, F ) es espacio topológico. La topologı́a
ası́ definida se llama trivial.
(5) Considere F como el conjunto de todos los puntos de X entonces
(X, F ) es espacio topológico. La topologı́a ası́ definida se llama
discreta.
Considere el espacio métrico (Rn , d), donde por d representaremos la
distancia euclidiana (o habitual). Consideremos la topologı́a formada por los
siguientes abiertos: un conjunto A es un abierto si y solamente si, para cada
punto x ∈ A existe una bola abierta de radio ǫ > 0 totalmente contenida en A.
5Existe un teorema que generaliza esta afirmación. El referido teorema dice que en Rn
toda las topologı́as lineales que son Hausdorff, definen los mismos abiertos. Este teorema se
encuentra en textos avanzados de topologı́a general, no obstante daremos en el apéndice I de la
sección (11.1) una demostración. Muestra que casi todas las topologı́as comúnmente usadas en
Rn son las mismas, lo que deja de ser válido en espacios de dimensión infinita.
2.4. Rn COMO ESPACIO TOPOLÓGICO 19

Decimos que esta es la topologı́a habitual. Toda topologı́a inducida por una
norma en Rn es, por lo anteriormente visto, equivalente a ésta. Por lo que todo
lo dicho con respecto esta topologı́a vale para cualquier otra que sea Hausdorff
y lineal en Rn .
EJERCICIO 2.30. Probar que si Y es un subconjunto de un espacio topológi-
co (X, F ) la colección FY de subconjuntos de Y definida por
FY = {V ∩ Y : V ∈ F}
es una topologı́a en Y.
La topologı́a formada de esta manera, se llama topologı́a relativa o indu-
cida por F en Y.
DEFINICIÓN 2.31. Sea f : X → Y una función definida en X con recorrido
en Y siendo X e Y espacios topológicos (X, τx ) y (Y, τy ). Decimos que f es
una función continua si y solamente si, la preimagen por f de todo abierto
en (Y, τy ) es un abierto en (X, τx ).
Es importante recordar las siguientes definiciones:
DEFINICIÓN 2.32. Sea (X, τ) espacio topológico y sea K ⊂ X.
(1) Decimos que x ∈ X es un punto de acumulación de K si y solamente
si, en todo entorno suyo hay un punto de K distinto de x.
(2) Llamaremos clausura de K al conjunto formado por la intersección
de todos los cerrados que lo contienen, notaremos a este conjunto
como K̄.
Muestre que la siguiente afirmación equivalente a la definición 2.23: El
conjunto A es denso en X si y solamente si, Ā = X.
TEOREMA 2.33. Un conjunto F ⊆ X es cerrado si y solamente si contiene
a todos sus puntos de acumulación.
Demostración: En efecto F es cerrado si y solamente si F = F̄. La clausura
de F es la unión de los puntos de F y sus puntos de acumulación, conjunto este
al que denotaremos por F ′ . Pero si A = A ∪ B entonces B ⊂ A luego F ′ ⊂ F. 
Si bien en este trabajo nos limitaremos a trabajar en Rn con la topologiı́a
habitual y las operaciones de suma y producto por escalar previamente defini-
das, es posible generalizar muchos de los resultados que aquı́ se presentan, al
caso más general de los llamados espacios vectoriales topológicos.
DEFINICIÓN 2.34. Un espacio vectorial X, en el que se define una topo-
logı́a τ, es llamado espacio vectorial topológico (abreviadamente e.v.t.), si se
verifican los siguientes dos axiomas:
20 2. Rn COMO UN ESPACIO VECTORIAL

(1) La función multiplicación por un escalar w : R × X → X definida


por w(λ, x) = λx y
(2) la función suma de vectores S : X × X → X definida por S (x, y) =
x + y,
son continuas respecto de las topologı́as producto Y ×τ y τ×τ respectivamente,
donde Y es la topologı́a definida en el cuerpo de los escalares. Estos espacios
se simbolizan generalmente por (X, +, ·).
En nuestro caso, el cuerpo de escalares R, será siempre el de los números
reales con la topologı́a habitual (es decir la generada a partir de los interva-
los abiertos).
En particular Rn con la topologı́a habitual y las operaciones de producto por
escalar y suma definidas en el inicio del capı́tulo, forma un espacio vectorial
topológico, el que se representa por (Rn , +, ·).

2.5. Sucesiones
Consideremos una función real x : N → R, cuyo dominio sea N el conjun-
to de números naturales. Llamamos sucesión al conjunto infinito de valores
x1 , x2 , . . . , xn , . . . que toma dicha función. Representamos a la sucesión por
su elemento genérico xn . Entendemos por subsucesión la composición de x
con una función f estrictamente creciente de N en N. Es decir yn es una
subsucesión de xn si yn = x f (n) para f como la descrita anteriormente.
DEFINICIÓN 2.35. Sucesión convergente en un espacio topológico De-
cimos que la sucesión xn definida en un espacio topológico, converge (o que
es una sucesión convergente) a x, lo que notaremos como xn → x, n → ∞, si
y solamente si para todo entorno abierto U x de x, existe n0 ∈ N tal que para
todo n ≥ n0 se verifica que xn ∈ U x .
Si una sucesión converge en un espacio topológico y la topologı́a separa
puntos, (definición 2.18), entonces el lı́mite es único. Consecuentemente la
sucesión xn ∈ X converge a x ∈ X si y solamente si x es el único punto de
acumulación de la sucesión.
DEFINICIÓN 2.36. Sucesión convergente en un espacio métrico Sea xn
una sucesión en un espacio métrico, decimos entonces que xn converge a x
si para todo ǫ > 0 existe n(ǫ) tal que si n ≥ n(ǫ) entonces d(xn , x) < ǫ.
Análogamente para espacios normados, diremos que xn → x, n → ∞ si y
solamente si: k xn − xk < ǫ, para todo n > n(ǫ).
2.6. CONJUNTOS COMPACTOS Y CONEXOS 21

DEFINICIÓN 2.37. Sucesión de Cauchy Decimos que una sucesión es de


Cauchy, si y solamente si, para todo ǫ > 0 existe n(ǫ) tal que si n, m ≥ n(ǫ)
entonces d(xn , xm ) < ǫ.
Decimos que un espacio es métrico completo, si y solamente si toda
sucesión de Cauchy es convergente en él. Ejemplo de espacio métrico completo
es el conjunto de los números reales. Rn con la métrica usual es un espacio
métrico completo. No es completo el conjunto de los racionales.
Se dice que un espacio normado completo es un espacio de Banach.
Mientras que es de Hilbert, un espacio vectorial en el que hay definido un
producto interno y que es a la vez, completo, respecto a la norma definida por
dicho producto.

2.6. Conjuntos compactos y conexos


A continuación haremos una breve introducción de los conceptos de compaci-
dad y conexidad. Entendemos que el lector tiene cierta familiaridad con estos
conceptos ası́ como con el continuidad de funciones.

S que una familia H de subconjuntos C de X es


DEFINICIÓN 2.38. Decimos
un cubrimiento de X, si X ⊂ C∈H C. Entendemos por subcubrimiento
S una
subfamilia G de H que también cubre a X, es decir que X ⊂ C∈G C.
El subcubrimiento se dirá finito, cuando la cardinalidad de G sea finita.
DEFINICIÓN 2.39. Decimos que K es un conjunto compacto si para todo
cubrimiento por abiertos de K, existe un subcubrimiento finito.
En Rn , decir que un conjunto es compacto, es equivalente a decir que es
acotado y cerrado, esto es el teorema de Heine-Borel, ver apéndice (11.3). Esta
propiedad no se mantiene necesariamente en espacios más generales que Rn
con la topologı́a usual. No obstante para espacios métricos vale la siguiente
definición, equivalente a la definición (2.39).
DEFINICIÓN 2.40. Un conjunto K es compacto si y solamente si toda
sucesión de elementos de K tiene una subsucesión convergente.
DEFINICIÓN 2.41. Decimos que K es un conjunto conexo si y solamente
si cada vez que K ⊂ A ∪ B siendo A y B abiertos en la topologı́a relativa, y
A ∩ B = ∅ entonces A = K y B = ∅ o bien B = K y A = ∅.
Obsérvese que X con la topologı́a τ es conexo si y solamente si los únicos
conjuntos de τ abiertos y cerrados a la vez, son el total y el vacı́o.
22 2. Rn COMO UN ESPACIO VECTORIAL

Puede probarse que en R los únicos conjuntos conexos son los intervalos6.
Si bien no equivalente a la anterior definición de conexidad, el concepto de
conexidad por caminos ayuda a entender la idea de conexión en general. Se
dice que un conjunto X es conexo por caminos cuando, dados dos puntos a y
b en X, existe un camino7 en el conjunto que los une. Si bien no todo conjunto
conexo de Rn es conexo por caminos8, es cierto que en Rn un conjunto abierto
es conexo si y solamente si es conexo por caminos. Ver [Lima, L.].
El siguiente concepto permitirá una caracterización muy utilizada de con-
juntos compactos.
DEFINICIÓN 2.42. Decimos que una familia F de subconjuntos de X tiene
la propiedad de intersección finita (PIF), si y solamente si, se verifica que
todo subconjunto finito de elementos de la familia F tiene intersección no
vacı́a.
Una importante aplicación de esta propiedad es el siguiente teorema:
TEOREMA 2.43. Sea (K, τ) espacio topológico, K es compacto si y sola-
mente si toda familia de cerrados con la PIF tiene intersección no vacı́a.
Demostración: Directo: Sea K compacto y sea τα α ∈ A una familia de
subconjuntos cerrados conS la PIF. Supongamos que la intersección es vacı́a. Por
lo tanto se verifica que α∈A τα = K. Por ser K compacto y τcα abiertos,
c existe
c = K.
S
una subfamilia
T F finita de elementos de A τ β , β ∈ F, tal que α∈F τα
Luego α∈F τα = ∅, lo que contradice que τα , α ∈ A tiene la PIF. Recı́proco:
Supongamos que toda familia de cerrados en K con la PIF tiene intersección
no vacı́a. Si K no es compacto, existe un cubrimiento de K, Aα ; α ∈ A de
que ninguna subfamilia finita F ⊂ A es un subcubrimiento
abiertos, tal S cde K,
es decir que α∈F Acα 6= ∅. Esto supone que ∀F ⊂ A, F finita, α∈F Aα 6= ∅.
T
Como Acα es una familia de cerrados con la PIF se sigue que la intersección
c
T
Sα∈A Aα 6= ∅, luego tomando complementos en ambos lados, se sigue que:
α∈A Aα 6= K lo que contradice la afirmación inicial. 

6Entendiendo por intervalo un subconjunto I de R formado por todos los puntos del
segmento de recta comprendidos entre dos reales dados. El intervalo será abierto, cerrado o
semiabierto, según contenga o no, a los extremos a y b, o a uno de ellos solamente. Obviamente,
si un subconjunto C de R no es un intervalo, existen números a < b en C y c ∈ C c tales que
a < c < b. Luego el conjunto C puede escribirse como unión de intervalos abiertos y disjuntos
(a, c) y (c, b) diferentes del vacı́o. Para el recı́proco ver por ejemplo [Lima, L.].
7Se entiende por camino en un espacio topológico X, una función f : I → X donde I es el
intervalo cerrado en [0, 1].
8Considere el subconjuto X ⊂ R2 , formado por la unión del grafo de f (x) = sin(1/x) y el
origen O = (0, 0) este conjunto es conexo, pero no es conexo por caminos.
2.7. APLICACIÓN 23

2.7. Aplicación
A partir de la caracterización de los conjuntos compactos como conjuntos en
los que se verifica que toda familia de subconjuntos cerrados con la PIF tiene
intersección no vacı́a, es posible demostrar la existencia de la demanda, con-
siderando consumidores con preferencias semicontinuas superiores, definidas
en Rl+ ver [Accinelli, E. (05)].
Recuerde que el problema central del consumidor es el de maximizar
sus preferencias en su restricción presupuestaria. Supongamos que en la eco-
nomı́a existen l bienes y sea Rl+ el conjunto de consumo. La llamada res-
tricción presupuestaria es un subconjunto del conjunto de consumo, con-
formado por aquellas cestas de bienes accesibles al consumidor dados los
precios y sus dotaciones iniciales. Representaremos a este subconjunto por:
RPw (p) = { x ∈ X : px ≤ pw}, donde p ∈ Rl+ es un vector cuyas coordenadas
representan los precios unitarios de los bienes y w ∈ R+l un vector que re-
presenta las dotaciones iniciales del consumidor. Eventualmente alguna de las
coordenadas de w puede ser nula, pero en este caso, nunca negativa. Como ya
fue dicho anteriormente, entendemos por preferencias un preorden completo
definido en el conjunto de consumo, es decir en un subconjunto X de un espacio
vectorial topológico, en este caso Rl+ y Rl respectivamente. Representaremos
la preferencia del consumidor (o preferencias) por . Si x e y ∈ X son tales
que x  y, decimos que x es al menos tan bueno cuanto y para el consumidor
en cuestión. Si x  y, y además y  x, diremos que el consumidor es indiferente
entre x y y. Mientras que el consumidor preferirá estrictamente x a y lo que
escribiremos como x ≻ y si x  y pero no se verifica y  x. Decimos que
la preferencia del consumidor, es semi-continua superiormente si el conjunto
C x = {y ∈ X : y  x} es cerrado. Si los precios son estrictamente positivos y
X = Rl+ entonces, la restricción presupuestaria es un subconjunto compacto de
Rl . Afirmamos que, entonces, existe al menos un elemento maximal m ∈ Rw (p)
para . Es decir que no existe x en la restricción presupuestaria, que verifica
que x  m. Llamaremos demanda del consumidor al conjunto de maximales
de  restringido a la restricción presupuestaria. En aquellos casos en que este
elemento exista y sea único, la demanda del consumidor será una función: la
función demanda. Dicha función, una vez que las preferencias del consumidor
están dadas, depende de los precios y de las dotaciones iniciales del agente.
Fijadas las dotaciones iniciales, la demanda será entonces, una función exclu-
siva de los precios de mercado. La suma de las demandas de todos los agentes
de la economı́a define la demanda agregada. Fijadas las preferencias y las do-
taciones iniciales de todos los agentes, esta función depende exclusivamente
24 2. Rn COMO UN ESPACIO VECTORIAL

de los precios y será, en esta forma, una herramienta importante para encontar
los equilibrios walrasianos de una economı́a9.
La existencia de la demanda sigue de considerar que A x = C x ∩ Rw (p)
es cerrado y acotado, y por lo tanto compacto. T Nótese que el conjunto de
los maximales para  en Rw (p) es igual a x∈Rw (p) A x . Por ser ésta, una
intersección de subconjuntos cerrados con la PIF en un compacto, es no vacı́a.

2.8. Continuidad de funciones


Introduciremos en esta sección algunas consideraciones sobre las funciones
continuas. Concepto que entendemos familiar al lector de este texto. Dedica-
remos un poco más de atención a los conceptos de semicontinuidad superior
e inferior, quizás menos conocidos por el lector. Los teoremas tratados en esta
sección tienen importantes aplicaciones no sólo en el campo de la matemática,
sino también en el de la economı́a. El primer teorema que consideraremos
afirma que la imagen de un conjunto compacto por una función continua es un
compacto y el segundo lo análogo para conjuntos conexos. Ambos son la base
para del teorema de Weierstrass, el que los economistas usan frecuentemente
en muchas de sus aplicaciones en las que afirman la existencia de la demanda,
como cesta maximizadora de las preferencias del consumidor, en su restricción
presupuestaria.
DEFINICIÓN 2.44. Se f : X → Y una función entre dos espacios topológi-
cos {X, τX } y {Y, τy }. Decimos que f es una función continua, si la preimagen
por f de un conjunto A abierto en Y, es a su vez, un conjunto B = f −1 (A)
abierto en X.
Obsérvese que el conjunto de funciones continuas entre dos conjuntos se
modifica con las topologı́as definidas en los espacios involucrados. Afortuna-
damente, las topologı́as generadas por normas equivalentes, son equivalentes,
es decir, contienen los mismos abiertos. Esto hace que en Rn el conjunto de
funciones continuas no cambie con la elección de la norma. Más aún, en Rn
son equivalentes todas las topologı́as lineales de Hausdorff, ver apéndice 1,
sección11.1.
Esta definición de continuidad es equivalente a la quizás más conocida
para el lector (usado corrientemente para funciones de Rn en Rn y generalizable
9Llamamos equilibrio walrasiano de una economı́a con n agentes y l bienes a un par
(z, p) ∈ Rln × Rl tal que, z = (x1 , . . . , xn ) donde P
xi ∈ Rl , i P
= 1, . . . , n representa la demanda
del i-ésimo agente a precios p y que verifica que ni=1 xi = ni=1 wi . Es decir que el exceso de
demanda se anula (los mercados se limpian), la demanda agregada iguala a la oferta agregada.
2.8. CONTINUIDAD DE FUNCIONES 25

para funciones entre espacios métricos), ver apéndice II, sección 11.2, que en
términos de epsilones y deltas, es la siguiente:
DEFINICIÓN 2.45. Sean (X, d x ) y (Y, dy ) espacios métricos. Una función
f : X → Y es continua en x0 ∈ X, si y solamente si, para todo ǫ > 0 existe
δ > 0 tal que, para todo x ∈ X que cumpla que d x (x, x0 ) < δ se verifica que,
dy ( f (x), f (x0 )) < ǫ. Se dice que f es continua en X, si es continua para todo
punto x ∈ X.
Dado que en espacios topológicos, la continuidad depende de la topologı́a
definida en él, la continuidad de una función en un espacio métrico, depende de
las métricas definidas en los espacios relacionados por la función. Por lo que el
conjunto de las funciones continuas entre dos espacios métricos, se modifica
si modificamos las métricas, obviamente siempre que estas modificaciones no
definan topologı́as equivalentes.
La definición de continuidad (2.45) es equivalente a la definición (2.44)
si consideramos a X e Y como espacios topológicos con la topologı́a inducida
por la métrica.
TEOREMA 2.46. Sean (X, τx ) e (Y, τy ) espacios topológicos. Sea f : K → Y
siendo K ⊂ X compacto y f continua. Entonces f (K) es compacto.
TEOREMA 2.47. Sean (X, τx ) e (Y, τy ) espacios topológicos. Sea f : K → Y
siendo K ⊂ X conexo f continua. Entonces f (K) es conexo.
Las demostraciones de estos teoremas se hacen por el absurdo, y las
suponemos conocidas por el lector. Pueden verse en [Lima, L.].
Es fácil convencerse de que cualquier función f : X → R es continua si
consideramos X como un espacio topológico con la topologı́a discreta, y a R
con la topologı́a habitual (es decir la definida por la distancia habitual). Mien-
tras que sólo las funciones constantes serán continuas si a X lo equipamos con
la topologı́a trivial. No obstante, topologı́as equivalentes generan las mismas
funciones continuas. En tanto que normas equivalentes generan topologı́as
equivalentes, el enunciado vale para normas equivalentes.
DEFINICIÓN 2.48. Extremos globales Considere f : X → R decimos que
x∗es un máximo global para f en X si y solamente si f (x∗ ) ≥ f (x) ∀ x ∈ X.
Analogamente, si x∗ ∈ X es tal que f (x∗ ) ≤ f (x) ∀ x ∈ X decimos entonces
que x∗ es un mı́nimo global10.

10El calificativo de global para los extremos es a los efectos de distinguirlo del concepto
de extremo relativo, que suponemos conocido por el lector.
26 2. Rn COMO UN ESPACIO VECTORIAL

Como consecuencia de los dos teoremas anteriormente mencionados, se


obtienen las siguientes propiedades para funciones reales y continuas expre-
sadas en los teoremas siguientes:

TEOREMA 2.49. (De Weierstrass) Sea (X, τx ) espacio topológico. Toda


función f real continua definida en un conjunto compacto K ⊂ X alcanza su
máximo (global) y su mı́nimo (global).

Demostración: Siendo f (K) compacto en R es acotado y cerrado. Con-


sidere entonces una sucesión f (xn ) convergente al supremo (s) de f . Como
K es compacto la sucesión { xn } tiene una subsucesión convergente. Sea esta
{ xni } y sea x su lı́mite. Por la continuidad de f la sucesión f (xni ) converge a
f (x) = s. 
Para demostrar que el ı́nfimo se alcanza repetimos la demostración anterior
pero para − f (x).

TEOREMA 2.50. (Del valor intermedio) Sea (X, τx ) un espacio topológi-


co. Sea f : D → Y función continua, D ⊂ X conexo. Sean y1 = f (x1 ) y
y2 = f (x2 ) = y2 donde y1 ≤ y2 siendo x1 y x2 puntos en D. Entonces para todo
y tal que y1 ≤ y ≤ y2 existe x ∈ D tal que f (x) = y.

Demostración: Es corolario del hecho de que funciones continuas trans-


forman conjuntos conexos en conexos y que los únicos conjuntos conexos en
R son los intervalos. 
En muchos problemas importantes de la teorı́a económica es posible reem-
plazar el supuesto de un comportamiento modelado por funciones continuas
por el más general representado por funciones semicontinuas. A continuación
definiremos los conceptos de semicontinuidad superior e inferior sin entrar en
detalles. No obstante mostraremos que la caracterización de los compactos por
la PIF, permite extender el teorema de Weierstrass a funciones semicontinuas
superiores y semicontinuas inferiores.

DEFINICIÓN 2.51. Funciones semicontinuas Sea f : X → R, siendo X un


espacio vectorial topológico.
• f es semicontinua superior en X si y solamente si, para todo c ∈ R,
el conjunto C = { x ∈ X : f (x) ≥ c} es cerrado en X.
• f es semicontinua inferior en X si y solamente si para todo c ∈ R, el
conjunto C = { x ∈ X : f (x) ≤ c} es cerrado en X.

El siguiente teorema caracteriza a las funciones semicontinuas y pue-


de encontrarse en cualquier texto de análisis. Recordamos que en términos de
2.8. CONTINUIDAD DE FUNCIONES 27

FIGURA 4. Semicontinuidades

sucesiones se tienen las siguientes definiciones:


lı́m inf f (xα ) = sup ı́nf f (xβ )
α α β≥α
mientras que:
lı́m sup f (xα ) = ı́nf sup f (xβ ).
α α β≥α

Equivalentemente en términos de entornos:


 
lı́m inf

f (x) = sup ı́nf { f (x) : x ∈ B x∗ (δ) ∩ X }
x→x δ>0
mientras que:
 
lı́m sup f (x) = ı́nf sup{ f (x) : x ∈ B x∗ (δ) ∩ X } .
x→x∗ δ>0

En la figura 4, se representan los dos tipos de funciones.


TEOREMA 2.52. Sea f : X → R X espacio vectorial topológico. Las
siguientes afirmaciones son equivalentes:
(1) f es semicontinua superior ( semicontinua inferior).
(2) lı́m supα f (xα ) ≤ (≥) f (x), cuando xα → x.
(3) Para cada ǫ > 0 existe δ > 0 tal que si x ∈ B x∗ (δ) ∩ X entonces
f (x) < f (x∗ ) + ǫ (resp. f (x) > f (x∗ ) − ǫ).
Este teorema admite una interpretación intuitiva: una función s.c.s. no tiene
saltos hacia abajo, mientras que una función s.c.i. no tiene saltos hacia arriba.
Esto debe ser interpretado cuidadosamente a la luz de diferentes ejemplos.
Demostración:
(3) → (1) Sea c = f (x∗ ) + ǫ, y sea Lc = { x ∈ X : f (x) < c}. Por (3) existe
B x∗ (δ) ⊂ Lc , luego C = (Lc )c es cerrado.
(1) → (3) Es inmediato.
28 2. Rn COMO UN ESPACIO VECTORIAL

(1) → (2) Sea z = lı́m supx→x∗ f (x), supongamos que no sea cierto que
lı́m supx→x∗ f (x) ≤ f (x∗ ). Existe entonces algún ǫ ∗ > 0 tal que
f (x∗ ) + 2ǫ ∗ < z :
(i) Si z = ∞ entonces por la definición de lı́mite superior, en toda
bola de centro x∗ y radio δ existe x tal que f (x) > f (x∗)+100,
luego no se cumplirı́a (3).
(ii) Si z ∈ R entonces en toda bola de centro x∗ y radio δ existe
xδ tal que f (xδ ) > z − ǫ ∗ lo que contradice (3).
(2) → (3) Como por (2) se verifica que f (x∗ ) ≥ lı́m sup x→x∗ f (x), por la
definición de lı́mite superior, se tiene que existe δ′ > 0 tal que para
todo 0 < δ < δ′ se verifica que

lı́m sup f (x) = sup { f (x) : x ∈ B x∗ (δ) ∩ X } < f (x∗ ) + ǫ.


x→x∗

Luego f (x) < f (x∗ ) + ǫ, ∀ x ∈ B x∗ (δ). 

EJERCICIO 2.53. Pruebe lo siguiente:


(i) Sea X el intervalo unidad en R y sea f : [0, 1] → R dada por

 0 0≤x<1
f (x) =
1 x = 1.

Es s.c.s. pero no s.c.i. en x = 1.


(ii) Como puede verse fácilmente, la suma de funciones s.c.s. (resp. s.c.i.)
es s.c.s. (resp. s.c.i.), pero no es cierta la afirmación análoga para el
producto.

El siguiente teorema muestra la existencia de máximos (resp. mı́nimos)


absolutos para funciones s.c.s. (resp. s.c.i.) definidas en compactos.

TEOREMA 2.54. (De Weirstrass para F.S.C) Sea f : K → R, donde


K es un subconjunto compacto de Rn , sea f semicontinua superior, (resp.
semicontinua inferior) entonces el conjunto de puntos donde f alcanza el
máximo (resp. mı́nimo) es no vacı́o y compacto.

Demostración: Sea c ∈ f (K), como f es s.c.s Fc = { x ∈ K : f (x) ≥ c} es


un subconjunto de K cerrado y por lo tanto compacto,
T y no vacı́o. La familia Fc
con c ∈ f (K), tiene la PIF, ver 2.42. Por lo tanto c∈ f (K) Fc 6= ∅, y compacto.
Obsérvese que si y ∈ K es un máximo para f es decir f (y) ≥ f (x) ∀ x ∈ X
entonces y ∈ ∩c∈ f (K) Fc y recı́procamente. 
2.9. APLICACIONES 29

2.9. Aplicaciones
¿Cómo encontrar extremos absolutos? El teorema de Weierstrass nos da
condiciones suficientes para la existencia de máximos y/o mı́nimos globales
o absolutos, para funciones reales restringidas a conjuntos compactos. No
obstante nada nos dice acerca de como hallar los puntos en los que estos valores
son alcanzados. Un posible camino para resolver este problema consiste en
encontrar candidatos y luego comparar entre ellos.
En el caso de funciones diferenciables en el interior de su dominio, (y por
lo tanto continuas) son candidatos a extremos globales:
(1) Aquellos puntos del interior del conjunto al que se restringe, donde
las derivadas se anulan y que son extremos relativos.
(2) Los puntos de la frontera de la restricción, en los que la función
(restringida a este subconjunto), alcanza sus valores extremos, entre
ellos: aquellos donde las derivadas de la función restringida se anulan
o aquellos donde no existe alguna de sus derivadas.
Luego entre estos candidatos elegimos aquellos en los que son alcanzados
los valores mayores o menores, estos serán respectivamente, los máximos y
mı́nimos absolutos.
Si hubiera puntos del interior del dominio, donde la función no es diferen-
ciable, estos deben agregarse a la lista de candidatos.
EJERCICIO 2.55. Considere la función f : R2 → R definida como f (x, y) =
xy2 − x.
(1) Justifique la existencia de extremos absolutos de la función restrin-
gida al conjunto
C = (x, y) ∈ R2 : −2 ≤ x ≤ 2; −3 ≤ y ≤ 3 .


(2) Encuentre los candidatos a extremos absolutos en el interior de C.


(3) Encuentre los candidatos a extremos absolutos para la función res-
tringida a la frontera de C, esto es considere lo casos f (2, y), f (−2, y),
f (x, 3), f (x, −3) y los vértices del cuadrado.
(4) Justifique que solamente estos puntos son candidatos a extremos
absolutos.
(5) Diga cuales son los puntos en los que los valores máximos y mı́nimos
absolutos se alcanzan.
Una aplicación a la teorı́a económica. Si bien en un caso más general
ya lo comprobamos, ver sección 2.7, una interesante aplicación a la economı́a
de este teorema es la demostración de que toda relación de preferencia 
representable por una función de utilidad semi-continua superiormente, tiene
30 2. Rn COMO UN ESPACIO VECTORIAL

elemento maximal. Una de las dificultades más importantes para caracterizar


los equilibrios walrasianos en economı́as con infinitos bienes, es decir en
economı́as cuyos conjuntos de consumo se modelan como subconjuntos de
espacios vectoriales de dimensión infinita, es precisamente el que un conjunto
puede ser acotado y cerrado sin ser compacto. De ahı́ que, aún con utilidades
continuas, no podamos garantizar la existencia de la solución del problema
del consumidor11, quedando descartada la posibilidad de estudiar los ceros de
la función exceso de demanda para caracterizar los equilibrios como hacemos
habitualmente, en el caso de economı́as finitas. Para un resumen de estos
resultados ver [Accinelli, E. (03)].
EJERCICIO 2.56. Considere una economı́a con dos bienes, con conjunto de
consumo X = R2+ . Las preferencias de un agente se encuentran representadas
1 1
por la función de utilidad, u : R2 → R definida como u(x, y) = x 2 + y 2 . El
ingreso del agente es I = 20.
(1) Suponga p = (2, 3). Muestre que la restricción presupuestaria es un
subconjunto compacto de R2 .
(2) Muestre que la frontera de la restricción presupuestaria es un sub-
conjunto cerrado de R2 .
(3) Muestre que la función de utilidad es continua.
(4) Concluya en la existencia de la función demanda, y muestre que es
un punto de la frontera.
(5) Calcule la demanda para esos precios e ingreso.
(6) Suponga ahora que p = (2, 0). Represente la restricción presupues-
taria, y muestre que no existe la demanda.
EJERCICIO 2.57. En una economı́a con l = 2 bienes, considere un agente
con preferencias representadas por un función de utilidad continua, y con do-
taciones iniciales w ∈ X siendo X = R2+ . Denominamos dotaciones inciales a
la cesta de bienes de que originalmente dispone el agente12. Dichas dotaciones
iniciales quedarán representadas por un vector w ∈ R2+ . El conjunto de con-
sumo, es el subconjunto de cestas posibles (no necesariamente adquiribles13)
por el consumidor, en este caso estas son las representadas por los vectores
x = (x1 , x2 ) tales que x1 ≥ 0, x2 ≥ 0. Sea p = (p1 , p2 ) el vector de precios
unitarios, asumimos que son estrictamente positivos, es decir p1 > 0, p2 > 0.
11En ciertos casos es posible restringir el conjunto de funciones de utilidad posibles,
exigiendo continuidad con respecto a topologı́as más débiles, o menos finas, que las generadas
por la norma, ver [Araujo, A. (85)].
12No discutimos su origen, simplemente asumimos su existencia.
13El concepto no hace referencia al valor de las cestas en él incluidas.
2.9. APLICACIONES 31

Consideremos x ∈ X e y ∈ X cestas en la restricción presupuestal del agente.


Representaremos a este subconjunto de X por RP y queda definido por la
desigualdad px ≤ pw. Por lo que
RP = { x ∈ X : px ≤ pw} ,
conjunto este, que representa al subconjunto del espacio de consumo, formado
por las cestas de bienes que el agente puede intercambiar por sus dotaciones
iniciales, y queda definido por los precios existentes en la economı́a y las
dotaciones iniciales (las que asumimos dadas) del agente. Por lo que si x ∈ RP
e y ∈ RP se cumplirá que además de estar en el espacio de consumo (el que
en nuestro caso es R2+ ), que su valor no será superior al de sus dotaciones
iniciales w, es decir que verificarán las desigualdades: px ≤ pw y py ≤ pw.
Supongamos ahora, que la cesta x le brinda al agente una utilidad u(x) y que la
cesta y le brinda una utilidad u(y) tal que u(x) < u(y). Muestre que, para todo
v ∈ R que verifica las desigualdades u(x) < v < u(y), existe una cesta z(v) en
la restricción presupuestaria (es decir que verifica pz(v) ≤ pw) y para la que
se cumple que u(z(v)) = v.
Capı́tulo 3
Conjuntos afines, y convexos

El estudio de los conjuntos convexos es una rama de la geo-


metrı́a, el análisis y el álgebra lineal, que tiene numerosas
conecciones con otras áreas de la matemática y permi-
te unificar muchos fenómenos matemáticos aparentemente
diferentes.
V. Klee.

Muchas de las consideraciones que haremos a continuación en Rn , con-


tinúan siendo válidas en general, en espacios vectoriales topológicos1. No
obstante, siguiendo el espı́ritu general de este libro, los resultados más impor-
tantes estarán referidos siempre a espacios vectoriales de dimensión finita (a
no ser que se diga lo contrario). Más aún, nos remitiremos siempre a Rn y toda
consideración sobre métrica será referida a la métrica euclidiana, ası́ también,
toda consideración topológica, a la topologı́a generada por esta métrica.
Los teoremas de separación de convexos, que demostraremos en este
capı́tulo, son de particular interés en economı́a y en toda la optimización en
general. En particular los usaremos para demostrar el teorema de Khun-Tucker.
Su generalización a espacios vectoriales topológicos es un corolario del llama-
do teorema de extensión Hahn Banach. El lector podrá encontrar una excelente
exposición de este teorema y sus corolarios en [Aliprantis, C.D.; Border, K.C.].
No obstante la aplicación de este teorema en economı́as más generales que las
llamadas economı́as con finitos bienes, es decir, a economı́as más generales que
aquellas cuyos conjuntos de consumo están definidos en espacios vectoriales
de dimensión finita, no siempre es inmediata. Un resumen de las dificultades
para realizar este tipo de generalizaciones puede verse en [Accinelli, E. (03)].
1Recordemos que un e.v.t. es un conjunto al que se les adjunta una estructura de espacio
vectorial necesaria para definir combinaciones lineales de sus elementos y una topologı́a lineal,
necesaria para definir entornos de sus puntos y tal que las operaciones de suma de vectores y
producto de vector por escalar sean continuas.

33
34 3. CONJUNTOS AFINES, Y CONVEXOS

3.1. Conjuntos afines


Si bien el tema central de esta sección es el de las propiedades de los conjuntos
convexos, comenzaremos con algunas consideraciones sobre conjuntos afines
y conos, necesarias para el análisis convexo. Un tratamiento desarrollado del
tema puede encontrarse en [Rockafellar, T.].
La definición que a continuación daremos, introduce notación necesaria
para esta y las siguientes secciones.
DEFINICIÓN 3.1. Se define la suma de dos conjuntos A y B de Rn como
el conjunto
C = A + B = {z ∈ Rn : z = x + y : x ∈ A, y ∈ B} .
Sea C un subconjunto de Rn y α ∈ R se define el conjunto producto
αC = {z ∈ Rn : z = αx, x ∈ C } .
La consideración de las propiedades que definen a los conos y conjunto afi-
nes, son como veremos, de gran importancia para el estudio de la optimización
convexa.
DEFINICIÓN 3.2. Un conjunto C es un cono si para cada x ∈ C y λ > 0 se
tiene que λx ∈ C.
DEFINICIÓN 3.3. Un conjunto A ⊂ Rn es llamado afı́n si cada vez que
x ∈ A e y ∈ A la lı́nea recta que los une λx + (1 − λ)y, λ ∈ R pertenece a A.
Puede verse fácilmente que un subespacio vectorial es un conjunto afı́n
cuya particularidad es que el cero pertenece al conjunto. Recı́procamente si A
es un conjunto afı́n y 0 ∈ A entonces A es un subespacio vectorial
DEFINICIÓN 3.4. Conjuntos paralelos Diremos que dos conjuntos afines
M y A son paralelos si existe a ∈ A tal que A + a = M.
Se verifica que si a y b pertenecen a A entonces A + a y A + b son paralelos.
De esta forma puede definirse la clase de equivalencia de todos los conjuntos
afines paralelos a uno dado.
Obsérvese que si A es un conjunto afı́n entonces
L = A − A = { x − y : x ∈ A, y ∈ A}
es un subespacio vectorial paralelo a A. A es paralelo a un único subespacio
L, A = x∗ + L, donde x∗ es un elemento arbitrario de A.2
2En efecto, si H y K son subespacios afines, entonces αH + βK es un espacio afı́n, para
cualesquiera α y β reales. En el caso 0 ∈ L por lo tanto L es un subespacio vectorial. Sea
3.1. CONJUNTOS AFINES 35

FIGURA 5. Sub-espacios e hiperplanos

DEFINICIÓN 3.5. Definimos la dimensión de un conjunto afı́n, como la


dimensión del único subespacio paralelo al conjunto. Un conjunto afı́n de Rn
de dimensión n − 1 es llamado un hiperplano . Ver figura 5.

Todo hiperplano define dos semiespacios E1 y E2 que serán llamados


cerrados o abiertos según contengan o no al hiperplano que los define.
Obsérvese que un hiperplano H en Rn queda determinado por un vector
p ∈ Rn , p 6= 0 y un real α siendo

H p,α = { x ∈ Rn : h p, xi = α} .

De esta manera quedarán determinados los semiespacios cerrados


E1 = { x ∈ Rn : h p, xi ≥ α} y E2 = { x ∈ Rn : h p, xi ≤ α}, los que serán lla-
mados abiertos si las desigualdades se reemplazan por desigualdades estrictas.
El hiperplano H es paralelo al subespacio vectorial

S = { x ∈ Rn : h p, xi = 0} ,

es inmediato verificar que H = x∗ + S siendo x∗ = α


hp,pi p.

x ∈ x∗ + L entonces x = x∗ + (y − z), y, z ∈ A. Como 21 x∗ + y ∈ A y además 12 x∗ − z ∈ A se


sigue que x ∈ A. Por lo tanto x∗ + L ⊂ A. Por otra parte, si x ∈ A entonces de que x − x∗ ∈ L
se sigue que x = x∗ + (x − x∗ ) ∈ x∗ + L es decir A ⊂ x∗ + L. 
36 3. CONJUNTOS AFINES, Y CONVEXOS

3.2. Conjuntos convexos


En general, todo el análisis convexo y en particular los conjunto convexos, jue-
gan un papel central en la optimización, y en especial en la teorı́a económica,
la que en gran medida, no es otra cosa que el arte de maximizar o minimi-
zar funciones cóncavas o convexas con restricciones convexas. Dedicaremos
esta sección precisamente al estudio de algunas propiedades de los conjunto
convexos.
DEFINICIÓN 3.6. Un subconjunto C de un espacio vectorial X se dice
convexo si
∀ x ∈ C, ∀y ∈ C y ∀t ∈ [0, 1] : tx + (1 − t)y ∈ C.
DEFINICIÓN 3.7. Decimos que x en una combinación convexa de elemen-
tos de C si
n
X Xn
x= ti xi siendo ti = 1,
i=1 i=1
para n ∈ N con xi ∈ C, y 0 ≤ ti ≤ 1; ∀i = 1, 2, . . . , n.
TEOREMA 3.8. Sea X un espacio vectorial topológico. Entonces C ⊂ X,
es convexo si y sólo si contiene todas las combinaciones convexas de C.
Demostración:
(i) La definición de conjunto convexo implica que si un conjunto con-
tiene todas sus combinaciones convexas entonces es convexo, pues
en particular contiene las de dos elementos.
(ii) Recı́procamente: Por ser C convexo entonces toda combinación con-
vexa de dos elementos de C está en C. Razonando por inducción
completa. Consideremos xi ∈ C; i = 1, 2, . . . , (n + 1), sea
n+1 n
X X ti
x= ti xi = t xi + (1 − t)xn+1
t
i=1 i=1

donde n+1 = ni=1 ti . Luego por la hiṕotesis


P P
i=1 ti = 1 y definamos tP
n ti
de inducción se sigue que y = i=1 t xi ∈ C. Finalmente, por la
convexidad asumida x = ty + (1 − t)xn+1 ∈ C.
DEFINICIÓN 3.9. Un conjunto C es un cono convexo si es un cono que
además verifica que cada vez que x, y ∈ C entonces x + y ∈ C.
Importantes ejemplos de conjuntos convexos son:
3.2. CONJUNTOS CONVEXOS 37

(1) Los semiespacios cerrados, es decir los conjuntos de la forma


{ x ∈ Rn : h x, bi ≤ β} , { x ∈ Rn : h x, bi ≥ β} ,
donde b ∈ Rn es un vector no nulo y β ∈ R. Si las desigualdades
son reemplazadas por desigualdades estrictas los semiespacios son
abiertos, y obviamente también son conjuntos convexos.
(2) Las conjuntos de la forma Br (x).
(3) Las rectas, los segmentos de recta, los planos.
Decimos que un subconjunto C de un espacio vectorial topológico es
estrictamente convexo, si y sólo si, para todo par de elementos x, e y de C y
para todo λ ∈ (0, 1) se verifica que, λx + (1 − λ)y ∈ C 0 .
LEMA 3.10. Sea X un espacio vectorial. Entonces las siguientes propie-
dades se verifican:
(1) La suma de conjuntos convexos es un conjunto convexo.
(2) Multiplicando un conjunto convexo por un escalar se obtiene un
conjunto convexo.
(3) C es convexo si y solamente si αC + βC = (α + β)C.
(4) La clausura y el interior de un convexo, son conjuntos convexos.
Para abreviar notación, en lo que sigue, representaremos por B la bola
abierta de centro 0 y radio 1.
Demostración: Probaremos solamente la segunda parte del último item.
Las afirmaciones restantes quedan como ejercicios. Sea C 0 el interior de C.
Considere z ∈ αC 0 + (1 − α)C 0 por lo que z = αx + (1 − α)y con x e y ∈ C 0 ,
por lo que existe ǫ tal que x + ǫB ∈ C y y + ǫB ∈ C donde B es la bola de
radio 1 y centro 0. La convexidad de B permite escribir αǫB + (1 − α)ǫB = ǫB.
Luego (α)[x + ǫB] + (1 − α)[y + ǫB] = z + ǫB ⊂ C 0 , por lo que z ∈ C 0 . Se tiene
que αC 0 + (1 − α)C 0 ⊂ C 0 luego C 0 es convexo. 
EJERCICIO 3.11. Pruebe que la clausura de un convexo es convexa3.
EJERCICIO 3.12. Muestre que la bola abierta de centro en x0 y radio r > 0
es convexa para toda métrica equivalente a la habitual. Mientras que lo mismo
no vale para S = { x ∈ Rn : d(x, x0 ) = 1}. Sugerencia: considere
P los casos
donde la métrica es la habitual y el caso en que d(x, x0 ) = i=1 | xi − x0i |.
EJERCICIO 3.13. Demuestre las siguientes afirmaciones:
3Sean x e y elementos de la clausura de C. Luego para todo ǫ > 0, existen x′ ∈ (x + ǫB) ∩C
e y′ ∈ y + ǫB ∩ C tales que por ser C convexo, su combinación convexa pertenece a C y además
αx′ + (1 − α)y′ ∈ αx + (1 − α)y + ǫB. Luego αx + (1 − α)y ∈ C̄. 
38 3. CONJUNTOS AFINES, Y CONVEXOS

(1) Si I es un conjunto de ı́ndices cualesquiera y {Ci } una colección


de conjuntos convexos de Rn entonces la intersección ∩i∈I Ci es un
conjunto convexo.
(2) Sean C1 y C2 conjuntos convexos de Rn , entonces
C = αC1 + βC2
es un conjunto convexo.
DEFINICIÓN 3.14. Dado un conjunto S ⊂ Rn no vacı́o, definimos la cápsu-
la convexa de S , a la cual denotaremos como co(S ), como la intersección de
todos los conjuntos convexos que contienen a S .
TEOREMA 3.15. La co(S ) es el conjunto de todas las combinaciones con-
vexas de S .
Demostración: Sea D el conjunto de todas las combinaciones convexas de
S , entonces S ⊆ D, siendo D convexo, entonces co(S ) ⊆ D. Recı́procamente,
sea y ∈ D por lo tanto y es una combinación convexa de elementos de S y por
lo tanto D ⊆ co(S ). 
TEOREMA 3.16. Para conjuntos convexos no vacı́os A1 , A2 , . . . , An en un
espacio vectorial topológico se verifica que
( n n
)
X X
co(∪Ai ) = λi xi, λi ≥ 0; xi ∈ Ai , λi = 1 .
i=1 i=1

En particular si cada Ai es compacto, entonces co(∪Ai ) es compacto.


Demostración: Sea x ∈ co(∪Ai ) entonces existen xi ∈ ∪i=1 Ai tales que x
es una combinación convexa de estos elementos. Es decir
m
X m
X
x= λi xi, λi = 1, λi ≥ 0, ∀ i = 1, 2, . . . , m.
i=1 i=1

Supongamos que la combinación convexa está compuesta por hi elementos


pertenecientes a Ai . Definamos ti igual a la suma de los hi coeficientes corres-
pondientes a los elementos de Ai . Escribamos x ubicando los elementos de
cada Ai uno a continuación de otro comenzando con los correspondientes al Ai
con menor i, sea este j. Llamemos a los elementos de j presentes en la combi-
nación convexa x1 , . . . , xh1 , donde h1 = h j , y reescribimos a t j como t1 . Sea k,
el segundo menor i presente en la combinación convexa, luego de reordenarlos
si fuera preciso, tendremos: xh1 +1 , . . . , xh2 donde h2 = h1 + hk renombramos
3.2. CONJUNTOS CONVEXOS 39

como t2 a tk . Continuamos de esta manera. Ası́ x puede escribirse entonces en


la forma:
h1 h2 hn
X αi X αi X αi
x = t1 + t2 + · · · + tn .
t1 t2 tn
i=1 i=h1 i=hn−1
Ph j
Obsérvese que i=h j−1 αt ji ∈ A j por ser combinación convexa de elementos de
A j y que nj=1 t j = 1, t j ≥ 0.
P
Finalmente para probar la compacidad de co(∪ni=1 Ai )Pdefinamos
f : A × A1 × · · · × An → P co(∪ni=1 Ai ) donde A = {λ ∈ Rn+ : ni=1 λi = 1}
tal que f (λ, x1 , x2 , . . . , xn ) = ni=1 λi xi . Es una función continua con dominio
compacto y por lo tanto por lo que co(∪ni=1 Ai ) es compacto. 
DEFINICIÓN 3.17. Diremos que m es la dimensión de un conjunto con-
vexo C ⊂ Rn si esta es la dimensión del menor subconjunto afı́n de Rn que
contiene a C, subconjunto al que denotaremos como a f f (C), afinidad de C.
Obsérvese que la dimensión de a f f (C) es a lo sumo n.
DEFINICIÓN 3.18. Se define como interior relativo de un conjunto con-
vexo X ⊆ Rn , que será denotado como riX, al interior de X en la topo-
logı́a relativa del menor subconjunto afı́n que contiene a X. Es decir riX =
{ x ∈ a f f (X) : ∃ǫ > 0, (x + B0 (ǫ)) ∩ (a f f (X)) ⊂ X }.
Si C es un subconjunto convexo de Rn entonces como fácilmente puede
comprobarse, la dimensión de C será n si y solamente si el interior de C
coincide con el interior relativo de C, es decir si y solamente si C 0 = riC.
El siguiente teorema es fundamental en lo referente a resultados de dimen-
sionalidad del análisis convexo. Dice que para conocer la cápsula convexa de
un subconjunto S ⊂ Rn es suficiente considerar combinaciones convexas
de no más de n + 1 elementos de S .
TEOREMA 3.19. (De Carathéodory) En un espacio vectorial de dimensión
n, todo vector en la cápsula convexa de un conjunto no vacı́o, puede escribirse
como la combinación convexa de a lo más n + 1 vectores de dicho conjunto.
Demostración: Sea S subconjunto de Rn . Supongamos que x ∈ co(S )
se escribe como combinación convexa Pk de menos de k elementos de S ,
siendo k > n + 1 sea x = i=1 αi xi . De esta forma el conjunto
V = { x2 − x1 , x3 − x1 , . . . , xk − x1 } es linealmente dependiente. Por lo tanto
existen λi , i = 1, 2, . . . , k no todos nulos tales que 0 = ki=2 λi (xi − x1 ). De
P

donde se sigue que 0 = i=2 λi xi − x1 i=2 λi . Sea c1 = − ki=2 λi , y sea


Pk Pk P

ci = λi i = 2, 3, . . . , k. Puede verse que ki=1 ci xi = 0 y que ki=1 ci = 0.


P P
40 3. CONJUNTOS AFINES, Y CONVEXOS

Sea c = min{ αcii : ci > 0}. Supongamos que c = αm /cm . Se sigue que
Pn
αi − cci ≥ 0, ∀i y además como Pn αm − ccm = 0 que i=1 αi − cci = 1.
Finalmente puede verse que x = i=1 (αi − cci)xi donde al menos un elemento
de la combinación convexa es cero, por lo que x puede escribirse con menos de
k elementos. Luego cada vez que k > n − 1 podemos obtener una combinación
convexa que exprese a x como una combinación convexa con al menos un
elemento menos. 

3.3. Teoremas de separación


Esta sección está dedicada al estudio de los teoremas de separación de conjun-
tos convexos. A partir de ellos, pueden realizarse un conjunto de importantes
aplicaciones de la microeconomı́a. Muchos de los teoremas más importantes
de esta teorı́a son en definitiva corolarios suyos. La extensión de los teo-
remas de separación a espacios más abstractos que Rn puede hacerse, pe-
ro con el cuidado de que sean conjuntos convexos con interior relativo no
vacı́o. En estos casos dichos teoremas de separación son corolario del teo-
rema de Hahn-Banach, ver por ejemplo [Brézis, H.], ası́ como la obra ya
citada [Aliprantis, C.D.; Border, K.C.]. Muchas de las dificultades de la teorı́a
económica modelada sobre espacios de dimensión infinita, radican precisa-
mente en la imposibilidad de extender estos teoremas a espacios vectoriales
de dimensión infinita. En particular, los conos positivos de estos espacios,
son conjuntos convexos los que en general tienen interior vacı́o. Hay excep-
ciones a esta regla, como ser el espacio de las funciones continuas definidas
en conjuntos compactos con la con la llamada norma uniforme, o el de las
funciones medibles con el supremo esencial acotado, ampliamente utilzado
en teorı́a del crecimiento económico, y en general en toda la optimización
dinámica y otras. No obstante, en otros casos (la mayorı́a), estos conos son
de interior vacı́o. El lector econtrará una amplia variedad de ejemplos de uno
y otro tipo en [Mas-Colell, A, and Zame, W.R.]. Los conos positivos de los
espacios vectoriales topológicos, juegan en la teorı́a económica un papel muy
importante, pues son ellos quienes, muchas veces, representan los conjuntos
de consumo de las economı́as modelados sobre dichos espacios . Se hace
entonces necesario utilizar y construir otras herramientas para poder extender
con éxito muchos de los teoremas más importantes de la optimización (y en
particular de la economı́a) a espacios vectoriales topológicos cualesquiera.
En [Araujo, A. and Monteiro P.K.(90)] se muestra la posibilidad de extender a
espacios vectoriales topológicos, teoremas como el de Khun-Tucker. Ası́ mis-
mo en [Mas-Colell, A. (86)] el lector interesado encontrará una construcción
3.3. TEOREMAS DE SEPARACIÓN 41

que en muchos casos, puede sustituir a los teoremas de separación, con es-
pecial interés para la teorı́a de las llamadas economı́as con infinitos bienes,
es decir economı́as cuyos espacios de consumo son subconjuntos de espacios
vectoriales topológicos de dimensión infinita.
TEOREMA 3.20. (De separación (1)) ( Sea X un conjunto convexo no vacı́o
de Rn . Sea x0 6∈ X̄. Entonces:
i) Existe un punto a ∈ X̄ tal que d(x0 , a) ≤ d(x0 , x) para todo x ∈ X̄,
con d(x0 , a) > 0. Aquı́ d(·, ·) : Rn × Rn → R+ representa la función
distancia definida en Rn .
ii) Existe un p ∈ Rn , p 6= 0, k pk < ∞ y un α ∈ R tal que
h p, xi ≥ α, ∀ x ∈ X̄ y ; h p, x0 i < α.
en otras palabras, X̄ y x0 están separados por el hiperplano
H = { x : h p, xi = α, x ∈ Rn }
Demostración:
(i) Sea B̄r (x0 ) una bola cerrada con centro en x0 y radio r > 0 tal
que la intersección con X̄ es no vacı́a. Sea A = B̄r (x0 ) ∩ X̄, este
conjunto es no vacı́o, cerrado y acotado, por lo tanto compacto4. Sea
d(x0 , ·) : A → R la función distancia. Es una función continua y por
ser A compacto, alcanza su mı́nimo en A (teorema de Weierstrass).
Esto es, existe a ∈ A tal que d(x0 , a) ≤ d(x0 , x) para todo x ∈ A y por
lo tanto para para todo x ∈ X̄. Como x0 6∈ X̄ entonces d(x0 , a) > 0.
(ii) Sea p ≡ a − x0 y α = h p, ai. Obsérvese que h p, x0 i = −k pk2 + α < α.
Sea x ∈ X̄ siendo X̄ convexo se sigue que x(t) = (1 − t)a + tx ∈ X̄.
Luego será d(x0 , a) ≤ d(x0 , x(t)). Esto es
k x0 − ak2 ≤ k x0 − [(1 − t)a + tx]k2 = k(1 − t)(a − x0 ) + t(x − x0 )k2 ,
siendo
k(1 − t)(a − x0 ) + t(x − x0 )k2 =
= h(1 − t)(a − x0 ) + t(x − x0 ) , (1 − t)(a − x0 ) + t(x − x0 )i
se sigue que:
k x0 − ak2 ≤ (1 − t)2 ka − x0 k2 + 2(1 − t)t(a − x0 )(x − x0 ) + t2 k x − x0 k2 .
De donde, 0 ≤ (t − 2)tka − x0 k2 +2(1 − t)t(a − x0)(x − x0 )+t2 k x − x0k2 .
Dividiendo por t, (t > 0) y tomando en la expresión obtenida el lı́mite
para t → 0 se obtiene que
0 ≤ −2ka − x0 k2 + 2(a − x0 )(x − x0 )
4Obsérvese que esta caraterización de los conjuntos compactos sólo vale en Rn .
42 3. CONJUNTOS AFINES, Y CONVEXOS

o equivalentemente 0 ≤ h(a − x0 ) , (a − x0 ) + (x − x0 )i. Finalmente


operando y siendo p = (a − x0 ) obtenemos que h p, ai ≤ h p, xi. 
COROLARIO 3.21. Sea X un conjunto convexo no vacı́o en Rn tal que
0 6∈ X̄. Entonces existe p ∈ Rn tal que p 6= 0, k pk < ∞, y un real α tal que:
h p, xi ≥ α > 0 ∀ x ∈ X̄.
TEOREMA 3.22. (De separación (2)) ( Sea X un conjunto convexo no vacı́o
en Rn y sea x0 6∈ riX. Entonces existe p ∈ Rn , p 6= 0, k pk < ∞, tal que
h p, xi ≥ h p, x0 i ∀ x ∈ X.
Demostración: Distinguimos dos casos.
(i) Si x0 6∈ X̄ entonces el teorema anterior prueba la afirmación.
(ii) Si x0 ∈ X̄, entonces para toda bola de radio r y centro en x0 existe un
punto que no pertenece a X̄. Es decir existe una sucesión de puntos
xq 6∈ X̄ convergente a x0 y una sucesión de pq tales que k pq k = 1
para los que se verifica que pq xq < pq x para todo x ∈ X̄. Como pq
pertenecen a la esfera unitaria la que es un conjunto compacto, existe
un punto lı́mite, sea este p. La continuidad del producto interno5
permite afirmar que h p, x0 i ≤ h p, xi para todo x ∈ X̄. 
TEOREMA 3.23. (De separación (3)) Sean X e Y conjuntos convexos no
vacı́os en Rn tales que riX ∩ riY = ∅. Entonces existe p ∈ Rn p 6= 0, k pk < ∞,
tal que
h p, yi ≤ α ≤ h p, xi; ∀y ∈ Y, ∀ x ∈ X.
Demostración: Consideremos el conjunto convexo S = X+(−Y). Entonces
0 6∈ riS pues en otro caso deberı́an existir x ∈ riX e y ∈ −riY tales que x = −y
lo que no puede suceder pues la intersección de ambos interiores relativos es
vacı́a. Escribamos z = x − y, por el teorema anterior existe p 6= 0 tal que
h p, zi ≥ h p, 0i para todo z ∈ S . Luego h p, xi ≥ h p, yi para todo x ∈ X e
y ∈ Y. Es decir in fx∈X h p, xi ≥ supy∈Y h p, yi. 
DEFINICIÓN 3.24. Decimos que un hiperplano H es un hiperplano so-
porte para un conjunto C si la clausura de C está contenida en unos de los
semiespacios cerrados que H determina.
En la figura 6 se representa un hiperplano soporte de un conjunto convexo.
Obsérvese entonces que el teorema de separación (2) establece que si
x∗ 6∈ ri(C) siendo C un conjunto convexo, entonces existe un hiperplano
5Esta propiedad del producto interno no es necesaria en espacios de dimensión infinita,
ver por ejemplo [Brézis, H.].
3.4. APLICACIÓN: CONJUNTOS DE PRODUCCIÓN 43

FIGURA 6. Hiperplano soporte

soporte para C que contiene a x∗ , particularmente si x∗ , es un elemento de la


frontera de C.

3.4. Aplicación: Conjuntos de producción


En teorı́a económica, la idea general de la producción se refiere al proceso
de transformación mediante el cual ciertos bienes (insumos) se convierten en
otros diferentes (productos). Para cada firma, un plan de producción consiste
en una especificación de insumos que se utilizarán para la creación de ciertos
productos. El conjunto de listas posibles (o planes de producción) depende de
la tecnologı́a disponible por la firma en cada momento y forma el conjunto
de producción o tecnológicamente factible. Este conjunto, al que representa-
remos por T , si bien se transforma con el tiempo, se supone que mantiene
algunas propiedades generales, por ejemplo T ⊂ Rl entendiendo que existen
en la sociedad l bienes diferentes, algunos serán insumos y otros productos,
dependiendo de la tecnologı́a existente y de la firma. En general, representa-
remos los planes de producción por vectores z ∈ T ⊂ Rl cuyas coordenadas
positivas representan la cantidad de productos y las negativas la cantidad de
insumos que se utilizarán para producir las cantidades indicadas de productos.
44 3. CONJUNTOS AFINES, Y CONVEXOS

Un plan z es posible si y solamente si z ∈ T . Además T se considera cerrado,


pues si la sucesión de planes zn ∈ T es posible entonces, su lı́mite debe ser
también un plan posible. Verifica además que T − Rl+ ⊆ T . Es decir que si
un cierto vector z̄ ∈ Rl representa un plan posible entonces cualquier z ≤ z̄
es también posible, definiendo z ≤ z̄ si y solamente si todas las coordenadas
de z son menores o iguales que todas las de z̄ es decir: z j ≤ z̄ j , ∀ j = 1, . . . , l.
Además T Rl+ = {0}, es decir, no pueden ser todos los elementos de la lista
T
productos, pues para producir algo, es necesario siempre, al menos un insumo.
Algunos supuestos económicos de importancia para la teorı́a de la firma, se
representan diciendo que el conjunto T es un conjunto convexo. Este supuesto
representa los llamados rendimientos decrecientes a escala. Para entender este
supuesto considere una firma que produce un único producto a partir de l − 1
insumos, supongamos que la cantidad máxima de producto que puede produ-
cir, a partir de las cantidades x = (x1 , . . . , xl−1 ) de insumos, representaremos
los planes posibles como el conjunto
T = (y, − x) : y ≤ f (x), y ≤ 0, x ∈ Rl+ ,


donde f : Rl−1 + → R representa la tecnologı́a disponble, f (x1 , . . . , xl−1 ) es


la máxima cantidad posible de producto que puede lograrse a partir de una
cesta de insumos definida por x = (x1 , . . . , xl ). Diremos que un plan (y − x)
es eficiente si se verifica que y = f (x). Se dice que la tecnologı́a presenta
rendimientos decrecientes a escala, si el conjunto T es convexo6, lo que puede
suponerse si la función f es cóncava. La intuición económica detrás del su-
puesto de rendimientos decrecientes a escala, es la de que un incremento en
los insumos produce incrementos decrecientes en el producto. Es decir que
si definimos φh (x) = f (x + h) − f (x) con h ∈ Rl−1 + fijo, se verificará que
φh (z) < φh (x) para z − x ∈ Rl−1
+ . Este supuesto permite encontrar una función
oferta para la firma, es decir un plan de producción que dados ciertos precios
P = (p, w) ∈ R+ × Rl−1 + para el producto y los insumos, le permite al produc-
tor, maximizar sus beneficios. Esto es resolver el problema de maximizar la
función de beneficios π(P) = py + wx con y ≤ f (x), x ≥ 0. Entonces, para
cada sistema o vector precios P existirá un plan eficiente, o lo que es lo mismo,
un plan eficiente que resuelve el problema de maximización antedicho, y que
se encuentra en la frontera del conjunto T . Este plan corresponde al punto
(x, f (x)) en el grafo de f , punto en el que existe un hiperplano de separación
del conjunto convexo P al que el vector de precios P es perpendicular. Como

6En [Mantel, R.] el lector interesado puede encontrar un modelo de economı́a con un
conjunto de tecnologı́a no convexo.
3.5. EJERCICIOS 45

FIGURA 7. Tecnologı́as convexas

veremos más adelante (sección (4.5)) si f es derivable en x, entonces existe


en este punto un único hiperplano de separación.
En la figura 7 se caracteriza en forma gráfica el conjunto de tecnologı́a
de una firma competitiva. Una función de producción cóncava, representa un
conjunto de planes posibles convexo. El lector interesado, puede encontrar por
ejemplo en [Mas-Colell et al] una descripción detallada de los conjuntos de
producción bajo el supuesto de convexidad. Por otra parte, un resumen de las
principales dificultades para el tratamiento matemático del tema cuando dicho
supuesto falla, puede encontrarse en [Brown, J.] y en [Mantel, R.].

3.5. Ejercicios
EJERCICIO 3.25. Verifique las siguientes afirmaciones:
(1) Un conjunto convexo, cerrado C es la intersección de todos los semi-
espacios que lo contienen. (Ayuda: use el teorema 3.20 de separación,
luego la intersección de todos los semi-espacios que contienen a C
no podrá tener puntos que no sean de C).
46 3. CONJUNTOS AFINES, Y CONVEXOS

(2) Sea S un subconjunto cualquiera de Rn muestre que la cápsula con-


vexa de S es igual a la intersección de todos los semiespacios que
contienen a S .
EJERCICIO 3.26. Sea S convexo en X espacio vectorial topológico. Un
vector x ∈ X se dice del interior algebraico de S si para todo z ∈ X existe
αz > 0 tal que
(1 − α)x + αz ∈ S ∀ 0 ≤ α ≤ αy .
Denotaremos a este conjunto por ali(S ).
Sea S un conjunto convexo no vacı́o en Rn Demuestre que:
(1) ri(S ) 6= ∅
(2) ali(S ) 6= ∅ si y solanmente si a f f (S ) = Rn
DEFINICIÓN 3.27. Tipos de separación
• Decimos que el hiperplano H p,α separa dos conjuntos A y B, si
A ⊆ { x ∈ Rn : h p, xi ≤ α} y B ⊆ { x ∈ Rn : h p, xi ≥ α} .
• Decimos que el hiperplano H p,α separa estrictamente dos conjuntos
A y B, si
A ⊆ { x ∈ Rn : h p, xi < α} y B ⊆ { x ∈ Rn : h p, xi > α} .
• Decimos que el hiperplano H p,α separa fuertemente dos conjuntos
A y B, si
A ⊆ { x ∈ Rn : h p, xi ≤ α} y B ⊆ { x ∈ Rn : h p, xi ≥ α + ǫ } .
EJEMPLO 3.28. En el espacio vectorial R2 , definimos los siguientes con-
juntos:
A1 =  {(x, y) : y > 0; o bien
(y = 0, x > 0)}, y B1 = −A1 , ası́ como
A2 = (x, y) : x > 0, y ≥ 1x y B2 (x, y) : x > 0, y ≤ − 1x . Entonces el hi-
perplano y = 0 separa A1 y B1 y separa estrictamente a A2 y B2 . No obstante
los conjuntos A1 y B1 no pueden ser estrictamente separados, y A2 no puede
ser fuertemente separado de B2 .
EJERCICIO 3.29. Considere el hiperplano H en Rn definido por
(p, α) ∈ Rn × R. Muestre que los conjuntos Xα = { x ∈ Rn : px ≤ α} y
X α = { x ∈ Rn : px ≥ α} son convexos.
DEFINICIÓN 3.30. Un poliedro en un espacio vectorial toplógico, es la
intersección finita de semiespacios cerrados. Es decir un poliedro es la solución
de un sistema finito de inecuaciones en X.
En la figura 8 se representa un poliedro como intersección de semiespacios
definidos por 3 hiperplanos.
3.5. EJERCICIOS 47

FIGURA 8. Un poliedro es la intersección de hiperplanos

EJERCICIO 3.31. Muestre que conjunto


\
X = x ∈ R2+ : px ≤ pw x ∈ R2+ : qx ≤ qh


donde p, q, w y h son vectores dados en R2 forma un poliedro convexo. Dibuje


el poliedro correspondiente a cada uno de los casos p = q y p 6= q.
EJERCICIO 3.32. Considere una economı́a con l bienes y n agentes, cada
uno con dotaciones iniciales wi y utilidades ui , i = 1, . . . , n. Sea Rl+ el conjunto
de consumo y sea P ∈ Rl+ el vector de precios. Muestre que la restricción
presupuestaria, de cada agente de la economı́a, es un conjunto convexo, y que
también lo es, el conjunto de las cestas de bienes en el espacio de consumo,
que verifican la igualdad px = pwi , para cada i = 1, . . . , n.
Capı́tulo 4
Funciones cóncavas y cuasi-cóncavas

Me parece que la noción de función convexa es tan fun-


damental como la de función positiva o creciente. Si no
me equivoco en esto, la noción encontrará su lugar en las
exposiciones elementales de la teorı́a de funciones reales.
J.V. Jensen.

Dado que uno de los problemas principales para los economistas es el


de resolver programas de optimización no lineales donde la función objetivo
es cóncava o cuasi-cóncava, y las restricciones se representan por conjuntos
convexos, dedicaremos esta sección a analizar algunas de las principales ca-
racterı́sticas de este tipo de funciones y conjuntos. Muchas de éstas no se
encuentran en los textos clásicos de análisis, los que en el mejor de los casos
analizan las funciones cóncavas o convexas diferenciables y generalmente al
final de un capı́tulo dedicado al lagrangiano por ejemplo, o en un apéndice. La
cuasi-concavidad queda totalmente a cargo de los economistas matemáticos y
en general a apéndices de libros dedicados al equilibro general o publicaciones
en revistas especializadas. Un texto clásico de análisis funcional, especialmen-
te recomendado a los economistas, pues obtiene muchos resultados propios
del análisis funcional, a partir del estudio de las propiedades de las funciones
cóncavas, es [Brézis, H.].
Muchas de las definiciones y propiedades que analizaremos en este capı́tu-
lo, propias de las funciones cóncavas, convexas, cuasi-cóncavas, etc, con do-
minio en subconjuntos de Rn , pueden extenderse a funciones definidas en
subconjuntos convexos de espacios vectoriales topológicos generales. No obs-
tante centraremos nuestra atención en Rn equipado con la topologı́a habitual,
espacio este, que representa un caso particular de espacio vectorial topológico.
La importancia de las funciones cuasi-cóncavas en economı́a radica en
que ellas representan preferencias convexas, es decir, el gusto de los agentes
económicos por la diversidad. Por su parte, las funciones convexas representan
costos con rendimientos decrecientes a escala, hecho este que caracteriza a las
49
50 4. FUNCIONES CÓNCAVAS Y CUASI-CÓNCAVAS

firmas competitivas. Una propiedad de gran utilidad para la teorı́a económica,


pero en la que no ahondaremos, es el hecho de que el conjunto de funcio-
nes cuasi-cóncavas y semi-continuas superiores, no se modifica al utilizar
topologı́as equivalentes1 lo que hace que en Rn este conjunto funcional, sea
prácticamente independiente de la topologı́a elegida, al interesado lo referimos
a [Aliprantis, C.D.; Brown, D.J.; Burkinshaw, O.] por ejemplo.
NOTA 4.1. En este capı́tulo, trabajaremos con funciones reales definidas
f : X → R definidas en subconjuntos convexos de Rn , no obstante la mayorı́a
de las definiciones, en particular las relacionadas a la concavidad o convexidad
de dichas funciones, continúan siendo válidas si en lugar de Rn consideramos
en espacio vectorial topológico cualquiera. El lector puede intentar hacer esta
traducción, sustituyendo Rn por E .
DEFINICIÓN 4.2. Funciones cóncavas Sea f una función real definida en
X subconjunto convexo de Rn . La función f es llamada cóncava si, para todo
x, y ∈ X, y 0 ≤ θ ≤ 1,
f (θx + (1 − θ)y) ≥ θ f (x) + (1 − θ) f (y)
Una función real definida en X subconjunto de Rn se dice convexa si − f es
cóncava.
DEFINICIÓN 4.3. Una función afı́n es una función f : X → R finita, a la
vez cóncava y convexa. Observe que f puede ser escrita como la suma de una
función lineal l : X → R y una constante c, f (x) = l(x) + c.
Si las desigualdades son estrictas, la función se dice que es estrictamente
cóncava. Una función f es llamada estrictamente convexa si − f es estricta-
mente cóncava.
En la figura 9 se representa una función estrictamente cóncava, mostrando
que el gráfico de dicha función, entre los puntos (x, f (x)) y (y, f (y)) queda por
encima de la cuerda que une dichos puntos.
NOTA 4.4. Intuitivamente f es cóncava si la cuerda que une dos puntos de
su gráfica cae bajo la función. Esta afirmación, puede demostrarse fácilmente
a partir de la definición de función cóncava y de la ecuación de la cuerda que
une dos puntos (a, f (a)) y (b, f (b)) en el grafo (x, f (x)) de la función cóncava.
Un concepto que generaliza al de funciones cóncavidad es el de funcio-
nes cuasi-cóncavas, estas son de gran importancia en la teorı́a ecomómica
1Más aún, esta afirmación continúa siendo válidas en espacios vectoriales topológicos
equipados con topologı́as compatibles con la de la norma, es deir aquellas que definen los
mismos espacios duales, ver [Aliprantis, C.D.; Border, K.C.].
4. FUNCIONES CÓNCAVAS Y CUASI-CÓNCAVAS 51

FIGURA 9. Una función estrictamente cóncava

por representar preferencias convexas. Es decir que si una relación de pre-


ferencia convexa es representable por una función de utilidad, entonces ésta
es cuasi-cóncava y recı́procamente. El concepto de función cuasi-cóncava
será desarrollado en la sección 4.6.
DEFINICIÓN 4.5. Decimos que f : X → R, siendo X un subconjunto
convexo de Rn es cuasi-cóncava, si
f (αx + (1 − α)y) ≥ min { f (x), f (y)} , 0 ≤ α ≤ 1.
La función f es cuasiconvexa si y solamente si − f es cuasi-cóncava.
Se sigue de la definición de cuasiconvexidad que f es cuasi-convexa si y
solamente si f (αx + (1 − α)y) ≤ max { f (x), f (y)} , 0 ≤ α ≤ 1.
DEFINICIÓN 4.6. Sea X un subconjunto convexo de Rn y f : X → R, se
definen los siguientes conjuntos:
El subgrafo de f como el subconjunto sug f ⊂ Rn × R
sug f = {(x, λ) ∈ X × R : λ ≤ f (x)} .
El epı́grafo de f como el subconjunto epi f ⊂ Rn × R
epi f = {(x, λ) ∈ X × R : λ ≥ f (x)} .
Ver figura 10.
52 4. FUNCIONES CÓNCAVAS Y CUASI-CÓNCAVAS

FIGURA 10. Epı́grafo de una función convexa

Algunas propiedades de las funciones cóncavas que se deducen de la


definición en forma inmediata son:
(1) Se verifica la siguiente desigualdad: f ( ni=1 αi xi ) ≥ ni=1 αi f (xi ).
P P
Es decir que el valor que toma una función cóncava en una combi-
nación convexa de elementos de su dominio, es mayor o igual que la
combinación convexa de los respectivos valores.
(2) El subgrafo de de una función cóncava, es un subconjunto convexo
de Rn × R.
(3) El epı́grafo de una función convexa, f : X → R siendo X ⊂ Rn
convexo, es un subconjunto convexo de Rn × R.
(4) Una combinación lineal no negativa, de funciones cóncavas ( res-
pectivamente convexas), definidas en un conjunto convexo, es una
función cóncava (resp. convexa).
(5) Toda función cóncava es cuasi-cóncava, pero el recı́proco no es cierto.
Demuestre que una función real, convexa puede ser cuasi-cóncava.
Dada una función f : S → R con S ⊂ Rn se puede siempre prolongar a
una función g : Rn → R̄ donde R̄ es el conjunto de los reales ampliado con los
valores ±∞ definida por:
(
f (x) si x ∈ S
g(x) =
∞ si x 6∈ S
4. FUNCIONES CÓNCAVAS Y CUASI-CÓNCAVAS 53

En muchos casos se define el concepto de función cóncava o convexa


permitiendo que el recorrido de la función tome valores en el conjunto de los
reales ampliado R̄ = R ∪ {−∞ + ∞}. En este caso, funciones tales como


 −∞ | x| < 1,

f (x) = 0 | x| = 1,


 ∞ | x| > 1
representan funciones convexas, pues su epı́grafo es convexo. No obstante
obsérvese que nuestra definición de convexidad tendrı́a problemas técnicos.
Funciones de este tipo son llamadas impropias. La definición general de fun-
ción cóncava que abarque también estos casos serı́a la siguiente:
DEFINICIÓN 4.7. Una función f : X → R̄, X ⊂ Rn convexo, es convexa,
si y solamente si su epı́grafo es convexo.
EJERCICIO 4.8. Muestre que si una función verifica la definción de conve-
xidad dada anteriormente entonces verifica esta última.
DEFINICIÓN 4.9. Sea X ⊂ Rn convexo. Una función f : X → R convexa
se dice propia cuando su epı́grafo es no vacı́o y no contiene rectas verticales,
esto es f (x) < +∞ para al menos un x y f (x) > −∞ para todo x ∈ X.
El subconjunto { x ∈ X : f (x) < ∞} es llamado dominio efectivo. De esta
manera una función convexa definida en un conjunto C no vacı́o puede ser visto
como una función convexa definida en todo x ∈ Rn , cuyo dominio efectivo es
C. Las razones que llevan a considerar el recorrido de f como un subconjunto
de los reales ampliado R̄ = [−∞, ∞] son de orden técnico y nosotros no
entraremos mayormente en ellos aquı́, aunque en algunos casos se definirán
funciones que toman valores infinitos, como el caso de la función indicadora.
En general el dominio de f coincidirá con su dominio efectivo, a menos que
digamos lo contrario. Para detalles ver [Rockafellar, T.].
Hay algunas relaciones entre funciones convexas y conjuntos convexos.
Una asociación muy simple la determina la función δ(·/C) : C → R̄ indicadora
de un conjunto convexo C :
(
0 si x ∈ C
(2) δ(x/C) =
+∞ si x 6∈ C.
El epı́grafo de la función indicadora de un conjunto C es un semi-cilindro
con sección C. Claramente δ(·/C) es una función convexa en Rn .
54 4. FUNCIONES CÓNCAVAS Y CUASI-CÓNCAVAS

Considere las funciones cóncavas g j : X →, j = 1, 2, . . . , m. Entonces el


conjunto
n
\
C= { x : x ∈ X : g j (x) ≥ 0}
j=1

es convexo. (La justificación de la afirmación queda a cargo del lector).


El lector familiarizado, relacionará este conjunto con el conjunto factible,
en los que un consumidor elige su cesta más preferida, o un productor elige su
plan maximizador de los beneficios.

EJERCICIO 4.10. Reescriba las anteriores definiciones de funciones con-


vexas propias y dominio efectivo, para funciones cóncavas.

EJERCICIO 4.11. Sea u : X → R la función de utilidad de un consumidor,


y X su conjunto de consumo, el que suponemos convexo. Muestre que si u es
cóncava, entonces S x = {y ∈ X : u(y) ≥ u(x)} es convexo. Es decir que toda
función de utilidad cóncava representa preferencias convexas, como veremos,
el recı́proco no es cierto. No obstante es cierto para el funciones cuasi-cócavas.

4.1. Aplicación
En teorı́a de la inversión bajo incertidumbre, consumidores adversos al riesgo
se reprepresentan como agentes cuyas funciones de utilidad son cóncavas,
mientras que, aquellos que son propensos al riesgo, presentan utilidades con-
vexas.
La explicación de esta analogı́a está en las propiedades de las referidas
funciones. Decir que un consumidor es adverso al riesgo, equivale a decir
que en un juego de azar prefiere quedarse con el valor esperado del juego a
participar en él, mientras que el propenso al riesgo prefiere participar del juego.
En efecto, supongamos un juego en el que el participante con probabilidad
p gana una cantidad w, mientras que con probabilidad (1 − p) pierde una
cierta cantidad l. Supongamos que la utilidad se representa por una función
creciente u de esta forma la utilidad esperada del agente U j , por participar en
el juego estará dada por: u(w)p + u(h)(1 − p) = U j . Mientras que de obtener el
valor esperado del beneficio el agente obtendrá una utilidad u(wp + (1 − p)l).
Obtenga las conclusiones a partir de considerar u cóncava y luego u convexa.
Note además que si el juego es justo, para el agente con utilidad cóncava, su
mejor elección será no participar del juego.
4.2. FUNCIONES CÓNCAVAS DE VARIABLE REAL 55

4.2. Funciones cóncavas de variable real


Presentaremos a continuación algunas propiedades para funciones cóncavas
reales de variable real.
TEOREMA 4.12. Si f : I → R es cóncava y si f (t) < ∞ para todo t ∈ I
donde I es un intervalo en R, entonces f es continua y existen las derivadas
laterales en el interior de su dominio y se tiene
f (t) − f (s)
f−′ (s) ≥ f+′ (s) ≥ ≥ f−′ (t) ≥ f+′ (t)
t−s
para todo s y para todo t en el interior del dominio de f tal que s ≤ t.
Demostración (intuitiva) de la continuidad: Consideremos a < s < x <
y < t < b, representemos por X al punto (x, f (x)) análogamente en los demás
casos. El punto X queda por encima de la recta que S Y mientras que el punto
Y queda por encima de la recta XT . Cuando y → x entonces f (y) → f (x).
Con los lı́mites por la izquierda procedemos de igual forma. 
Demostración: (Formal). Considere a < b < c pertenecientes al interior
del dominio de f . Sea h ∈ R tal que: b = (1 − h)a + hc. Usando la concavidad
de f se obtiene que
f (b) − f (a) f (c) − f (a)
(3) ≥ .
b−a c−a
Análogamente, sea k tal que b = ka + (1 − k)c. Se obtiene entonces que
f (c) − f (a) f (c) − f (b)
(4) ≥ .
c−a c−b
Entonces vale la siguiente cadena de desigualdades:
f (b) − f (a) f (c) − f (a) f (c) − f (b)
(5) ≥ ≥ .
b−a c−a c−b
Sea 0 ≤ α ≤ β; entonces para t perteneciente al interior del dominio de
f , t − β < t − α < t < t + α < t + β y la cadena de desigualdades (4 ) implican
que:
f (t) − f (t − β) f (t) − f (t − α) f (t + α) − f (t) f (t + β) − f (t)
≥ ≥ ≥ .
β α α β
Puede verse que la función x → f (t+x)−x
f (t)
es una función no decreciente
cuando x ↓ 0 y que además está acotada por arriba, por lo que existe f+′ (t).
+

Similarmente la función x → f (t)− xf (t−x) es una función no creciente


cuando x ↓ 0+ y que además está acotada por abajo, por lo que existe f−′ (t).
56 4. FUNCIONES CÓNCAVAS Y CUASI-CÓNCAVAS

Más aún, para x > 0 y t1 < t2 en el interior del dominio de f se tiene que:
f (t1 + x) − f (t1 ) f (t2 ) − f (t2 − x)
f+′ (t1 ) ≥ y f−′ (t2 ) ≤ .
x x
Considerando: x = t2 − t1 se obtiene:
f (t2 ) − f (t1 )
f+′ (t1 ) ≥ ≥ f−′ (t2 ).
x
Finalmente de la desigualdad f (t)− xf (t−x) ≥ f (t+x)−
x
f (t)
, ∀ x > 0, tomando
′ ′
lı́mites cuando x → 0 se sigue que f− (t) ≥ f+ (t). 
TEOREMA 4.13. Si f : I → R es diferenciable en I. Una condición
necesaria y suficiente para que f sea cóncava en I es que f ′ sea decreciente
en I.
Demostración: El directo es una consecuencia inmediata del teorema an-
terior.
Recı́procamente: Sea a ≤ b ≤ c. Por el teorema del valor medio sabemos que
existen x1 ∈ (a, b) y x2 ∈ (b, c) tales que:
f (b) − f (a) f (c) − f (b)
f ′ (x1 ) = y f ′ (x2 ) = .
b−a c−a
Por ser la derivada decreciente se concluye que:
f (b) − f (a) f (c) − f (b)
(6) ≥ .
b−a c−a
a−b
Luego haciendo b = αa + (1 − α)c, sustituyendo en (6) y dado que α = a−c se
llega a que f (αa + (1 − α)c) ≥ α f (a) + (1 − α) f (c). 
COROLARIO 4.14. Si f : I → R admite derivada segunda en I. Una
condición necesaria y suficiente para que f sea cóncava en I es que f ′′ (x) ≤ 0
∀ x ∈ I.
Demostración: Ejercicio para el lector. 
NOTA 4.15. Si f es tal que f ′′ es negativa (respectivamente positiva)
en I entonces f es estrictamente cóncava (respectivamente convexa) en I.
No obstante puede una función ser estrictamente cóncava (respectivamente
convexa) en un intervalo y la derivada anularse en algún punto del mismo.
Caso f (x) = x4 .
La figura 11, ilustra algunas propiedades de las funciones cóncavas. Re-
presente el lector el mismo esquema para funciones convexas.
4.3. FUNCIONES CÓNCAVAS DE n VARIABLES. 57

FIGURA 11. La recta tangente de una función cóncava

4.3. Funciones cóncavas de n variables.


A continuación presentaremos algunas propiedades de continuidad verificadas
por las funciones cóncavas y convexas.
EJERCICIO 4.16. Los siguientes dos teoremas serán enunciados y demos-
trados para funciones convexas, definidas en subconjuntos convexos de Rn ,
no obstante las demostraciones son válidas en espacio vectoriales topológi-
cos cualesqueira. Enuncie y demuestre los teoremas correspondientes para
funciones cóncavas.
TEOREMA 4.17. (De continuidad local) Si una función f convexa está de-
finida en X subconjunto convexo de Rn y está acotada superiormente en un
entorno V x ∩ X de un punto x ∈ ri(X) , entonces es continua en el punto.
Demostración: Sea Br (0) la bola con centro en cero y radio r tal que para
z ∈ Br (0) : x − z ∈ V x . Para δ ∈ [0, 1], x + δz = (1 − δ)x + δ(x + z), se tiene
que f (x + δz) ≤ (1 − δ) f (x) + δ f (x + z). Por lo tanto
(7) f (x + δz) − f (x) ≤ δ[ f (x + z) − f (x)].
Cambiando z por −z obtenemos:
(8) f (x − δz) − f (x) ≤ δ[ f (x − z) − f (x)].
Como x = 21 (x + δz) + 21 (x − δz) se sigue que f (x) ≤ 21 f (x + δz) − 21 f (x − δz).
Multiplicando por 2, la expresión anterior, operando a partir de las ecuaciones
(7) y (8) se obtiene:
(9) f (x) − f (x + δz) ≤ f (x − δz) − f (x) ≤ δ[ f (x − z) − f (x)].
58 4. FUNCIONES CÓNCAVAS Y CUASI-CÓNCAVAS

A partir de (7) y (8) se obtiene:


(10) | f (x + δz) − f (x)| ≤ δmax { f (x − z) − f (x), f (x + z) − f (x)} .
Luego, usando el hecho de que f está acotada por arriba en un entorno de x
se sigue para δ suficientemente pequeño: | f (x + δz) − f (x)| ≤ δM. Luego,
para todo y ∈ x + δBr (0) para ǫ > 0 arbitrario, eligiendo δ = Mǫ se sigue que
| f (y) − f (x)| < ǫ para todo y ∈ x + δBr (0) desde que δ = Mǫ . 
TEOREMA 4.18. (De la continuidad global) Sea f : X → R convexa,
siendo X un subconjunto convexo de Rn . Las siguientes afirmaciones son
equivalentes:
(1) f es continua en ri(X).
(2) f es semicontinua superior en ri(X).
(3) f está acotada superiormente en algún entorno abierto V x ∩ X de
cada punto x ∈ ri(X).
(4) f es continua en algún x ∈ ri(X).
Demostración:
(1) → (2) es inmediato.
(2) → (3). Sea x ∈ ri(X) como f es semicontinua superior se tiene que
{y : f (y) < f (x) + 1} es un entorno abierto de x.
(3) → (4) Es el teorema probado anteriormente.
(4) → (1) Supongamos que f es continua en x ∈ ri(X). Queremos probar que,
entonces, f es continua en cualquier otro punto y ∈ ri(X). Sea V x
un entorno de x tal que V x ⊂ ri(X). Escribimos V x = x + Bǫ (0)
donde Bǫ (0) es la bola de centro cero y radio ǫ. Para cada y ∈ ri(X)
existe z ∈ X, tal que y = λx + (1 − λ)z 2. Se verifica que y + λBǫ (0) =
λ(x + B( ǫ))(0) + (1 − λ)z. Sea B′0 = λB( ǫ)(0), entonces Vy = y + B′0
es un entorno de y contenido en ri(X). Sea w ∈ Vy existen entonces
v ∈ B′0 y u ∈ Bǫ (0) tales que w = y + v = λ(x + u) + (1 − λ)z.
Como f (w) = f (y + v) de la convexidad de f se sigue que f (w) ≤
λ f (x + u) + (1 − λ) f (z). Como f es continua en x existe M tal
que f (x + u) ≤ M, ∀u ∈ Bǫ (0) (ǫ suficientemente pequeño).
Luego f (w) ≤ λM + (1 − λ) f (z) para todo w ∈ Vy por lo tanto
f está acotada en Vy entorno de y y por el teorema anterior es
continua en y. 

2Tal z ∈ X existe, para probarlo considere V entorno abierto de y. Sea β > 0 suficiente-
y
mente pequeño como para que z = y + β(x − y) ∈ Vy . Puede verse entonces que existe 0 < λ < 1
tal que y = λx + (1 − λ)z.
4.3. FUNCIONES CÓNCAVAS DE n VARIABLES. 59

Obsérvese que los teoremas de continuidad anteriores son válidos en ge-


neral en espacios vectoriales topológicos cualesquiera. Su validez, en espacios
vectoriales de dimensión finita como Rn , tanto para funciones cóncavas co-
mo convexas con valores reales es inmediata, pues si una función convexa
f : X → R tiene por dominio un subconjunto X convexo de Rn , entonces es
finita en un entorno de cualquier punto interior. Demostración de la afirma-
ción: En efecto, sea x interior a C, existen entonces a y b tales que a < x < b.
Sea [a, b] = {y ∈ Rn : a ≤ y ≤ b}. Este es un entorno de x en C que forma la
cápsula convexa de un conjunto finito de puntos (teorema de Charatheodory)3,
luego f debe ser acotada por arriba en ese conjunto. La continuidad de f en C
se sigue de los teoremas anteriores.
En general una función convexa definida en un espacio de dimensión
infinita puede no ser continua, basta pensar en un funcional lineal discontinuo.
EJERCICIO 4.19.
(i) Muestre un ejemplo de función convexa semicontinua superior en su
dominio que no sea continua en el mismo.
(ii) Muestre un ejemplo de función cóncava semicontinua inferior en su
dominio que no sea continua en el mismo.
(iii) Muestre que una función convexa no puede ser semicontinua inferior
sin ser continua y que, análogamente, una función cóncava no puede
ser semicontinua superior sin ser continua.
EJERCICIO 4.20.
(i) Demuestre que si una función cóncava definida en X convexo, alcanza
un máximo local en x∗ 4 entonces f (x∗ ) es un máximo global.
Para la demostración de este punto, considere z(α) = αx∗ +(1 − α)y ∈
X, ∀ 0 ≤ α ≤ 1, observe que z(α) pertenece a cualquier entorno
de x∗ si α está suficientemente próximo a 1. Utilice la definición de
concavidad para contradecir entonces, que x∗ es un máximo local.
(ii) Demuestre que si una función convexa definida en X convexo, alcanza
un mı́nimo local en x∗ entonces f (x∗ ) es un mı́nimo global.
A continuación presentaremos algunas propiedades de las funciones con-
vexas relacionadas con la derivabilidad. Notaremos por grad f (x) al vector
gradiente de f en x (es decir el vector de Rn formado por las derivadas parciales
3Sea h = b − a observe que los puntos de la forma b − δh = (b − δ h , . . . , b − δ h )
1 1 1 n n n
siendo δi = 1 o 0 i = 1, 2, . . . , n son puntos extremos. Entonces [a, b] es la cápsula convexa de
estos puntos.
4Recuerde que una función alcanza en x∗ su máximo local, si y solamente si, existe un
entorno del punto donde f (x∗ ) ≥ f (y), para toda y en dicho entorno.
60 4. FUNCIONES CÓNCAVAS Y CUASI-CÓNCAVAS

de f evaluadas en el punto x). Aquı́ si la estructura vectorial de Rn es fuerte-


mente utilizada. Para el estudio de estas propiedades en casos más generales
se puede consultar: [Zeidler, E.] y [Luenberger, D. (a)].
TEOREMA 4.21. Sea X ⊂ Rn convexo y sea f : X → R diferenciable. f es
cóncava si y solamente si
(11) hgrad f (y) − grad f (x), y − xi ≤ 0 ∀ x, y ∈ X.
Demostración: Para la demostración del teorema precisamos del siguiente
lema:
LEMA 4.22. Sean x e y en X y d = y − x. Considere F(t) = f (x + td).
Entonces f es cóncava si y solamente si para todo x, y ∈ X lo es F.
Demostración del lema: Considere F(t) = f (ty + (1 − t)x), 0 ≤ t ≤ 1,
si F es cóncava se sigue que F(t) ≥ tF(1) + (1 − t)F(0), como F(1) = f (y)
mientras que F(0) = f (x) la concavidad de f se sigue. El recı́proco queda a
cargo del lector.
(1) Directo: Sea f cóncava. Sea ahora d = y − x entonces debido a
la concavidad de F, se sigue que F ′ (0) ≥ F ′ (1) como F ′ (0) =
grad f (x), y − x y F ′ (1) = grad f (y), y − x se tiene hgrad f (x), y −
xi ≥ hgrad f (y), y − xi.
(2) Recı́proco: Si hgrad f (y) − grad f (x), y − xi ≤ 0 ∀ x, y ∈ X se de-
duce que F ′ es decreciente pues la expresión: [F ′ (t) − F ′ (t′ )](t − t′ ) =
hgrad f (x + td) − grad f (x + t′ d), d(t − t′ )i es negativa cada vez que
t ≥ t′ . Por lo tanto si y solamente si F ′ es decreciente lo que implica
que F es cóncava, luego f es también lo es. 
TEOREMA 4.23. Sea X ⊂ Rn abierto y convexo y f : X → R dos veces
diferenciable. f es cóncava si y solamente si ▽2 f (x) es semidefinida negativa5
sobre C.
Demostración: Considere x ∈ X sea F(t) = f (x + td). Puede verse fácil-
mente que f es cóncava si y solamente si F ′′ (0) ≤ 0, ∀ x, d, en consecuencia
si y solamente si h▽2 f (x)d, di ≤ 0 ∀ x, d. 
Para f : X → R, X ⊆ Rn , la matriz ▽2 f (x) a veces escrita como [ f ′′ (x)]
se denomina hessiana de f en x y es la matriz cuyas entradas están dadas por
las derivadas parciales segundas {∂2 f (x)/∂xi ∂x j} i, j = 1, . . . , n.
5Recordamos que una matriz simétrica M es semidefinida negativa si y solamente si sus
autovalores son todos negativos, o bien si los determinantes de las submatrices principales
alternan los signos, empezando con menor o igual a cero. Es estrictamente definida negativa
cuando las desigualdades son estrictas.
4.4. EJERCICIOS 61

4.4. Ejercicios
EJERCICIO 4.24.
(i) Escriba un teorema análogo al teorema 4.23 para funciones estricta-
mente cóncavas. Recuerde la observación (4.15).
(ii) Verificar que si f es cóncava y λ > 0 entonces λ f es cóncava.
(iii) Si f y g son funciones cóncavas entonces también lo es f + g.
(iv) Verificar que si f es cóncava y K : R → R es cóncava entonces K( f )
no es necesariamente cóncava.
(v) Probar que las siguientes funciones son cóncavas:
1 1 x2
f (x) = x 2 , f (x, y) = x 2 − y2 , f (x, y) = − .
y
(vi) Probar que las siguientes funciones son convexas
f (x) = x2 , f (x, y) = x2 + y2 , f (x, y, z) = x2 + 3y4 + 2z2
1 1
(vii) La siguiente función es cóncava o convexa? f (x, y) = x2 + y3 − x 2 y 2 .
Si una u otra propiedad se verifica, indique las regiones del plano
donde ello sucede.
(viii) Muestre que si fi : X → R, i = 1,P . . . , n son funciones cóncavas y si
λi ≥ 0, i = 1, . . . , n entonces F = ni=1 λ1 fi : X → R es cóncava.
EJERCICIO 4.25. Verifique que siPpn = (p1 , . . . , pn ) pertenece al simplexn de
Rn es decir que 0 ≤ pi ≤ 1; ∀i, y i=1 pi = 1, entonces para todo x ∈ R se
n p
verifica que h p, xi ≥ Πi=1 (xi ) .
i

Ayuda: Tome logaritmos de h p, xi use entonces la concavidad de la función


logaritmo y las propiedades conocidas de esta función.
EJERCICIO 4.26. En teorı́a económica, el conjunto de posibilidades de pro-
ducción se representa muchas veces por funciones reales. Dada una tecnologı́a
disponible, es posible producir una cantidad y ≥ 0 de cierto producto a partir
de las cantidades x1 , . . . , xn , donde xi ≥ 0 ∀i = 1, . . . , n, de ciertos bienes
llamados insumos, si y solamente si el vector (y, − x1 , . . . , − xn ) es tecnológi-
camente posible. Es decir si y ≤ f (x1 , . . . , xn ) donde f : Rn → y es la función
que representa la tecnologı́a.
(1) Muestre que si f es cóncava entonces el conjunto de posibilidades de
producción Y = {(y, − x1 , . . . , − xn ), y ≤ f (x1 , . . . , xn )} es convexo.
(2) Considere el caso donde f (x1 , x2 ) = xα1 xβ2 , α ≥ 0, β ≥ 0 y considere
los conjuntos de producción para los casos en que α + β es mayor,
igual, o menor que 1. Indique los casos en que se puede definir un
plan óptimo, es decir un plan maximizar de la función de beneficios
62 4. FUNCIONES CÓNCAVAS Y CUASI-CÓNCAVAS

π(y, x) = py − wx, siendo w ∈ Rn el vector de precios unitarios de


los insumos, y p > 0 el precio unitario del producto.
EJERCICIO 4.27. Considere el conjunto de tecnologı́a
Y = (− x, y) ∈ Rl−1 × R+ : y ≤ f (x), x ≥ 0 .


Muestre que Y es convexo si y solamente si f es cóncava.

4.5. Derivadas direccionales y subgradientes


Una propiedad de gran utilidad de las funciones convexas es la de poseer de-
rivadas direccionales universalmente. Estas derivadas están relacionadas con
los subgradientes, vectores estos, que representan hiperplanos soportes del
epı́grafo de la función considerada. Un interesante resumen, con demostracio-
nes fácilmente accesible al lector interesado, de las principales propiedades de
las funciones convexas puede encuentrarse en [Coruzeix, J.P.; Ocaña, E; Sosa,
W.]. La referencia clásica es [Rockafellar, T.]. La posibilidad de utilizar el con-
cepto de subgradiente en microeconomı́a para extender resultados conocidos
a casos más generales puede verse en por ejemplo [Mas-Colell, A. (1985)]
Consideraremos en esta sección funciones reales f : X → R definidas en
subconjuntos abiertos X de Rn .
DEFINICIÓN 4.28. Sea f : X → [−∞, ∞] finita en a punto interior de X.
Se llama derivada direccional de f en a en la dirección de y, lo que se denota
como f ′ (a; y) al siguiente lı́mite si éste existe:
f (a + λy) − f (a)
f ′ (a; y) = lı́m .
λ→0 λ
Nótese que f (x + λy) está definida para todo λ > 0 y tal que x + λy ∈ X.
Los valores +∞ y −∞ son aceptados como posibles valores del lı́mite.
Fácilmente puede comprobarse que la igualdad,
f ′ (x; y) = hgrad f (x), yi,
se verifica.
TEOREMA 4.29. Sea X ⊂ Rn abierto y convexo, f : X → R una función
convexa y sea x ∈ X tal que f (x) es finita. Para cada y ∈ Rn , el cociente en
la definción de derivada direccional es una función no decreciente de λ > 0 y
por lo tanto f ′ (x; y) existe y es igual al
 
f (x + λy) − f (x)
in f , λ > 0, : x + λh ∈ X .
λ
4.5. DERIVADAS DIRECCIONALES Y SUBGRADIENTES 63

Más aún, f ′ (x; y) es una función convexa positivamente homogénea en y, con


f ′ (x; 0) = 0.
Decimos que una función f : X → R es positivamente homogénea (u
homogénea de grado 1) si para todo k positivo y para todo x ∈ X se verifica
que f (kx) = k f (x).
Demostracón: Debido a que la función
f (x + λy) − f (x)
φ(λ) =
λ
es creciente, (decrece, cuando λ decrece), entonces el lı́mite de φ cuando λ → 0
existe y es igual al ı́nfimo.
Para ver que la función φ : R → R es decreciente considere λ2 > λ1 tales que
x+λ1 y ∈ X y x+λ2 y ∈ X. Defina ahora z1 = x+λ1 y y z2 = x+λ2 y. Sea ahora z2 =
(1 − α)x+αz2 por la convexidad de f se sigue que: f (z2 ) ≤ (1 − α) f (x)+α f (z2 )
de donde se concluye que f (z2 ) − f (x) ≤ α [ f (z2 ) − f (x)]. Pero como puede
corroborarse α = λλ21 . Por lo que se obtiene que φ(λ1 ) ≤ φ(λ2 ).
La homogeneidad sigue de la identidad
f (x + λ(ky)) − f (x) f (x + (kλ)y)) − f (x)
=k
λ kλ
para todo k > 0. Luego tomamos lı́mites en ambos miembros con λ → 0. 
EJERCICIO 4.30. Enuncie y demuestre el teorema correspondiente para
funciones cóncavas.
DEFINICIÓN 4.31. Decimos que un vector x∗ ∈ Rn es un subgradiente6 de
una función convexa f en x si
(12) f (z) ≥ f (x) + < x∗ , z − x > ∀z ∈ dom( f ).
La desigualdad (12) que define al subgradiente, es llamada desigualdad
subdiferencial y admite una interpretación geométrica sencilla: Es fácil ver
que la función afı́n
h(z) = f (x) + h x∗ , z − xi
define un hiperplano no vertical que pasa por el punto (x, f (x)).
El conjunto de subgradientes de f en x es llamado subdiferencial de
f en x y es representado por ∂ f (x). El mapa multivaluado x → ∂ f (x) es
6En general, para el caso en que el dominio de f sea un subconjunto convexo de un espacio
vectorial X, el subgradiente es un elemento del espacio dual de X para el que las propiedades
aquı́ enunciadas se verifican. En el caso particular de Rn , su dual, es el mismo Rn . El concepto
de espacio dual será introducido en la sección 5.
64 4. FUNCIONES CÓNCAVAS Y CUASI-CÓNCAVAS

llamado subdiferencial de f en x. Obsérvese que el conjunto ∂ f (x) es convexo


y cerrado. Si ∂ f (x) 6= ∅ decimos que f es subdiferenciable en x.
Un caso importante en la teorı́a de subgradientes es el caso en el que f es
la función indicadora (ver ecuación (2)). Por definición x∗ ∈ ∂δ(·/C) si y sólo
si:
δ(z/C) ≥ δ(x/C) + h x∗ , z − xi, ∀z.
Esta condición implica para x ∈ C que 0 ≥ h x∗ , z − xi para todo z ∈ C, eso
significa que x∗ es normal con C. En el caso particular en que x es interior a
C entonces x∗ = 0. Luego ∂δ(x/C) representa el cono normal a C en x, el que
es vacı́o si x 6∈ C. Por cono normal a C se entiende el conjunto de todos los
vectores que son normales a dicho conjunto7.
Consecuentemente para una función cóncava g definimos supergradien-
tes y superdiferenciales. De esta forma x∗ es un supergradiente para g si:
g(z) ≤ g(x) + h x∗ , z − xi, ∀z.
EJEMPLO 4.32. Para f : R → R el subdiferencial es el conjunto de todas
las pendientes x∗ ∈ R de las rectas que pasan por (x, f (x)) abajo de la curva f
en x.
Como ejemplo de función subdiferenciable en todo punto pero no siempre
diferenciable, considere la función f (x) = k xk. Es diferenciable en x 6= 0, pero
es subdiferenciable para todo x ∈ Rn .
∂ f (0) = { x∗ ∈ Rn : kzk ≥ h x∗ , zi, ∀z} .
Es decir que ∂ f (0) está formado por todos los vectores en la bola unitaria.
En efecto x∗ ∈ ∂ f (0) si y solamante si, 1 ≥ h x∗ , kzk
z
i ∀z. Este producto es
2
máximo para z = x∗ . Se sigue entonces que 1 ≥ kxk ∗
kxk , es decir que, x ∈ ∂ f (0)
si y solamente si k x∗ k ≤ 1.
x
Mientras que ∂ f (x) = kxk para todo x 6= 0. Para ver esto considere que si
x ∈ ∂ f (x) debe verificarse que: k x + λhk − k xk ≥ λh x∗ , hi. Luego debe ser

hgrad f (x), hi ≥ h x∗ , hi ∀h ∈ X, de donde se deduce que x∗ = grad f (x).


La figura 12 representa gráficamente un caso como el del ejemplo.
TEOREMA 4.33. Sea X ⊂ Rn subconjunto convexo y abierto. Sea f : X →
R convexa y x un punto del dominio donde f (x) es finito. Entonces x∗ es un
subgradiente si y solamente si, para todo y ∈ Rn se verifica la desigualdad,
f ′ (x; y) ≥ h x∗ , yi.
7Recuerde que un vector x∗ se dice normal a un conjunto convexo C en un punto a donde
a ∈ C, si x∗ no hace un ángulo agudo con ningún segmento de recta interior a C con vértice en
a, esto es si hx∗ , x − ai ≤ 0 para todo x ∈ C.
4.5. DERIVADAS DIRECCIONALES Y SUBGRADIENTES 65

FIGURA 12. Subgradientes en puntos angulosos

Demostración: A partir de la desigualdad


f (x + λy) − f (x)
≥ h x∗ , yi, ∀ λ > 0 y tal que x + λy ∈ X
λ
y teniendo en cuenta la definición de f ′ (x, y). 
COROLARIO 4.34. (Principio del mı́nimo) Sea f : X → (−∞, ∞], f 6= ∞
donde X es un subconjunto abierto y conexo de Rn . Entonces x̄ es solución del
problema de mı́n x∈X f (x) si y solamente si 0 ∈ ∂ f ( x̄).
Demostración: Sigue inmediatamente a partir de la desigualdad del teore-
ma (4.33). 
La continuidad de una función f : Rn → R en x no implica la diferencia-
bilidad en x ver por ejemplo [Lima, L.]. No obstante para funciones convexas
tal afirmación se cumple para subgradientes.
TEOREMA 4.35. Sea f : X → (−∞, ∞], f 6= ∞ donde X es un subconjunto
abierto y conexo de Rn entonces:
(1) ∂ f (x) es convexo.
(2) Sea f convexa, finita y continua en x entonces ∂ f (x) es no vacı́o.
(3) ∂ f (x) es compacto.
Demostración: Es posible que ∂ f (x) = ∅ este es el caso si f (x) = ±∞.
La convexidad de ∂ f (x) sigue de la definición. Probaremos ahora el inciso
(2). Sabemos que epi f es convexo, además (x, f ((x)) pertenece a f r[epi f ],
es decir a la frontera del epı́grafo de f . Luego por el teorema de separa-
ción (3) (ver definición 3.3), existe (w∗ , a∗ ) ∈ Rn × R y α ∈ R tales que
66 4. FUNCIONES CÓNCAVAS Y CUASI-CÓNCAVAS

hw∗ , xi + a∗ f (x) ≥ α ≥ hw∗ , yi + a∗ a para todo (y, a) ∈ epi f (ver definición


4.6.) Luego como (y, f (y)) ∈ epi f f y a∗ 6= 0 se sigue que:
h x∗ , xi + f (x) ≥ α ≥ h x∗ , yi + f (y)
siendo x∗ = w∗ (a)−1 . Supongamos que a∗ = 0, entonces hw∗ , x − yi ≥ 0,
∀y ∈ dom( f ). Como el producto interno es una función continua y x es un
punto en el interior del dominio de la función, es decir x ∈ int[dom( f )] en-
tonces w∗ = 0. En contradicción con (w∗ , a∗ ) 6= 0. Demostración de (3.): Sea
U = {h ∈ X : f (x + h) − f (x) ≤ 1}. Luego para todo h ∈ U se tiene que
h x∗ hi ≤ f (x + h) − f (x) ≤ 1.
Por lo que ∂ f (x) es acotado. Que es también cerrado se sigue de la continuidad
del producto interno considerando una sucesión convergente u∗n ∈ ∂ f (x). 
Sea X ⊂ Rn y f : X → R̄ y sea a ∈ X. Se dice que f es Fréchet
diferenciable8 en a si existe x∗ ∈ Rn tal que
f (a + h) − f (a) − h x∗ , hi
(13) →0
khk
cuando h → 0. 
Observe que la definición no depende de la norma elegida. Si x∗ existe
y es único, escribimos entonces x∗ = grad f (a). Trivialmente se deduce
que hgrad f (a), hi = f ′ (a; h). No es suficiente la existencia de las derivadas
parciales en a para asegurar la diferenciabilidad de la función f en a.
TEOREMA 4.36. Sea f una función convexa propia, y sea a ∈ dom( f ).
Entonces f es Fréchet diferenciable en a si y solamente si existe un único
x∗ ∈ ∂ f (a). En este caso x∗ = grad f (a).
Demostración: (Directo:) Sea f Fréchet diferenciable en a. Si x∗ ∈ ∂ f se
tiene que h x∗ , hi ≤ f ′ (x; h) = hgrad f (a), hi. Entonces h x∗ − grad f (a), hi ≤
0∀h. Haciendo h = x∗ − grad f (a) se tiene que x∗ = grad f (a).
(Recı́procamente:) Considere la función auxiliar
g(x) = f (x) − f (a) − h x − a, x∗i

8El concepto de diferencial de Fréchet, corresponde al concepto de función diferenciable


para Rn . Recuerde que f : U → R con U ⊂ Rn abierto, se dice diferenciable en a si existe
una transformación lineal La tal que para todoPn v ∈ Rn f (a + v) − f (a) = La (v) + r(v) donde
r(v) ′
lı́mt→0 kvk = 0. Donde La (v) = d f (a)v = i=1 f xi vi . A veces la transformación lineal La se
Pn ′
escribe como: La = d f (a) = f
i=1 xi dxi entendiendo por dxi una transformación lineal, tal
que dxi : Rn → R definida como dxi (v) = vi , por lo que: La (v) = d f (a)(v) = ni=1 fx′i dxi (v) =
P
Pn ′
i=1 f xi vi , ver [Lima, L.].
4.5. DERIVADAS DIRECCIONALES Y SUBGRADIENTES 67

puede verse que g(a) = 0 y que g(a + h) ≥ 0, ∀h. Además como existe un único
subgradiente de f en a, se verifica que f ′∗ i y por lo tanto

(14) g′ (a; h) = 0.

Mostraremos luego que para todo h ∈ Rn es posible elegir unos vectores


di ∈ Rn , i = 1, 2, . . . , 2n y 2n números reales ti , tales que: 2n
P
i=1 ti = 1, t ≥
P2n i
0∀i = 1, 2, . . . , 2n de forma tal que se cumpla la igualdad h = khk1 i=1 di ti .
Por lo que 0 ≤ g(a + h) = g(a + 2n
P P2n
i=1 ti khk1 di ) ≤ i=1 ti g(a + khk1 di ). La
primera desigualdad se sigue de que g(a) = 0 y g(a + h) ≥ 0 la segunda
g(a+khk1 di )−g(a)
por la convexidad de g. Entonces 0 ≤ g(a+h)−g(a) ≤ 2n
P
khk1 i=1 ti khk1 ≤
P2n g(a+khk1 di )−g(a) Pn
i=1 ti khk1 . Donde khk1 = i=1 |hi |.
Tomando lı́mites cuando h → 0, y teniendo en cuenta (14) obtenemos que
g(a+h)−g(a)
khk1 → 0 y por lo tanto grad g(a) = 0 y por lo tanto grad f (a) = x∗
Elección de los di y de los ti : Sean ei , i = 1, 2, . . . , n los elementos de la
base canónica de Rn . Definamos di = ei , y dn+i = −ei i = 1, 2, . . . , n. Luego
ξi
ti = khk 1
con ξi = 0, y ξn+i = −hi si hi < 0 mientras que si hi > 0 hacemos
ξi = hi , y ξn+i = 0. Se sigue entonces que h = 2n
P
i=1 di ξi . 
Veremos en el siguiente teorema que el grafo de una función convexa o
cóncava puede ser considerado como la envolvente de funciones afines.

TEOREMA 4.37. Sea f : X → R̄ una función convexa s.c.i. con dominio


efectivo cerrado. Para cada x en el dominio efectivo definamos

G(x) = sup {g(x) : g ≤ f, ∀g afı́n}

entonces f (x) = G(x).

Demostración: Fijamos x en C dominio efectivo de f . Es suficiente probar


que si α < f (x) entonces existe una función afı́n tal que g < f y g(x) = α.
Como f es convexa y semicontinua inferior, el epı́grafo de f , definido por E =
{(y, r) ∈ C × R : r ≥ f (x)}, es un subconjunto no vacı́o, convexo y cerrado
en Rn × R. Consideremos entonces (x, α) 6∈ E. Por el teorema de separación
de convexos (3.20) sabemos que existe un vector de Rn × R, definido como
(p, λ) tal que h p, xi + λα < h p, xi + λ f (x) lo que implica λ > 0. Definamos
ahora la función afı́n g como g(y) = λ1 [−l(y) + l(x)] + α. Como puede verse
g(y) < f (y) ∀y ∈ C y además g(x) = α. 

EJERCICIO 4.38. Reescriba el teorema anterior y su demostración para


funciones cóncavas.
68 4. FUNCIONES CÓNCAVAS Y CUASI-CÓNCAVAS

4.6. Funciones cuasi-cóncavas y cuasi-convexas


En muchas aplicaciones a la teorı́a económica una generalización de los con-
ceptos de función cóncava y convexa se hace necesaria. Los conceptos de
función cuasi-cóncava y cuasiconvexa dan más generalidad a las conclusio-
nes que la teorı́a económica puede obtener. Una muestra de su importancia
es el hecho de que curvas de indiferencia convexas provienen de relaciones
de preferencia representadas por funciones cuasi-cóncavas y generalmente
las funciones de producción o de tecnologı́a son también consideradas como
cuasicóncavas, lo que ciertamente incluye el caso cóncavo.
El teorema de Kuhn-Tucker se extiende a funciones cuasi-cóncavas. El
teorema de Arrow-Enthoven de 1961, muestra esta posibilidad, el mismo
será presentado más adelante en estas notas.
NOTACIÓN 4.39. En lo que sigue, a los efectos de simplificar la notación
escribiremos cuando sea necesario xy para representar el producto interno
h x, yi.
La siguiente definición es como veremos, equivalente a la definición (4.5).
DEFINICIÓN 4.40. Sea f : X → R, siendo X un conjunto convexo de
Rn , decimos que f es cuasi-cóncava si para todo a ∈ R se verifica que
Xa = { x ∈ X : f (x) ≥ a} es convexo. Diremos que f es cuasiconvexa si y
solamente si − f es cuasi-cóncava.
TEOREMA 4.41. Sea f : X → R siendo X un conjunto convexo entonces,
las siguientes afirmaciones son equivalentes:
(1) f es cuasi-cóncava.
(2) Para todo x, y ∈ X y θ ∈ [0, 1] se verifica que:
f (θx + (1 − θ)y) ≥ min{ f (x), f (y)}.
(3) Si f (x) ≥ f (y) entonces f (θx + (1 − θ)y) ≥ f (y).
Demostración:
(1) → (2) Supongamos que f (y) = min{ f (x), f (y)}. Por ser f una función
cuasi-cóncava el subconjunto de Rn
definido como { x ∈ X : f (x) ≥ f (y)} es convexo, de donde se si-
gue que f (θx + (1 − θ)y) ≥ f (y).
(2) → (3) Es inmediato.
(3) → (1) Sea c ∈ R si existe x ∈ X tal que f (x) ≥ c entonces sea y 6= x ∈ Xc .
Sin pérdida de generalidad asumimos que f (y) ≥ f (x), por (3)
f (θx + (1 − θ)y) ≥ f (x) por lo tanto θx + (1 − θ)y ∈ Xc . Es decir
que Xc es conexo. En otro caso Xc = ∅ por lo tanto Xc es también
convexo. 
4.7. CONJUNTOS EXTREMOS 69

Ejemplos de funciones cuasi-cóncavas que no son cóncavas son los si-


guientes:
(1) f (x) = x2 , x ∈ R+ .
(2) f (L, K) = Lα K β , con α + β > 1, α > 0, β > 0, L ≥ 0, K ≥ 0.
Puede ser probado que toda función cuasi-cóncava, homogénea de grado
menor o igual que 1, es decir tal que ∀k > 0 se verifica f (kx) = kα f (x) 0 <
α ≤ 1 es cóncava.
Un hecho no muy agradable es que a diferencia de lo que sucede con
la combinación lineal positiva de funciones cóncavas, la combinación lineal
positiva de funciones cuasi-cóncavas no es necesariamente cuasi-cóncava.

4.7. Conjuntos extremos


Estudiaremos en esta sección los conjuntos extremos, a los que luego relacio-
naremos con los conjuntos de maximizadores de funciones cuasi-cóncavas.
DEFINICIÓN 4.42. Un subconjunto extremo de un conjunto C es un sub-
conjunto no vacı́o E de C con la propiedad de que si x = αy + (1 − α)z ∈ E,
donde 0 < α < 1 y con y, z ∈ C entonces y, z ∈ E. En el caso en que un con-
junto extremo E, contenga un único elemento, este punto es llamado punto
extremo de C y los notaremos como E(C).
De esta forma un punto extremo de C no puede ser escrito como combi-
nación convexa de dos puntos diferentes de C. Puede verse que un punto e de
un conjunto convexo C es extremo si y solamente si C \ {e} es convexo.
Ejemplos de conjuntos extremos son:
• Las caras de un conjunto convexo.
• Vértices y aristas de un poliedro son puntos extremos.
• Cada uno de los puntos de la cáscara esférica que limita a una esfera,
son puntos extremos.
• La cáscara esférica no es un conjunto extremo.
Se representan en la figura 13, un punto extremo y un conjunto extremo.
Existen conjuntos convexos cuyos conjuntos extremos no tienen puntos
extremos. Ejemplo de este es el subconjunto convexo C de R2
C = (x, y) ∈ R2 : y ≥ 0 .


El conjunto extremo es E = (x, y) ∈ R2 : y = 0 el que claramente no tiene




puntos extremos. No obstante, para conjuntos extremos compactos se tiene el


siguiente lema:
70 4. FUNCIONES CÓNCAVAS Y CUASI-CÓNCAVAS

FIGURA 13. Puntos y conjuntos extremos

LEMA 4.43. Sea C subconjunto de Rn entonces todo subconjunto E extremo


y compacto de C contiene al menos un punto extremo.

Demostración: Considere el conjunto de todos los subconjuntos compac-


tos extremos de C incluidos en E, ordenémoslos por inclusión. La intersección
de los elementos de cada cadena es no vacı́a y compacta. Por el lema de Zorn,
existe un conjunto G minimal extremo de C en F, (ver apéndice IV). Si este
conjunto tuviera más de un elemento tendrı́amos una contradicción. Para ver
esta contradicción, alcanza con suponer que existen dos elementos diferentes a
y b en el minimal. Considere luego un funcional lineal f tal que f (a) > f (b). El
conjunto M de maximizadores de este funcional restringido a G es un conjunto
extremo que no contiene a b, luego G no serı́a minimal. 

TEOREMA 4.44. Todo subconjunto K compacto y convexo de Rn está in-


cluido en la cápsula convexa de sus puntos extremos 9.

Demostración: Suponga que existe a ∈ K tal que a 6∈ co(E(K)). Luego


por el teorema de separación 3.20, existe p funcional lineal en Rn tal que
p(a) > p(x), ∀ x ∈ co(E(K)). Sea A el conjunto de los maximizadores de p en
K. A ⊂ K ∩ [co(E(K))]c es un subconjunto extremo no vacı́o y compacto. Por
el lema anterior contiene un punto extremo de K, por lo tanto A ∩ co(E(K)) 6= ∅,
lo que contradice la definición de A. 

9Este teorema vale en espacios de Hausdorff localmente convexos. Es conocida como


teorema de Krein-Milman.
4.8. CONJUNTOS MAXIMIZADORES 71

4.8. Maximizadores de funciones cuasi-convexas y cuasi-cóncavas


Nos introduciremos en esta sección en la problemática de la maximización de
funciones cuasi-cóncavas. Este punto será desarrollado también más adelante,
ver sección 8.1. Veremos propiedades de los conjuntos maximizadores de
funciones cuasi-cóncavas y cuasi-convexas, y algunas caracterı́sticas sobre la
forma en que crecen estas funciones.
DEFINICIÓN 4.45. Sea f : X → R siendo x ⊂ Rn decimos que x∗ es un
elemento maximizador de f si es un máximo global para f en X. El conjunto
de estos elementos es llamado conjunto maximizador de f .
TEOREMA 4.46. (Principio del máximo de Bauer) Si C es un conjunto
compacto y convexo de Rn , entonces toda función s.c.s, cuasi-convexa alcanza
su máximo (global) en un punto extremo.
Idea de la demostración: La demostración es consecuencia de la extensión
del teorema de Weierstrass para funciones s.c.s. y de que la cuasiconvexidad de
f asegura que el conjunto de los maximizadores es un subconjunto extremo.
La afirmación del teorema se obtiene ahora a partir del hecho de que todo
subconjunto extremo tiene un punto extremo 10. 
EJERCICIO 4.47.
(i) Demuestre que el conjunto de maximizadores de una función cuasi-
convexa es o bien vacı́o o bien un conjunto extremo y que
(ii) el conjunto de minimizadores de una función cuasi-cóncava es o bien
vacı́o o bien un conjunto extremo
(iii) Complete la demostración del teorema de Bauer.
(iv) Demuestre que el conjunto de minimizadores de una función cuasi-
cóncava es un conjunto extremo.
(v) Demuestre que el conjunto de maximizadores de una función cuasi-
cóncava no es necesariamente un subconjunto extremo.
TEOREMA 4.48. Sea X ⊂ Rn , convexo. Si f : X → R es una función
diferenciable con jacobiano en x∗ definido por f ′ (x∗ ) = grad f (x∗ ). Entonces
una condición necesaria y suficiente para que f sea cuasi-cóncava en X es
que la desigualdad

(15) f (x) ≥ f (x∗ ) implique grad f (x∗ )(x − x∗ ) ≥ 0 ∀ x∗ , x ∈ X.

10Este teorema vale en todo espacio de Hausdorff localmente convexo.


72 4. FUNCIONES CÓNCAVAS Y CUASI-CÓNCAVAS

NOTA 4.49. Este teorema afirma que una condición necesaria y suficiente
para que una función real sea cuasi-cóncava, es que para todo x∗ ∈ X para
el que existe x ∈ X tal que f (x) ≥ f (x∗ ) entonces f (y) ≥ f (x∗ ) para todo y
perteneciente al segmento de recta que une x con x∗ . Es decir que la derivada
direccional evaluada en cualquier punto de su dominio, sea positiva en la
dirección del crecimiento 11
NOTA 4.50. Obsérvese que si f es derivable, entonces es cóncava si y
solamente si f (y) − f (x) ≤ f ′ (x)(y − x) para todo x en su dominio.
Demostración: Siendo f (x) ≥ f (x∗ ) la cuasi-concavidad de f implica que
f (x∗ +θ(x−x∗ ))− f (x∗ )
θ ≥ 0; por lo tanto tomando lı́mites cuando θ
→ 0 se obtiene:
grad f (x∗ )(x − x∗ ) ≥ 0 de donde se obtiene la afirmación.
(Recı́procamente) Sea φ(λ) = f (λy + (1 − λ)z) por lo tanto φ(1) =
f (y); φ(0) = f (z). Supongamos que f (y) ≥ f (z) y que se cumple (15) pe-
ro no obstante que f no es cuasi-cóncava. Esto es, que existe λ̄ ∈ (0, 1) tal
que, φ(λ̄) < φ(0). En estas condiciones, existe λ0 ∈ (0, 1) tal que φ(λ0 ) < φ(0)
tal que φ′ (λ0 ) > 0. Sea x0 = λ0 y + (1 − λ0 )z = z + λ0 (y − z), usando la regla de
la cadena se sigue que:
φ′ (λ0 ) = grad f (x0 )(y − z) > 0 (A).
Como f (z) ≥ f (x0 ) se tiene que grad f (x0 )(z − x0 ) ≥ 0 (B), y por ser
f (y) ≥ f (x0 ) se tiene que grad f (x0 )(y − x0 ) ≥ 0 (C). Como además z − x0 =
−λ0 (y − z) se sigue de (B) que −λ0 grad f (x0 )(y − z) ≥ 0. Análogamente,
como y − x0 = (1 − λ0 )(y − z) se sigue de (C) que (1 − λ0 )grad f (x0 )(y − z) ≥ 0.
Por lo tanto grad f (x0 )(y − z) = 0 lo que contradice la desigualdad (A). 
DEFINICIÓN 4.51. Sea f : C → R y C x∗ = { x ∈ C : f (x) ≥ f (x∗ )}. Deci-
mos que un vector p ∈ E espacio vectorial topológico define un soporte para
C x∗ en x∗ ∈ X si se verifica que p(x − x∗) ≥ 0 para todo x ∈ C x∗ .
DEFINICIÓN 4.52. Decimos que un semiespacio E ⊂ Rn es un semiespacio
soporte para X si X está totalmente contenido en E y existe al menos un punto
x∗ ∈ X̄ en la frontera de E.
De esta forma todo hiperplano soporte de X, define un semiespacio soporte
de X. En otras palabras los hiperplanos soporte para X, son los hiperplanos
que pueden ser representados en la forma H = { x : h x, bi = β, } con b 6= 0 con
h x, bi ≤ β para todo x ∈ X y h x, bi = β para al menos un punto en f r(X). De
acuerdo al teorema de separación (2), si C es un subconjunto convexo de Rn
11Obsérvese que para v = x − x∗ se tiene que grad f (x∗ )(x − x∗ ) = ∂f
(x∗ ) = f ′ (x∗ , v).
∂v
4.8. CONJUNTOS MAXIMIZADORES 73

entonces para todo x∗ en su frontera, existe un hiperplano soporte H para C


que contiene a x∗ . Definiendo a la vez este H un semiespacio soporte para C.
TEOREMA 4.53. Sea f : X → R una función cuasi-cóncava diferenciable
en x∗ , siendo X ⊂ Rn convexo, entonces el gradiente de f evaluado en x∗ ,
representado por grad f (x∗ ), define un hiperplano soporte para x∗ .
Demostración: En efecto si x ∈ C x∗ entonces por el teorema 4.48 se
verifica la desigualdad, grad f (x∗ )(x − x∗ ) ≥ 0 y por lo tanto grad f (x∗ ) es
un soporte para x∗ . 
COROLARIO 4.54. Sea f : X → R diferenciable en x∗ , y X ⊂ Rn convexo.
Supongamos que x∗ pueda ser considerado como combinación convexa de dos
elementos de X y que grad f (x∗ ) 6= 0. Entonces f es cuasi-cóncava en X si
y solamente si x∗ , es la solución del siguiente programa de maximización no
lineal: máxx∈X f (x) s.a. grad f (x∗ )x ≤ grad f (x∗ )x∗ .
Demostración: Sea f cuasi-cóncava. Supongamos que existe y 6= x∗
que verifica las condiciones del programa no lineal y que a la vez verifica que
f (y) > f (x∗ ). Por el teorema anterior sabemos que grad f (x∗ ) define un so-
porte para C x∗ por lo tanto debe verificarse la igualdad grad f (x∗ )(y − x∗ ) = 0.
Por la continuidad de f y el hecho de ser f (y) > f (x∗ ) existe ǫ > 0 tal que
para todo z ∈ By (ǫ) se verifica que: f (z) > f (x∗ ). A la vez, este z puede
elegirse de forma tal que verifique grad f (x∗ )(z − x∗ ) < 0 contradiciendo la
cuasi-concavidad de f .
(Recı́procamente) Supongamos que x∗ puede ser considerado como la combi-
nación convexa de dos puntos y, z ∈ C. Entonces debe suceder que
grad f (x∗ )x∗ ≥ min {grad f (x∗ )y, grad f (x∗ )z} Por lo tanto y o z perte-
necerán a la restricción del programa de maximización. Se deduce entonces
que f (x∗ ) ≥ min { f (y), f (z)} . 
EJERCICIO 4.55. El segundo teorema del bienestar económico, dice que
si los agentes tienen preferencias convexas, entonces todo óptimo de Pareto12
puede ser alcanzado como equilibrio walrasiano con transferencias, es decir
reasignando las dotaciones iniciales de la economı́a. Relacione el lector, el
teorema y corolario anterior, con el segundo teorema del bienestar económico.
Para esto suponga que la asignación de recursos x∗ es óptimo de Pareto,
y suponga que las preferencias son convexas. Luego aplique el teorema de
separación de convexos y reasigne las dotaciones iniciales. Nótese que la
12Entendemos como óptimo de Pareto una asignación de los recursos económicos, tal que
no es posible, mediante reasignaciones de estos recursos, mejorar a algún agente, sin empeorar
al menos a otro.
74 4. FUNCIONES CÓNCAVAS Y CUASI-CÓNCAVAS

necesidad de preferencias convexas, hacen que este teorema tenga menos


generalidad que el llamado primer teorema del bienestar, según el cual toda
asignación correspondiente a un equilibrio walrasiano es un óptimo de Pareto.
El lector encontrará una demostración de este teorema en la sección 9.4.
Muchas veces en economı́a se utilizan funciones que son cuasi-cóncavas
y que son a la vez homogéneas de grado uno 13. Estas dos condiciones jun-
tas implican la concavidad de la función. Se tiene el siguiente teorema que
relaciona cuasi-concavidad y concavidad.
TEOREMA 4.56. Sea f : X → R homogénea de grado uno, siendo X un
subconjunto convexo de Rn , supongamos que para todo x ∈ X; x 6= 0 se verifica
que f (x) > 0. Entonces f es cuasi-cóncava (respectivamente cuasi-convexa)
si y solamente si es cóncava (resp. convexa).
Demostración: La suficiencia es obvia. Sea ahora f cuasi-cóncava. Sean
x, y ∈ X − {0}, y definamos x∗ = [1/ f (x)]x e y∗ = [1/ f (y)]y. Entonces
f (x∗ ) = f (y∗ ) = 1. La cuasi-concavidad de f hace que
(16) f (λx∗ + (1 − λ)y∗ ) ≥ min { f (x∗ ), f (y∗ )} = 1.
f (x)
En particular esto vale para λ = f (x)+ f (y) se tiene entonces, a partir de la
ecuación (16) y la homogeneidad de f , que f (x + y) ≥ f (x) + f (y), es decir
f es superaditiva. Por ser entonces f función super aditiva y homogénea de
grado uno es cóncava. 
En la sección 8.2 mostraremos algunas relaciones entre funciones cuasi-
cóncavas y el hessiano orlado (ver definición 8.5).

4.9. Ejercicios
EJERCICIO 4.57. Pruebe la última afirmación de la demostración del teo-
rema (4.56).
EJERCICIO 4.58. Muestre que si la relación de preferencias  es convexa
y representable por una función de utilidad, entonces ésta es cuasi-cóncava y
recı́procamente.
EJERCICIO 4.59. Sea f : X → R siendo X un subconjunto convexo de Rn .
(1) Muestre que el conjunto de maximizadores para f cuasi-cóncava es
un subconjunto convexo.
13Recuerde que una función se dice homogénea de grado uno, cuando para todo λ > 0
verifica f (λx) = λ f (x) para todo x en el dominio de f .
4.10. APLICACIONES 75

(2) Muestre que si la función f es estrictamente cuasi-cóncava entonces


si el conjunto de maximizadores es no vacı́o, tiene un único elemento.
(3) Considere ahora f cuasiconvexa, y muestre los análogos a los ı́temes
anteriores para el conjunto de minimizadores.

4.10. Aplicaciones
EJERCICIO 4.60. En teorı́a económica se define la demanda del consumi-
dor, como el conjunto de maximizadores de una cierta función de utilidad u,
restringido a un cierta región presupuestaria, (obsérvese que la demanda no
tiene por que ser única). Sea u : Rn → R continua y cuasi-cóncava dicha fun-
ción de utilidad. Sea P = { x ∈ Rn : px ≤ I } la restricción presupuestaria del
consumidor. El vector p = (p1 , . . . , pn ) representa los precios, pi es el precio
unitario del bien i, el número I > 0 representa el ingreso del consumidor. Sea
x(p) la demanda del consumidor.
(1) Muestre que si pi > 0 para todo i = 1, . . . , n entonces x(p) es no
vacı́a.
(2) ¿Se puede afirmar lo mismo si algún pi = 0?
(3) ¿Bajo qué condiciones se u se puede asegurar que x(p) es una fun-
ción?
EJERCICIO 4.61. Sea f : R → R, cóncava y tal que f (0) = 0. Construya
un conjunto de producción Y = {(− x, y) ∈ R × R, y ≤ f (x), x ≥ 0}, para
el que exista un plan eficiente (x, f (x)) para P = (1, w) con w1 ≤ w ≤ w2
para w1 y w2 fijos y positivos. Sean m1 = − w12 y m2 = − w11 . Muestre que
∂ f (x) = {m : m1 ≤ m ≤2 }.
EJERCICIO 4.62. Sea f : X → R siendo X ⊂ Rn y f una función C 1 ,
cóncava. Muestre que entonces que si:
(1) Las derivadas parciales de f se anulan en x∗ , entonces x∗ es un
máximo relativo de f . Por lo tanto f ′ (x∗ ) = 0 es necesario y suficiente
para que x∗ sea máximo relativo.
(2) El punto x∗ es un máximo relativo entonces es un máximo global.
EJERCICIO 4.63. Considere una economı́a con dos agentes y dos bienes.
Las dotaciones iniciales de los agentes están dadas por wA = (4, 6), wB = (2, 8)
1 1
y las funciones de utilidad son respectivamente: uA (x1 , x2 ) = x1 x2 y uB = x12 x22 .
(1) Muestre que ambas funciones de utilidad son estrictamente cuasi-
cóncavas en R2+ .
76 4. FUNCIONES CÓNCAVAS Y CUASI-CÓNCAVAS

(2) Obtenga las curvas de nivel y los respectivos gradientes, muestre que
los gradientes son ortogonales a las curvas de nivel respectivas.
(3) Calcule la demanda de cada agente para precios p = (p1 , p2 ).
(4) Muestre que se verifica la ley de Walras, es decir que pz(p) = 0, ∀ p
tal que pi > 0, ∀i ∈ {1, 2} siendo z : R2+ → R2 la función exceso de
demanda.
(5) Obtenga precios y asignación de equilibrio.
EJERCICIO 4.64. Considere una economı́a con dos agentes y tres bie-
nes. Las dotaciones iniciales de los agentes están dadas por wA = (4, 6, 3),
wB = (2, 8, 2) y las funciones de utilidad son respectivamente:
1 1 1
uA (x1 , x2 , x3 ) = x14 + x23 + x32
y
1 1 1
uB = x12 + x22 + 2x32 .
(1) Muestre que ambas funciones de utilidad son estrictamente cóncavas
en R2+ .
(2) Indique las superficies de nivel14 y los respectivos gradientes, muestre
que los gradientes son ortogonales a las curvas de nivel respectivas15.
(3) Calcule la demanda de cada agente para precios p = (1, 2, 3). Esto
corresponde a maximizar las funciones de utilidad de cada agente
en sus respectivas restriccines presupuestarias, siendo la demanda el
punto en el que se alcanza el máximo.
(4) Muestre que se verifica la ley de Walras, es decir que pz(p) = 0, ∀ p :
pi > 0 i ∈ {1, 2}, siendo z : R2+ → R2 la función exceso de demanda.

EJERCICIO 4.65. Sea u(x1 , x2 ) = x1/2


1 x2 la función de utilidad de un
agente cuyas dotaciones iniciales están dadas por w = (1, 2). Suponga que
p = (p1 , p2 ) ∈ R2++ .
(1) Muestre que la función de utilidad es cóncava.
(2) Muestre que la demanda existe y se alcanza sobre la recta p1 xi +
p2 x2 = p1 + 2p2 .
(3) Muestre que si z(p) representa el exceso de demanda del agente16,
entonces pz(p) = 0.

14Es decir: grafique los conjuntos S = ˘ x ∈ R2 : u (x) = k¯ i = 1, 2 ∀k ∈ R.


ik + i
15 ∂ui (x) ∂ui (x) dx2
Es decir que ∂x1
1 + ∂x2 dx1
= 0.
16El exceso de demanda es la diferencia entre demanda y oferta agregada es decir que:
zi (p) = x∗i (p) − wi donde x∗i (p) representa la demandas del i-ésimo agente.
4.11. APÉNDICE: FUNCIONES MITCÓNCAVAS 77

(4) Muestre que la recta definida por p1 xi + p2 x2 = p1 + 2p2 es perpendi-


cular a la dirección definida por el gradiente de la función de utilidad,
evaluado en la demanda del consumidor.
(5) Concluya que (p1 , p2 ) = αgrad u(x1 (p), x2 (p)), siendo α > 0 y
x(p) = (x1 (p), x2 (p)) la demanda del consumidor a precios p.
(6) Calcule a partir del item anterior la demanda del consunidor.
(7) ¿Qué sucederı́a si alguno de los precios fuese cero con la demanda
del consumidor? Justifique su respuesta.

4.11. Apéndice: Funciones mitcóncavas


Introduciremos en esta sección las llamadas funciones mitcóncavas, la mit-
concavidad resulta a veces más sencilla de verificar que la convexidad, y si
además es una función continua, entonces la mitconcavidad es equivalente a
la concavidad de la función.
Definiremos mitconcavidad y diremos que una función f es mitconvexa
si y solamente si − f es mitcóncava.
DEFINICIÓN 4.66. Sea f : X → R definida en X ⊂ Rn , convexo, decimos
que f es mitcóncava si para todo x, y ∈ X se verifica que
 x + y 1
f ≥ [ f (x) + f (y)] .
2 2
TEOREMA 4.67. Sea X un subconjunto convexo de Rn . Una función
f : X → R es mitcóncava si y solamente si: para toda combinación con-
vexa racional se verifica que:
n
! n
X X
(17) f αi xi ≥ αi f (xi ).
i=1 i=1

NOTA 4.68. Resulta inmediato entonces, verificar que una función mitcónca-
va continua, es cóncava. En efecto, la continuidad de la función obliga a que
la desigualdad (17) se verifique también para αi irracional. No obstante es
posible construir, aún para el caso de variable real, funciones mitcóncavas no
continuas. La condición de continuidad para mitcóncavas es la misma ya vista
para funciones cóncavas, esto es la acotación de f en un entorno de algún
punto de su dominio.
Demostración: Es claro que si una función es cóncava entonces es mit-
cóncava. Veamos ahora el recı́proco. Facilmente puede probarse que si f es
78 4. FUNCIONES CÓNCAVAS Y CUASI-CÓNCAVAS

mitcóncava entonces, para n = 2k debe verificar que:


x + x + ··· + x  1
1 2 n
f ≥ [ f (x1 ) + f (x2 ) + · · · + f (xn )] .
n n
Para n = 3 se tiene que:

x1 +x2 +x3 x1 +x2 +x3


1 
(x1 + x2 + x3 ) + (22 − 3)
 
f 3 = f 22 3 ≥
(18)
1 x1 +x2 +x3
f (x1 ) + f (x2 ) + f (x3 ) + (22 − 3) f
 
≥ 22 3 .
Para ver la igualdad en (18), elija x4 tal que
1 1
2
(x1 + x2 + x3 + x4 ) = (x1 + x2 + x3 ),
2 3
 2 
esto implica que x4 = (x1 + x2 + x3 ) 23 − 1 .
Luego para f [ 212 (x1 + x2 + x3 + x4 )] sustituyendo x4 por el valor hallado,
y aplicando la conclusión obtenida para n = 22 se obtiene la desigualdad de
(18). Entonces:
23 − 3
  
x1 + x2 + x3  1
1− 2
f ≥ 2 [ f (x1 ) + f (x2 ) + f (x3 )] ,
2 3 2
o equivalentemente,
3  x1 + x2 + x3  1
f ≥ 2 [ f (x1 ) + f (x2 ) + f (x3 )] .
22 3 2
Para n cualquiera elegimos m tal que 2m−1 ≤ n ≤ 2m y procedemos de
manera análoga al caso n = 3, entonces podemos escribir:
x + x + ··· + x 
1 2 n
f =
 n 
1 m x1 + x2 + · · · + xn )
= f m (x1 + x2 + · · · + xn ) + (2 − n) )
2 n
1 h  x + x + · · · + x i
m 1 2 n
≥ f (x 1 ) + f (x 2 ) + · · · + f (x n ) + (2 − n) f .
2m n
Operando análogamente a lo hecho para el caso n = 3 obtenemos:
x + x + ··· + x  1
1 1 n
f ≥ [ f (x1 ) + f (x2 ) + · · · + f (xn )] .
n n
AhoraP para cualquier conjunto de n racionales αi = pi /qi , i = 1, 3, . . . , n
tales que ni=1 αi = 1, escribiendo ahora αi = ui /d donde d el denominador
4.11. APÉNDICE: FUNCIONES MITCÓNCAVAS 79

común de los αi se tiene que ni=1 ui = d luego:


P
u u2 un 
1
f x1 + x2 + · · · + xn =
d  d d 
1
= f [(x1 + · · · + x1 ) + (x2 + · · · + x2 ) + · · · + (xn + · · · + xn )]
d
habiendo ui sumandos en el paréntesis que ocupa el lugar i. El resultado se
obtiene apelando al caso ya probado. 
Capı́tulo 5
Dualidad y optimización

Es cierto que un matemático que no es un poco poeta, no


será nunca un perfecto matemático.
K. Weierstrass.

En esta sección introduciremos el concepto de funcional como elemento


del espacio dual de un espacio vectorial dado, y daremos la demostración del
teorema de dualidad de Fenchel. Un rico desarrollo de estos conceptos con in-
teresantes aplicaciones a la economı́a el lector puede encontrar en [Aubin, J.P.].
DEFINICIÓN 5.1. Se denomina funcional a una función f : X → R lineal
y real, con dominio en un espacio vectorial X.
Un ejemplo de funcional ampliamente utilizado en economı́a, es el sis-
tema de precios. Precisamente, podemos considerar a un sistema de precios,
simbolizado por p, como una función lineal real (o funcional), que actúa en
un espacio vectorial X en el que está definido el conjunto de consumo de cada
agente de la economı́a, de forma tal que, p : X → R define para cada cesta x
el valor v de la cesta mediante la expresión: px = v. Por lo que dicho número
v representará el valor de la cesta de consumo x, a precios p.
DEFINICIÓN 5.2. El conjunto de los funcionales definidos en un espacio
vectorial X se denomina espacio dual o simplemente el dual de X, y se denota
por X ∗ . Dicho espacio es a su vez un espacio vectorial. Es decir que x∗ ∈ X ∗
si y solamente si x∗ : X → R y es lineal.
El teorema de representación de Riesz dice que todo funcional lineal en
Rn puede ser representado por un vector de Rn en el sentido de que, para
cada x∗ : Rn → R lineal, existe x̄ ∈ Rn tal que x∗ (x) = h x̄, xi, ∀ x ∈ Rn .
Esto es, siendo X = Rn entonces, X ∗ = Rn . Es decir que el dual de Rn es
81
82 5. DUALIDAD Y OPTIMIZACIÓN

él mismo1. En términos del teorema de Riesz, esto es equivalemte a afirmar


que para todo x̄∗ en el dual de Rn , existe x̄ ∈ Rn que lo representa, esto es
x∗ (x) = h x̄, xi ∀ x ∈ Rn .
El lector puede encontrar la demostración del teorema de Riesz, en cual-
quier texto de análisis funcional. Una generalización de dicho teorema con im-
portantes aplicaciones en economı́a puede encontrarse en [Luenberger, D. (a)].
Usaremos la siguiente notación:
(1) Para f funcional convexo, con dominio en C subconjunto convexo de
un espacio vectorial X, usaremos la notación epi[ f, C] para referirnos
al epı́grafo de f . Es decir que
epi[ f, C] = {(s, x) : x ∈ C : s ≥ f (x)} .
(2) Mientras que, para un funcional cóncavo g, definido en un conjunto
convexo D, representamos por sub[g, D] el de g. Es decir definimos
sub[g, D] = {(r, x) : x ∈ D : r ≤ f (x)} .
La demostración de la siguiente proposición queda a cargo del lector.
TEOREMA 5.3. El funcional f, definido en un conjunto convexo C es
convexo, si y solamente si, [ f, C] es convexo. Obsérvese que epi[ f, C] ⊆ R × X.
EJERCICIO 5.4. Enuncie y demuestre el teorema corespondiente, para un
funcional cóncavo.

5.1. Dualidad en problemas de distancias mı́nimas


El principio básico de la dualidad (el que se ilustra en la figura 14) es que:
La distancia mı́nima de un punto x 6∈ K a un conjunto convexo K es igual al
máximo de las distancias desde el punto a los hiperplanos separadores del
punto y el conjunto, al que representaremos por P .
Este principio intuitivamente simple nos permite llegar a un importante
principio de dualidad. Hagamos previamente la siguiente definición:
DEFINICIÓN 5.5. Sea K un conjunto convexo en un espacio normado X.
Llamamos funcional soporte de K al funcional h : X ∗ → R definido como
h(x∗ ) = sup x∈K h x, x∗ i. En general, h(x∗ ) puede ser infinito.
1La demostración de este teorema para el caso de Rn es sencilla. Sea x∗ : Rn → R
un funcional lineal de Rn . Consideremos Pn ahora una base de Rn , sea esta {e1 , . . . , en }. Para
∗ ∗
x = (x1 , . . . , xn ) se obtiene, x (x) = i=1 xi x (ei ) es decir que para todo x ∈ Rn se sigue que
x∗ (x) = h x̄, xi siendo x̄ = (x∗ (e1 ), . . . , x∗ (en )).
5.1. DUALIDAD EN PROBLEMAS DE DISTANCIAS MÍNIMAS 83

Como puede fácilmente convencerse el lector, se verifica que el conjunto


K para todo x∗ , pertenece al semiespacio

S E x∗ = { x ∈ X : h x, x∗ i ≤ h(x∗ )} .

T
Por lo que K ⊆ x∗ ∈X ∗ S E x∗ .

FIGURA 14. Distancia de un punto a un convexo


84 5. DUALIDAD Y OPTIMIZACIÓN

FIGURA 15. Conjunto convexo como intersección de semiespacios

La figura 15, representa dicho funcional, y puede ser interpretado geométri-


camente de la siguiente forma: Dado un elemento x∗ ∈ X ∗ , consideremos la
familia de todos los semi-espacios { x : h x, x∗i ≤ c}. Cuando la constante c
crece, los semiespacios se agrandan. Entonces h(x∗ ) queda definido como el
mı́nimo de los c tales que el semiespacio que define, contiene a K.
A partir de esta observación concluimos en que
\
K= { x : h x, x∗ i ≤ h(x∗ )} .
x∗ ∈X ∗

Obsérvese que si K es una esfera con centro en el origen, entonces h(x∗ )


es igual al radio de la esfera al cuadrado.
En el siguiente teorema expresa analı́ticamente la interpretación geométri-
ca del funcional soporte.
Sea K un conjunto convexo, cuya distancia al cero es finita (ver 3.20).
Sea x∗ ∈ X ∗ tal que k x∗ k = 1 y supongamos que el hiperplano
H x∗ = { x : h x, x∗i ≤ h(x∗ )} es un hiperplano soporte para K que separa el
cero de K. Entonces la distancia del origen a H es igual −h(x∗) ver figura 16.

TEOREMA 5.6. (El problema dual de la norma mı́nima) Sea x1 un punto


en un espacio de Hilbert X y sea d su distancia a un conjunto convexo K con
5.1. DUALIDAD EN PROBLEMAS DE DISTANCIAS MÍNIMAS 85

FIGURA 16. Distancia a un hiperplano soporte y la dualidad

un funcional soporte h, entonces:


d = ı́nf k x − x1 k = máx {h x1 , x∗ i − h(x∗ )} ,
x∈K kx∗ k≤1

donde el máximo en la expresión de la derecha es alcanzado en x∗0 ∈ X ∗ .


Demostración: Sin pérdida de generalidad consideremos x1 = 0. Entonces
debemos mostrar que:
d = ı́nf k xk = máx −h(x∗ ).
x∈K kx∗ k≤1

Obsérvese que solamente debemos preocuparnos por aquellos elementos


de x∗ que hacen que h(x∗) ≤ 0. Pues en otro caso se sigue inmediatamente
que d ≥ −h(x∗ ). Si x∗ es tal que h(x∗ ) < 0 entonces K está contenido
en el semiespacio C x∗ = { x ∈ X : h x, x∗i ≤ h(x∗ )}. Como h0, x∗ i = 0 este
semiespacio no contiene al 0. El hiperplano H x∗ = { x ∈ X : h x, x∗ i = h(x∗ )}
separa K de 0. Sea Bǫ (0) una bola de radio ǫ centrada en 0, tal que Bǫ (0) ∩ C x∗ =
∅. Para cada x∗ ∈ X ∗ tal que h(x∗ ) < 0 y k x∗ k = 1 sea ǫ ∗ (x∗ ) el supremo de
los ǫ > 0 para el que Bǫ (0) ∩ C x∗ = ∅. Obviamente 0 ≤ ǫ ∗ (x∗ ) ≤ d. Se tiene
que h(x∗ ) = ı́nf kxk<ǫ ∗ h x, x∗ i = −ǫ ∗ . Entonces para todo x∗ ∈ X ∗ y k x∗ k = 1
se tiene que −h(x∗ ) ≤ d. Por otra parte K no contiene puntos interiores de
Bd (0), por lo que existe un hiperplano separando K y S (d). Es decir, existe
x∗ : k x∗ k = 1 tal que h(x∗ ) = d. 
86 5. DUALIDAD Y OPTIMIZACIÓN

5.2. Funcionales y conjuntos conjugados


Para un espacio vectorial X representaremos por X ∗ el espacio vectorial forma-
do por todos los funcionales lineales acotados en él definidos. Denominamos
a este espacio vectorial, dual topológico de X. Un funcional lineal L en X se
dice acotado si
kLk = sup |L(x)| < ∞.
kxk≤1

(1) Sea f un funcional convexo definido en un subconjunto convexo C


de un espacio normado X, el conjugado de C respecto de f se define
como:
 
∗ ∗ ∗ ∗
C f = x ∈ X : sup[h x, x i − f (x)] < ∞
x∈C

y el funcional f ∗ con dominio en C ∗f y definido como

f ∗ (x∗ ) = sup[h x, x∗ i − f (x)],


x∈C

se denomina funcional conjugado de f en C.


(2) Para g funcional cóncavo definido en D suconjunto convexo de
un espacio normado X, se define el conjunto D∗ conjugado del
subconjunto D respecto de g como:
 
∗ ∗ ∗ ∗
Dg = x ∈ X : ı́nf h x , xi − g(x)] > −∞
x∈D

y el funcional g∗ conjugado de g como:

g∗ (x∗ ) = ı́nf [h x, x∗ i − g(x)].


x∈D

Nótese que si f = 0 entonces f ∗ define el funcional soporte para C, (ver


definición 5.5). Análogamente para g = 0.

TEOREMA 5.7. El funcional conjugado f ∗ de un funcional convexo, es


convexo, el conjunto conjugado C ∗ es convexo y epi[ f ∗ , C ∗ ] es un conjunto
convexo y cerrado en R × X ∗ . En el caso de ser g un funcional cóncavo, se
verifica que su conjugado es cóncavo, D∗ es convexo y [g∗ , D∗ ] es un conjunto
convexo y cerrado en R × X ∗ .
5.3. INTERPRETACIÓN GEOMÉTRICA DEL CONJUGADO 87

Demostración: Probemos primeramente que f ∗ es convexo. Considere x∗1


y x∗2 elementos duales. Sea x∗ = αx∗1 + (1 − α)x∗2 , entonces:
f ∗ (x∗ ) = f ∗ (αx∗1 + (1 − α)x∗2 ) =
= sup {α[h x, x∗1 i − f (x)] + (1 − α)[h x, x∗2 i − f (x)]} ≤
x∈C
≤ α sup[h x, x∗1 i − f (x)] + (1 − α) sup[h x, x∗2 i − f (x)] =
x∈C x∈C
= α f ∗ (x∗1 ) + (1 − α) f ∗ (x∗2 ).
Veamos ahora que epi[ f ∗ , C ∗ ] es cerrado. Para esto consideremos una sucesión
{(si , x∗i )} de elementos de epi[ f ∗ , C ∗ ] convergente a (s, x∗ ) y probemos que
este punto pertenece a epi[ f ∗ , C ∗ ]. Se tiene que
si ≥ f ∗ (x∗i ) ≥ h x, x∗i i − f (x) ∀ x ∈ C.
Tomando lı́mites para i → ∞ concluimos en que
s ≥ h x, x∗ i − f (x) ∀ x ∈ C.
Luego
s ≥ sup x∈C [h x, x∗ i − f (x)] = f ∗ (x∗ )
por lo que [s, x∗] ∈ [ f ∗ , C ∗ ]. 
Es posible definir el funcional conjugado del conjugado o doble conju-
gado, f ∗∗ = ( f ∗ )∗ .
f ∗∗ = sup {h x, x∗ i − f ∗ (x∗ )} .
x∗
Las siguientes propiedades son consecuencias inmediatas de las definiciones:
(1) f ∗∗ = supx∗ ı́nf y {h x − y, x∗ i f (y)}.
(2) f ∗∗ (x) ≤ f (x) ∀ x.
Se tiene el siguiente teorema sin demostración, ésta puede consultarse en
[Rockafellar, T.].
TEOREMA 5.8. Sea f una función convexa, semicontinua inferior y propia,
entonces f ∗ es convexa y semicontinua inferior y f ∗∗ = f .

5.3. Interpretación geométrica del conjugado


Esta interpretación geométrica es debida a [Luenberger, D. (a)]. Por otra parte,
en [Araujo, A. and Monteiro P.K.(90)] puede encontrarse una interesante apli-
cación a la teorı́a económica para el caso de economı́as definidas en espacios
tales que su cono positivo es de interior vacı́o.
88 5. DUALIDAD Y OPTIMIZACIÓN

FIGURA 17. interpretación geométrica del conjugado

En el espacio R × X los hiperplanos cerrados quedan representados por la


ecuación:
sr + h x, x∗ i = k,
de forma tal que s, k y x∗ determinan un hiperplano. Representamos a R en
el eje vertical, por lo cual el hiperplano es no vertical si intersecta a R
en un sólo punto. Esto es equivalente a considerar hiperplanos definidos por
k y (−1, x∗), pues cualquier hiperplano no vertical queda definido por una
elección adecuada de x∗ y k. Las soluciones (r, x) de la siguiente ecuación para
x∗ fijo, dependen de k
h x, x∗ i − r = k
y describen, al modificarse k, hiperplanos paralelos en R × X. Nótese que
el número f ∗ (x∗ ) es el supremo de los valores de k para el cual el convexo
epi[ f, C] queda comprendido en el semiespacio h x, x∗i − r ≥ k. Es decir
que h x, x∗ i − r = f ∗ (x∗ ) es un hiperplano soporte para el conjunto convexo
epi[ f, C]. Es decir que f ∗ (x∗ ) es el funcional soporte h definido en el dual
(−1, x∗), (ver definición 5.5). Se sigue que f ∗ (x∗ ) = h(−1, x∗). Ahora bien, el
hiperplano
h x, x∗ i − r = f ∗ (x∗ )
intersecta el eje vertical, R, (es decir para x = 0) en en r = − f ∗ (x∗ ). Por lo que
− f ∗ (x∗ ) es la altura del hiperplano sobre el origen, ver figura 17.
5.5. PROBLEMAS DUALES DE OPTIMIZACIÓN 89

5.4. Ejercicios y Aplicaciones


Demuestre que el conjunto P definido en la sección 3.4 es convexo. Asuma
que la función de tecnologı́a es cóncava. Conisdere x∗ ∈ Rl definido por
x∗i = wi /p, siendo wi el precio unitario del insumo i-ésimo y p el precio
unitario del producto.
(1) Interprete en términos económicos h(x∗ ).
(2) Muestre que el beneficio máximo para los precios anteriormente
establecidos, queda definido por el punto de corte del hiperplano
tangente en x̄ tal que h(x∗ ) = h x, x∗ i. Es decir que π(w, p) = − f ∗ (x∗ ).
(3) Resuelva completamente los puntos anteriores para el caso en que
hay un único insumo y un único producto estando la tecnologı́a
1
definida por f (x) = x 2 .

5.5. Problemas duales de optimización


Consideraremos una aplicación de la conjugación al problema de optimiza-
ción, que consiste en resolver. ı́nfC∩D [ f (x) − g(x)], donde f es un funcional
convexo definido en C y g es cóncavo con dominio D. Ambos dominios son
subconjuntos convexos de un espacio vectorial X. Análogamente se puede
considerar el problema de resolver supC∩D [ f (x) − g(x)], donde f es un fun-
cional cóncavo definido en C y g es convexo con dominio D, siendo C y D
subconjuntos convexos de un espacio vectorial X. En las aplicaciones más
frecuentes se considera g = 0.
TEOREMA 5.9. (De dualidad de Fenchel) Sean f y g funcionales respec-
tivamente, convexo y cóncavo definidos en C y D subconjuntos convexos de
un espacio vectorial normado. Supongamos que C ∩ D contiene puntos en
el interior relativo y además que tanto [ f, C] como [g, D] tienen interior no
vacı́o. Supongamos además que
µ = ı́nf { f (x) − g(x)}
x∈C∩D
es finito. Entonces
µ = ı́nf { f (x) − g(x)} = máx {g∗ (x∗ ) − f ∗ (x∗ )} ,
x∈C∩D x∗ ∈C ∗ ∩D∗
donde el máximo de la derecha es alcanzado por algún x∗0 ∈ C ∗ ∩ D∗ . Si
el ı́nfimo a la izquierda de la igualdad anterior, es alcanzado por algún
x0 ∈ C ∩ D. Entonces:
máx[h x, x∗0 i − f (x)] = [h x0 , x∗0 i − f (x0 )]
x∈C
90 5. DUALIDAD Y OPTIMIZACIÓN

y
mı́n[h x, x∗0 i − g(x)] = [h x0 , x∗0 i − g(x0 )].
x∈C

Demostración: Por definición, para todo x∗ ∈ C ∗ ∩ D∗ y x ∈ C ∩ D se


obtiene:
f ∗ (x∗ ) ≥ h x, x∗ i − f (x)
(19)
g∗ (x∗ ) ≤ h x, x∗ i − g(x)
De donde:
(20) f (x) − g(x) ≥ g∗ (x∗ ) − f ∗ (x∗ )
Se obtiene que
(21) ı́nf [ f (x) − g(x)] ≥ sup [g∗ (x∗ ) − f ∗ (x∗ )]
C∩D C ∗ ∩D∗

Ahora la igualdad de la hipótesis puede obtenerse, encontrando x∗0 ∈ C ∗ ∩ D∗


que verifique que: ı́nfC∩D [ f (x) − g(x)] = [g∗ (x∗0 ) − f ∗ (x∗0 )]. Para esto considere
el desplazamiento vertical de [ f, C] definido por [ f − µ, C]. Los conjuntos [ f −
µ, C] y [g, D] están arbitrariamente próximos, pero sus interiores respectivos
son no vacı́os y tienen intersección vacı́a. Podemos entonces aplicar el teorema
de separación de convexos para definir un hiperplano en R × X que los separa
el que podemos representar por (1, x∗0 , c) ∈ R × X ∗ × R. Este hiperplano puede
ser descrito como
H = {(r, x) ∈ R × X : h x, x∗0 i − r = c} .
Siendo que [g, D] está por debajo de H pero arbitrariamente próximo, y
[ f − µ, C] por encima se tiene que
c = ı́nf [h x, x∗0 i − g(x)] = g∗ (x∗0 )
x∈D
y que
c = sup[h x, x∗0 i − f (x) + µ] = f ∗ (x∗0 ) + µ.
x∈C
Luego µ = g∗ (x∗0 )
− f ∗ (x∗0 )
basta entonces que el ı́nfimo µ sea alcanzado en
alguún x0 ∈ C ∩ D. 
En las aplicaciones clásicas se trata, generalmente, de minimizar un fun-
cional convexo restringido a un conjunto convexo C, o bien de maximizar un
funcional cóncavo en un conjunto D convexo. Estos conjuntos C o D forman el
conjunto de restricciones o factible para el problema de optimización corres-
pondiente. Llamaremos a estos problemas problemas primales. Para resolver
5.6. OPTIMIZACIÓN LINEAL 91

cualquiera de los dos problemas mencionados de acuerdo al teorema de Fen-


chel elegimos C = X y g(x) = 0, ∀ x ∈ D, y resolvemos los correspondientes
problemas duales. Por ser g(x) ≡ 0, se tiene que
g∗ (x∗ ) = ı́nf {h x, x∗i}
x∈D

De esta forma para el problema primal, de minimización del funcional convexo,


obtenemos el problema dual, de maximización:
ı́nf { f (x)} = sup {h x, x∗ i − f ∗ (x∗ )} .
x∈D x∗ ∈D∗

En el caso de maximizar el funcional cóncavo el teorema de dualidad toma la


forma
sup { f (x)} = ∗ı́nf ∗ {h x, x∗ i − f ∗ (x∗ )} .
x∈D x ∈D

Estos son los llamados problemas duales. El cálculo de f ∗ es en si mismo un


problema de optimización, no obstante, sin restricciones, pues consideramos
X = C. El cálculo de g∗ es también un problema de optimización, en el que
como elegimos g = 0, se transforma en un problema de optimización con obje-
tivo lineal. Para una aplicación a la teorı́a económica del teorema de dualidad
de Fenchel, ver por ejemplo [Accinelli, E.; Brida, G. Plata, L.; Puchet, M.].

5.6. Optimización lineal


Como otra aplicación de las funciones conjugadas, consideremos la dualidad
en la optimización lineal. Sea B una matriz de m filas por n columnas, a y x
pertenecientes a Rn y b ∈ Rm . Definimos:
(22) α = ı́nf {ha, xi : Bx ≥ b}
x≥0

Con la hipótesis de que existe x̄ tal que B x̄ ≥ b siendo x̄ ≥ 0. Podemos


asegurar entonces que α < +∞. Definimos f : Rn → R como
(
ha, xi si Bx ≥ b, x ≥ 0,
f (x) =
+∞ en caso contrario.
Sea ahora φ : Rn × Rm definida por
(
ha, xi si Bx ≥ b + u, x ≥ 0,
φ(x, u) =
+∞ en caso contrario
92 5. DUALIDAD Y OPTIMIZACIÓN

Se puede probar fácilmente que f y φ son funciones convexas, semicon-


tinuas inferiormente y propias. Se tiene además que f (x) = φ(x, 0) ∀ x Sea
ahora, h(u) = ı́nf x φ(x, u), entonces α = h(0) siendo h convexa.
El subnivel λ de φ(x, u) se define como el conjunto S λ (φ) = {(x, u) ≤ λ},
en este caso
S λ (φ) = {φ(x, u) : ha, xi ≤ λ, Bx − u ≥ b, x ≥ 0} .
El conjunto S λ (φ) es un poliedro convexo. Se tiene que u ∈ S λ (h) si y so-
lamente si, para todo µ > λ existe x tal que φ(x, u) ≤ µ. Se tiene entonces
que
\
S λ (h) = pro ju S µ (φ),
µ>λ

donde la función pro ju : Rn × Rm


→ Rm queda definida por pro ju (x, u) = u, es
decir que pro ju representa la proyección natural del espacio producto Rn × Rm
en su segunda componente. Por ser S λ (h) intersección de cerrados, es el mismo
cerrado, luego h es semicontinua inferior, y por lo tanto h∗∗ = h ver teorema
5.8. Por lo tanto h∗∗ (0) = α = h(0). Calculemos a continuación la conjugada
de h.
n o
h∗ (u∗ ) = sup {hu, u∗ i − h(u)} = sup hu, u∗ i − ı́nf φ(x, u) .
u u x

Luego
h∗ (u∗ ) = sup {hu, u∗ i + h0, x∗ i − φ(x, u)}
x,u

Llegamos a que h∗ (u∗ ) = φ∗ (0, x∗ ). Finalmente:


h∗ (u∗ ) = φ∗ (0, x∗ ) = sup {hu, u∗ i − ha, x∗i : Bx − u ≥ 0, x ≥ 0.} .
u,x

(1) Si u∗ tiene una componente negativa, por ejemplo la i0 elegimos


ui = −(Bx)i − bi , y ui0 → −∞. Entonces h∗ (u∗ ) = ∞
(2) Si u∗ > 0 entonces

h∗ (u∗ ) = sup {h−b + Bx, u∗i − ha, xi} = hb, u∗ i + suph{ x, Bt u∗ − ai.
x≥0 x≥o

Concluimos en que
 h−b, u∗ i si Bt u∗ − a ≤ 0

(23) h∗ (u∗ ) =
+∞ en caso contrario.

5.7. DUALIDAD Y TEORÍA DE JUEGOS 93

Por lo tanto
h∗∗ (0) = sup h0, u∗ i − hb, u∗ i : u∗ > 0, Bt u∗ ≤ a =

u∗
= ı́nf {ha, xi : x > 0, Bx ≤ b} = h(0).
x
Para una demostración de la dualidad en el caso lineal, usando directamente
el teorema de Fenchel ver [Rockafellar, T.].

5.7. Dualidad y teorı́a de juegos


Consideremos un juego estratégico de dos jugadores, estrictamente competiti-
vo, también llamado de suma cero (es decir cada jugador gana o pierde lo que
el otro pierde o gana). Dos jugadores se encuentran enfrentados en un conflicto
cuya resolución depende de lo que cada uno de ellos decida hacer. El jugador 1
al que representaremos como J1 puede escoger en un conjunto de acciones (o
estrategias puras) que llamaremos A1 finito, la acciones posibles de ser elegidas
por este jugador, son representadas por ai ∈ A1 , , i = 1, . . . , n. Análogamente
para el jugador 2, lo denotaremos como J2 y al conjunto de sus acciones
posibles por A2 = {b1 , . . . , bm }. Representamos por u1 (ai , b j ) el retorno que
obtendrá J1 si el elige ai y su oponente b j . Por u2 (ai , b j ) representaremos los
retornos correspondientes a J2. La particularidad del juego es, como ya fue
dicho que lo que uno gana el otro lo pierde, esto es u1 (ai , b j ) + u2 (ai , b j ) = 0.
Supongamos que cada jugador elige sus acciones en forma aleatoria, es de-
cir mediante distribuciones de probabilidad, x = (x1 , . . . , xn ) por parte del juga-
dor 1, e y = (y1 , . . . , ym ) para el jugador 2. El número xi , i = 1, . . . , n representa
la probabilidad de que J1 elija su acción ai . Análogamente yi , i = 1, . . . , m,
representa la probabilidad con que J2 elige su i-ésima acción. Las coordenadas
de los vectores x e y suman respectivamente 1, y son positivas. El conjunto de
todas las distribuciones posibles de ser elegidas las representaremos por P1 y
P2 , en teorı́a de juegos se denomina estrategias mixtas. Cada jugador elegirá la
mejor distribución de probabilidades, considerando que su oponente hace lo
mismo. En una matriz M de entradas gi j representamos lo que el jugador 1
gana (o pierde) en el caso de de que él juegue de acuerdo a la estrategia ai
y su oponente de acuerdo a la estrategia b j . Respectivamente, el jugador 2
ganará hi j en este caso, por ser el juego estrictamente competitivo, se tiene
hi j = −gi j .
El retorno esperado para el jugador 1 asociado al par estratégico (x, y) será
X
u1 (x, y) = xi gi j y j = h xM1 , yi
ij
94 5. DUALIDAD Y OPTIMIZACIÓN

donde M1 representa una matriz de n filas por m columnas, cuyas entradas son
los premios correspondientes al jugador 1. Análogamente el retorno esperado
del jugador 2,
X
u2 (x, y) = xi hi j y j = h xM2 , yi
ij
siendo M2 una matriz de n filas por m columnas. P
Si, por ejemplo, J1 elige x no perderá más que máxy∈P2 i j xi gi j y j .
Análogamente
P la mayor pérdida que puede sufrir J2 si elige y, será igual
al máx x∈P1 i j xigi j y. De esta forma si las siguientes cantidades existen,

µ0 = mı́n x∈P1 máxy∈P2


P
i j x i gi j y j
P
µ0 = máxy∈P2 mı́nx∈P1 i j x i gi j y j

µ0 representará la máxima pérdida a que J1 puede exponerse, mientras que µ0


representará el menor beneficio que J2 puedeP obtener.
De las definiciones se deduce que µ0 ≤ i j x0i gi j y0 j ≤ µ0 . El problema
fudamental es el de la existencia de la posibilidad para la que se verifica
que µ0 = µ0 . Como puede verse si esta posibilidad existe, la solución es
precisamente un equilibro de Nash. Consideraremos el caso en que n = m,
(en forma más general podemos aplicar este teorema a espacios reflexivos)
recuerde que el dual de Rn es el propio Rn (teorema de representación de
Riesz). Resolveremos esta cuestión mediante el teorema de Fenchel.
TEOREMA 5.10. (Del min-max) (Si los conjuntos de estrategias posibles
de ser elegidas P1 y P2 forman conjuntos compactos y convexos, entonces:
X X
mı́n máx xi gi j y j = máx mı́n x i gi j y j .
x∈P1 y∈P2 y∈P2 x∈P1
ij ij

Nótese que para el caso considerado se verifica el teorema pues tanto P1


como P2 son conjuntos compactos y convexos como subconjuntos de Rn .
Demostración. Definamos el funcional f con dominio en Rn :
X
(24) f (x) = máx x i gi j y j .
y∈P2
ij

Una vez que P2 es compacto, para cada x ∈ Rn existe y ∈ P2 solución del


problema 24. El funcional f es convexo y continuo en P1 ; queremos ahora
encontrar un expresión para mı́nx∈P1 f (x).
Usando el teorema de dualidad de Fenchel, partimos del funcional f
definido en C = Rn , definimos g(x) = 0 ∀ x ∈ P1 . Se ve inmediatamente que
5.7. DUALIDAD Y TEORÍA DE JUEGOS 95

P∗1 = Rn , se sigue entonces que


(25) g∗ (x∗ ) = min x∈P1 h x, x∗ i.
Además observemos que C ∗ = P2 . En efecto, supongamos que x∗1 ∈ C ∗ pero
que x∗1 6∈ P2 , entonces, por el teorema de separación de convexos se sigue que
existen α y x̄ ∈ Rn tales que ∗ ∗ ∗

P h x̄, x1 i ∗− h x̄, x i > α > 0 para todo x ∈ P2 .
Luego h x, x1 i − máxx∗ ∈P2 i j x1i gi j x j puede hacerse arbitrariamente grande,
basta con elegir x = k x̄ con k suficientemente grande. Finalmente
sup[h x, x∗1 i − f (x)] = ∞
y por lo tanto x∗1 6∈ C ∗ .
Recı́procamente si: x∗1 ∈ B entonces la expresión:
X
h x, x∗1 i − máx

gi j x∗j ,
x ∈P2
xi
que puede escribirse como
h x, x∗1 i − máx

h xM, x∗i = h x, x∗1 i − máx

h x, M tr x∗ i,
x ∈P2 x ∈P2
alcanza su valor máximo, que es cero, en x = 0. Por lo que f ∗ (x∗ ) = 0.
Finalmente se obtiene:
X
mı́n f (x) = ∗ máx n g∗ (x∗ ) = máx

mı́n xigi j x∗j . 
x∈P1 x ∈P2 ∩R x ∈P2 x∈P1
ij
Capı́tulo 6
La programación no lineal

El punto de partida de la definición de punto crı́tico es la


fórmula: dtd F(u(t)|t=0 = 0.
E. Zeidler.

Es esta la sección central de este trabajo. Precisamente aquı́ demostrare-


mos el teorema de Kuhn-Tucker. Es este teorema clave para la teorı́a de la
optimización y como veremos su demostración requiere, como herramienta
central, del teorema de separación de convexos. Quedará
de esta forma en evidencia la importancia que dicho teorema tiene para la
optimización y por extensión, para la teorı́a económica. Si bien en este trabajo,
el teorema de separación de convexos, fue demostrado en Rn su validez como
ya se dijo enla sección 3.3 es mucho más amplia. En espacios de dimensión
infinita es un corolario del teorema de Hahn-Banach y ası́ se lo puede en-
contrar en muchos textos de análisis funcional, ver por ejemplo [Brézis, H.].
A pesar de lo dicho, muchas de las generalizaciones del teorema de separa-
ción de convexos requieren de atentos cuidados al cumplimiento de todas las
hipótesis requeridas. Una hipótesis de gran importancia y difı́cilmente sosla-
yable, para el cumplimiento de este teorema, es (como ya fue mencionado),
la de que el convexo que se pretende separar debe ser de interior no vacı́o,
hecho este que no siempre se cumple, en particular en espacios de dimesión
infinita. Los llamados conos positivos de muchos espacios de dimensión in-
finita, como por ejemplo L2+ (µ) (el cono positivo del espacio de las funciones
µ−medibles con cuadrado integrable), ampliamente utilizado en la teorı́a de
finanzas, ver por ejemplo [Duffie, D.], son en general conjuntos convexos de
interior vacı́o. Esto obliga a que para resolver algunos problemas propios de la
teorı́a económica, se busquen alternativas a este teorema, véase por ejemplo el
trabajo ya citado [Mas-Colell, A. (86)] o [Araujo, A. and Monteiro P.K. (93)].
Afortunadamente este no es el caso de Rn , cuyo cono positivo tiene, como es
fácilmente verificable, interior no vacı́o.
97
98 6. LA PROGRAMACIÓN NO LINEAL

En muchos problemas de la economı́a y de la ingenierı́a como en general


de la ciencia es necesario maximizar o minimizar funciones reales definidas
en subconjuntos X ⊆ Rn , bajo determinadas restricciones adicionales, como
por ejemplo:

g1 (x) ≥ 0, g2 (x) ≥ 0, · · · , gm (x) ≥ 0

donde cada g j es una función real. Por ejemplo en la teorı́a del consumidor
f : X → R es la función de utilidad, evaluada en cestas de consumo x con n
bienes, X el ortante positivo de Rn , y las restricciones, las determinadas por la
región presupuestaria, M − h p, xi ≥ 0, con x ≥ 0. M es el nivel de ingresos del
consumidor. En muchos otros casos, no sólo en las aplicaciones a la economı́a,
las restricciones comprenden las llamadas restricciones de no negatividad,
esto es que xi ≥ 0 para todas las variables involucradas en el problema. La
existencia de este tipo de restricción da lugar a una forma particular para la
resolución del problema a la que nos referiremos en la observación (6.13).
Si las funciones que intervienen en el problema son lineales, entonces
estamos frente a un problema de programación lineal. Este problema fue
formulado por el matemático ruso Kantorovich, y luego desarrollado en los
Estados Unidos por Dantzig y otros. En cuanto a la programación no lineal el
trabajo seminal es [Kuhn,H.W.; Tucker, A. W.].
Nos restringiremos en el texto generalmente, al problema de maximizar
funciones cóncavas o minimizar funciones convexas con restricciones conve-
xas, pues ası́ se presentan las aplicaciones más frecuentes en teorı́a económica,
por lo que las llamadas condiciones de primer orden serán necesarias y sufi-
cientes para resolver el problema. No obstante en la sección 7.2, analizaremos
brevemente, las llamadas condiciones de segundo orden, suficientes para pro-
blemas con funciones objetivo que no son cóncavas ni convexas.
La relación funcional g j (x) = 0, lineal o no, define (bajo condiciones
bastante generales, [Lima, L.]) una superficie en Rn . Suponga además que,
esta superficie (o curva si n = 1), divide al espacio en dos regiones, una
región que representaremos por A j = { x ∈ Rn : g j (x) ≥ 0}, otra definida como
B j = { x ∈ Rn : g j (x) ≤ 0} y una frontera común a la que llamaremos F r =
{ x ∈ Rn : g j (x) = 0}. El llamado conjunto factible, el que matemáticamente
se representa como: C = { x : x ∈ X, g j (x) ≥ 0, j = 1, 2, . . . , m}, representa las
restricciones impuestas al programa, donde X es un subconjunto del espacio
vectorial en el que se está trabajando, en nuestro caso de Rn . Nótese que C =
∩nj=1 A j ∩ X. En general las técnicas de optimización transforman problemas con
un cierto número de variables y restricciones, en problemas de optimización
con menos restricciones pero más variables. Es este punto de vista el que hace
6.1. PROGRAMACIÓN CÓNCAVA. PUNTO SILLA 99

que el concepto de punto de ensilladura sea fundamental en la programación


convexa.
En principio, puede suceder que el conjunto C fuese vacı́o, esto es que
no exista x ∈ X que satisfaga a la vez a todas las condiciones de factibilidad.
Suponga que C = 6 ∅, entonces el programa no lineal, consiste en maximizar la
función objetivo: f (x) sobre el conjunto no vacı́o C . Si el punto x̄, que resuelve
el programa pertenece al interior de la región Ah decimos que la restricción h
es inactiva, contrariamente las restricciones Ai se dicen activas, si se verifica
que gi ( x̄) = 0.
El conocido problema de Lagrange o Euler, que consiste en maximizar una
cierta función real, con restricciones siempre activas g j(x) = 0, j = 1, 2, . . . , m;
no puede considerarse como un caso particular del programa no lineal expuesto
sustituyendo las restricciones g j (x) = 0 por g j (x) ≥ 0 y −g j (x) ≥ 0. Veremos
que esto inhabilita la mayorı́a de las llamadas condiciones de cualificación.
Las siguientes preguntas son las que aparecen naturalmente en un programa
de maximización no lineal:
(1) ¿Es el conjunto C no vacı́o ? Esto es, ¿existe un punto factible?
(2) ¿Existe una solución x̄? Es decir, ¿existe al menos un punto en el
conjunto factible, que maximice a la función objetivo?
(3) En caso de existir solución, ¿es ésta única?
(4) ¿Existen algoritmos que permitan hallar la solución?
En todo lo que sigue asumiremos que las funciones que aparecen son
propias. (Ver definción 4.9).

6.1. Programación cóncava. Punto silla


En esta sección caracterizaremos la solución del programa de maximización
no lineal, cuando se trata de maximizar una función objetivo cóncava sujeto a
restricciones que definen un conjunto factible convexo. Sea X un subconjunto
convexo de Rn . Observe que si g : X → R define una función cóncava, entonces
el conjunto S u = { x ∈ X : g(x) ≥ u} define un conjunto convexo. Por lo que
para n funciones gi : X → R, i = 1, . . . , n cóncavas, se tiene que, el conjunto
S , definido por la intersección de todos los S ui i , S = ∩ni=1 S ui i , es un conjun-
to convexo, siendo S ui i = { x ∈ X : gi (x) ≥ ui }, i = 1, . . . , n. En la mayorı́a
de los problemas que analizaremos, el conjunto factible aparecerá definido de
esta forma.
Comenzaremos analizando el comportamiento de punto silla, el que carac-
terizará a la solución de nuestro problema. Su caracterı́stica principal es la de
100 6. LA PROGRAMACIÓN NO LINEAL

FIGURA 18. La silla de montar

definir un máximo relativo de una determinada función restringido a una de-


terminada dirección y ser a la vez un mı́nimo de la misma función en otra
dirección.
DEFINICIÓN 6.1. Sea Φ(x, y) una función a valores reales definida en X × Y
donde x ∈ X e y ∈ Y. Un punto ( x̄, ȳ) en X × Y se llama punto de silla de
Φ(x, y) si:

Φ(x, ȳ) ≤ Φ( x̄, ȳ) ≤ Φ( x̄, y), ∀ x ∈ X, y ∈ Y


Es conocida la imagen que representa al punto silla a través del dibujo de
una silla de montar, figura 18, pero no es esta la única posibilidad como se
demuestra en el ejemplo 6.2.
EJEMPLO 6.2. La siguiente descripción corresponde a la figura 19. donde
el (0, 0) es un punto de silla:
Φ(x, y) = 1 − x + y, 0 ≤ x ≤ 1, 0 ≤ y ≤ 1.

EJERCICIO 6.3. Suponga que el punto S = ( x̄, ȳ) es un punto de silla de la


función dos veces derivable1 Φ : R2 → R. ¿Qué propiedades deben verificar
las derivadas parciales en el punto S ? ¿Es la matriz hessiana definida positiva
o negativa?
1Entendemos que la función es dos veces derivable en un punto, si existen en el punto
todas las derivadas hasta el segundo orden.
6.2. UN TEOREMA PREVIO AL DE KUHN-TUCKER 101

FIGURA 19. Punto de silla

6.2. Un teorema previo al de Kuhn-Tucker


El objetivo de esta sección y la siguiente es la demostración rigurosa del
teorema de Kuhn-Tucker, de forma tal de comprender sus posibilidades y li-
mitaciones para resolver diferentes tipos de problemas de optimización y com-
prender las caracterı́sticas de las soluciones. Comenzaremos considerando un
teorema previo, que nos permitirá demostrar el teorema de Kuhn-Tucker en
forma directa.
Al siguiente teorema lo llamaremos teorema fundamental pues muchas
de las técnicas que utilizaremos para resolver problemas de optimización que
involucren funciones cóncavas o convexas se basan en él. En particular en la
demostración del teorema de Kuhn-Tucker se utiliza fuertemente este teorema.

TEOREMA 6.4. (Fundamental de optimización) Sea X un conjunto con-


vexo en Rn y sean f1 , f2 , . . . , fm funciones cóncavas, reales, definidas en X. Si
el sistema:
fi (x) > 0, i = 1, 2, . . . , m
102 6. LA PROGRAMACIÓN NO LINEAL

no admite soluciones x ∈ X, entonces existen coeficientes p1 , p2 , . . . , pm , no


negativos y que no se anulan simultáneamente, para los que se verifica la
desigualdad siguiente:
m
X
(26) p f (x) = pi fi (x) ≤ 0 ∀ x ∈ X.
i=1
Siendo p = (p1 , p2 , . . . , pm ), y f (x) = ( f1 (x), f2 (x), . . . , fm (x)).
Demostración: Dado un punto x ∈ X definimos el conjunto Z x como:
Z x = {(z1 , z2 , . . . , zm ) ∈ Rm ; zi < fi (x) i = 1, 2, . . . , m}
Consideremos ahora el conjunto Z definido por:
Z = ∪ x∈X Z x
El conjunto Z no contiene al cero y es convexo. En efecto, si contuviera al
cero el sistema fi (x) > 0, i = 1, 2, . . . , m, tendrı́a solución, lo que es una
contradicción. Para probar la convexidad, suponga que z1 ∈ Z x1 y z2 ∈ Z x2
entonces
λz1 + (1 − λ)z2 ≤ λ f (x1 ) + (1 − λ) f (x2 ) ≤ f (λx1 + (1 − λ)x2 ).
Entonces, haciendo uso el teorema de separación (3), sección 3.3, sabemos
que existe p̄ tal que h p̄, zi ≥ h p̄, 0i = 0 para todo z ∈ Z
Como z j puede tomarse tan negativo como se quiera, obtenemos p̄ ≤ 0.
Consideramos a continuación p = − p̄. Se sigue que h p,Pzi ≤ 0 para todo z ∈ Z.
m
Finalmente consideremos
Pm z j = f j (x) − ǫ j . Obtenemos
Pm i=1 p j [ f j (x) − ǫ j ] ≤ 0,
esto supone que i=1 p j f j (x) < ǫ, donde ǫ = Pi=1 p j ǫ j . Como esta relación
vale para cualquiera sea ǫ concluimos con que m i=1 p j f j (x) ≤ 0. 

6.3. El teorema de Kuhn-Tucker


TEOREMA 6.5. (De Kuhn-Tucker, Uzawa) Sean f, g1 , g2 , . . . , gm funcio-
nes reales y cóncavas definidas en un conjunto convexo X ⊂ Rn . Supongamos
que en x̄, f alcanza su máximo, sujeto a las restricciones gi (x) ≥ 0, i =
1, 2, . . . , m. Entonces, existen coeficientes, p̄0 , p̄1 , . . . , p̄m , ninguno de ellos
negativo y no todos iguales a cero, tales que:
p̄0 f (x) + p̄g(x) ≤ p̄0 f ( x̄) ∀ x ∈ X
donde p̄ = ( p̄0 , p̄1 , . . . , p̄n ) y g(x) = (g1 (x), g2 (x), . . . , gm (x)).
Pm Además p̄g( x̄) = 0. Pudiéndose elegir los coeficientes p̄i tales que
i=0 p̄i = 1.
6.3. EL TEOREMA DE KUHN-TUCKER 103

Demostración: La prueba de este teorema, sigue de aplicar el teorema


fundamental al sistema:
gi (x) ≥ 0, i = 1, 2, . . . , m

f (x) − f ( x̄) > 0


para x̄ ∈ X que maximiza a f . Este sistema no tiene solución, por lo tanto,
tampoco lo tendrá el sistema que resulta del anterior sustituyendo desigual-
dades por desigualdades estrictas. La primera afirmación resulta entonces de
aplicar ahora el teorema fundamental a este último sistema.
Para probar la segunda afirmación, considere la desigualdad:
m
X
p̄0 [ f (x) − f ( x̄)] + p̄i gi (x) ≤ 0, ∀ x ∈ X
i=1
o lo que es lo mismo:
p̄0 f (x) + p̄g(x) ≤ p̄0 f ( x̄), ∀ x ∈ X
sustituya ahora x por x̄ en la desigualdad anterior. La afirmación sigue del
hecho de que p̄ ≥ 0 y g( x̄) ≥ 0. 
Llamaremos en lo que sigue, a los coeficientes p̄0 , p̄1 , . . . , p̄m , multipli-
cadores de Kuhn-Tucker.
COROLARIO 6.6. Supongamos que se satisfacen además de las condiciones
del teorema anterior las siguientes:
(S) (de Slater) Existe x̃ ∈ X tal que gi ( x̃) > 0, i = 1, 2, . . . , m. Entonces
tenemos que p̄0 > 0.
(SP) Si se satisface (S) ası́ como las condiciones del teorema,
entonces existen coeficientes λ̄ = (λ̄1 , λ̄2 , . . . , λ̄m ) tales que:
Φ(x, λ̄) ≤ Φ( x̄, λ̄) ≤ Φ( x̄, λ), para todo x ∈ X y λ ≥ 0, donde

Φ(x, λ) = f (x) + λg(x), con λ = (λ1 , λ2 , . . . , λm ), siendo λ j = p̄0j .
En otras palabras, ( x̄, λ̄) es un punto de silla para Φ(x, λ).
Demostración: La demostración se hace por el absurdo, suponga que
p̄0 = 0, obtenemos p̄g(x) ≤ 0, ∀ x ∈ X, en particular p̄g( x̃) ≤ 0, lo
que obviamente contradice el supuesto de ser x̃ un punto interior de la región
factible.
La segunda parte se sigue inmediatamente de que: p̄g( x̄) = 0, g( x̄) ≥ 0 y
p ≥ 0. 
NOTA 6.7. La condición S es conocida como condición de Slater. Si esta
condición no se verifica, entonces el corolario no necesariamente se cumple.
104 6. LA PROGRAMACIÓN NO LINEAL

Considere el siguiente problema: Maximizar f (x) = x, x ∈ R sujeto a: g(x) =


− x2 ≥ 0. Claramente x̄ = 0 es la solución, no obstante puede observarse que,
(0, λ̄) no es punto de silla de Φ(x, λ) = f (x) + λg(x) para ningún λ no negativo.
(Obsérvese que ∂Φ∂x evaluada en x = 0 es positiva, para cualquier valor de λ).
La función Φ(x, λ) = f (x)+λg(x), o la no tan usual Φ(x, p) = p0 f (x)+pg(x)
definida en X × Rm + , es llamada el lagrangiano de f.
Se tiene el recı́proco del corolario recién probado:
TEOREMA 6.8. Sean f, g1 , g2 , . . . , gm , funciones reales definidas en
X ⊂ Rn . Si existe un punto ( x̄, λ̄) ∈ X × Rm
+ punto de silla para el lagrangiano
del problema de maximizar f , sujeto a g j (x) ≥ 0, j = 1, 2, . . . , m entonces:
(i) El punto x̄ maximiza f sujeto a las restricciones.
(ii) λ̄g( x̄) = 0. Nótese que esta condición implica λ̄i gi ( x̄) = 0
∀ i ∈ (1, 2, . . . , m).
Demostración: La desigualdad Φ( x̄, λ̄) ≤ Φ( x̄, λ), ∀λ ∈ Rm + implica
λ̄g( x̄) ≤ λg( x̄), ∀λ ∈ Rm + , por lo tanto (basta elegir λ = 0) λ̄g( x̄) ≤ 0, co-
mo λ̄ ∈ Rm + y x̄ verifica las restricciones, se sigue (ii).
Luego, g j ( x̄) ≥ 0, j = 1, 2, . . . , m, tomando λ = 0 en la desigualdad de
arriba, obtenemos λ̄g( x̄) = 0. Esto es (ii) se cumple.
Ahora de la desigualdad Φ(x, λ̄) ≤ Φ( x̄, λ̄), ∀ x y de (ii) se sigue que
f ( x̄) − f (x) ≥ 0 para toda x ∈ X tal que g j (x) ≥ 0, j = 1, 2, . . . , m. 
NOTA 6.9. Nótese que los multiplicadores de Kuhn-Tucker, correspon-
dientes a restricciones inactivas, son ceros. La condiciones (ii) del teorema
(6.8), suelen llamarse condiciones de complementariedad.
Combinando este teorema y el corolario anterior, obtenemos el siguiente
resultado:
TEOREMA 6.10. Sean f, g1 , g2 , . . . , gm , funciones cóncavas definidas sobre
un conjunto convexo X ⊂ Rn . Suponga además que se cumple la condición de
Slater (S). Entonces x̄ maximiza a f sujeto a g j (x) ≥ 0, j = 1, 2, . . . , m, si y
sólo si existe λ̄ ≥ 0 tal que ( x̄, λ̄) que es un punto silla del lagrangiano Φ(x, λ)
para x ∈ X y λ ≥ 0 y tal que λ̄g( x̄) = 0.

6.4. Caracterización por las condiciones de primer orden


En esta sección asumiremos que las funciones f, g1 , g2 , . . . , gm ; reales, tienen
dominio en un conjunto X ⊂ Rn , y que son diferenciables2 en X.
2Esto es derivables, con derivadas parciales continuas.
6.4. CARACTERIZACIÓN POR LAS CONDICIONES DE PRIMER ORDEN 105

Discutiremos sobre las siguientes condiciones llamadas de primer orden:


(M) (Condición de Máximo) Existe x̄ ∈ X que maximiza a f sujeto a:
g j (x) ≥ 0, j = 1, 2, . . . , m; con x ∈ X.
(SP) (Condición de Punto de Silla) Existe ( x̄, λ̄) en X × Rm + , punto de silla
de Φ(x, λ) = f (x) + λg(x).
(CPO) (Condiciones de Primer Orden) Existe un ( x̄, λ̄) en X × Ωn tal que
f¯x + λ̄ḡ x = 0, g( x̄) ≥ 0 y λ̄g( x̄) = 0.
Obsérvese que la condición f¯x + λ̄ḡ x = 0 puede escribirse como:
m
X ∂g j
∂f
( x̄) + λ̄ j ( x̄) = 0, i = 1, 2, . . . , n
∂xi ∂xi
j=1

donde las derivadas parciales se evaluan en x = x̄.


TEOREMA 6.11. Sean f, g1 , g2 , . . . , gm , funciones reales y diferenciables
en un subconjunto abierto X ⊂ Rn .
(i) La condición (SP) implica las (CPO)
(ii) Si además las funciones son todas cóncavas, y X convexo entonces
se cumple el recı́proco, esto es (CPO) implica (SP).
Demostración:
(i) Por hipótesis Φ(x, λ̄) ≤ Φ( x̄, λ̄) para todo x ∈ X. Se sigue que
Φ x ( x̄, λ̄) = f¯x + λ̄ḡ x = 0. Además por el teorema 6.8, se sigue
que λ̄ḡ x = 0. Finalmente de Φ( x̄, λ̄) ≤ Φ x ( x̄, λ), para todo λ ≥ 0
se sigue que g( x̄) ≥ 0.
(ii) Por ser Φ(x, λ) combinación lineal no negativa de funciones cónca-
vas, ella misma es cóncava, luego como Φ x ( x̄, λ̄) = 0 se sigue que
Φ(x, λ̄) ≤ Φ( x̄, λ̄) para todo x ∈ X. Por último, por ser λ̄.g( x̄) = 0,
obtenemos Φ( x̄, λ̄) ≤ Φ( x̄, λ) para todo λ ≥ 0, y g( x̄) ≥ 0. 
Combinando este teorema con el corolario del teorema de Kuhn-Tucker
Uzawa obtenemos el siguiente resultado:
TEOREMA 6.12. Sean f, g1 , g2 , . . . , gm , funciones cóncavas y diferencia-
bles en un conjunto convexo abierto, X ⊂ Rn . Asuma que se cumpla la
condición de Slater, entonces se verifica (M) si y sólo si se verifican (CPO).
Las relaciones entre, (M), (SP), (CPO) son representadas en la figura 20.
NOTA 6.13. En economı́a es frecuentemente necesario, usar la restricción
x ≥ 0, junto a otras como g j (x) ≥ 0, j = 1, 2, . . . , m, en este caso la condi-
ción (CPO) se presenta de la siguiente manera:
106 6. LA PROGRAMACIÓN NO LINEAL

FIGURA 20. Las relaciones entre, (M), (SP), (CPO)

Existen x̄, λ̄ y µ̄ tales que:


∂ f ( x̄) ∂g( x̄)
+ λ̄ + µ = 0, ∀i = 1, 2, . . . , n,
∂xi ∂xi
λ̄g( x̄) + µ̄ x̄ = 0
y además:
g( x̄) ≥ 0, x̄ ≥ 0,
λ̄ ≥ 0, µ̄ ≥ 0.
Esta condición puede transformarse en la expresión equivalente:
Existen x̄ ≥ 0, λ̄ ≥ 0 tales que:
∂ f ( x̄)
∂xi + λ̄ ∂g( x̄)
∂xi ≤ 0, [ ∂∂x
f ( x̄)
i
+ λ̄ ∂g( x̄)
∂xi ] x̄i = 0 i = 1, 2, . . . , n

µ̄i x̄i = 0 λ̄i gi ( x̄) = 0, g( x̄) ≥ 0.


EJEMPLO 6.14. Un caso sencillo común en la teorı́a del consumidor se
presenta cuando se trata de encontrar la demanda de un agente, que maximiza
una función de utilidad u : Rn+ → R en su restricción presupuestaria. Considere
el lector los siguientes casos:
(1) u : R2 → R definida como u(x1 , x2 ) = ax1 + bx 2 con la restricción
presupuestaria B = x ∈ R2+ : 2x1 + 3x2 ≤ 5 obtenga la solu-

ción para el problema de maximizar
máx u(x1 , x2 ), sujeto a la condición (x1 , x2 ) ∈ B,
x1 ,x2
discutiendo en función de a y b.
(2) u : R2 → R definida como u(x1 , x2 ) = xa1 xb2 para 0 ≤ a, b ≤ 1 con la
restricción presupuestaria anterior obtenga la solución al problema
de maximizar u(x1 , x2 ), s.a (x1 , x2 ) ∈ B.
Como habitualmente, Rn+ simboliza el cono positivo de Rn .
6.5. CONDICIONES DE CUALIFICACIÓN 107

6.5. Condiciones de cualificación


En el teorema 6.12 se analiza la relación existente entre la existencia de un
máximo y las condiciones de primer orden (CPO), pasando por la condición
de Slater y la concavidad de las funciones involucradas. El trabajo original de
Kuhn y Tucker relaciona, la existencia del máximo y las condiciones de primer
orden directamente. Se buscan en este trabajo, condiciones necesarias para la
optimalidad, es decir condiciones que aseguran que un óptimo verifica las
llamadas CPO. Las condiciones que aseguran esto, son llamadas condiciones
de cualificación. Sin que estas condiciones se verifiquen no es necesariamente
cierto que si un punto x∗ resuelve un determinado programa de optimización
las condiciones de primer orden (CPO),

fx (x∗ ) + λ∗ g x (x∗ ) = 0, (A)

(27) λ∗ g(x∗ ) = 0, (B)

λ∗ ∈ Rn+ , (C ′ )

deban verificarse. Es decir, la afirmación: las condiciones de primer orden,


son necesarias para un máximo restringido no es necesariamente cierta. No
obstante, sı́ es cierto, que si modificamos la expresión (27 (A)) y consideramos
en lugar de (27), el sistema

λ0 fx (x∗ ) + λ∗ g x (x∗ ) = 0, (A′ )

(28) λ∗ g(x∗ ) = 0, (B)

λ0 ∈ R, λ∗ ∈ Rn+ , (C ′ )

siendo (λ0 , λ∗ ) ∈ Rn+1 los multiplicadores de Kuhn-Tucker, admitiendo la


posibilidad de que λ0 = 0, entonces la condición de máximo siempre implica
estas CPO modificadas. En definitiva, las condiciones de calificación son las
que garantizan que λ∗0 sea positiva, lo que permite elegir λ0 = 1. Obsérvese
que basta la independencia lineal de los vectores compuestos por al derivadas
parciales de las restricciones, es decir de los gradientes de las restricciones
evaluadas en el punto, grad gi (x∗ ), i = 1, 2, . . . , n, para que sea λ∗0 6= 0.
Para seguir este camino precisamos definir punto regular o las llamadas
condiciones de cualificación para un punto en el conjunto factible. Existen
varios conjuntos de condiciones que permiten cumplir con este objetivo. Intro-
duciremos primeramente los definidos por Kuhn-Tucker. A los efectos de no
108 6. LA PROGRAMACIÓN NO LINEAL

complicar excesivamente el lenguaje, nos limitaremos al caso en que las res-


tricciones son funciones reales definidas en X. El lector interesado en estudiar
casos más generales en los que se puede aplicar el teoram de Kuhn-Tucker
puede referirse a [Luenberger, D. (a)]. Es importante remarcar que una con-
dición necesaria para que el teorema de Kuhn-Tucker pueda aplicarse, es que
el conjunto Z, codominio de G, sea un espacio normado cuyo cono positivo
tenga interior no vacı́o. Entendiendo como G la aplicación con dominio en
X y recorrido en Z que define la restricción G(x) ≤ 0. En nuestro caso G
está definida por las restricciones g(x) = (g1 (x), . . . , gk (x)). Esta condición se
cumple automáticamente cuando Z = Rk .
DEFINICIÓN 6.15. Condición de Kuhn-Tucker K Sea C el conjunto fac-
tible, C = { x : x ∈ X, g j (x) ≥ 0, j = 1, 2, . . . , m}, siendo cada g j : X → R.
Un punto x̄ ∈ C se dice regular para C si x̄ ∈ C y si existe h ∈ X tal que
g( x̄) + g′ ( x̄, h) > 0, donde g′ ( x̄, h) = (grad g1 ( x̄)h, . . . , grad gk ( x̄)h), repre-
senta, el vector formado por los valores de las derivadas direccionales de las
restricciones activas, evaluadas en x̄ en la dirección de h.
Esta condición es ilustrada en el ejemplo que sigue, ver figura 21.
EJEMPLO 6.16. Considere g1(x) = x2 ; g2 (x) = x1 ; g3 (x) = − x2 − (x1 − 1)3 .
El punto (1, 0) no es regular, desde que los gradientes de g1 y g3 van en direccio-
nes opuestas. La condición de regularidad es una condición de independencia
lineal, elimina a los puntos donde los lı́mites de la región factible forman
cúspides.
Haremos uso, en esta sección y más adelante, del llamado Lema Farkas-
Minkowski.
LEMA 6.17. (Farkas-Minkowski) Sea a1 , a2 , . . . , am y b 6= 0, elementos
de Rn . Supongamos que bx ≥ 0 para todo x tal que ai x ≥ 0, i = 1, 2, . . . , m.
m
Entonces existePnλ̄ ∈ R+ cuyas coordenadas no se anulan simultáneamente y
tales que b = 1=1 λ̄i ai .
Pn i

Demostración: Sea K = i=1 αi a , αi ∈ R+ , i = 1, 2, . . . , n , el cono po-
liédrico generado por a1 , a2 , . . . , an . Entonces K es un conjunto cerrado. Que-
remos ver que b ∈ K. Supongamos que no. Entonces existen p y β tales que
px ≥ β y pb < β. Como K es un cono se tiene que si x ∈ K entonces
θx ∈ K para todo θ ∈ R+ luego p(θx) ≥ β luego px ≥ β/θ haciendo θ → ∞ se
concluye que px ≥ 0 para todo x ∈ K y pb < 0. Esto contradice el supuesto.
Finalmente, b ∈ K. 
6.5. CONDICIONES DE CUALIFICACIÓN 109

FIGURA 21. Un punto no regular

TEOREMA 6.18. (De Kuhn-Tucker generalizado) Sean las funciones


f, g1 , g2 , . . . , gm diferenciables en un subconjunto X de Rn abierto y conve-
xo. Supongamos que x0 es regular, entonces, si x0 verifica (M), existe λ∗0 ≥ 0
tal que x0 es un punto estacionario del lagrangiano:
f (x) + λ∗0 g(x),
más aún: λ∗0 g(x) = 0.
Demostración: En el espacio W = R × Rm definimos los conjuntos:
A = (r, z) : r ≤ grad f (x0 )h; z ≥ g(x0 ) + g′ (x0 , h) para algún h ∈ X


B = {(r, z) : r ≥ 0, z ≥ 0} .
Los conjuntos A y B son convexos, pero el conjunto A no contiene nigún punto
en su interior que sea interior de B. Pues si esto fuera posible, existirı́a un
punto x̄ = x0 + αh y por lo tanto en el interior de la región factible tal que
f ( x̄) > f (x0 ), lo que contradice la optimalidad de x0 . De acuerdo al teorema
de separación de convexos 3.23, existe un hiperplano cerrado que separa los
110 6. LA PROGRAMACIÓN NO LINEAL

conjuntos A y B, es decir existen r0 , λ∗0 , y c tales que:


r0 r + hz, λ∗0 i ≤ c para todo (r, z) ∈ A

r0 r + hz, λ∗0 i ≥ c para todo (r, z) ∈ B.


Como (0, 0) está en A y en B se sigue que c = 0. Por las caracterı́sticas de B te-
nemos que r0 ≥ 0 y z∗0 ≥ 0. Más aún como existe h tal que g(x0 ) + g′ (x0 , h) > 0
entonces debe ser r0 6= 0. Por lo que no hay pérdida de generalidad si conside-
ramos a r0 = 1. Se sigue entonces que:
(29) grad f (x0 )h + hg(x0 ) + g′ (x0 , h), λ∗0 i ≤ 0
para todo h ∈ X. En particular si h = 0 tenemos que hg(x0 ), λ∗0 i ≤ 0 como
g(x0 ) ≥ 0 entonces λ∗0 ≥ 0 implica que hg(x0 ), λ∗0 i ≥ 0 por lo que se sigue que:
hg(x0 ), λ∗0 i = 0. Luego como la inecuación (29) se verifica para todo h ∈ X,
teniendo en cuenta la linealidad de las operaciones involucradas, llegamos a
que: grad f (x0 )h + hg(x0 ) + g′ (x0 , h), λ∗0 i = 0. 
Como puede verse a través de una serie de casos, (ver por ejemplo el
caso citado a continuación, ejemplo 6.22), si no se cumple la condición de
regularidad, no es posible en primera instancia, concluir que un punto que
verifique la condición de ser un máximo para un programa de maximización
sea un punto de silla del correspondiente lagrangiano.
En la búsqueda de condiciones de cualificación esto es de condiciones
que impliquen que la solución de un programa de optimización verifique
(CPO), la condición de regularidad de Kuhn-Tucker juega un papel importante.
Pero no es particularmente fácil de verificar. Afortunadamente, no es la única
que garantiza que en un máximo se satisfacen las condiciones de primer
orden, obsérvese que del teorema 6.12 se concluye que la concavidad de las
funciones f y g j , j = 1, 2, . . . , m, y la condición de Slater, garantizan que en un
máximo restringido se cumplen las condiciones de primer orden, esto es (M)
implica (CPO). Demostraremos más adelante que la cuasi-concavidad de las
funciones gi , i = 1, 2, . . . , m sustituye a la condición de regularidad. Este es el
teorema de Arrow-Enthoven 8.3. Condiciones alternativas pueden encontrarse
en [Arrow, K.; Hurwicz, L,; Usawa, H.] y en [Takayama, A.].
Las siguientes condiciones introducidas por primera vez en el trabajo
de [Arrow, K.; Hurwicz, L,; Usawa, H.] dispensan la utilización de las condi-
ciones de regularidad en Kuhn-Tucker. Las llamaremos condiciones fuertes
(AHUf). Como habitualmente, la notación g′j (x) representa el vector de deri-
vadas parciales de la función g j evaluada en x.
(1) Condición (CV). Todas las gi (x), i = 1, 2, . . . , m, son convexas y
existe x̄ tal que ∀i severifica que gi ( x̄) < 0.
6.5. CONDICIONES DE CUALIFICACIÓN 111

(2) Condición (CO). Todas las gi (x), i = 1, 2, . . . , m, son cóncavas y


además se cumple la condición de Slater.
(3) Condición (CI). El conjunto C = { x : g(x) ≥ 0, j = 1, 2, . . . , m, x ∈ Rm }
es convexo y posee un punto interior, y además g′j ( x̄) 6= 0 siendo para
toda j tal que g j sea efectiva, es decir g j ( x̄) = 0.
(4) Condición (R). La matriz formada por los gradientes de las restric-
ciones efectivas evaluadas en el óptimo, tiene rango máximo.
La demostración de que estas condiciones dispensan la verificación de la
regularidad de Kuhn-Tucker, puede encontrarse en la obra citada y no la hare-
mos acá.
No obstante, el lector puede intentar demostrar que las condiciones an-
teriores implican la condición (AHU), la que introduciremos a continuación.
Esta condición es suficiente para que M implique (CPO). Es decir que, si x∗
resuelve el programa de optimización (esto es, es un máximo), entonces se
verifican para este punto las condiciones de primer orden (CPO), esto es el
contenido del teorema 6.20.
DEFINICIÓN 6.19. (Condición AHU) Definimos el conjunto de ı́ndices:
E = { j ∈ {1, 2, . . . , m} : g j (x) = 0}. La condición AHU se verifica si existe un
h∗ ∈ Rn tal que
grad g j (x∗ )h∗ ≥ 0 ∀ j ∈ J y grad g j (x∗ )h∗ > 0 ∀ j ∈ J ′
Donde J ⊂ E representa el conjunto de las restricciones activas convexas,
mientras que J ′ ⊂ E representa el conjunto de las restricciones activas no
convexas.
Como ya fue indicado, el siguiente teorema introduce esta condición como
alternativa a la de regularidad dada en el teorema de Kuhn-Tucker, es de más
fácil verificación y es implicada por cualquiera de las cuatro condiciones dadas
anteriormente. Utilizaremos la notación fx∗ para referirmos a las derivadas par-
ciales de f envaluadas en x = x∗ , mientras que fx∗ h indicará la derivada direc-
cional, en la dirección h evaluada en x∗.
TEOREMA 6.20. (De Arrow-Hurwicz-Uzawa) Sean f, g1 , . . . , gm , funcio-
nes reales diferenciables definidas en X ⊂ Rn abierto y convexo. Supongamos
que la condición (AHU) se verifica. Entonces si en x∗ se alcanza el máximo
del programa de maximización,
max f (x); restringido a: gi (x) ≥ 0, i = 1, 2, . . . , m; x ∈ X,
existe λ∗ tal que el par (x∗ , λ∗ ) verifica las (CPO).
(La siguiente demostración es debida a L. Hurwicz) Demostración:
112 6. LA PROGRAMACIÓN NO LINEAL

(i) Supongamos que gi (x) > 0, ∀i. Se sigue que λi = 0, ∀i, y entonces
fx∗ = 0 y CPO se verifica.
(ii) Admitamos entonces que E 6= ∅. Siendo x∗ un máximo para f se
sigue que f (x∗ + h∗ t) − f (x∗ ) ≤ 0. Se sigue que, fx∗ h∗ ≤ 0. Ahora
como h∗ verifica (AHU), usando el teorema Farkas-Minkowsky 6.17,

se concluye en que existen λ j ; j ∈ E tales que − fx = j∈E λ j g j (x∗ ),

P
Luego eligiendo λ j = 0 para todo j 6∈ E se concluye el teorema. 
NOTA 6.21. Algunas relaciones entre las diferentes condiciones de cua-
lificación. Observe el lector que si la condición (CV) de las condiciones
(AHUf) se verifica entonces basta considerar h∗ = 0, y entonces (AHU) sigue.
Si la condición (CO) se verifica, la función f se comportará, en un entorno de
x∗ como una función cóncava, la demostración se obtiene usando el teorema
fundamental. La convexidad de C en la condición (CI) implica que las funcio-
nes gi (x) sean cuasi-cóncavas, nuevamente el teorema fundamental termina la
demostración. El hecho de que (R) implica (AHU) se demuestra más abajo en
el texto, ver teorema (6.23).
A los efectos de aclarar la relación entre las diferentes condiciones de
regularidad, consideremos el siguiente ejemplo debido a Slater.
EJEMPLO 6.22. Considere el siguiente programa de optimización:
máx x∈R2 f (x) = x2
s.a : − x2 − x21 ≥ 0.
Claramente x∗ = (0, 0) es la solución de este problema, no obstante
x∗ = (0, 0) no es punto estacionario del lagrangiano, no obstante es cierto
que λ∗0 fx (0, 0) + λ∗ g x (0, 0) = 0 basta elegir λ̄∗ = 0.
El siguiente teorema muestra que la independencia lineal de los gradien-
tes evaluados en el punto x∗ , solución del programa de maximización, de
las restricciones activas, es una condición suficiente para que x∗ verifique las
(CPO).
TEOREMA 6.23. Suponga que x∗ satisface las condiciones de máximo
(M), para el problema de maximizar f (x) con las condiciones gi (x) ≥ 0,
i = 1, 2, . . . , m. Suponga también que el rango de la matriz de m filas por
∂g
n columnas, { ∂xij } evaluada en x = x∗ , es igual a me , estamos suponiendo
me ≤ n donde me es el número de las restricciones activas. Entonces para x̄
se satisfacen las condiciones de primer orden.
Demostración: Sea E = { j ∈ {1, 2, . . . , m} : g j (x∗ ) = 0}. El hecho de que
el rango de la matriz R, cuyas columnas son los gradientes de las restricciones
6.6. APLICACIONES 113

evaluados en x∗ , sea máximo, equivale a que se cumple la condición AHU y


por lo tanto la demostración se concluye a partir del teorema (6.20). Basta ver
que si ubicamos en los primeros lugares de R las columnas correspondientes
a las restricciones efectivas, obtenemos una submatriz S R invertible de rango
me . Luego el sistema S Rh = u donde u es un vector de unos tiene solución.
Formamos ahora el h∗ de la condición AHU, haciendo h∗ = (h, 0) es decir
completamos las n − me coordenadas con ceros. Luego se verifica trivialmente,
para las restricciones efectivas las desigualdades grad g j (x∗ )h∗ > 0. 
Terminemos esta sección con el siguiente comentario. Como el lector ya
habrá percibido, las condiciones de cualificación son condiciones referidas a
las restricciones únicamente, y no a las caracterı́sticas de la función objetivo, de
ahı́ que sean conocidas como condiciones de cualificación de las restricciones.

6.6. Aplicaciones
EJERCICIO 6.24. Considere una firma que produce un bien z, a partir de
insumos x e y. El bien x es un recurso no renovable. Existe una ley que prohibe
a la empresa utilizar de ese bien, más que una cierta cantidad x0 . La cantidad
posible de ser producida del bien z dada la tecnologı́a existente es z = xα yβ .
El precio del mercado de dicho bien puede suponerlo igual a 1 y el mercado
consume todo lo que la firma produce. Mientras que p x y py representarán los
precios de los insumos x e y respectivamente.
(1) Plantee el problema de optimización del productor.
(2) Muestre que si α + β < 1 entonces la función que representa la
tecnologı́a es estrictamente cóncava en R2+ = {(x, y) : x ≥ 0, y ≥ 0}.
(3) Discuta las soluciones posibles según sea α + β mayor, igual o me-
nor que uno. Indicando en que casos el problema de maximizar el
beneficio, puede ser resuelto a partir de las condiciones de primer
orden.
(4) Suponga β = 1 − α con 0 < α < 1. Como se deberı́a compensar al
productor si se establece una ley mediante la cual se obliga a reducir
la utilización del bien no renovable a una cantidad menor o igual a
x0 − 1.
EJERCICIO 6.25. Una firma produce un cierto producto y, a partir de dos
insumos i1 e i2 . La utilización del insumo i1 produce contaminación, por lo
que por su utilización se debe pagar una tasa. Sea s el valor por unidad de
contaminación producida. La contaminación producida es c = ak2 , siendo
a > 0, y k la cantidad utilizada del insumo. Los precios unitarios de los
114 6. LA PROGRAMACIÓN NO LINEAL

insumos son w1 y w2 respectivamente para i1 e i2 . Suponga que la tecnologı́a


existente permite producir a lo más z unidades del bien y, donde z = kα + lβ , a
partir de k unidades del insumo k ≥ 0 y l ≥ 0.
(1) Plantee el problema de optimización.
(2) Muestre que si α y β son positivos y menores que uno, entonces las
condiciones de primer orden son suficientes.
(3) Plantee la solución en función de la tasa s. Analice como varı́a la
cantidad de z producida y la utilización k y l de los insumos, en
función de s.
(4) Analice la diferencia entre los beneficios del capitalista sin tasa, y
los beneficios obtenidos cuando hay una tasa s, pero si ésta no se le
cobrara y el valor total recaudado al aplicar la tasa. Defina entonces
una polı́tica óptima de gravamen.
La función valor o función máximo valor. Sea f : X → R y gi : X →
R; i = 1, ...n siendo X ⊂ Rl convexo. Para el problema de optimización:
máx f (x) s.a, gi (x) ≤ ai , i = 1, . . . , n,
x∈X

se define la función valor,


V(a1 , . . . , an ) = f (x(a1 , ..., an )) = máx f (x)
x∈X

sujeto a las restricciones del problema. Bajo condiciones muy generales, la


función valor, depende continuamente de los parámetros3. Como el lector
∗ ∗ ∗
puede verificar, el coeficientePλni , correspondiente al par (x , λ ) punto silla de
la función φ(λ, x) = f (x) + i=1 λi gi (x), representará la tasa a la que la fun-
ción de valor crece cuando ai crece. Cada ai puede interpretarse como una
restricción de recursos, por lo que los coeficientes de Kuhn-Tucker, ilustran
cuanto se incrementará el valor óptimo de la función objetivo si los recursos
disponibles crecen. Este problema será estudiado en forma más general en el
capı́tulo 10.
EJERCICIO 6.26. Considere el caso de un individuo que maximiza su
función de utilidad u : Rl+ → R en su restricción presupuestaria, definida
l

como RP = x ∈ R+ : px ≤ I en el caso en que p representa los precios de
la economı́a fijos, e I el ingreso del agente. La función de valor, para precios
p dados, será entonces v(I) = u(x(p, I)), donde x(p, I) representa la demanda
a precios p e ingreso I. Interprete el multiplicador asociado a la restricción
3Este es el contenido principal del llamado teorema del máximo, el que no incluimos en
este trabajo. El lector puede encontrar una demostración de este teorema en [Accinelli, E. (07)].
6.6. APLICACIONES 115

presupuestaria, desde el punto de vista económico, justifique su denominación


de precio sombra del ingreso.
Considere una economı́a con n agentes y l bienes. Los agentes serán inde-
xados por i ∈ {1, ..., n}. Representamos por wi ∈ Rl+ las dotaciones iniciales
del i−ésimo agente. Sea xi(wi , p) la solución del problema de maximizar la
utilidad ui : X → R del i−ésimo agente en su restricción presupuestaria, dadas
las dotaciones wi y los precios p (es decir que xi(p, wi ) representa la demanda
del i−ésimo agente). Por X representamos el conjunto de consumo (por ejem-
plo el cono positivo de Rl ), el que asumimos el mismo para todos los agentes.
Simbolizamos por x(p, w) = (x1 (p, w1 ), ..., xn (p, wn )) la correspondiente asig-
nación de recursos maximizdora. Definimos como equilibrio walrasiano al
par (p, x) ∈ Rl × Rln tal que, a precios p, la asignación de recursos x, resuelve
el problema de maximización de cada agente en su restricción presupuestaria,
esto es verifica la igualdad,
ui (xi (p, wi )) = max xi ∈X ui (xi ), s.a : xi : pxi ≤ pwi , i = 1, ..., n
y hace que ni=1 xi(p, wi ) = ni=1 wi , es decir verifica la ecuación, demanda
P P
agregada igual a oferta agregada. El análisis de las condiciones que garantizan
la existencia y la unicidad del equilibrio walrasiano, es un capı́tulo de gran
interés de la teorı́a económica. Aconsejamos la lectura de [Debreu, G. (a)], es
una exposición rigurosa, seminal y apasionante, del equilibrio walrasiano y
sus propiedades que utiliza solamente elementos del análisis en Rn .
EJERCICIO 6.27. Analice las caracterı́sticas de la CPO para la asignación
de recursos que corresponde al equilibrio walrasiano.
Capı́tulo 7
Teorema de Lagrange

Genralizando el método de Euler, Lagrange tuvo la idea


de estas notables fórmulas, donde la solución de todos los
problemas de la mecánica anlı́tica están contenidas en una
sóla lı́nea.
C.G.J. Jacobi.

El problema clásico de Lagrange hace referencia a restricciones de igual-


dad, esto es, se trata de hallar un x̄ ∈ X abierto, que maximice a una cier-
ta función objetivo, f (x) bajo ciertas condiciones representadas por g j (x) =
0, j = 1, 2, . . . , m. Discutiremos en esta sección la relación entre las (CPO) y
la solución del problema de Lagrange. Este problema puede reducirse al ante-
rior, considerando el cumplimiento simultáneo de las condiciones: g j (x) ≥ 0
y −g j (x) ≤ 0, j = 1, 2, . . . , m, pero esto no resuelve el problema. Obsérvese
que no pueden aplicarse las condiciones de regularidad, pues ningún punto
satisfaciendo a todas las restricciones será regular, tampoco estamos en las
condiciones consideradas en la sección anterior, a menos que las restriccio-
nes de igualdad correspondan a funciones afines, pues si g j es cóncava, −g j
es convexa. Obsérvese también que aunque aparezcan 2m restricciones, sola-
mente existen m diferentes. Por otra parte las condiciones de cualificación no
pueden ser las mismas, pues el hecho de que un punto x∗ resuelva el programa
de maximización supone restricciones de igualdad, es decir que maximiza la
función objetivo pero bajo condiciones más restrictivas que las de un programa
con desigualdades.
El siguiente teorema muestra no obstante que, bajo condiciones de cuasi-
concavidad, condiciones análogas a las (CPO) para el problema con restric-
ciones de desigualdad, son también suficientes para la optimalidad del punto
x∗ . Estas condiciones están dadas por la existencia un vector λ ∈ Rm + , siendo
m el número de restricciones gi (x) = 0 del programa de maximizar f tal que
verifica grad f (x∗ ) + m gi (x∗ ) = 0.
P
i=1 λ i grad
117
118 7. TEOREMA DE LAGRANGE

TEOREMA 7.1. (De Lagrange) Sean f, g1 , g2 , . . . , gm funciones cuasi-cón-


cavas y diferenciables en X ∈ Rn . Considere el siguiente programa de maxi-
mización, al que denotaremos por (P):
máxn f (x), s.a. gi (x) = 0, i = 1, 2, . . . , m.
x∈R

x∗
Suponga que verifica las siguientes condiciones (llamadas de primer orden,
CPO), existen escalares λ∗1 , . . . , λ∗m no negativos, tales que f ′ (x∗ ) + λ∗ g′ (x∗ ) =
0. y además que gi (x∗ ) = 0 entonces x∗ resuelve el problema (P).
Demostración: Para todo x ∈ X tal que gi (x) ≤ gi (x∗ ) se verifica que
hgrad g(x∗ ), (x∗ − x)i ≤ 0. A partir de las condiciones de Kuhn-Tucker, se
llega a:
m
X
hgrad f (x∗ ), (x∗ − x)i = λ∗i hgrad gi (x∗ ), (x∗ − x)i ≤ 0.
i=1
Finalmente la cuasi-concavidad de f implica que f (x∗ ) ≥ f (x). 
NOTA 7.2. Obsérvese que la condición requerida para que el teorema
se aplique es que de la condición hgrad f (x0 ), (x − x0 )i puede obtenerse la
condición f (x) ≥ f (x0 ). Esta propiedad la tienen las funciones cuasi-cóncavas,
y por lo tanto las cóncavas, pero hay una clase de funciones que no son cuasi-
cóncavas que también la verifican, son las llamadas funciones pseudocóncavas.
Las que se definen precisamente por satisfacer esta propiedad. Ejemplo de este
tipo de funciones es f (x) = − x3 − x, pues h(x1 − x2 ), −(3x22 + 1)i ≥ 0 implica
x2 ≥ x1 y por lo tanto f (x2 ) ≥ f (x1 ).
Un problema importante que aparece en la maximización con restriccio-
nes de igualdad, es que de antemano, no sabemos el signo de los multipli-
cadores correspondientes a estas restricciones en el lagrangiano. Considere
el problema de maximizar una determinada función sujeto a condiciones de
igualdad. Admitamos que estas condiciones están dadas por funciones gi ;
i = 1, 2, . . . , n, afines. Podemos entonces desdoblar las restricciones, reem-
plazando cada restricción g j (x) = 0 por las siguientes dos condiciones de
desigualdad: g j (x) ≥ 0, −g j (x) ≥ 0. El lagrangiano para este problema es
m
X m
X
Φ(x, λ) = f (x) + (µ j − ν j )g j (x) = f (x) + λ j g j (x)
j=1 j=1

donde λ j = µ j − ν j , j = i, 2, . . . , m. Aunque las condiciones de primer orden,


conllevan a la no negatividad de los multiplicadores µ j y ν j , no podemos
afirmar nada sobre el signo de λ j .
7. TEOREMA DE LAGRANGE 119

FIGURA 22. Soluciones para el ejemplo 7.3

EJEMPLO 7.3. Considere el problema:

máx x∈R2 x1 x2

s.a : x21 + x22 − 1 = 0

El lagrangiano para este problema es: φ(x, λ) = x1 x2 + λ(x21 + x22 − 1), de


donde se obtienen las (CPO):

∂Φ ∂Φ
= x̄2 + 2λ̄ x̄1 = 0, = x̄1 + 2λ̄ x̄2 = 0 ( x̄21 + x̄22 − 1) = 0
∂x1 ∂x2

Resolviendo este sistema obtenemos la solución: x̄1 = x̄2 =+− 1/ 2 y λ = 12 .
∂g
Evaluada en este punto la matriz { ∂xij } = (2 x̄1 , 2 x̄2 ) tiene rango 1, por lo que
la condición del teorema se cumple. Ver figura 22.
120 7. TEOREMA DE LAGRANGE

Como en la sección anterior, también aquı́ nos interesa encontrar condicio-


nes que hagan que la solución de un problema de Lagrange verifique las (CPO),
en este caso no ponemos condiciones en el signo de los multiplicadores.
TEOREMA 7.4. (Condición de cualificación para el problema de La-
grange) La independencia lineal de los gradientes de las restricciones es
una condición suficiente para que si x∗ resuelve el problema de maximizar
f (x) s.a hi (x) = 0, i = 1, 2, . . . , m, verifique las (CPO) correspondientes.
La siguiente demostración de este teorema es sencilla pero se basa en las
propiedades de las superficies regulares, una exposición de la teorı́a corres-
pondiente y de este teorema puede verse en [Lima, L.]. No obstante daremos
una breve demostración del teorema sin entrar mayormente en la discusión de
los temas propios de la teorı́a de superficies.
Demostración: Comenzamos con la definición de punto crı́tico de una
función diferenciable. M representa una superficie, y por f /M representamos
la función restringida a M. Un punto crı́tico de la función f : M → R es
un punto p tal que d f (p) = 0, es decir, tal que se verifica hgrad f (p), vi = 0
para todo v ∈ T p M. Esto es que el gradiente de f en p es ortogonal al plano
tangente en dicho punto. Entre los puntos crı́ticos de f : M → R se encuentran
los máximos y los mı́nimos locales de f pues si p es uno de esos puntos
entonces para todo camino λ : (−ǫ, ǫ) → M con λ(0) = p se debe verificar
que ( f (λ))′ (0) = 0, equivalentemente hgrad f (p), λ′ (0)i = 0. Es decir que el
vector grad f (p) evaluado en un punto crı́tico p ∈ M es perpendicular a todo
vector en el plano tangente a M en p.
Supongamos ahora que la superficie M ⊂ Rm+n está dada por la imagen
inversa de φ : U → Rn de clase C 1 de un valor regular c = (c1 , c2 , . . . , cn ),
con U ⊂ Rm+n , es decir M = φ−1 (c). Si las funciones coordenadas son
φ1 , φ2 , . . . , φn entonces la condición de ser c un valor regular, significa que
los vectores grad φ1 , grad φ2 , . . . , grad φn son linealmente independientes1,
y por lo tanto constituyen una base del espacio vectorial perpendicular a T p M.
De aquı́ que el punto p ∈ M es un punto crı́tico de f /M si y solamente si el
vector grad f (p) es una combinación lineal de los vectores grad φ( p), es decir
si y solamente si existen números reals λ1 , . . . , λn tales que
grad f (p) = λ1 grad φ1 (p) + λ2 grad φ2 (p) + · · · + λn grad φn (p). 
A continuación mostraremos un ejemplo (tomado de [Lima, L.]) , en el
que se pide encontrar los puntos crı́ticos de una función f : Rm × Rn → R2

1El contraejemplo siguiente mostrará la importancia de esta condición.


7. TEOREMA DE LAGRANGE 121

restringida a una superficie M igual al producto cartesiano de las esferas en


Rm y Rn de radio 1.

EJEMPLO 7.5. Sea A : Rm → Rn una transformación lineal. Represen-


taremos por Atr , su traspuesta. Sabemos que hAx, yi = h x, Atr yi. Conside-
remos la función bilineal f : Rm × Rn → R2 , definida como f (x, y) =
m−1 × S n−1 siendo
P
hAx, yi = i j ai j xi y j . Considere la superficie M = S
M = φ−1 (1, 1), donde c = (1, 1) y φ(x, y) = (| x|2 , |y|2 ). Se tiene que; φ(x, y) =
(φ1 (x, y), φ2 (x, y)) con φ1 (x, y) = | x|2 y φ2 (x, y) = |y|2 . Vamos a encon-
trar a continuación, los puntos crı́ticos de la función f restringida a M.
Se tiene que grad f (x, y) = hAtr y, Axi, ∀(x, y) ∈ Rm × Rn , mientras que
grad φ1 (x, y) = (2x, 0), y grad φ2 (y) = (0, 2y). Entonces p = (x, y) es
punto crı́tico de f /M si y solamente si:
λ µ
grad f (x, y) = grad φ1 (x, y) + grad φ2 (x, y)
2 2
Es decir: Atr x, Ay = (λx, µy). Por lo que los puntos crı́ticos de f /M son


los puntos p = (x, y) ∈ S m−1 × S n−1 , que verifican Ax = µy A∗ y = λx.


Como fácilmente puede verse, los valores λ2 , µ2 son los valores crı́ticos de la
transformación lineal A∗ A : Rm → Rm .

NOTA 7.6. (Contraejemplo) Considere el problema:

mı́n F(ξ, η), s.a : G(ξ, η) = 0

donde F(ξ, η) = exp(ξ + η) y G(ξ, η) = ξ 2 + η2 .

La solución del problema es obviamente u0 = (0, 0), pues u0 es el único


punto que verifica la condición G(ξ, η) = 0. La aplicación formal del método
de Lagrange supone que:

Fξ (0, 0) + λGξ (0, 0) = 0, Fη (0, 0) + λGη (0, 0) = 0.

No obstante esto es una contradicción pues Gξ (0, 0) = 0 y Fξ (0, 0) = 1.


Obsérvese que grad G(0, 0) = (0, 0) por lo que la condición de independencia
lineal de los gradientes no se cumple. No obstante no habrı́a contradicción,
si como en el caso del teorema de Kuhn-Tucker hubiéramos considerado las
condiciones:

λ0 Fξ (0, 0) + λGξ (0, 0) = 0, λ0 Fη (0, 0) + λGη (0, 0) = 0,

con λ20 + λ 6= 0.
122 7. TEOREMA DE LAGRANGE

7.1. Restricciones de igualdad y desigualdad


Un caso interesante es aquel en que aparecen restricciones de igualdad y de
desigualdad.
máx x∈X f (x)

sujeto a: g j (x) ≥ 0, j = 1, 2, . . . , m,

hk (x) = 0, k = 1, 2, . . . , l.
Sea x̄ una solución para este problema, y sea E el conjunto de ı́ndices tales
que g j ( x̄) = 0 (es decir las restricciones efectivas), sea me ese número. Para
me + l ≤ n tenemos el siguiente resultado:
TEOREMA 7.7. Sea x̄ ∈ (M). Supongamos que el rango de la matriz
(me + l) × n  
∂g j
∂xi
 j ∈ E, k = 1, 2, . . . , l
 

∂hk
∂xi
evaluada en x̄ es me + l. Entonces se tiene que x̄ es un punto estacionario para
el lagrangiano:
Φ(x, λ, µ, ) = f (x) + λg(x) + µh(x)
Es decir, en x̄ se cumplen las condiciones de primer orden, con λ̄ ≥ 0 mientras
que µ̄ puede ser positivo o negativo.
Una demostración directa de este teorema puede encontrarse en la obra
[Bazaraa, M.S.; Shetty, C.M.]. No obstante puede hacerse una demostración
utilizando el teorema anterior. Basta para esto, considerar como restricciones
de igualdad también a todas las restricciones efectivas, y repetir el razona-
miento hecho en la demostración del teorema (7.4). 

7.2. Condiciones de segundo orden


Si bien el objetivo de nuestro trabajo es la optimización con funciones objetivos
cóncavas (o convexas) y restricciones definidas por conjuntos convexos por
ser estas las caracterı́sticas generales de los problemas que aparecen en teorı́a
económica es posible generalizar estos resultados casos más generales, esto
supone introducir las llamadas condiciones de segundo orden.
Si limitamos nuestra atención a funciones f : D → R y g : D → R
cóncavas en la vecindad de x∗ , entonces las condiciones de primer orden
7.3. EJERCICIOS 123

vistas en el teorema 7.1, son necesarias y suficientes para la solución local


del problema. Alternativamente se pueden encontrar, merced al desarrollo de
Taylor, condiciones alternativas de segundo orden. Definamos

φ(x, λ) = f (x) + λg(x).

Estas condiciones se definen a partir de la siguiente matriz


 ′′ ∗ ′′ (x∗ ) g′ (x∗ )
f11 (x ) . . . f1n

1
 ′′ ∗
 f21 (x ) . . . f2n (x ) g′2 (x∗ )
′′ ∗ 

 
M(x∗, λ∗ ) =  . . . ... ... ...
 

 
 f ′′ (x∗ ) . . . f ′′ (x∗ ) g′ (x∗ ) 
 n1 nn n 
g′1 (x∗ ) ... g′n (x∗ ) 0

donde fi′′j (x∗ ) representa la derivada segunda de f (x) respecto a las variables
i, j evaluada en x∗ , análogamente g′i (x∗ ) representa la derivada primera de
g respecto a la i-ésima variable evaluada en x∗ . Puede probarse el siguiente
teorema:

TEOREMA 7.8. Sea D un conjunto abierto de Rn y f : D → R y f : D → R


funciones C 2 . Si en un punto x∗ ∈ D se verifican las condiciones
(a) g(x∗ ) = 0.
(b) (x∗ , λ∗ ) verifica las condiciones de primer orden.
(c) La matriz M(x∗, λ∗ ) es definida negativa.
Entonces x∗ es un máximo local de f condicionado a g(x) = 0. Recı́proca-
mente: Si x∗ es un máximo local de f en D condicionado a g(x) = 0 entonces
(a) g(x∗ ) = 0.
(b) (x∗ , λ∗ ) verifica las condiciones de primer orden.
(c) La matriz M(x∗, λ∗ ) es semidefinida negativa.

Para demostrar el teorema, basta desarollar de acuerdo a la fórmula de


Taylor la función φ(x, λ∗ ) en x = x∗ .

7.3. Ejercicios
Presentaremos a continuación algunas aplicaciones y ejercicios ilustrativos.
124 7. TEOREMA DE LAGRANGE

EJEMPLO 7.9. Se trata de elegir (x1 , x2 ) ∈ R2 en el problema:


Maximizar x1 x2
sujeto a: g(x) = x1 + 8x2 − 4 ≥0
h(x) = x2 −1+ x22 −1 = 0
El lagrangiano para este problema es:
Φ(x, λ, µ) = x1 x2 + λ(x1 + 8x2 − 4) + µ(x2 − 1 + x22 − 1)
y las (CPO):
∂Φ̄
∂x1 = x̄2 + λ̄ + 2µ̄ x̄1 = 0
∂Φ̄
∂x2 = x̄1 + 8λ̄ + 2µ̄ x̄2 =0
x̄21 + x̄22 − 1 = 0
λ̄( x̄1 + 8 x̄2 − 4) = 0
λ̄ ≥ 0
Resolviendo este sistema obtenemos: x̄1 = x̄2 = √12 , λ̄ = 0 y µ = − 21 . Nótese
que el multiplicador µ̄ que corresponde a la restricción de igualdad es negativo.
Puede verse fácilmente que la restricción g(x) está inactiva en ( x̄1 , x̄2 ). Luego
∂h ∂h
la condición sobre el rango se verifica en la matriz ( ∂x , ) = (2x1 , 2x2 ) que
1 ∂x1
1
es igual a 1 en x̄1 = x̄2 = √2 , por lo tanto es satisfecha.
EJEMPLO 7.10.
(a) Observe que si bien el punto (2, 0) resuelve el problema de
max x1 s.a. : x1 ≥ 0; x2 = (2 − x1 )2 ,
no es un punto de silla del correspondiente lagrangiano.
(b) Considere ahora el siguiente problema:
max x1 s.a. : x1 ≥ 0; 0 ≤ x2 ≤ 1; x2 = −1 + (2 − x1 )2
Observe que para este caso el punto (2, 0) resuelve el problema y
satisface la condición SP.
¿Cuál es la diferencia entre el problema (a) y el (b) ?.
EJERCICIO 7.11. Un turista debe decidir entre pasar sus vacaciones en
Venecia y / o en Milán. Supongamos que dispone de cierto presupuesto I para
los gastos y sus vacaciones serán de h dı́as. El gasto diario promedio en Milán
es pm mientras que el gasto promedio diario en Venecia es pv . La función de
utilidad del turista está dada por u(M, V) = M α V β , donde M y V representan
7.3. EJERCICIOS 125

los dı́as pasados en Milán y en Venecia respectivamente, además 0 < α, 0 < β


y α + β < 1.
(1) Obtenga el tiempo óptimo que el turista pasará en cada ciudad.
(2) Dado el creciente flujo de turistas a Venecia, y las correspondientes
pérdidas en bienestar que este flujo implica para la población local,
las autoridades locales deciden poner una tasa por dı́a a los turistas
que permanecen en la ciudad. Sea esta Iv . Calcule en función de esta
tasa la nueva distribución de las vacaciones del turista.

EJERCICIO 7.12. Se desea construir una caja en forma de paralelepı́pedo


con aristas x, y, z, de volumen máximo con una chapa de superficie igual a 2a.
(1) Plantee el problema de maximización correspondiente.
(2) Muestre que las CPO son necesarias y suficientes.
(3) Muestre que la caja debe ser un cubo de aristas x = y = z = a3 .
p

EJERCICIO 7.13. Encuentre el valor máximo de la raı́z enésima del pro-


ducto de n números x1 , . . . , xn positivos si su suma es igual a un número a. Es
decir se tratra de resolver:
1
máxn (x1 . . . xn ) n , s.a : x1 + · · · + xn = a.
x∈R+

(1) Verifique que la solución es: x1 = · · · = xn = an .


(2) Muestre que la media geométrica es siempre menor que la media
aritmética, es decir que:
1 x1 + · · · + xn
(x1 . . . xn ) n ≤ .
n
EJERCICIO 7.14. (Condiciones de segundo orden) Considere el siguiente
programa de optimización:

1 1
máx x31 + x32 − x21 − x22 s.a. x1 + x2 + 1 = 0.
x∈R 2 2 2

(1) Muestre que el punto x1 = x2 = 12 , con λ = − 45 es un candidato a


solución.
(2) Muestre que x1 = x2 = 21 , cumple las condiciones suficientes, y por
lo tanto, es un máximo local de x31 + x32 − 21 x21 − 12 x22 , condicionado
a: x1 + x2 + 1 = 0.
Capı́tulo 8
Desarrollos de la programación no lineal
Una función de utilidad cuasi-cóncava del consumidor, co-
rresponde a una función de utilidad ordinaria cuyas curvas
de indiferencia son convexas hacia el origen, y la cuasi-
concavidad de la función de producción da lugar a re-
tornos crecientes a escala. Estas observaciones deberı́an
ser suficientes para motivar el estudio de la programación
cuasi-cóncava.
A. Takayama.
Presentaremos en esta sección dos temas de interés que dan a la teorı́a
aquı́ presentada mayor generalidad y, consecuentemente, nuevas posibilidades
de aplicaciones a la compleja realidad a la que ella se refiera. Ambos tienen
interés en economı́a. El primero se refiere a la programación cuasi-cóncava.
Es decir se trata de resolver programas con restricciones convexas y funcio-
nes objetivo cuasi-cóncavas. El interés por resolver este tipo de programa en
teorı́a económica parte de que preferencias convexas son representables por
funciones de utilidad cuasi-cóncavas, (ver ejercicio 4.58) por lo que el pro-
blema del consumidor se refiere entonces al problema de optimizar funciones
cuasi-cóncavas en conjuntos convexos.
El segundo tema se refiere a problemas de optimización multi-objetivo.
Es decir se pretende encontrar un vector x̂ tal que resuelva un sistema de
inecuaciones del tipo fi ( x̂) ≥ fi (x), i = 1, . . . , k; ∀ x : g j (x) ≥ 0 j = 1, . . . , m
siendo las fi y las g j funciones cuasi-cóncavas. Como motivación para el
estudio de este tema, puede pensarse en el problema de n agentes maximizando
sus funciones de utilidad en sus restricciones presupuestarias con un conjunto
de dotaciones iniciales definido previamente.

8.1. Programación cuasi-cóncava


En la mayorı́a de los problemas de la teorı́a económica relacionados con
programas de maximización, las funciones objetivos son cuasi-cóncavas y se
127
128 8. DESARROLLOS DE LA PROGRAMACIÓN NO LINEAL

agrega la condición de que el resultado debe pertenecer al ortante positivo


del espacio en el que se modela la economı́a, por ejemplo Rn+ . Por ejemplo,
casos en los que se maximizan funciones de utilidad o beneficios. También
suele aparecer programas de minimización, estos pueden presentarse como
programas de maximización cambiando los signos de las respectivas funciones
objetivos. Ası́ el problema de minimizar el costo C(y, w) para producir una
determinada cantidad de producto y a precio de los factores w fijos, puede
transformarse en el problema equivalente de maximizar −C(y, w).
En estas sección probaremos dos teoremas de Arrow-Enthoven de 1961,
que extiende las condiciones suficientes para que x∗ ∈ Rn definidas en el
teorema de Kuhn Tucker, al caso donde la función objetivo es cuasi-cóncava y
restricciones de convexidad también definidas por funciones cuasi-cóncavas.
Veremos también como corolario de este teorema una caracterización de la
cuasi-concavidad para funciones reales definidas en subconjuntos convexos de
Rn que hace uso del llamado hessiano orlado de f evaluado en x∗. Naturalmente
que los resultado válidos para programas cuasicóncavos, lo son para cóncavos.
• Usaremos la siguiente notación:
• La función G : X → Rm , queda definida por
G(x) = (g1 (x), . . . , gm (x))
para todo x ∈ X subconjunto convexo de Rn .
• Siendo λ un vector en Rn la notación λG(x) representa el producto
interno de estos dos vectores.
• G′ (x) = (grad g1 (x), . . . , grad gm (x)) y para λ ∈ Rm escribiremos
m
λG′ (x) = i=1 λi grad gi (x).
P
• Sea X ⊂ Rn diremos que h ∈ Rn es una dirección admisible para
x ∈ X si existe ǫ > 0 y x + vh ∈ X para v 0 ≤ v ≤ ǫ.
Haremos uso en lo que sigue de los siguientes teoremas:
TEOREMA 8.1. Sea f una función real diferenciable en X ⊂ Rn . Si f tiene
un máximo en x∗ ∈ X entonces la derivada de f en x∗ se anula en toda
dirección admisible.
Demostración: Definimos φ : [0, ǫ] → R como φ(v) = f (x + vh). Esta es
una función real de una variable real, que alcanza su extremo en v = 0, luego
φ′ (0) = dv
d
f (x∗ + vh)h|v=0 = 0. Es decir dv
d
f (x∗ )h = 0 ∀h admisible. 

TEOREMA 8.2. Supongamos ahora que X 0 = { x ∈ Rn : G(x) = 0} donde


G : Rn → Rm es una función dos veces diferenciable. Sea L(x) = f (x) + λG(x)
donde λ ∈ Rm . Supongamos que existe Br (x∗ ) una bola de centro x∗ y radio r,
8.2. TEOREMAS DE ARROW-ENTHOVEN 129

tal que
(30) f (x∗ ) > f (x) para todo x ∈ Br (x∗ ) ∩ X, x 6= x∗ .
Entonces la matriz hessiana de L(·, λ∗ ) : Rn → Rm , evaluada en x∗ , L′′xx (x∗ , λ∗ )
es definida negativa, para todo h tal que grad L(x∗ , λ∗ )h = 0.
Demostración: Observe que (30) es equivalente a
L(x∗ , λ∗ ) > L(x, λ∗ ) para todo x ∈ Br (x∗ ) ∩ X, x 6= x∗ .
Use ahora las condiciones suficientes para máximo local. (Condiciones de
segundo orden). 
El siguiente teorema define una condición suficiente para que x∗ sea un
máximo de un programa de maximización con función objetivo cuasi-cóncava
y restricciones convexas. Diremos que la función G : Rn → Rm es cuasi-
cóncava si y solamente si los son cada una de sus funciones coordenadas.
Notaremos como G′ (x) el jacobiano de G evaluado en x.

8.2. Teoremas de Arrow-Enthoven


A continuación enunciaremos el teorema fundamental de la programación no
lineal en el caso diferenciable. Primeramente en el caso general, luego en el
caso en que nos restringimos a trabajar en el ortante positivo de Rn .
Consideremos el problema:
(31) Maximizar f (x) sujeto a G(x) ≥ 0.
TEOREMA 8.3. (De Arrow-Enthoven, 1961) Sea f una función real dife-
renciable en X subconjunto abierto y convexo de Rn . y sea G : G : Rn → Rm
cuasi-cóncava en X. Supongamos además que se verifica la condición de Sla-
ter, (ver corolario 6.6). Entonces, si x∗ ∈ Rn es una solución para el problema
(31), existe y∗ ∈ Rm+ tal que
L x (x∗ , y∗ ) = fx (x∗ ) + y∗G′ (x∗ ) = 0, (i)
(32) Ly (x∗ , y∗ ) = G(x∗ ) ≥ 0, (ii)
y∗ Ly (x∗ , y∗ ) = y∗G(x∗ ) = 0. (iii)
x∗ y∗
Recı́procamente, sea ∈ X e ≥ 0 tales que verifican las condiciones
(i), (ii), y (iii) dadas en (32). Entonces si f es cuasi-cóncava, x∗ resuelve (31).
Demostración: Es inmediato verificar que si x∗ resuelve el problema de
maximización, entonces la condición (ii) de (32) se verifica. Si además fx(x∗ ) =
0 entonces basta elegir y∗ = 0 para que todas las condiciones de (32) se
130 8. DESARROLLOS DE LA PROGRAMACIÓN NO LINEAL

verifiquen. Podemos entonces asumir que la derivada de f evaluada en x∗ es


no nula, es decir que, fx∗ 6= 0. Siendo x∗ optimal para f en F = { x : G(x) ≥ 0}
se sigue de la diferenciabilidad de f que para todo x ∈ F se verifica:
f (x∗ + λ(x − x∗)) − f (x∗ ) = fx∗ (λ(x − x∗ )) + r(λ(x − x∗ )) ≤ 0
para todo λ ∈ (0, 1). De la definición de diferenciabilidad se sigue que:
(33) fx∗ (λ(x − x∗ )) ≤ 0, ∀ x ∈ F.
Sea I = {i : 1 ≤ i ≤ n : gi (x∗ ) = 0}. Es fácil ver que I 6= ∅ pues en otro caso
por la continuidad de las gi , serı́a posible elegir µ > 0 y una bola de centro x∗
y radio δ, B(x∗ , δ) tal que x∗ ± µe ∈ B x∗ (δ) y por lo tanto, a partir de (33) se
obtiene fx∗ ≤ 0 y fx∗ ≥ 0, por lo que fx∗ = 0 lo que contradice la afirmación
de que fx∗ 6= 0. Entonces para todo i ∈ I se verifica que gi (x) ≥ gi (x∗ ) por la
cuasi-concavidad de cada gi , i ∈ I se sigue que
(34) grad gi (x∗ )(x − x∗ ) ≥ 0, ∀ x ∈ F.
Entonces por el teorema fundamental (6.4) aplicado a las ecuaciones (33) y
(34), existe vi ≥ 0, i ∈ I tales que
∂ f ∗ X ∂g ∗
(x ) + vi (x ) = 0.
∂xi ∂xi
i∈I

La igualdad ((i), 32) se concluye ahora eligiendo y∗i = vi cada vez que i ∈ I
y cero en otro caso. Para estos mismos valores de y∗ , como fácilmente puede
comprobarse, se tiene la igualdad ((ii)32).
Recı́procamente: A partir de (32) se sigue que grad f (x∗ )(x − x∗ ) ≤ 0,
∀ x ∈ F. Entonces la cuasi-concavidad de f implica que f (x∗ ) ≥ f (x), ∀ x ∈
F lo que establece la optimalidad de x∗ en F. Para ver esto, observe que si
I 6= ∅ entonces elegimos como anteriormente y∗i , para cada i ∈ I, la condición
(iii) impone y∗i = 0 ∀i 6∈ I. A partir de (i) se sigue que:
X
grad f (x∗ )(x − x∗) ≤ − y∗i grad g(x∗ )(x − x∗ ) ≤ 0.
i∈I

Ahora la cuasi-concavidad de f termina la demostración. Si I = ∅ entonces


fx (x∗ ) = 0, y otra vez la cuasi-concavidad de la f termina la demostración. 
COROLARIO 8.4. (Arrow-Enthoven, 1961) Sea f una función real cuasi-
cóncava definida en Rn+ y sea G : Rn → Rm cuasi-cóncava. Consideremos el
problema:
(35) Maximizar f (x) su jeto a G(x) ≥ 0, x ≥ 0.
8.2. TEOREMAS DE ARROW-ENTHOVEN 131

Siendo G(x) = (g1 (x), g2 (x), . . . , gm (x)). Supongamos además que existe
x̄ ∈ Rn : x̄i > 0, i = 1, 2, . . . , n y que además verifica gi ( x̄) > 0, ∀i =
1, 2, . . . , m. Entonces si x∗ ∈ Rn con G(x∗ ) ≥ 0 es una solución para este
problema existe y∗ ∈ Rm + tal que
fx (x∗ ) + y∗G′ (x∗ ) ≤ 0, (i)
(36) y∗G(x∗ ) = 0, (ii)
fx (x∗ ) + y∗G′ (x∗ ) x∗ = 0, (iii)
 

Recı́procamente, sea x∗ ∈ X e y∗ ≥ 0 tales que verifican las condiciones


(i), (ii), y (iii) dadas en (36). Entonces si f es cuasi-cóncava, y si una de las
siguientes condiciones es satisfecha,
a) fk′ (x∗ ) = ∂ f (x∗ )/∂xk < 0 para al menos un k; y tal que existe x̄ ∈ Rn+
tal que x̄k > 0 y G( x̄) > 0.
b) f j′ (x∗ ) = ∂ f (x∗ )/∂x j > 0 para al menos un j tal que x∗j > 0;
c) f ′ (x∗ ) 6= 0 y f es dos veces diferenciable en un entorno de x∗ ;
entonces x∗ es optimal.
Demostración: Para ver que las condiciones (i), (ii) y (iii) de (36) son
necesarias, definimos gm+k (x) = xk , k = 1, 2, . . . , n. Considere entonces
F = { x ∈ Rn : g j (x) ≥ 0; j = 1, 2, . . . , m + n} .
De esta forma
m+n
X m
X n
X
L(x, y) = f (x) + yi gi (x) = f (x) + yi gi (x) + yi xi
i=1 i=1 i=1
donde µi = ym+i . Repitiendo el razonamiento anterior hecho en el teorema
(8.3) se obtiene facilmente que L x (x∗ , y∗ ) = 0 y que por lo tanto grad f (x∗ ) +
∗ ∗ ∗
P P
i∈Inyi grad gi (x )+ i∈E µi ei ≤
o 0, siendo: I = {i ∈ {1, 2, . . . , m} : gi (x ) > 0},
E = j ∈ {1, 2, . . . , n} : x∗j > 0 , (este conjunto puede ser vacı́o), ei es el vec-
tor canónico en la i-ésima dirección, obsérvese que grad xi = ei . Finalmente
del hecho de que µi = 0 si x∗i > 0, ( esto por (ii) en (32) ) y en otro caso
∂f ∗) +
Pm ∂gi ∗
µi ≥ 0 se tiene que ∂x j
(x i=1 ∂x j (x ) ≤ 0, para todo i = 1, 2, . . . , m. Si la
desigualdad es estricta entonces debe ser µi > 0 y por lo tanto xi = 0. Por lo
que la condición (iii) en (36) se cumple siempre.
Recı́procamente:
a) Si I 6= ∅. A partir de (36) (análogamente a lo hecho en la demostración
del teorema 8.3) se sigue que y∗i = 0 para todo i 6∈ I, de donde resulta
que:
132 8. DESARROLLOS DE LA PROGRAMACIÓN NO LINEAL

X
(37) grad f (x∗ )(x − x∗ ) ≤ − y∗i grad gi (x∗ )(x − x∗ ) ≤ 0,
i∈I

para todo x ∈ F. Por lo que en este caso la demostración termina co-


mo en el teorema anterior. Supongamos ahora que I = ∅, es decir que
se verifican las desigualdades gi (x∗ ) > 0, ∀i. Consideremos entonces,
x1 = x∗ + ek donde ek = (0, . . . , 0, e, 0, . . . , 0) para e suficientemente
pequeño, y cualquier x ∈ F se tiene que x(λ) = (1 − λ)x + λx1 ,
0 ≥ λ ≥ 1. Las siguientes desigualdades se verifican:
fx (x∗ )(x(λ) − x∗ ) =
∂f ∗
= (1 − λ) fx (x∗ )(x − x∗) + λ (x )(x(λ) − x∗ )ek < 0.
∂xk
Como la desigualdad vale para todo λ ∈ (0, 1) de la continuidad se
deduce que fx (x∗ )(x − x∗ ) < 0. Luego por la cuasi-concavidad se
sigue que f (x) ≤ f (x∗ ).
b) Supongamos que no existe i que verifica la condición a) del corolario.
Por lo tanto fx (x∗ ) ≥ 0 para todo x ∈ Rn+ . Razonando como en (37)
obtenemos que fx (x∗ )(x − x∗ ) ≤ 0. Para x ∈ Rn+ tal que G(x) ≥ 0
escribamos:
x(α) = (1 − α)x, y, x∗ (α) = (1 − α)x∗ , 0 ≤ α ≤ 1.
Se sigue que:
fx (x∗ )(x∗ (α) − x∗ ) = −α fx (x∗ )x∗ < 0,
pues existe el menos una coordenada x∗j > 0 para la que se verifica
que ∂ f (x∗ )/∂x j > 0.
fx (x∗ )(x(α) − x∗(α)) = (1 − α) fx (x∗ )(x − x∗ ) ≤ 0
Sumando las desigualdades anteriores, luego haciendo α → 0 y
usando la condición de cuasi-concavidad (15) se obtiene el resultado.
c) Para el caso restante, ver [Kemp, M.; Kimura, Y.].
A continuación mostraremos algunas relaciones existentes entre funciones
cuasi-cóncavas y sus hessianos orlados.
DEFINICIÓN 8.5. Llamaremos hessiano orlado de f : X → R en x ∈ X
donde X ⊂ Rn , a la matriz
f ′ (x)
 
0
[H(x)] =
f ′ (x) f ′′ (x)
8.2. TEOREMAS DE ARROW-ENTHOVEN 133

donde f ′ (x) = grad f (x) y f ′′ (x) representa la matriz hessiana de f evaluada


en x.
TEOREMA 8.6. (De Arrow-Enthoven, 1961) Para función f dos veces
diferenciable definida en un subconjunto convexo X de Rn se verifica que:
(1) Si f es cuasi-cóncava en X entonces [H(x)] es semidefinida negativa,
en cada x ∈ X
(2) Es suficiente para que f sea cuasi-cóncava en X que [H(x)] sea
definida negativa en cada x ∈ X para todo h ∈ Rn tal que f ′ (x)h = 0.
Demostración:
(1) Si f ′ (x) = 0 para x ∈ X entonces la condición necesaria se verifica
trivialmente. Supongamos entonces que f ′ (x0 ) 6= 0 para algún
x0 ∈ X. Consideremos entonces el problema de: Maximizar
f (x) s.a. f ′ (x0 )(x − x0 ) ≥ 0, x ≥ 0. Definamos entonces
G(x) = f ′ (x0 )(x0 − x) ≥ 0 las condiciones definidas en ((36), (a), (b),
(c)) con y∗ = 1 se verifican para este caso. Por lo tanto x0 es una solu-
ción para el problema de maximización. Luego f (x0 ) es un máximo
bajo la restricción f ′ (x0 )(x0 − x) ≥ 0. Usando ahora el teorema 8.2
concluimos con que H(x0 ) es semidefinida negativa.
(2) Sea [H](x0 ) definida negativa para todo h tal que f ′ (x0 )h = 0. Siendo
f dos veces diferenciable en x0 ∈ X se tiene que h f ′′ (x0 )h < 0.
Para x suficientemente próximo a x0 tal que h = (x − x0) se tiene que
f (x) < f (x0 ) esto es f (x0 ) es un máximo local estricto para f sujeto a
la condición f ′ (x0 )(x − x0 ) = 0. Esto significa que para todo x̄ ∈ X se
verifica que x̄ maximiza a f (x) sujeto a la restricción f ′ ( x̄)(x − x̄) = 0.
Supongamos haber demostrado que lo mismo ocurre si conside-
ramos la restricción f ′ ( x̄)(x − x̄) ≤ 0. Llamemos a este, supuesto
(A). Sea entonces x1 ∈ X y sea x2 una combinación convexa de x0 y
x1 . Por el supuesto (A), debe verificase que f (x2 ) ≥ f (x) para todo x
tal que f ′ (x2 )(x − x2 ) ≤ 0. Obsérvese que, por ser x2 una combina-
ción convexa de x0 y x1 , no pueden verificarse simultáneamente las
siguientes desigualdades:
f ′ (x2 )(x0 − x2 ) > 0, y f ′ (x2 )(x1 − x2 ) > 0;
ni
f ′ (x2 )(x0 − x2 ) < 0, y f ′ (x2 )(x1 − x2 ) < 0;
Luego será cierto que f (x2 ) ≥ f (x0 ) o bien f (x2 ) ≥ f (x1 ) es decir
f (x2 ) ≥ min { f (x0 ), f (x1 )} por lo que f es cuasi-cóncava.
134 8. DESARROLLOS DE LA PROGRAMACIÓN NO LINEAL

Falta entonces probar la afirmación hecha en (A). Consideremos la res-


tricción definida por el conjunto X0 = { x ∈ X : f ′ (x0 )(x − x0 ) ≤ 0}. Que-
remos probar que f (x0 ) es el máximo de f restringido a X0 . Supongamos
que no lo sea. En este caso existe x1 ∈ X0 tal que f (x1 ) > f (x0 ). Sean
x(λ) = (1 − λ)x0 + λx1 y g(λ) = f ((1 − λ)x0 + λx1 ). Se verifica que g(1) > g(0)
y que g′ (λ) = grad f (x(λ))(x1 − x0 ). Se tiene además que g′ (0) < 0, por
lo tanto existe λ̄ ∈ (0, 1) que es mı́nimo relativo para g, para el que se
cumple g′ (λ̄) = 0. Es posible elegir un h suficientemente pequeño tal que
λ̄ + h ∈ (0, 1). Puede verificarse que x(λ̄ + h) − x(λ̄) = h(x1 − x0 ). Por lo tanto,
grad f (x(λ̄))x(λ̄ + h) − x(λ̄) = 0 por o tanto f (x(λ̄ + h)) < f (x(λ̄)) es decir
g(λ̄ + h) < g(λ̄). De donde la demostración se concluye por el absurdo. 

8.3. Programación multi-objetivo


Nos referiremos ahora al problema de maximizar funciones vectoriales
f : Rn → Rk bajo determinadas restricciones.

DEFINICIÓN 8.7. Sea f1 (x), ... , fk (x) y g1 (x), ... , gm (x) funciones reales de-
finidas en X ⊂ Rn. Diremos que x̂ ∈ X es un máximo para f (x) = ( f1 (x), ... , fk (x))
sujeto a g j (x) ≥ 0, j = 1, . . . , m, si se dan las siguientes condiciones:
(i) g j ( x̂) ≥ 0, j = 1, . . . , m, y x̂ ∈ X.
(ii) No existe x tal que:

fi (x) ≥ f( x̂) ∀i = 1, . . . , k
(38) fi (x) > fi ( x̂) para algún i,
g j (x) ≥ 0 j = 1, . . . , m; con x ∈ X.

El lector puede ver que los llamados puntos eficientes en la teorı́a de la


producción, verifican esta definición. Es decir si x̄ es eficiente, entonces con
una cantidad menor o igual de insumos no puede producirse una cantidad
mayor de producto. También es de interés remarcar que un óptimo de Pareto,
es precisamente una asignación que verifica un sistema del tipo (38) siendo las
funciones fi las correspondientes funciones de utilidad y g(x) la restricción de
factibilidad, ver por ejemplo [Balasko, Y. (88)].
De acuerdo a la definición anterior se tiene que si x̂ realiza el máximo para
la función vectorial f (x) entonces
8.3. PROGRAMACIÓN MULTI-OBJETIVO 135

x̂ maximiza fi0 (x) [esto es : fi0 ( x̂) ≥ fi0 (x)]


su jeto a : fi (x) ≥ fi ( x̂)
fi (x) ≥ fi ( x̂) ∀i 6= i0
g j (x) ≥ 0 j = 1, . . . , m, x ∈ X.
El siguiente teorema da una condición necesaria para máximo, que el
lector verificará:
TEOREMA 8.8. (Condición necesaria para máximo) Consideremos el
conjunto f1 , . . . , fk , g1 , . . . , gm de funciones reales y cóncavas definidas en un
subconjunto convexo X ∈ Rn . Suponga que la condición de Slater se verifica
(esto es, existe x̄ ∈ X : g j (x) ≥ 0 para todo j). Entonces si x̂ maximiza
f (x) = ( f1 (x), . . . , fk (x)) restringido a g j (x) ≥ 0 ∀ j, existe α ∈ Rk , λ̂ ∈ Rm
con α ≥ 0, λ̂ ≥ 0 y α 6= 0 tal que ( x̂, λ̂) es un punto de silla para φ(x, λ) =
α f (x) + λg(x); esto es:
φ(x, λ̂) ≤ φ( x̂, λ̂) ≤ φ( x̂, λ) ∀ x ∈ X, λ ≥ 0.
Presentaremos ahora una condición suficiente:
TEOREMA 8.9. (Condición suficiente para máximo) Consideremos el
conjunto f1 , . . . , fk , g1 , . . . , gm de funciones reales y cóncavas definidas en un
subconjunto convexo X ∈ Rn . Suponga que existe x̂ ∈ X, α > 0, y λ̂ ≥ 0, tales
que
α f (x) + λ̂g(x) ≥ α f ( x̂) + λ̂g( x̂), ∀ x ∈ X,
y además:
λ̂g( x̂) = 0, g( x̂) ≥ 0.
Entonces x̂ es un máximo para f (x) restringido a: g(x) ≥ 0, x ∈ X.
Obsérvese que si bien la concavidad de las funciones es necesaria para el
teorema anterior, no lo es la convexidad de X.
El siguiente teorema se deduce inmediatamente de este:
TEOREMA 8.10. Sean f1 , . . . , fk ; g1 , . . . , gm funciones reales definidas en
un subconjunto X ∈ Rn . Suponga que existen x̂ ∈ X y coeficientes α1 , . . . , αk
con αi > 0 para todo i, tales que x̂ maximiza α f (x) restringido g(x) ≥ 0 y
x ∈ X. Entonces x̂ maximiza f (x) restringido a g(x) ≥ 0, y x ∈ X.
Para una aplicación de este teorema para caracterizar los óptimos de Pareto
ver por ejemplo [Accinelli, E.; Brida, G. Plata, L.; Puchet, M.].
136 8. DESARROLLOS DE LA PROGRAMACIÓN NO LINEAL

TEOREMA 8.11. Sean f1 , . . . , fk ; g1 , . . . , gm funciones reales definidas en


un subconjunto X ∈ Rn . Suponga que existe α ∈ Rk con αi > 0 para todo
i ∈ {1, . . . , n} y un punto silla ( x̂, λ̂) ∈ Rk × Rm para los que se verifica:
φ(x, λ̂) ≤ φ( x̂, λ̂) ≤ φ( x̂, λ)
con φ(x, λ) = α f (x) + λg(x). Entonces
(1) x̂ maximiza f (x) restringido a g(x) ≥ 0.
(2) λ̂g( x̂) = 0.
Para el caso en el que las funciones sean diferenciables, las condiciones
de primer orden toman la forma
α fx ( x̂) + λ̂g( x̂) = 0
y los teoremas correspondientes se deducen en forma obvia.
Capı́tulo 9
Economı́a y optimización no lineal

Consideremos un consumidor tı́pico con una función de


utilidad u(x) definida en su conjunto de consumo X. La
función u(x) es una función real definida en X. El consumi-
dor elige x (su acción) de forma tal de maximizar u(x). Su
elección está restringida a un subconjunto de X, llamado
la restricción presupuestaria.
A Takayama.

Las aplicaciones de la programación no lineal en economı́a son abundan-


tes y muy importantes. En definitiva la economı́a es la ciencia que intenta
distribuir o utilizar optimamente recursos escasos. Es decir trata de maximi-
zar una función objetivo con restricciones. De ahı́ la importancia central del
teorema de Kuhn-Tucker. Mostraremos primeramente que los multiplicadores
de Kuhn-Tucker pueden ser interpretados heurı́sticamente como los precios
de equilibrio (o precios sombra) de los recursos de una economı́a. Luego pre-
sentaremos diferentes aplicaciones de la optimización no lineal, válidas tanto
por su importancia en la teorı́a económica, como por sus enseñanza para la
técnica que estamos estudiando.
Comenzaremos con el tema ya introducido en el ejercicio 6.26, referido a
la interpretación económica de los multiplicadores de Kuhn-Tucker.
Una interpretación de los multiplicadores de Kuhn-Tucker. Suponga-
mos que sea posible modificar las restricciones de un problema de optimiza-
ción, en el que se trata de minimizar una función objetivo, f : X → R con
X ⊆ Rn , definidas por funciones gi : X → Rn de forma tal que gi (x) ≤ 0
para i ∈ I, siendo I un conjunto de ı́ndices para las restricciones. Supongamos
que estas modificaciones se realizan mediante la adquisición de una cantidad
adicional de recursos en aquellos casos en que el óptimo x∗ implica que la
restricción es activa, es decir en los casos en que g j (x∗ ) = 0, j ∈ E, donde
E ⊂ I es el subconjunto de restricciones activas. Supongamos que el precio
de la unidad adicional del j−ésimo recurso tiene un precio v∗j , j ∈ E. Sea
137
138 9. ECONOMÍA Y OPTIMIZACIÓN NO LINEAL

entonces v∗ el vector precios unitarios de los recursos. Supongamos que se


adquieren v j , j ∈ E unidades adicionales de tales recursos. Tal modificación
resulta interesante si se tiene la desigualdad f (y∗ ) + hv∗ , vi ≤ f (x∗ ). Esto es,
el costo de producir bajo las nuevas condiciones g j (y∗ ) = v j , j ∈ E, el que
es igual al costo f (y∗ ), de producir y∗ , donde y∗ minimiza f con las condicio-
nes g j (x) ≤ v j más el costo hv∗ , vi de adquirir la cantidad adicional de recursos
v, es menor que el costo de producir x∗ en la situación
n anterior. La desigualdad
o
anterior corresponde a la siguiente: mı́nx∈C f (x) + j∈E v∗j g j (x) < f (x∗ )
P

siendo C = { x : g j (x) = v j } .
Supongamos ahora que v∗j = λ∗j , j ∈ E es decir, que el precio unitario del
recurso j, está dado por el correspondiente multiplicador de Kuhn-Tucker. En
estas condiciones se tiene que
( )
X
f (x) + λ∗i gi (x) ≥ f (x∗ ),
i∈E
es decir que ( )
X
mı́n f (x) + λ∗i gi (x) = f (x∗ ),
x∈C
i∈E
es decir que a precios la mejor opción es x∗ , por lo tanto no hay incentivos
λ∗
a modificar la producción.

9.1. Dos aplicaciones


Presentaremos en esta sección dos aplicaciones de gran importancia en la teorı́a
económica. El primero puede ser llamado el problema de la firma competitiva
y el segundo el problema del consumidor.
EJEMPLO 9.1. El primer ejemplo será el problema de minimizar costos
(MC) por parte de una firma competitiva que produce un único producto a
partir de n insumos. Asumimos que los precios unitarios de los insumos y el
producto están determinados y no dependen de la actividad de la firma.
La firma deberá elegir los insumos que le permitan producir una cierta
cantidad y, previamente determinada, del bien que ella produce, en forma tal
de minimizar el costo de tal producción Los insumos utilizados serán indicados
por un vector x ∈ Rn , cuyas coordenadas representan la cantidad utilizada del
insumo correspondiente. Esta elección será realizada en forma acorde con la
técnica de producción que la firma posee, la que será representada por una
9.1. DOS APLICACIONES 139

función de tecnologı́a f : Rn+ → R, definida como y = f (x) la que asumiremos


estrictamente cóncava y diferenciable.
La firma competitiva elegirá entonces, x ∈ Rn+ tal que resuelva el siguiente
problema:
Minimizar: wx, (Maximizar: −wx)
(39)
sujeto a: f (x) ≥ y and x ≥ 0,
donde, w es el vector de precios (dado) de los insumos, admitimos wi > 0, i =
1, 2, . . . n; x el vector de insumos, y(> 0) el nivel del producto deseado, f (x)
la función de producción. Las condiciones de primer orden (CPO), para este
problema son:
−wi + λ̄ ∂∂x
f ( x̄)
i
≥ 0, [−wi + λ̄ ∂∂x
f ( x̄)
i
] x̄i = 0 i = 1, 2, ..., n (A)
(40)
λ̄[ f ( x̄) − y] = 0, f ( x̄) − y ≥ 0. (B)
Estas condiciones caracterizan la solución del problema de minimización
del costo, a la que llamaremos demanda por insumos de la firma a precios w y
para el nivel y de producción, al que representaremos por x̄ = x(w, y). El valor
del multiplicador también podrá ser obtenido a partir de estas condiciones y
lo representaremos por λ̄ = λ(w, y).
EJERCICIO 9.2. Muestre que si solamente se exige concavidad (no estricta)
a la función de producción, la demanda de la firma puede no ser única.
El conjunto factible para este problema es C = { x : x ≥ 0, f (x) ≥ y}.
Suponga que existe x̄ ≥ 0, tal que f ( x̄) > y esto es que se cumple la condición
de Slater, (ver corolario 6.6). Si la función de producción es estrictamente
cóncava, entonces las condiciones (40) son necesarias para la existencia de
un óptimo local. Por otra parte siendo la función objetivo lineal, y por lo
tanto cóncava, las condiciones de primer orden son también suficientes para
un óptimo global.
No obstante es perfectamente posible obtener una solución de esquina, esto
es una solución donde se cumpla la desigualdad estricta en (40); λ̄ ∂∂x f ( x̄)
i
< wi ,
en este caso x̄i = 0. Puede pensarse que para la tecnologı́a existente es un
factor muy caro y que por lo tanto no se usará.
En el caso en que x̄ verifique las igualdades
∂ f ( x̄)
(41) λ̄ = wi , y = f ( x̄),
∂xi
es posible obtener a partir del teorema de la función implı́cita (ver apéndice),
una función x̄i : Rn++ × R → Rn+ definida como x̄ = xi (w, y) llamada función
140 9. ECONOMÍA Y OPTIMIZACIÓN NO LINEAL

de demanda (de largo plazo) de la firma por insumos . La referencia al largo


plazo es debida a que suponemos que la firma puede elegir libremente sobre
todos los insumos, a diferencia del corto plazo, que hace referencia al hecho
de estar fijo algún o algunos insumos.
A partir de la función de demanda por insumos, es posible obtener una
oferta óptima de la firma competitiva, es decir la cantidad de producto que
la firma dejada a su libre arbitrio escogerá. Bastará para esto resolver el
correspondiente problema de maximización de beneficios.
(42) maxy∈R+ π(y) = py − wx(w, y).
La oferta óptima será función del precio p del producto y de los precios w de
los insumos, la representamos por y∗ = y(p, w), los que la firma competitiva
asume como determinados por el mercado, es decir, independientemente del
nivel de actividad por ella desarrollado, pues este se supone pequeño relativo
a la producción global.
EJERCICIO 9.3. Muestre el lector que en el caso de ser la función de
tecnologı́a cóncava, las condiciones de primer orden para el problema (42)
son necesarias y suficientes para la existencia de la solución. Observe que
y = f (x(w, y)).
EJEMPLO 9.4. Nuestro segundo ejemplo, es el problema de maximizar
la función de utilidad supuesta cuasi-cóncava y derivable de un consumidor
quien es un tomador de precios, y que tiene un ingreso fijo M.
Considérese una economı́a con l bienes, el problema del consumidor es el
siguiente:

maximizarx∈Rl u(x)
(43)
sujeto a: h p, xi ≤ M, x ≥ 0,
donde u : Rn+ → R es la función de utilidad, p ∈ Rl+ el vector de precios, cuyas
coordenadas verifican p j > 0 j = 1, ..., l y M > 0 el ingreso monetario.
Nótese que la restricción presupuestaria define un conjunto de restricciones
convexo y compacto. Por ser M > 0 y p un vector de precios positivos, existe
x̄ ∈ Rl+ tal que p x̄ < M. Además la condición (b) del teorema (8.4) se verifica,
desde que, por ejemplo, el consumidor prefiera más a menos. Las condiciones
de primer orden para este problema son:
∂u( x̄)
∂x j − λ̄p j ≤ 0, [ ∂u( x̄)
∂x j − λ̄p j ] x̄ j = 0,
(44)
λ̄(px − M) = 0, p x̄ − M ≤ 0,
9.1. DOS APLICACIONES 141

siendo x̄ ≥ 0 y λ̄ ≥ 0 y j = 1, ..., l. Como en el caso anterior, las condiciones


dadas en (44) determinan la demanda y el valor del multiplicador en función
de los parámetros, p, M.
En el caso de una función de utilidad cóncava (alcanza cuasi-cóncava) las
condiciones (44) son necesarias y suficientes para la existencia del óptimo,
naturalmente, siempre que se satisfaga la condición de Slater (ver corolario
6.6), la que en este caso, por ser M > 0, se cumple.
EJERCICIO 9.5. Muestre que la condición de cuasi-concavidad (no estricta)
en la función de utilidad, no es suficiente para asegurar la unicidad de la
solución.
Obsérvese que si hay algún tipo de no saciedad local, esto es que, en todo
entorno de toda cesta de consumo, existe otra que es estrictamente preferible,
como por ejemplo, lo que sucede si para algún j ∈ {1, ..., l} se verifica que
∂u( x̄)
∂x j > 0 (esto implica λ̄ > 0) y si además p j > 0. Bajo el supuesto de no
saciedad local, el consumidor gastará enotnces, todo su ingreso. Luego, en el
óptimo, la restricción presupuestaria se verificará con igualdad. No obstante
esto no alcanza para evitar las soluciones x̄ donde se cumple ∂u( x̄)
∂xh < λ̄ph
para algún h ∈ {1, ..., l} en este caso el vector de precios, no será paralelo al
gradiente de la curva de indiferencia del consumidor. Como se desprende de
las (CPO), x̄h = 0. El sentido económico que corresponde a esta situación es
que el bien h es demasiado caro, con respecto a la utilidad marginal que su
consumo ofrece, lo que harı́a que el agente no lo consuma.
EJERCICIO 9.6. Proponemos al lector resolver el problema del consumidor
(43) en cada uno de los siguientes casos:
(1) El precio de algún bien es cero.
(2) Existe algún bien para el que se cumple que, ∂u( x̄)
∂x j < 0. Considere los
casos en que p j ≥ 0 y p j ≤ 0.
(3) Si bien ∂u( x̄)
∂x j > 0 se verifica para el bien j−ésimo, su precio es
negativo, es decir p j < 0.
Interprete económicamente cada uno de estos casos y sus soluciones.
No obstante, en economı́a, es frecuente imponer condiciones que aseguren
que la solución sea interior, es decir x̄ j > 0, ∀ j = 1, . . . , l. Alcanzarı́a para
obtener este tipo de soluciones que, por ejemplo, todas las derivadas parciales
de la función de utilidad sean positivas, (decimos que el consumidor prefiere
más a menos) o bien que el consumidor prefiera cualquier cesta con todas sus
coordenadas positivas, a una que le ofrezca cero de algún bien. En este caso
142 9. ECONOMÍA Y OPTIMIZACIÓN NO LINEAL

nos encontramos con la solución familiar:


∂u( x̄)
(45) u j ( x̄) = = λ̄p j , j = 1, 2, . . . , l; p x̄ = M.
∂x j
Es posible, en el caso de asumir por ejemplo la estricta cuasi-concavidad de
la función de utilidad y la existencia de todas sus derivadas segundas, obtener,
a partir de las igualdades (45), la demanda del consumidor y el valor de los
multiplicadores de Lagrange, como funciones diferenciables de los paráme-
tros p y M. Esto se obtendrá como resultado del teorema de la función implı́cita.
Analizaremos esta posibilidad en la sección siguiente. El multiplicador λ puede
ser interpretado como la utilidad marginal de la moneda.

EJERCICIO 9.7. Fundamente matemáticamente esta interpretación.

9.2. El problema del consumidor: La demanda


El teorema de la función implı́cita, ver sección (11.5), permitirá como veremos,
una correcta definición de la función de demanda como función diferenciable
de los precios y el ingreso. Bastará para esto imponer condiciones adecuadas
en las funciones de utilidad. Estas condiciones no son muy restrictivas de
acuerdo a las condiciones habitualmente consideradas en la teorı́a económica
para las preferencias del consumidor, utilidad cuasi-cóncava y con derivadas
segundas continuas.
Considere el caso en que la solución es interior, es decir, para el caso en
que existen x̄ con todas sus coordenadas positivas y λ̄ > 0 que verifican las
ecuaciones:
∂u( x̄)
∂x j − λ̄p j = 0 j = 1, ..., l,
(46)
− p x̄ + M = 0.

Luego, siendo la matriz de derivadas respecto de las variables x y λ de las


funciones
∂u(x)
F j (x, λ, M, p) = ∂x j − λp j , j = 1, ..., l;
(47)
G(x, λ, M, p) = − px + M,

evaluada en la solución ( x̄, λ̄, M, P)


9.3. TRES TEOREMAS DE LA MICROECONOMÍA 143

 
u11 ( x̄) . . . u1l ( x̄) − p1
 .. .. .. .. 
(48) M=
 . . . . 

 ul1 ( x̄) . . . ull ( x̄) − pl 
− p1 . . . − pl 0
invertible, lo que está asegurado por el hecho de ser la función de utilidad dos
veces derivable y estrictamente cuasi-cóncava1. Con la notación ui j ( x̄) repre-
sentamos la segunda derivada de la función u evaluada en x̄, respecto de las
variables xi y x j , i, j = 1, ..., l. Podemos concluir entonces, utilizando el teo-
rema de la función implı́cita (ver apéndice 11.5) en la existencia, continuidad
y diferenciabilidad de la demanda individual, como función de los precios y
el ingreso. Una representación de la modificación continua de la demanda con
los precios, siempre que éstos se mantengan positivos, se muestra en la figura
23. La modificación de los precios conlleva el correspondiente cambio de las
restricción presupuestarias de cada agente de la economı́a y consecuentemente
se modifica la demanda.
EJERCICIO 9.8. A partir de las ecuaciones (41) y utilizando el teorema de
la función implı́cita, obtenga la demanda de largo plazo por insumos de la
firma competitiva.

9.3. La microeconomı́a y el teorema de separación de convexos


Finalizaremos esta sección mostrando que, tres de los lemas más importantes
de la microeconomı́a ası́ como el llamado segundo teorema del bienestar
económico son, en definitiva, una aplicación directa del teorema de separación
de convexos. El lector interesado en aplicaciones del análisis convexo a la
producción económica podrá encontrar en [Uribe, P.] un excelente texto.
Recordamos que como corolario del teorema de separación de convexos,
podemos asegurar que si un conjunto K ⊂ Rn es convexo entonces para todo
x̄ ∈ f r(K), donde por f r(K) representamos la frontera del conjunto K (ver
definición 2.19), existe p̄ ∈ Rn tal que p̄ x̄ ≤ p̄x, ∀ x ∈ K. (Este es el teorema de
existencia del hiperplano soporte ya estudiado en la sección correspondiente al
1Recuerde que la función u : X → R, X ⊂ Rl , dos veces diferenciable, es estrictamente
» 2 T

∂ u(x) [∂u(x)]
cuasi-cóncava si y solamente si, la matriz M = es definida negativa (ver
∂u(x) 0
2
teorema 8.6). Por ∂ u(x) representamos la matriz de derivadas segundas y por ∂u(x) el gradiente
de las función u.
144 9. ECONOMÍA Y OPTIMIZACIÓN NO LINEAL

FIGURA 23. La demanda como función de los precios

teorema de separación de convexos). El hiperplano determinado por el vector


p̄, como el lector recordará, es denominado hiperplano soporte de K en x̄.
Llamaremos a los vectores p̄ vectores soporte.
Sea Hk el conjunto de vectores soporte del conjunto convexo K. Definamos
a continuación la aplicación soporte de K µk :→ K definida como
µk (p) = {ȳ ∈ K : pȳ = ı́nf(py), ∀ y ∈ K } .
LEMA 9.9. (Lema de dualidad:) Supongamos que K es estrictamente
convexo. Entonces el gradiente de µk evaluado en p grad µk (p) = ȳ.
Demostración: Es inmediato ver que en este caso existe un único ȳ ∈ µk (p)
y además que pertenece a la frontera de K. Como fácilmente puede verse la
función µk es lineal. Definamos ahora la función
ξ( p̄) = µk ( p̄) − p̄y ≤ 0 ∀ y ∈ K.
Dicha función alcanza su máximo valor en ȳ. Finalmente obtenemos que
 µ( p̄) − ȳ = 0. 
grad ξ( p̄) = grad
Sea Y = (y, − x) ∈ Rn × Rl , x > 0 un conjunto de producción, de una

firma que produce n productos a partir de l insumos. El conjunto de producción


Y es el conjunto de vectores insumo-producto, o planes posibles dada la
tecnologı́a existente. Supongamos que Y es un conjunto convexo y cerrado
(supuestos comunes en microeconomı́a) ver [Varian, H.] por ejemplo. Un
vector z ∈ Y se llama eficiente si z ∈ f r(Y).
9.3. TRES TEOREMAS DE LA MICROECONOMÍA 145

TEOREMA 9.10. (De la eficiencia) Un vector z̄ de insumo producto, es


eficiente si y solamente si existe p̄ ∈ Rnl
+ vector con todas sus coordenadas
positivas, tal que p̄z̄ ≥ p̄z ∀ z ∈ Y.
Demostración: La suficiencia es obvia. El recı́proco: La existencia es una
inmediata consecuencia del teorema de existencia del hiperplano soporte men-
cionado en el comienzo del epı́grafe. Si alguna coordenada p̄i fuese negativa
entonces la coordenada i-ésima de v ∈ Y podrı́a ser arbitrariamente grande.
Lo que es un absurdo. 
Sea Π : Rn+ → R, la función de beneficios de una empresa cuyo conjunto
tecnológico Y es convexo, Π( p̄) = maxz∈Y p̄z = p̄z̄. La existencia de z̄ se deduce
de las condiciones habituales exigidas para el conjunto Y de producción2.
TEOREMA 9.11. (De Hotteling) Sea Y estrictamente convexo, entonces
grad Π( p̄) = z̄. Es decir la oferta de productos y la demanda de insumos a
precios p̄ verifcan las igualdades respectivas que implican que de la derivada
de la función de beneficios envaluada en z̄ respecto a sus respectivos precios
sea igual a z̄.
Demostración : La estricta convexidad de Y muestra que Π es un función,
el resto es una aplicación directa del lema (9.9) 
Supongamos una empresa que produce un único producto a partir de n − 1
insumos diferentes cuyos precios están dados por w ∈ R+n−1 , con tecnologı́a
definida por una función f convexa de forma tal que
Y = {(q, −z1 , . . . , −zn−1 ) ∈ Rn : q − f (z) ≤ 0, z1 > 0, . . . , zn > 0} .
Los costos quedan definidos por la función
c(w̄, q) = minz:q≤ f (z) w̄z = w̄z̄.
TEOREMA 9.12. (De Shepard) Si la demanda por insumos z(w, q) consiste
de un único punto entonces grad w c(w, q) = z̄.
Demostración: Si admitimos la estricta convexidad de la función f , la
unicidad de la demanda de insumos se deduce inmediatamente. Lo restante es
nuevamente una aplicacion del lema de dualidad. 
Finalmente veamos la relación entre la demanda hicksiana y la función
de gasto. Supongamos una economı́a con n bienes diferentes cuyo espacio
de consumo es X ⊂ Rn y un agente cuya función de utilidad está dada por
u : Rn → R, cóncava. Recordamos que se define como demanda hicksiana
la demanda que minimiza el gasto que permite alcanzar un nivel de utilidad
2Por ejemplo la existencia de a ∈ Rn tal que z ≤ a, ∀ z ∈ Y.
146 9. ECONOMÍA Y OPTIMIZACIÓN NO LINEAL

determinado. A precios p fijos el gasto corresponde al valor de la cesta de


bienes elegida es decir px si dicha cesta es p. Definimos ahora la función
de gasto e : Rn × R → como:
e( p̄, ū) = min x px
s.a. : u(x) ≥ ū
La cesta de bienes x̄ que resuelve este problema es precisamente la demanda
hicksiana: x̄ = h( p̄, ū). Obsérvese que siendo la función de utilidad cóncava,
entonces el conjunto { x ∈ X : u(x) ≥ u} es convexo. A partir del lema de
dualidad podemos concluir ahora que, grad p e( p̄, ū) = h( p̄, ū).

9.4. El segundo teorema del bienestar económico


Como una aplicación del teorema de separación de convexos, probaremos el
teorema que garantiza la posibilidad de que todo óptimo de Pareto, puede
ser alcanzado en forma descentralizada por una economı́a, a partir de una
redistribución de la riqueza inicial existente. Un tratamiento amplio del tema
puede verse en [Mas-Colell et al].
Considere una economı́a con l bienes, n consumidores, con preferencias
i convexas, estrictamente monótonas (es decir cada consumidor prefiere más
a menos de cualquier bien) y dotaciones iniciales wi i = 1, . . . , n. Suponemos
además que en la economı́a existen l bienes (por lo que wi ∈ Rl+ , i = 1, . . . , n).
Sea x = (x1 , . . . , xn ) una asignación factible, es decir una lista de cestas de
bienes,
Pn unaPpara cada consumidor, por lo que xi ∈ Rl+ y que además verifica
n ∗
i=1 xi = i=1 wi . Decimos que una una asignación x es Pareto optimal,
si es factible y ningún integrante de la economı́a puede mejorar lo que le
corresponde en x∗ sin que otro empeore.
TEOREMA 9.13. (Segundo teorema del bienestar económico.) En las
condiciones antedichas para toda asignación de recursos Pareto optimal x∗ ,
existe un sistema de precios p∗ = (p∗1 , . . . , p∗l ) tal que el par (p∗ , x∗ ) es un
equilibrio walrasiano con transferencias.
Demostración: Considere los conjuntos:
( n
)
X
l ∗
Y = z ∈ R+ : z = zi , zi  xi .
i=1
( n
)
X
J = x∈ Rl+ :x= wi .
i=1
9.4. EL SEGUNDO TEOREMA DEL BIENESTAR ECONÓMICO 147

Como puede comprobarse fácilmente Y y J son subconjuntos convexos de


Rl , cuya intersección es no vacı́a pues x∗ pertenece a ambos, pero riY ∩riJ = ∅.
Ahora por el teorema de separación de convexos (3) en sección (3.3) existe
p∗ ∈ Rl tal que p∗ z ≥ p∗ x ∀z ∈ Y , x ∈ J . Puede probarse que p∗i > 0,
∀i = 1, . P
. . , l. En efecto por la estricta monotonı́a de las preferencias se tiene
que z = ni=1 x∗1 + e j pertenece a Y por lo que p∗ z ≥ p∗ x∗ . Esto supone que
p∗ e j ≥ 0, luego p∗j ≥ 0 siendo e j = (0, . . . , 0, 1, 0, . . . , 0) el vector con ceros
en todas sus coordenadas con excepción de la j-ésima, donde tiene un uno,
se deduce la desigualdad para todo p∗j , j = 1, . . . , l. Para un nivel de riquezas
w∗i = p∗i x∗i el par (p∗ , x∗ ) es un equilibrio walrasiano. 
El lector no familizarizado con el tema puede encontrrá una exposición
detallada en [Mas-Colell et al].
Dedicaremos la próxima sección al análisis de sensibilidad, y al llamado
teorema de la envolvente.
Capı́tulo 10
Análisis de sensibilidad

La verdadera optimización es la contribución revoluciona-


ria de la investigación moderna a los procesos de decisión
G. B. Dantzig.

Se analizarán las modificaciones en la solución de un problema de pro-


gramación no lineal, cuando se modifican los parámetros del problema, por
ejemplo el precio de alguno de los insumos o factores de producción, o el
total a producir y en el caso de minimizar un costo o maximizar beneficios,
o bien en el precio de alguno de los bienes, o el ingreso en el caso de un
consumidor que maximiza su función de utilidad. Para considerar estos pro-
blemas en forma general trabajaremos con las siguientes funciones: f (x, α) y
g j (x, α), j = 1, 2, . . . , n, reales, continuamente diferenciables, definidas en Rn+l
donde x ∈ Rn , α ∈ Rl , que el lector particularizará. Consideremos el problema
de fijado un vector α de parámetros, hallar x tal que:
maximizar: f (x, α)
(49)
sujeto a: g j (x, α) ≥ 0, j = 1, 2, . . . , n x ≥ 0.
Las condiciones de primer orden para este problema son:
fx ( x̄, α) + λ̄g x ( x̄, α) ≤ 0, [ fx ( x̄, α) + λ̄g x ( x̄, α)] x̄ = 0
λ̄g( x̄, α) = 0, g( x̄, α) ≥ 0.
Por fx ( x̄, α) representamos el gradiente de f evaluado en ( x̄, ᾱ), análogamente
para g x ( x̄, α) en todas las restricciones. Con x̄ ≥ 0, λ̄ ≥ 0.
El análisis de sensibilidad se refiere a las modificaciones que aparecen en
la solución óptima x̄(α) y λ̄(α) ante modificaciones del parámetro α.
Consideraremos el caso más sencillo en el que la solución es interior, esto
es x̄i > 0, ∀i y λ̄ j > 0, ∀ j. Por este motivo las (CPO) quedan restringidas a las
149
150 10. ANÁLISIS DE SENSIBILIDAD

igualdades:
fx ( x̄, α) + λ̄g x ( x̄, α) = 0
(50)
g( x̄, α) = 0.
Estas (n + m) ecuaciones, se usarán para obtener, (n + m) incógnitas
x̄i = xi (α), i = 1, 2, . . . , n;
(51)
λ̄ j = λ j (α), j = 1, 2, . . . , m.
A a partir del teorema de la función implı́cita aplicado al sistema ( 50)
obtenemos las funciones diferenciables definidas en (51) las que a su vez
permiten definir una función diferenciable a la que llamaremos función valor
o máximo valor.

F(α) = f [x(α), α]
Definamos también la función:
Ψ(α) = f [x(α), α] + λ(α)g[x(α), α]
a la que llamaremos función pertubación.

10.1. Teorema de la envolvente


La aplicación del teorema de la función implı́cita a las condiciones de primer
orden, (50) permiten analizar las repercusiones de cambios en los parámetros
en los resultados de los problemas de maximización, aún sin conocer explici-
tamente la función máximo valor. El llamado teorema de la envolvente da esta
posibilidad:
TEOREMA 10.1. (De la envolvente) Sean F y Ψ diferenciables, entonces
tenemos que: Fα = Ψα = Φα esto es:
∂F(α) ∂Ψ(α) ∂Φ(x(α), λ, α)
= = ,
∂α j ∂α j ∂α j
donde Φ(x, λ, α) = f (x, α) + λg(x, α) es el lagrangiano,mientras que x(α)
representa a la solución del problema de maximización definido en (49).
Demostración: La prueba se sigue de aplicar la regla de la cadena y aplicar
las (CPO), definidas en (50):

Ψα = Φ x xα + Φλ λα + Φα = Φα ,
10.1. TEOREMA DE LA ENVOLVENTE 151

Fα = fx xα + fα = −λg x xα + fα = λgα + fα = Φα ,
para obtener la segunda igualdad se usó la primera ecuación del sistema (50),
para la tercera se usó la segunda ecuación de dicho sistema, pues g x xα +gα = 0.
Para justificar el nombre de este teorema1 considere el siguiente cambio
de variables: β = (α1 , . . . , αl−1 ) y el siguiente problema de maximización:
F(αl ) = máxβ F(β, αl )
(52)
s.a : g(β, αl ) = b.
Supongamos que se fija ᾱ j , sea entonces β̄ = β(ᾱ j ) la solución para el co-
rrespondiente problema de maximización. Se verifica entonces que F(α j ) ≥
F(β̄, αl ) con igualdad sólo en α j = ᾱ j . Luego F(αl ) − F(β̄, αl ) ≥ 0, esta
diferencia alcanza su mı́nimo en α j = ᾱ j por lo que se verificará que
dF(ᾱl ) ∂F(β̄, ᾱl )
(53) − = 0.
dαl ∂αl
Esta igualdad representa el contenido fundamental del teorema de la envolven-
te. Obsérvese que esta conclusión se puede obtener a partir de aplicar la regla
de la cadena a: F(αl ) = F(β(αl ), αl ) siendo β(αl ) la solución del problema (52)
y de la correspondiente condición de primer orden: ∂F(β(αl ), αl )/∂β = 0.
Por lo que F(αl ) y F(β̄, αl ) coinciden en α j = ᾱl , donde F(β̄, αl ) alcanza
su máximo, y donde además se verifica que la derivada total de F(αl ) coincide
con la derivada parcial de F(β̄, αl ) respecto a α j . Las siguientes dos ecuaciones
definen la envolvente de la familia curvas F(β, αl ) parametrizadas por αl , en
el plano (F, αl ),

φ(β̄, ᾱl ) = F(ᾱ j ) − F(β̄, ᾱl ) = 0,


(54)
dF(ᾱl ) ∂F(β̄,ᾱl )
φαl (β̄, ᾱl ) = dλl − ∂αl = 0.

1Sea {γ } una familia S de curvas suaves en el plano dependientes del parámetro α. Una
α
curva suave γ se denomina envolvente de la familia S si en cada uno de sus puntos es tangente al
menos a una curva de la familia y si en cualquier segmento de la misma es tangente a un conjunto
infinito de curvas de la familia. Si la familia de curvas está definida para cada α = ᾱ ∈ (a, b),
por la ecuación γ(β, ᾱ) entonces la envolvente γ a la familia S se determina por las ecuaciones:
φ(β, ᾱ) = γ(β) − γ(β, ᾱ)− = 0 φα (β) = 0.
Ver [Pogorélov, A.].
152 10. ANÁLISIS DE SENSIBILIDAD

Para cada αl fijo las ecuaciones φ(β(αl ), αl ) = 0, siendo β(α) solución del
problema (52) y φαl (β, αl ) = 0 define la envolvente a la familia de superficies
parametrizada por αl . A partir de las ecuaciones anteriores obtenemos, la
ecuación de la envolvente ǫ(F, αl ) = 0.

10.2. Aplicaciones a la microeconomı́a


Como aplicación del teorema de la envolvente analizaremos la repercusión
que la modificación en el ingreso del consumidor o en alguno de los precios,
tiene en la utilidad obtenida por el consumidor racional.
EJEMPLO 10.2. Consideremos el problema del consumidor, asumamos
p > 0 y sea x(p, M) la solución del problema, siendo λ(p, M) el multiplicador
de Lagrange. En este caso α = (p, M). La función de utilidad del consumi-
dor será: u. Definimos :
U(p, M) = u[x(p, M)],
como la función de utilidad indirecta.
La función lagrangiana será: Φ = u(x)+λ(M − px). Por el teorema anterior
tendremos:
∂U/∂M = λ(p, M)
Esto es el multiplicador de Lagrange representa la utilidad marginal del
ingreso. Por otra parte obtenemos:
∂U/∂p j = −λx j , j = 1, 2, . . . , n.
Esto significa que un aumento en el precio disminuirá la satisfacción del
consumidor.
Las igualdades obtenidas nos permiten obtener la identidad de Roy:
∂U/∂p j + x j ∂U/∂M = 0, j = 1, 2, . . . , n.
EJEMPLO 10.3. (Una interpretación del multiplicador) Consideremos
el problema de elegir x ∈ Rn tal que:
maximizar : f (x)

su jeto a : g j (x) ≤ b j , j = 1, 2, . . . , m
El lagrangiano será: Φ(x, λ, b) = f (x) + λ[b − g(x)]
10.3. LA ENVOLVENTE DE LAS CURVAS DE COSTO EN EL CORTO PLAZO 153

Aplicando el teorema anterior con F(b) = f [x(b)] obtenemos:


∂F(b)
= λ j , j = 1, 2, . . . , m
∂b j
Entonces el j-ésimo multiplicador de Lagrange, representa el variación mar-
ginal del valor del máximo F(b) con respecto a la j-ésima restricción. Inter-
pretando b j como la cantidad existente del j-ésimo recurso, λ j representa la
pérdida en el valor máximo F(b) por la pérdida de una unidad del mencionado
recurso, por lo tanto es un precio sombra.
Sugerencia: considere el problema de minimizar el costo, ya presentado,
y haga las interpretaciones correspondientes. Verifique que el multiplicador λ
representa el costo marginal por elevar en una unidad el producto. Observe
también que en el óptimo, la demanda por el j-ésimo factor es igual a la
variación marginal del costo respecto a su precio.
El lector interesado podrá verificar también el lema de Hotelling, esto,
en un problema de maximizar beneficios, para una firma competitiva que
produce m productos a partir de n factores, la variación marginal del beneficio
π(p, w) = py − wx respecto del precio del i-ésimo producto es igual a la
producción óptima del mismo, y que el beneficio decrece con el aumento del
precio de los factores.
También puede obtenerse, a partir de la verificación anterior, asumiendo
que la función beneficio es dos veces diferenciable, la llamada simetrı́a de
Hotelling, esto es:
∂x j /∂wi = ∂xi /∂w j
Estas relaciones pueden encontrarse en [Varian, H.].

10.3. La envolvente de las curvas de costo en el corto plazo


Supongamos que para producir un determinado producto en cantidad y se
utilizan n + 1 insumos, n de ellos variables y uno fijo, en cantidades x ∈ Rn
variables y k ∈ R constante. Supongamos que w representa el vector de precios
de los insumos variables y que g(k) es el costo fijo, asumimos g convexa. Por
lo que producir y con una tecnologı́a f (x, k) con fk′ (x, k) > 0, tiene asociado
un costo C(y, w, k) que se obtiene de resolver el problema
mı́n x wx + g(k) = {máx x −[wx + g(k)]} s.a : f (x, k) ≥ y, x ≥ 0.
(55)
s.a : f (x, k) ≥ y, x ≥ 0.
Sea C(w, y, k) = wx(w, y, k) + g(k) = mı́n x wx + g(k) s.a. y = f (x, k), por lo
que C(w, y, k) representa el costo de corto plazo para producir una cantidad y
154 10. ANÁLISIS DE SENSIBILIDAD

de producto con precios de los insumos variables definidos por w y k el monto


del insumo fijo.
El lagrangiano para este problema es
Φ(x, λ) = −[wx + g(k)] + λ[ f (x, k) − y].
Asumiendo w, y, k como parámetros obtendremos una demanda por insumos
variables, x(w, y, k), por lo que C(w, y, k) = wx(w, y, k) + g(k) y para el multi-
plicador λ = λ(w, y, k).
Por el teorema de la envolvente obtenemos:
∂C(w, y, k)/∂y = ∂Φ/∂y = −λ(w, y, k), (a)
(56) ∂C(w, y, k)/∂w j = ∂Φ/∂w j = − x j(w, y, k), (b)
∂C(w, y, k)/∂k = ∂Φ/∂k = −g′ (k) − λ∂ f (x, k)/∂k. (c)
Si fijamos el valor de k = k̄ obtenemos la función de costos de corto plazo a
partir de la igualdad
C(w, y, k̄) = wx(w, y, k̄) + g(k̄).
Denotaremos por C(w, y) a la función de costos de largo plazo. En el largo
plazo todos los factores son variables, la firma puede elegir libremente todos
los insumos, aún aquellos considerados fijos en el corto plaza,.
C(w, y) = mı́n wx + g(k) s.a : y = f (x, k).
k,x

Sea
Φ̄(x, k, λ̄) = −[wx + g(k)] + λ̄[ f (x, k) − y]
el correspondiente lagrangiano para el problema de largo plazo.
A partir del teorema de la envolvente obtenemos:
∂C(w, y)/∂y = ∂Φ̄/∂y = −λ̄(w, y), (a)
(57) ∂C(w, y)/∂w j = ∂Φ/∂w j = − x j(w, y), (b)
∂C(w, y)/∂k = ∂Φ/∂k = −g′ (k) − λ∂ f (x, k)/∂k. (c)
Al resolver el problema de largo plazo, para cada valor de y fijo encon-
traremos un valor k(y) correspondiente al valor de k que minimiza el costo de
producir y asumiendo ahora este insumo ahora también variable. Sea y = ȳ
dado y sea k̄ = k(ȳ) la correspondiente demanda por el insumo k en el largo
plazo. Supongamos ahora que consideramos este valor del producto como pre-
determinado. El costo de corto plazo asumiendo k = k̄, verificará la igualdad:
(58) C(w, ȳ, k̄) = C(w, ȳ).
10.4. EJERCICIOS 155

A partir de las ecuaciones (56) y (57) concluimos en que


(59) Cy′ (w, ȳ) = Cy′ (w, ȳ, k̄).
A esta conclusión se puede llegar también a partir de las definiciones de
las funciones involucradas, pues es claro que
C(w, y, k̄) ≥ C(w, y)
es decir que C(w, y, k̄) − C(w, y) ≥ 0 ∀y ≥ 0.
De esta forma, para w fijo, en el plano (C, y) la curva {(C(w, y), y) y ≥ 0}
define la envolvente a la famila de curvas {(C(w, y, k), y) y ≥ 0}. Es decir que
para cada y ≥ 0, encontramos k tal que
C(w, y) − C(w, y, k) = 0,
(60)
Cy′ (w, y) − Cy′ (w, y, k) = 0.
Por lo tanto, la curva de largo plazo forma la envolvente de las curvas de
corto plazo. Fijado w, cada una de estas curvas coincide con la curva de largo
plazo, en un único punto en el que además ambas son tangentes.

10.4. Ejercicios
EJERCICIO 10.4. Considere el problema de maximizar f (x) sujeto a
g(x) + α ≤ 0 siendo f y g funciones reales con dominio en X ⊂ Rn y
α ∈ R. Muestre que si f y g son cóncavas entonces la función perturbación
definida para cada α ∈ A siendo A convexo es cóncava.
EJERCICIO 10.5. Encuentre la función valor F(α) y la perturbación φ(α)
correspondientes al problema:
1 1
max x∈R2++ x12 x22

s. a : α1 x1 + α2 x2 ≤ α3
donde α ∈ R3 .
EJERCICIO 10.6. Considere una firma que produce un producto a partir
de un insumo variable x ∈ R y un insumo constante k, suponga g(k) = k2 y
1 1
f (x, k) = x 2 k 2 . Obtenga las curvas de costos de corto y largo plazo, en el plano
(C, y).
Capı́tulo 11
Apéndices

En los siguientes apéndices se presentan algunas demostraciones y comen-


tarios no realizados en el texto, pero que, por creerlos de interés y a los efectos
de simplificar la vida del lector interesado, las incluimos acá. Su lectura no es
esencial para la comprensión de los temas presentados, pero algunos de ellos
son en cierta forma paradigmáticas y completan el conocimiento adquirido de
los temas estudiados en el libro.

11.1. Apéndice I. Topologı́as equivalentes


Mostraremos la equivalencia entre las diversas topologı́as lineales de Haus-
dorff en Rn . Sea (X, τ) un espacio topológico. Decimos que la topologı́a τ es
Hausdorff si separa puntos, es decir si dados dos puntos diferentes x e y existen
abiertos disjuntos que los contienen. Puede demostrarse que si τ es Hausdorff,
entonces todo conjunto compacto es cerrado.
Sea X espacio vectorial. Decimos que una topologı́a τ en X es lineal si las
funciones
• f : X × X → X definida como f (x, y) = x + y y
• g : R × X → X definida como g(α, X) = αx,
son τ continuas. De esta forma el par (X, τ) define un espacio vectorial to-
pológico.
TEOREMA 11.1. (Topologı́as equivalentes en Rn ) Todo espacio vectorial
topológico, de dimensión finita admite una única topologı́a lineal de Hausdorff.
Demostración: Sea X = Rn y τ1 una topologı́a lineal y Hausdorff en
X y sea τ la topologı́a generada por la norma euclidiana k xk2 . Mostremos
primeramente que τ1 ⊂ τ. Para esto consideremos la función identidad
I : (X, τ) → (X, τ1 ).
157
158 11. APÉNDICES

Si demostramos que esta función en continua habremos demostrado que τ1 ⊆ τ.


Considere { xα } una sucesión de Rn tal que xα → 0 de acuerdo a k xk2 .
Esto supone que cada sucesión coordenada { xαi } converge a cero. Luego
xα = ni=1 xiei siendo ei los vectores canónicos, converge a cero según τ1 .
P
Luego la identidad I por ser lineal es continua como función de (X, τ) en
(X, τ1 ). Mostraremos a continuación que: τ ⊂ τ1 . Sea B = { x ∈ Rn : k xk2 < 1}
y sea S = { x ∈ Rn : k xk2 = 1}. Por ser S compacto en τ y como por la parte
anterior sabemos que τ1 ⊂ τ, se sigue que S es τ1 compacto. Luego, como τ1
es Hausdorff, entonces S es cerrado. Luego como 0 6∈ S existe V entorno de
0 con la topologı́a τ1 , tal que V ∩ S = ∅. Además V ⊆ B, pues si no lo fuera,
existirı́a x ∈ V tal que k xk2 > 1, por lo que x/k xk2 ∈ V ∩ S lo que es absurdo.
Luego V ⊆ B por lo que τ ⊆ τ1 . 

11.2. Apéndice II. Continuidad de funciones


Haremos en este apéndice algunos comentarios sobre la continuidad de fun-
ciones. En primer lugar es interesante destacar que el hecho de ser una función
entre dos espacios topológicos una función continua, depende de las topologı́as
elegidas. Una topologı́a con pocos abiertos en el dominio de las funciones,
dará como resultados pocas funciones continuas. Cuanto más rica en abiertos
sea la topologı́a considerada en el dominio, más funciones continuas definidas
en el espacio topológico en el que se encuentra el dominio habrá (recuerde el
lector la definición 2.44). En el caso de ser el dominio un subconjunto de Rn las
funciones continuas serán las mismas para toda topologı́a Hausdorff y lineal.
En segundo lugar, es importante destacar que la definición de continuidad en
espacios métricos realizadas en términos de proximidad, es equivalente a la
definición, introducida en el texto en la sección (2.8), que sólo hace referencia
a conjuntos abiertos, si consideramos la topologı́a cuya base está formada por
las bolas abiertas con la métrica considerada. Una función f : X → Rn definida
en X ⊆ Rm , se dice continua en el punto a ∈ X cuando para cualquier ǫ > 0
dado, se puede obtener un δ > 0 tal que para todo x ∈ X cuya distancia al
punto a sea menor que δ es transformado por f en un punto f (x) que dista de
a en menos que ǫ. En forma simbólica
∀ǫ > 0, ∃δ > 0 : x ∈ X, tal que k x − ak < δ ⇒ k f (x) − f (a)k < ǫ.
En términos de bolas, la continuidad de f en a se expresa ası́: Para toda bola
abierta B′ de centro en f (a) en Rm , existe una bola abierta de centro en a en
Rn tal que f (B ∩ X) ⊂ B′ . Remarquemos que la continuidad de una función
es una propiedad local. Observemos que toda función es continua en un punto
11.3. APÉNDICE III. TEOREMA DE HEINE-BOREL 159

aislado: Sea a un punto aislado del dominio de f, entonces f es continua en a.


En efecto, obsérvese que si a es aislado existe δ > 0 tal que Ba (δ ∩ X) = {a}.
Luego para cualquier ǫ > 0 se tiene que k f (x) − f (a)k < ǫ, cada vez que x ∈ X
verifique k x − ak < δ pues x = a.

EJERCICIO 1A Construya una función f : R → R tal que:


(1) Sea continua en un sólo punto.
(2) No sea continua en ningún punto.
EJERCICIO 2A Defina en R la topologı́a discreta, para la cual todo punto
es un abierto. Muestre que toda función f : R → R es continua, pero que
si dotamos a R de la topologı́a trivial (los úncos abiertos son R y el vacı́o)
entonces sólo son continuas las funciones constantes.

11.3. Apéndice III. Teorema de Heine-Borel


La importancia del teorema de Heine-Borel radica en el hecho de que permite
afirmar que en Rn un conjunto es cerrado y acotados si y solamente si, es com-
pacto. Esta equivalencia es de importancia central en economı́a pues permite
concluir, mediante la utilización del teorema de Weirstrass, que en economı́as
con conjuntos de consumo en Rn la demanda del consumidor existe cuando
por ejemplo, los precios son positivos y las funciones de utilidad continuas.
Lamentablemente, este teorema no se verifica para espacios más generales, lo
que trae importantes desafı́os metodológicos para la teorı́a económica (simi-
lares por su dificultad, a los aparejados por los conos positivos con interior
vacı́o, propios de los espacios vectoriales topológicos de dimensión infinita),
ver por ejemplo [Araujo, A. (87)].
Para la demostración del teorema de Heine-Borel, usaremos el teorema de
Lindelöf.
TEOREMA 11.2. (de Lindelöf) Sea X ⊂ Rn un conjunto arbitrario. Todo
cubrimiento abierto X ⊆ ∪Aλ admite un subcubrimiento numerable, X ⊆
Aλ1 ∪ Aλ2 · · · ∪ Aλn ∪ · · · .
Demostración: Considere la familia B de las bolas abiertas de centro en
los racionales y con radio racional y tales que cada una de ellas esté contenida
en algún Aλ . Esta familia es numerable y cubre X. Para ver que cubre X
considere x ∈ X, luego existe una bola B x (2r) ⊂ Aλ . Además existe un
racional xi tal que x ∈ B xi (r), falta probar que esta bola está contenida en Aλ .
En efecto, si y ∈ B xi (r) entonces ky − xk ≤ ky − xi k + k xi − xk ≤ 2r. Por
lo que y ∈ B x (r) ⊆ Aλ . Luego enumerando las bolas de la familia y eligiendo
160 11. APÉNDICES

el correspondiente Aλ que contiene a la bola en consideración, Bi ⊂ Aλi ,


obtenemos la cobertura numerable. 
El teorema de Lindelöf vale para todo espacio topológico con base nu-
merable. Basta que exista en el conjunto un subconjunto denso numerable.
Decimos que un subconjunto D de un espacio topológico (X, τ) es denso en X,
si para todo x ∈ X y para todo entorno V x de x, existe h ∈ D ∩ V x .
Veamos ahora el teorema de Heine-Borel en dos etapas:
TEOREMA 11.3. (de Heine-Borel) Sea K subconjunto de Rn . Entonces:
(1) Si K es acotado y cerrado, entonces de toda cobertura de K podemos
extraer una subcobertura finita.
(2) Si de toda cobertura de K podemos extraer una subcobertura finita,
entonces K es compacto.
Con esto habremos probado la equivalencia de en Rn entre conjuntos
compactos y conjuntos acotados y cerrados. La afirmación de que K en Rn es
compacto si y solamente si toda sucesión tiene una subsucesión convergente,
se deduce del teorema de Bolazano-Weierstras que afirma que toda sucesión
limitada en Rn tiene una subsucesión convergente.
Demostración de 1: Por el teorema de Lindelöf S podemos empezar con una
cobertura numerable {Aλi , i ∈ N } de K. Sea K ⊂ ∞ i=1 Aλi . Consideremos la
familia decreciente de compactos
\
Ki = K (Aλ1 ∪ · · · ∪ Aλi )c
para cada i ∈ N. Luego para
T∞ todo x ∈ K a partir de cierto h ∈ N se verifica que
x 6∈ K j ∀ j ≥ h. Luego i=1 Ki = ∅, por lo que algún Ki es vacı́o, finalmente
K ⊂ Kic es decir K ⊆ Aλ1 ∪ · · · ∪ Aλi . 
Demostración de 2: Consideremos las bolas abiertas de radio 1 y centro
en los puntos de K. Esto es una cobertura de K, luego podemos extraer
una cobertura finita, por la tanto K está limitado. Si K no es cerrado, existe
a ∈ K̄ − K. Consideremos ahora Ai el complemento de la bola cerrada de
centro a y radio 1/i. Luego para todo x ∈ K se verifica que k x − ak > 1/i para
algún i. Puede verse que K ⊆ ∪i Ai . Por lo que la familia Ai i ∈ N es una
cobertura de K y no existe subcobertura finita. 

11.4. Apéndice IV. Lema de Zorn


Recordamos que el lema de Zorn es uno de los principios básicos de la
matemática. Para demostrarlo podemos recurrir a una serie de otros axiomas
equivalentes, pero ninguno de ellos puede demostrarse independientemente de
11.5. APÉNDICE V. TEOREMA DE LA FUNCIÓN IMPLÍCITA 161

los otros. El lema de Zorn es una de las presentaciones de estos axiomas más
usuales en matemática y en economı́a.
LEMA 11.4. (De Zorn) Si toda cadena en un conjunto X parcialmente
ordenado tiene una cota inferior, entonces X tiene un elemento minimal.
Este lema es equivalente al axioma de elección, al principio de buena
ordenación, al lema de Kuratowsky, y a otros, todos equivalentes entre si, pero
ninguno se puede demostrar sin hacer uso de alguno de ellos. Estos axiomas
o principios están en la base de la matemática y casi nada se puede construir
sin apelar a algunos de ellos. Ver [Kelley, J.].
El axioma o principio llamado de elección, presenta también un enunciado
“convincente intuitivamente” pero cuya demostración necesita del lema de
Zorn.
AXIOMA DE ELECCIÓN 11.5. Si Xa es un conjunto no vacı́o para cada
punto a de un conjunto de ı́ndices A, entonces hay una función e de A tal que
e(a) ∈ Xa para cada a ∈ A.
Este axioma lo que dice es que en cualquier colección de conjuntos no
vacı́os se puede elegir un elemento en cada uno de ellos.
El lema de Zorn permite demostrar el siguiente teorema de existencia
del óptimo de Pareto. Teorema Si en una economı́a con un número finito
de consumidores, suponemos que cada uno de ellos tiene preferencias semi
continuas superiormente entonces existe una asignación óptimo de Pareto
individualemte racional. La demostración de este teorema puede verse en
[Aliprantis, C.D.; Brown, D.J.; Burkinshaw, O.].

11.5. Apéndice V. Teorema de la función implı́cita


El teorema de la función implı́cita juega en economı́a un importante pa-
pel el que trasciende las aplicaciones que presentamos en este libro, ver por
ejemplo la sección 9.2 . No obstante entendemos que estas aplicaciones son
paradigmáticas, motivo por el cual incluimos su discusión. A los efectos de
completarla y por la gran cantidad de sus posibles aplicaciones, daremos la
demostración del teorema de la función implı́cita, en el que dichas aplicaciones
y discusión, se fundamentan.
Sea F : X × Y → Z una función entre los espacios vectoriales X = Rn , Y =
R y Z = Rl . Queremos resolver la ecuación F(x, y) = 0 sabiendo que existe
m

un punto solución, F(x0 , y0 ) = 0, para y en un entorno de (x0 , y0 ) es decir se


trata de encontrar un mapa x → y(x) tal que y(x0 ) = y0 y F(x, y(x)) = 0. La
condición para la existencia de tal mapa como una función es la existencia del
162 11. APÉNDICES

operador inverso de Fy (x0 , y0 ) :


Fy (x0 , y0 )−1 : Y → Z
como un operador lineal entre los espacios Y y Z. Esto es equivalente a que la
derivada parcial de Fréchet Fy (x0 , y0 ) : Y → Z sea una transformación lineal
biyectiva. La clave para la existencia de la solución puede verse a partir del
desarrollo clásico de F en series de potencias:
F(x, y) = F(x0 , y0 ) + a(x − x0 ) + b(y − y0 ) + términos de orden superior,
siendo F(x0 , y0 ) = 0 y b = Fy (x0 , y0 ) se obtiene que F(x, y) = 0 si y solamente
si:
y − y0 = −b−1 a(x − x0 ) + términos de orden superior.
Enunciaremos a continuación el teorema de la función implı́cita en la forma de
Hildebrandt y Graves de 1927, la que fue presentada para X, Y, Z como espacios
de Banach, para los fines de nuestro trabajo estos espacios son espacios reales
como definidos al comienzo de este apéndice.
TEOREMA 11.6. (De la función implı́cita) Supongamos que
(i) La función F : U(x0 , y0 ) ⊆ X × Y → Z está definida en un entorno
abierto U(x0 , y0 ) y F(x0 , y0 ) = 0, siendo X = Rn , Y = Rm y Z = Rl .
(ii) Fy existe y es biyectiva en U(x0 , y0 ).
(iii) F y Fy son continuas en (x0 , y0 ),
entonces las siguientes afirmaciones son ciertas:
(a) Existencia y unicidad: Existen unos números positivos r y r0 tales
que, para todo x ∈ X que verifique k x − x0 k ≤ r0 existe exactamente
un y(x) ∈ Y tal que ky(x) − yk ≤ r y F(x, y(x)) = 0.
(b) Construcción de la solución: La sucesión:
yn+1 = yn − Fy (x0 , y0 )−1 F(x, yn ),
converge a la solución y(x) para todo x : k x − x0 k ≤ r0 .
(c) Continuidad: Si F es continua en un entorno de (x0 , y0 ) entonces y(·)
es continua en un entorno de x0 .
(d) Diferenciabilidad: Si F es C m , 1 ≤ m ≤ ∞ en un entorno de (x0 , y0 )
entonces y(·) también es C m en un entorno de x0 .
NOTACIÓN Decimos que una función es C m si admite derivadas de
orden m continuas.
La demostración sigue los lineamientos de la hecha en [Lima, L.].
Demostración: Para la demostración de los incisos (a) y (b) definimos:
g(x, y) = Fy (0, 0)y − F(x, y).
11.5. APÉNDICE V. TEOREMA DE LA FUNCIÓN IMPLÍCITA 163

La ecuación F(x, y) = 0 es equivalente a la siguiente:


y = Fy (0, 0)−1 g(x, y) = T x y,
note que x es en T x un ı́ndice y no una indicación de derivada parcial.
Sen k xk, kyk, kzk, ≤ r. Como gy (0, 0) = 0, siendo F y Fy continuas en
(0, 0) el teorema de Taylor1 permite escribir:
kg(x, y) − g(x, z)k ≤ sup0<τ<1 kgy (x, z + τ(y − z)kky − zk = o(r)ky − zk.
Siendo g(0, 0) = 0 y g continua en (0, 0) se sigue que
kg(x, y)k ≤ kg(x, y) − g(x, 0)k + kg(x, 0)k ≤ o(r)ky − zk + o(r).
Siendo o(r) un infinitésimo del orden de r. Como
kT x yk ≤ kFy (0, 0)−1 kkg(x, y)k,
kT x y − T x zk ≤ o(r)kFy (0, 0)−1 kky − zk.
Ahora por el teorema de punto fijo de Banach, para cada x : k xk ≤ r existe
y(x) tal que y = T x y.
Inciso (c): La continuidad del mapa (x, y) → T x y implica la continuidad
de la función x → y(x).
La demostración del inciso (d) puede verse en [Zeidler, E.]. 
A continuación demostaremos el teorema de punto fijo de Banach para
contracciones. Recordamos que una transformación T : M → M en un espacio
métrico (X, d) completo, se dice k-contractivo si existe una constante k positiva
y menor que 1, 0 ≤ k < 1, tal que d(T x, T y) ≤ kd(x, y) para todo x, y ∈ M.
TEOREMA 11.7. (De punto fijo de Banach) Sea (X, d) un espacio métri-
co, y sea T : M ⊆ X → M un operador contractivo, que transforma el
subconjunto cerrado M en si mismo. Entonces se verifica que:
(a) Existencia y unicidad: Existe una única solución para la ecuación
x = T x, x ∈ M. Es decir la transformación T tiene un único punto
fijo.
(b) Convergencia: La sucesión de iteraciones xn+1 = T (xn ) converge a x
para cualquier elección de x0 .
(c) Error: Para todo n se verifca que d(xn , x) ≤ k(1 − k)−1 d(x0 , x1 ).
1El teorema de Taylor para f : U(x) ⊆ X → Y en C n definida en un entorno de x permite
escribir para todo h en un entorno del origen
n−1
X 1 (k)
f (x + h) = f (x) + f (x)hk + o(khkn ), h → 0.
k=1
k!

Consecuentemente si n = 0 f (x + h) = f (x) + o(1), h → 0.


164 11. APÉNDICES

Demostración: La sucesión xn+1 = T xn es de Cauchy. Esta afirmación


sigue de la siguiente cadena de igualdades y desigualdades:
d(xn xn+1 ) = d(T xn−1 , T xn ) ≤

≤ kd(xn−1 , xn ) ≤ k2 d(xn−2 , xn−1 ) ≤ · · · ≤ kn d(x0 , x1 ).


Una aplicación reiterada de la desigualdad triangular y luego la suma de la
serie geométirca da por resultado:
d(xn , xn+m ) ≤ d(xn , xn+1 ) + d(xn+1 , xn+2 ) + · · · + d(xn+m−1 , xn+m ) ≤

≤ (kn + kn+1 + · · · + kn+m−1 )d(x0 , x1 ) ≤ kn (1 − k)−1 d(x0 , x1 ).


Por lo tanto xn es una sucesión de Cauchy. Como X es completo entonces
xn → x. Ahora como xn+1 = T xn haciendo n → ∞ se sigue que x = T x. La
unicidad se prueba por el absurdo. Supongamos que x 6= y tales que x = T x e
y = T y. Se tiene entonces que d(x, y) = d(T x, T y) ≤ kd(x, y), como 0 ≤ k < 1
se tiene que d(x, y) = 0 i.e. x = y. 

11.6. Apéndice VI. Programación lineal


En este apéndice veremos que algunos de los resultados de la programación
lineal, pueden obtenerse en forma alternativa a la expuesta en la sección 5.6
e inmediata a partir de las condiciones que caracterizan a un punto silla.
Probablemente uno de los resultados más importantes de la programación
lineal es la relación dual. Esta relación se refiere a la existente entre los
siguientes dos problemas, uno dual del otro:
máxx∈Rl px
(61)
s.a. : Ax ≤ r, con x ≥ 0.
con p ∈ Rl un vector dado, r ∈ Rm y A una matriz m × l.
mı́nw∈Rm wr
(62)
s.a. : Atr w ≥ p, con w ≥ 0.
Los siguientes teoremas fueron probados originalmente sin recurrir a la
programación no lineal, no obstante aquı́ los probaremos usando programación
no lineal.
TEOREMA 11.8. (De dualidad)
(1) Existe una solución x∗ para (61) si y solamente si existe una solución
w∗ para (62)
11.6. APÉNDICE VI. PROGRAMACIÓN LINEAL 165

(2) x∗ ≥ 0 y w∗ ≥ 0, verifican Ax∗ ≤ r, Atr w∗ ≥ p ası́ como


w∗ (r − Ax∗ ) = x∗ (Atr w∗ − p) = 0 si y solamente si, x∗ es solu-
ción para (61) y w∗ lo es para (62) más aún en este caso px∗ = rw∗ .
Demostración: Inciso [(1)] Supongamos que x∗ es solución de (61). Sa-
bemos que existe entonces w∗ ∈ Rm tal que (x∗ , w∗ ) es un punto silla para
φ(x, w) = px + w(r − Ax), esto es:
φ(x, w∗ ) ≤ φ(x∗ , w∗ ) ≤ φ(x∗ , w), ∀ x ≥ 0, w ≥ 0.
Definimos ahora
ψ(w, x) = −φ(x, w) = − px − w(r − Ax) = −wr + x(A′ w − p).
Se sigue entonces que:
ψ(w, x∗ ) ≤ ψ(w∗ , x∗ ) ≤ ψ(w∗ , x), ∀ x ≥ 0, w ≥ 0.
De donde se sigue que w∗ maximiza −wr restringido a: A′ w − p ≥ 0, y
w ≥ 0. Esto es que w∗ es optimal para el problema (62). Recı́procamente, si
w∗ resuelve (62), entonces procediendo como anteriormente, obtenemos x∗ tal
que ψ(w, x) tiene un punto silla en (w∗ , x∗ ). Lo que implica que φ(x, w) tiene
un punto silla en (x∗ , w∗ ) y es por lo tanto una solución optimal para (61).
Inciso [(2)] Si x∗ y w∗ son respectivamente soluciones optimales pa-
ra (61) y (62), entonces (x∗ , w∗ ) y (w∗ , x∗ ) son puntos sillas de φ(x, w) y
ψ(w, x) respectivamente. Luego por el teorema (6.8, item 2) se tiene que
w∗ (r−Ax∗ ) = x∗ (Atr w∗−p). Como φ(x, w) = −ψ(w, x) se tiene que px∗ = w∗ r. Re-
cı́procamente, supongamos que x∗ y w∗ verifican w∗(r − Ax∗ ) = x∗ (Atr w∗ − p) =
0 con Ax∗ ≤ r y Atr w∗ ≥ p. Entonces si x∗ ≥ 0 y w∗ ≥ 0 se tiene que
φ(x, w∗ ) = px + w∗ (Ax − r) = w∗ r + (p − w∗ A)x ≤ w∗ r =

= w∗ r − x∗ (Atr w∗ − p) = px∗ + w∗ (r − Ax∗ ) = φ(x∗ w∗ ) =

= px∗ ≤ px∗ + w(r − Ax∗ ) = φ(x∗ , w).


Por lo que (x∗ , w∗ ) es punto silla de φ(x, w) se deduce entonces que x∗ es
solución del problema (61) y w∗ de su dual. 
El siguiente teorema se deduce fácilmente:
TEOREMA 11.9. (De Goldman-Tucker) Existe una solución óptima x∗ y
w∗ para los problemas (61) y (62) respectivamente si y solamente si existe
(x∗ , w∗ ) punto de silla de φ(x, w) = px + w(r − Ax).
La demostración queda a cargo del lector.
Bibliografı́a

[Accinelli, E. (07)] La topologı́a de las correspondencias y el equilibrio de Nash” Economı́a


Dinámica, Economı́a Aplicada y Teorı́a de Juegos: Ensayos en Homenaje a Ramón Garcı́a-
Cobián. Editado por César Martinelli y Loretta Gasco. CH 8.Ed. Fondo editorial de la
Pontificia Universidad Católica del Perú. (2007).
[Accinelli, E. (05)] Elementos de la topologı́a y de la teorı́a de conjuntos en la teorı́a del
equilibrio general. UAM(A), Eon-Sociales (2005).
[Accinelli, E. (03)] Existence of GE: are the cases of non existence a cause of serious worry?
General Equilibrium: Problems and Prospects. Ed. F.Petry and F. Hahan, Routledge (2003).
[Accinelli, E.; Brida, G. Plata, L.; Puchet, M.] Bienestar social, óptimos de Pareto y equili-
brios walrasianos. El Trimestre Económico dedicado a las VI JOLATE, 75, pp. 125-134 .
Enero (2008).
[Aliprantis, C.D.; Border, K.C.] Infinite dimensional analysis Springer-Verlag (1994).
[Aliprantis, C.D.; Brown, D.J.; Burkinshaw, O.] Existence and optimality of competitive equi-
librium. Studies in Economic Theory, vol 4. Springer-Verlag (1990).
[Apostol, T.] Calculus. Ed Reverté (2003).
[Araujo, A. (85)] Lack of Pareto optimality in economies with infinitely many commodities The
need for impatience. Econométrica, 53 pp 455-461, (1985).
[Araujo, A. (87)] The non-existence of smooth demand in general Banch spaces Journal of
Mathematical Economics, 17 pp 1, 11, (1987).
[Araujo, A. and Monteiro P.K. (93)] The general existence of extended price equilibrium with
infinitely many commodities. Journal of Economic Theory, v.63, pp 408-426, (1993).
[Araujo, A. and Monteiro P.K.(90)] Notes on programing when the positive cone has an empty
interior. Journal of Optimization Theory and Applications, v.67/ 2, pp 395-410, (1990).
[Arrow, K.; Enthoven, A.] Quasi Concave Programing. Econmetrica 29, pp 779-800 (1961).
[Arrow, K.; Hurwicz, L,; Usawa, H.] Constraint Qualifications in Maximization Problems. Na-
val Research Logistics Quarterly Vol 8/2 junio (1961).
[Aubin, J.P.] Optima and Equilibria Graduate Tecxts in Mathematics. Ed. Spronger Verlag,
(1993).
[Balasko, Y. (09)] The equilibrium manifold. Mit Press. (2009).
[Balasko, Y. (88)] Foundations of the Theory of General Equilibrium. Academic Press, inc.
(1988)
[Bazaraa, M.S.; Shetty, C.M.] Foundations of Optimization. Lecture Notes in Economics and
Mathematical Systems, vol 122, (1976).

167
168 BIBLIOGRAFÍA

[Brown, J.] Equilibrium analysis with non-convex technologies. Hand Book of Matehematical
Economics, vol 4. Ed by W. Hildenbrand and H. Sonnenschein, chapter 36. North Holland,
(2006).
[Brézis, H.] Analyse fonctionelle. Masson Editeur de Parı́s (1983).
[Coruzeix, J.P.; Ocaña, E; Sosa, W.] Análisis Convexo Monografı́as de IMCA No. 33 (2003).
[Debreu, G. (a)] Theory of Value: An Axiomatic Analysis of Economic Equilibrium New Haven
and London, Yale University Press (1959).
[Debreu, G. (b)] Continuity properties of paretian utility. International Jouranl of Economics
setiembre (1964).
[Duffie, D.] Dynamic Asset Pricing Theory. Princeton University Press (1992)
[Kuhn,H.W.; Tucker, A. W.] Nonlinear Programming. Proceedings of 2nd Berkeley Sympo-
sium, 481-492, Berkeley: University of California Press (1951).
[Kelley, J.] Topologı́a General. Eudeba (1962).
[Kemp, M.; Kimura, Y.] Introduction to Mathematical Economics. Springer-Verlag, (1978).
[Lima, L.] Curso de Analise. Volume 2. Ed. Sociedad Brasilera de Matemáticas, Projeto Eucli-
des.
[Luenberger, D. (a)] Optimzacion by vectorial space methods Ed. John Willey and Sons, Inc
(1969).
[Luemberguer, D. (b)] Microeconomic Theory, McGraw Hill, (1995).
[Maden, P.] Concavidad y optimización en microeconomı́a. Ed. Alizanza Editorial (1986).
[Mantel, R.] Equilibrio con rendimineto crecientes a escala Anales de la Sociedad Argentina
de Economı́a Polı́tica 1, pp 271-283, (1979).
[Mas-Colell, A. (1985)] “The Theory of General Equilibrium, A Differentiable Approach”.
Cambridge University Press.
[Mas-Colell, A. (86)] The price equilibrium existence problem in topological vector lattices.
Econometrica 54: pp 1039-1054. (1986)
[Mas-Colell et al] Microeconomic Theory. Ed. Oxford Univeristy Press (1995).
[Mas-Colell, A, and Zame, W.R.] Equilibrium theory in infinite dimensional spaces. Handbook
of Mathematical Economics, IV, 1835-1898. (1991)
[Pogorélov, A.] Geometrı́a diferencial. Ed. Mir, Moscú (1984).
[Rockafellar, T.] Convex Analysis. Princeton University Press (1970).
[Takayama, A.] Mathematical Economics. Cambridge University Press (1994).
[Uribe, P.] Análisis de Actividades y Teorı́a del Capital. Universidad de Guadalajara , México
(1997).
[Varian, H.] Micreconomic Analysis. Ed. Norton, New York. Third edition.
[Zeidler, E.] Nonlinear Functional Analysis and its Applications Ed. Springer-Verlag (1993).
Índice alfabético

de producción, 43
condición denso, 17
de Kuhn-Tucker, 108 extremo, 69
equilibrio walrasian, 115 maximizador, 71
paralelo, 34
análisis de sensibilidad, 149 producto, 34
asignación, 6 acotado, 13
factible, 146 cerrado, 19
axioma de elección, 161 conexo, 21
conexo por caminos, 22
base de una topologı́a, 16 secuencialmente compacto, 21
base local, 16 separable, 17
bola abierta, 12 conjunto de consumo, 6
bola cerrada, 13 cono, 34
convexo, 36
cápsula convexa, 38 cubrimiento, 21
cestas de bienes, 5, 6
clausura, 19 demanda, 24
combinación convexa, 36 demanda del consumidor, 75
condición demanda por insumos, 139
de cualificación, 107 derivada direccional, 62
de Slater, 107 desigualdad
condiciones de Cauchy-Schwarz, 10
de primer orden, 105 triangular, 10
de segundo orden, 122 distancia usual, 10
conjunto dominio efectivo, 53
abierto, 15 dotaciones iniciales, 30
afı́n, 34 dual topológico, 86
cerrado, 15
compacto , 21 entorno, 15
complemento, 15 epı́grafo, 51, 82
conjugado, 86 espacio
convexo, 36 dual, 81
de consumo, 30 métrico, 10

169
170 ÍNDICE ALFABÉTICO

normado, 12 plan de producción, 43


topológico, 15 poliedro, 46
vectorial, 7 preorden completo, 16
vectorial topológico, 19 primer axioma de numerabilidad, 16
de Banach, 21 principio básico de la dualidad, 82
métrico completo, 21 problema del consumidor, 23
normado completo, 21 producto interno o escalar, 9
extremos globales, 25 programación
cuasi-cóncava, 127
función multi-objetivo, 134
afı́n, 50 lineal, 164
cóncava, 50 propiedad de intersección finita, 22
cónvexa, 50 punto
continua, 19, 24 de acumulación, 19
cuasi-cóncava, 50 extremo, 69
cuasi-convexa, 51 frontera, 16
homogénea, 74 interior, 16
mitcóncava, 77 punto silla, 100
valor, 114
Fréchet diferenciable, 66 relación de preferencias, 16
semicontinua, 26 restricción presupuestaria, 31
función de utilidad indirecta, 152
función demanda, 142 segundo axioma de numerabilidad, 16
función demanda por insumos, 140 semiespacio soporte, 72
función valor, 150 subbase de una topologı́a, 16
funcional, 81 subcubriemiento, 21
conjugado, 86 subgrafo, 51, 82
doble conjugado, 87 sucesión
soporte, 82 de Cauchy, 21
convergente, 20
hessiano, 60 suma
hessiano orlado, 132 de conjuntos, 34
hiperplano, 35 de vectores, 7
soporte, 42
teorema
interior relativo, 39 condición de cualificación, 120
de Arrow-Enthoven (1), 129
lema de dualidad en la microeconomı́a, 144 de Arrow-Enthoven (2), 133
lema de Zorn, 161 de Arrow-Hurwicz-Uzawa, 111
de Carathéodory, 39
métrica, 10 de dualidad, 164
multiplicación por un escalar, 7 de dualidad de Fenchel, 81, 89
multiplicadores de Kuhn-Tucker, 107 de Goldman-Tucker, 165
de Heine-Borel, 160
no saciedad local, 141 de Kuhn-Tucker, 97, 108
norma, 11 de Kuhn-Tucker, Uzawa, 102
normas equivalentes, 12 de la eficiencia, 145
ÍNDICE ALFABÉTICO 171

de la función implı́cita, 142, 162


de la norma mı́nima, 84
de Lagrange, 118
de las topologı́as equivalentes, 157
de Lindelof, 159
de punto fijo de Banach, 163
de represetación de Riesz, 81
de Separación (1), 41
de Separación (2), 42
de Separación (3), 42
de Weierstrass, 26
de Weirstrass para F.S.C, 28
del bienestar, 73, 146
del máximo de Bauer, 71
del valor intermedio, 26
fundamental, 101
min-max, 94
de Heine-Borel, 21
de Hotteling, 145
de la envolvente, 150
de Shepard, 145
tipos de separación, 46
topologı́a, 15
definida por métricas y normas, 17
Hausdorff, 15
relativa, 19

valor de una cesta, 6


vectores, 7
ortogonales, 9

También podría gustarte