FÍSICA TEÓRICA
TEORIA
CUANTICA
(NO-RELATIVISTA)
y
LANDAU LIFSHITZ
VOLÚMEN 3
SEGUNDA EDICIÓN
CURSO DE FÍSICA TEÓRICA
Volumen 3
MECÁNICA CUÁNTICA NO-RELATIVISTA
L. D. LANDAU
E. M. LIFSHITZ
Academia de Ciencias, U. R. S. S.
MECÁNICA CUÁNTICA
NO-RELATIVISTA
Volumen 3
del
CURSO DE FÍSICA TEÓRICA
EDITORIAL REVERTÉ, S. A.
BARCELONA-BOGOT_i\-BUENOS AIRES-CARACAS-MÉXICO-RIO DE JANEIRO
Titulo de la obra original
KBAHTOBAR MEXAHHKA
HepenHTHBBCTCRaH TeOpHH
Editada por
MEZHDUNARODNAYA KNIGA, Moscou
Versión española directamente del ruso por el
Prof. Dr. Ramón Ortiz Fornaguera
Jefe de la División de Física Teórica
de la Junta de Energía Nuclear - Madrid
Propiedad de EDITORIAL REVERTÉ, S. A. Encarnación, 86. Barcelona (24)
Reservados todos los derechos. Ninguna parte del material cubierto por este título
de propiedad literaria puede ser reproducida, almacenada en un sistema de informática o transmitida de cualquier forma o por cualquier medio electrónico, mecánico,
fotocopia, grabación u otros métodos sin el previo y expreso permiso por escrito
del editor.
Edición en español
© EDITORIAL REVERTÉ, S. A., 1983
Impreso en España
Printed in Spain
ISBN - 84 - 291 - 4079 - 4
obra completa
ISBN - 84 - 291 - 4083 - 2
tomo 3
Dep. Leg. B. 44,225 - 1g(j2
LITOCLUB, S.A. - Nilpoles, 300 - Barcelona-25
DEL PRÓLOGO A LA PRIMERA EDICIÓN
Junto a los fundamentos de la mecánica cuántica, se exponen también en el
libro sus numerosas aplicaciones en grado considerablemente mayor que el normal
en los cursos generales de mecánica cuántica. Hemos dejado a un lado tan.sólo
aquellas cuestiones cuyo estudio exigiría de modo esencial el realizar a la vez un
detallado análisis de los datos experimentales, lo que inevitablemente se saldría
de los límites de la obra.
Hemos intentado exponer de la manera lo más completa posible los diferentes
problemas concretos. En relación con esto hay que decir que se han estimado
innecesarias las referencias a los trabajos originales, limitándonos a indicar sus
autores.
Como en los tomos precedentes, nos esforzamos en presentar las cuestiones
generales de tal manera que, en lo posible, resulte claramente evidente la esencia
física de Ja teoría y sobre esta base se construye el formalismo matemático. Esto
se advierte particularmente en los primeros párrafos del libro, dedicados a elucidar
las propiedades generales de los operadores de la mecánica cuántica.
En contraste con el esquema de exposición que se adopta de ordinario, esquema
que parte de teoremas matemáticos referentes a los operadores lineales, nosotros,
al revés, deducimos las condiciones matemáticas que se imponen a los operadores
y funciones propias partiendo del planteo físico del problema.
Es imposible dejar de hacer notar que en muchos cursos de mecánica cuántica
la exposición se ha complicado considerablemente en comparación con los trabajos
originales. Aunque esta complicación se suele justificar por razones de generalidad
y de rigor, sin embargo, un examen atento permite advertir fácilmente que en
realidad, una y otro, son con frecuencia ilusorios, hasta tal punto que una parte
considerable de los teoremas « rigurosos » es errónea.
Dado que ese complicar la exposición nos parece algo completamente injustificado, hemos tendido a la mayor simplicidad y, en muchos casos, se ha vuelto
a los trabajos originales.
Algunos conocimientos puramente matemáticos se presentan al final del libro
en forma de « Apéndices matemáticos», para, en lo posible, no interrumpir la
exposición en el texto con incisos orientados hacia lo que es puramente cálculo.
Estos apéndices persiguen también una finalidad informativa general.
V
PRÓLOGO A LA SEGUNDA EDICIÓN
El tercer tomo del Curso de física teórica está dedicado a la exposición de la
mecánica cuántica no relativista. La teoría cuántica relativista, en cambio, formará
el contenido del volumen siguiente. Entendemos aquí por teoría relativista, en el
más amplio sentido, la teoría de todos los fenómenos cuánticos que dependen de
la velocidad de. la luz de manera esencial. De acuerdo con esto, en ella se incluirá
no sólo la teoría basada en la ecuación relativista de Dirac, sino también y de modo
general toda la teoría cuántica de la radiación.
Para esta segunda edición, el libro ha sido revisado y ampliado considerablemente, si bien el plan general de la obra, al igual que su carácter, siguen siendo
los mismos. La revisión ha afectado a todos los capítulos. En particular, en las
secciones que se refieren a la teoría de la composición de momentos y a la teoría
de las colisiones se han realizado grandes cambíos. Se ha añadido un nuevo capítulo
acerca de la estructura del núcleo; de acuerdo con el plan general del Curso, estas
cuestiones se exponen aquí tan sólo en la medida en que es conveniente fiacerlo
sin entrar a la vez en un análisis detallado de los datos experimentales.
Quisiéramos expresar nuestra sincera gratitud a todos aquellos numerosos
compañeros que nos han hecho observaciones referentes a la primera edición del
libro, observaciones que se han tenido en cuenta al redactarlo de nuevo. Una gran
cantidad de ellas, relativas a la teoría de las colisiones, fueron hechas por la. A. Smorodinskii. Agradecemos en particular a L. P. Pitaevskii la gran ayuda prestaqa en
la corrección de fórmulas y problemas y en la lectura de las pruebas de imprenta.
L. D.
Moscú, enero de 1962.
vii
LANDAU y
E. M.
LIFSHITZ
NOTACIONES
Los operadores se caracterizan por el símbolo "
Elemento del espacio de configuraciones dq.
rnm = ¡n = (ni f lm) Elementos de matriz de la magnitud f (véase la definición
m
en la página 14)
Frecuencias de las transiciones
Wnm = (En - Em)/li
Conmutador de dos operadores
{/,g} = /g-g/
1J
Hamiltoniano
Campo eléctrico y campo magnético
lf, Ye
Si
Corrimientos de fase de las funciones de onda ~'
Tensor unidad antisimétrico
ÍNDICE DE MATERIAS
CAPÍTJJLO
l.
CONCEPTOS FUNDAMENTALES DE LA MECÁNICA CUÁNTICA
t
2
3
4
5
El principio de la indeterminación ................................... .
El principio de la superposición ..................................... .
Operadores ......................................................... .
Suma y producto de operadores ..................................... .
El espectro continuo ............................................... .
6 El paso al límite ................................................... .
7 Función de onda y medición ....................................... .
CAPÍTULO JI.
1
1
7
9
15
19
24
26
ENERGÍA E IMPULSO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
30
8 El operador de Hamilton ........................................... .
9 Derivación de los operadores respecto del tiempo ..................... .
1O Estados estacionarios ............................................... .
11 Matrices ........................................................... .
12 Transformación de matrices ......................................... .
13 Los operadores en la representación de Heisenberg ................... .
14 La matriz densidad ................................................. .
15 Impulso ........................................................... .
16 Relaciones de indeterminación ....................................... .
30
31
33
36
42
44
45
49
54
CAPÍTULO
111.
LA ECUACIÓN DE SCHRODINGER
...............................•..
17 La ecuación
18 Propiedades
19 Densidad de
20 El principio
de Schrodinger ......................................... .
fundamentales de la ecuación de Schrodinger ............. .
corriente ............................................... .
variacional ............................................. .
21 Propiedades generales del movimiento en una dimensión ............... .
22 El pozo de potencial ............................................... .
23 El oscilador lineal ................................................. .
24 Movimiento en un campo homogéneo ................................. .
25 Coeficiente de transmisión ........................................... .
IV. MOMENTO CIÉTICO
Momento cinético . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
27 Valores propios del ntomento cinético . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
28 Funciones propias del momento cinético . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
29 Elementos de matriz de vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
CAPÍTULO
26
Xl
59
59
62
66
68
71
75
79
86
88
95
95
100
104
l 07
30 Paridad de un estado ........... , ................................... .
31 Suma de momentos ................................................. .
MOVIMIENTO EN UN CAMPO CENTRAL ••....•..•...•••..•.•...•••...
118
Movimiento en un campo central ..................................... .
Movimiento libre (coordenadas esféricas) ............................. .
Desarrollo de una onda plana ....................................... .
«Caída» de una particula hacia un centro de fuerzas ................. .
Movimiento de un campo coulombiano (coordenadas esféricas) ......... .
Movimiento en un campo coulombiano (coordenadas parabólicas) ....... .
118
VI. TEORÍA DE PERTURBACIONES . . . . • . . . • . . • • . . . . . . . . . . . . . . . . . • . . . . .
Perturbaciones independientes del tiempo ............................. .
La ecuación secular ................................................. .
Perturbaciones dependientes del tiempo ............................... .
Transiciones debidas a una perturbación que actúa durante un tiempo finito ..
Transiciones provocadas por una perturbación periódica ........... : .... .
Transiciones en el espectro continuo ................................. .
La relación de indeterminación para Ja energía ....................... .
La energia potencial como perturbación ............................. .
150
CAPÍTULO
32
33
34
35
36
37
V.
CAPÍTULO
38
39
40
41
42
43
44
45
111
114
VII. EL CASO CUASICLÁSICO ..•..•...•.••....•.... : .•.•....•.....•..
46 La función de onda en el caso cuasiclásico ........................... .
47 Condiciones en los límites en el caso cuasiclásico ..................... .
48 Regla de cuantificación de Bohr-Sommerfeld ........................... .
49 Movimiento cuasiclásico en un campo central ......................... .
50 Paso a través de una barrera de potencial ........................... .
51 Cálculo de los elementos de matriz cuasic1ásicos ....................... .
52 Probabilidad de transición en el caso cuasiclásico
53 Transiciones debidas a perturbaciones adiabáticas ..................... .
CAPÍTULO
VIII. SPIN • . . . . . . . . . . . . . . . . . . . . . . . . . . • • . . . . • . . . . . . . . . . . . . . . . . . • . . .
54 Spin ............................................................... .
55 Espinores ........................................................... .
56 Espinores de orden superior ........................................ .
51 Funciones de onda de las partículas de spin arbitrario ................. .
58 La relación entre espinores y tensores ............................... .
59 Polarización parcial de las partículas ................................. .
60 Inversión del tiempo y teorema de Kramers ...•........................
CAPÍTULO
IX. PARTÍCULAS IDÉNTICAS ................•.........•..••...••..•..•
Principio de indistinguibilidad de las partículas idénticas ............... .
Interacción de intercambio ........................................... .
Simetría respecto de las perturbaciones ............................... .
Segunda cuantificación. Estadística de Bose ........................... .
65 Segunda cuantificación. CaBo de la estadísttca de Fermi ............... .
CAPÍTULO
61
62
63
64
xii
122
130
132
135
146
150
154
159
163
170
172
175
178
183
183
186
188
193
198
204
209
213
217
217
221
227
228
231
236
238
242
242
245
250
256
263
X. EL
CAPÍTUW
66
67
68
69
70
71
72
73
74
75
76
77
ÁTOMO
•••..•..•.•......•••••••.•••••••...•..•••••••••••••••
Niveles atómicos de energía ......................................... .
Estados de los electrones en un átomo ............................... .
Niveles de energía hidrogenoides .................................... .
El campo autoconsistente ........................................... .
Ecuación de Thomas-Fermi ......................................... .
Funciones de onda de los electrones exteriores cerca del núcleo ......... .
Estructura fina de ios -niveles atómicos ............................... .
El sistema periódico de los elementos de D. l. Mendeleev ............... .
Términos de rayos X ............................................... .
Momentos multipolares ............................................. .
Efecto Stark ....................................................... .
El efecto Stark en el hidrógeno ..................................... .
267
267
269
273
274
279
285
286
291
299
302
306
311
LA MOLÉCULA DIATÓMICA .........•............•.•..••...••.••..•
320
78 Términos electrónicos de una molécula diatómica ..................... .
79 La intersección de términos electrónicos ........................... , ..
80 Relación entre los términos moleculares y los atómicos ................. .
81 La valencia ......................................................... .
82 Estructuras de vibración y rotación de los términos singlete de una molécula
diatómica .................................................. , .. , . ,
83 Términos multiplete. Caso a ........................................ .
84 Términos multiplete. Caso b ........................................ .
85 Términos multiplete. Casos e y d ............................... ·.... .
86 Simetría de los términos moleculares ................................. , .
87 Elementos de matriz para una molécula diatómica ..................... .
88 Duplicación A ............................................... , · .. ·.
89 La interacción de los átomos a grandes distancias ....................... .
90 Predisociación .............................. , .......... , , . · , · · · · · · · · · ·
320
CAPÍTUW
CAPÍTUW
91
92
93
94
95
96
97
98
99
XI.
XII.
TEORÍA DE LA SIMETRÍA
Transformaciones de simetría ....................................... .
Grupos de transformaciones ......................................... .
Grupos puntuales ................................................... .
Representaciones de los grupos ....................................... .
Representaciones irreducibles de los grupos puntuales ................... .
Representaciones irreducibles y la clasificación de los términos ........... .
Reglas de selección para los elementos matriz ......................... .
Grupos continuos ................................................... .
Representaciones bivalentes de los grupos puntuales finitos ............... .
CAPÍTULO
XIII.
MOLÉCULAS
POLIATÓMICAS
............•..•........•• : ..•..•••.
100 Clasificación de las vibraciones moleculares ............................. .
101 Niveles de energía de vibración ....................................... .
102 Estabilidad de las configuraciones simétricas de una molécula ............. .
xiii
323
327
331
339
347
351
355
358
361
366
369
373
384
384
388
391
400
408
413
415
419
422
428
428
436
439
103
Cuantificación de la rotación de un sólido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Interacción de las vibraciones y de la rotación de un molécula . . . . . . . . . .
Clasificación de los términos moleculares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
104
105
COMPOSICIÓN DE MOMENTOS CINÉTICOS . . . . . . . . . . . . . . . . . . . . . . . . . .
463
106 Símbolos 3j
107 Elementos de matriz de los tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
108 Símbolos 6i . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
109 Los elementos de matriz en la composición de momentos cinéticos
463
472
CAPÍTULO
XV.
475
483
MOVIMIENTO EN UN CAMPO MAGNÉTICO . . . • . . . . . . . . . . . . . • . . . . . . . . • .
486
La ecuación de Schrodinger en un campo magnético . . . . . . . . . . . . . . . . . . . .
Movimiento en un campo magnético homogéneo . . . . . . . . . . . . . . . . . . . . . . . .
Efecto Zeeman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
El spin en un campo magnético variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
La densidad de corriente en un campo magnético . . . . . . . . . . . . . . . . . . . . . . . .
486
489
CAPÍTULO
110
111
112
113
114
XIV.
441
449
454
CAPÍTULO
XVI.
ESTRUCTURA DEL NÚCLEO Al'ÓMICO . . . • . . . • . . . • . . • • . . . . . . . . . . . . . .
Invariancia isotópica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Fuerzas nucleares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
E1 modelo de capas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Núcleos no esféricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
119 El corrimiento isotópico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
120 Estructura hiperfina de los niveles atómicos . . . . . . . . . . . . . . . . . . . . . . . . . . . .
121 Estructura hiperfina de los niveles moleculares . . . . . . . . . . . . . . . . . . . . . . . .
115
116
117
118
502
505
505
510
515
527
533
535
539
TEORÍA DE LAS COLISIONES ELÁSTICAS • . . • • . • . . • . • . • . . • . . • . . . . . •
542
122 Teoría general de la dispersión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
123 Estudio ·de la fórmula general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
124 La condición de unitariedad en la dispersión . . . . . . . . . . . . . . . . . . . . . . . . . . . .
125 Fórmula de Born . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
126 El caso cuasiclásico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
127 Dispersión para grandes energías . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
128 Propiedades analíticas de la amplitud de dispersión . . . . . . . . . . . . . . . . . . . .
129 Relaciones de dispersión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
130 Dispersión de particulas lentas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
131 Dispersión de resonancia para pequeñas energías . . . . . . . . . . . . . . . . . . . . . . . .
132 Resonancia en un nivel cuasidiscreto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
133 Fórmula de Rutherford . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
134 El sistema de las funciones de onda del espectro continuo . . . . . . . . . . . . . . .
135 Colisiones entre partículas idénticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
136 Dispersión de resonancia de partículas cargadas . . . . . . . . . . . . . . . . . . . . . . . .
137 Colisiones elásticas de electrones rápidos con átomos . . . . . . . . . . . . . . . . . . . .
138 La dispensión con interacción spin-órbita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
542
546
549
553
CAPÍTULO
XVII.
493
500
xiv
561
565
568
574
578
584
591
597
600
605
608
613
618
CAPÍTULO
139
140
141
142
143
144
145
146
147
148
XVIII.
TEORÍA DE LAS COLISIONES INELÁSfICAS
La colición elástica cuando son posibles los procesos inelásticos . . . . . . . . . .
Dispersión ínelástica de partículas lentas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
La matriz de dispersión en las reacciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Fórmulas de Breit. y Wigner . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Interacción en el estado final en el caso de reacciones . . . . . . . . . . . . . . . . . . . .
Comportamiento de las reacciones eficaces cerca del umbral de reacción . . . .
Colisiones inelásticas de electrones rápidos con átomos . . . . . . . . . . . . . . . . . .
Frenado eficaz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Choques inelásticos de partículas pesadas con átomos . . . . . . . . . . . . . . . . . . . .
Dispersión por moléculas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
626
626
633
636
640
649
652
659
670
675
678
APÉNDICES MATEMÁTICOS . . . . • . . . . . . • • . . . . • . . . . • • . • . . . . . . . . . . . . . . . . . • . . • • . . . . . •
685
Polinomios de Hermite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Función de Airy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Polinomios de Legendre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
La función hipergeométrica confluente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
La función hipergeométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Cálculo de integrales que contienen funciones hipergeométricas confluentes. . .
685
688
691
694
698
701
a
b
e
d
e
f
707
ÍNDICE
XV
CURSO DE FfSICA TEÓRICA
Volumen 3
MECÁNICA CUÁNTICA NO-RELATIVISTA
CAPÍTULO
I
CONCEPTOS FUNDAMENTALES DE LA MECÁNICA CUÁNTICA
§ 1.
El principio de indeterminación
Cuando se intenta aplicar la mecánica y la eiectrodinámica clásicas a la explicación de los fenómenos atómicos, ambas conducen a resultados que se encuentran
en abierta contradicción con la experiencia. Un ejemplo muy claro de esto lo proporciona ya la contradicción a que se llega al aplicar la electrodinámica ordinaria
al modelo de átomo en el que los eiectrones se mueven en torno del núc1eo siguiendo
órbitas clásicas. En este movimiento, como en cualquie, movimiento acelerado de
las cargas, los electrones deberían radiar continuamente ondas electromagnéticas.
Con la radiación, los electrones perderían su energía y esto debería conducir, en
último término, a su caída sobre el núcleo. Así, pues, según la electrodinámica clásica el átomo sería inestable, lo que en modo alguno corresponde a la realidad.
Esta profunda contradicción entre teoría y experimento nos dice que la construcción de una teoría aplicable a los fenómenos atómicos - esto es, a fenómenos
que ocurren con partículas de masa muy pequeña y en muy pequeñas regiones
del espacio-, exige un cambio esencial en las leyes y nociones fundamentales de
las teorías clásicas.
Como punto de partida para descubrir cuáles son estos cambios resulta conveniente adoptar un fenómeno observado experimentalmente, la Jlamada difracción
de los electrones (1 ). Cuando un haz homogéneo de electrones atraviesa un cristal,
a la salida del mismo se observa una figura constituida por máximos y mínimos de
intensidad consecutivos del todo análoga a la figura de difracción que se observa
en la difracción de las ondas electromagnéticas. Así, en cie:tas condiciones el comportamiento de las partículas materiales - de los electrones - presenta rasgos típicos
de los procesos ondulatorios.
El siguiente experimento ideal, que corresponde a una esquematización de la
1
( )
En realidad, el fenómeno de la difracción de los electrones fue descubierto después de fundada
ya la mecánica cuántica. Sin embargo, en nuestra exposición no nos atenemos al desarrollo histórico de
la teoría, sino que tratamos de construirla de tal manera que mejor quede de manifiesto cómo los principios
fundamentales de la mecánica cuántica están ligados con fenómenos observados.
2
Conceptos fundamentales de la mecánica cuántica
difracción electrónica por un cristal, pone claramente de manifiesto hasta qué
punto es profunda la contradicción entre este fenómeno y las nociones ordinarias
acerca del movimiento. Imaginemos una pantalla que no se deja atravesar por los
electrones y en la cual se han practicado dos rendijas. Si se observa el paso del haz
de electrones (1) por una de ellas, cuando la otra rendija permanece cerrada, obtenemos sobre una pantalla plana colocada detrás de la rendija una cierta figura de distribución de la intensidad; de la misma manera obtenemos otra figura abriendo la
segunda rendija y cerrando la primera. En cambio, observando el paso del haz
simultáneamente por las dos rendijas, de acuerdo con las ideas ordinarias, deberíamos esperar hallar una figura consistente en la simple superposición de las dos anteriores, ya que cada electrón, moviéndose en su trayectoria, pasa por una de las·
rendijas sin ejercer influencia alguna sobre los electrones que pasan por la otra. El
fenómeno de la difracción electrónica muestra, sin embargo, que en realidad se obtiene una figura de difracción que, gracias a la interferencia, de ningún modo se
reduce a la suma de las figuras dadas por cada una de las rendijas por separado.
Es claro que este resultado en manera alguna se puede conciliar con el concepto
de movimiento de los electrones a lo largo de una trayectoria.
Resulta así que la mecánica a que obedecen los fenómenos atómicos - la llamada
mecánica ondulatoria o cuántica - , debe basarse en nociones acerca del movimiento
diferentes en esencia de las ideas de la mecánica clásica. En la mecánica cuántica
no existe el concepto de trayectoria de una partícula. Esta circunstancia constituye
el contenido del llamado principio de indeterminación - uno de los conceptos fundamentales de la mecánica cuántica descubierto por W. HEISENBERG en 1927 (2).
Al rechazar las nociones ordinarias de la mecánica clásica, el principio de indeterminación posee, por ·así decirlo, un contenido negativo. Es natural que de por
sí es del todo insuficiente para construir, tomándolo como base, la nueva mecánica
de las partículas. En la base de una tal teoría deben encontrarse, claro está, ciertas
proposiciones afirmativas que se considerarán más adelante (§ 2). Sin embargo,
para formularlas es necesario examinar previamente cómo se plantean los problemas
con que se enfrenta la mecánica cuántica. Para ello analicemos ante todo el carácter
peculiar de la relación que existe entre la mecánica cuántica y la clásica.
De ordinario, la teoría más general se puede formular de manera lógicamente
cerrada con independencia de una teoría menos general que constituye un caso
límite de la primera. Así, la mecánica relativista se puede construir partiendo de
sus principios fundamentales y sin hacer referencia ninguna a la mecánica newto(1) El haz se supone enrarecido hasta tal punto que la interacción mutua de las partículas que lo constituyen no representa papel alguno.
( 2)
Es interesante observar que todo el formalismo matemático de la mecánica cuántica fue establecido
por W. HEISENBERG y E. ScHRODINGER en 1925-1926, antes del descubrimiento del principio de indeterminación, que pone de manifiesto el contenido físico de dicho formalismo.
El principio de indeterminación
3
niana. La formulación de las tesis fundamentales de la mecánica cuántica, en cambio, es en principio imposible sin acudir a la mecánica clásica.
El que un electrón (1) carezca de trayectoria determinada le priva también, al
mismo tiempo, de cualesquiera otras características dinámicas (2). Es claro por ello
que para un sistema constituido solamente por objetos cuánticos sería imposible
construir una mecánica lógicamente cerrada. La posibilidad de una descripción
cuantitativa del movimiento de un electrón exige la existencia de objetos físicos que,
con precisión suficiente, obedecen a la mecánica clásica. Si el electrón entra en interacción con un « objeto clásico», el estado de éste, en general, cambia. El carácter
y la magnitud de este cambio dependen del estado del electrón y pueden así servir
para caracterizarlo cuantitativamente.
En tales circunstancias el « objeto clásico» se suele llamar aparato y del proceso
de su interacción con el electrón se suele decir que se trata de una medición. Es
necesario subrayar, sin embargo, que en modo alguno se trata aquí de un proceso
de medición en el que participa el físico observador. En mecánica cuántica se entiende
por medición cualquier proceso de interacción entre objetos clásicos y cuánticos
que ocurre aparte y con independencia de un observador cualquiera. Fue N. BoHR
quien puso de manifiesto el profundo papel que desempeña el concepto de medición
en la mecánica cuántica.
Hemos definido un aparato como un objeto físico que obedece con prec1s10n
suficiente a la mecánica clásica. Tal es, por ejemplo, un cuerpo de masa suficientemente grande. Con todo, no hay que pensar que el carácter macroscópico constituye
una propiedad ineludible de un aparato. En ciertas condiciones puede representar
también el papel de aparato un objeto evidentemente microscópico, dado que el
concepto de « con precisión suficiente » depende del problema concreto planteado.
Así, el movimiento de un electrón en una cámara de Wilson se observa por la traza
de niebla que deja, traza cuyo grosor es grande comparado con las dimensiones
atómicas; dentro de este grado de precisión en la definición de trayectoria, el electrón es un objeto enteramente clásico.
La mecánica cuántica ocupa así una posición muy particular en el conjunto de
las teorías físicas: contiene la mecánica clásica como caso límite, y al mismo tiempo
tiene necesidad de este caso límite para su propia fundamentación.
(1) En este párrafo y en el siguiente hablamos, para abreviar, de un electrón, si bien pensamos en
general en un objeto cuántico arbitrario, es decir, en una partícula o un sistema de partículas que obedecen
~ la mecánica cuántica, pero no a la clásica.
(2) Se trata de magnitudes que caracterizan el movimiento del electrón, no de magnitudes que caracterizan a éste como partícula (carga, masa), que son parámetros.
4
Conceptos /undamentales de la mecánica cuántica
Podemos formular ahora el problema que se plantea la mecánica cuántica. Un
problema típico consiste en predecir el resultado de una medición, partiendo
del resultado conocido de mediciones anteriores. Además, veremos más adelante que, en general, la mecánica cuántica limita, por comparación con la mecánica clásica, el conjunto de valores que pueden tomar las diferentes magnitudes físicas (por ejemplo, la energía), es decir, los valores que pueden constituir el resultado
de la medición de una cantidad dada. El formalismo de la mecánica cuántica debe
hacer posible determinar estos valores permitidos.
El proceso de medición posee en mecánica cuántica una peculiaridad muy importante: ejerce siempre una acción sobre el electrón a que se aplica, y esta acción
no se puede hacer, por principio, tan débil cuanto se quiera para una precisión dada
de la medición. Cuanto más precisa ésta, tanto más intensa es la acción que se ejerce,
y tan sólo en las mediciones de precisión muy pequeña puede conseguirse que la
acción sobre el objeto de la medición sea débil. Esta propiedad de las mediciones
está lógicamente ligada con el hecho de que las características dinámicas del electrón se manifiestan tan sólo como resultado de la propia medición; es claro que si
la acción del proceso de medición sobre el objeto se pudiera debilitar cuanto se
quisiera, ello significaría que la cantidad medida posee de suyo un valor determinado,
independiente de la medición.
Entre los diferentes tipos de medición representa un papel fundamental la medición de las coordenadas del electrón. Dentro de los límites de aplicabilidad de la
mecánica cuántica, es siempre posible realizar (1) la medición de las coordenadas
de un electrón con precisión arbitraria.
Supongamos que al ·cabo de determinados intervalos de tiempo D..t se efectúan
sucesivas mediciones de las coordenadas de un electrón. Los resultados, en general,
no se encuentran sobre una curva lisa. Por el contrario, cuanto más exactamente
se efectúan las mediciones, tanto más discontinua, más desordenada es la marcha
que presentan sus resultados en correspondencia con el hecho de que no existe para
un electrón el concepto de trayectoria. Una trayectoria más o menos lisa se obtiene
solamente si se determinan las coordenadas de un electrón con un grado de precisión
no ~nuy grande, como, por ejemplo, mediante la condensación de gotitas de vapor
en la cámara de Wilson.
Si, en cambio, manteniendo constante la precisión de las medidas, se disminuyen
los intervalos /j.t entre mediciones, las medidas vecinas darán, claro está, valores
de las coordenadas próximos entre sí. Sin embargo, si bien los resultados de una
serie de mediciones sucesivas se encontrarán en una pequeña región del espacio,
(1) Subrayaremos una vez más que al hablar de una « medición realizada», nos referimos a la interacción del electrón con un « aparato » clásico, sin suponer en modo alguno la presencia de un observador
exterior.
El principio de indeterminación
5
se distribuirán en ella de una manera totalmente desordenada, sin situarse en modo
alguno sobre una curva lisa. En particular, cuando D..t tiende a cero, los resultados
de mediciones vecinas nunca tienden a colocarse sobre una recta.
Este último hecho indica que en mecánica cuántica no existe el concepto de
velocidad de una partícula en el sentido clásico de la palabra, es decir, como límiie
al que tiende la diferencia de las coordenadas correspondientes a dos instantes
dividida por el intervalo D..t entre ellos. Sin embargo, veremos más adelante que en
dicha mecánica es posible, con todo, dar una definición razonable de la velocidad
de una partícula en un instante dado, definición que, al pasar a la mecánica clásica,
se reduce al concepto clásico de velocidad.
Pero mientras en mecánica clásica una partícula posee en cada instante unas
coordenadas y una velocidad determinadas, en mecánica cuántica las cosas ocurren
de una manera completamente distinta. Si como resultado de una medida se atribuyen determinadas coordenadas al electrón, en tales condiciones no posee obsolutamente ninguna velocidad determinada. Recíprocamente, si el electrón posee una
velocidad determinada, no puede tener una posición determinada en el espacio.
En efecto, la existencia simultánea, en un instante arbitrario, de coordenadas y de
velocidad significaría que existe una determinada trayectoria, trayectoria que el
electrón no posee. Así, pues, en mecánica cuántica las coordenadas y la velocidad
del electrón son cantidades que no se pueden medir simultáneamente con exactitud,
es decir, no pueden tener simultáneamente valores determinados. Cabe decir que
las coordenadas y la velocidad de un electrón son cantidades que no existen a la vez.
Más adelante se deducirá una relación cuantitativa que determina la posibilidad
de una medición no exacta de las coordenadas y de la velocidad en un mismo instante.
Una descripción completa del estado de un sistema tísico se obtiene en mecánica
clásica dando, para un cierto instante, todas sus coordenadas y velocidades; con
estos datos iniciales las ecuaciones del movimiento determinan por completo el comportamiento del sistema en cualquier instante ulterior. En mecánica cuántica esta
descripción es imposible por principio, dado que las coordenadas y las correspondientes velocidades no, existen simultáneamente. De esta manera la descripción
del estado de un sistema cuántico se realiza con un número menor de cantidades que
en mecánica clásica, es decir, aquélla resulta menos detallada que la descripción
clásica.
De aquí se sigue una consecuencia muy importante acerca del carácter de las
predicciones que es posible hacer en mecánica cuántica. Mientras que la descripción
clásica basta para predecir el movimiento de un sistema mecánico en el futuro de
manera completamente exacta, la descripción menos detallada de la mecánica cuántica no puede bastar, evidentemente, para ello. Esto significa que si el electrón se
6
Conceptos fundamentales de la mecánica cuántica
encuentra en un estado descrito de la manera más completa posible en mecánica
cuántica, su comportamiento en instantes ulteriores es, con todo, incierto por principio. Por ello la mecánica cuántica no puede hacer predicciones rigurosamente
determinadas acerca del comportamiento futuro del electrón. Para un estado inicial
dado de éste, una medición ulterior puede dar diferentes resultados. El problema
de la mecánica cuántica consiste simplemente en determinar la probabilidad de obtener un cierto resultado en dicha medición. En algunos casos, claro está, la probabilidad de un determinado resultado de la medición puede ser igual a la unidad,
es decir, la probabilidad puede transformarse en certeza, con lo cual el resultado
de la medición en cuestión sólo puede ser uno ..
Todos los procesos de medición en mecánica cuántica se pueden clasificar en
dos categorías. A una de ellas, que incluye la mayor parte de las mediciones, pertenecen las mediciones que, cualquiera que sea el estado del sistema, no conducen
con certeza a un resultado único. A la otra categoría, en cambio, pertenecen las
mediciones tales que para cada uno de sus resultados existe un estado en el que la
medición conduce con certeza al resultado en cuestión. Precisamente estas últimas
mediciones, que se pueden calificar de predecibles, representan en mecánica cuántica
un papel fundamental. Las características cuantitativas de un estado definidas por
tales mediciones son lo que en mecánica cuántica se llaman magnitudes físicas. Si
en un cierto estado la medida da con certeza un resultado único, diremos que en
este estado la correspondiente magnitud física posee un determinado valor. En lo
que sigue entenderemos siempre la expresión « magnitud física » precisamente en
este sentido.
Veremos más de una vez en lo que sigue que no todo sistema de magnitudes
físicas, ni mucho menos, pueden ser medidas en mecánica cuántica simultáneamente,
es decir, no todas pueden tener simultáneamente valores determinados (se presentó
ya un ejemplo: las velocidades y coordenadas de un electrón).
Representan u~ importante papel en mecánica cuántica los conjuntos de magnitudes físicas que gozan de la siguiente propiedad: las cantidades de uno de ellos
se pueden medir simultáneamente, y si éstas poseen simultáneamente determinados
valores, ninguna otra cantidad física (que no sea función de ellas) puede poseer
en dicho estado un valor determinado. De tales sistemas de magnitudes físicas diremos que constituyen sistemas completos; en ciertos casos particulares, un sistema
completo puede quedar reducido a una sola magnitud.
Toda descripción del estado de un electrón es consecuencia del resultado de una
cierta medida. Veamos ahora qué caracteriza la descripción completa de un estado
en mecánica cuántica. Los estados completamente definidos· surgen como resultado
de la medición simultánea de un sistema completo de magnitudes físicas. A partir
de los resultados de una tal medición es posible, en particular, determinar la pro-
El principio de superposición
7
habilidad de los resultados de cualquier medición ulterior con total independencia
de lo que ocurrió al electrón antes de la primera medida.
En mecánica cuántica hay que considerar prácticamente tan sólo estados descritos de manera completa, y en lo que sigue entenderemos siempre (excluido tan sólo
el § 14) por estados de un sistema cuántico precisamente dichos estados.
§ 2.
El principio de superposición
Expongamos ahora los fundamentos del formalismo matemático de la mecánica
cuántica y convengamos en designar por q el conjunto de las coordenadas del sistema cuántico y por dq el producto de las diferenciales de estas coordenadas. Con
frecuencia se llama a dq elemento de volumen del espacio de configuraciones del
sistema; para una partícula dq coincide con el elemento de volumen d V del espacio
ordinario.
El elemento básico del formalismo matemático de la mecánica cuántica consiste
en el hecho de que cada estado del sistema se puede describir, en un instante dado,
por una determinada función (en general, compleja) de las coordenadas 'Y(q), de
forma tal que el cuadrado del módulo de esta función determina la distribución
de probabilidades de los valores de las coordenadas: J'Yi 2dq es la probabilidad de
que al realizar una medición de las coordenadas del sistema los valores de éstas
pertenezcan al elemento dq del espacio de configuraciones. La función 'Y se llama
función de onda del sistema (a veces se la llama también amplitud de probabilidad) (1).
El conocimiento de la función de onda permite también, en principio, calcular
las probabilidades de los diferentes resultados de cualquier otra medición (distinta
de la medición de las coordenadas). En todos estos casos las probabilidades se
definen por expresiones que son bilineales respecto de 'Y y 'Y*. La forma más general de una expresión de este tipo es
JJ'Y(q) 'Y*(q') <f,(q, q') dqdq',
(2.1)
donde la función ef,(q, q') depende del género y del resultado de la medición y la
integración se extiende a todo el espacio de configuraciones. La propia probabilidad
'Y'Y* de los diferentes valores de las coordenadas es también una expresión de este
tipo (2).
A medida que transcurre el tiempo, el estado de un sistema, y con él también
(1)
Fue introducida por primera vez en mecánica cuántica por E. ScHRODINQER, en 1926.
Se obtiene a partir de (2.1) haciendo cp(q, q') = IJ(q - Qo) IJ(q' -qo), donde <5 representa la llamada
función-lJ que se define más adelante, en el § 5; con q0 representamos el valor de la coordenada cuya probabilidad buscamos.
( 1)
8
Conceptos fundamentales de la mecánica cuántica
la función de onda, cambian, en general. En este sentido se puede considerar la función de onda como función también del tiempo. Si la función de onda se conoce
en un cierto instante inicial, en virtud del propio sentido del concepto de descripción completa de un estado dicha función debe en principio estar determinada
también para cualquier instante ulterior. La dependencia efectiva de la función
de onda con relación al tiempo se determina mediante ecuaciones que se deducirán
más adelante.
La suma de las probabilidades de todos los posibles valores de las coordenadas
de un sistema debe ser, por definición, igual a la unidad. Es necesario, por lo tanto,
que el resultado de la integración de !'Yl 2 en todo el espacio de configuraciones sea
igual a la unidad:
J l'Yl
2
(2.2)
dq = t.
Esta igualdad es la llamada condición de normalización de las funciones de onda.
Si la integral de j'Yl 2 converge, es siempre posible conseguir normalizar la función 'Y,
mediante la elección oportuna de .un coeficiente constante. A veces, sin embargo,
se utilizan también funciones de onda no normalizadas; además, veremos más
adelante que 'la integral de l'Yl 2 puede diverger, en cuyo caso la función 'F' no se
2 no deterpuede normalizar de acuerdo con la condición (2.2). Én tales casos
mina, claro está, los valores absolutos de la probabilidad de las coordenadas, pero
la razón de los valores de !'Yl 2 en dos puntos distintos del espacio de configuraciones
determina la probabilidad relativa de los correspondientes valores de las coordenadas.
l'fl
Dado que todas las cantidades con sentido físico inmediato que se calculan con
ayuda de la función de onda son de la forma (2.1), en la que 'Y aparece multiplicada
por 'Y*, es claro que.. la función de onda normalizada está definida salvo un factor
constante de fase de la forma ;« (~ es un número real arbitrario) de módulo igual a la
unidad. Esta falta de unicidad es inevitable y de carácter fundamental; sin embargo,
de hecho carece de importancia, ya que no se refleja en ningún resultado físico.
En la base del contenido positivo de la mecánica cuántica encontramos toda una
serie de proposiciones relativas a las propiedades de la función de onda, proposiciones que se pueden enunciar como sigue.
Supongamos que en el estado caracterizado por la función de onda 'Y¡(q) se
efectúa una medición que conduce con certeza a un determinado resultado (resultado 1) y que el hacerlo en el estado 'flq) conduce al resultado 2. Se admite entonces que toda combinación lineal de '1\ y 'r2, esto es, toda función de la forma
c1'Y1 +c2'Y2 (con c1, c 2 constantes), representa un estado en el que la misma medición puede dar o el resultado 1 o el resultado 2. Además, cabe afirmar que si cono-
Operadores
9
cernos la dependencia de los estados respecto del tiempo, dependencia que en un
caso viene dada por la función 'I\(q, t) y en el otro por la 'Y2(q, t), cualquier combinación lineal da también la dependencia posible de un estado con relación al
tiempo. Estas proposiciones se generalizan de manera inmediata a un numero cualquiera de estados distintos.
El conjunto de las proposiciones que acabamos de enunciar acerca de las funciones de onda constituye el llamado principio de superposición de los estados - principio fundamental positivo de la mecánica cuántica. De él se sigue inmediatamente,
en particular, que todas las ecuaciones a las que satisfacen las funciones de onda
deben ser lineales respecto de 'Y.
Consideremos un sistema constituido por dos partes y supongamos que su estado
se da de forma tal que cada una de las partes viene descrita de manera completa (1).
Cabe afirmar entonces que las probabilidades de las coordenadas q1 de la primera
parte son independientes de las probabilidades de las coordenadas q2 de la segunda
parte, y por ello la distribución de probabilidades para el sistema como un todo
debe ser igual al producto de las probabilidades correspondientes a cada una de sus
partes. Esto significa que la función de onda 'Y1lq1, q2) del sistema se puede representar como producto de las funciones de onda 'Y1(q1) y 'Y2(q2) de sus partes :
(2.3)
Si ambas partes no se encuentran en interacción mutua, esta relación entre la función de onda del sistema y las de sus partes se conserva también en cualquier instante futuro, es decir, se puede escribir:
(2.4)
§ 3.
Operadores
Consideremos una magnitud física f que caracteriza el estado de un sistema
cuántico. Hablando estrictamente, en las consideraciones que siguen deberíamos
hablar no de una magnitud, sino, ya desde el principio, de un sistema completo
de magnitudes. Sin embargo, ninguna de aquéllas cambiaría por ello esencialmente
y para abreviar, y por razones de simplicidad, hablaremos siempre en lo que sigue
tan sólo de una magnitud física.
Los valores que puede tomar una magnitud física dada se llaman en mecánica
(1) Con ello, claro está, se da también una descripción completa del estado del sistema como un todo.
Hay que subrayar. sin embargo, que la proposición reciproca no es en general cierta: una descripción
completa del estado del sistema como un todo es insuficiente, en general, para determinar de manera
completa los estados de sus partes por separado (véase también § 14).
10
Conceptos fundamentales de la mecá._nica cuántica
cuántica sus valores propios y el conjunto de éstos se denomina espectro de valores
propios de la magnitud en cuestión. En mecánica clásica las magnitudes toman,
en general, valores que constituyen una sucesión continua. También en mecánica
cuántica existen magnitudes físicas (por ejemplo, las coordenadas) cuyos valores
propios forman una tal sucesión; en estos casos se habla de un espectro continuo
de valores propios. Sin embargo, junto a tales magnitudes encontramos en mecánica cuántica otras cuyos valores propios constituyen una sucesión discreta; en tales
casos se habla de un espectro discreto.
Para simplificar, supondremos que la magnitud que aquí consideraremos, f,
posee espectro discreto; el caso de un espectro continuo se estudia en el § 5. Designaremos los valores propios de la magnitud f por fm donde el índice n toma los
valores O, l, 2, 3, ... Representemos además por 'F'n la función de onda del sistema
en un estado en que la magnitud f toma el valor Ín· Las funciones de onda 'F'n se
llaman funciones propias de la magnitud física dada f. Cada una de estas funciones
se supone normalizada, de forma que
f l'I'nl
2
dq
= 1.
(3.1)
Si el sistema se encuentra en un estado cualquiera caracterizado por la función
de onda 'F', la medición de la magnitud/ efectuada en él dará como resultado uno
de los valores propios Ín· En virtud del principio de superposición podemos afirmar
que la función de onda 'F' debe ser combinación lineal de aquellas funcjones propias
'F'n que corresponden a los valores fn que es posible obtener. con probabilidad distinta de cero en una medición realizada en el sistema que se encuentra en el estado
considerado. Por esto, en el caso general de un estado arbitrario, la función 'F' se
puede representar en forma de serie:
(3.2)
donde la suma se extiende a todos los valores n, y los an son ciertos coeficientes
constantes.
Llegamos así a la conclusión de que toda función de onda puede desarrollarse
en serie de funciones propias de una magnitud física cualquiera. De un sistema
de funciones que haga posible efectuar este desarrollo se dice que constituye un
sistema completo (o cerrado) de funciones.
El desarrollo (3.2) permite determinar la probabilidad de encontrar en el sistema,
supuesto en el estado caracterizado por la función de onda 'Y, uno de los valores
f n de la magnitud f (es decir, la probabilidad de obtener el correspondiente resultado
en una medición). En efecto, de acuerdo con lo dicho en el párrafo anterior, estas
probabilidades deben determinarse por ciertas expresiones bilineales respecto de
'Y y 'F'* y, por consiguiente. deben ser bilineales con relación a an y an *. Además,
11
Operadores
estas expresiones, claro está, han de ser esencialmente positivas. Finalmente, la
probabilidad del valor / 11 debe reducirse a la unidad si el sistema se encuentra en
un estado cuya función de onda es 'F = 'Fn y ha de anularse si en el desarrollo
(3.2) de la función de onda 'F no existe un término con la 'F11 en cuestión. Esto
último significa que la probabilidad buscada debe ser igual a la unidad si son nulos
todos los coeficientes a11 salvo uno (con el valor den dado), que es igual a la unidad,
y debe ser nula si se tiene para el a11 dadó an = O. La única magnitud esencialmente
positiva que satisface esta condición es el cuadrado del módulo del coeficiente a11 •
Llegamos así al resultado de que el cuadrado del módulo la 11 ¡2 de cada uno de los
coeficientes del desarrollo (3.2) determina la probabilidad del correspondiente valor / 11
de la cantidad/ en el estado caracterizado por la función de onda 'F. La suma de las
probabilidades de todos los valores posibles fn debe ser igual a la unidad; con otras
palabras, debe cumplirse la relación
(3.3)
Si la función 'F no estuviese normalizada, tampoco se cumpliría la relación (3.3).
2
La suma 1:/an/
debería entonces determinarse mediante una expresión bilineal
11
respecto de 'F y 'F* y que se reduzca a la unidad cuando 'F está normalizada. La
única expresión de este tipo es la integral f 'F'F* dq. Así, pues, debe quedar satisfecha la igualdad
f
~ anan* = 'Y'Y* dq
De otra parte, multiplicando por 'F el desarrollo 'F*
(3.4)
=
l: ah*q,·u *
de la función
'Y*, conjugada compleja de la 'F, e integrando, obtenem¿~:
Comparando este resultado con (3.4), se tiene:
de donde resulta la fórmula siguiente que determina los coeficientes a11 del desarrollo
de la función 'Y en serie de funciones propias 'Y11 :
an
=
f 'Y'Yn*
dq.
(3.5)
Si substituimos aquí la expresión (3.2), se obtiene:
de donde se sigue, evidentemente, que las funciones propias deben satisfacer las
12
Conceptos fundamentales de la mecánica cuantíca
condiciones
f 'Y
m 'Y n
* dq =
(3.6)
3nm,
donde bnm = 1 para n = m y bnm = O para n =/:= m. La anulación de las integrales
de los productos \Jl'mo/n * con m =/:= n traduce la llamada ortogonalidad de las funciones o/11 • Tenemos así que el conjunto de las funciones propias o/n constituye
un sistema completo de funciones normalizadas y ortogonales dos a dos (o, como
suele decirse para abreviar, un sistema ortonormal).
Introduzcamos ahora el concepto de valor medio f de una magnitud f en un estado
dado. De acuerdo con la definición ordinaria de valores medios, definiremos J como
suma de todos los valores propios fn de la magnitud dada multiplicados cada uno
por la correspondiente probabilidad ja11 !2• Se tiene así
(3.7)
Escribamos j en la forma de una expresión que contenga, no los coeficientes a11
del desarrollo de la función o/, sino la propia función. Dado que en (3. 7) aparecen
los productos a11 a11 *, es claro que la expresión buscada debe ser bilineal respecto
de 'F y o/*. Introduzcamos un operador matemático, que designaremos por f(1)
y que definiremos de la siguiente manera. Sea (/'Y) el resultado de aplicar el operador/
a la función o/. Definiremos/ de tal manera que la integral del producto de (Í'Y) por
la función conjugada compleja o/* sea igual al valor medio j:
f
=
f 'P*(/'f!)
(3.8)
dq.
Es fácil ver que en el caso general el operador J es un operador integral lineal (2).
En efecto, teniendo en cuenta la expresión (3.5) para am podemos escribir la definición (3. 7) del valor medio en la forma
Comparando con (3.8), vemos que el resultado de aplicar el operador/ a la función o/
es de la forma:
(3.9)
Si se ,substituye aquí Ja expresión (3.5) para a11 , se encuentra que J es un operador
Convenimos en designar siempre los Qperadores mediante letras con circunflejo.
(1)
2
A
<)
f(ao/)
=
Un/ ~perador s~ caljfica de li~eal si posee l:3s propiedades siguientes: (('t\ + o/2 )
~ 'f, donde q 1, 't 2 son funciones cualesquiera y a una constante arbitraria.
=
Í'f 'i +j't\,
13
Operadores
- integral de la forma:
(fo/)
=
JK(q, q')o/(q') dq',
(3.10)
donde la función K(q, q') (el llamado núcleo del operador) es
K(q, q') = ~fn'I\*(q')'I!n(q).
(3.11)
Resulta así que a cada magnitud física corresponde en mecánica cuántica un
determinado operador lineal.
De (3.9) se sigue que si la función 'Fes una de las funciones propias 'Fn (de forma
que todos los a 11 son nulos, salvo uno), al aplicarle el operador esta función queda
simplemente multiplicada por el correspondiente valor propio fn:
J
(3.12)
(En lo que sigue, y siempre que ello no pueda conducir a confusión, prescindiremos
del paréntesis en la expresión (f'Y), sobreentendiendo que el operador se aplica
a la expresión que la sigue inmediatamente.) Podemos así decir que las funciones
propias de una magnitud física dada f son soluciones de la ecuación
jty =.f'Y,
donde fes una constante, y que los valores propios son precisamente aquellos valores de esta constante para los que dicha ecuación posee soluciones que satisfacen
las condiciones impuestas. Claro está, dado que por el momento el operador J se
ha definido solamente mediante las expresiones (3.10-3.11 ), que contienen las funciones propias 'Fm del resultado obtenido no se pueden deducir consecuencias
ulteriores. Sin embargo, conforme veremos más adelante, la forma de los operadores
que corresponden a las diferentes magnitudes físicas se puede determinar a partir
de consideraciones físicas directas, y entonces aquella propiedad de los operadores
hace posible encontrar las funciones propias y los valores propios mediante la resolución de las ecuaciones Í'F = f 'f'.
Los valores que pueden tomar las magnitudes físicas reales son, evidentemente,
valores reales. Por esta razón también el valor medio de una magnitud física debe
ser real, cualquiera que sea el estado. Recíprocamente, si el valor medio de una magnitud física es real cualquiera que sea el estado, reales serán también sus valores
propios ; basta observar que los valores medios coinciden con los valores propios
en los estados caracterizados por las funciones 'Fn.
Del hecho de que los valores medios son reales cabe deducir algunas conclusio-
14
Conceptos fundamentales de la mecánica cuántica
nes relativas a las propiedades de los operadores. Igualando la expresión (3.8) con
su conjugada compleja, obtenemos la relación
f 'Y*(Í'Y) dq = f 'Y(f*'Y*) dq,
(3.13)
donde /* designa el operador conjugado complejo del /( 1). Un operador lineal
arbitrario no cumple esta relación, en general, de forma que ésta constituye una
cierta limitación impuesta a la posible forma de los operadores J Dado un operador
cualquiera se puede encontrar un operador, llamado operador transpuesto del
primero, J, y definido de forma que se tenga
J
f 'Y(/<t>) dq = f <t> (fi') dq,
(3.14)
donde 'F, <I> son dos funciones diferentes. Si para la función <I> se elige la función
'F*, conjugada compleja de la 'F, la comparación con (3.13) prueba que debe tenerse
l=f*.
(3.15)
Los operadores que satisfacen esta condición se califican de hermíticos (2). Así, pues,
los operadores que en el formalismo matemático de la mecánica cuántica corresponden a las magnitudes físicas reales deben ser hermíticos.
Desde un punto de vista formal es también posible considerar magnitudes físicas complejas, es decir, magnitudes cuyos valores propios son complejos. Sea f una
de estas magnitudes. Cabe entonces introducir la magnitud compleja conjugada f*,
cuyos valores propios son conjugados complejos de los valores propios de f. El
operador que corresponde a la magnitud/* lo designaremos por/+. Se le suele llamar
operador conjugado del operador /y, en general, es necesario distinguirlo del operador conjugado complejo/*. De la condición .f* = (/)* se obtiene sin más
(3.16)
de donde resulta, evidentemente, que /+, en general, no coincide con J*. Para una
magnitud física real se tiene j = j+, es decir, el operador coincide con su conjugado
(los operadores hermíticos se llaman también autoconjugados).
Veamos cómo se puede demostrar directamente la ortogonalidad dos a dos de
las funciones propias de un operador hermítico asociadas a diferentes valores pro(1) Por definición, si p~ra el., operador J tenemos jtp = cf,, el operador complejo conjugado/• será
el operador para el que se tiene f *tp* = f, *.
(2) Para un operador integral lineal de la forma (3.10) la condición de hermiticidad significa que el
núcleo del operador debe ser tal que K(q, q') = K*(q', q).
Suma y producto de operadorés
15
píos. Sean/nJm dos valores propios de la magnitud/ diferentes y 'Ym 'Y m las correspondientes funciones propias:
Multipliquemos los dos miembros de la primera de estas igualdades por 'Ym *,
y la igualdad conjugada compleja de la segunda multipliquémosla por 'Y n· Restando miembro a miembro estos dos productos, se obtiene:
Integremos los dos miembros de esta igualdad respecto de q. Dado que/* = J, la
integral del primer miembro de la igualdad se anula en virtud de (3.14), con lo que
resulta
de donde se sigue, dado que f, 1 =f=. f,m la propiedad de ortogonalidad buscada de las
funciones 'l'n Y 'l'm·
Hablamos aquí constantemente de una magnitud física f tan sólo, cuando debería hablarse, conforme se indicó al principio de este párrafo, de un sistema completo
de magnitudes físicas. Encontraríamos entonces que a cada una de estas magnitudes f, g, ... corresponde su operador/, g, .... Las funciones propias ':F11 corresponden en tal caso a estados en los que todas las magnitudes consideradas toman valores
determinados, es decir, corresponden a sistemas determinados de valores propios
fm g 11 , ••• y son soluciones del sistema de ecuaciones
,
A
\Tl'
f'Y = j'Y, g'Y = g-r ' ....
§ 4.
Suma y producto de operadores
Sean f y g dos magnitudes físicas que pueden tomar simultáneamente valores
determinados y j y g sus operadores. Los· valores propios de la suma f +g de estas
magnitudes son iguales a las sumas de los valores propios de las magnitudes f y g.
A esta nueva magnitud corresponderá, evidentemente, un operador igual a la suma
de los operadores J y g. En efecto, si 'f'11 son i'as funciones propias comunes a los
operadores J y g, de /'J.· 11 = f,/F11 , g'Y11 = g 11'Y 11 se sigue que
es decir, los valores propios del operador J+g son iguales a las sumasf,1 +gn-
16
Conceptos fundamentales de la mecánica cuántica
En cambio, si las magnitudes f y g no pueden tomar simultáneamente valores
determinados, hablar de su suma en el sentido en que acabamos de hacerlo carece,
evidentemente, de significado. En mecánica cuántica, se conviene en tales casos en
definir la suma de las magnitudes f y g como aquella magnitud cuyo valor medio
en un estado arbitrario es igual a la suma de los valores medios J y g:
f+g
=! +g.
(4.1)
Es claro que a la magnitud f +g así definida corresponderá el operador /+g. En
efecto, según la fórmula (3.8) tenemos:
f+g
f
f
= 'Y*(/+g)'Y dq = 1.Y*J'Y dq+ J'Y*g'Y dq = f+g.
Sin embargo, en lo que concierne a los valores propios y a las funciones propias
del operador J+g, en este caso no tendrán, en general, relación ninguna con los
valores propios y las funciones propias de las magnitudes f y g. Evidentemente, si
los operadores J y g son autoconjugados, también será autoconjugado el operador
J+g de forma que los valores propios de éste serán reales y representarán los valores
propios de la nueva magnitud f+g así determinada.
Consideremos el siguiente teorema. Sean fo, g 0 los valores propios mínimos de
las magnitudes f, g y (f +g)0 el correspondiente valor para la magnitud f +g. Cabe
afirmar entonces que
(f+g)o
> fo+go.
(4.2)
El signo de igualdad vale si las magnitudes f y g son simultáneamente medibles.
La demostración se sigue del hecho evidente de que el valor medio de una magnitud es siempre mayor o igual que su valor propio mínimo. En un estado en el que la
magnitud (f +g) toma el valor (f +g) 0 , tendremos (f +g) = (f +g)0 y dado que, por
otra parte, f+g = J+g ~ f 0 +g0 , llegamos a la desigualdad (4.2).
Consideremos ahora de nuevo dos magnitudes simultáneamente medibles, f y g.
Junto a su suma, cabe también introducir el concepto de su producto, entendiendo
por tal una magnitud cuyos valores propios son iguales a los productos de los valores
propios de las magnitudes f y g. Es fácil ver que a esta magnitud corresponde un
operador tal que su aplicación consiste en aplicar sucesivamente a una función
primero un operador (el g) y después el otro (elf). Este operador se representa matemáticamente como producto de los operadores/ y g. En efecto, si 'Fn son las funciones propias comunes a los operadores J y g, tendremos:
Suma y producto de operadores
(el símbolo
17
/g
representa el operador cuya aplicación a la función o/ equivale a la
aplicación sucesiva de, primero, el operador gala función 'F y, luego, del operador/
a la función g 'F). De la misma manera podríamos formar en vez del operador fg
el operador§/, que difiere del primero en el orden de los factores. Es evidente que el
resultado de la aplicación de ambos operadores a la función 'Y n será el mismo. Pero
dado que cada función de onda 'F se puede representar como combinación lineal
de funciones 'Fm se sigue de aquí que también será el mismo el resultado de la aplicación de los operadores /g y g/ a una función cualquiera. Este hecho se puede
traducir en forma de una igualdad simbólica /i=§j o bíen
/g-g/= o.
(4.3)
J
De dos operadores y g" que poseen esta propiedad se dice que conmutan entre
sí. Llegamos de esta manera a un importante resultado: si dos magnitudes f y g
pueden tomar simultáneamente valores determinados, sus operadores conmutan
entre sí.
Se puede también demostrar el teorema recíproco (véase el § 11): si los operadores J y g conmutan, es posible elegir todas sus funciones propias de forma que
sean comunes a ambos, lo que físicamente significa la mensurabilidad simultánea
de las correspondientes magnitudes físicas. Así, pues, la conmutabilidad de los
operadores es condición necesaria y suficiente para la mensurabilidad simultánea
de las magnitudes físicas.
Un caso particular de producto de operadores es el de un operador elevado
a una potencia. Partiendo de lo que acabamos de decir, se llega a la conclusión
de que los valores propios del operador/P (donde pes un número e11-tero) son iguales
a las potencias de igual grado de los valores propios del operador f De una manera
general, es posible definir una función cualquiera del operador rp{f) como el operador cuyos valores propios son iguales a la misma función cp(f) de los valores propios del operador/ Si la función </>(!) se puede desarrollar en serie de Taylor, en
virtud de este desarrollo la aplicación del operador rp(/) se reduce a la aplicación
de las diferentes potencias
JP
En particular, el operador ¡-1 se llama inverso del operador f Es evidente que
como resultado de la aplicación sucesiva de los operadores f y ¡-1 a una función
arbitraria, esta última no varía, es decir, j/-1 = /-1 / = 1
Si las magnitudes f y g no pueden tomar simultáneamente valores determinados,
no es posible definir el concepto de producto de la manera antes indicada. Esto se
traduce en el hecho de que el operador /g no es autoadjunto en este caso y, por
consiguiente, no puede corresponder a ninguna magnitud física. En efecto, de acuerdo
con la definición de operador transpuesto podemos escribir
18
Conceptos fundamentales de la mecánica cuántica
I 'J!fg<I> dq = I 'J!f(g<'P) dq = I (g<I>)(!'Y) dq.
El operador/ se aplica aquí solamente a la función 'F y el operador gala función <I>,
de forma que en el integrando aparece simplemente el producto de dos funciones
g<I> y
Aplicando una vez más la definición de operador transpuesto, escribiremos:
/'Y.
I 'J!Jg<'P dq = I <fr)(g<'P) dq = I <1>lfr dq.
Hemos obtenido así una integral en la que, comparada con la primera, las funx::JI
ciones 'F y <I> han permutado sus papeles. Con otras palabras, el operador gf es
el operador transpuesto del /g y podemos escribir:
(4.4)
esto es, el operador transpuesto del producto /i es el producto de los transpuestos
de los factores tomados en orden inverso. Formando la expresión conjugada compleja de ambos miembros de la igualdad (4.4), se encuentra que
(ig)+
=
g+ j+.
(4.5)
Si cada uno de los operadores Í y g es hermítico, se tendrá (Íi) = gj De aquí
se sigue que el operador Ji será hermítico sólo si los factores j y g son conmutables.
Obsérvese que a partir de los productos /g y gj de dos operadores hermíticos no
conmutables se puede deducir un operador asimismo hermítico formando la combinación simétrica
i(/g+gj).
(4.6)
A veces conviene utilizar expresiones de este tipo; de ellas se dice que son productos
simetrizados.
Es fácil también comprobar que la diferencia /i- gj es un operador « antihermítico » (es decir, un operador tal que el operador transpuesto es igual al operador
conjugado complejo tomado con signo contrario). A partir de él se puede formar
un operador hermítico sin más que multiplicarlo por i; de esta forma
i(/g-gf)
es también un operador hermítico.
En lo que sigue utilizaremos a veces, para abreviar, la notación
El espectro continuo
{/,g} = /g-g/,
19
(4.7)
para representar el llamado conmutador de dos operadores. Es fácil ver que se tiene
la relación
{/g, h} =
{/,
h}g+/{g, h}.
(4.8)
Obsérvese que si {/h = O} y {gh = O} de aquí generalmente no se sigue, en
modo alguno, la conmutabilidad de J y g.
§ 5.
El espectro continuo
Todas las relaciones deducidas en íos §§ 3-4 relativas a las propiedades de las
funciones propias del espectro discreto, se pueden generalizar sin dificultad al caso
de un espectro continuo de valores propios.
Sea f una magnitud física que posee espectro continuo. Designaremos sus valores
propios simplemente por la misma letra f, sin subíndice, para expresar el hecho de
que f recorre una sucesión continua de valores. La función propia que corresponde
al valor propio f la representaremos por 'Y¡. De manera análoga a como una función
de onda arbitraria 'Y se puede desarrollar en serie (3.2) de funciones propias de una
magnitud con espectro discreto, cabe también desarrollarla - pero esta vez como
integral - tomando como base un sistema completo de funciones propias de una
magnitud con espectro continuo. Un desarrollo de esta clase es de la forma
'F(q) =
Ja 'F (q) dj,
1
1
(5.1)
donde la integración se extiende a todo el dominio de valores que puede tomar la
magnitud¡:
Más complicada que en el caso del espectro discreto se presenta la cuestión
de la normalización de las funciones propias de un espectro continuo. La condición
de que la integral del cuadrado del módulo de la función sea igual a la unidad no se
puede cumplir aquí, conforme veremos. En vez de ella, normalizaremos la función
'Y1 de tal manera que la,¡ 2 df represente la probabilidad de que la magnitud considerada tome valores comprendidos en un intervalo dado, f y f + df, en el estado
descrito por la función de onda 'F¡. Esto constituye una inmediata generalización
del caso del espectro discreto, en el que el cuadrado fa 11 [2 determina la probabilidad
del correspondiente valor f 11 • Dado que la suma de las probabilidades de todos los
valores posibles f debe ser igual a la unidad, se tiene:
Jla,1
2
df = 1
(5.2)
20
Conceptos fundamentales de la mecánica cuántica
(relación análoga a la (3.3) para el espectro discreto).
Procediendo exactamente de la misma manera a como se hizo al deducir la fórmula (3.5) y apoyándonos en las mismas consideraciones, escribiremos, de una
parte,
f 'Y'Y* dq f la,¡2 df
=
y, de otra parte:
f 'Y'Y* dq = ff a,*'Y,*'Y dfdq.
Comparando entre sí ambas expresiones encontramos la fórmula que determina
los coeficientes del desarrollo
a1 =
f 'Y(q)'Y *(q) dq,
1
(5.3)
exactamente análoga a (3.5).
Para deducir la ·condición de normalización, substituyamos ahora (5.1) en (5.3),
con lo que se obtendrá:
Esta relación debe cumplirse cualesquiera que sean las a¡ y, por consiguiente,
debe cumplirse idénticamente. Para que así ocurra es necesario, ante todo, que el
coeficiente de a1 en el integrando (es decir, la integral f 'Yf"Y¡* dq) se anule para todo
f' =/= f Para f' = f este coeficiente debe hacerse infinito (en caso contrario la integral
respecto de f' sería, simplemente, igual a cero). Así, pues, la integral f 'Y /Y¡* dq
es una función de la diferencia f - f' que se anula para todos los valores del argumento distintos de cero y se hace infinita cuando el argumento se anula. Representaremos esta función por l)(f' - f):
f 'Y,,'Y,• dq = 3(f' -j).
(5.4)
La manera como la función l)(f' - f) se hace infinita para f' - f = O se determina teniendo en cuenta que debe tenerse
f ó(f' -J) a¡,dj' = a¡.
Es claro que para ello ha de ser
f ó(f'-f) df' = l.
21
El espectro continuo
La función así definida se llama función-b (introducida en la mecánica cuántica
por P. A. M. D1RAC). Escribamos una vez más las fórmulas que la definen. Tenemos:
S(x) = O para x =1- O,
S(O) = oo,
(5.5)
de tal manera que
J S(x)
dx
= l.
(5.6)
Como límites de integración se pueden elegir cualesquiera otros que comprendan
entre ellos el punto x = O. Si f(x) es una función cualquiera continua para x = O,
se tendrá
J
8(x)f(x) dx = f(O).
(5.7)
Esta fórmula se puede escribir en la forma más general
f S(x-a)f(x) dx = f(a),
(5.8)
donde el intervalo de integración incluye el punto x = a y f (x) es continua para
x = a. Es evidente también que la función-bes par, es decir,
S(-x) = S(x),
(5.9)
Finalmente, escribiendo
1
J"' se~). dx = J"' o(y) dy
- = -,
-oo
-oo
,~,
,~,
llegamos a la conclusión de que
(5.10)
donde
c1.
es una constante arbitraria.
La fórmula (5.4) expresa la regla de normalización de las funciones propias
de un espectro continuo y substituye la condición (3.6) del espectro discreto. Vemos,
pues, que las funciones 'Y¡ y 'Fr, conf =f=.f', son ortogonales entre sí, como antes.
En cambio, las integrales de los cuadrados j'Y1j2 de las funciones del espectro continuo son divergentes.
Las funciones 'Y¡(q) satisfacen además una relación análoga a la (5.4). Para
deducirla substituyamos (5.3) en (5.1), lo que da:
'Y(q)
= J'Y(q')(f 'Y,*(q')'Y¡(q) df) dq',
22
Conceptos Jundamentales de la mecánica cuánticq
de donde se deduce sin más que debe ser:
J'Y *(q')'Y (q) df = S(q' -q).
1
1
(5.11)
Una relación análoga se puede deducir también, claro está, para el espectro discreto, en cuyo caso toma la forma
~ 'Y n*(q')'Yn(q)
n
= S(q' -q).
(5.12)
Comparando el par de fórmulas (5.1), (5.4) con el par (5.3), (5.11) vemos que,
de una parte, las funciones 'Y¡(q) permiten el desarrollo de la función 'Y(q) con
los a¡ como coeficientes del desarrollo y que, de otra parte, se puede considerar la
fórm,ula (5.3) como un desarrollo completamente análogo de la función a1 == a(f)
en funciones 'Y¡*(q), representando 'F(q) el papel de coeficientes del desarrollo.
La función a(fj, como la 'Y(q), determina completamente el estado del sistema;
de ella se dice a veces que es la función de onda en la representación-! (y de la función 'Y(q), que es la función de onda en la representación-q). De manera análoga
a como l'Y(q)j 2 determina la probabilidad de que el sistema tenga coordenadas
pertenecientes a un intervalo dado dq, ja(f)j 2 determina la probabilidad de que los
valores de la magnitud f se encuentren en un intervalo df. Las funciones 'f'¡(q), en
cambio, son, de una parte, funciones propias de la magnitud f en la representación-q
y, de otra, sus conjugadas complejas son las funciones propias de la coordenada q
en la representación-/.
Sea </>(!) una función de la magnitud f tal que <p y f están ligadas entre sí de manera biunívoca. Cada una de las funciones 'f'¡(q) puede entonces considerarse como
función propia de la magnitud <p correspondiente al valor <p de esta última determinado por la relación <p = </,(!). Sin embargo, es necesario en tal caso cambiar la
normalización de estas funciones. En efecto, las funciones propias 'Yq;(q) de la magnitud </, deben normalizarse por la condición
J'Ycft<.J'>'Ycft(J>* dq =
S[<f,(f')-<f,(f)],
mientras que las funciones 'Y¡, están normalizadas de acuerdo con la condición
(5.4). El argumento de la función-{5 se anula para f' = f. Para f' próximo a/, tenemos:
[dcp(f)/d/J . (f' -/).
</,(!')-</>(/) =
Teniendo en cuenta (5.10), podemos por ello escribir (1):
(1)
fórmula
En general, si
</,(x)
es una función uniforme (si bien su función inversa puede no serlo) vale la
8[c,b(x)] =
1
¿-ocx-ix,).
WCixt)!
i
donde r:xt son las raíces de la ecuación <Í>(x) = O.
El espectro continuo
1
o[</>U' )-</>(f)J = ld</>(f)/d/! o(f' -f).
23
(5.13)
Así, pues, la condición de normalización de la función 'Y 9 se puede escribir
en la forma
f
'Y ,:qt
</>(!)
:11:
r/>(f)
d q-
1
ld</>(f)/dfl o(f'-!):
Comparando este resultado con (5.4), vemos que las funciones 'Y9 y 'Y¡ están ligadas entre sí por la relación
1
'Y <1>(!> =
vld</>U)/dfl ~-,.
(5.14)
Existen magnitudes físicas tales que en un cierto dominio de sus valores poseen
un espectro discreto, y en otro, uno continuo. Para las funciones propias de una
tal magnitud valen, claro está, todas las relaciones que se han deducido en los párrafos precedentes. Sólo hay que observar que el sistema completo de funciones
está constituido por el conjunto de las funciones propias de ambos espectros. Por
consiguiente, el desarrollo de una función de onda cualquiera respecto de las funciones propias de dicha magnitud tiene la forma:
'Y(q) = ~ an'Yn(q)+
f a,'Y,(q) d/,
(5.15)
donde la suma se extiende al espectro discreto, y la integral, a todo el espectro continuo.
La propia coordenada q constituye un ejemplo de magnitud que posee espectro
continuo. Es fácil ver que el operador que le corresponde es la simple multiplicación por q. En efecto, dado que la probabilidad de los diferentes valores de las coordenadas está determinada por el cuadrado j'Y(q)/ 2, el valor medio de la coordenada
es igual a ij = f ql'Yl 2 dq. Por otra parte, el valor medio de la coordenada debe
definirse en función de su operador por ij = f 'l"*q'Y dq. La comparación de ambas
expresiones muestra que el operador q es la mera multiplicación por q; esto se
puede escribir simbólicamente en la forma (1):
q=q.
(5.16)
Las funciones propias de este operador deben determinarse, de acuerdo con la
regla general, por la ecuación q'Yq = %'f'q donde con% designamos, por el mo0
0
,
(1) En lo que sigue, para simplificar el simbolismo, convendremos en escribir siempre los operadores
que se reducen a la multiplicación por una cierta cantidad utilizando simplemente el mismo símbolo que
para dicha cantidad.
24
Conceptos fundamentales de la mecánica cuántica
mento, los valores concretos de la coordenada para distinguirlos de la variable q.
Dado que esta igualdad queda satisfecha bien para 'P'Qo = O, bien para q = %,
es claro que las funciones propias que satisfacen la condición de normalización
son (1):
(5.17)
§ 6.
El paso al límite
La mecánica cuántica incluye en sí la mecamca clásica como un cierto caso
límite. Surge la cuestión de cómo se puede llevar a cabo este paso al límite.
En mecánica cuántica el electrón se describe mediante una función de onda
que determina los diferentes valores de sus coordenadas; de esta función sólo sabemos hasta ahora que es solución de una ecuación lineal entre derivadas parciales.
En mecánica clásica, en cambio, el electrón se considera como una partícula material que se mueve a lo largo de una trayectoria determinada por completo por las
ecuaciones del movimiento. Una relación mutua, en cierto sentido análoga a la
·existente entre la mecánica cuántica y la clásica, existe en electrodinámica entre la
óptica ondulatoria y la geométrica. En la óptica ondulatoria las ondas electromagnéticas se definen por los vectores de los campos eléctrico y magnético, vectores que
satisfacen un determinado sistema de ecuaciones diferenciales lineales (ecuaciones
de Maxwell). En la óptica geométrica, en cambio, se considera la propagación de la
luz siguiendo determinadas trayectorias: los rayos. Tal analogía permite concluir
que el paso al límite que lleva de la mecánica cuántica a la clásica se efectúa de
manera análoga al paso de la óptica ondulatoria a la geométrica.
Recordemos cómo se lleva a cabo matemáticamente esta última transición.
Sea u una cualquiera de las componentes del campo electromagnético. Podemos
escribirla en la forma u = aei'P (con a y cf, reales), donde a es la amplitud y cf, la fase
de la onda. El caso límite que constituye la óptica geométrica corresponde a pequeñas
longitudes de onda, lo que se traduce matemáticamente en el hecho de que la fase cf,
(que en óptica geométrica se llama iconal) varía considerablemente entre puntos
separados por pequeñas distancias; esto significa, en particular, que podemos suponerla grande en valor absoluto.
<1) Los coeficientes del desarrollo de una función arbitraria 'Y respecto de estas funciones propias
son iguales a
La probabilidad de que los valores de las coordenadas pertenezcan a un intervalo dado dq0 es igual a
como debía ser.
El paso al límite
25
De acuerdo con esto, partamos de la hipótesis de que al caso límite que representa
la mecánica clásica corresponden en mecánica cuántica funciones de onda de la
forma 'Y = aei<P, donde a es una función lentamente variable y <p toma valores que
son grandes. Como es sabido, las trayectorias de las partículas se pueden determinar
en mecánica mediante un principio variacional, según el cual la llamada acción S
del sistema mecánico debe ser un mínimo (principio de la mínima acción o principio
de Hamilton). En óptica geométrica, en cambio, la marcha de los rayos se determina por el principio de Fermat, según el cual debe ser mínima la longitud óptica
del rayo, es decir, la diferencia entre los valores de la fase en el extremo y en el origen del mismo.
Partiendo de esta analogía, podemos afirmar que la fase <p de la función de onda
en el caso límite clásico debe ser proporcional a la acción mecánica S del sistema
físico considerado, es decir, debe tenerse S = const. <p. El coeficiente de proporcionalidad se llama constante de Planck y se designa con la letra h (1 ). Su dimensión
es la de una acción (puesto que <p carece de dimensiones) y su valor es igual a
ñ = 1·054 x 10-27 erg. s.
Así, pues, la función de onda « casi clásica» (o, como suele decirse, cuasiclásica)
de un sistema tiene la forma:
(6.1)
La constante de Planck representa un papel fundamental en todos los fenómenos
cuánticos. Su valor relativo (respecto -de otras magnitudes de igual dimensión) determina el « grado de cuantificación » de un sistema físico. El paso de la mecánica
cuántica a la clásica, la cual corresponde a grandes valores de la fase, se puede
describir formalmente como paso al límite para ñ -+0 (de manera análoga a como
el paso de la óptica ondulatoria a la geométrica corresponde al paso al límite cuando
la longitud de onda tiende a cero, J. -+0).
Hemos establecido la forma límite de la función de onda, pero subsiste todavía
la cuestión de cómo está ligada con el movimiento clásico a lo largo de trayectorias.
En general, el movimiento descrito por la función de onda no se reduce, en modo
alguno, al movimiento siguiendo una determinada trayectoria. El vínculo con el
movimiento clásico consiste en que si en un cierto instante inicial se da la función
de onda, y con ella también la distribución de probabilidades de las coordenadas,
esta distribución se « desplazará » en instantes ulteriores como suponen las leyes
de la mecánica clásica (para más detalles, véase el final del § 17).
Para obtener el movimiento a lo largo de una. trayectoria determinada, hay
que partir de una función de onda de tipo especial (el llamado paquete de ondas),
(1) Fue introducida por el físico M. PLANCK en 1900. La constante li, que utilizaremos siempre en
este libro, es, en rigor, la constante de Planck h dividida por 2n.
26
Conceptos fundamentales de la mecánica cuántica
que es apreciablemente distinta de cero tan sólo en una pequeña región del espacio;
las dimensiones de esta región se pueden hacer tender a cero junto con h. Cabe entonces afirmar que, en el caso cuasiclásico, el paquete de ondas se desplazará en el
espacio siguiendo la trayectoria clásica de una partícula.
Finalmente, en lo que concierne a los operadores de la mecánica cuántica, éstos
deben reducirse en el límite a la multiplicación por la correspondiente magnitud
física.
§ 7.
Función de onda y medición
Volvamos de nuevo al proceso de medición, proceso cuyas propiedades se consideraron cualitativamente en el § 1, y veamos cómo estas propiedades están ligadas
con el formalismo matemático de la mecánica cuántica.
Consideremos un sistema constituido por dos partes, un aparato clásico y un
electrón (considerado como un objeto cuántico). El proceso de medición consiste
en que estas dos partes entran en interacción mútua, como resultado de la cual el
aparato pasa del estado inicial a otro estado, y gracias a este cambio de estado
podemos sacar conclusiones acerca del estado del electrón. Los estados del aparato
se distinguen por los valores de una cierta magnitud física (o de unas ciertas magnitudes) que los caracteriza: las indicaciones del aparato. Convengamos en designar
esta magnitud por g y sus valores propios por gn; estos últimos recorren, de acuerdo
con la naturaleza clásica del aparato, una sucesión continua de valores, en general,
pero nosotros supondremos - tan sólo para simplificar la escritura de las fórmulas
que siguen - que el espectro es discreto. La descripción de los estados del aparato
se realiza mediante funciones de onda cuasiclásicas, las cuales representaremos por
«l>n(~), donde el subíndice n corresponde a la « indicación » gn del aparato, y~ representa el conjunto de sus coordenadas. El carácter clásico del mismo se traduce en
que, en cada instante dado, es posible afirmar con certeza que se encuentra en uno
de los estados conocidos el> n con cierto valor determinado de la magnitud g; para el
sistema cuántico, claro está, una tal afirmación no sería legítima.
Sea ct>o(~) la función de onda del estado inicial del aparato (antes de la medición)
y 'Y(q) una función de onda inicial normalizada artitraria del electrón (q designa sus
coordenadas). Estas funciones describen el estado del aparato y del electrón de manera independiente y, por consiguiente, la función de onda inicial de todo el sistema
es el producto
(7.1)
El aparato y el electrón entran luego en interacción mutua. Aplicando las ecuaciones
de la mecánica cuántica es posible seguir en principio el cambio de la función de onda
del sistema con el tiempo. Terminado el proceso de medición, la función de onda,
Función de onda y medición
27
claro está, no será ya un producto de funciones de~ y de q. Desarrollándola en funciones propias <I>n del aparato (que forman un sistema completo de funciones),
obtenemos una suma de la forma·
(7.2)
donde las An(q) son ciertas funciones de q.
Entran ahora en escena el carácter «clásico» del aparato y el doble papel de la
mecánica cJásica. como caso límite y, al mismo tiempo, como fundamento de la
mecánica cuántica. Conforme se indicó ya, gracias al carácter clásico del aparato,
en cada instante la magnitud g (la « indicación del aparato ») tiene un valor determinado. Esto permite afirmar que el estado del sistema aparato +electrón después
de la medición se describirá, en realidad, no por toda la suma (7.2), sino solamente
por un término, el que corresponde a la « indicación » Kn del aparato:
(7.3)
Se sigue de aquí que An(q) es proporcional a la función de onda del electrón después
de la medición. No es aún la propia función de onda, lo que se reconoce ya en el hecho
de que la función An(q) no está normalizada. Dicha función encierra en sí tanto
información acerca de las propiedades del estado resultante del electrón, como la
probabilidad de que se obtenga la n-ésima «indicación» del aparato, probabilidad
determinada por el estado inicial del sistema.
En virtud del carácter lineal de las ecuaciones de la mecánica cuántica, la relación entre An(q) y la función de onda inicial del electrón 'Y(q) se expresa, en general,
mediante un cierto operador integral lineal:
An(q)
=
f
Kn(q, q')'Y(q') dq',
(7.4)
cuyo núcleo Kn(q, q') caracteriza el proceso de medición considerado.
Supondremos que la medida en cuestión es tal que como resultado de la misma
se consigue una descripción completa del estado del electrón. Con otras palabras
(véase§ 1), en el estado resultante las probabilidades de todas las magnitudes deben
ser independientes del estado precedente del electrón (el estado antes de la medición).
Esto significa matemáticamente que la forma de las funciones An(q) ha de venir
determinada por el mismo proceso de medición y no debe depender de la función
de onda inicial del electrón 'Y(q).
Así, pues, las A 11 deben tener la forma:
(7.5)
donde <f, 11 son ciertas funciones, que supondremos normalizadas, y sólo las constan-
28
Conceptos fundamentales de la mecánica cuántica
tes an dependen del estado inicial 'F'(q). En la relación integral (7.4), a este caso
corresponde un núcleo Kn(q, q') que se descompone en el producto de una función
de q por una función de q' :
Kn(q, q')
=
</>n(q)'Yn*(q');
(7.6)
con lo que la relación lineal de las constantes an con la función 'F'(q) viene dada por
fórmulas del tipo:
ª"
=
f 'Y(q)'Y *(q) dq,
n
(7.7)
donde 'Y n(q) son determinadas funciones que dependen del proceso de medición.
Las funciones </>n(q) son las funciones de onda normalizadas del electrón después de la medición. Vemos así cómo el formalismo matemático de la teoria refleja
la posibilidad de obtener, mediante una medición, el estado de un electrón descrito
por una determinada función de onda.
Si la medición se efectúa en un electrón con función de onda dada 'F(q), las
constantes an tienen un simple significado físico: en virtud de las reglas generales,
lanl2 es la probabilidad de que la medición dé el n-ésimo resultado. La suma de las
probabilidades de todos los resultados es igual a la unidad:
(7.8)
La licitud de las fórmulas (7.7) y (7.8) para una función de onda arbitraria (normalizada) 'F'(q) equivale (cf. § 3) a afirmar que una función arbitraria 'F'(q) se puede
desarrollar en funciones 'F'n(q). Esto significa que las funciones 'Yn(q) constituyen
un sistema completo de funciones normalizadas y ortogonales dos a dos.
Si la función de onda inicial del electrón coincide con una de las funciones
la correspondiente constante On será, evidentemente, igual a la unidad y todas
las demás serán nulas. Con otras palabras, si la medición se efectúa en un electrón
que se encuentra en el estado 'Y n(q), ésta da con certeza un resultado determinado
(el n-ésimo).
'Yn(q),
Todas estas propiedades de las funciones 'Yn(q) muestran que son funciones
propias de una cierta magnitud física característica del electrón (representémosla
por /), y de la medición considerada podemos decir que es una medición de esta
magnitud.
Es muy importante el hecho de que las funciones \P' n(q) no coinciden, en general,
con las funciones <f,n(q) (estas últimas, en general, incluso ni son ortogonales dos a
dos, ni forman un sistema completo de funciones propias de un cierto operador).
Función de onda y medición
29
Esta circunstancia expresa, ante todo, la no reproducibilidad de los resultados de las
mediciones en mecánica cuántica. Si el electrón se encontraba en el estado 'Fn(q),
al efectuar en él una medida de la magnitud f se obtiene con certeza el valor f n.
Pero después de la medición el electrón se encuentra en un estado <Í>n(q) distinto de¡
inicial, estado en el cual la magnitud/ no posee en absoluto ningún valor determinado,
cualquiera que sea. Por consiguiente, si inmediatamente después de la primera
medición del electrón se efectúa una segunda, obtendríamos para f un valor que no
coincide con el obtenido como resultado de la primera medida (1). Para predecir
(en el sentido de calcular su probabilidad) el resultado de la segunda medición
cuando se conoce el resultado de la primera, es necesario deducir de ésta la función
de onda </>n(q) del estado originado por ella, y de la segunda medición, la función
de onda 'F'n(q) del estado cuya probabilidad nos interesa. Esto significa lo siguiente:
partiendo de las ecuaciones de la mecánica cuántica determinamos la función de
onda </>n(q, t) que en el momento de la primera medición es igual a </>n(q). La probabilidad del m-ésimo resultado en la segunda medición, realizada en el instante t,
viene dada por el cuadrado del módulo de la integral
f <Í>n(q, t)'Ym*(q) dq.
Vemos así que el proceso de medición en mecánica cuántica presenta« dos caras»:
su papel respecto del pasado y del futuro no coinciden. Con relación al pasado,
dicho proceso «verifica» las probabilidades de los diferentes resultados posibles
predichos por el estado resultante de la medición anterior. En cambio, en relación
al futuro, da lugar a un nuevo estado (véase también el § 44). En la propia naturaleza del proceso de medición se encierra así una profunda irreversibilidad.
Esta irreversibilidad tiene un importante significado fundamental. Como veremos más adelante (véase el final del § 18), las ecuaciones básicas de la mecánica
cuántica poseen de suyo un carácter simétrico con relación al cambio de signo de la
variable tiempo; en este respecto la mecánica cuántica no difiere de la clásica. La
irreversibilidad del proceso de medición, en cambio, introduce en los fenómenos
cuánticos una no equivalencia física de los dos sentidos del tiempo, es decir, conduce
a la aparición de una diferencia entre futuro y pasado.
( 1)
Es necesario observar, sin embargo, que existe una importante excepción a la no reproducibilidad
de las mediciones: la única magnitud cuya medición se puede repetir es una coordenada. Dos mediciones
de una coordenada del electrón efectuadas después de transcurrido un intervalo de tiempo suficientemente
corto deben dar valores próximos entre sí; lo contrario significaría que el electrón posee una velocidad
infinita. Esta circunstancia está relacionada matemáticamente con el hecho de que una coordenada conmuta con el operador de energía de interacción en.re el electrón y el aparato, operador que (en la teoría
no relativista) es función sólo de las coordenadas.
CAPÍTULO
II
ENERGÍA E IMPULSO
§ 8.
El operador de Hamilton
La función de onda 'Y determina completamente el estado de un sistema físico
en mecánica cuántica. Esto significa que dar esta función para un cierto instante
no sólo define -todas las propiedades del sistema en el mismo, sino que determina
también su comportamiento en los instantes futuros - tan sólo, claro está, hasta el
grado de definición que permite en general la mecánica cuántica. Desde el punto
de vista matemático esto se traduce en que el valor de la derivada o'Y/ót de la función de onda respecto del tiempo debe quedar determinado en cada instante por el
valor de la propia función 'Y correspondiente al mismo, debiéndo ser además esta
dependencia, según el principio de superposición, una dependencia lineal. En la
forma más general se puede escribir
i o'Y/ot =
DY,
donde l es un operador lineal; el tactor z se introduce aquí por conveniencia.
Veamos algunas propiedades del operador l. Dado que la integral
es una constante que no depende del tiempo, tenemos:
f
-d l'Yl 2 dq =
&
f'Y-o'Y... f'Y•-·o'Y
~
dq+
-dq
~
=
f 'Y'Y• dq
o.
Substituyendo aquí o'Y/ot = -iL'Y, o'Y•/ot = iL•'F'• y aplicando a la primera
integral la definición de operador transpuesto, escribiremos:
f 'YL•'Y• <lq - f 'Y"" L'Y <lq = f 'Y•l•'Y <lq - f 'Y•L'Y dq
= f 'Y•(l•-L)'Y <lq = o.
Dado que esta igualdad debe quedar satisfecha ~ualquiera que sea la función 'Y,
de ella se sigue que ha de tenerse idénticamente L•-L = O , o bien
l=L•.
Derivación de los operadores respecto del tiempo
31
El operador 1 es así hermítico. Examinemos a qué magnitud clásica corresponde.
Utilicemos para ello la expresión límite (6.1) de la función de onda y escribamos:
a'F
at
i
as
at
-=--:tF;
ñ
no es necesario derivar la amplitud lentamente variable a. Comparando esta igualdad con la definición o'Y/ot = -iL'Y, vemos que en el caso límite el operador i
se reduce a la simple multiplicación por la cantidad -(1/ ñ) oS/ot. Esto significa
que esta última es precisamente la magnitud física a la que se reduce el operador
hermítico L.
Conforme enseña la mecánica, la derivada - oS/ot no es sino la función de Hamilton H del sistema mecánico. Así, pues, el operador hi es el operador que corresponde en mecánica cuántica a la función de HAMILTON; este operador, que representaremos por Íí, se llama operador hamiltoniano o, más brevemente, hamiltoniano
del sistema. La relación entre o'Y/ot y 'Y toma la forma:
iñ o'F/ot =
íl'F.
(8.1)
Si se conoce la forma del hamiltoniano, la ecuación (8.1) determina las funciones
de onda del sistema físico dado. Esta ecuación fundamental de la mecánica cuántica
se llama ecuación de onda·
§ 9.
Derivación de los operadores respecto del tiempo
El concepto de derivada respecto del tiempo de una magnitud física no se puede
definir en mecánica cuántica en el mismo sentido que tiene en la mecánica clásica.
En efecto, la definición de derivada está ligada en mecánica clásica con la consideración de los valores de una magnitud en dos instantes próximos, pero distintos.
Ahora bien, en mecánica cuántica una magnitud que en cierto instante posee un
valor determinado no posee en general ningún determinado valor en los instantes
siguientes; de esto se trató con mayor detalle en el § 1.
El concepto de derivada respecto del tiempo, por consiguiente, debe definirse
en mecánica cuántica de otra manera. Es natural definir la derivada j de una magnitud f como aquella magnitud cuyo valor medio es igual a la derivada respecto
del tiempo del valor medio J Tenemos así, por definición:
l=f.
(9.1)
Partiendo de esta definición no es difícil obtener la expresión del operador /
que corresponde a la magnitud/en la mecánica cuántica. Dado que f = f 'Y'-'/'Y dq,
será
32
Energía e impulso
f
l= I = !!_ 'Y*/'Y dq =
dt
f 'Y*0atf'Y dq+ f o'Y*J'Y
dq + f 'Y*Jª'Y
at
at
dq.
Aquí aJ/ot es el operador que se obtiene al derivar el operador /respecto del tiempo,
variable ésta de la que el operador puede depender en forma paramétrica. Substituyendo en vez de las derivadas o'Y/ot, o'Y*/at sus expresiones dadas por (8.1),
obtenemos:
/ =
J'Y* ataj'Y dq+~ñ J(H*'Y*)/'Y dq-~ñ J'Y*f(H'Y) dq.
Dado que el operador ÍI es hermítico, es
f (H*\J!*)(/'Y) dq f 'F*H/'Y dq:
=
y así tenemos:
¡=
\J! dq.
at
J'Y* (-+-fJJ--JfJ
aj i
ñ
i
ñ
A
)
Por otra parte, dado que por la definición de valores medios ha de tenerse
J= f 'Y*/'Ydq, de ahí se sigue que la expr~sión que aparece en el integrando entre
paréntesis representa el operador buscado f (1):
(1) En mecánica clásica, para la derivada total respecto del tiempo de una magnitud f, que es función
de las coordenadas generalizadas Qi y de los impulsos Pi del sistema, se tiene:
df =a¡+~(ª! qá a¡-A).
dt at ~
aqi
ºPi
i
Substituyendo, de acuerdo con las ecuaciones de Hamilton
q¡ = oH/op,, p¡ = -oH/oq,, obtenemos
df/dt = a¡¡at+[H,f],
donde
[H fJ = ~ ( a¡ aH _ a¡ aH)
' - ~ aqi api api aqi
1
es el llamado paréntesis de Poisson para las magnitudes/ y H (véase tomo l. Mecánica,§ 4i). Comparando
con la expresión (9.2), vemos que, al pasar al límite clásico, el operador i(H/-ffI) se reduce a cero en
primera aproximación, como era de esperar, y que en la siguiente aproximación (respecto de h) se reduce
a la magnitud h[H.f[. Este resultado es también válido para dos magnitudes cualesquierafy g: el operador
i(fg-gf) se reduce en el límite a la magnitud h[f, g], donde [f, g] es el paréntesis de Poísson.
[f,g]=
ag a¡
¿(
. aq, ap,
ag a¡)
ap, aq,
-----.
l
Esto último se sigue inmediatamente de que siempre podemos imaginar formalmente un sistema cuyo
hamiltoniano coincide con g.
Estados estacionarios
33
J= ataj+¡li f11i-f11).
(9.2)
J
Observemos que si el operador no depende explícitamente del tiempo, el operador Í se reduce, salvo un factor, al resultado de la conmutación del operador j
con el hamiltoniano.
Una categoría muy importante de magnitudes físicas está constituida por los
operadores que no dependen explícit~mente del tiempo y que, además, conmutan
con el hamiltoniano, de forma que f = O. Tales funciones se califican de conservativas.
J
J J
Si el operador se anula idénticamente, se tendrá = = O, es decir, J = const.
Con otras palabras, el valor medio de esta magnitud se mantiene constante en el
curso del tiempo. Cabe también afirmar que si en un estado dado la magnitud f
tiene un valor determinado (es decir, la función de onda es una función propia del
operador/), también en los instantes ulteriores poseerá un valor determinado - precisamente el mismo.
§ 1O.
Estados estacionarios
Si un sistema no se encuentra en un campo exterior variable, su hamiltoniano
no puede contener el tiempo explícitamente. Esto se sigue inmediatamente del
hecho que cuando no existe un campo exterior (o si el campo exterior es constante)
todos los instantes son equivalentes en lo que concierne al sistema físico dado.
Por otra parte, puesto que todo operador conmuta, claro está, consigo mismo,
llegamos a la conclusión de que ia función de HAMILTON se conserva en los sistemas
que no se encuentran en un campo exterior variable. Como es sabido, una función
de HAMILTON que se conserva recibe el nombre de energía. Obtenemos así la ley
de conservación de la energía en mecánica cuántica. Ella significa en nuestro caso
que si en un estado dado la energía tiene un valor determinado, este valor se conserva constante en el tiempo.
Los estados en los que la energía tiene valore~ determinados se llaman estados
estacionarios del sistema. Estos estados se describen mediante funciones de onda
que son funciones propias del operador de HAMILTON, es decir, funciones que satisfacen a la ecuación H'Y n = En'I·n, donde En son los valores propios de la energía.
De acuerdo con esto, la ecuación de onda (8.1) para la función 'Y n
iñ o'J!'nfot
=
H'I!'n = En'Yn
se puede integrar inmediatamente respecto del tiempo y nos da
(10.1)
34
Energí.a e impul.so
donde 'f/Jn es función sólo de las coordenadas. Mediante esta fórmula se determina
la dependencia temporal de las funciones de onda de los estados estacionarios.
La letra 1/J minúscula designará las funciones de onda de los estados estacionarios sin el factor dependiente del tiempo. Estas funciones, y también los valores
propios de la energía, se determinan mediante la ecuación
Hij; = Eif;.
(10.2)
Haremos notar que el estado estacionario al que corresponde el_menor de todos
los valores posibles de la energía se llama estado normal o fundamental del sistema.
El desarrollo de una función de onda arbitraria 'F en funciones de onda de los
estados estacionarios es de la forma:
(10.3)
Los cuadrados Janl 2 de los coeficientes del desarrollo determinan, como siempre,
las probabilidades de los diferentes valores de la energía del sistema.
La distribución de probabilidades de las coordenadas en un estado estacionario
viene determinada por el cuadrado j'Fn\ 2 = 1%\2 ; no depende, pues, del tiempo.
Lo mismo vale para los valores medios
de cualquier magnitud física{ (cuyo operador no depende del tiempo explícitamente),
y, por consiguiente, también para las probabilidades de sus diferentes valores.
Conforme se indicó, el operador de una magnitud cualquiera conservativa- conmuta con el hamiltoniano. Esto -significa que toda magnitud física que se conserve
puede medirse a la vez que la energía.
Entre los diferentes estados estacionarios puede haber también algunos que
corresponden a un mismo valor de la energía, difiriendo entre sí por los valores
de cualesquiera otras magnitudes físicas. De tales valores propios de la energía
(o de los, como se les llama también, diferentes niveles energéticos del sistema), a los
que corresponden diferentes estados estacionarios, se dice que son degenerados.
La posibilidad de existencia de niveles degenerados está ligada físicamente con el
hecho de que la energía no constituye de suyo, en general, un sistema completo de
magnitudes físicas.
En particular, es fácil ver que si se tienen dos magnitudes físicas conservativas f
y g cuyos operadores no conmutan entre sí, los niveles de energía del sistema son,
Estados estacionarios
35
en general, degenerados. En efecto, sea 1P la función de onda de un estado estacionario en el que, junto con la energía, posee un valor determinado la magnitud f.
Cabe entonces afirmar que la función K1P no coincide (ni aun salvo un factor constante) con 1P; lo contrario significaría que también g tiene un valor determinado,
lo que es imposible, ya que f y g no se pueden medir simultáneamente. De otra
parte, la función g''f/J es función propia del hamiltoniano correspondiente al mismo
valor E de la energía que la función 1P:
fl(g¡/1) = gfli/i = E(g,fi).
Vemos así que a la energía E corresponde más de una función propia, es decir, que
el nivel energético es degenerado.
Es evidente que cualquier combinación lineal de funciones de onda correspondientes a un mismo nivel degenerado de la energía es también función propia asociada al mismo valor de la energía. Con otras palabtas, la elección de las funciones
propias correspondientes a un valor propio de la energía degenerado no es única.
Las funciones propias de un nivel energético elegidas arbitrariamente no son, en
general, ortogonales dos a dos. Sin embargo, eligiendo convenientemente sus combinaciones lineales es siempre posible construir un sistema de funciones propias
ortogonales dos a dos (y normalizadas). Esta elección se puede efectuar de infinitas
maneras; en efecto, el número de coeficientes independientes en una transformación
lineal de n funciones es igual a n 2 , y el número de condiciones que traducen la normalización y ortogonalidad de las n funciones es igual a n(n+I)/2, es decir, menor
que n2 •
Estas consideraciones relativas a las funciones propias de un nivel energético
degenerado valen, claro está, no sólo para las funciones propias de la energía, sino
también para las funciones propias de cualquier otro operador. Así, tan sólo las
funciones que corresponden a valores propios distintos del operador en cuestión
son automáticamente ortogonales; en cambio, las funciones que corresponden a
un mismo valor propio degenerado no son, en general, ortogonales dos a dos.
Si el hamiltoniano del sistema es la suma de dos (o más) términos.B = 0 1 +fJ2 ,
uno de los cuales contiene solamente las coordenadas q1 y~ el otro las coordenadas q2 ,
las funciones propias del operador fI se pueden escribir como productos de las
funciones propias de los operadores H1 y Í/2, y los valores propios de la energía
son iguales a las sumas de los valores propios de dichos operadores.
El espectro de valores propios de la energía puede ser tanto discreto como continuo. Un estado estacionario del especto discreto corresponde siempre a un movimiento finito del sistema, es decir, a un movimiento en el que ni el sistema ni una
parte cualquiera del mismo escapan al infinito. En efecto, para las funciones propias
del espectro discreto la integral f ]'Fl 2 dq extendida a todo el espacio es finita. Esto
36
Energía e impulso
significa, en cualquier caso, que el cuadrado ['Y[ 2 disminuye con rapidez suficiente,
tendiendo a cero en el infinito. Con otras palabras, la probabilidad de que las coordenadas tomen valores infinitos es igual a cero, es decir, el sistema realiza un movimiento finito o, conforme suele decirse, se encuentra en un estado ligado.
Para las funciones de onda del espectro continuo la integral f )'Y] 2 dq diverge.
El cuadrado de la función de onda i'Yi 2 no determina ahora de manera inmed:ata
la probabilidad de los diferentes valores de las coordenadas y debe considerarse
solamente como una cantidad proporcional a dicha probabilidad. La divergencia
de la integral f )'Y[ 2 dq está siempre ligada con el hecho de que i'Yl 2 no tiende a
cero en el infinito (o tiende a cero, pero no con la suficiente rapidez). Por consiguiente, se puede afirmar que la integral f ['Y\ 2 dq extendida a la región del espacio
exterior a una superficie cerrada cualquiera, pero finita y tan grande cuanto se
quiera, será siempre divergente. Esto significa que en el estado considerado el sistema (o una cualquiera de sus _partes) se encuentra en el infinito. Para una función
de onda que es superposición de diferentes funciones de onda de estados estacionarios del espectro continuo, la integral f \'Y[ 2 dq puede resultar convergente, de forma
que el sistema se encuentre en una región finita del espacio. Sin embargo, es posible
demostrar que en el curso del tiempo este dominio se extenderá sin límites y en
último término el sistema escapará al infinito (1). Los estados estacionarios del espectro continuo corresponden así a un movimiento infinito del sistema.
§ 11.
Matrices
Supondremos para simplificar que el sistema considerado posee un espectro
discreto (todas las relaciones que se obtienen a continuación se generalizan inmediatamente también al caso del espectro continuo). Sea 'Y = I:an'Y n el desarrollo
(1) Es fácil ver que así ocurre de la siguiente manera. Una superposición de funciones de onda del
espectro continuo tiene la forma:
'Y =
Ja Ee-(i flt)Etip E(q) dE.
El cuadrado del módulo de 'Y se puede escribir en forma de integral doble
Si se promedia esta expresión en un intervalo de tiempo T y se hace luego que T tienda a infinito, los valores medios del factor oscilante e(if1t)(E 1-E)1, y con ellos toda la integral, tienden a cero en el límite. Por
consiguiente, el valor medio respecto del tiempo de la probabilidad de éncontrar el sistema en un lugar
dado cualquiera del espacio de configuraciones tiende a cero; pero esto es sólo posible si el movimiento
se efectúa en todo el espacio infinito.
Observemos que para una función 'Y que es superposición de.funciones del espectro discreto sería
l'YJ2 =
~~
nm
anam*e(i/1tXEm-En>t¡/Jn'Pm* = ~ lan'Pn(q)J2,
n
es decir, la probabilidad buscada se conserva finita al promediar respecto del tiempo.
Matrices
37
de una función de onda cualquiera en funciones de onda 'Y n de los estados estacionarios. Si se substituye este desarrollo en la definición f = f 'P'*l"/'Y d.q del valor
medio de una magnitud f, obtenemos:
(11.1)
donde las fnm(t) d~signan las integrales
Ínm(t)
=
f
*fY m dq.
'Yn
(11.2)
El conjunto de cantidadesfnm(t), con todos los valores posibles n, m, se llama matriz
de la magnitudf(1), y de cada una de lasf,1m(t) se dice que es un element1J de matriz
correspondiente a la transición del estado n al estado m (2).
La dependencia de los elementos de matriz fnm(t) respecto del tiempo viene
determinada (si el operador J no contiene t explícitamente) por la dependencia
temporal de las funciones 'Fn, Substituyendo en vez de éstas las expresiones (10.1 ),
se encuentra que
(11.3)
donde
(11.4)
es la llamada frecuencia de transición entre los estados n y m, y las cantidades
(11.5)
constituyen la matriz no dependiente del tiempo de la magnitud f, matriz que se
utiliza a menudo (3). Observemos que las frecuencias w 11 m satisfacen las relaciones
evidentes:
(11.6)
J
Los elementos de matriz de la derivada se obtienen derivando respecto del
tiempo los elementos de matriz de la magnitud f; esto se sigue desde luego del hecho
(1) La representación matricial de las magnitudes físicas fue introducida por W. HEISENBERG en 1925,
antes del descubrimiento por ScHRÓDINGER de la ecuación de onda. La « mecánica matricial » fue luego
desarrollada por M. BoRN, W. HEISENBERG y P. JoRDAN.
(2) En ciertos casos, cuando es necesario escribir cada uno de los índices n, m, como conjunto de varias
letras, utilizaremos la notaciónfmn en vez defnm• Para los mismos elementos de matriz se emplea también
la notación (ni f: m).
( 3)
Ho hay que perder de vista que, debido a la indeterminación del factor de fase en las funciones
de onda normalizadas (véase§ 2), también los elementos de matrizfmn (y fmn(t)) están determinados salvo
,un factor de la forma ei(am - an). También aquí esta indeterminación no se refleja en ninguno de los resultados físicos.
38
Energía e impulso
que el valor medio J es igual Í, es decir,
J=
LL an*amfnm(t).
nm
En virtud de (11.3) tenemos así para los elementos de matriz de /:
fnm(t) = ÍWnmfnm(t)
(11.7)
o (dividiendo ambos miembros por el factor temporal ei"'nm') para los elementos
de matriz no dependientes del tiempo:
(/)nm
= iwnmfnm = (i//i)(E,,,-Em)fnm•
(11.8)
Para simplificar la notación en las fórmulas, todas las relaciones que se deducen
a continuación se refieren a los elementos de matriz no dependientes del tiempo;
las mismas relaciones exactamente valen también para las matrices dependientes
de él.
Para los elementos de matriz de la magnitud ¡• conjugada compleja de f se obtiene, teniendo en cuenta la definición de operador conjugado:
o bien
(11.9)
Para las magnitudes físicas reales, que son las que habitualmente tan sólo consideramos, tenemos, por consiguiente,
(11.10)
(f* mn aparece aquí en vez de (fmn)*). Estas matrices, como sus correspondientes
operadores, se llaman hermíticas.
Los elementos de matriz con n = m se llaman diagonales. Estos elementos no
dependen en general del tiempo, y de (11.1 O) se sigue, evidentemente, que son reales. El elemento fnn representa el valor medio de la magnitud f en el estado "Pn·
No es difícil obtener la regla de multiplicación de matrices. Observemos para ello,
ante todo, que vale la fórmula
(11.11)
Esto no es sino el desarrollo de la función /ifsn en funciones "Pm con coeficientes
determinados siguiendo la regla general (3.5). Teniendo en cuenta esta fórmula,
escribamos el resultado de aplicar a la función "Pn el producto de dos operadores:
Matrices
/gi/;n = /( gipn) = J f gknlPk =
39
f gkn/ipk = k"'frlknÍmklPm·
Dado que, de otra parte, debe tenerse
llegamos al resultado de que los elementos de matriz del producto fg vienen dados
por la fórmula
(11.12)
Esta regla coincide con la adoptada en matemáticas para el producto de matrices.
Dar una matriz es equivalente a dar el propio operador. En particular, dar la
matriz proporciona en esencia la posibilidad de determinar los valores propios de
la magnitud física en cuestión y las correspondientes funciones propias.
Consideremos ahora los valores de todas las magnitudes en- un cierto instante
y desarrollemos una función de onda cualquiera 'Y (correspondiente a este instante)
en funciones propias del operador de HAMILTON ÍI, es decir, en funciones de onda
"Pm, independientes del tiempo, de los estados estacionarios:
(11.13)
donde hemos representado los coeficientes del desarrollo por Cm· Substituyamos
este desarrollo en la ecuación fP" = f'p' que determina los valores propios y las
funciones propias de la magnitud f Tenemos:
Multipliquemos ambos miembros de esta ecuación por "Pn * e integremos respecto
de q. Cada una de las integrales f 'Pn•fil,m dq que aparecen en el primer miembro
de la igualdad es el correspondiente elemento de matriz fnm· En cambio, en el se~
gundo miembro todas las integrales f 'Pn.•.¡,m dq con m =I= n desaparecen en virtud
de la ortogonalidad de las funciones "Pm dos a dos, y la integral f 'Pn •.¡,. dq = 1
en virtud de su normalización:
o bien
(11.14)
donde
~nm
= O para m =/= n, e igual a 1 para m = n.
40
Energí,a e impulso
Hemos obtenido así un sistema de ecuaciones algebraicas homogéneas de primer grado (respecto de las incógnitas cm). Como es sabido, un sistema de este tipo
tiene soluciones diferentes de cero sólo si se cumple la condición de anulación del
determinante formado por los coeficientes de las ecuaciones, es decir, si se cumple
la condición
Las raíces de esta ecuación (en la que f se considera como incógnita) representan
también los valores posibles de la magnitud f El conjunto de las cantidades cm que
satisfacen las ecuaciones (11.14) conf igual a uno cualquiera de estos valores, determina la correspondiente función propia.
Si en Ja definición (11.5) de los elementos de matriz de la magnitud f se toma
para 'f/Jn las funciones propias de esta misma magnitud, en virtud de la ecuación
f,pn = f n'Pn tendremos:
Dada la ortogonalidad y normalización de las funciones 'f/Jm esta relación conduce
afnm = O paran=/= m y fmm = fm. Resultan así diferentes de cero tan sólo los elementos de matriz diagonales y cada uno de ellos es igual al correspondiente valor
propio de la magnitud f; de una matriz en la que sólo son diferentes de cero estos
elementos se dice que está reducida a la forma diagonal. En particular, en la representación ordinaria, con las funciones de onda de los estados estacionarios utilizadas
como funciones 'f/Jm la matriz de la energía es diagonal (como también las matrices
de todas las otras magnitudes físicas que poseen valores definidos en los estados
estacionarios). En general, de la matriz de una magnitud f determinada mediante
las funciones propias de un cierto operador g se dice que es la matriz f en la representación en la que g es diagonal. Salvo indicación explícita, entenderemos en lo
que sigue por matriz de una magnitud física la matriz en la representación ordinaria,
en la que la energía es diagonal. Todo lo dicho antes acerca de la dependencia de
una matriz respecto del tiempo se aplica, claro está, a esta representación ordinaria (1).
Con ayuda de la representación matricial de los operadores se puede demostrar
el teorema mencionado en el § 4: si dos operadores conmutan entre sí, poseen un
sistema completo común de funciones propias. Sean J y g dos de estos operadores.
De Jg = g/ y de la regla de multiplicación de matrices (11.12) se sigue que
(1) Teniendo en cuenta el carácter diagonal de la matriz energía, es fácil comprobar que la igualdad
(I 1.8) no es sino la relación entre operadores (9.2) escrita en forma matricial.
41
Matrices
Tomando como sistema de funciones '!fn para el cálculo de los elementos de matriz
las funciones propias del operador /, tendremos f mk = O para m =f= k, de forma
que la igualdad anterior se reduce a la igualdad f~mgmn = gmnfnm o bien
= O.
Si todos los valores propios .fn de la magnitud f son diferentes, para todos los m =f= r.
g mn(fm-fn)
tendremos f m - fn =; O, de forma que debe ser gmn = O. Así, pues, también la matriz gmn resulta diagonal, es decir, las funciones 'f/Jn son también funciones propias
de la magnitud física g. En cambio, si entre los valores fn los hay iguales (es decir
si existen valores propios tales que a ellos les corresponden varias funciones propias), los elementos de matriz g mn correspondientes a cada uno de estos grupos
de funciones 'f/Jn resultan, en general, diferentes de cero. Sin embaro, las combinaciones lineales de funciones "Pn que corresponden a un mismo valor propio de la
magnitud/ son también, evidentemente, funciones propias de la misma; es siempre
posible elegir estas combinaciones de tal manera que se reduzcan a cero los correspondientes elementos de matriz gmn no diagonales y, por consiguiente, también
en este caso obtenemos un sistema de funciones que son funciones propias de los
operadores J y g simultáneamente.
Observemos que se puede considerar la. matriz /nm como el operador f en la
representación energética. En efecto, el conjunto de los coeficientes en del desarrollo
(11.13) en funciones propias 'f/Jn del hamiltoniano se puede considerar (cf. § 5) como
función de onda en la «representación-E» (donde el índice n es una variable que
indica el número del estado estacionario). La fórmula
para el valor medio de la magnitud J corresponde entonces a la expresión general
del valor medio de una magnitud, en mecánica cuántica, en función de su operador
y de la función de onda del sistema dado.
PROBLEMA
El hamiltoniano de un sistema, y con él las funciones propias de la energía, En, son funciones
de un cierto parámetro Á. Demostrar que
(oH/oA)nn
= oE,,Jo>...
Solución. Derivando la ecuación (H-En)iµn = O respecto de
izquierda por tpn*, obtenemos:
Á y
7"T
Oipn = i/;n* (ºEn
ipn*(n
-En)- - -oft) !pn,
o>..
o>..
o>..
multiplicando luego a la
42
Energía e impulso
Al integrar respecto de q, el primer miembro de esta igualdad se anula, por lo que
dado el carácter hermítico del operador H. Et segundo miembro da precisamente la igualdad
buscada.
§ 12. Transformación de matrices
Los elementos de matriz de una misma magnitud física pueden definirse con
relación a diferentes sistemas -de funciones de onda. Estas pueden ser, por ejemplo,
funciones de onda de estados estacionarios descritos por diferentes conjuntos de
magnitudes físicas, o funciones de onda de estados estacionarios de un mismo
sistema que se encuentra en diferentes campos exteriores. Ligada con esto se plantea la cuestión de transformar las matrices pasando de una representación a otra.
Sean "Pn(q) y 1Pn'(q) (n = l, 2, ... ) dos sistemas completos ortonormales de
funciones. Estos sistemas están ligados entre sí por ciertas tn¡nsformaciones lineales
Y,n'
= !:
m
SmnY,m,
(12.1)
que representan simplemente el desarrollo de las funciones 1Pn' en funciones 1Pn
de un sistema completo. Esta transformación se puede escribir en forma de operador:
(12.2)
El operador S debe satisfacer determinada condición a fin de que garantice
el carácter ortonormal del sistema de funciones 1Pn' cuando lo es el sistema constituido por las funciones "Pn· En efecto, substituyendo (12.2) en la condición
y teniendo en cuenta la definición de operador transpuesto (3.14), obtenemos:
f (Sif,n)S*if,m• dq = f Y,m*S*SY,n dq = 3mn•
Para que esta igualdad se cumpla para todos los m, n, debe ser
S•S = 1, o bien
(12.3)
es decir, el operador inverso coincide con el conjugado hermitico. Los operadores
que gozan de esta propiedad se llaman Únitarios. En virtud de ella la transformación
ffn ::;: S-lifin~ inversa de la transformación (12.1), viene dada por la fórmula
Trans/ormación de matrices
43
(12.4)
Escribiendo la igualdad S+S = 1 o SS+ = 1 en forma matricial, obtenemos
la condición que traduce el carácter unitario en la forma:
(12.5)
o bien
(12.6)
Consideremos ahora una magnitud física cualquiera/y escribamos sus elementos
de matriz en la « nueva » representación, es decir, respecto de las funciones "Pn'.
Dichos elementos vienen dados por las integrales:
De aquí se sigue, evidentemente, que la matriz del operador/ en la nueva representación es igual a la matriz del operador
¡, = s-1/s
(12.7)
en la representación antigua.
Un importante papel en diferentes cálculos de mecánica cuántica lo representan
las sumas de los elementos diagonales de las matrices; tales sumas se llaman traza
de las matrices y se designan por tr f (1):
trf = Lfnn·
n
(12.8)
Observemos, ante todo, que la traza del producto de dos matrices es independiente
del orden de los factores:
tr (fg)
= tr (gf),
(12.9)
En efecto, según la regla de multiplicación de matrices tenemos:
tr (fg)
= Ln Lk Ín~kn = Lk nL gknÍnk = tr (gf).
(1) De la palabra traza. Se utiliza también la notación Sp, del alemán Spur = traza. Claro está, sólo
es posible considerar la traza cuando converge la suma respecto de n, condición que supondremos se
cumple.
44
Energía e impulso
De manera análoga es fácil comprobar que la traza del producto de varias matrices
no varía cuando se efectúa una permutación circular de los factores; así
tr (fgh)
=
tr (hfg)
=
tr (ghf).
(12.10)
La propiedad más importante de la traza consiste en que es independiente de la
elección del sistema de funciones respecto del cual se determinan los elementos
de matriz. En efecto:
(tr f)'
§ 13.
=
tr (S-1jS)
=
tr (SS-1j)
=
tr f.
Los operadores en la representación de Heisenberg
En el formalismo matemático de la mecánica cuántica que acabamos de exponer,
los operadores que corresponden a las diferentes magnitudes físicas se aplican a
funciones de las coordenadas y ellos mismos no dependen por lo general explícitamente del tiempo. Los valores medios de las magnitudes físicas dependen del tiempo
tan sólo como consecuencia de la dependencia, con relación al tiempo, <;le la función
de onda del estado, y de acuerdo con la fórmula
/(t)
=
J'Y*(q, t)/P(q, t) dq.
(13.1)
Sin embargo, el formalismo de la mecánica cuántica se puede presentar en otra
forma diferente, que equivale a la primera, en la cual la dependencia temporal pasa
de las funciones de onda a los operadores. Aunque en este libro no utilizaremos
esta representación de los operadores (llamada representación de Heisenberg), la
formularemos aquí con vistas a su aplicación ulterior a la teoría relativista.
Introduzcamos el operador
S = exp[-(i/li)Ht],
(13.2)
<londe b es el hamiltoniano del sistema. Por definición, sus funciones propias coinciden con las funciones propias del operador H, es decir, con las funciones de onda
de los estados estacionarios 1J)n(q), y se tiene
(13.3)
Se sigue de aquí que el desarrollo (10.3) de una función de onda arbitraria en funciones de onda de los estados estacionarios se puede escribk en forma de operador:
'F(q, t) = S'Y(q, O),
(13.4)
es decir, la aplicación del operador S conduce al paso de una función de onda del
sistema en un cierto instante inicial a la función de onda en un instante cualauiera.
45
La matriz densidad
De acuerdo con la definición (3.16) tenemos (dado que el operador bes hermitico):
es decir, Ses un operador unitario, conforme debía ser, ya que se puede considerar
la fórmula (13.3) (con el tiempo t como parámetro) como caso particular de la transformación (12. l ).
Introduciendo, de acuerdo con (12. 7), el operador dependiente del tiempo
/et) = s-1¡s,
tendremos:
/(t) =
f 'F*(q, O)f(t)'F(q, O) dq,
(13.5)
(13.6)
es decir, representamos la fórmula que da el valor medio de la magnitud f (y que
es la la que define los operadores) en una forma en la que la dependencia respecto
del tiempo recae completamente en el operador.
Evidentemente, los elementos de matriz del operador (13.5) respecto de las funciones de onda de los estados estacionarios coinciden con los elementos de matriz
fnm(t), dependientes del tiempo, determinados por la fórmula (11.3).
Finalmente, derivando la expresión (13.5) respecto del tiempo (en el supuesto
de que los propios operadores/y H no contienen t), obtenemos la ecuación
a
-/(t)
ot
.
=
;.n1-Jn),
ñ
(13.7)
que es análoga a la fórmula (9.2), pero que tiene un sentido algo distinto: la expresión (9.2) es la definición del operador/, que corresponde a la magnitud física j,
mientras que en el primer miembro de la ecuación (13.7) aparece la derivada respecto del tiempo del operador de la propia magnitud f
§ 14.
La matriz densidad
Consideremos un sistema que es parte de un cierto sistema aislado. Supongamos
que éste, considerado como un todo, se encuentra en un cierto estado definido
por la función de onda 'Y(q, x), donde x representa el conjunto de las coordenadas
del sistema parcial considerado y q las restantes coordenadas del sistema aislado.
Esta función, por lo general, no se descompone en producto de una función de x
46
Energía e impulso
solamente y de una función de sólo q, de forma que el sistema considerado no posee
su propia función de onda (1).
Sea f una magnitud física relativa a nuestro sistema. Su operador se aplica, por
ello, tan sólo a las coordenadas x, pero no a las q. El valor medio de esta magnitud
en el estado considerado es:
J=
ff V•(q, x)fY(q, x) dqdx.
(14.1)
Introduzcamos la función e(x', x) definida por
p(x', x) =
J"Y*(q, x')"Y(q, x) dq,
(14.2)
donde la integración se refiere tan sólo a las coordenadas q; la llamaremos matriz
densidad del sistema. Por la definición (14.2) es evidente que dicha función posee
la propiedad de hermiticidad.
p*(x, x')
= p(x', x).
(14.3)
Los « elementos diagonales » de la matriz densidad
p(x, x)
=
f j"Y(q, x)¡2 dq
definen, evidentemente, la distribución de probabilidad de las coordenadas del
sistema.
Mediante la matriz densidad, ?.\ valor medio / se puede escribir en la forma:
I=
f [/p(x',x)Jx,=z dx.
(14.4)
En ella/se aplica a la función e(x', x) tan sólo en tanto depende de las variables x;
después de calcular el resultado de la aplicación hay que hacer x' = x. Vemos,
pues, que si se conoce la matriz densidad, es posible calcular el valor medio de cualquier magnitud característica del sistema. Se sigue de aquí que mediante e(x', x)
es posible determinar también las probabilidades de los diferentes valores de las
magnitudes físicas del mismo. Llegamos así a la conclusión de que un estado del
sistema que no posea función propia se puede describir mediante la matriz densidad.
Esta no contiene las coordenadas q, que no se refieren al sistema dado, si bien,
claro está, depende esencialmente del estado del sistema aislado considerado como
un todo.
(1) Para que 'Y(q, x) se descomponga (en un instante dado) en un producto de este tipo, la medición,
como resultado de la cual se produjo el estado en cuestión, debe describir de manera completa y por
separado el sistema considerado y el resto del sistema aislado. Pero para que 'l"(q, x) siga conservando esta
forma en los instantes ulteriores, es necesario también que estas partes del sistema aislado no se encuentren
en interacción mutua (véase § 2). No suponemos ahora ni lo uno ni lo otro.
La matriz densidad
47
La descripción mediante la función densidad resulta ser la forma más genera)
de describir los sistemas en mecánica cuántica. La descripción que proporciona
una función de onda es, en cambio, un caso particular, caso que corresponde a una
matriz densidad de la forma e(x', x) = 'Y*(x')'Y(x). Entre este caso particular y el
caso general existe la siguiente diferencia importante (1). Para un estado que posee
función de onda existe siempre un sistema completo de procesos de medición que
conducen con certeza a resultados determinados (esto significa matemáticamente
que 'Y es función propia de un cierto operador). En cambio, para los estados que
poseen solamente una matriz densidad no existe un sistema completo de mediciones
que conduzcan a resultados unívocamente predecibles.
Supongamos que el sistema considerado es aislado, o que se convierte en tal
a partir de un cierto instante. Es posible entonces deducir una ecuación que determina la variación de la matriz densidad con el tiempo, ecuación que es análoga a la
ecuación de onda para la función 'Y. Se puede simplificar el cálculo observando
que la ecuación diferencial lineal buscada para e(x', x, t) debe quedar satisfecha
también en el caso particular en que el sistema posee función de onda, es decir,
cuando se tiene
p(x', x, t) = 'l"•(x', t)'l"(x, t).
Derivando respecto del tiempo y utilizando la ecuación de onda (8.1 ), tenemos:
op
o'l"(x t)
o'Y•(x' t)
ili- = ili'Y•(x', t)
' +ili'Y(x, t)
'
ot
ot
ot
=
'Y•(x', t)ll'Y(x, t)-'Y(x, t)ll'•'Y•(x', t),
donde 11 es el hamiltoniano del sistema, que se aplica a funciones de x, y ff' el mismo
operador aplicado a funciones de x'. Las funciones 'Y*(x', t) y 'Y(x, t) se pueden
permutar, evidentemente, con los símbolos de los operadores fi y Íi', respectivamente, y obtenemos así la ecuación buscada
ili op( x'' x, t) /ot
Sean
es decir,
respecto
'Y n(x, t)
= (ll-ít'•)p( x' ,x, t).
(14.5)
'Y n(x, t) las funciones de onda de los estados estacionarios del sistema,
las funciones propias del hamiltoniano. Desarrollemos la matriz densidad
de estas funciones; el desarrollo constituye una serie doble en las funciones
y 'Yn(x', t), desarrollo que escribiremos en la forma:
p(x', x, t) = :E:E Omn'Yn"'(x', t)'F m(x, t)
mn
= :E:E Omn'Pn"'(x')i/,m(x),J.:l/1'XE,.-E,,Jt.
mn
(14.6)
(1) Los estados descritos por una función de onda se llaman a veces estados puros y, en contraposición
a ellos, los estados descritos por la matriz densidad se llaman estados mezclados.
48
Energía e impulso
Este desarrollo representa para la matriz densidad un papel análogo al del desarrollo
(10.3) para las funciones de onda. En vez del conjunto de coeficientes am encontramos aquí un doble sistema de coeficientes ªmn· Estas cantidades poseen, evidentemente, al igual que la propia matriz densidad, el carácter de hermiticidad
(14.7)
Para el valor medio de una magnitud
f
tenemos, substituyendo (14.6) en (14.4):
f = mn
:E:E ªmn f 'Yn*(x, t)/lJ! m(x, t) dx,
o bien
(14.8)
donde /,,m son los elementos de matriz de la magnitud f. Esta expresión es análoga
a la fórmula (11.l) (1).
Las cantidades amn deben satisfacer determinadas desigualdades. Los « elementos diagonales» g(x, x) de la matriz densidad, que determinan la distribución de
probabilidad de las coordenadas, deben ser, evidentemente, cantidades positivas.
De la expresión ·(14.6) (con x' = x) se sigue, por lo tanto, que la forma cuadrática
construida con los coeficientes anm
(donde ;n son cantidades complejas arbitrarias) debe ser definida positiva. Esto
impone a las cantidades. aum ciertas condiciones bien conocidas por la teoría de las
formas cuadráticas. En particular, deben ser positivas, evidentemente, todas las
cantidades « diagonales >>
ª1m
>O,
(14.9)
y cada tres cantidades ann, Omm, amn deben satisfacer la desigualdad
(14.10)
Al caso «puro», en el que la matriz densidad se reduce a un producto de funciones, corresponde, evidentemente, una matriz ªmn de la forma:
Vet.4nos un criterio simple que permite decidir fácilmente, a partir de la matriz
si se trata de un estado «puro» o «mezclado». En el caso puro tenemos:
ªmm
1
( )
BLOCH,
La descripción de un sistema mediante las cantidades amn fue introducida por L.
independientemente, en 1927.
LANDAU y
F.
49
Impulso
(a2)mn
=; amkakn
= l:: ak*aman*ak
k
=aman* l::k
lakl 2
o bien
(14.11)
es decir, el cuadrado de la matriz densidad coincide consigo misma.
§ 15.
Impulso
Consideremos un sistema de partículas que no se encuentra en un campo exterior. Dado que todas las posiciones, en el espacio, de este sistema como un todo
son equivalentes, es posible afirmar, en particular, que el hamiltoniano del mismo
no varía en una translación arbitraria del sistema. Basta imponer que se cumpla
esta condición para un desplazamiento paralelo arbitrariamente pequeño; se cumplirá entonces también para una translación finita.
Una translación infinitamente pequeña caracterizada por el vector c5r representa
una transformación en la cual los vectores posición rª de todas las partículas (a es
el número que indica la partícula) experimentan el incremento c5r : rª ~ rª +c5r.
Una función cualquiera 1Plt1, r 2 , ••• ) de las coordenadas de las partículas se convierte, en una transformación de este tipo, en la función
tf,(r1 +Sr, r 2+Sr, ... ) = if,(r1, r 2, ... )+Sr • l:: 'V a'P
a
=
(1 +Sr • l:: Va)tf,(r1, r 2, ... )
a
(V a designa el «vector» cuyas componentes son los operadores 8/oxa, 8/oya, 8/oza).
La expresión entre paréntesis, es decir,
l+Sr. l:: Va,
a
se puede considerar como el operador de una translación infinitesimal que convierte la función 1P(r1, r 2 , •.• ) en la función
tf,(r1 +sr, r2+Sr, ... ).
Afirmar que una cierta transformación no altera el hamiltoniano significa que si
se aplica esta transformación a la función h tp, el resultado será el mismo que el
de su aplicación sólo a la función 1P seguida de la aplicación del operador Íí. Podemos escribir esto matemáticamente de la siguiente manera. Sea 6 un operador que
«efectúa» la transformación considerada. Tenemos entonces Ó(ílif,) = fl(Óif,), de
donde
ófl-Bó=O,
50
Energí.a e impulso
es decir, el hamiltoniano debe conmutar con el operador
8.
En el caso presente el operador O es el operador, introducido más arriba, que
corresponde a una translación infinitesimal. Dado que el operador unidad (el operador de la. multiplicación por 1), conmuta, claro está, con cualquier operador, y
que el factor constante ór se puede permutar con el símbolo D, la condición
ófi -fló = O se reduce aquí a la condición
(~ 'Va)lJ-lJ(~ 'Va)= O.
a
(15.1)
a
Conforme sabemos, 1a conmutabilidad de un operador (que no contiene el tiempo
explícitamente) con B significa que la magnitud física que le corresponde se conserva.
La magnitud cuyo carácter conservativo para un sistema aislado se sigue de la homogeneidad del espacio se llama impulso. Así, pues, la relación (15.1) expresa la ley
de conservación del impulso en mecánica cuántica; el operador ~ v ª debe corresponder, salvo un factor constante, al impulso total del sistema, y cada uno de los
términos ª de la suma, al impulso de cada una de las partículas.
v
El coeficiente de proporcionalidad entre el operador p del impulso de una partícula y el operador V se puede determinar mediante el paso al límite de la mecánica
clásica. Escribiendo p = cV y utilizando la expresión límite (6.1) de la función
de onda, tenemos
p'Y = (i/li) cae<iflt)S\] S = c(i/li)'YVS,
es decir, en la aproximación clásica la aplicación del operador p se reduce a la multiplicación por (i/ li)c V S. Conforme es sabido por la mecánica, el gradiente V S
es el impulso p de la partícula; se debe tener, por consiguiente, (i/ li)c = 1, es decir
e= -ili.
El operador impulso de una partícula es, por consiguiente, p = -ili V, o bien,
para las componentes:
Í>a: = -ilió/ox, Í>11 = -ilio/oy, Í>z = -iliiJ/oz.
(15.2)
Es fácil comprobar que estos operadores son hermíticos, cual debía ser. En efecto,
para funciones arbitrarias 111(x) y <f,(x) que tienden a cero en el infinito, tenemos:
f
</,p.,/, dx = -ili
f~
dx = ili
f f :: f
dx =
,f,p.•.¡, dx,
que es precisamente la condición de hermiticidad del operador.
Dado que el resultado de derivar funciones respecto de dos variables diferentes
no depende del orden de derivación, es claro que los operadores de las tres componentes del impulso conmutan entre sí:
(15.3)
51
Impulso
Esto significa que las tres componentes del impulso de una partícula pueden tener
simultáneamente valores definidos.
Determinemos las funciones propias y los valores propios de los operadores de
impulso. Unas y otros se determinan mediante las ecuaciones
-in oif,/ox = p~,
-ili o¡/J/oy = Pvif,,
-ilioif,/oz = p,if,.
(15.4)
La solución de la primera de ellas es
iJ, = f(y, z)e<i/A)pxx,
donde f no depende de x. Esta solución se conserva finita para todos los valores
de x, cualquiera que sea el valor real de Px· Así, pues, los valores propios de las
componentes Px del impulso forman un espectro continuo que se extiende de - oo
a + oo; lo mismo vale, naturalmente, para hs componentes Py, PzLas tres ecuaciones (15.4) poseen también, en particular, soluciones comunes,
que corresponden a estados con valores determinados de las tres componentes del
impulso que forman el vector p. Estas soluciones son de la forma:
if, =
C/i/11,)p.r,
(15.5)
(Ces una constante). Dar a la vez las tres componentes del impulso determina por
completo, conforme vemos, la función de onda de una partícula. Con otras palabras,
las magnitudes Px, Py, Pz constituyen uno de los posibles sistemas completos de magnitudes físicas.
Determinemos el coeficiente de normalización en (15.5). Según la regla (5.4) de
normalización de las funciones propias del espectro continuo, debe ser
f ¡/,p,¡/,p* dV = 8(p'-p)
(15.6)
donde la integración ha de extenderse a todo el espacio (dV = dx dy dz) y c5(p' - p)
es la función-<5 tridimensional definida de manera análoga a la función unidimensional (función de una sola variable) (1). La integración se efectúa mediante la fórmula (2 )
1
( )
La función-ó tridimensional ó(r) se puede representar, en particular, como producto
ó(r) = ó(x)ó(y)ó(z)
de funciones-ó de las componentes cartesianas del vector r.
2
( )
El significado convencional de esta fórmula es el de que la función que aparece en el primer miembro de la igualdad posee la propiedad característica de la función-ó expresada por la igualdad
QO
_[ f (x)8(x) dx = f (0).
Este resultado se sigue de la fórmula integral de Fóurier
f(x') = (1/27T)
ff f(x)ei<x-x''Ja dxdoc,
s1 se supone en ella x' = O.
Separando la parte real, es también posible escribir la fórmula (15.7) en la forma:
f cosrt.X dx
QO
(1/27T)
-ao
= S(oc).
(15.7a)
52
Energí.a e impulso
QC)
(l/21r~[ eiax dx =
(15.7)
8(0t).
Tenemos:
f 'Pp,'Pp* dV = C2 f e<i/'/1,XP'-P).r dV
= C2(21rli) 38(p' -p).
De aquí se sigue, evidentemente, que debe ser C2(2,,,/i)3
zada 1J)p es así igual a:
'Pp = {21r/i)-3/2e(i/'fl,)p.r.
=
l. La función normali(15.8)
El desarrollo de una función de onda arbitraria de una partícula 1P(r) en funciones propias % del operador de impulso no es sino el desarrollo de aquélla en
integral de Fourier:
tf,(r) =
f a(p)tf,p(r) d3p = (21rli)-3/2 f a(p)eCi/J'OP.r d3p
(15.9)
(d3p = dpx dpy dpz). Los coeficientes del desarrollo a(p) son iguales, de acuerdo
con la fórmula (5.3), a
a(p) =
f tf,(r)tf,p*(r) dV
=
(21rli)-3/2
f tf,(r)e-Ci/'fl,)p.r dV.
(15.10)
La función a(p) se puede considerar (véase § 5) como función de onda de una
partícula en la « representación-p »: [a(p)J 2 d3p es la probabilidad de que el impulso
tome valores en el intervalo d 3p. Las fórmulas (15.9-10) determinan la relación
entre las funciones de onda en ambas representaciones.
De manera análoga a como el operador p corresponde al impulso, determinando
sus funciones propias en la « representación-r » es posible introducir el concepto
de operador r del vector posición de la partícula en la « representación-p ». El operador r se debe definir de manera que el valor medio de las coordenadas se pueda
representar en la forma:
r= f a*(p)i'a(p) d3p.
(15.11)
Por otra parte, este mismo valor medio se determina a partir de la función de onda
1J)(r) mediante la relación
r=
f tf,*rtf, dV.
Escribiendo 1P(r) en la forma (15.9), tenemos (integrando por partes) (1):
( 1)
La derivada respecto del vector p se interpreta como un vector cuyas componentes son las derivadas respecto de Px, py, p z.
Impulso
rtf,(r)
=
(2,,,./i)-3/2
53
Jra(p)eCifA)p.r dªp
J
= (2,,,./i)-3/2 ilie<i/A)P.r[éJa(p)/op] d3p.
Mediante esta expresión y teniendo en cuenta (15.10), se encuentra:
r = JtJ,•rtJ, dV =
=
(21rñ)-3 / 2
JJtf,*(r)iñ[oa(p)/op]eCi/A)P,r dªpdV
Jilia*(p)[oa(p)/op] dªp.
Comparando con (15.11 ), vemos que el operador del vector posición en la « representación-p » es
r=
iña¡ap.
(15.12)
El operador de impulso en esta representación, en cambio. se reduce simplemente
a la multiplicación por p.
PROBLEMAS
1. Expresar el operador
operador de impulso.
Solución.
1'a de la translación finita caracterizada por el vector a mediante el
Por definición del operador Ta, debe ser
1'atf,(r) = tf,(r+a).
Desarrollando la función 1P(r+a) en serie de Taylor, tenemos:
tf,(r+a) = tf,(r)+a. otf,(r)/or+ ... '
o bien, introduciendo el operador
f, =
-ili\j:
1 i
+-,ri .f>+z(t
• f, )2+ ... Jtf,(r).
tf,(r+a) = [ 1
La expresión que aparece dentro del paréntesis recto es el operador
f'a
=
e(i/A)a ·P.
Este es precisamente el operador buscado de la translación finita.
2. Hallar la ley de transformación de la función de onda en una transformación de Galileo.
Apliquemos la transformación a la función de onda del movimiento libre de una
partícula (onda plana). Dado que cualquier función 'Y se puede desarrollar en ondas planas, esto
nos permite hallar también la ley de transformación para una función de onda arbitraria.
Solución.
Las funciones de onda del movimiento libre en los sistemas de referencia K y K' (K' se mueve
respecto de K con velocidad V) son:
54
Energía e impulso
'Y
'Y'
= constante x e(i/11,)(p.r-Et>,
= constante x e!i/lt)(p'.r'-E't>,
donde r = r' +Vt y los impulsos y las energías en ambos sistemas están ligados entre sí por las
fórmulas (1)
p = p'+mV,
E= E'+V.p'+!mVt
Substituyendo estas expresiones de r, p, E en 'Y, obtenemos
'Y= 'Y' exp[imV.(r'+iVt))
=
'Y' exp[~V.!(r+r')
l
(1)
En esta forma la fórmula en cuestión no contiene ya magnitudes que caractericen el movimiento
libre de una partícula y constituye la ley general de transformación buscada para la función de
onda de un estado arbitrario de una partícula. Para un sistema de partículas, como exponente
en (1) deberá aparecer la suma respecto de las diferentes partículas.
§ 16.
Relaciones de indeterminación
Deduzcamos ahora las reglas de conmutación entre los operadores del impulso
y de las coordenadas. Dado que el resultado de la derivación sucesiva respecto
de una de las variables x, y, z y la multiplicación por otra de ellas no depende del
orden de estas operaciones, se tendrá
P11:Y-YP11:
=
O, PzZ-ZPz = O,
(16.1)
Pv, Pz.
y análogamente para
Para deducir la regla de conmutación de
ftx
con x, escribamos:
('Pa:X-XPz),f, = -ili. o(xv,)/cx+iñx o,f,/ox
= -ili,f,.
El resultado de aplicar el operador p:i;X-xp x se reduce, pues, a multiplicar la función por -ili lo mismo vale, naturalmente, para los conmutadores de Pu con y
y de Pz con z. Tenemos así (2):
.11
A
Pa:X-XP11: =
•J;;.
-ir,,,
A
A
P11Y-YP11
•J::
= -in,
Véase tomo I, Mecánica, § 8.
Estas relaciones, descubiertas en forma matricial por
partida para fundar la actual mecánica cuántica.
•f:
Pzz-zp, = -m.
.11
A
(16.2)
(1)
<
2
)
HEISENBERG
en 1925, sirvieron de punto de
55
Relaciones de indeterminación
Todas las relaciones (16.1-2) se pueden escribir en la forma:
(i, k = x,y, z).
(16.3)
Antes de pasar al análisis del sentido físico de estas relaciones y sus consecuencias, deduzcamos dos fórmulas que serán útiles más adelante. Sea /(r) una función
de las coordenadas; se tendrá entonces
p/(r)-/(r)p
= -iñvf.
(16.4)
En efecto:
(pf-fp)¡/J = -iñ[v(f¡/J)-f v¡/JJ = -iñ¡/Jvf.
Una relación análoga vale también para la conmutación de r con una «función»
/(p) del operador impulso:
/(p)r-r/(p) = -iliof/op.
(16.5)
Esta puede deducirse de la misma manera que (16.4) si se efectúa el cálculo en la
representación-p, utilizando para los operadores de las coordenadas las expresiones
(15.12).
Las relaciones (16.1-2) demuestran que la coordenada de una partícula a lo largo
de un eje puede tener un valor determinado a la vez que las componentes del impulso
respecto de los otros dos ejes; en cambio, una coordenada y la componente del
impulso a lo largo del mismo eje no existen simultáneamente. En particular, una
partícula no puede encontrarse en un punto determinado del espacio y poseer al
mismo tiempo un impulso determinado p.
Supongamos que una partícula se encuentra en una cierta región finita del espacio cuyas dimensiones respecto de los tres ejes son del orden de magnitud ~x,
dy, ~z. Además, sea p0 el valor medio del impulso de la partícula. Esto significa,
desde el punto de vista matemático, que la función de onda tiene la forma
'P = u(r)eiPor/\ donde u(r) es una función que difiere apreciablemente de cero tan
sólo en aquella región del espacio. Desarrollemos la función 'P en funciones propias del operador de impulso (es decir, en integral de Fourier).
Los coeficientes a(p) de este desarrollo vienen determinados por las integrales
(15.10) de funciones de la forma u(r)ei<p ·p)r/h. Para que una tal integral difiera de
cero de manera apreciable, los períodos del factor oscilante ei(p ·p)r/\ no deben
ser pequeños respecto de las dimensiones dx, ~y, ~z de la región en la que la función u(r) es diferente de cero. Esto significa que a(p) diferirá apreciablemente de
cero tan sólo para valores p tales que (Pox - Px)~x/h ,:S 1, ... Dado que [a(p)l 2
determina la probabilidad de los diferentes valores del impulso, los intervalos de
valores de Px, Py, Pz en los que a(p) es diferente de cero no son sino aquellos intervalos
de valores en los que puedan encontrarse las componentes del impulso de la partícula
0
0
56
Energí.a e impulso
en el estado considerado. Designando estos intervalos por ll.px, Ap11 , Apz, tenemos
así:
(16.6)
Estas relaciones (las llamadas relaciones de indeterminación) fueron obtenidas por
HEISENBERG.
Vemos, pues, que con cuanta mayor precisión se conoce una coordenada de la
partícula (es decir, cuanto menor es Ax), tanto mayor es la indeterminación Apx
relativa a los valores de la componente del impulso a lo largo del mismo eje, y recíprocamente. En particular, si la partícula se encuentra en un punto rigurosamente
determinado del espacio (Ax= Ay= Az = O), se tendrá Apx = Ap11 = Apz = oo,
Esto significa que en este caso todos los valores del impulso son igualmente probables. Recíprocamente, si la partícula posee un impulso rigurosamente determinado p,
todas las posiciones en el espacio son equiprobables (lo que también se ve inmediatamente observando que la función de onda (15.8) es tal que el cuadrado del módulo
no depende en absoluto de las coordenadas).
Como ejemplo consideremos una partícula en el estado definido por la función
de onda
tp = constante x tf..í /'/t)'pºx-a.x• /211,
(16.7)
(para simplificar consideramos el caso unidimensional, con la función de onda
dependiente tan sólo de una coordenada). Las probabilidades de los diferentes valores
de las coordenadas son iguales a
li/sl 2 = constante
X e-a.xª /11,,
es decir, se distribuyen en torno del origen (valor medio x = O) de acuerdo con la
ley de Gauss, con una fluctuación cuadrática mediay[(Ax}2] = y(li/2a.)(Ax designa la diferencia x - x) (1). El cálculo de los coeficientes a(px) del desarrollo de esta
función en integral de Fourier según la fórmula
00
a(Pre)
=
(21rli)-ll~I tf;(x)e-<íJ'lt>Pxx dx,
conduce a una expresión de la forma:
a(Pre)
= constante x e-<P,-Px>ªJ2'ftrx..
La distribución de probabilidades de los valores del impulso
lal 2 = constante X
e-(Po-'Px)ª m«,
1
( )
Como es sabido, la distribución gaussiana para la probabilidad w(x) de los valores de una cierta
magnitud x es de la forma:
57
Relaciones de indeterminación
tiene, por consiguiente, la misma forma gaussiana, con una fluctuación cuadrática
media
(donde D..px = Px - p 0 ). El producto de las fluctuaciones cuadráticas medias de la
coordenada y del impulso son iguales, por consiguiente, a
(16.8)
de acuerdo con (16.6) (1).
Finalmente, deduzcamos aun otra relación útil. Sean f y g dos magnitudes físicas cuyos operadores satisfacen la relación de conmutación
J.A
f!}
•l:,
A
(16.9)
¡g-¡;,¡ = -iric,
(1) Se puede demostrar que este valor del producto de las fluctuaciones es el menor posible. Para
ello consideremos la siguiente deducción formal (H. WEYL). Supongamos que el estado de una partícula
viene descrito por la función tp(x) y que los valores medios de las coordenadas y del impulso en este estado
son, para simplificar la demostración, iguales a cero. Consideremos la desigualdad evidente
f"'
1
dij;
-"' c,.xif;+ dx
12
dx
> O,
donde et: es una constante real arbitraria (el signo de igualdad vale para una función tp de la forma (16.7)).
Para calcular esta integral observemos que
f
f(
x21if;l2 dx = (~x)2,
dip*
dtp) dx
x~+xip*dx
dx
=
f dlt/Jl
2
x - dx = dx
f
l,J,1 2 dx = -1,
con lo que se obtiene
Para que este trinomio cuadrático (respecto de a) sea positivo cualesquiera que sean los valores de
debe quedar satisfecha la condición
!X,
o bien
(16.8a)
58
Energía e impulso
donde ees el operador de una magnitud física c. En el segundo miembro de la igualdad hemos introducido el factor h para tener en cuenta que en el límite clásico
(es decir, pa~ h--+ O) todos los operadores de las magnitudes físicas se reducen a la
multiplicación por estas mismas magnitudes y conmutan entre sí. En el caso « cuasiclásico » es posible, por consiguiente, considerar en primera aproximación igual a
cero el segundo miembro de la igualdad (16.9). En la siguiente aproximación, en
cambio, cabe substituir el operador t por un operador que consiste simplemente
en multiplicar por la magnitud c. Se obtiene entonces:
Jg-g/ = -iñc.
Esta igualdad es exactamente análoga a la relación PzX-XPx = -ili, con la única
diferencia de que en vez de la constante h aparece en ella fa magnitud he (1). De
esto podemos concluir, por analogía con la relación AxApx ~ li , que en el caso
cuasiclásico vale para las magnitudes f, g la relación de indeterminación
!::,.f6.g - ñc
(16.10)
En particular, si una de las magnitudes es la energía (f == H) y el otro operador
(g) no depende explícitamente del tiempo, según (9.2) será e= g y la relación de
indeterminación en el caso cuasiclásico es:
!::,.E!::,.g - lig.
(16.11)
( 1)
La magnitud clásica e es el paréntesis de Poisson correspondiente a las magnitudes f y g, véase
la nota en la pág. 32).
CAPÍTULO
III
LA ECUACIÓN DE SCHRODINGER
§ 17.
La ecuación de Schrodinger
Pasemos ahora a determinar la forma del hamiltoniano-cuestión esta de la mayor
importancia, porque es este operador el que determina la forma de la ecuación de
onda.
Empecemos por considerar una partícula libre, es decir, una partícula que no
se encuentra en ningún campo exterior. Dada la completa homogeneidad del espacio
para una tal partícula, su hamiltoniano no puede contener en forma explícita las
coordenadas y debe expresarse tan sólo en función del operador impulso. Además,
para una partícula libre se conservan tanto la energía como el impulso, por lo cual
ambas magnitudes pueden existir simultáneamente. Dado que el valor del vector
impulso determina por completo el estado de la partícula, los valores propios de la
energía E deben ser función del valor del impulso en el mismo estado. Además, E
debe ser función solamente del módulo del impulso, no de su dirección; esto último
se sigue de la completa isotropía del espacio con relación a una partícula libre, es
decir, de la equivalencia en él de todas las direcciones. La propia forma de la función E(p) queda completamente determinada por las condiciones que impone ·el
llamado principio de relatividad de Galileo, principio que debe quedar satisfecho
en la mecánica cuántica no relativista al igual que en la mecánica clásica (no relativista). Como se demuestra en mecánica (1), esta condición conduce a una dependencia cuadrática de la energía con relación al impulso E = p 2/2m, donde la cons..
tante m se llama masa de la partícula.
Para que la relación E= p2/2m se cumpla para todos los valores propios de la
energía y del impulso, esta misma relació.n debe ser también válida para sus operadores:
tJ =
c112m)<Pl+P112+¡.2).
(17.1)
Substituyendo aquí (15.2), obtenemos el hamiltoniano de una partícula que se
mueve libremente en la forma:
1
( )
Véase tomo l, Mecánica, § 4.
60
La ecuación de Schrodinger
11 =
donde L
=
-(li,2/2m)L,
(17.2)
o2/ox 2+éJ2/éJy2+o2/oz 2 es ei operador de Laplace.
Si tenemos un sistema de partículas que no interactúan entre sí, su hamiltoniano
es igual a la suma de los hamiltonianos de cada una de ellas:
11 =
-!li2 ~ (1/ma)La
(17.3)
a
(el índice a numera las partículas; La es el operador de Laplace en el que la derivación se efectúa respecto de las coordenadas de la a-ésima partícula).
La forma del hamiltoniano para un sistema de partículas en interacción mútua
no se puede deducir partiendo únicamente de los principios generales de la mecánica
cuántica. Su forma es análoga a la función de HAMILTON de la mecánica clásica,
y se obtiene sumando al hamiltoniano de las partículas sin interacción una cierta
función U(r1 , r 2 , ••• ) de sus coordenadas:
11 =
-lli2 ~ La/ma+U(r1 ,r2 , ... ).
a
(17.4)
El primer término se puede considerar como el operador de la energía cinética y el
segundo como el operador de la energía potencial. Este último se reduce a la simple
multiplicación por la función U, y del paso al límite de la mecánica clásica se sigue
que esta función debe coincidir con la que determina la energía potencial en dicha
mecánica. En particular, el hamiltoniano de una sola partícula que se encuentra
en un campo exterior es
fJ =p2/2m+ U(x,y, z) = -(li2/2m)6. + U(x,y, z),
(17.5)
donde U(x, y, z) es la energía potencial de la partícula en dicho campo.
Observemos que los valores propios del operador de la energía cinética son positivos, lo que se sigue desde luego del hecho que este operador es igual a la suma
de los cuadrados de los operadores que corresponden a las componentes del impulso
con coeficientes positivos. En consecuencia, también el valor medio de la energía
cinética en un estado arbitrario será siempre positivo.
La substitución de las expresiones (17.2)-(17.5) en la ecuación general (8.1)
nos da la ecuación de onda de los correspondientes sistemas. Escribamos, en particular, la ecuación de onda de una partícula en un campo exterior
ili o'Y/ot
= -(li2/2m)L'Y+ U(x,y, z)'Y.
(17.6)
La ecuación (10.2) que determina los estados estacionarios toma, en cambio, la
forma:
(li 2/2m)Lip +[E-U(x,y,z)]ip = O.
(17.7)
La ecuación de Schrodinger
61
Las ecuaciones (17.6), (17.7), fueron obtenidas por E. ScHRODINGER en 1926 y se
llaman ecuaciones de Schrodinger - temporal y no temporal, respectivamente.
Para una partícula libre la ecuación de Schrodinger (17.7) tiene la forma:
(li 2/2m)L,f;+E,f; = O.
(17.8)
Esta ecuación posee soluciones finitas en todo el espacio para cualquier valor positivo de la energía E (incluido el valor O). Como a tales soluciones se pueden tomar
las funciones propias (15.5) comunes a los operadores de las tres componentes del
impulso. Las funciones de ónda completas de los estados estacionarios tendrán
entonces la forma:
'Y= constante xe-<if1i)Et+(i/11,)p.r (E= p2/2m).
(17.9)
Cada una de estas funciones describe un estado en el que la partícula posee una
energía determinada E y un impulso determinado p. Es una onda plana que se
propaga en la dirección p y que posee una frecuencia E/ li y una longitud de onda
21rli/p (esta última se llama longitud de onda de De Broglie de la partícula) ü).
El espectro energético de una partícula que se mueve libremente resulta así
ser continuo, extendiéndose de cero a + =. Cada uno de estos valores propios
(con la única excepción del valor E= O) es degenerado y la degeneración es de multiplicidad infinita. En efecto, a cada valor E diferente de cero corresponde una
multiplicidad infinita de funciones propias (17.9) que difieren entre sí en la dirección
del vector p para un mismo valor absoluto del mismo.
Veamos de qué manera tiene lugar en la ecuación de Schrodinger el paso al
límite de la mecánica clásica, considerando, para simplificar, una sola partícula
en un campo exterior. Substituyendo en la ecuación de Schrodinger ( 17.6) la expresión límite (6.1) de la función de onda \f = aei5 lh, obtenemos, efectuando la derivación,
ªª
as
a
ili
ili
li2
a--ili-+-(vS)2--aLS--vS. va--La+Ua = O.
at at 2m
2m
m
2m
En esta ecuación aparecen términos puramente reales y términos puramente imaginarios (recordemos que S y a son reales); igualando unos y otros a cero por separado, obtenemos dos ecuaciones:
as 1
~
2
-+-(vS) +U--La = O,
at
2m
aa
at
2ma
a
1
2m
m
-+-Ls+-vs. va= O.
El concepto de onda asociada a una partícula fue introducido por vez primera por L. DE BRoen 1924.
(1)
GLIE
62
La ecuación de Schrodinger
Prescindiendo en la primera de estas ecuaciones del término que contiene /t,2, obtenemos:
as 1
(17.10)
-+-(V S) 2 + U= O,
2m
es decir, cual debe ser, la conocida ·ecuación clásica de Hamilton-.lacobi para la
acción S de la partícula. Obsérvese, a propósito, que cuando ñ -+ O, la mecánica
clásica es válida con una precisión que es del primer orden de magnitud (y no de
orden cero) respecto de li.
ot
La segunda de las ecuaciones precedentes se puede escribir, después de multiplicarla por 2a, en la forma:
S) = O.
aa2 +div(a2 V
ot
m
(17.11)
Esta ecuación posee un significado físico intuitivo: a2 es la densidad de probabilidad
de encontrar la partícula en un lugar del espacio (['Yi 2 = a 2);
S/m = p/m es la
velocidad clásica v de la partícula. La ecuación ( 17 .11) no es, por lo tanto, sino la
ecuación de continuidad que nos dice que la densidad de probabilidad « se desplaza »
según las leyes de la mecánica clásica con la velocidad clásica v en cada punto.
v
§ 18.
Propiedades fundamentales de la ecuación de Schrodinger
Las condiciones a que deben satisfacer las soluciones de la ecuación de Schrodinger son de un carácter muy general. Ante todo la función de onda debe ser uniforme y continua en todo el espacio. La condición de continuidad se mantiene
también en aquellos casos en que el propio campo U(x, y, z) presenta superficies
de discontinuidad. En tales superficies deben conservarse continuas tanto la función
de onda como sus derivadas. Acerca de la continuidad de las derivadas hay que
hacer, sin embargo, la reserva de que éstas dejan de ser continuas si más allá de una
cierta superficie la energía potencial U se hace infinita. Una partícula no puede en
absoluto penetrar. evidentemente, en una región del espacio donde U = =, es
decir, en dicha región debe ser en todas partes 1JJ =-' O. La continuidad de tp, exige
que en la frontera de este dominio 1JJ se anule; en cambio, las derivadas de lJJ experimentan en este caso, por lo general, una discontinuidad finita.
Si el campo U(x, y, z) no se hace infinito en ningún punto, también la función
de onda debe ser finita en todo el espacio. Esta misma condición debe quedar satisfecha en los casos en que U se hace infinito en algún punto, pero no más rápidamente
que 1/r,; con s < 2 (véase también § 35).
Sea Umín el valor mínimo de la función U(x, y, z). Dado que el hamiltoniano
de una partícula es suma de dos términos - el operador energía cinética t y el
Propiedades fundamentales de la ecuación de Schrodinger
63
operador energía potencial-, el valor medio de la energía en un estado arbitrario
es igual a la. suma E_= T +O.Pero todos los valores propios del operador t (que
coincide con el hamiltoniano de una partícula libre) son positivos; por e11o también el
valor medio T ~ O. Teniendo también en cuenta la desigualdad evidente O> Umin'
encontramos que E > Umin . Dado que esta desigualdad se cumple para cualquier
estado, es evidente que vale también para todos los valores propios de la energía:
(18.1)
Consideremos una partícula que se mueve ep un campo de fuerzas que se anula
en el infinito; la función U(x, y, z), como de costumbre, la definiremos de manera
que en el infinito tienda a cero. Es fácil ver que el espectro de valores propios negativos de la energía será entonces discreto, es decir, en un campo que se anula en el
infinito todos los estados con E < O son estados ligados. En efecto, en los estados
estacionarios del espectro continuo, estados que corresponden a un movimiento
infinito, la partícula se encuentra en el infinito (véase § IO). Pero a distancias suficientemente grandes se puede prescindir de la existencia del campo, con lo que es
posible considerar el movimiento de la partícula como un movimiento libre; ahora
bien, en un movimiento libre la energía sólo puede ser positiva.,
Por el contrario, los valores propios positivos forman un espectro continuo
y corresponden a un movimiento infinito; para E> O la ecuación de ScHRODINGER
no tiene, por lo general (en el campo considerado), soluciones para las que la integral Jlv,\ 2 d V converja (1 ).
Debemos hacer notar que en la mecánica cuántica y para un movimiento finito
la partícula puede encontrarse también en regiones del espacio en las que E < U;
aunque la probabilidad lv,\ 2 de encontrar la partícula en ellas tiende rápidamente
a cero al penetrar en una región de este tipo, con todo dicha probabilidad es distinta
de cero a cualquier distancia finita. Se presenta aquí una diferencia fundamental
con la mecánica clásica, en la que una partícula no puede en modo alguno penetrar
en una región donde U> E. En la mecánica clásica, la imposibilidad de penetrar
en esta región está ligada con el hecho de que para E < U la energía cinética sería
negativa, es decir, la velocidad sería imaginaria, lo que es absurdo. En mecánica
cuántica los valores propios de la energía cinética son también positivos; sin embargo, no llegamos aquí a una contradicción dado que si en el proceso de medición
la partícula se localiza en un determinado punto del espacio, como resultado de
este mismo proceso el estado de la partícula se perturba de tal manera que ésta
deja de poseer una energía cinética determinada, cualquiera que sea.
Si en todo el espacio es U(x, y, z) > O (con U-+ O en el infinito), en virtud de la
(1) Desde un punto de vista puramente matemático es necesario advertir, sin embargo, que para ciertas formas determinadas de la función U(x, y, z) (que carecen de significación física) pueden dejar de pertenecer al espectro continuo los puntos de un conjunto discreto de valores.
64
La ecuación de Schrodinger
desigualdad (18.1) tenemos En> O. Dado que, por otra parte, cuando E> O el
espectro debe ser continuo, llegamos a la conclusión de que en el caso considerado
el espectro discreto no existe, es decir, es sólo posible un movimiento infinito de la
partícula.
Supongamos que U tiende a - oo en un cierto punto (que elegimos como origen de coordenadas) de acuerdo con la ley
(ex
>
O).
(18.2)
Consideremos una función de onda que es finita en una pequeña región (de radio r0 )
en torno del origen de coordenadas e igual a cero fuera de ella. La indeterminación
de los valores de las coordenadas de la partícula en un tal paquete de ondas es del
orden de r 0 ; por consiguiente, la indeterminación en el valor del impulso es~ ñ/r 0 •
El valor medio de la energía cinética en este estado es del orden de magnitud de
ñ2 /mrl,Y el valor medio de la energía potencial es del orden de ,_, - :xjr0s. Supongamos primero que s > 2. Entonces la suma
n/mrl-a/ro
2
8
para valores de rO suficientemente pequeños toma valores negativos tan grandes
cuanto se quiera en valor absoluto. Pero si la energía media puede tomar tales valores, ello significa en cualquier caso que existen valores propios negativos de la energía
que, en valor absoluto, son tan grandes cuanto se quiera. A los niveles de energía
con [El grande corresponde un movimiento de la partícula en una región muy pequeña del espacio en torno del origen de coordenadas. El estado « normal » corresponderá a una partícula que se encuentra en el propio origen de coordenadas, es
decir, tiene lugar una « caída » de la partícula al punto r = O.
Si, en cambio, s < 2, la energía no puede tomar valores negativos tan grandes
cuanto se quiera en valor absoluto. El espectro discreto comienza con un cierto
valor finito negativo. No tiene lugar en este caso la «caída» de la partícula al centro.
Obsérvese que en la mecánica clásica una tal «caída» de la partícula es en principio posible en cualquier campo atractivo (es decir, para cualquier valor positivo
des). El casos= 2 se considerará aparte en el§ 35.
Examinemos ahora el carácter del espectro energético en su dependencia del
comportamiento del campo a grandes distancias. Supongamos que para r -+ oo la
energía potencial, que es negativa; tiende a cero de acuerdo con la ley (18.2) (en
esta fórmula se supone ahora que res grande). Consideremos un paquete de ondas
que «llena» un estrato esférico de gran radio r 0 y de espesor ~r. ~ r 0 • En estas
condiciones, el orden de magnitud de la energía cinética será de nuevo ñ2/m(~r) 2,
y la energía potencial será del orden de - 1Y..jr 0s. Aumentemos r 0 y a la vez también
el valor de ~r (de forma que ~r crezca proporcionalmente a r0 ). Si s < 2, para
valores r0 suficientemente grandes la suma ñ2/m(~r)2- cx/r 0 ' pasa a ser negativa.
Propie,la,le.,; fundamentale.,; de la ecuación de Schriidinger
65
Se sigue de aquí que existen estados estacionarios con energías negativas en los que
la partícula puede encontrarse, con probabilidad apreciable, a grandes distancias
del origen de coordenadas. Pero esto significa que existen niveles energéticos negadvos de valor absoluto arbitrariamente pequeño (es necesario recordar que en un
dominio del espacio donde U> E las funciones de onda se amortiguan rápidamente).
Así, pues, en el caso considerado el espectro discreto contiene una infinidad de
niveles que se acumulan hacia el nivel E= O.
Si, en cambio, el campo tiende a cero en el infinito como -- 1/r8 con s > 2, no
existen niveles negativos con valores absolutos arbitrariamente pequeños. El espectro
discreto termina a un nivel con valor absoluto diferente de cero, de forma que el
número total de niveles es finito.
La ecuación de ScHRODINGER (no temporal), al igual que las condiciones impuestas a sus soluciones, es real. Por lo tanto, sus soluciones 1P se pueden siempre
elegir reales (1 ). En lo que concierne a las funciones propias de los valores no degenerados de la energía, éstas resultan automáticamente reales, salvo un factor de fase
que carece de importancia. En efecto, "P* satisface la misma ecuación que 1P y, por
consiguiente, es también función propia para aquel mismo valor de la energía;
por lo tanto, si este valor no es degenerado, 1P y "P* deben ser en esencia idénticas,
es decir, tan sólo pueden diferir en un factor constante (de módulo igual a la unidad).
En cambio, las funciones de onda que corresponden a un mismo nivel degenerado
de la energía, no son necesariamente reales, pero mediante una elección adecuada
de combinaciones lineales de las mismas es siempre posible obtener un sistema de
funciones reales.
Las funciones de onda completas 'F, en cambio~ se determinan por Ul'(l ecuación
entre cuyos coeficientes aparece i. Esta ecuación, sin embargo, conserva su forma
si en ella se cambia ten - t y a la vez se pasa a la conjugada compleja (2). Por esto
es siempre posible elegir las funciones 'F tales que 'F y 'F* difieren tan sólo en el
signo del tiempo - resultado éste que ya conocemos en virtud de las fórmulas
(10.1), (10.3).
Como es sabido, las ecuaciones de la mecánica clásica no cambian en la inversión del tiempo, es decir, al cambiar el signo de éste. En mecánica cuántica la simetría con relación a los dos sentidos del tiempo se expresa, conforme vemos, en la
invariancia de la ecuación de onda respecto del cambio de signo de t acompañado
simultáneamente de la substitución de 'Y por 'F*. Sin embargo, hay que recordar
que esta simetría se refiere aquí tan sólo a las ecuaciones, no al propio concepto
<1) Estas proposiciones no son válidas para los sistemas que se encuentran en un campo magnético
(véase cap. XV).
(:!)
Se supone que la energía po·encial U no depende explícitamente del tiempo: o d sistema es aislado.
o se encuentra en un campo constante (no magnético).
66
La ecuación de Schrodinger
de medición, que representa un papel fundamental en mecánica cuántica (conforme
se discutió ya detenidamente en el § 7).
§ 19.
Densidad de corriente
En mecánica clásica la velocidad de una partícula es igual al impulso dividido
por la masa. Veamos cómo esta misma relación se cumple, como era de esperar,
también en la mecánica cuántica.
Según la fórmula general (9.2) de derivación de los operadores respecto del tiempo,
para el operador velocidad se tiene v
t
=
v=
Valiéndonos de la expresión (17 .5) de
(i/ñ)(Hr-rH).
Hy de la fórmula (16.5), obtenemos:
v =p/m.
(19.1)
Las mismas relaciones existirán también, evidentemente, entre los valores propios
de la velocidad y del impulso y entre sus valores medios en un estado cualquiera.
La velocidad, como el impulso de una partícula, no puede tener un valor determinado a la vez que sus coordenadas. Pero la velocidad multiplicada por un elemento
de tiempo infinitesimal dt, determina el desplazamiento de la partícula en el tienpo dt.
Por consiguiente, el hecho de que no exista la velocidad a la vez que las coordenadas
significa que si la partícula se encuentra en un determinado punto del espacio en un
cierto instante, no podrá tener una posición definida en un instante infinitamente
próximo.
J
He aquí una fórmula útil relativa al operador correspondiente a la derivada
respecto del tiempo de una magnitud f(r) que es función del vector posición. Teniendo en cuenta que f conmuta con V(r), encontramos:
Í
=
(i/ñ)(Hf-JH)
=
(i/2mñ)(f, 2f-f f, 2 ).
Mediante (16.4) podemos escribir
f,2.f
=
P . Uf,-iñvf)
=
f,f. f,-iñf, • vJ,
Jp?. = (pf+itzvf).p = pf .p+ilivf .p.
Substituyendo en la fórmula para_/, obtenemos ]a expresión buscada
Í
=
(1/2m)(p.
vi+ v/. f,).
Determinemos ahora el operador aceleración. Tenemos:
.¿,
=
(i/h)(Hv -
vil)
=
(i/mli)(Hp-pH)
=
(i¡'mn)(Uf,- pU)
(19.2)
67
Densidad de corriente
(con p conmutan todos los términos de
mula (16.4), se encueritra:
fI
salvo U(r)). Teniendo en cuenta la fór-
mv= -vU.
(19.3)
Esta ecuación entre operadores coincide exactamente en su forma con la ecuación del movimiento de la mecánica clásica (ecuación de NEWTON).
La integral f l'Yl 2 dV> extendida a un cierto volumen finito V, representa la probabilidad de encontrar la partícula en dicho volumen. Calculemos la derivada de
esta magnitud respecto del tiempo. Tenemos:
r
-d
l'Yj 2 dV=
dt •
V
f ( at *
V
a'Y
o'Y) dV=-i
'Y-+'Y*at
ñ
f
('Y.H*'Y*-'Y*.H'P')dV.
V
Substituyendo aquí
fl
H*
=
=
-(h2/2m)L, + U(x,y,z)
y utilizando la identidad
'Y D 'Y*-'Y* t::.'Y= div ('Yv'Y*-'Y*v'Y),
obtenemos:
d~
f
f
i'YJ'dV= -
V
dividV,
V
donde i designa el vector:
i
=
(in/2m)('fv'f*-'l"*v'f).
(19.4)
La integral de div i se puede transformar mediante el teorema de GAuss en una
integral extendida a la superficie cerrada S que rodea el volumen V (1):
:J
l'YI' dV = -
V
f
i. df.
(19.5)
S
Vemos así que se puede llamar a i vector densidad de corriente de probabilidad. La
integral de este vector extendida a una superficie es la probabilidad de que en la
unidad de tiempo la partícula atraviese esta superficie. El vector i y la densidad
de probabilidad l'Y) 2 satisfacen la ecuación
oj'YJ 2/at+div i = O,
(19.6)
análoga a la ecuación clásica de continuidad.
(') El elemento de superficie df se define como un vector cuyo valor absoluto es igual al área d/ del
1elemento y cuyo versor coincide con el de la normal exterior al dominio.
68
/,a Pcuación dt> Schrodinger
Introduciendo el operador de impulso, es posible escribir el vector i en la forma:
i
(19.7)
(1/Zm)('Yp*'Y*+'Y*p'Y).
=
Es útil demostrar cómo de la ecuación de Schródinger se sigue inmediatamente
la ortogonalidad de las funciones de onda de dos estados con valores diferentes
de la energía. Sean ~·,,, y ~',, dos de tales funciones; una y otra satisfacen las ecuaciones
-(n 2/2m)6if;m+ U¡/;m
= Emfm,
-(h2 /2m)D.¡/;n*+ Ufn* =
Multipliquemos la primera de ellas por
a miembro una de otra; esto da:
(Em-En)!fm¡pn *
=
~J 11
Eni/i,/"
*, la segunda por ~111 y restemos miembro
(li 2/2m)(¡/;mD.¡/;n*-¡/;n* D-fm)
= (li 2 /2m) div (fm V'Pn*-i/¡nfFV'Pm)•
Si ahora integramos ambos miembros de la ecuación en todo el espacio, el segundo
miembro, transformándolo mediante el teorema de GAuss, se reduce a cero y obtenemos:
de donde, en virtud de la hipótesis Em
buscada
§ 20.
=/= E
11 ,
se sigue la relación de ortogonalidad
El principio variacional
La ecuación de ScHRODINGER en su forma general flif,
a partir del principio de variación
J
o i/¡*(fl-E),fi dq
= O.
=
Eif,, se puede obtener
(20.1)
Dado el carácter complejo de 1P, la variación de 1P y de "P* se puede efectuar independientemente. Variando "P*, tenemos:
f oi/¡*(fl-E)i/¡ dq
=
O,
de donde se sigue, dada la arbitrariedad de blp*, la ecuación buscada flif, = Eif,.
La variación de '1/J no da nada nuevo. En efecto, variando 1P y teniendo en cuenta
69
El principio variacional
el carácter hermítico del operador
H
tenemos:
Jif;*(Él-E)oif; dq = Joif;(H*-E)if;* dq = o,
lo que conduce a la ecuación conjugada compleja H*if,*
= Eif,*.
El principio variacional (20. J) impone a la integral la condición de extremo
incondicionado. Es posible presentarlo en otra forma considerando a E como un
multiplicador de Lagrange en el problema de extremo condicionado
s Jif;*Élif; dq = o,
(20.2)
Jif;ifi* dq = l.
(20.3)
con la condición suplementaria
El valor m1mmo de la integral (20.2) (con la condición suplementaria (20.3))
es el primer valor propio de la energía, es decir, la energía E 0 del estado normal.
La función V', que conduce a este mínimo es, por consiguiente, la función de onda
1Po del estado normal (1). En cambio, las funciones de onda 'fJ'n(n > O) de los siguientes estados estacionarios corresponden simplemente a extremos, no a un mínimo
de la integral en sentido estricto.
Para obtener a partir de la condición de mínimo de la integral (20.2) la función
de onda 'Pi y la energía E 1 del estado que sigue al normal. hay que admitir como
funciones lJJ únicamente aquéllas que no sólo satisfacen la condición de normalización (20.3), sino también la condición de ser ortogonales a la función de onda fo
del estado normal J lJJlJJo dq = O. De manera general. si se conocen las funciones
de onda 1/'f¡, 'Pi, ... , 1p 11 _ 1 de los n primeros estados (ordenados de acuerdo con los
valores crecientes de la energía), la función de onda del estado siguiente hace mínima
la integral (20.2) en el supuesto de que se cumplan las condiciones suplementaria-.:
(m
=
O, 1,2, ... ,n-1).
(20.4)
Presentemos aquí algunos teoremas generales que se pueden demostrar a partir
del principio variacional (2).
La función de onda lJJo del estado fundamental no se anula
(o.
como se suele
(1) En lo que resta de este párrafo supondremos que las funciones de onda 1/' son reales. lo cual siempre se puede conseguir (si no existe un campo magnético).
2
( )
La demostración de los teoremas relativos a los ceros de las funciones propias (véase también
el párrafo siguiente) se puede encontrar en los libros: M. A. LAVRENT'Ev y L. A. L1usTERNIK, Curso de
cálculo de variaciones, 2.ª edición, Cap. IX, GosTEJIZDAT, 1950: R. CouRANT y D. H1LBERT, Methods
of Mathematical Physics, Vol. I, Chapter VI, lnterscience Publishers, 1953.
70
La ecuación de Schrodinger
decir, no presenta nodos) para ningún valor finito de las coordenadas (1 ). Con otras
palabras, posee un signo constante en todo el espacio. De aquí se sigue que las
funciones de onda ¡¡, 11 (n > O) de ]os demás estados estacionarios, que son ortogonales a 1/'o, deben presentar necesariamente nodos (si 1p 11 fuera también de signo
constante, la integral J 11'o1Pndq no podría reducirse a cero).
Además, del hecho de que V'o carezca de nodos se sigue que el nivel energético
fundamental no puede ser degenerado. En efecto, supongamos que sí lo fuera y sean
%, 1Po dos funciones propias distintas correspondientes al nivel E 0 • Toda combinación lineal C1Po--t-c'v,0' sería también función propia; pero eligiendo de manera conveniente las constantes e, e', es siempre posible conseguir que esta función se anule
en un punto dado cualquiera del espacio, es decir, obtendríamos una función propia
con nodos.
Si el movimiento tiene lugar en un dominio finito del espacio, en su frontera
debe ser 'P = O (véase 18). Para determinar los niveles de energía hay que encontrar, mediante el principio variacional, el mínimo de la integral (20.2) para esta
condición de contorno. El teorema según el cual Ja función de onda del estado fundamental carece de nodos significa aquí que V'o no se anula en punto ninguno interior el dominio considerado.
*
Observemos que al aumentar las dimensiones de la reg1on en que tiene lugar
el movimiento todos los niveles de energía E11 disminuyen: esto se sigue desde Juego
de que el crecimiento del dominio aumenta el sistema de funciones admisibles que
pueden conducir al mínimo de la integral y como resultado de ello el valor mínimo
de la integral sólo puede disminuir.
La expresión
f if;Hif;
dq
=
J[- ~ (ñ /2ma)if;~aif;+ Uif;2] dq
2
para los estados del espectro discreto de un sistema de partículas se puede transformar en otra, más cómoda para efectuar de hecho la variación. En el primer
término del integrando haremos:
La integral de div, 1( V'7 11 1J)) respecto de qª se transforma en una integral extendida
a una ~uperticie cerrada "ituada en el infl nito. y dado que en éste las funciones de
\)nda de los estados del espectro discreto tienden a cero de manera suficientemente
rápida. esta integral se anula. A sí. pues,
(1) Este teorema (al igual que sus consecuencias) deja de valer, en general, para las funciones de onda
de los sistemas constituidos por partículas idénticas (véase la nota al final del§ 63) .
Propiedades generales del movimiento en umi dimensión
71
(20.5)
§ 21.
Propiedades generales del movimiento en una dimensión
Si la energía potencial de la partícula depende de una sola coordenada (XL la
función de onda se puede buscar en la forma de producto de una función de y.
z por una función de x solamente. De ellas, la primera se determina mediante la
ecuación de Schrodinger del movimiento libre y la segunda mediante la ecuación
unidimensional de Schrodinger
d 2if; Zm
-+-[E- U(x)]ip
dx2 Ji2
= O.
(21.1)
A la misma ecuac1on unidimensional conduce, evidentemente, el problema que
plantea el movimiento en un campo con energía potencial U(x, _r, z) -== l/ 1(x)+
+ Uiy) + Uiz), que se descompone en suma de funciones cada una de las cuales
depende de una sola coordenada. En los
22-24 se estudiarán toda una serie de
ejemplos concretos de este tipo de movimiento « unidimensional ». Pero aquí nos
limitaremos a ciertas consideraciones previas relativas a algunas de sus propiedades
generales.
**
Demostremos ante todo que en el problema unidimensional ningún nivel energético del espectro discreto es degenerado. Para ello supongamos que así no fuera
y sean 1Pi y lp2 dos funciones propias distintas correspondientes a un mismo valor
de la energía. Dado que ambas satisfacen la misma ecuación (21.1) .tenemos:
o bien 1Pi" "h - lp2 " V'i = O (se representa con un apóstrofo la derivación respecto
de x). Jntegrando esta relación, éncontramos:
(21.2)
Dado que en el infinito ip1
=
1.J.'2
= O, la const. debe ser igual a cero, de forma que
o bien l.J.'r'.11f'i = v,2 ' /v,2 • Integrando de nuevo, obtenemos
en esencia ambas funciones coinciden.
1.j.J 1
=0
const. vi 2 , es decir,
Para las funciones de onda 1.J.' 11 (x) del espectro discreto se puede enunciar el
siguiente teorema (llamado teorema de oscilación): la función 1.J.' 11 (X) que corresponde al n + 1-ésimo valor propio, ordenados éstos en orden creciente, E11 , se anula
72
La ecuación de Schrodinger
(para valores finitos de x) n veces(1).
Supondremos que la función U(x) tiende a límites finitos para x -+ ± = (pero
no que deba ser función monótona). El límite U(-+-=) lo tomaremos como origen
de energí;-is (es decir, suponemos que U(+=) = O). y el límite U(- oo) Jo designaremos por U0 , suponiendo, además, que U0 '> O. El espectro discreto pertenece
al intervalo de valores de la energía para los que la partícula no puede escapar al
infinito; para ello la energía debe ser menor que ambos límites U( -:t =), es decir,
debe ser negativa:
(21.3)
E<O,
donde, claro está, en cualquier caso debe tenerse E> U111 ; 11 • es decir, la función
U(x) debe presentar por lo menos un mínimo con U111 í,, < O.
Consideremos ahora el intervalo de valores positivos de la energía menores
que U0 :
O< E< U0 .
(21.4)
En este intervalo el espectro será continuo y el movimiento de la partícula en los
correspondientes estados estacionarios será infinito, escapando la partícula hacia
x = + =. Es fácil ver que todos los valores propios de la energía en esta parte del
espectro son también no degenerados. Para ello basta observar que en la demostración anterior (correspondiente al espectro discreto) es suficiente que las funciones
"Pi, 1J)2 tiendan a cero aunque sólo sea en uno de los dos valores infinitos (en el presente caso tienden a cero para x ~ - oo).
Para valores de x positivos suficientemente grandes, se puede prescindir de U(x)
en la ecuación de SCHRODINGER (2 l. l):
¡//' +(2m/h2 )Eip
=
O.
Esta ecuación posee soluciones reales cuya forma es la de « ondas planas estaci onarias »:
ip
= a cos(kx+8),
(21.5)
donde a, ó son constantes y el « vector de onda» k = p/ñ = v(2mE)/li. Mediante
esta fórmula se determina la forma asintótica (para x -++ oo) de las funciones de
onda de los niveles energéticos no degenerados en el intervalo (21.4) del espectro
continuo. Para grandes valores negativos, la ecuación de -ScHRODlNGER es
if/' -(2m/n2 )( U0 -E)¡/J = O.
(1)
Si la partícula se puede encontrar sólo en un segmento finito del eje x, hay que hablar de ceros
de la función '1/'n(x) interiores a este segmento.
Propiedades generales del movimiento en una dimensión
La solución que no tiende a infinito para x
ifi
= beKX,
donde
K
=
~
-
oo
73
es
v[2m(Uo-E)]/li.
(21.6)
Esta es la forma asintótica de la función de onda para x ~ - oo. Así, pues, la función de onda se amortigua exponencialmente cuando penetramos en la región
en la que E < U.
Finalmente, para
(21.7)
el espectro será continuo, y el movimiento infinito en ambos sentidos. En esta parte
del espectro todos los niveles son doblemente degenerados. Esto se sigue de que las
correspondientes funciones de onda se determinan por la ecuación de segundo orden
(21.1) y de que las dos soluciones de esta ecuación independientes satisfacen las
condiciones en el infinito (mientras que, por ejemplo, en el caso anterior una de las
soluciones tiende a infinito para x ~ - oo y es necesario, por consiguiente, prescindir de ella). La forma asintótica de la función de onda para x ~+ = es
(21.8)
y análogamente para x ~ -
ºº· El término con eikx corresponde a una partícula
que se mueve hacia la derecha y el término con e-ikx a una partícula que se mueve
hacia la izquierda.
Supongamos que la función U(x) es par (U(- x) = U(x)). En tal caso, al cambiar el signo de la coordenada la ecuación de SCHRODINGER (21.1) no varía. Se sigue
de aquí que si 1p(x) es una solución de esta ecuación, también lo es ip(- x) y coincide con 1p(x) salvo un factor constante: lp(- x) = cip(x). Cambiando otra vez el
signo de x, obtenemos '!{'(x) = c 2 ip(x), de donde e= -- 1. Así, pues, cuando la
energía potencial es simétrica (respecto del punto x = 0) las funcione~ de onda
de los estados estacionarios pueden ser o pares ( lp(- x) = 1p(x)) o impares ( '!{'(- x) =
= - '!{'(X)) (1). En particular, la función de onda de] estado fundamental es par:
en efecto, dicha función no puede presentar nodos, y una función impar siempre
se anula para x = O( lp(Ü) = - lp(O) = O).
Para normalizar las funciones de onda del movimiento unidimensional (en el
espectro continuo) existe un método simple que permite determinar el coeficiente
de normalización directamente a partir de la expresión asintótica de la función
de onda para grandes valores de [x\.
(1) En estas consideraciones se supone que el estado estacionario no es degenerado, es decir, que
el movimiento no es infinito en ambos sentidos. En caso contrario, al cambiar el signo de x, dos funciones
de onda relativas al nivel energético dado pueden transformarse entre sí. Sin embargo, en este caso, las
funciones de onda de los estados estacionarios, aunque no son necesariamente pares o impares, siempre
se pueden elegir de forma que lo sean (mediante una elección conveniente de combinaciones lineales de
las funciones de partida).
74
La ecuación de Schrodinger
Consideremos la función de onda del movimiento infinito en un sentido, es
decir, de un estado estacionario del intervalo (21.4) del espectro continuo. La integral de normalización diverge para x-+ = (para x-+ - = la función decrece exponencialmente, de forma que la integral converge rápidamente). Por consiguiente,
en la determinación de la constante de normalización se puede substituir 1P por s.u
valor asintótico (para grandes valores x > O) y efectuar la integración eligiendo
como límite inferior un valor finito cualquiera x, por ejemplo el valor cero; esto
equivale a prescindir de una cantidad finita frente a otra infinitamente grande.
Demostremos que la función de onda normalizada según la función-b de p (el impulso de la partícula en el infinito) debe presentar la forma asintótica (21 .5) con
a = y'(2/,,,./i), es decir,
lfp
~
= y(l/21rli)[ei(kx+c,)+e-i(kx+B)].
y(2/1rli) cos(kx+o)
(21.9)
donde k. = p h.
Dado que no se trata de comprobar la ortogonalidad dos a dos de las funciones
que corresponden a valores distintos de p, al substituir las funciones (21,9) en la
integral de normalización J % *1P/ dx consideraremos impulsos p infinitamente
próximos; podemos así suponer ó = o'(ó es, en general, una función de p). Además,
en el integrando conservaremos solamente aquellos términos que divergen para
p = p'; con otras palabras. prescindiremos de términos que contienen los factores
e±t<k+k')x. Obtenemos así:
J ipp*lfp' dx = (l/21rli)
{
j é<k'-k)x dx+ Je-iW-k)x dx),
o
o
o bien, de otra manera,
J,J,p*,J,p' dx =
(1/21Tñj e<<k•-k)x clx.
Pero la integral así obtenida coincide con la integral de normalización para la función de onda del movimiento libre
lfp = (21rñ)-lf2eikx,
(21.10)
normalizada según la función-o del impulso (cf. (15.8)).
El paso a la normalización según la función-o de la energía se efectúa de acuerdo
con (5.14), multiplicando '1/Jp por dp/dE= 1/V~v es la velocidad). Así, para el
movimiento libre tenemos:
V
lf E = (21rñv)-lf2eikx,
(21.11)
Observemos que la densidad de corriente de probabilidad en esta onda es igual a
(21.12)
Dividiendo la función (21.9) por
Vv y teniendo
en cuenta la igualdad (21.12),
75
El pozo de potencial
podemos formular la siguiente regla para la normalización de la función de onda
del movimiento infinito en un sólo sentido respecto de la función-<5 de la energía:
una vez representada la expresión asintótica de la función de onda como suma
de dos ondas planas que se mueven en sentidos opuestos, hay que elegir el coeficiente de normalización de tal manera que la densidad de corriente de probabilidad
en la onda que se mueve hacia el origen de coordenadas (o que se aparta de este
origen) sea igual a Ií2 nli.
De manera análoga se puede obtener la regla para la normalización de las funciones de onda del movimiento infinito en ambos sentidos. La función de onda
estará normalizada respecto de la función-ó de la energía si la suma de las corrientes
de probabilidad en las ondas que se mueven hacia el origen de coordenadas a lo
largo de los semirrayos negativo y positivo del eje x es igual a 1/2 nli.
§ 22.
El pozo de potencial
Como ejemplo simple de movimiento en una dimensión consideremos el movimiento en un pozo de potencial unidimensional de forma rectangular, es decir, en el
campo caracterizado por la función U(x) representada en la fig. 1: U(x) = O para
O < x < a, U(x) = U0 para x < O, > a. Es desde luego evidente que para E < U0
el espectro será discreto y que para E> U0 se tiene un espectro continuo cuyos
niveles son doblemente degenerados ..
x
En el dominio O < x
< a tenemos la ecuación de Schrodinger
1//' +(2m/li2 )Eif¡ = O
(22.1)
(el apóstrofo designa la derivación respecto de x), y en la región exterior al pozo
se tiene:
if¡" +(2m/n2 )(E-U0 )ip = O.
(22.2)
Para x = O, a, las soluciones de estas ecuaciones deben enlazarse de manera continua
al igual que sus derivadas primeras, y para x = ± oo la solución de la ecuación
(22.2) debe conservarse finita (para el espectro discreto, cuando E < U0 , debe tender
a cero).
U{x)
o
FIG. 1
X
76
La ecuación de Schrodinger
Para E< U0 , la.solución de la ecuación (22.2) que tiende a cero en el infinito es
'P =constantexe=fKX,
donde
K
= v[(2m/n2 )(Uo-E)];
(22.3)
(los signos - y + en el exponente se refieren, respectivamente, a los dominios
x > a y x < O). La probabilidad lv-'12 de encontrar la partícula decrece exponencialmente al penetrar en el dominio en el que E < U(x). En vez de la continuidad de
1P y '1/J' en la frontera del pozo de potencial, es conveniente imponer la continuidad
de 1P y de la derivada logarítmica '1/J' / "P· Teniendo en cuenta (22.3), obtenemos la
condición de contorno en la forma:
(22.4)
No nos entretendremos aquí en determinar los niveles de energía en un pozo de
profundidad arbitraria U0 (véase el problema 2) y analizaremos tan sólo el caso
límite en que las paredes del pozo son de altura infinita ( U0 ~
=).
=
Para U0 =
el movimiento se efectúa solamente en el segmento limitado por
los puntos x = O, y x = a y, conforme se indicó en el § 18, la condición de contorno en estos puntos debe ser:
'P = o.
(22.5)
(Es fácil ver que esta condición se obtiene también a partir de la condición general
(22.4). En efecto, para U0 ~ = tenemos asimismo :,,e ~ = y por ello v,,' / 1P ~ =;
dado que '1/J' no puede hacerse infinita, de aquí se sigue que 1P = O.) Busquemos la
solución de la ecuación (22.1) dentro del pozo en la forma:
(22.6)
ip = csen(kx+S), donde k = v(2mE/n 2 ).
La condición 1P = O para x = O nos da <5 = O, con lo cual la misma condición
en x = a da sen ka = O, de donde ka = nn (n es un número entero positivo, mayor
o igual que la unidad (1)) o
bien
(22.7)
Mediante esta fórmula se determinan los niveles de la energía de una partícula en
el pozo de potencial. Las funciones de onda normalizadas de los estados estacionarios son
'Pn =
v(2/a)sen(1rnx/a).
(22.8)
Basándonos en estos resultados es posible escribir sin más los niveles de energía
de una partícula en una « caja de potencial » tridimensional rectangular, es decir,
para el movimiento en tres dimensiones en un campo carácterizado por la energía
potencial U = O para O < x < a, O < y < b, O < z < e y U =
fuera de este
dominio. Estos niveles vienen determinados precisamente por las sumas
=
(1)
Para n = O se obtendría la identidad
tp
== O.
77
El pozo de potencial
En n.n
1
"
7r2fi2 (ni2
a
= -2m
-
n22 na2)
--+-+(n1, n2, n3 =
a2
b2
,2
1, 2, 3, ... ),
(22.9)
y las correspondientes funciones de onda por los productos
"1n 1 n 2n =
ª
8
7Tn¡
7Tn2
1Tn3
-sen-xsen-ysen-z.
J
abe
a
b
e
(22.10)
Observemos que la energía del estado fundamental resulta ser, de acuerdo con
(22.7) o (22.9), del orden de E 0':"li 2/m/2, donde l representa las dimensiones lineales
del dominio en que se efectúa el movimiento de la partícula. Este resultado concuerda
con las relaciones de indeterminación: para una indeterminación de una coordenada ,_, l, la indeterminación del impulso, y con ella el orden de magnitud del pro-·
pio impulso, es-li/l.; la energía correspondiente resulta ser -(li/l)2/m.
PROBLEMAS
1. Determinar la distribución de probabilidad de los diferentes valores del impulso en el
estado normal de una partícula que se encuentra en un pozo de potencial rectangular (unidimensional) de profundidad infinita.
Solución. Los coeficientes a(p) del desarrollo de la función lJ'1 (22.8) en funciones propias del
impulso (21.10) son iguales a:
a(p)
=
f
if, 11*'if,1 dx =
1
v'(1rali)
f
a
sen(~ax)e-<if'll)Px dx.
o
Calculando la integral y elevando al cuadrado su módulo, obtenemos la distribución de probabilidades buscada:
4-rrli3a
pa
2
2
la(p)l -- (p2a2-1r2li2)2 cos -2ñ'
2.
Determinar los niveles de energía para el pozo de potencial representado en la fig. 2.
Solución. El espectro de energías E < U1 es discreto, y es precisamente éste el que consideraremos. En la región x < O la función de onda es
y en la región x
> a
Dentro del pozo (O < x < a) escribiremos
'1./J
if, = csen(kx+S),
en la forma
donde
k=v'(2mE/li2 ).
La ecuación de Schrodinger
78
La condición de continuidad de 1JJ'111' en las fronteras del pozo da las ecuaciones
kctg 8
=
K1
= v'[(2m/li2)U1 -k2], k ctg(ka+8) =
- K2
= -v'[(2m/li2)U2-k2 ],
o bien
=
sen8
kli/v'(2mU1 ), sen(ka+8)
=
-kli/v'(2mU2)·
Eliminando <5, obtenemos la ecuación transcendente
ka= n-rr- arcsen[kli/v'(2mU1) ] - arcsen[kli/v'(2mU2)]
(1)
(donde n = 1, 2, 3, ... y los valores de arcsen se toman entre O y n/2), cuyas raíces determinan
los niveles de energía E= k 1 1i1/2m. Para cada valor den se tiene, en general, una raíz; los valores n numeran los niveles en orden creciente de energías.
U(x)
- - -... U1
a
)(
Fm.2
Dado que el argumento del arcsen no puede ser mayor que 1, es claro que los valores de k
pueden pertenecer sólo al intervalo entre O y,V(2mU1 /li 2).El primer miembro de la ecuación (1)
es función monótona creciente de k, y el segundo, función monótona decreciente. Por consiguiente,
para que exista una raíz de la ecuación (1) es necesario que parak = V(2mU1 /li2)el segundo miembro sea menor que el primero. En particular, la desigualdad
(2)
que se obtiene para n = 1 es la condición para que en el pozo exista por lo menos un nivel energético. Vemos así que para valores dados U1 =:/= U2 existen siempre valores d1! la anchura a del
pozo tan pequeños que no existirá ni un solo nivel discreto de la energía. Cuando U1 = U2, la condición (2) se cumplirá siempre, evidentemente.
Para U 1
=
U2
=
U0 (pozo simétrico) la ecuación (1) se reduce a
arcsen[lik/y'(2mU0)] = -!(nTr-ka).
Introduciendo la variable
~ = kaf 2.
cos
(3)
obtenemos para n impar la ecuación
f = ±rf,
donde
y= (li/a)y'(2/mU0 ),
(4)
de la que hay que tomar aquellas raíces para las que tg; > O. Para n par, obtenemos la ecuación -
senf
= ±r,,
(5)
y hay que elegir las raíces para las que tg ~ < O. De las raíces de estas dos ecuaciones se deducen
los niveles energéticos E= 2;2h2/ma2, y el número de niveles (para y =f=. O) es finito.
79
El oscilador lineal
En particular, para un pozo no profundo, en el que U0 ~ h2/ma 2, tenemos y ~ 1 y la ecuación (5) no tiene ninguna raíz. La ecuación (4), en cambio, tiene una raíz (para el úgno superior
en el segundo miembro), raíz.; r,.; 1/y (1 - 1/2y2). En este pozo de potencial se tiene así únicamente
un nivel energético
Eo
~
Uo-(ma 2/2ñ 2 )Uo2,
situado cerca de su «boca».
3. Determinar la presión que ejercen sobre las paredes de una « caja de potencial» rectangular tridimensional las partículas que se encuentran en ella.
Solución. La fuerza que se ejerce sobre la pared perpendicular al eje x es igual al valor medio
de la derivada - 8H/8a de la función de Hamilton de la partícula respecto de la longitud del pozo
a lo largo del eje x; la presión, por su parte, se obtiene dividiendo esta fuerza por la superficie be
de la pared. Según la fórmula obtenida en el problema del§ 11, el valor medio buscado se encuentra
derivando el valor propio de la energía (22.9). En consecuencia, para la presión se obtiene
§ 23.
El oscilador lineal
Consideremos una partícula que efectúa oscilaciones pequeñas en una dimensión
(el llamado oscilador lineal). La energía potencial de esta partícula es igual, conforme
es sabido, a mw2x 2/2, donde w es, en mecánica clásica, la frecuencia propia (cíclica)
de las oscilaciones. De acuerdo con esto, el hamiltoniano del oscilador será
(23.1)
Dado que la energía potencial tiende a infinito cuando x = ± oo y que su valor
mínimo (para x = O) es nulo, en virtud de las reglas generales es desde luego evidente
que el espectro energético del oscilador será discreto con valores positivos de la
energía.
Determinemos los niveles de la energía del oscilador siguiendo el método matricial (1). Partiremos de las « ecuaciones del movimiento» en la forma (19.3); en el
presente caso dan:
~+w2x =
O.
(23.2)
En forma matricial esta ecuación es:
(X)mn+w 2 Xmn = 0.
Para los elementos de matriz de la aceleración tenemos, según (11.8), (x)mn
(1) Éste fue el método seguido por
onda por ScHRODINGER.
HEISENBERG
=
(1925) antes del descubrimiento de la ecuación de
80
La ecuación de Schrodinger
De aquí se sigue que todos los elementos de matriz Xmn son nulos salvo aquéllos
para los que wmn = ± w. Numeremos los estados estacionarios de tal manera que
las frecuencias ± w correspondan a las transiciones n -+ n =f 1, es decir, wn,n=rt =
= ± w. En tales condiciones, serán diferentes de cero tan sólo los elementos de
matriz Xn,n±I·
·supondremos que las funciones de onda 1Pn se han elegido reales. Dado que x
es una magnitud real, también serán reales todos los elementos de matriz Xmn· La
condición de hermiticidad (11.10) conduce ahora a que la matriz Xmn sea simétrica:
Para calcular los elementos de matriz de la coordenada diferentes df' cero utilizaremos la regla de conmutación
&x-x&
=
-ih/m,
escribiéndola en forma matricial:·
Mediante la regla de multiplicación de matrices (11.12), obtenemos de aquí para
m =n
i
~ (WnlXnzXzn - XnzwznXzn) = 2i ~ wnzXn1 2 = - ili/m.
l
l
En esta suma los únicos términos no nulos son aquéllos para los que l
de forma que se tiene:
=
n
±
1,
(23.3)
,n) 2
De esta igualdad se deduce que las cantidades (x11 +1
forman una progresión aritmética que crece sin límites, pero necesariamente acotada inferiormente, ya
que en ella pueden figurar solamente términos positivos. Dado que hasta aquí
hemos fijado solamente el orden relativo de los números de los estados n, pero no
sus valores absolutos, podemos elegir arbitrariamente el valor n correspondiente
al primer estado - el normal - del oscilador. Elijámoslo igual a cero. Según esto,
x0,_1 debe considerarse idénticamente nulo, y la aplicación sucesiva de las ecuaciones (23.3) con n = O, 1, ... conduce al resultado
(xn,n-1) 2
= nn/2mw.
Obtenemos así finalmente la siguiente expresión para los elementos de matriz de la
coordenada diferentes de cero (1):
(1) Elegimos las fases indeterminadas x,1 (véase la nota de la pág. 37) de tal manera que para todos
los elementos de matriz (23.4) se obtenga el signo + delante de la raíz. Esta elección es siempre posible
para una matriz en la que son diferentes de cero únicamente los elementos que representan transiciones
entre estados consecutivos.
81
El oscilador lineal
Xn,n-1
=
Xn-1,n
= y(nn/2mw).
(23.4)
La matriz del operador .íi es diagonal y los elementos de ·matriz H nn constituyen
los valores propios buscados de la energía En, del oscilador. Para calcularlos escribamos:
H,m = En = }m[(x2)nn+w2(x2)nn]
= }m[
=im
t' Ü»niXn¡iWznXzn+w2 f XnlX¡n]
r (w2+wnz2)xzn2·
En la suma respecto de l son diferentes de cero sólo los términos con l
substituyendo (23.4), obtenemos:
En = (n+!)ñw,
n
= O, 1, 2, ....
=
n
± 1;
(23.5)
Los niveles de energía del oscilador aparecen así distribuidos a intervalos íguales
hw uno del otro. La energía del estado normal (n = O) es igual a ltw/2; subrayemos
que esta energía resulta ser no nula.
El resultado (23.5) se puede obtener también resolviendo la ecuación de ScHR~
DINGER.
Para un oscilador, esta ecuación tiene la forma
d 2if, 2m
-+-(E-!mw2x2)ip
dx2 2
n
=
O.
(23.6)
Conviene aquí introducir en vez de la coordenada x la variable sin dimensiones;
definida por la relación
g = v(mw/ñ)x.
(23.7)
ip" + [(2E/ñw)-f 2 ]ip = O;
(23.8)
Obtenemos entonces
(El apóstrofo designa aquí la derivación respecto de t)
Para grandes valores de; se puede prescindir de 2E/ ñw frente a ; 2 ; la ecuación
1P" = ;21/J tiene las integrales asintóticas ,¡, = eHt• (la derivación de esta función
da, en efecto, prescindiendo de términos de orden inferior respecto de;, 1/J" = ; 21Jl).
Dado que la función de onda 1P debe conservarse finita para ~ = ± oo, en el exponente se debe elegir el signo menos. Debido a ello es natural efectuar en la ecuación
(23.8) la substitución
(23.9)
Para la función x(;) obtenemos la ecuación (se ha introducido la notación(2E/ ñw)
-1 = 2n; dado que, conforme sabemos ya, E> O, se tiene n > - !)
82
La ecuación de Schrodinger
o,
x"-2fx'+2nx =
(23.10)
donde la función x debe conservarse finita para todos los valores finitos de ~ y para
± oo puede tender a infinito, pero no más rápidamente que una potencia
finita de ~ (de modo que la función 1P tienda a cero).
~~
Tales soluciones de la ecuación (23.1 O) existen solamente para valores enteros
y positivos den (incluido el valor cero, véase el§ a de los apéndices matemáticos);
esto da para la ·energía los valores propios ya conocidos (23.5). Las soluciones de la
ecuación (23.10) que corresponden a los distintos valores enteros den son: x = const.
Hn(~), donde Hn(~) son los llamados polinomios de Hermite, que son los polinomios
de grado n respecto de ; definidos por la fórmula
(23.11)
Determinando la constante de manera que las funciones 'f/J,z satisfagan la condición de normalización
co
f if,,. (x) dx = 1,
2
-co
obtenemos (véase (a, 7))
if,,¡{:Jc) =
mw)l/4 1
(-'TT'li 2n/2y'(n!) e-mwxa¡211,Hn(xy'[mw/li]).
(23.12)
Así, pues, la función de onda del estado normal es
if,0(x) = (mw/1rli)114e-mwx:f211,.
(23.13)
Como debe ser, esta función carece de ceros para valores de x finitos.
Calculando las integrales
J'Pn'Pmf df,
se pueden determinar los elementos de
matriz de la coordenada; dicho cálculo conduce, claro está, a los mismos valores
(23.4).
Para terminar, demostraremos cómo es posible calcular las funciones de onda
'f/Jn siguiendo el método matricial. Observemos que en las matrices de los operadores
l ±iwx, son no nulos únicamente los elementos
(x-zwx)n-1,n = -(x+iwx)n,n-1
= -iv(2wlin/m).
Partiendo de la fórmula general (11.11) y teniendo en cuenta que 'f/J-i
a la conclusión de que
(1-iwx)if,0 = O.
(23.14)
= O, llegamos
83
El oscilador lineal
Después de substituir la expresión .t = -i(li/m)o/ox, de aquí se obtiene la ecuación
oif,a/ox = -(mw/li)xif,a,
cuya solución normalizada es (23.13). Además, dado que
(.t+iwx)if,n- 1 = (x+iwx)n,n-ilpn
obtenemos la fórmula recurrente
=
iy(2wlin/m)if,n,
cuya aplicación reiterada n veces a la función (23.13) conduce a la expresión (23.12)
para las funciones normalizadas 1/Jn·
PROBLEMAS
1. Determinar la distribución de las probabilidades de los diferentes valores del impulso para
un oscilador.
Solución. En vez de desarrollar la función de onda de un estado estacionario en funciones
propias del impulso, en el caso de un oscilador es más sencillo partir directamente de la ecuación
de Schrodinger en la « representación-p ». Substituyendo en (23.1) el operador coordenada (15.12)
= ilio/op obtenemos el hamiltoniano en la « representación-p »:
*
La correspondiente ecuación de Schrodinger lia(p)
representación-p es
= Ea(p)
para la función de onda a(p) en la
d2a(p)
2 (
p2)
-.-+-E-- a(p) =
2 2
2
dp
mw ñ
2m
O.
Esta ecuación es exactamente de la misma forma que la (23.6); por ello sus soluciones se pueden
escribir directamente por analogía con (23.12) (substituyendo en esta fórmula xv (mw/ li) por
Plv(mwli)). Encontramos así la distribución de probabilidades buscada:
2. Determinar el límite inferior de los posibles valores de la energía de un oscilador mediante
la relación de indeterminación (16.8a).
Solución.
Para el valor medio de la energía del oscilador tenemos
84
La ecuación de Schrodinger
o bien, utilizando la relación (16.8a):
E > (!lp) 2/2m+mw 2h2/8(!lp)2.
Determinando el valor mínimo de esta expresión (considerada como función de (.:\p)2), encontramos
el límite inferior de los valores medios de la energía y, por consiguiente, también de todos los valores posibles de la misma:
E
>iñw.
3. Determinar los niveles de energía de una partícula que se mueve en un campo caracterizado
por la energía potencial
(fig. 3; P. M. MORSE).
Solución. El espectro de valores propios positivos de la energía es continuo (con niveles no
degenerados) y el espectro de valores negativos es discreto.
uM
-A
FIG. 3
La ecuación de
SCHRODINGER
es:
Introduzcamos la nueva variable
g=
2y'(2mA)
e-ax
(1..ñ
(que toma valores entre Oe oo) y la notación (consideramos el espectro discreto, de modo que E< O)
s = v'(-2mE)/~, n = v'(2mA)/(1..ñ-(s+!).
La ecuación de
ScHRODINGER
(1)
adopta entonces la forma
1
(
n+s+}
if/'+-:.if/+ -1+--
e
s2).¡,=o.
g2
'
Para~-+ oo la función tp se comporta asintóticamente como e±;/2, y cuando ~-+O es proporcional
a ~±s. Por consideraciones de finitud, hay que elegir la solución que se comporta como e-;/2 para
85
El oscilador lineal
~ ~ oo
y como
~s
para
~~
O. Efectuemos la substitución
con lo que se obtiene para w la ecuación
fw"+(2s+l-f)w'+nw
= O,
(2)
que debe resolverse con las condiciones siguientes: w es finita para ~ = O, y cuando ~ ~ oo, w tiende
a infinito no más rápidamente que una potencia finita de t La ecuación (2) es la ecuación de una
función hipergeométrica confluente (véase § d de los apéndices matemáticos):
w
= F(-n, 2s+l, f).
La solución que satisface la condición impuesta se obtiene para valores enteros no negativos de n
(caso en que la función F se reduce a un polinomio). De acuerdo con las definiciones (1), obtenemos, por consiguiente, para los niveles de energía los valores
-En
=
ttn
[
A 1 v(ZmA)(n+!)
]2,
donde n recorre los valores enteros positivos a partir de cero y hasta el valor máximo para el cual
todavía es
v'(2mA)/a.ñ
> n+ l
(de modo que el parámetro s, de acuerdo con su definición, es positivo). El espectro discreto contiene así una sucesión finita de niveles. Si
v'(2mA)Ja.ñ
< t,
no existe espectro discreto.
U(x)
-Uo
FIG. 4
4.
El mismo problema que en el caso anterior, pero con U = - U0 /cosh 2 ttx (fig. 4).
Solución. El espectro de energías positivas es continuo y el de energías negativas es discreto;
consideremos este último. La ecuación de ScHRÓDINGER es
d2iµ 2m(
U
-+E+
2
dx n
cosh2ttX
0
2
)
ip=O.
86
La ecuación de Schrodinger
Efectuemos el cambio de variable
€
=
~
= tgh a:x; introduciendo la notación
y'(-2mE)/ñr1.,
s=
2mU0 /r1.2n2 = s(s+ 1),
t(-1+ J[1+ ::~·]).
obtenemos:
dip] + [ s(s+ 1)- -€2-] ip = O.
-d [ (1-g2)-
dg
dg
1-t2
Esta es la ecuación de las funciones de Legendre asociadas. Llevémosla a la forma hipergeométrica mediante la substitución ,p=(l -~2)Ef 2 w(f)y con el cambio provisional de variable i(J~)=u:
u(l-u)w" +(€+ 1)(1-2u)w' -(€-s)(€+s+ l)w
= O.
La solución finita para ~ = 1 (es decir, para x = =), es
Para que 'P se conserve finita también para~ = -1 (es decir, para x = - =), debe ser «-s = -n,
donde n = O, 1, 2, ... (Fes entonces un polinomio de grado n, finito para~ = -1).
Los niveles de energía se determinan así por la condición s - ~ = n. de donde
En= -1t2r1.2
- [ -(1+2n)+
8m
J(
8mUº)]2
1+
-.
rJ.21t2
Existe un número finito de niveles determinado por la condición « > O, es decir, n < s.
§ 24.
Movimiento en un campo homogéneo
Consideremos el movimiento de una partícula en un campo exterior homogéneo. Elegiremos la dirección del campo como eje x y sea F la fuerza que el campo
ejerce sobre la partícula; en un campo eléctrico de intensidad E, esta fuerza es F = eE,
donde e es la carga de la partícula.
La energía potencial de la partícula en un campo homogéneo es de la forma
U= - Fx+const.; eligiendo la constante de forma que sea U= O para x = O,
tenemos U = - Fx. La ecuación de ScHRODINGER del problema en cuestión es de
la forma
d 2¡/J/dxª+(2m/li2)(E+Fx)ip = O.
(24.1)
Dado que U tiende a + = para x -+ - = y U-+ - oo para x -++ =, es evidente, sin más, que los niveles de energía forman un ,espectro continuo que cubre
todo el intervalo de valores de la energía E, desde - oo a + =. Ninguno de estos
valores propios es degenerado y corresponden a un movimiento que es finito en el
sentido x = - = e infinito en el sentido x = + oo.
Movimiento en un campo homogéneo
87
Introduzcamos en vez de la coordenada x la variable sin dimensiones
, = (x+EJF)(2mFJ/i2)11a.
(24.2)
La ecuación (24.1) toma entonces la forma
rfl'+,if, = o.
(24.3)
Esta ecuación no contiene ya el parámetro energía. Por consiguiente, si hallamos
la solución que satisface las condiciones necesarias de finitud, habremos con ello
obtenido la función propia correspondiente a valores arbitrarios de la energía.
La solución de la ecuación (24.3) que es finita para todo valor de x tiene la forma
(véase § b de los apéndices matemáticos):
if,(f) = A<I>( -,),
(24.4)
donde
es la llamada función de Airy y A es un factor de normalización que determinaremos
más adelante.
Para ; --+ - oo la función 1J)(;) tiende a cero exponencialmente. U na expresión
asintótica, que determina a 1J)(;) para valores negativos de; grandes en valor absoluto,
tiene la forma (véase (b, 4)):
if,(,) ~
A
--exp[-il,lª/2].
2¡,¡114
(24.5)
En cambio, para grandes valores positivos de ;, una expresión asintótica de la función 1J)(fl es la siguiente (véase (b, 5)) (1):
ip(,) = Ag-1 14 sen(¡g3 12 +f1T),
(24.6)
Según la regla general (5.4) de normalización de las funciones propias del espectro
continuo, normalizaremos las funciones (24.4) respecto de la función-c5 de la energía,
de forma que:
_Í'P(f),f,(f) dx = 3(E'-E).
(24.7)
En el§ 21 se indicó un método sencillo para determinar el coeficiente de normaliza(1) Observemos, adelantando ideas, que las expresiones asintóticas (24.5) y (24.6) corresponden precisamente a las expresiones cuasiclásicas de la función de onda (47.1) y (47.4a).
La ecuación de Schrodinger
88
ción mediante la expresión asintótica de las funciones de onda. Siguiendo este mé. todo, representemos la función (24.6) como suma de dos ondas móviles:
if,(g)
~
}Ag-1¡4 exp(i(fg3¡2_t,r ])+¡Ag-1¡4 exp(-i[fg3¡2_VT ]).
La densidad de corriente de probabilidad
estos dos términos, debe ser igual a
y[2(E+Fx)/m](A/2g114 ) 2
=
(v]1f'\ 2),
calculada mediante cada uno de
A 2 (2ñF)1 13/4m2 / 3
= 1/2TTñ,
de donde se sigue:
(2m)l/3
A= 7rl /2FI /6/;,2 /3 .
(24.8)
PROBLEMA
Determinar las funciones de onda en la representación-p para una partícula en un campo
homogéneo.
Solución.
El operador hamiltoniano en la representación-p es
H = p2/2m-iñF a¡ap,
de modo que la ecuación de Schrodinger para la función de onda a(p) tiene la forma:
(p2 )
. da
-iñF-+ --E a= O.
dp
2m
Resolviendo esta ecuación, obtenemos las funciones buscadas
Estas funciones se normalizan de acuerdo con la condición
J
OC)
aE*(p)aE·(P) dp
§ 25.
=
8(E' -E).
Coeficiente de transmisión
Consideremos el movimiento de partículas en un campo del tipo representado
en la fig. 5: U(x) crece con monotonía desde un límite constante ( U = O para x -+ - oo) a otro (U= U0 para x -++ oo). Según la mecánica clásica, una partícula
con energía E< U0 que se mueva en un campo de estas características de izquierda
a derecha, al llegar al muro de potencial « es reflejada » por éste, comenzando a moverse en sentido opuesto; si, en cambio E> U0 , la partícula sigue moviéndose en el
sentido inicial con menor velocidad. En mecánica cuántica encontramos un nuevo
movimiento: incluso para E> U0 la partícula puede « ser reflejada» por el muro
Coeficiente de transmisión
89
de potencial. La probabilidad de reflexión debe calcularse, en principio, de la siguiente manera.
Supongamos que la partícula se mueve de izquierda a derecha. Para grandes
valores positivos de x, la función de onda debe representar una partícula que ha
pasado por « encima del muro » y que se mueve en el sentido positivo del eje x,
es decir, debe tener la forma asintótica:
parax
~ co,
if,
~ Aeik1 x,
donde k 2
=
(1/li)v[2m(E- U0 )]
(25.1)
(A es una constante). Para hallar la solución de la ecuación de Schrodinger que
FIG. 5
satisface a esta condición en el límite, calculemos la expresión asintótica cuando
x ~ - oo; esta es una combinación lineal de las dos soluciones de la ecuación
del movimiento libre, es decir, tiene la forma
(25.2)
El primer término corresponde a una partícula que incide sobre el « muro »
(suponemos que 'IJ) está normalizada de tal manera que el coeficiente de este término
es igual a la unidad); el segundo término, en cambio, representa una partícula
reflejada por el mismo. La densidad de corriente de probabilidad que corresponde
a la onda incidente es proporcional a k 1, la que corresponde a la reflejada es k1 \B\ 2 ,
mientras que a la transmitida corresponde k 2 ]A[ 2 • Definiremos el coeficiente de
transmisión D de la partícula como razón de la densidad de corriente de probabilidad en la onda transmitida a la densidad de corriente en la onda incidente:
(25.3)
Análogamente, se puede definir el coeficiente de reflexión R como razón de la densidad de corriente reflejada a la incidente; es evidente que R = 1 - D:
R=
IBl 2 =
l-(k2/k1)IAl 2
(25.4)
(esta relación entre A y B se cumple automáticamente).
Si la partícula se mueve de izquierda a derecha con energía E < U0 , el factor k 2
es imaginario puro y la función de onda disminuye exponencialmente para x ~+ oo.
La corriente reflejada es igual a la incidente, es decir, tiene lugar una « reflexión total »
90
La ecuación de Schrodingt!r
de la partícula en el muro de potencial. Subrayemos, sin embargo, que en este caso
la probabilidad de encontrar la partícula en la región donde E < U es con todo diferente de cero, aunque disminuye rápidamente al aumentar x.
En el caso general de un estado estacionario arbitrario (de energía E> U0)
la forma asintótica de la función de onda, tanto para x -+ - oo como para x -+ + oo,
es suma de dos ondas que se propagan en ambos sentidos a lo largo del eje x:
if,
= A 1eik1x+B1e-tk1x
para
x
~
-oo,
if,
= A 2etk2x
+ B 2e-tk2x
para
x
~
+oo.
(25.5)
Dado que estas dos expresiones son las formas asintóticas de una misma solución
de una ecuación diferencial lineal, entre los coeficientes A1, B1 y A2 , B 2 existe una
relación lineal. Sea A 2 = ~A1 +f3B1 , donde ~, /3 son constantes (en general complejas) que dependen de la forma concreta del campo U(x). Una relación análoga se
puede entonces escribir para B 2 basándose en consideraciones ligadas con el carácter real de la ecuación de SCHRODINGER. En virtud de esta última, si 1P es una solución
de una ecuación de SCHRODINGER dada, también la función conjugada compleja
1/J* es solución de la misma ecuación. La forma asintótica
if,•
= Ai•e-tk1x+Bi•etk1x
para
x
if,• = A 2•e-ik2x+B2•etk2x
para
x ~
~
_ oo,
+ oo
difiere de (25.5) tan sólo en la notación adoptad3: para los coeficientes constantes;
tenemos por ello B 2* = ~B1*+/3Ai* o B 2 = ~*B1 +/3*A 1• Así, pues, los coeficientes
que aparecen en (25.5) están ligados entre sí por relaciones de la forma
(25.6)
La condición de que la corriente de probabilidad sea constante a lo largo del
eje x conduce a la relación entre los coeficientes de (25.5)
k1(IA11 2-IB11 2) = k2(1A21 2-IB2\ 2).
Expresando aquí A 2 , B2 en función de A1, B 1 según (25.6), obtenemos:
locl 2-liBl 2 = k1/k2.
(25.7)
Mediante las relaciones (25.6) es posible, en particular, demostrar que los coeficientes de reflexión son iguales (para una energía dada E> U0 ) en el caso de partículas que se mueven en el sentido positivo o en el sentido negativo del eje x. En
efecto, obtenemos el primer caso haciendo en las funciones (25.5) B2 = O, y el segundo, tomando A1 = O. Los correspondientes coeficientes de reflexión son
IB1/A1l 2 = li8•/oc•l 2,
= !A2/B2\ 2 = 1 ~/oc j2,
R1 =
R2
91
Coeficiente de transmisión
de donde resulta, evidentemente, que R1 = R 2 •
PROBLEMAS
1. Determinar el coeficiente de reflexión de una partícula por un muro rectangular de potencial (fig. 6); energía de la partícula, E > U0 •
Solución.
En toda la región x > O la función de onda tiene la forma (25.1), y en la región
y B se determinan a partir de la condición de continuidad
x < O, la forma (25.2). Las constantes A
de 1P y d1JJ/dx para x = O:
de donde
El coeficiente de reflexión (25.4) (1) es:
Para E= U0, (k2 = O), R se reduce a la unidad, y para E-+ oo, tiende a cero como R = (U0/4E) 2•
2. Determinar el coeficiente de transmisión de una partícula a través de una barrera rectangular de potencial (fig. 7).
uCx>
uº.,_______
a
X
FIG. 6
FIG. 7
Solución. Sea E > U0 y supongamos que la partícula incidente se mueve de izquierda a derecha. Tenemos entonces para la función de onda en las· diferentes regiones expresiones de la forma:
< O,
para O< x <
para x > a,
para x
a, if, = Beik•x+B'e-ik.x,
if,
= Ceik/i;
(1) En el caso límite de la mecánica clásica el coeficiente de reflexión debe anularse. La expresión
obtenida, sin embargo, no contiene la constante cuántica. Esta aparente contradicción se explica de la
siguiente manera. El límite clásico corresponde al caso en que la longitud de onda de De Broglie de la
partícula A"" h/p es pequeña respecto de las dimensiones características que aparecen en el problema,
es decir, respecto de las distancias para las que cambia de manera apreciable el campo U(x). Pero en el
ejemplo esquemático considerado, esta distancia es igual a cero (se reduce al punto x = O), con lo que no
es posible llevar a cabo el paso al límite.
La ecuación de Schrodinger
92
( en la región x > a debe existir tan sólo la onda transmitida, que se propaga en el sentido positivo del eje x). Las constantes A, B, B', C se determinan a partir de las condiciones de continuidad
de '1/J y d'I/J/dx en los puntos x = O, a. El coeficiente de transmisión se determina mediante la relación D = k1 IClª/k1 = fCl 2• El cálculo conduce al siguiente resultado:
2
4k¡ kz2
]) = ~~~~~~~~~~~
(k1 2 -kz2) 2 sen2ak 2 +4k12kz2
Para E < U0 , k 2 es una cantidad imaginaria pura; las correspondientes expresiones para D
se obtienen substituyendo k 2 por i-x 2 , donde li1<1 = v[2m( U O-E)]:
3. Determinar el coeficiente de reflexión de una partícula por un muro de potencial definido
por la fórmula U(x) = U0 /(1 +e-cxx) (fig. 5); energía de la partícula E> U0 •
Solución.
La ecuación de
ScHRÓDINGER
2
es:
2m(
d ¡/J
dx2 + 1t2 E
Hemos de encontrar la solución que para Jll.,,-+
ip
+ oo
= constante x
tiene la forma:
eik.x.
-Introduzcamos una nueva variable
(que toma valores entre - oo y O) y busquemos una solución de la forma:
donde w(;) tiende a una constante para;-)> O (es decir, para
ecuación de tipo hipergeométrico:
X-'?
oo).
Para w(;) obtenemos una
f(1-f)w''+(1-2ik 2 /r¡..)(1-f)w'+(kl-ki2)w/rJ. 2 = O,
que tiene por solución la función hipergeométrica
(no hemos escrito el factor constante). Cuando
la condición impuesta.
;-'?
O esta función tiende a 1, es decir, satisface
La forma asintótica de la función ip para;-'? - oo (es decir, x----+- oo) es (1):
(1) Véase la fórmula (e, 6); en cada uno de los dos sumandos hay que tomar sólo el primer término
del desarrollo, es decir, substituir las funciones hipergeométricas de 1/z por la unidad.
93
Coeficiente de transmisión
donde
f(-i(k1 +k2)/rt.)f(-i(k1 +k2)/rt.+ 1)'
C2
f(2ik1/rt.)f(-2ik2/rt.+ 1)
=
.
f(i(k1-k2)/rt.)r(i(k1-k2)/rt.+ 1)
El coeficiente de reflexión buscado es R
=
f(x+ 1) = xf(x),
¡c ;c
2
2
1\ ;
el cálculo mediante las conocidas fórmulas
f(x)f(l-x) = Trjsen TrX,
conduce al resultado
Para E
=
U0 , (k 2
=
O), R se reduce a la unidad y para E-+
R =
= tiende a cero de acuerdo con la ley
2
7TUo ) -e-47T\f'(2mE)fal't.
2m
__
( rt.ñ
E
Al pasar al límite de la mecánica clásica, R se reduce a cero, como debe ser.
FIG. 8
4. Determinar el coeficiente de transmisión de una partícula a través de una barrera de potencial definida por la fórmula
U(x)
= U0 /cosh 2ct.x
( fig. 8); energía de la partícula E < U0 •
Solución. La ecuación de ScHRODINGER para este problema se obtiene a partir del problema 4,
§ 23, cambiando el signo de U0 y considerando ahora la energía E como positiva.
Siguiendo el mismo método se obtiene la solución
¡fo= (1-t2)-ik/2aF[-ik/rt.-s, -ik/rt.+s+ 1, -ik/<1.+ 1, !(1-t)],
donde
g=
s=
tgh
el.X,
k = y(2mE)/ñ,
( J[
t - 1+
1-
8mU0 ] )
:.1.2f12
(1)
94
La ecuación de Schrodinger
=
Esta solución cumple ya la condición de que cuando x-,..
(es decir, para~_,.. 1, (1 -~)::::: 2e-z)
la función de onda contenga solamente la onda transmitida (,_, eikz). La forma asintótica de la
función de onda para x-,.. 1) se encuentra transformando la función hipergeométrica mediante la fórmula (e, 7):
= (~-,.. -
if; ,....,
e-ikx
reik)re1-ik) .
re -ik)ret-ik)
+ eik:r
•
re-s)r(l +s)
re -ik-s)re-ik+s+ 1)
(2)
Calculando el cuadrado del módulo de la razón de coeficientes en esta función, obtenemos la siguiente expresión para el coeficiente de transmisión D = 1 - R:
2
senh ( 1rk/rJ.)
]) = ~~~~~~~~~~~~~~~~
senh 2 (1rk/iJ.)+cos 2[!1r v(l-8mU0/n 2rJ.2)]
para 8mU0 /h
2 2
r:1..
< 1,
l) =
senh 2(1rk/rJ.)
~~~~~~~~~~~~~~~~-
sen h 2 e1rk/ cx) + cos h 2[!1r v(8mU0 /h2iJ.2 -l)]
para 8mU0 /h > l.
La primera de estas fórmulas vale también para el caso en que U0 < O, es decir, cuando la
partícula pasa no por encima de una barrera de potencial, sino por encima de un pozo de potencial. Es interesante que en estas condiciones sea D = 1 si 1+8mlUol/ñ2ix2 = (2n+1) 2 ;
es decir, que para determinados valores de la profundidad del pozo U0 las partículas que pasan
por encima de él no se reflejan. Esto se advierte ya en la expresión (2), en la cual desaparece el
término que contiene e-ikz cuando s es un entero positivo.
2 2
r:1..
CAPÍTULO
IV
MOMENTO CINÉTICO
§ 26.
Momento cinético
En el § 15 al deducir la ley de conservación del impulso nos apoyamos en la
homogeneidad del espacio con relación a un sistema aislado de partículas. Junto
a la homogeneidad, el espacio posee también la propiedad de isotropía - es decir,
todas las direcciones son en él equivalentes. Por consiguiente, el hamiltoniano de
un sistema aislado no debe cambiar al someter el sistema como un todo a una rotación, cualquiera que sea su amplitud y cualquiera que sea su eje. Como en el § 15,
es suficiente imponer la condición de que se cumpla esta condición en una rotación
infinitesimal arbitraria.
Sea ~9 el vector infinitesimal de la rotación, igual en valor absoluto al ángulo ~<p
de la rotación y cuyo vector coincide con el eje en torno del cual se realiza aquélla.
Los cambios óra (de los vectores posición de las partículas, r11 ) en dicha rotación
son, como es sabido, iguales a:
Sr11 = O<p X r 11 •
Una función arbitraria 1P(r1 , r 2 ,
ción
••. )
se convierte en esta transformación en la fun-
ip(r1 +Sr1, r 2 +8r 2, ••• ) = tf;(r1 , r 2 , •.• )+ La Sra.
v atfa
= tf;(r1, r 2, .•• )+ La S<p X ra • V atfa
= (1 +scp. Lra
X V a)¡/;(ri, r2, ... ).
a
La expresión
se puede considerar como el « operador de rotación infinitesimal». El hecho de
que una rotación infinitesimal no cambia el hamiltoniano del sistema, se traduce
en la conmutabilidad del « operador rotación» con el operador H (véase § 15).
Dado que el operador multiplicación por la unidad conmuta con todos los operado-
96
res, y que
Momento cinético
ó<p
es un vector constante, esta condición conduce a la relación
(26.1)
que expresa una ley de conservación.
La magnitud cuya conservación para un sistema aislado se sigue de la propiedad
de isotropia del espacio es el momento cinético del sistema. El operador l:ra X V a
debe así corresponder, salvo un factor constante, al momento cinético total del
sistemz _ y cada uno de los términos rª x
ª de la suma, al momento cinético de
cada una de las partículas.
v
El coeficiente de proporcionalidad debe tomarse igual a -ili; esto resulta inmediatamente de que entonces la expresión para el operador momento de la partícula
-ilir x V= r xpcorresponderá exactamente a la expresión clásica ordinaria r x p.
En lo que sigue utilizaremos siempre el momento cinético medido en unidades li.
El operador determinado de esta manera para el momento de una partícula lo
representaremos por i, y el momento cinético de todo el sistema lo designaremos
por L. Tenemos así para los operadores componentes del momento cinético de una
partícula las expresiones
(26.2)
Para un sistema que se encuentra en un campo exterior, el momento cinético,
en general, no se conserva. Sin embargo, el momento cinético puede conservarse
cuando el campo posee determinada simetría. Así, si el sistema se encuentra en un
campo que presenta simetría esférica, todas las direcciones en el espacio que parten
del centro son equivalentes y, por lo tanto, se conservará el momento cinético respecto de este punto. Análogamente, en un campo con simetría axil se conserva la
componente del momento cinético a lo largo del eje de simetría. Todas estas leyes
de conservación, que se cumplen en la mecánica clásica, conservan su validez también en la mecánica cuántica.
En un sistema en el que no se conserve el momento cinético en los estados estacionarios, el momento cinético carece de valores determinados. En tales casos
presenta a veces interés el valor medio del momento cinético en un estado estacionario dado. Es fácil ver que en todo estado estacionario no degenerado el valor medio
del momento cinético es igual a cero. En efecto, si se- cambia el signo del tiempo,
no cambia la energía, y dado que al nivel energético en cuestión corresponde un
sólo estado estacionario, se sigue de aquí que al cambiar ten - t el estado del sistema
debe permanecer inalterado. Esto significa que tampoco pueden variar los valores
medios de las diferentes magnitudes, en particular, el del momento cinético. Pero
al cambiar el signo del tiempo, cambia el signo del momento cinético, con lo que
97
Momento cinético
obtendríamos L = - L ; de aquí se sigue que L = O. El mismo resultado se puede
obtener partiendo de la definición matemática de valor medio de la magnitud, L,
como integral de ip*Lfa. Las funciones de onda de los estados no degenerados son
reales (véase el final del § 18). Por consiguiente, la expresión
es imaginaria pura, y dado que L debe ser, claro está, una cantidad real, es evidente
que L = O.
Hallemos las reglas de conmutación de los operadores del momento cinético
con los operadores de las coordenadas y de los impulsos. Mediante las relaciones
(16.2) obtenemos fácilmente:
{Íx,x} = O, {Íx,Y} ='z°Z, {Íx, z} = -iy,
{Í111Y} = O, {1 11 ,z} = ix, {!11 , x} = -iz,
{tz}
= O, {Íz,X} = t)', {Íz,Y} = -ix.
}
(26.3)
Así, por ejemplo
Ía:y-yla: = (1/li.)(yi>z-zJ,11)y-y(yJ,z-ZP11)(1/n)
=
-(z/n){p 111 y}
=
iz.
Todas las relaciones (26.3) se pueden escribir en forma tensorial de la siguiente
manera:
(26.4)
1
)
donde eikl es el tensor unidad antisimétrico de tercer orden ( y donde se sobreentiende la sumación para cada dos índices mudos· que se repiten.
Como es fácil comprobar, relaciones de conmutación totalmente análogas valen
para los operadores del momento cinético y del impulso:
{Íi,A} = ieikzPz·
(26.5)
El tensor unidad antisimétrico de tercer orden eikl (llamado también tensor axil unidad) se define
como el tensor antisimétrico respecto de sus tres índices y tal que e123 = 1. Es evidente que de las 27 componentes de este tensor, sólo son distintas de cero las 6 componentes para las que los índices i, k, /, forman
una permutación cualquiera de los números 1, 2, 3. De éstas, las componentes iguales a + 1 corresponden
a~permutaciones i, k, /, que se obtienen a partir de 1, 2, 3, mediante un número par de transposiciones,
y son iguales a - 1 las que resultan de un número impar. Es evidente que
1
( )
eikZeikm = 2Szm, eikleikl = 6.
Las componentes del vector C = A x B, que son las componentes del producto vectorial de los dos
vectores A y B, se pueden escribir mediante el tensor eik! en la forma
98
Momento cinético
Mediante estas fórmulas es fácil encontrar las reglas de conmutación de los
operadores la:, ! 71 , 12 entre sí. Tenemos:
ñ(l)11 -lJa:)
=
=
=
la;(zj,:,;-xp,J-(zJ,a:-XPz)la;
(f~-zfa:)P:c-x(fxPz-J>zfa;)
-iyJ,a:+ixJ, 11 = iñfz•
Así, pues,
(26.6)
o bien
(26.7)
Exactamente· las mismas relaciones valen también para los operadores La:, L1,, L 2 .
del momento cinético total del sistema. En efecto, dado que los operadores del
momento cinético de las diferentes partículas conmutan entre sí, se tiene, por ejemplo:
''J:}a11'Efa,"E[a,"Efa11
a
a
a
a
= "E(faJa,-fa,fa11)
= i~a fa:,;•
a
Por lo tanto,
(26.8)
Las relaciones (26.8) demuestran que las tres componentes del momento cinético
no pueden poseer simultáneamente valores determinados (con la única excepción
del caso en que las tres componentes son simultáneamente nulas - véase más adelante). Desde este punto de vista, el momento cinético difiere esencialmente del
impulso, para el cual las tres componentes pueden tomar simultáneamente valores
determinados.
de los operadores L~, L 11, L. formemos el operador Lz 2+L./'+L.2,
que se puede considerar como el operador del cuadrado del módulo del vector
momento cinético; representémoslo por l2:
A partir
L 2 = Lz2 +L 112 +L,2 •
(26.9)
Este operador conmuta con cada uno de los operadores Lz,
L11 , L.:
{L2,La;} = o, {L2,L11} = o, {L2,L,} =
En efecto, teniendo en cuenta (26.8), resulta, por ejemplo:
o.
{La:2,L,} = La:(La;,L,}+{L:r,L,}La:
= -i(L:r;l,,+ L11La:),
{L112, Lz}
= i(L:r;l,,+L 11L:,;),
{L,2,L,}
=
o.
(26.10)
99
Momento cinético
Sumando estas igualdades obtenemos {L2 ,
Lz} = O.
Las relaciones (26.1 O) significan físicamente que el cuadrado del momento cinético (es decir, de su módulo) puede tener un valor determinado a la vez que una
de sus < omponentes.
En vez de los operadores lx,
sus combinaciones complejas
Ly, con frecuencia resulta más conveniente utilizar
(26.11)
Es fácil verificar, mediante un cálculo directo y teniendo en cuenta (26.8), que para
estas combinaciones valen las siguientes reglas de conmutación:
2Lz,
{Lz, L+}
{Lz, L_} =
-L-,
{L+, L-} =
=L +,
(26.12)
Tampoco es difícil comprobar que
t2 = l+L-+Lz2 -Lz
= L-L++Lz2 +Lz.
(26.13)
Finalmente, escribamos unas expresiones frecuentemente utilizadas para el operador del momento cinético de una sola partícula en coordenadas esféricas. Introduciendo éstas mediante las relaciones habituales
x
= r sen 8 cos ef,,
y= rsen9sen<1>.
z
= r cos 8,
después de un cálculo simple obtenemos las siguientes expres10nes:
lz
=
a
oef,'
-i-
(26.14)
1± = e±tr/J(± !_ +i ctgB!_)·
ae
(26.15)
oef,
Substituyéndolas en (26.13), obtenemos el operador del cuadrado del momento
cinético de una partícula en la· forma:
º)]
1 82
1 ó ~sen8¡2 = - [ ----+--2
se~B óef,
sen (} 80
80
•
(26.16)
Obsérvese que esta expresión es, salvo un factor, la parte angular del operador de
La place.
100
§ 27.
Momento cinético
Valores propios del momento cinético
Para determmar los valores propios de la proyección del momento cinético
de una partícula en una dirección conviene utilizar la expresión de su operador en
coordenadas esféricas, eligiendo el eje polar en el sentido de la dirección considerada.
Según la fórmula (26.14), la ecuación lzt!, = lzt!, puede escribirse en la forma:
(27.1)
Su solución es
if,
=
f (r, O)eüztf,,
donde f(r, 6) es una función arbitraria de r y 6. Para que la función '1/J sea una función uniforme, es necesario que sea periódica respecto de <p con período 2n. De
aquí se sigue (1):
l, = m, donde m = O, ±1,± 2, ....
(27.2)
Así, pues, los valores propios lz son iguales a los números enteros, positivos
y negativos, incluido el valor cero. El factor que depende de <p, y que caracteriza
las funciones propias del operador lz, lo designaremos por
<I> m(<p)
= (21r)-l/2eimef,.
(27.3)
Estas funciones se normalizan de forma que
2ff'
fo <I>m*(cf,)<I>m (cp) dcf,
1
= 8mm'·
(27.4)
Los valores propios de la componente-z del momento cinético total de un sistema
son también iguales. evidentemente, a los números enteros positivos y negativos:
L. = M, donde M
= 0,± 1, ±2, ...
(27.5)
lesto se sigue del hecho que el operador Lz es la suma de los operadores lz correspondientes a las diferentes partículas, operadores que conmutan entre sí).
Dado que la dirección del eje z no es una dirección privilegiada a priori, es claro
que el mismo resultado se obtiene para Lx, Ly y, en general, para la componente del
momento cinético respecto de una dirección cualquiera - todas ellas pueden tomar
solamente valores enteros. Este resultado puede parecer a primera vista paradójico,
sobre todo si se aplica a dos direcciones infinitamente próximas. En realidad, sin
embargo, no hay que perder de vista que la única función propia común a los operadores lx, ly, lz corresponde a los valores simultáneos
L~
= L 11 = L, = O;
( )
La notación generalmente admitida que representa los valores propios de la proyección del momento cinético por la letra m - que es la m,,ma con la que se designa la masa de una partícula-, no
puede de hecho conducir a confusión.
1
Valores propios del momento cinético
101
en este caso el vector momento cinético, y, por lo tanto, también su proyecc10n
sobre una dirección cualquiera, es igual a cero. Pero basta que uno sólo de los valores propios Lx, Ly, Lz sea diferente de cero, para que no exista función propia
alguna común a los operadores.la;, lv, Lz. Con otras palabras, no existe un estado
tal que en él dos o tres componentes del momento cinético relativas a direcciones
diferentes posean simultáneamente valores determinados (diferentes de cero), de
forma que tan sólo de una de ellas podemos decir que toma valores enteros.
Los estados estacionarios de un sistema que difieren tan sólo en el valor Lz
poseen la misma energía, conforme se sigue de consideraciones generales ligadas con
el hecho de que la dirección del eje z no es a priori privilegiada. Así, pues, los niveles
energéticos de un sistema cuyo momento cinético se conserva (y es distinto de cero)
son siempre degenerados (1).
Pasemos ahora a determinar los valores propios del cuadrado L2 del momento
cinético, y veamos cómo es posible encontrar estos valores partiendo solamente
de las condiciones de conmutación (26.8). Designemos por 1PM las funciones de onda
de los estados estacionarios correspondientes a un nivel de energía degenerado y que
difieren en el valor Lz = M. Junto con la energía, en estos estados tiene un valor
determinado (y único) el cuadrado L2 del momento cinético (2).
Observemos ante todo, que en tanto la diferencia
t2_ lJz
f' 2 --
l :,;2+ l y 2
es igual al operador de una magnitud física esencialmente positiva, Lx2+ Ly2, para
un valor dado L2 del cuadrado del momento cinético y para todos los valores propios posibles de la magnitud Lz debe cumplirse la desigualdad L2 > Lz2 , o bien
(27.6)
Así, pues, los valores posibles Lz (para un L2 dado) están limitados por ciertas cotas
superior e inferior; llamemos L el valor del número entero que corresponde al mayor
valor de \Lz[·
(1) Esta circunstancia es un caso particular del teorema general demostrado en el § 1O relativo a la
degeneración de los niveles cuando existen por lo menos dos magnitudes que se conservan y que no conmutan entre sí. Tales magnitudes son aquí las componentes del momento cinético.
(2}
Se supone aquí que no existe ninguna degeneración adicional que conduzca a valores de la energía
iguales para diferentes valores del cuadrado del momento cinético. Esto es lícito para el espectro discreto
(con excepción del caso de la llamada degeneración accidental en un campo de Coulomb, véase § 36) y,
en general, no lo es para los niveles energéticos del espectro continuo. Sin embargo, incluso cuando existe
una tal degeneración adicional es siempre posible elegir las funciones propias de modo que correspondan
a estados con valores determinados de V y entre ellos elegir luego los estados con valores iguales de E
y L 2 • Esto se traduce matemáticamente en que las matrices de operadores que conmutan entre sí pueden
siempre reducirse simultáneamente a la forma diagonal. En lo que sigue, en casos análogos y para abreviar, discurriremos como si no existiera ninguna degeneración adicional, teniendo en cuenta que, en virtud
de lo dicho, los resultados obtenidos no dependen, en realidad, de esta hipótesis.
102
Momento cinético
Aplicando el operador lzL± a la función propia 1PM del operador Lz y utilizando la regla de conmutación {Lz, L±} = ± L± (26.12), obtenemos:
De aquí se sigue que la función L±'PM es (salvo una constante de normalización)
función propia correspondiente al valor M ± 1 de la magnitud Lz; podemos escribir:
'PM+l
=constantex L+tfiM,
'PM-1
=constantex L-'PM·
(27.7)
Si en la primera de estas igualdades se hace M = L, debe tenerse idénticamente
(27.8)
dado que, por definición, no existen estados con M > L. Aplicando a esta igualdad
el operador l- y teniendo en cuenta la relación (26.13), obtenemos:
L-L+1/;L =
(L 2 -
Lz 2 - Lz)ih = o.
Pero dado que las "PM son funciones propias comunes a los operadores L 2 y
será
lz,
L 2 ipL = L 2ipL, Lz2 1PL = L2ipL, Lz'PL = Lh,
de modo que la ecuación obtenida da
L2 = L(L+l).
(27.9)
La fórmula (27.9) determina los valores propios buscados del cuadrado del momento cinético. El número L toma todos los valores enteros positivos;, incluido el
valor cero. Para un valor dado del número L, la componente Lz = M del momento
cinético puede tener los valores
M = L,L-1, ... ,-L,
(27.10)
es decir, en total 2L+ 1 valores diferentes. El nivel de energía que corresponde al
momento cinético L (1) presenta así una degeneración de orden 2L + 1. El estado
con valor nulo del momento cinético L = O (con lo que también las tres componentes son iguales a cero) no es degenerado; observemos que la función de onda de dicho
estado presenta simetría esférica. Esto se sigue ya de que al aplicarle el operador
momento cinético, el resultado se reduce a cero, es decir, dicha función no varía
en una rotación infinitesimal.
Para el momento cinético de una sola partícula escribiremos la fórmula (27.9)
en la forma:
12 = l(l+ 1),
(27.11)
(') Para abreviar, y como es costumbre, hablaremos con frecuencia del « momento cinético L » de
un sistema, sobreentendiendo con ello el momento cinético con valor máximo posible de la proyección
de dicho momento igual a L.
103
J' alores propios del momento cinético
es decir, representaremos el momento cinético de una partícula por la letra minúscula/.
Calculemos los elementos de matriz de las magnitudes Lx y Ly en la representación en la que, junto con la energía, son diagonales L= y L2 (M. BoRN, W. HEISENBERG, P. JORDAN; 1926). Observemos ante todo que dado que los operadores Lx
y Ly conmutan con el operador !, sus matrices son diagonales respecto de la energía,
es decir, todos los elementos de matriz correspondientes a transiciones entre estados
con energía diferente (y diferentes momentos cinéticos L) son iguales a cero. Basta,
pues, considerar los elementos de matriz para las transiciones dentro de un grupo
de estados con valores diferentes M y correspondientes a un mismo nivel degenerado
de la energía.
De las fórmulas (27.7) se deduce que en la matriz del operador L+ son distintos
de cero tan sólo los elementos que corresponden a las transiciones M + 1 -+ M, y
en la matriz del operador L-, los elementos correspondientes a M - 1 -+ M. Teniendo esto en cuenta, formemos los elementos de matriz diagonales en ambos
miembros de la igualdad (26.13) y obtendremos (1):
L(L+ 1) = (L+)M,M-1(L-)M-1,M+M 2 -M.
Observando que en virtud del carácter hermítico de los operadores
Lx, Ly,
(L-)M-1,M = (L+)*M,M-lt
escribiremos esta igualdad en la forma:
l(L+)M,M-11 2 = L(L+l)-M(M-1)
= (L-M+l)(L+M),
de donde (2):
(L+)M,M-1 = (L-)M-1,M
= v[(L+M)(L-M+ 1)].
(27.12)
Para los elementos de matriz, distintos de cero, de las propias magnitudes Lx y Ly
se deducen de aquí los valores:
(Lx)M,M-1 = (Lx)M-1,M = i v[(L+M)(L-M+ l)],
(27.13)
(L1JM,M-1 = -(L11)M-1,M = -iiv[(L+M)(L-M+l)].
( 1)
Al representar los elementos de matriz prescindimos, para simplificar, de todos los índices respecto de los cuales dichos elementos son diagonales (entre ellos, del índice L).
(2) La elección del signo en esta fórmula está de acuerdo con la elección de los factores de fase en las
funciones propias del momento cinético.
104
Momento cinético
En las fórmulas análogas para el momento cinético de una partícula hay que escribir/, m en vez de L, M.
§ 28.
Funciones propias del momento cinético
Dar los valores de 12 y lz no determina por completo la función de onda de una
partícula. Esto se ve ya sin más que tener en cuenta que las expresiones de los operadores correspondientes a estas magnitudes en coordenadas esféricas contienen
solamente los ángulos () y <p de modo que sus funciones propias pueden contener
un factor arbitrario función de r. Consideraremos aquí tan sólo la parte angular
de la función de onda, parte característica de las funciones propias del momento
cinético. La representaremos por Yzm((), <p) y la normalizaremos mediante la condición
J IYzml
(do
=
2
do = 1,
sen () d() dcp es el elemento de ángulo sólido).
Como demostrarán los cálculos que siguen, el problema de determinar las funciones propias comunes a los operadores i 2 y Íz admite la separación de las variables
(} y <p y dichas funciones pueden buscarse en la forma:
(28.1)
donde <I_>ni(</>) son las funciones propias del operador lz determinadas por la fórmula
(27.3). Dado que las funciones <I>m están ya normalizadas por la condición (27.4),
las funciones 0zm deben normalizarse según la condición
1T
fo l0iml senB dB
2
= l.
(28.2)
Las funciones Y1111 con valores diferentes de I o de m resultan ser automáticamente
ortogonales entre sí:
2'11
'1T
JJ Yi·m·*YzmSenB dBd<f> =
Ozz'Omm',
(28.3)
o o
en tanto que funciones propias de los operadores de momento cinético correspondientes a diferentes valores propios. Por separado son también ortogonales las
funciones <I>m(</>) (véase (27.4)) en tanto que funciones propias del operador lz correspondientes a sus diferentes valores propios m. Las funciones 0zm(O), en cambio,
no son de suyo funciones propias de ninguno de los operadores del momento cinético; son ortogonales dos a dos para diferentes /, pero no para diferentes m.
105
Funciones propias del momento cinético
El método más directo para el cálculo de las funciones buscadas consiste en
resolver sin más el problema de hallar las funciones propias del operador i2 escrito
en coordenadas esféricas (fórmula (26.16)). La ecuación 1211' = 12 11, se escribe:
Olp)
1 8~
1 82if,
- - senO- +--+l(l+l)if,
sena 88
88
sen28 8</>2
O.
=
Substituyendo en esta ecuación 1P en la forma (28.1 ), obtenemos para la función
0 1m la ecuación
dE>zm) ---E>zm+l(l+l)E>zm
m
d ~senB--1- 2
2
sen8 d()
d()
sen 8
=
O.
(28.4)
Esta ecuación es bien conocida por la teoría de armónicos esféricos. Posee soluciones
que cuMplen las condiciones de finitud y uniformidad para valores positivos enteros
l > ]ml, de acuerdo con los valores propios del momento cinético obtenido antes
siguiendo el método matricial. Las correspondientes soluciones son los polinomios
asociados de Legendre Pj(cos 8) (véase el § e de los apéndices matemáticos). Normalizando la solución mediante la condición (28.2), obtenemos (1):
E>zm(8)
Se supone aquí que m
= (- lril v'[i(2l+ 1)(/-m)!/(l+m)!]Pr(cos 8).
> O. Para valores m negativos, definimos
~lm
(28.5)
por la relación
(28.6)
es decir, 0 1m con m < O viene dada por la fórmula (28.5) en la que hay que escribir
lm[ en vez de m y prescindir del factor (- 1}fil. Parn m = O los polinomios asociados
de Legendre se llaman, simplemente, polinomios de Legendre P, (cos O); tenemos:
(28.7)
Desde el punto de vista matemático, las funciones propias del momento cinético
resultan no ser así sino los armónicos esféricos normalizados de determinada manera.
En virtud de (27.3) y (28.6), las funciones que difieren en el signo de m están ligadas
entre sí por la relación
(-l)l-m Yi,-m = Yzm*·
(28.8)
He aquí algunas observaciones relativas a las funciones propias del momento
cinético. Para l = O (de modo que también m = O) esta función se reduce a una
constante. Con otras palabras, las funciones de onda de los estados de una partícula
(1) La elección del factor de fase no queda determinada, claro está, por la condición de normalización.
La definición (28.5), que utilizaremos en este libro, es la más natural desde el punto de vista de la teoría
general de composición de momentos cinéticos (véase cap. XIV), y difiere de la que se suele aplicar en el
factor il.
106
Momento cinético
con momento cinético igual a cero dependen sólo de r, es decir, poseen simetría
esférica.
Para un m dado, los valores l a partir de 1ml ordenan los sucesivos valores propios
de la magnitud l en orden creciente. Por lo tanto, teniendo en cuenta el teorema
general relativo a los ceros de las funciones propias (§ 21 ), podemos concluir que las
funciones E>1m se anulan para l - [mi valores distintos del ángulo-O; con otras palabras, dicha función posee como líneas nodales / - [mi «paralelos» de la esfera.
En cuanto a las funciones angufares completas, si las elegimos con los factores reales
cos mcf, o sen mcf, en vez de e+im</> (1-), tendrán además como líneas nodales !mi
« meridianos »; el número total de lineas nodales será, por lo tanto, igual a /.
Finalmente, veamos cómo es posible calcular las funciones E>zm siguiendo el
método matricial. El problema se resuelve de manera análoga a como se calcularon
en el § 23 las funciones de onda de un oscilador. Partiremos de la igualdad (27.8)
Í+Yú = O.
Teniendo en cuenta la expresión (26.15) para el operador l y substituyendo
Yu
=
(211)-leil<l>E)u( 8),
obtenemos para E>u la ecuación
d0zz/d8-l ctg 8 0n = O,
sen1
de donde E>u = const.
O. Determinando la constante a partir de la condición
de normalización, se obtiene:
0n
= (-i)1v[!(2l+ 1)!]2-l(l/l!)senzo.
(28.9)
Recordando (27.12), escribamos luego:
1-Yl,m+l
=
{L)m,m+1Yzm
= v[(l-m)(l+m+ 1)] Y,,,..
La aplicación reiterada de esta fórmula da:
v[(l-m)l/(l+m)!] Yzm = [(2Z)!J-1/2(Lt-mlí,.
El cálculo del segundo miembro de la igualdad se efectúa fácilmente con ayuda de
la expresión (26.15) para el operador f_, según la cual
/_[J(B)etm'P]
=
eHm-ll'Psenl-mO d(jsenmO)/d(cos 8).
1
( )
Cada una de estas funciones corresponde a un estado en el que lz no tiene un valor determinado,
pero puede tener, con igual probabilidad. los valores +m.
107
Elementos de matriz de vectores
La aplicación reiterada de esta fórmula da:
(L)l-meiltf,0n
= eiffl<flsen-mo d1-m(senl8. 0u)/d(cos8)Z-"'.
Finalmente, teniendo en cuenta estas relaciones y la expresión (28.9) para
tenemos la fórmula
J[
0 1m(8) = (-i)'
(2l+ l)(l+m)!]
2(1-m)!
1
az-m
sen 218,
21l!senm8 d(cosO)'-m
0u,
ob-
(28.10)
que coincide con (28.5).
§ 29.
Elementos de matriz de vectores
Consideremos de nuevo un sistema aislado de partículas (1), y seafuna magnitud
física escalar cualquiera que lo caracterice y J el operador que corresponde a esta
magnitud. Todo escalar es invariante respecto de una rotación del sistema de coordenadas. Por consiguiente, el operador escalar no varía en una rotación, es decir,
conmuta con el operador de rotación. Pero sabemos que el operador de una rotación
infinitesimal coincide, salvo un factor constante, con el operador del momento ciné•
tico, de modo que
J
{/, la:} = {/, l
(y también
11 }
= {/,
l,J
=
o
(29.1)
{!, t2} = O).
De la conmutabilidad de / con el operador del momento cinético se sigue que
la matriz de la magnitud f en una representación en la que L 2 y Lz son diagonales,
será también diagonal respecto de los índices L, M. Convendremos en representar
por n el conjunto de los demás índices que determinan el estado del sistema. Demostremos que los elementos de matriz f:/tL no dependen del valor del índice M.
Para ello valgámonos de la conmutabilidad de y L+
J
fl+-l+f = o.
Escribamos el elemento de matriz de esta igualdad correspondiente a la transición
n, L, M ~ n', L, }.{ - 1. Teniendo en cuenta que la matriz de la magnitud L+
posee solamente elementos con n, L, M ~ n, L, M -1, obtenemos:
nLM
n'LM
nLM
nLM-1
f n'LM(L+)n'L,M-1-(L+)nL,M-t/n'L ,M-l = O,
1
y dado que los elementos de matriz de la magnitud L+ no dependen del índice n,
encontramos:
nLM
nL,M-1
f n'LM = / n'L,M-1,
( 1)
Todos los resultados de este párrafo valen también para una partícula en un campo con simetría
central (en general, siempre que se conserve el momento cinético total del sistema).
108
Momento cinético
de donde s~ sigue que todos los t:ftf.t con valores de M distintos (y con los restantes
índices iguales) son iguales entre sí.
A sí, pues, los elementos de matriz de la magnitud f distintos de cero serán:
nLM
f n'LM
donde
n', L.
f':h
nL
=fn'L,
(29.2)
representa una cantidad que depende de los valores de los índices n,
Si se aplica este resultado al propio hamiltoniano, obtenemos la independencia
ya conocida de la energía de los estados estacionarios respecto de M, es decir, la
degeneración de orden 2L+ 1 de los niveles energéticos.
Sea ahora A una magnitud física vectorial característica del sistema aislado.
En una rotación del sistema de coordenadas (en particular, en la aplicación del operador de rotación infinitesimal, es decir, del operador del momento cinético) las
componentes del vector se transformarán entre sí. Por consiguiente, y como resultado
de la conmutación de los operadores li con los operadores Á ¡, deben obtenerse
de nuevo componentes del mismo vector Ái. Puede encontrarse qué componentes
se obtienen precisamente observando que, en el caso particular en que A es el vector
posición de una partícula, deben obtenerse las fórmulas (26.3). Encontramos así
las reglas de conmutación
{lx, Áx} = O, {Lx, Áy} = iÁz, {Lx, Áz} = -iÁ11 ,
{29.3)
(las restantes se obtienen a partir de éstas por permutación circular de los índices x,
y, z) o bien
{Lt, Á1c} = ieilclAz.
{29.4)
Estas relaciones permiten obtener una serie de resultados relativos a la forma de
las matrices de las componentes de un vector A (M. BoRN, W. HEISENBERG, P. JoRDAN; 1926). Ante todo, es posible encontrar reglas de selección que determinan
para qué transiciones los elementos de matriz· pueden ser diferentes de cero. Sin
embargo, no nos detendremos aquí en efectuar los correspondientes cálculos, bastante pesados, dado que más adelante veremos (§ 107) que estas reglas son, en realidad, consecuencia directa de propiedades generales de las transformaciones de las
magnitudes vectoriales y se pueden obtener a partir de ellas, en esencia, sin cálculo
ninguno. Con todo, daremos aquí estas reglas sin demostración.
Los elementos de matriz de todas las componentes de un vector pueden ser
diferentes de cero tan sólo para aquellas transiciones en las que el momento cinético L
varía como máximo en una unidad:
L -+L
o
L±l.
(29.5)
109
Elementos de matriz de vectores
Además, se cumple otra regla de selección que prohibe las transiciones entre dos
estados cualesquiera con L = O; esta regla es consecuencia, evidentemente, de la
completa simetría esférica de los estados con momento cinético nulo.
Las reglas de selección relativas a la proyección M del momento cinético son
diferentes para las diferentes componentes del vector. Así, pueden ser diferentes
de cero los elementos de matriz para las transiciones acompañadas de las siguientes
variaciones del valor M:
para
A+ = Ax+iAy,
para
A- = Ax-iA11 ,
M~M-1,
M~M+l,
para
Az,
M~M.
)
(29.6)
Además, es posible determinar de forma general la dependencia de los elementos
de matriz de un vector respecto del número M. Estas importantes fórmulas, utilizadas con frecuencia, las damos aquí también sin demostración, puesto que también
ellas resultan ser, en realidad, un caso particular de relaciones más generales (relativas a cualquier magnitud tensorial)) que se obtendrán. en el § 107.
Los elementos de matriz distintos de cero de la magnitud Az se determinan por
las fórmulas siguientes:
M
(A )nLM _
AnL
z n'LM - v[L(L+1)(2L+1)] n'L'
_
(A )nLM
z n',L-1,M -
J
L2-M2
(A )n,L-1,M _
z n' LM
-
J
L2-M2
AnL
L(2L-1)(2L+ 1) n',L-1 ,
(29.7)
An,L-1
L(2L-1)(2L+ 1) n' L ·
En ellas A:fi., son cantidades que no dependen de M (1), y están ligadas entre sí
por las relaciones de « hermiticidad »
nL -_ (An'
L')* ,
A n'L'
nL
(29.8)
(1) Estas cantidades se llaman a veces elementos de matriz reducidos. Que en las fórmulas (29.7),
(29.9) aparezcan denominadores que dependen de L resulta de la notación general introducida en el§ 107.
La conveniencia de que aparezcan estos denominadores se manifiesta, en particular, en la forma simple
que adopta la fórmula (29.12) para los elementos de matriz del producto escalar de dos vectores.
Observemos que para el propio vector L los elementos de matriz reducidos son
Lf = y[L(L+ 1)(2L+ 1)],
L L-1
L
= LLL-1
= 0,
dado que la matriz Lz es diagonal respecto de L y los elementos diagonales son iguales a M. Estos mismos
valores se obtienen también. naturalmente, comparando las fórmulas (29.9) y (27.12).
110
Momento cinético
que se siguen inmediatamente del carácter hermítico del operador
Az.
Mediante estas mismas cantidades A:!-¡_,. se determinan los elementos de matriz
de las magnitudes A_ y A+. Los elementos de matriz no nulos de A_ son iguales a
L
M l
(A-)!,L'M- =
L M
l
(A-):,.·L-1.M =
J(L-M+l)(L+M)
L
L(L+l)(2L+l) A:,L'
J(L-M+ l)(L-M) L
L(2L-1)(2L+ 1) A!',L-l'
(A )n,f,-1,M-1 = _ J(
- n LM
(29.9)
L+M-l)(L+M)
An,f-1
L(2L-1)(2L+ 1) n L ·
Los elementos de matriz de A+ no exigen fórmulas especiales, ya que en virtud
del carácter real de Ax y Ay tenemos (recordando (11.9)):
'L'M' ]*.
(A+)!,LM
L'M' = [(A-)!LM
(29.10)
Es útil destacar una fórmula que expresa los elementos de matriz del escalar
A. B (A, B, son dos magnitudes físicas vectoriales) en función de los coeficientes
A!fL'' B!fL, que aparecen en las fórmulas (29.7-9); en las aplicaciones hay que
considerar a menudo productos de
este
tipo. El cálculo se efectúa de una manera
A
A
cómoda expresando el operador A • B en la forma:
(29.11)
Es evidente desde luego, que la matriz de A. B (como la de todo escalar) es diagonal
respecto de L y M. El cálculo con ayuda de las fórmulas (29.7-9) conduce al resultado
nLM _
l
(A· B)n'LM - - - 2L+l
¿
nL
n" L"
An"L"Bn'L '
(29.12)
n",L"
(L" toma los valores L, L ± 1).
PROBLEMAS
1. Determinar los elementos de matriz (respecto de las funciones propias del momento cinético) del versor n del vector posición de una partícula.
Solución. Los elementos de matriz de un vector polar relativo a una sola partícula son distintos de cero únicamente para las transiciones /-* l ± 1 (véase§ 30). Su dependencia con relación
al número cuántico m se determina mediante las fórmulas generaies (29.7-9), de modo que basta
1
calcular el coeficiente
1 = (n:- )* en dichas fórmulas). Para ello determinemos, por ejemplo,
el elemento de matriz de llz = cos O:
n:_
Paridad de un estado
J(
21
111
1
_ 1; + l) n/- = (cosB)lt·º = [ 01-1,0• cose. 0rosen8 dO,
21
con las funciones E>zo de (28.7) (la integral se calcula mediante la fórmula (107.15) con /1 = 1,
= / - 1). Como resultado se obtiene:
/2
n~-l =
iy'l.
2. Promediar el tensor niuk - ! ,5uc (donde n es el versor del vector posición de una partícula) respecto de un estado con valor absoluto dado del vector l, pero sin que se dé su dirección
(es decir, para lz indeterminado).
Solución. El valor medio buscado es un operador que puede expresarse en función sólo del
operador l. Supongámoslo de la forma
esta es la forma más general de un tensor simétrico de segundo orden con traza nula que se puede
construir a partir de las componentes de Para determinar la constante a multipliquemos la igualdad que precede a la izquierda por ft y a la derecha por Í~ (sumando respecto de i y k). Dado que
t.
el vector n es perpendicular al vector ñl = r x p, se tiene ntf, = O. El producto lddk[k = (12) 2
lo substituiremos por el valor propio / 2(/+ 1)2 , y el producto l,lklilk lo transformaremos mediante
las relaciones de conmutación (26. 7) de la siguiente manera:
Mklilk
=
MiMk-ieiklMzlk
=
(i2)2-iietkZii(lzlk-Mz)
=
(i 2)2+!eiklelkmÍtÍm
=
(i2)2-i2
=
(hemos utilizado la relación eikiemkz
resultado:
=
12(1+ 1)2-l(l+ 1)
2oim). Después de una simple reducción obtenemos el
a= -1/(21-1)(21+3).
§ 30.
Paridad de un estado
Además de la translación del sistema de coordenadas (utilizada en el § 15) y la
rotación del mismo (utilizada en el § 26), existe todavía una transformación que
deja invariante el hamiltoniano de un sistema aislado (1). Es la llamada transformación de inversión, que consiste en cambiar simultáneamente el signo de todas las
coordenadas. En mecánica clásica la invariancia de la función de HAMILTON respecto
de la inversión no conduce a ninguna ley de conservación. En mecánica cuántica,
en cambio, la situación es otra.
(1)
Lo mismo vale para un sistema que se encuentre en un campo central.
112
Momento cinético
Representemos por Í el operador inversión; el resultado de aplicarlo a una
función consiste en el cambio de signo de todas las coordenadas. La invariancia
de fi respecto de la inversión significa que
111-líJ
=
o.
(30.1)
El operador Í conmuta también con los operadores del momento cinético:
(30.2)
(en la inversión cambian de signo tanto las coordenadas como los operadores de
derivación respecto de las mismas, con lo cual los operadores del momento cinético
no varían).
Es fácil encontrar los valores propios I del operador inversión, determinados por
la ecuación
N, =N.
Para ello observemos que la doble aplicación del operador Í conduce a la identidad,
ya que todas las coordenadas recobran su signo inicial. Con otras palabras, tenemos
J2«f¡ = J 2«fa = «fa,es decir 12 = 1, de donde
1
= ±1.
(30.3)
De esta manera las funciones propias del operador inversión o no cambian en modo
alguno al aplicarles este operador, o cambian de signo. En el primer caso la función
de onda (y el correspondiente estado) se llama par, y en el segundo, impar.
La igualdad (30.1) expresa, por consiguiente, la ley de conservación de la paridad:
si el estado de un sistema aislado posee una determinada paridad (es decir, si es par
o si es impar), esta paridad se conserva en el tiempo.
Las igualdades (30.2) significan físicamente que el sistema puede poseer valores
determinados de L y M y a la vez una determinada paridad del estado. Además,
cabe afirmar que todos los estados que difieren únicamente en el valor de M poseen
la misma paridad. Esto se puede demostrar partiendo de la relación
l+l-ll+
=
o
.exactamente de la misma manera como se obtuvo (29.2).
Al aplicar la inversión, las magnitudes escalares o no cambian ( escalares en sentido estricto) o cambian de signo (en cuyo caso se las llama pseudoescalares) (1).
Si la magnitud física f es un escalar en sentido estricto, su operador conmutará
con Í:
(30.4)
1/-JJ = o.
(1)
Pseudoescalar lo es, por ejemplo, el producto escalar de un vector axil y un vector polar.
Paridad de un estado
113
De aquí se sigue que si la matriz de 1 es diagonal, también lo será la matriz de f
con relación al índice que indica la paridad del estado, es decir, sólo son diferentes
de cero los elementos de matriz que corresponden a las transiciones u-+ u, g-+ g
(con los índices g y u designamos los estados pares e impares, respectivamente).
Para el operador de una magnitud pseudoescalar, en cambio, tenemos 1/ =
o bien
1/+/1 =
O;
- /1,
(30.5)
Í anticonmuta con/ El elemento de matriz de esta igualdad para la transición g -+ges
1(1(/f(I(/+ f,u,I(I(/
= O,
lgy = 1, se tendrá /yy = O (prescindimos de todos los índices salvo
del índice que indica la paridad). Análogamente encontramos que también fuu = O.
Resulta así que en la matriz de una magnitud pseudoescalar sólo pueden ser distintos de cero los elementos no diagonales respecto del índice de paridad (transiciones
con cambio de paridad).
y dado que
Para las magnitudes vectoriales se obtienen resultados análogos. Los operadores
de un vector polar (1) anticonmutan con Í y sus matrices (en una representación
en la que Í es diagonal) contienen solamente elementos para las transiciones con
cambio de paridad. Los operadores de un vector axil, por el contrario, conmutan
con 1 y sus matrices contienen solamente elementos para transiciones sin cambio
de paridad.
Conviene indicar también otra manera de obtener estos resultados. Por ejemplo,
el elemento de matriz de un escalar f para la transición entre estados de paridad
diferente es la integral fuu = f 'Pu*/ift0 dq, donde la función 1J}g es par, y la "Pu, impar.
Al cambiar de signo todas las coordenadas, el integrando cambia de signo si f es
un escalar en sentido estricto; por otra parte, la integral extendida a todo el espacio
no puede variar al cambiar la manera de designar las variables de integración. De
aquí se sigue que / 11 g = - fug, es decir, fug == O.
Determinemos la paridad del estado de una partícula con momento cinético l.
La inversión (x -+ - x, y-+ - y, z -+ - z) equivale, en coordenadas esféricas, a la
transformación
r -+ r,
() -+ 1T-8, cf, -+ 11'+</,.
(30.6)
La dependencia de la función de onda de la partícula con relación a los ángulos
viene dada por la función propia del momento cinético Y 1m que, salvo una cons(1) Los vectores ordinarios, es decir, los vectores polares, cambian de signo en la inversión. En cambio,
los vectores axilcs (por ejemplo, el producto vectorial de dos vectores polares) no cambian en dicha transformación.
114
Momento cinético
tante que no nos interesa aquí, es de la forma P,m(cos 8)eim4>. Al cambiar <p en <f,+n,
el factor eim</J queda multiplicado por (- l)ID, y al cambiar() en n - 6, Pr(cos 8)
se transforma en P ,m( -cos 8) = ( -1) z-mP r( cos 8). Así, pues, dicha función queda
multiplicada por el número (- 1)1 (que no depende de m, de acuerdo con lo dicho
antes), es decir, la paridad del estado con valor dado l es
1=(-l)l.
(30.7)
Vemos así que todos los estados con l par son pares y los de l impar son impares.
Una magnitud física vectorial asociada a una partícula individual puede tener
elementos de matriz tan sólo para transiciones del tipo l --+ l, l ± 1 (§ 29). Teniendo
esto presente y comparando la fórmula (30. 7) con lo antes dicho respecto del cambio
de paridad en los elementos de matriz de los vectores, llegamos a la conclusión
de que los elementos de matriz de un vector polar son distintos de cero tan sólo
para las transiciones con l --+ l ± 1, mientras que para un vector axil lo son únicamente para las transicic;mes /--+ l.
§ 31.
Suma de momentos
Consideremos un sistema constituido por dos partes débilmente acopladas entre
sí. Si se prescinde por completo de la interacción, para cada una de ellas vale la
ley de conservación del momento cinético, y el momento cinético total L del sistema
se puede considerar como suma de los momentos L 1 y L 2 de sus partes. En la aproximación siguiente, al tener en cuenta la débil interacción, las leyes de conservación
de L 1 y L 2 no se cumplen ya rigurosamente, pero los números L 1, L 2 que determinan
sus cuadrados siguen siendo « buenos » números cuánticos, adecuados para una
descripción aproximada del estado del sistema. Gráficamente, esto es, considerando
los momentos cinéticos clásicamente, cabe decir que en esta aproximación L 1 y L 2
giran en torno de la dirección de L conservando invariable su módulo.
Ligado con la consideración de tales sistemas se plantea el problema de la ley
de composición de los momentos cinéticos. ¿Cuáles son los valores posibles de L
para valores dados de L 1 y L 2? En lo que concierne a la ley de composición de las
componentes del momento cinético, esta ley es evidente: del hecho de ser
lz
=
l1z+l2z,
se sigue M = M 1 +M 2 • Para los operadores de los cuadrados de los momentos
cinéticos, en cambio, no existe una relación tan simple, y para deducir su ley de
composición razonaremos de la siguiente manera.
Si se elige como sistema completo de magnitudes físicas el formado por las mag-
115
Suma de momentos
nitudes L¡2, Ll, L 1z, L 2z (1), cada estado vendrá determinado por los valores de los
números L 1, L 2 , M 1 , M 2 • Para valores dados de L 1 y L 2 , los números M 1 y M?. toman,
respectivamente, 2L1 + 1 y 2L2 + 1 valores, de forma que en total se tienen (2L1 + 1) .
(2L2 + 1) estados diferentes con los mismos valores L 1 , L 2 • Las funciones de onda
de los estados en esta representación las designaremos por <f,L1L 2M 1M 2.
En vez de las cuatro magnitudes indicadas es posible elegir como sistema completo
las cuatro magnitudes L¡2, L 22, L 2, Lz. Cada estado se caracterizará entonces por los
valores de los números L 1, L 2 , L, M (las correspondientes funciones de onda las designaremos por 1PLiL 2LM). Para valores dados de L 1 y L 2 deben existir, claro está, al
igual que antes (2L1 + 1) · (2L 2 + 1) estados diferentes, es decir, para valores dados
de L 1, L 2 , el par de números L, M puede tomar (2L 1 + 1) · (2L 2 + 1) pares de valores.
Estos valores se pueden determinar mediante las siguientes consideraciones.
a
A cada valor L corresponden 2L + 1 diferentes valores posibles M desde
+L. El valor mayor posible de M en los estados <p (para L 1 y L 2 dados) es M =
-
L
L1+
+L 2 , que se obtiene para M 1 = L 1, M 2 = L 2 • Por ello, también el valor máximo
de M en los estados 1P, y por cons guiente, también el valor máximo de L, es L 1 +L 2 •
Además, se tienen dos estados <p con M = L 1 + L 2 - 1, el que corresponde a M 1 =
= L 1, M 2 = L 2 - 1 y el que corresponde a M 1 = L1 - 1, M 2 = L2 . En consecuencia,
deben existir también dos estados 1P con estos valores de M; uno de ellos es el estado
con L = L1 + L 2 ( y M = L - 1), y el otro, evidentemente, con L = L 1 + L 2 - 1
(y M = L). Para el valor M = L 1 +L2 - 2 existen tres estados 1P distintos - con
los siguientes pares de valores (M1, M 2 ) : (L1, L2 - - 2), (L1 - 1, L 2 - 1), (L1 - 2, L 2 ).
Esto significa que junto a los valores L = L 1 +L2 , L = L 1 +L2 - 1, es también
posible el valor L = L1 +L 2 - 2.
Este razonamiento se puede repetir exactamente de la misma forma mientras
al disminuir en 1 el valor de M aumente en 1 el número de estados con valor dado M.
Es fácil ver que ello ocurrirá hasta que M alcance el valor [L 1 - L 2 ]. Si se sigue
disminuyendo el valor de M, el número de estados deja de crecer, manteniéndose
igual a 2L2 + 1 (si L 2 < L1). Esto significa, que [L1 - L 2 es el menor valor posible
de L.
l
Llegamos así al resultado de que, para valores dados de L 1 y L 2, el número L
puede tomar los valores
(31.1)
es decir, en total 2L2 + 1 valores diferentes (suponiendo que L 2
<
L 1). Es fácil com-
(1) Y todo un conjunto de otras magnitudes que, con las cuatro indicadas, formen un sistema completo.
Estas magnitudes complementarias no representan papel alguno en las consideraciones que siguen, y
para simplificar las expresiones no hablaremos de ellas, conviniendo en llamar sistema completo el de las
cuatro magnitudes indicadas.
116
Momento cinético
probar que efectivamente se obtienen (2L1 + 1) (2L2 + 1) pares distintos de valores
de los números M, L. En relación con esto importa hacer notar que (si se prescinde
de los 2L + 1 valores distintos de M para un L dado) a cada uno de los valores posibles de L (31.1) corresponde solamente un estado.
Este resultado se puede representar gráficamente mediante el llamado modelo
vectorial. Si se introducen dos vectores L 1 , L 2 de longitudes L 1 y L 2 , los valores de L
se representan como longitudes de valor entero de los vectores L que se obtienen como
resultado de la suma vectorial de L 1 y L 2 ; el valor máximo de L, (L1 + L 2), se obtiene
cuando L 1 y L 2 son paralelos, y el menor, IL1 - L 2 /, cuando dichos vectores son
anti paralelos.
La regla de composición de los momentos cinéticos que acabamos de obtener
ofrece la posibilidad, claro está, de componer un número arbitrario de momentos
cinéticos (mayor que 2) mediante aplicación reiterada de la misma.
En los estados con valores determinados de los momentos cinéticos L 1, L 2 y del
momento cinético total L, poseen también valores determinados los productos
escalares L 1 L 2 , L L 1 , L L 2 • Es fácil encontrar estos valores. Para calcular L 1 • L 2 escribamos L = L¡ +L2 o bien, elevando al cuadrado y pasando términos de un
miembro a otro:
2L1 • L 2 = 1}-L¡2-L22 •
Substituyendo los operadores que aparecen en el segundo miembro de la igualdad
por sus valores propios, obtenemos el valor propio del operador que figura en el
primer miembro de la misma:
L 1 • L 2 = i{L(L+l)-L1 (L1 +l)-LiL2 +l)}.
(31.2)
De manera análoga se encuentra:
(31.3)
Consideremos ahora la regla de composic,ión de paridades. Conforme sabemos,
la función de onda 'Y del sistema constituido por dos partes independientes es igual
al producto de las funciones de onda 'Y1 y 't·2 de estas partes. Es claro, por consiguiente, que si estas dos últimas poseen la misma paridad (es decir, si ambas cambian,
o ambas no cambian, de signo al cambiar de signo todas las coordenadas), la función de onda de todo el sistema será par. Recíprocamente, si 'Y1 y W 2 poseen paridad
diferente, la función 'Y será impar.
Esta regla, claro está, se generaliza inmediatamente al caso de un sistema constituido por un número arbitrario n de partes independientes. Si éstas se encuentran
en estados de paridades determinadas, definidas por los correspondientes valores
propios /i = ± 1 del operador Ji, la paridad I del estado de todo el sistema viene
Suma de momentos
117
definida por el producto
(31.4)
En particular, si se trata de un sistema de partículas que se encuentran en un campo
central (pero pudiéndose considerar débil la interacción de las partículas entre sí),
se tendrá Ji = ( - IYi, donde li es el momento cinético de la i-ésima partícula (véase
(30.7)), de forma que la paridad del estado del sistema total viene dada por
(31.5)
Hay que subrayar que el exponente representa aquí la suma algebraica de los momentos cinéticos li que, en general, difiere de su « suma vectorial», es decir, del momento
cinético L del sistema.
Si un sistema aislado se desintegra en partes (bajo la acción de las fuerzas internas), deben conservarse su momento cinético total y su paridad. Esta circunstancia
puede hacer imposible la desintegración de un sistema, incluso cuando ésta es posible desde el punto de vista energético.
Consideremos, por ejemplo, un átomo que se encuentra en un estado par de
momento cinético L = O y que energéticamente se podría desintegrar en un electrón
libre y un ion en un estado impar con igual momento cinético L = O. Es fácil ver
que esta desintegración de hecho no puede tener lugar (como suele decirse, dicha
desintegración está prohibida). En efecto, en virtud de la ley de conservación del
momento cinético, el electrón libre debería poseer también momento cinético igual
a cero y encontrarse por ello en un estado par ([ = ( - 1) º = + 1); pero en este
caso el estado del sistema ion +electrón libre sería impar, mientras que el estado
inicial del átomo era par.
CAPÍTULO V
MOVIMIENTO EN UN CAMPO CENTRAL
§ 32. Movimiento en un campo central
El problema-del movimiento de dos partículas en interacción mutua se puede
reducir en mecánica cuántica al_problema de una sola partícula, de manera análoga
a como se puede hacer en la mecánica clásica. El hamiltoniano de dos partículas
(de masas m1 , m2) cuya energía de interacción viene dada por la ley U(r) (res la distancia entre las partículas), es de la forma:
(32.1)
donde ,6.1, ,6.2 son los operadores de Laplace relativos a las coordenadas de las
partículas. Introduzcamos en vez de los vectores posición de las partículas r 1 y r 2
nuevas variables R y r:
r
= r 2 -ri,
R
= (m1r 1 +m:ar2)/(m1 +m2);
(32.2)
r es el vector de posición relatíva de las partículas y R el vector posición de su centro
de masas. Un cálculo simple conduce al resultado
(32.3)
(.6.R y ,6. son los operadores de Laplace correspondientes a los vectores R y r, respectivamente; m1 +m2 es la masa total del sistema, m = m1m2/(m1 +mJ es la llamada
masa reducida). Así, pues, el hamiltoniano se descompone en la suma· de dos partes
independientes. En consecuencia, cabe buscar V'(r1, rJ en forma de producto c/>(R)1P(r),
donde la función cf,(R) describe el movimiento del centro de masas (como movimiento
libre de una partícula de masa m1 +mJ, y V'(r) describe el movimiento relativo de
las partículas (como movimiento de una partícula de masa m en un campo central
U= U(r)).
La ecuación de Schrodinger para el movimiento de una partícula en un campo
central es de la forma
119
MmJimiento en un campo central
6y,+(2m/ñ2)[E-U(r)]y,
O.
=
(32.4)
Utilizando la conocida expresión del operador de Laplace en coordenadas esféricas,
escribiremos esta ecuación en la forma:
1
º( 8y,) +- - -8~sen8-8y,) +--8 y,] +-[E-U(r)]y,
2m
= O. (32.5)
sen 8cf,
li
-r2 8r
1[
r2-
r2
&r
1
2
1
sen(} 88
2 (}
88
2
2
Si se introduce aquí el operador f2 (26.12) del cuadrado del momento cinético, obtenemos (1-):
/i2[ 1 8 ( 2ol/J) ¡2 ]
-r +-tf,
2m
r 2 87
87
72
+ U(r)l/J
=
E,t,.
(32.6)
En el movimiento en un campo central, el momento cinético se conserva. Consideremos los estados estacionarios en los que 12 y lz tienen valores determinados.
Con otras palabras, determinemos las funciones propias comunes a los operadores
fl, i 2 y fz.
La condición de que 'f/J sea función propia de los operadores 12 y lz determina
su dependencia angular. De acuerdo con ello, buscaremos la solución de la ecuación
(32.6) en la forma:
if, = R(7) Yim(O, cf,),
(32.7)
donde las funciones Y1m (O, cf,) se definen mediante las fórmulas del § 28.
Dado que ¡2y 1m =l(l+l)Yim, para la «función radial» R(r) obtenemos la
ecuación
1 d ( 2dR)
--
72 d7
7 -
d7
l(l+l)
2m
---R+-[E-U(7)]R = O.
72
/i2
Observemos que esta ecuación no contiene el valor lz
a la degeneración de orden 2/ + 1 del nivel ya conocida.
(1)
=
m, lo que corresponde
Si se introduce el operador de la componente radial Pr del impulso en la forma:
PrY' =
A
1 0
-ili- -(rtf,)
787
1)
8 .
= -i~ ( -+y,,
OT
(32.8)
T
el hamiltoniano se escribe:
que coincide formalmente con la función de Hamílton clásica en coordenadas esféricas.
120
Movimiento en un campo central
Pasemos ahora a investigar la componente radial de las funciones de onda. La
substitución
(32.9)
R(r) = x(r)/r
reduce la ecuación (32.8) a la forma:
2
d x [2m
l(l+ 1)]
-+
-(E-U)--X=
2
2
dr
h
r2
O.
(32.10)
Si la energía potencial U(r) es finita para todo valor de r, también la función de onda
deberá ser finita en todo el espacio, incluido el origen de coordenadas, y, por consiguiente, también su parte radial R(r). De aquí se sigue que x(r) debe anularse para
r= O:
= O.
x(O)
(32.11)
En realidad, esta condición subsiste también (véase § 35) para un campo que tiende
a infinito para r ~ O.
La condición de normalización para la función radial R(r) viene dada por la
integral f~IR] 2 r 2 dr y, por consiguiente, para la función x(r), por la integral J~lx[ 2 dr.
La ecuación (32.10) coincide formalmente con la ecuación de SCHRODINGER
para el movimiento unidimensional en un campo con energía potencial
h2 l(l+ 1)
lfz(r) = U(r)+---,
2m r 2
(32.12)
igual a la suma de la energía U(r) y un término
nl(l+ 1)/2mr
2
2
= h212/2mr2,
que se puede llamar energía centrifuga. De esta manera, el problema que plantea
el movimiento en un campo central se reduce a un problema de movimiento unidimensional en un intervalo limitado por uno de sus extremos (la condición de con,
torno para r = O).
En el caso del movimiento unidimensional en un intervalo limitado por un ex
tremo, los niveles de energía no son degenerados(§ 21). Por lo tanto, podemos deci
que si se da el valor de la energía, la solución de la ecuación (32.10), es decir, la part
radial de la función de onda, queda completamente determinada. Teniendo tambié1
en cuenta que la parte angular de la función de onda está completamente definid
por los valores l y m, llegamos a la conclusión de que en el movimiento en un camp
central la función de onda viene unívocamente determinada por los valores E, /, n
Con otras palabras, la energía, el cuadrado del momento cinético y la componente•
Movimiento en un campo central
121
del mismo constituyen un sistema completo de magnitudes físicas para ese tipo de
movimiento.
La reducción del problema del movimiento en un campo central a un problema
en una dimensión permite aplicar el teorema de oscilación (véase§ 21). Ordenemos
los valores propios de 1a energía (del espectro discreto) para un valor dado de /
en orden creciente, numerándolos mediante números ordinales nr de forma que al
nivel más bajo le corresponda el número nr = O. En estas condiciones, nr determina
el número de nodos de la parte radial de la función de onda para valores finitos de r
(sin contar el punto r = O). El número nr se llama número cuántico radial. En el
movimiento en un campo central, el número l se llama a veces número cuántico
acimutal, y m, número cuántico magnético.
Para designar los estados con diferentes valores del momento cinético l de una
partícula se adopta en general el siguiente simbolismo: los estados se representan
mediante letras del alfabeto latino de acuerdo con la correspondencia:
1=01234567 .. .
spdfghik .. .
El estado normal para el movimiento de una partícula en un campo central es
siempre un estado-s; en efecto, para l =/= O la parte angular de la función de onda
posee siempre nodos, mientras que la función de onda del estado normal no puede
poseerlos en modo alguno. Cabe también afirmar que el menor valor propio de
la energía para un valor de l dado crece al aumentar l. Ello se sigue de que la existencia de un momento cinético va ligada con la adición al hamiltoniano de un
término esencialmente positivo li2l(l+l)i2mr~, que crece al aumentar l.
Determinemos la forma de la función radial cerca del origen de co01denadas.
Supondremos que
lím U(r)r 2 = O.
r-+o
Escribamos R(r) como serie de potencias crecientes de r, conservando para valores
pequeños de r únicamente el primer término del desarrollo; con otras palabras,
representemos R(r) en la forma R = const. X r 5• Substituyendo esta expresión en
la ecuación
d(r2 dR/dr)/dr-l(l+ l)R
= O,
que se obtiene a partir de (32.8) multiplicando esta última por r 2 y pasando al límite para r -* O, se encuentra
s(s+ 1) = l(l+ 1).
De aquí se sigue
122
Movimiento en un campo central
s=l o
s=-(1+1).
La solución con s = - (/ + 1) no satisface las condiciones necesarias, ya que tiende
a infinito en r = O (recordemos que l > O). Queda así la solución con s = !, es decir,
cerca del origen de coordenadas las funciones de onda de los estados con valor dado
de l son proporcionales a r1:
R,
~ constante X
r.
(32.13)
La probabilidad de que la partícula se encuentre a una distancia del centro comprendida entre r y r+dr viene dada por r 2IR( 2 y es así proporcional a , 2<z+ 1 ). Vemos,
pues, que dicha probabilidad tiende a cero en el origen de coordenadas tanto más
rápidamente cuanto mayor es el valor/.
§ 33.
Movimiento libre (coordenadas esféricas)
La función de onda de una partícula que se mueve libremente
Y,p
= constante xt!.i/A)p,r
describe un estado estacionario en el que la partícula posee un impulso determinado p
(y una energía E= p 2/2m). Consideremos ahora los estados estacionarios de una
partícula libre en los que ésta posee no sólo un valor determinado de la energía,
sino también valores determinados del módulo y de la proyección del momento
cinético. En vez de la energía convendrá introducir el número de onda
k = p/li = v(2mE)/li.
(33.1)
La función de onda del estado con momento cinético l y su proyección m tiene
la forma:
'Pklm
= Rki(r) Yím(O, <f,),
(33.2)
donde la función radial se determina mediante 1a ecuación
,, 2 ,
Rki +-Rki
T
+[ k -1(1+1)]
- - Rk, =
r
2
2
(la ecuación (32.8) con U(r) == O). Las funciones de onda
nes de normalización y de ortogonalidad dos a dos:
O
"Pklm
(33.3)
satisfacen las condici-
La ortogonalidad mutua paré;l diferentes/, l' y m, m' queda garantizada por las funciones angulares. Las funciones radiales, en cambio, deben normalizarse por la
condición
Movimiento libre ( coordenadas esféricas)
jr Rk'iR1c, dr = 8(k'-k).
2
123
(33.4)
o
Si se normalizan las funciones de onda no « en la escala k », sino « en la escala de
energía», es decir, mediante la condición
jr RE,¡RE, dr = 8(E'-E),
2
o
según la fórmula general (5.14) tendremos:
REl = R1ci v'(dk/dE) = (1/li) v'(m/k)R1ci•
(33.5)
Para l = O la ecuación (33.3) se puede escribir:
d 2(rR )
_ _1c0_+k2rR1c0
dr2
= O;
su solución, finita parar= O y normalizada por la condición (33.4) (cf. (21.9)), es:
R'lcO
=
J=senkr.
r
(33.6)
'TT
Para resolver la ecuación (33.3) con l =/= O, haremos la substitución:
(33.7)
Rki = rxki·
Para Xkl se tendrá la ecuación
Xki"+2(l+1)xki'/r+k 2xk, = O.
Si se deriva esta ecuación respecto de r, se obtiene:
2(1+ 1)
2(1+ 1)]
Xk1 +--xkz"
+ [ k2 - - - Xki' = 0.
,
r2
1
"
Mediante la substitución Xkz' = rxk,z+i, esta ecuación toma la forma:
Xk,1+1
"+2(!+2)
' k2
---xk,z+1 + Xk,i+1
r
= o,
que coincide exactamente con la que debe satisfacer la función Xk,l+i· De este
modo las sucesivas funciones lkl están ligadas entre sí por la relación
(33.8)
y por consiguiente
124
Movimiento en un campo central
1d
Xkz = ( ; dr
)l
Xko,
donde Xko = Rko se define por la fórmula (33.6) (esta expresión puede todavía
multiplicarse, claro está, por una constante arbitraria).
Así, pues, para las funciones radiales del movimiento libre de una partícula
obtenemos en definitiva la siguiente expresión:
2
J
Rki=(-l)l
rl
(l d)Z senkr
-- -kl r dr
--
7T
(33.9)
r
(el factor k-1 se introduce por razones de normalización - cf. más adelante;
factor (- 1) 1 se introduce por comodidad (1)).
';!}
Para obtener una expresión asintótica de la función radial (33.9) a grandes distancias, observemos que el término que menos rápidamente decrece para r-+ oo
se obtiene derivando l veces la expresión sen kr:
Dado que
)l
d
(
d
--senkr
= ksen(kr-i-1r), ... , - - senkr = k1 sen(kr-!{1r),
dr
dr
1
( )
Las funciones
Rki
se pueden expresar mediante funciones de Bessel de orden semientero en la
forma:
Rki = v(k/r)]z+112(kr).
He aquí algunas de las primeras funciones
Rko
=
(33.9a)
Rki:
2 senkr
-k--,
7T
kr
J
cos kr]
R kl -_ J2-k [senkr
----2
7T
(kr)
kr
'
Rk2 = J:k[(2--~)senkr
3
7T
(kr)
kr
3 coskr]·
(kr) 2
Movimiento libre ( ooordenadas esféricas)
125
obtenemos la siguiente expresión asintótica:
Rkz ~
2 sen(kr-!hr)
J
-
(33.10)
·
1T
T
La normalización de. las funciones Rk1 se puede efectuar mediante sus expresiones
asintóticas conforme se explicó en el § 21. Comparando la fórmula asintótica (33.10)
con la función normalizada Rko (33.6), vemos que las funciones Rkt, con los coeficientes elegidos en (33.9), están efectivamente normalizadas cual deben.
Cerca del origen de coordenadas (r pequeño) tenemos, conservando solamente
el término con la más baja potencia de r:
d
1d )lsenkr
-_ (1- ( r dr
r
r dr
)'¿"' {-l)n_k2n+1,-2n
__
(2n+l)!
n..o
9 1 21
~
1 d )' k' + r
(-l)Z ( ; dr {2l+1)1
... 21
= {-1 )1k2l+l2.4
_ __
(21+ l)!
= (-1)1k21+1/1.3 ... (2l+1).
Por consiguiente, cerca del origen las funciones
R ,..,
kl
=
2
-
J
1r
Rkl
son de la forma (1):
lt-+1
,.Z
(21+ 1)!! '
(33.11)
de acuerdo con el resultado general (32.13).
En algunos problemas es necesario considerar funciones de onda que no satisfacen las condiciones ordinarias de finitud, sino que corresponden a un flujo de partículas que parten del origen de coordenadas. La función de onda que describe
este flujo de partículas con momento cinético l = O se obtiene si en vez de la « onda
esférica estacionaria» (33.6) se toma la solución en forma de « onda esférica divergente»:
{33.12)
En el origen de coordenadas esta función tiende a infinito.
(1) El símbolo !! representa el producto de todos los números naturales de igual paridad hasta el
número dado inclusive.
126
Movimiento en un campo central
Análogamente, un flujo de partículas que se dirigen hacia el centro del campo
(con momento cinético l = O), se representa mediante una función de onda cuya
forma es la de una « onda esférica convergente »:
Rk0-
= Ae-ikr¡r.
En el caso general de un momento cinético l
ecuación (33.3) en la forma (1):
r
= (-1)1A-
Rki±
(33.13)
=/= O obtenemos la
solución de la
(i- -)l- .
d
e±ikr
'Jl, r dr
(33.14)
r
Una expresión asintótica para esta función es
Rki* ~ Ae±iCkr-l1r;2>¡r.
(33.15)
En cambio, cerca del origen de coordenadas toma la forma:
Rkl±
"'
-
A
(2l-l)l!
'/(,
,--z-1 •
(33.16)
Normalicemos estas funciones de modo que correspondan a la emisión (o a la
absorción) de una partícula por unidad de tiempo. Observemos para ello que, a
grandes distancias, cada porción pequeña de la onda esférica puede considerarse
como plana y que la densidad de flujo de probabilidad en aquélla es igual a i = V'l/J'l/J*,
donde v = kli/m es la velocidad de la partícula. La normalización se determina
mediante la condición § i df = 1 , donde la integración se extiende a una superficie
esférica de radio r grande, es decir, J ir 2 do = 1, donde do es el elemento de ángulo
sólido. Conservando la condición de normalización de las funciones angulares como
antes, debemos igualar, por consiguiente, el coeficiente A de la función radial a
A
= 1/ vv = v(m/kli).
(33.17)
Una expresión asintótica análoga a la (33.10) vale no solamente para la parte
radial de la función de onda del movimiento libre, sino también para el movimiento
(con energía positiva) en un campo cualquiera que disminuye con rapidez suficiente al crecer la distancia (2). A grandes distancias, es posible prescindir en la ecua(1)
Estas funciones se pueden expresar mediante la función de Hankel
(33.14a)
(de especie 1 ó 2, según el signo sea
valores de r es:
e±i(kr-l1rJ2) [
± _
Rkz
2
( )
-
+o
A
r
--:-). El desarrollo asintótico de las funciones
1
l(l+ 1)
(l-1)l(l+ 1)(1+2)
=F 1! 2ikr +
2! (2ikr)2
Rki
para grandes
]
=F ··· ·
Como se demostrará en el § 123, el campo debe disminuir más rápidamente que 1/r.
Movimiento libre ( coordenadas esféricas)
127
ción de Schrodinger tanto del campo como de la energía centrífuga, con lo que
queda la ecuación aproximada
1 d2(rR )
_ _ _k_Z +k2Rkl
T
=
o.
dr2
Su solución general es
(33.18)
donde o1 es una constante (el corrimiento de fase), y el factor común se ha elegido
de acuerdo con la normalización de la función de onda « en la escala k » (1). La
constante de fase o1 se determina mediante la condición de contorno (finitud de Rk1
para r -+ O) para lo que hay que resolver la ecuación de SCHRODINGER exacta, y no
se puede calcular de forma general. Los corrimientos de fase o1 son, claro está, funciones tanto de l como de k y constituyen una importante característica de las funciones de onda del espectro continuo.
PROBLEMAS
1. Determinar los niveles de energía para el movimiento de una partícula con momento
cinético I = O en un pozo de potencial central:
U(r) = -U0 porr
Solución.
de
<
a, U(r) = Oporr
> a.
Para l =Olas funciones de onda dependen sólo der. Dentro del pozo la ecuación
es de la forma:
SCHRODINGER
1 d2
2
--:-:Cn/i)+k
if, = O,
2
T
dr
1
k
= ¡;v'[2m(U0 -IEI)].
r,,
La solución finita para r = O será
senkr
if,=A-.
T
Para r > a tenemos la ecuación
1 d2
--(rip)-K2tp = Ü,
T dr2
1
K
= -v(2mlEI).
ñ
La solución que tiende a cero en el infinito será:
1
( )
El término - ln/2 en el argumento del seno se ha introducido a fin de que cuando no existe campo
sea óz = O. Dado que el signo de la función de onda carece de importancia, las fases óz se determinan
salvo un múltiplo nn (y no 2nn); por ello sus valores se pueden siempre limitar al intervalo comprendido
entre O y n.
128
Movimiento en un campo cent-:-al
tf,
=
A'e-KT/r.
La condición de continuidad de la derivada logarítmica de np en r
k ctg ka =
=
a
nos da
= - v'[(2mU0/lí 2)-k2 ],
-K
(1)
o bien
± v'(n2/2ma 2 U0)ka.
senka =
(2)
Esta ecuación determina en forma implícita los niveles de energía buscados (deben tomarse aquellas
raíces de la ecuación para las que ctg ka < O, conforme se deduce de (1)). El primero de estos
niveles (el nivel con l = O) es a la vez el más bajo de todos los niveles energéticos, es decir, corresponde al estado normal de la partícula.
Para una profundidad U0 demasiado pequeña del pozo de potencial, no existe ningún nivel
de energía negativo, la partícula no puede ser «retenida» por el pozo. Esto se ve fácilmente teniendo en cuenta la ecuación (2) y con ayuda de la siguiente construcción gráfica. Las raíces de
una ecuación de la forma ± sen x = cxx se representan por los puntos de intersección de la recta
y= cxx con la curva y = ± sen x, debiéndose considerar solamente aquellos puntos de intersección en los que ctg x < O; los correspondientes arcos de las curvas y = ± sen x se representan
en la fig. 9 mediante líneas de trazo continuo. Vemos que para valores demasiado grandes de oi:
(demasiado pequeños de U0 ) no existen tales puntos de intersección. El primero de ellos aparece
cuando la recta y = cxx toma la posición Oa, es decir, para ex = 2/n y se encuentra para x = n/2.
Haciendo ~ = ñ/v'(2ma2 U0 ), x = ka, obtenemos a partir de aquí y para la mínima profundidad
del pozo tal que aparezca el primer nivel negativo, la expresión
(3)
Esta cantidad es tanto mayor cuanto menor es el radio del pozo a. La posición del primer
nivel E 1 en el momento en que aparece se determina a partir de ka = n/2 y es igual a E 1 = O, como
era natural esperar. A medida que aumenta la profundidad del pozo, baja también el nivel normal E 1•
a
y
/
/
-
/
'
/
\
' ' ,_ ....,-<enx '
/
FIG. 9
2. Determinar el orden de los niveles energéticos con diferentes valores del momento cinético len un pozo de potencial muy profundo (Uo ~ ñ.2jma 2 ) (W. ELSASSER, 1933).
=
la función 1P tienda
Solución. La condición en la frontera del pozo exige que para U0 ---+
a cero (véase § 22). Escribiendo la función de onda radial dentro del pozo en la forma (33.9a),
obtenemos la ecuación
Movimiento libre ( coordenadas esféricas)
129
]z+1;2(ka) = O,
cuyas raíces determinan la posición de los niveles a partir del fondo del pozo (Uo-lEI = ñ2k2/2m)
para diferentes valores de /. El orden en que se colocan, partiendo del estado fundamental, resulta
ser el siguiente :
1s, 1p, 1d, 2s,
1/, 2p, 1g, 2d, 1h, 3s, 2/, ....
El número delante de la letra ordena de manera creciente la sucesión de niveles con igual valor
de l (1).
3. Determinar el orden en que aparecen los niveles con diferentes valores de I a medida que
crece la profundidad del pozo U0 •
Solución. En el momento en que aparece por primera vez, el nuevo nivel posee la energía
E = O. La correspondiente función de onda en la región fuera del pozo y que tiende a cero para
r-+ = es Ri = const x ,-(l+l) (solución de la ecuación (33.3) con k = O). De la continuidad de
Ri y R'i en el límite del pozo se sigue, en particular, la continuidad de la derivada (r 1+1Rl)', de
donde se deduce, en el presente caso, para la función de onda dentro del pozo la siguiente condición:
(rl+IRz)'
=O
para
r = a.
Esta ecuación es equivalente (2) a la condición de que se anule la función R1_ 1 y, teniendo en cuenta
(33.9a), obtenemos la ecuación
]z-112(ay(2mUo)/~) = O;
para 1 = O hay que substituir la función J¡_ ! por la función cos. De aquí resulta el siguiente orden
de aparición de nuevos niveles al crecer U0 :
1s, 1p, 1d, 2s,
1/, 2p, 1g, 2d, 3s, 1h, 2/, ....
Obsérvese que las diferencias en el orden de los niveles con relación al caso del pozo profundo
se manifiestan solamente para niveles relativamente altos.
4. Determinar los niveles de energía del oscilador espacial (es decir, de una partícula en el
campo U = ~ mw 2r 2), la multiplicidad de su degeneración y los valores posibles del momento
cinético orbital en los correspondientes estados estacionarios.
Solución. La ecuación de SCHRODINGER para una partícula en el campo U= !mw 2(x 2 +y2 +z2 )
admite,la separación de variables, que conduce a 'tres ecuaciones del tipo correspondiente a un
oscilador lineal. Por consiguiente, los niveles de energía son:
El orden de degeneración del n-ésimo nivel es igual al número de descomposiciones de n en
suma de tres números enteros positivos (incluido el valor O)(ª); dicho número es igual a
Esta notación es la adoptada para los niveles de las partículas en un núcleo (véase cap. XVI).
De acuerdo con (33.7-8) tenemos (r-lR 1)',...., r-lRr+i· Dado que la ecuación (33.3) no cambia al
substituir l por - / - 1, tenemos también (rl+lR_¡_ 1)' == rt+ 1 R_1. Finalmente, puesto que las funciones
R_1 y R 1_1 , satisfacen la misma ecuación, obtenemos en definitiva (rl+ 1 Rz)' ,...._, rl+ 1 R1_1, relación que se
utiliza en el texto.
( 3)
Con otras palabras, éste es el número de maneras posibles de distribuir n bolas idénticas entre
tres urnas.
(
1
)
( 2)
130
Movimiento en un campo central
l(n+ l)(n+2).
Las funciones de onda de los estados estacionarios son
(1)
donde a: = v'(mw/ñ) (m es la masa de la partícula). Al cambiar -el signo de una coordenada, el
polinomio Hn queda multiplicado por (- 1)1'; Por consiguiente, la paridad <le la función (1) es
(-t)n1+n2+na = (-t)n. Formando las combinaciones lineales de estas funciones para un valor
dado de la suma n1 + n2 + n3 = n, se pueden construir las funciones
'Pnlm = constante
X
e-a 2 r 2 /2rn0 1m(8)e±imrf>,
(2)
donde m = O, 1, ... , l, y l toma los valores O, 2, ... , n para n par y 1, 3, ... , n para n rmpar;
esto último es evidente comparando la paridad (- l)n de las funciones (1) y la paridad (-1)1 de
las funciones (2), que deben ser iguales. Se determinan así los valores posibles del momento cinético orbital que corresponden a los niveles energéticos considerados.
El orden de sucesión de los niveles del oscilador espacial (con la misma notación que en los
problemas (2) y (3)) es, por lo tanto, la siguiente:
(ls), (lp), (ld, 2s), (lf, 2p), (lg, 2d, 3s), ... ,
donde dentro de un paréntesis se encierran los estados degenerados de igual energía.
§ 34.
Desarrollo de una onda plana
Consideremos una partícula libre que se mueve con impulso determinado p = kh
en el sentido positivo del eje z. La función de onda de esta partícula tiene la forma:
if, = constante X eikz.
Desarrollemos esta función en funciones de onda 'Wklm del movimiento libre con
valores del momento cinético determinados. Dado que en el estado considerado
la energía posee un determinado valor E = k 2 li,2/2m, es claro que en el desarrollo
que se busca aparecerán solamente funciones con el mismo valor de k. Además,
puesto que la función eikz posee simetría axil en torno del eje z, en su desarrollo
pueden aparecer solamente funciones que no dependan del ángulo cf,, es decir, funciones con m = O. Así, pues, debe ser:
donde los a1 son constantes. Substituyendo las expresiones (27.3), (28. 7), (33.9) para
las funciones <1>, e, R, obtenemos:
eikZ
=
)l senkr¿" CiPi( 8) (r)l(l
-d
cos
l-0
k
r dr
kr
(z
= r cos 8),
131
Desarrollo de una onda plana
donde C1 son otras constantes. Estas últimas se determinari sin dificultad comparando los coeficientes de (r cos fJ)n en los desarrollos de ambos miembros de la igualdad en potencias de r. En el segundo miembro de ésta, un término de dicho tipo
aparece únicamente en el n-ésimo sumando; para l > n el desarrollo de la función
radial comienza con potencias de mayor grado en r, y para l < n el polinomio
Pt(cos O) contiene potencias menores de cos O. El término con cos1 f) en Pt(cos O)
tiene por coeficiente (2!)!/21(/!) 2 (véase la fórmula (c, 2)). Utilizando también la
fórmula (33.11), encontramos el término que nos interesa del desarrollo del segundo
miembro de la igualdad,
(21)! (kr cos 8)1
(-l)'C,-2,-(l!-)2-(2-l+-1)-!I°
En el primer miembro, el término correspondiente (en el desarrollo de
eikr
cos O) es
(ikr cos 8)1/l!.
Igualando estas dos cantidades, encontramos C1 = (- i)1(2l + 1). Obtenemos así en
definitiva el desarrollo buscado:
eikZ =
" (-i)'(2l+ 1)Pi(cos 8) (')'(1
¿
- -d)' senkr
--.
z-o
k
r dr
kr
(34.1)
Para grandes distancias este desarrollo toma la forma asintótica:
eikz
1
¿ i (2l+ l)Pz(cos8)sen(kr-i11r).
kr z-o
~-
00
1
(34.2)
Normalizaremos la función de ~mda eikz igualando a la unidad la densidad de
corriente de probabilidad, es decir, de forma que corresponda a un flujo de partículas (paralelo al eje z) a través de la superficie unidad tal que por ella pase una partícula
por unidad de tiempo. Es fácil ver que esta función es
tp
=
v-I/2eikz = v(m/kfi)eikz,
(34.3)
(ves la velocidad de las partículas). Multiplicando ambos miembros de la igualdad
(34.1) por v'(m/kñ)e introduciendo en el segundo miembro las funciones normalizadas "P±klm = R±k1(r)Y1m(O, cp), obtenemos:
El cuadrado del módulo del coeficiente de "P--klo (o de 1P+k10 ) en este desarrollo
determina, de acuerdo con las reglas generales, la probabilidad de que una partícula
del flujo que se dirige hacia el origen (o que diverge de él) posea un momento cinético l
132
Movimiento en un campo central
(con relación al origen de coordenadas). Dado que la función de onda eikzJV v corresponde a un flujo de partículas de densidad igual a la unidad, dicha «probabilidad»
posee las dimensiones del cuadrado de una longitud; se puede representar intuitivamente como valor del « área de impacto» (en el plano x, y), área a la que tiene que
ir a parar la partícula incidente si su momento cinétic0 es igual a/. Representando
esta cantidad por a1, tenemos:
ª' = 11'(21+ 1)/k = 11'(Aj211')2(2l+ 1),
2
(34.4)
(A es la longitud de onda de De Broglie de la partícula).
Para grandes valores de / la suma de las áreas de impacto correspondientes al intervalo M de valores l (tal que 1 ~ f:,.[ ~ l) es igual a:
""
~
Al
17'
crz ~ -211:!l
k2
lJi2
= 21r-lll.
p2
Substituyendo la expresión clásica del momento cinético lil =
llamado parámetro de impacto) esta expresión se transforma en
pp (donde e es el
211'pllp,
que coincide con la expresión clásica. No se trata aquí de un hecho casual: veremos
más adelante que para grandes valores de l el movimiento es cuasiclásico (véase
capítulo VII).
§ 35.
«Caída» de una partícula hacia un centro de fuerzas
Para explicar ciertas características peculiares del movimiento en mecánica cuántica, es útil estudiar un caso que, a decir verdad, no tiene un sentido físico inmediato:
el movimiento de una partícula en un campo cuya energía potencial se hace infinita
en un cierto punto (el origen de coordenadas) de acuerdo con la ley U(r) ~ -{3/r 2 ,
f3 > O; la forma del campo lejos del origen de coordenadas no nos interesa aquí.
Vimos en el § 18 que es éste un caso intermedio, en cierto sentido, entre aquellos
casos en los que &e tienen estados estacionarios en sentido ordinario, y aquellos otros
en los que tiene lugar una « caída » de la partícula al origen de coordenadas.
Cerca del origen de coordenadas, la ecuación de ScHRODINGER en el caso considerado será la siguiente:
R" +2R'/r+yR/r2 = O,
(35.1)
(R(r) es la parte radial de la función de onda), donde se ha introducido la constante
y =
2mfJ/li2 -l(l+ 1)
(35.2)
y se ha prescindido de todos los términos de orden inferior en 1/r; el valor de la ener-
«Caída» de una partícula hacia un centro de fuerzas
133
gía E se supone finito y, por consiguiente, también se prescinde en la ecuación del
término correspondiente.
Busquemos para R una expresión de la forma R ,...., ,s; se obtiene entonces para s
la ecuación de segundo grado
s(s+ l)+y = O,
que posee las dos raíces
S¡
= -}+ y(¡-y),
S2
= -!- v(¡-y).
(35.3)
Para continuar el análisis conviene proceder de la siguiente manera. Tracemos
alrededor del origen de coordenadas un pequeño entorno de radio rO y substituyamos
en él la función -y/r 2 por la cantidad constante-y/rl. Determinando las funciones
de onda en este campo «cortado», veamos qué se obtiene al pasar al límite para
'º~o.
Supongamos primero que y < i. Entonces s1 y s2 son números reales negativos,
siendo además s1 > s2 • Para r > rO la solución general de la ecuación de SCHRODINGER tiene la forma (se trata siempre de valores de r pequeños):
(35.4)
R = Arª1+Brª1,
(A, B son constantes). Parar
< r0 la solución de la ecuación
R"+2R'/r+yR/r02 = O
que es finita en el origen es de la forma:
R
senkr
= C--, k = v'y/r0 •
r
(35.5)
Para r = rO la función R y su derivada R' deben ser funciones continuas. Conviene
escribir una de estas condiciones como condición de continuidad de la derivada
logarítmica de rR. Esto conduce a la ecuación
A(s1 + l)r/1+B(s2 + 1)r0',
- - - - - - - - - - = kctgkr0 ,
Ar0 ªí+l+Br 0 8 .+1
o bien
A(s1 + 1)r0 ªi+B(s 2 + 1)r0 '•
-------- =
Ar/1+Br0ª•
v'y ctg v'y.
Una vez resuelta respecto de la razón B/ A, esta ecuación conduce a una expresión
de Ja forma
134
Movimiento en un campo central
(35.6)
Pasando ahora al límite r O ~ O, encontramos que B/ A __,,. O (recordemos que
s1 > sJ. De esta manera resulta que de las dos soluciones de la ecuación de SCHRODINGER (35.1) que divergen en el origen de coordenadas debe elegirse la que tiende
a infinito más lentamente:
R
Supongamos ahora y>
1/ •
4
S¡
= A/rl•11.
(35.7)
Las raíces s1 y s2 son entonces complejas:
= -}+iv'(y-1),
S2
S¡*,
Repitiendo los razonamientos anteriores, llegamos de nuevo a la igualdad (35.6),
la cual, al substituir los valores de s1 y s2 , nos da:
B/A = constantexr/v'<4.,..-1>.
(35.8)
Para r O ~ O esta expresión no tiende a ningún límite determinado, de modo que es
imposible el paso directo al límite para rO ~ O. Teniendo en cuenta (35.8), la forma
general de la solución real se puede escribir de la siguiente manera:
R = constante xr-1/2 cos( v'(y-i) log(r/ro)+ constante).
(35.9)
Esta función posee ceros cuyo número crece sin límite al disminuir r 0 • Dado
que, de una parte, la expresión (35.9) es válida para la función de onda (y valores
de r suficientemente pequeños) cualquiera que sea el valor finito de la energía E
de la partícula, y que, de otra parte, la función de onda del estado normal no puede
tener ceros, podemos concluir que el « estado normal » de una partícula en el campo
considerado corresponde a la energía E - oo. Pero en cualquier estado del espectro discreto la partícula se encuentra esencialmente en una región del espacio en la
que E > U. Por lo tanto, para E ~
oo la partícula se encuentra en una región
infinitamente pequeña en torno del origen de coordenadas, es decir, tiene lugar la
« caída » de la partícula al centro.
El campo «crítico» Ucr para el que es justo posible la «caída» de la partícula
al centro, corresponde al valor y= !- El menor valor del coeficiente de - 1/r2
se obtiene para l = O, es decir,
Ucr = -ñ.'1·/8mr2 •
(35.10)
De la fórmula (35.3) (para s1) resulta evidente que la solución admisible de la
ecuación de SCHRODINGER (cerca del punto en el que U,......, 1/r2) diverge para r ~ O
no más rápidamente que 1/V r. Si el campo tiende a infinito más lentamente que
1/r2 para r ~ O, en la ecuación de SCHRODINGER y en el entorno del origen de coordenadas se puede prescindir por completo de U(r) frente a los términos restantes
y obtenemos las mismas soluciones que en el caso del movimiento libre, es decir,
1P,...., r 1 (véase§ 33). Finalmente, si el campo tiende a infinito más rápidamente que
Movimiento de un campo coulombiano ( coordenadas esféricas)
135
1¡,s con s > 2), la función de onda en el entorno del origen es proporcional a , 1-s1 (véase el problema del § 49). En todos estos casos el producto
rtp se anula parar= O.
1/r 2 fcomo -
Examinemos ahora las propiedades de las soluciones de la ecuación de ScHRoDINGER correspondiente a un campo que decrece a grandes distancias de acuerdo
con la ley U ~ -f.J/r 2 , con independencia de su forma a distancias pequeñas. Supongamos primero que y < !-. Es fácil ver que en este caso puede existir solamente
un número finito de niveles de energías negativos (1). En efecto, para la energía
E= O la ecuación de ScHRODINGER a grandes distancias es de la forma (35.1) con
la solución general (35.4). Pero la función (35.4) carece de ceros (para r =f= O); por
consiguiente, todos los ceros de la función de onda radial buscada se encuentran
a distancias finitas del origen de coordenadas y su número es, en cualquier caso,
finito. Con otras palabras, el número ordinal que corresponde al nivel E = O, que
cierra el espectro discreto, es finito.
Si, en cambio y > t, el espectro discreto contiene un número infinito de niveles
de energía negativos. En efecto, la función de onda del estado con E = O posee
a grandes distancias la forma (35.9), con un número infinito de ceros, de modo que el
número ordinal correspondiente es, en cualquier caso, infinito.
Finalmente, supongamos que el campo es U= -f.J/r 2 en todo el espacio. En
estas condiciones, para y > t tiene lugar la << caída » de la partícula. Si, en cambio,
y <
no existe ningún nivel de energía negativo. En efecto, la función de onda
del estado con E = O será en todo el espacio de la forma (35. 7); carece así de ceros
a distancia finita, es decir, corresponde al más bajo nivel de energía (para el valor
dado de/).
¡,
§ 36.
Movimiento de un campo coulombiano (coordenadas esféricas)
Un caso muy importante de movimiento en un campo central lo constituye el
movimiento en un campo coulombiano
u= ±('/.Ir
(ex es una constante positiva). Consideraremos primero la atracción coulombiana,
de acuerdo con lo cual escribiremos U= - (f./r. De las consideraciones generales
que preceden resulta evidente que el espectro de valores propios negativos de la
energía será discreto (con un número infinito de niveles), y que el espectro de energías positivas será continuo.
La ecuación (32.8) para las funciones radiales es de la forma:
{ 1)
Se supone que para valores pequeños de r el campo es tal que no puede tener lugar una «caída»
de la partícula.
136
Movimiento en un campo central
d2R 2 dR l(l+ 1)
2m(
ex.)
----R
+ -2 E+- R = O.
dr2 r dr
r2
/i
r
-+-
(36.1)
Si se trata del movimiento relativo de dos partículas que se atraen, hay que entender
por m su masa reducida.
En los cálculos relacionados con el campo de Coulomb, es cómodo utilizar en
vez de las unidades ordinarias ciertas unidades particulares para la medida de todas
las cantidades, unidades que llamaremos unidades coulombianas. Eligiremos así
como unidades de masa de longitud y de tiempo, respectivamente, las cantidades:
m, li,2/mcx.,
n3/ma2•
Todas las demás unidades se deducen de aquí; así, la unidad de energía será:
m('J.2¡n2.
A partir de aquí, en este párrafo y en el que sigue utilizaremos siempre (salvo indicación expresa) esas unidades (1).
Escribamos la ecuación (36.1) en las nuevas unidades:
2
d R 2 dR l(l+ 1)
(
1)
-+- - - - R + 2 E+- R
dr rdr
r
r
2
2
= O.
(36.2)
Introduzcamos en vez del parámetro E y de la variable r nuevas cantidades
n
= 1/ v'(-2E),
p
= 2r/n.
(36.3)
Para valores negativos de E (que serán los que primero consideraremos) n es un
número real positivo. La ecuación (36.2), después de substituir (36.3), toma la forma:
2
p
R"+-R'+
[
n l(l+l)]
-!+---R
p
p2
=0
(36.4)
(los apóstrofos significan la derivación respecto de e).
1
( )
Si rn = 9,11 x 10- 2 s ges la masa del electrón y r:,. = e2 (e es la carga del electrón), las unidades
coulombianas coinciden con las llamadas unidades atómicas. La unidad atómica de longitud es:
li,2f me2 = 0,529 x 10-s cm
(el llamado radio de Bohr). La unidad atómica de energía es igual a
me4/n2 = 4,36 X 10-11 erg = 27,21
electrón-volts.
La unidad atómica de carga es e = 4,80 x 10- ues. El paso a las fórmulas con unidades atómicas se efectúa formalmente haciendo e= 1, m = 1, h = l. Para r:,. = Ze 2 , las unidades coulombianas difieren de
las atómicas.
10
Movimiento de un campo coulombiano ( coordenadas esféricas)
137
Para valores pequeños de e, la solución que cumple las condiciones necesarias
de finitud es proporcional a e1 (véase (32.13)). Para determinar el comportamiento
asintótico de R para grandes valores de e, prescindiremos en (36.4) de los términos
con 1/e y 1/(¿2, obteniendo así la ecuación
R"
=
iR,
de donde R = e± P/2 • La solución que nos interesa - la que se anula en el infinito se comporta, por consiguiente, para grandes valores de e como e-P/ 2•
En estas condiciones, es natural efectuar la substitución
R
= p1e-pí2w(p),
(36.5)
con lo cual la ecuación (36.4) toma la forma:
pw"+(2l+2-p)w'+(n-l-1)w = O.
(36.6)
La solución de esta ecuación debe diverger en el infinito no más rápidamente que
una potencia finita de e, y para e = O debe ser finita. La solución que satisface
esta última condición es la función hipergeométrica confluente
w = F(-n+l+l, 21+2, p)
(36.7)
(véase § d de los apéndices matemáticos) (1). La solución que satisface la condición
en el infinito se obtiene únicamente para valores enteros y negativos (o para el valor
nulo) de -n+t+I, en cuyo caso la función (36.7) se reduce a un polinomio de
grado (n - l - l ). En el caso contrario, dicha solución diverge en el infinito como eP
(véase (d, 14)).
Llegamos así a la conclusión de que el número n debe ser un entero positivo
y tal que, para un l dado:
n
> l+l.
(36.8)
Recordando la definición (36.3) del parámetro n encontramos que:
E = -1/2n2, n = 1, 2, ....
(36.9)
Queda así resuelto el problema de determinar los niveles de energía del espectro
discreto en un campo coulombiano. Vemos que existe una multiplicidad infinita de
niveles entre el nivel normal E 1 = - l y cero. Los intervalos entre cada dos niveles
(1)
La segunda solución de la ecuación (36.6) diverge para(!-'?- O como (F 2 i-1 •
138
Movimiento en un campo central
consecutivos disminuyen al auamentar n; los niveles se adensan a medida que nos
acercamos al vafor E= O, valor en el cual el espectro discreto enlaza con el continuo.
En unidades ordinarias la fórmula (36.9) tiene la forma siguiente (1):
E = - moc2/2h2n2 •
(36.10)
El número entero n se llama número cuántico principal. El número cuántico
radial, definido en § 32, es, en cambio, igual a
n.,
= n-l-1.
Para un valor dado del número cuántico principal, el número l puede tomar los
valores
l = O, 1, ... , n-1,
(36.11)
en total n valores diferentes. En la expresión (36.9) de la energía aparece sólo el
número n. Por consiguiente, todos los estados con valores diferentes de /, pero con
iguales valores de n, poseen la misma energía. Así, pues, cada valor propio resulta
degenerado, no só}o en relación con el número cuántico magnético m (cual ocurre
en todo movimiento en un campo central)f: sino también respecto del número l.
Esta última degeneración (calificada de accidental) es específica precisamente del
campo coulombiano. A cada valor dado de l corresponden, conforme sabemos,
21 + 1 valores diferentes m. Por lo tanto, la multiplicidad de la degeneración del
n-ésimo nivel energético es igual a:
ti-1
~ (21+1)
l=O
= nª.
(36.12)
Las funciones de onda de los estados estacionarios se determinan mediante las
fórmulas (36.5), (36. 7). La función hipergeométrica confluente con valores enteros
de ambos parámetros coincide, salvo un factor, con los llamados polinomios generalizados de Laguerre (véase§ d de los apéndices matemáticos). Por lo tanto,
Rni
2Z+1
= constante Xp1e-Pl 2Ln+l (p).
Las funciones radiales deben normalizarse mediante la condición
j Rni"r dr = 1.
1
o
(1) N. BOHR fue el primero en obtener la fórmula (36.10) en 1913, antes de que apareciera la mecánica
cuántica. Dentro del marco de esta última, fue deducida por W. PAuu, en 1926, siguiendo el método matricial y por ScHRODINGER, al cabo de unos meses, a partir de la ecuación de ondas.
Movimiento de un campo coulambiano (coordenadas esféricas)
139
Su forma final es la siguiente (1):
R
=
2 J(n-Z-1)!e-r/n
- -[(n+l)I]ª
nª
ni -
J
2
1 2
n + (2l+l)!
(n+l)l
(n-l-1)!
(2r) L (2r)
-;;-
i 2i+1
n+i -;;-
(2r)1e-"fnF(-n+l+ 1 21+2 2r/n) ·
'
'
'(36.13)
(para el cálculo de la integral de normalización, véase§ f, integral (f.6)) (2).
Cerca del origen de coordenadas
Rnl
tiene la forma:
zl+l
Rn1 ~
,1.
- n2+Z(2l+ 1)!
J
(n+l)f
{n-l-1)!
•
{36.14)
rn-le-r /n.
(36.15)
A grandes distancias,
zn
Rni ~ { -1 )n-l-1
nn+l v'[(n+Z)! (n-Z-1)!]
La función de onda R10 del estado normal disminuye exponencialmente a distancias
del orden de r,...., 1, es decir, en unidades ordinarias, del orden de ñ2 /mct..
Los valores medios de las diferentes potencias de r se calculan mediante la fórmula
rk =
j
rk+ 2R,.i'"
dr.
o
1
( )
He aquí, en forma explícita, algunas de las primeras funciones Rnz:
Ze-",
R10
=
R20
= (1/ v2)e-rl2(1-!r),
R 21 = (1/2 v6)e-rl2r,
R 30
R81
(2/3 V3)e--m(
=
t-}+ ~,2).
2
(8/27 V6)e-r13r( 1-~,),
R88 = (4/81 v30)e-r1s,2.
( 2)
La integral de normalización se puede calcular también substituyendo la expresión (d. 13) para
los polinomios de Laguerre e integrando por partes (de manera análoga a como se calcula la integral (c.11)
para los polinomios de Legendre).
140
Movimiento en un campo central
La fórmula general para rk se puede obtener mediante la fórmula (f. 7). He aquí
algunos de los primeros valores rk (para k positivo y negativo):
i = ![3n2 -l(l+1)], r 2 = }n2[5n2 +1-3l(l+l)],
r-1
= 1/n2,
r- 2
(36.16)
= 1/n3(l+}).
El espectro de valores propios de la energía positivos es continuo y se extiende
de cero hasta infinito. Cada uno de estos valores propios es degenerado con multiplicidad infinita; a cada valor de la energía E corresponde una multiplicidad infinita de estados con valores de l que recorren todos los valores enteros de cero hasta =
(y con todos los valores posibles de m, para cada l dado).
El número n y la variable
rios puros:
(!
definidos por las fórmulas (36.3) son ahora imagina-
n = -i/ v'(2E)
= -i/k,
p
= 2ikr
(hemos introducido en vez de la energía el « número de onda » k
funciones propias radiales del espectro continuo son de la forma:
Rki =
e
k
(21+1)1
(36.17)
=
V2E).
(2kr)le-ikrF(i/k+l+l, 21+2, 2ikr),
Las
(36.18)
donde Ck es un factor de normalización. Dichas funciones se pueden representar
en la forma de una integral compleja (véase § d)
1
Rkz = Ci2kr)le-ikr2'1Ti
,C ( 2ikr)-i¡k-l-1
j eE 1--gg-21-2 df,
que se extiende al contorno representado en la fig. 10 (1 ). La substitución~
(t+n reduce esta integral a la forma más simétrica:
(36.19)
=
2ikr
Fm. 10
{1) En vez de este contorno se puede utilizar también cualquier otro circuito cerrado que roüee los
puntos singulares~= O y~= 2ikr en sentido positivo. Para l entero, la función V(~)= ~-n-l ·(~ - 2ikr)n-l
(véase § d) vuelve ai valor de partida al recorrer por completo dicho contorno.
141
Movimiento de un campo coulombiano ( coordenadas esféricas)
(el camino de integración rodea en sentido positivo los puntos t = ±
expresión resulta inmediatamente que las funciones Rk1 son reales.
Rki
= Ck
(-2kr)-l-l
1T
2
ij
,
e2ikrt(t+i)iJk-l-1(t-!)-iJk-z-1 dt;
n.
De esta
(36.20)
El desarrollo asintótico (d.14) de la función hipergeométrica confluente permite
obtener sin más el mismo desarrollo para las funciones de onda Rkl· Los dos términos en (d.14) conducen en la función Rkz a dos expresiones conjugadas complejas
y el resultado que se obtiene es:
e-1r¡2k {e-i[kr-1r(Z+1)12+(l/k) log2kr]
}
Rki = Ck--re
.
G(l+ 1+i/k, i/k-1, -2ikr) .
kr
r(l+l-i/k)
(36.21)
Si se normalizan las funciones de onda « en la escala k » (es decir, mediante la
condición (33.4)), el coeficiente de normalización Ck es igual a
(36.22)
En efecto, la expresión asintótica de Rkz para grandes valores de r (primer término
del desarrollo (36.21)) tiene entonces la forma:
Rki
~
2l
1
- -sen(kr+- log 2kr-i11T+1i3,),
1TT
k
J
(36.23)
o,= argr(l+l-i/k),
de acuerdo con la forma general (33.18) de las funciones de onda normalizadas del
espectro continuo en un campo central. La expresión (36.23) difiere de (33.18) en
el término logarítmico que aparece en el argumento de la función seno; sin embargo,
dado que, al aumentar r, In r crece lentamente en comparación con el propio r,
la existencia de este término carece de importancia en el cálculo de la integral de
normalización, que diverge en el infinito.
El módulo de la función r que encontramos en la expresión (36.22) del factor
de normalización, se puede expresar mediante funciones elementales. Utilizando
las conocidas propiedades de la función r
r(z+ 1)
= zr(z},
r(z)r(l-z) = 7T/Sen1TZ,
tenemos:
r(l+ t+i/k) = (l+i/k) ... (l+i/k)(i/k)r(i/k),
r(l+l-i/k) = (l-i/k) ... (1-i/k)r(t-i/k),
142
Movimiento en un campo central
y también
¡r(l+ 1-i/k)I
=
[r(l+ 1-i/k)r(l+ 1+i/k)p12
=
J?:Il•-1 J(s
k
2
+~)senh-t~.
k
k
Por consiguiente
(36.24)
(para l = O el producto se substituye por la unidad).
Las funciones radiales RE1, normalizadas en la « escala de energías», se obtienen
a partir de las funciones Rkz dividiendo por Vk:
vk= RE,= k-*Rk,
(véase (33.5)).
El paso al límite para E-+ O (es decir, para k-+ O) permite obtener a partir de
REl la función radial correctamente normalizada R 01 para el caso particular de
en~rgía igual a cero (la función REz normalizada en la escala de energía se conserva
finita y no nula en el límite E -+ O, mientras que Rk1 -+ O para k -+ O). El límite
de la serie F(i/k+l+ 1, 21+2, 2ikr) para k-+ O es
2r
(2r)'
1 (21+2)11 + (21+2)(21+3)21
...
=
(2l+1)1(2r)-l-1/2J2,+1( v(8r]),
donde l 2z+ 1 es la función de Bessel de orden 21+ l. El coeficiente Ck (36.24) se reduce,
para k-+ O, a
Ck
~
2k-l+112 as k
-?
O.
De aquí se obtiene sin dificultad:
R 0, = v(2/r)J2z+1(,v[8r]).
(36.25)
La forma asintótica de esta función para grandes valores de r es la siguiente (1):
R 0, ~ (2/1r2r3) 1! 4 sen( v[Br]-l1r-b).
(36.26)
1
( )
Obsérvese que esta función corresponde a la aproximación cuasiclásica (§ 49) aplicada al movimiento en el intervalo (/ + l )2 ~ r ~ k-2 •
Movimiento de un campo coulombiano ( coordenadas esféricas)
143
En un campo de Coulomb repulsivo ( U = rx/ r) se tiene tan sólo un espectro
continuo de valores propios positivos de la energía. La ecuación de SCHRODINGER
en este campo se puede obtener formalmente a partir de la ecuación que corresponde
a un campo atractivo cambiando el signo der. Por lo tanto, las funciones de onda
de los estados estacionarios se obtienen inmediatamente de (36.18) aplicando este
mismo cambio. El coeficiente de normalización se determina de nuevo por la expresión a -intótica, y se obtiene en definitiva:
Rki
e,
=
e
k
(21+1)!
(2kr)leikrF(i/k+l+ 1, 21+2, -2ikr),
=
j~ke-",..lr(I+ l+i/kll
=
2vk
v(e21T/k-1)
Ilz
s-1
J( 1)
s2+ k2 .
(36.27)
La expresión asintótica de esta función para grandes valores de r es de la forma:
R., "'
J~ ~ kr-l
sen(
8i
log 2kr-!f.-+8.).
= argr(l+l+i/k).
(36.28)
PROBLEMAS
1. Determinar la. distribución de probabilidades de los diferentes valores del impulso en el
estado fundamental del átomo de hidrógeno.
Solución (1).
La función de onda del estado fundamental es
aµ=
R10Yoo
= (1/v7T)e-r.
La función de onda de este mismo estado en la representación-p resulta de aquélla mediante la
integral
a(p) = (21r)-3/2
f
rf,(r)e-tP,r dV
(véase (15.10)). La integral se calcula pasando a coordenadas esféricas con el eje polar dirigido
en el sentido del vector p; el resultado que se obtiene es ( 2):
(1)
En los problemas 1 y 2 utilizamos unidades atómicas.
Las funciones de onda en la representación-p para los estados excitados en un campo de Coulomb
se pueden encontrar en el libro: H. A. BETHE y E. E. SALPETER, Handbuch der Physik 35, 88, Springer,
Berlín 1957. Estas funciones fueron analizadas por V. A. FoK y aplicadas por él al cálculo de toda una
serie de sumas complicadas (lzv. AN SSSR. ser. fizich., n. º 2, 169, 1935).
(2)
144
Movimiento en un campo central
2,v2
a(p) =
7T
1
(1 +p2)2'
y la densidad de probabilidad en la representación-p es [a(p)¡ 2 •
2. Determinar el potencial medio del campo creado por el núcleo y el electrón en el estado
fundamental del átomo de hidrógeno.
Solución. La manera más fácil de determinar el potencial medio 'Pe ·creado por la « nube
electrónica » en un punto arbitrario r consiste en hallar la solución con simetría esférica de la
ecuación de Poisson para una densidad de carga e = - [1¡.,2[:
1 d2
--(rc/>e) = 4e-2r.
r dr2
Integrando esta ecuación, eligiendo las constantes de forma que cf,e(O) sea finita y que cf,e(=)
=
O,
y sumando luego el potencial del campo del núcleo, se obtiene:
4,
~ +ef,e(r) =
=
(~
+ 1).-•,.
parar ~ 1 tenemos cf, ,...._, 1/r (campo del núcleo), y para r ~ 1 se tiene el potencial cf, ,...._, e- 2 r (apantallamiento del núcleo por el electrón).
3. Determinar los niveles de energía de una partícula que se mueve en un campo central cuya
energía potencial es U = A/r 2 - B/r (fig. 11).
U(r)
U(r)
r
FIG. 11
FIG. 12
Solución. El espectro de energías positivas es continuo, y el de energías negativas, discreto;
consideremos este último. La ecuación de SCHRODINGER para la función radial es:
d R 2 dR 2m(
lt
1 A B)
-+---+E--l(l+l)---+R =
dr2 r dr
lt2
2m
r2 r2 r
2
2
Introduzcamos la nueva variable
p
= 2 v(-2mE)r/lt,
O.
(1)
Movimiento de un campo coulombiano ( coordenadas esféricas)
145
y Ja notación
2mA/n2 +l(l+ 1)
=
s(s+ 1),
(2)
(3)
Bv'(m/-2E)/ñ = n.
La ecuación (1) toma entonces la forma:
2
(
R" +-R' +
p
1 n s(s+l))
--+---R
4 p
p2
=
O,
que coincide formalmente con (36.4) .. De ello resulta, sin más, que la solución que satisface las
condiciones necesarias es:
R
= p8 e-P/2F(-n+s+ 1,
2s+2, p),
donde n - s - l = p debe ser un número entero positivo (o nulo) y s es la raíz positiva de la
ecuación (2). De acuerdo con la definición (3), obtenemos, por consiguiente, los niveles de energía:
4.
Problema igual que el anterior, pero con U= A/r 2 +Br 2 (fig. 12).
Solución.
Sólo existe un espectro discreto. La ecuación de ScHRODINGER será la siguiente:
d2R 2 dR
Zm[
-+
- - + -2 E
dr2 r dr
h
li 2l(l+ 1)
2mr2
A
r2
Br2 ]R = O.
Introduciendo la variable
f
= v'(2mB)r2/h
y las notaciones
l(l+ 1)+2mA/h2
= 2s(2s+ 1),
v'(2m/B)E/ñ = 4(n+s)+3,
obtenemos la ecuación
3
fR"+-R'+[n+s+!-!f-s(s+i)/flR
2
La solución buscada se comporta asintóticameme para,;-,..
de ,; es proporcional a c;S, donde s es el valor positivo
=
O.
= como e-;'2, y para valores pequeños
s = l[-1+ v'{(2l+1)2+8mA/h2 }].
146
Movimiento en un campo central
Por lo tanto, buscaremos la solución en la forma:
con lo que se obtiene para w la ecuación
de donde
siendo n un número entero no negativo. Para los niveles de energía obtenemos, por consiguiente,
una multiplicidad infinita de valores uniformemente distribuidos
E,. = liv(B/2m)[4n+2+ v{(2l+ 1)2+8mA/li2}], n = O, 1, 2, ....
§ 37.
Movimiento en un campo coulombiano (coordenadas parabólicas)
La separación de variables en la ecuación de ScHRODINGER, escrita en coordenadas esféricas, es siempre posible para el movimiento en un campo central cualquiera.
En el caso del campo de Coulomb, la separación de variables es también posible
cuando se adoptan coordenadas parabólicas. La solución del problema del movimiento en un campo coulombiano en coordenadas parabólicas es útil para el estudio
de una serie de problemas en los que una determinada dirección en el espacio resulta
ser privilegiada, por ejemplo, debido a la presencia de un campo eléctrico exterior
(aparte del coulombiano) (§ 77).
Las coordenadas parabólicas ~' 17, <p se definen mediante las fórmulas
X
=
v(fr¡)coscf,, y
T
=
v(x2+y2+z2)
=
=
v(g71)sencf,,
Z
=
t(g-71),
}(g+71),
(37.1)
o, recíprocamente:
g = r+z,
71
= r-z, cf,
=
arctg(y/x);
(37.2)
~
y 17 toman valores comprendidos entre O e oo, y <p recorre el intervalo O, 2n. Las
superficies ~ = const. y 17 = const. son paraboloides de rotación de eje z y foco
en el origen de coordenadas. Este sistema de coordenadas es ortogonal. El elemento
de longitud viene dado por la expresión
(di)'
= ':,, (dg¡•/:,, (d,¡)'H,1(d<fo)',
(37.3)
Movimiento en un campo coulombiano ( coordenadas parabólicas)
147
y el elemento de volumen es:
(37.4)
De (37.3) se sigue para el operador de Laplace la expresión
6
4 [
= ,+11
º'o('º'o) + o( ao)] +,
011
11
1 a2
11 acf,2 •
11
(37.5)
La ecuación de ScHRODINGER para una partícula en un campo de Coulomb
atractivo
U= -1/r
=
-2/(t+TJ)
se escribe:
4 [
,+11
a( ai¡,) o(11oif,)] 1 02i¡, (
2 )
ag
+ 011 011 + , 11 ocf,2 +z E+ ,+ 11 if, = º·
'º'
(37.6)
Busquemos las funciones propias 1P de la forma:
(37.7)
donde m es el número cuántico magnético. Substituyendo esta expresión en la ecuación (37.6), multiplicada por (~+17)/4, y separando las variables~ y 17, obtenemos
para f 1 y A las ecuaciones
(37.8)
donde los « parámetros de separación »
/31, /32 están ligados
entre sí por la relación
(37.9)
Consideremos el espectro discreto de energía (E< O). Introduzcamos en vez
de E, ;, r¡ las cantidades
n
= 1/ v(-2E),
PI
= ev(-2E) = eJn,
= r,/n,
P2
(37.10)
con lo que obtenemos la ecuación para f 1 :
d2f1 +1 df1 [
1 (lml+l
)
-+ -!+--+n1
-2
dp1
P1 dp¡
P1
2
m2
]
--- / 1 =
4p¡2
O,
(37.11)
Movimiento en un campo central
148
y la correspondiente ecuación para/.¿, habiendo introducido también las notaciones
(37.12)
De manera análoga a como se procedió en el caso de la ecuación (36.4), se encuentra que / 1 se comporta para grandes valores de (h como· e-iPz, y para valores
de g1 pequeños, como ei1".1112 • De acuerdo con esto, buscaremos la solución de la
ecuación (37.11) adoptando para ella la forma:
/1(P1) = e-P1/2p¡Jmlf2wi(p1),
(y análogamente para / 2), con lo que obtenemos la ecuación en w1
P1W1"+(lml+l-p¡)w¡'+n1W1 = O.
Esta es de nuevo la ecuación de una función hipergeométrica confluente. La solución
que satisface la condición de finitud será:
w1 = F(-n 1 , lml+1, p1 ),
donde n1 debe ser un número entero no negativo.
Así, pues, cada estado estacionario del espectro discreto se determina en coordenadas parabólicas por tres números enteros: los « números cuánticos parabólicos »
n1 y n2 y el número cuántico magnético m. Para el número n ( « número cuántico principal») se tiene, en virtud de (37.9) y (37.12):
n
= n1 +n2+lml+1.
(37.13)
Para los niveles de energía se obtiene, claro está, el resultado anterior (36.9).
Para n dado, el número \m l puede tomar n valores distintos,de O hasta n - 1.
Fijados n y Jm\, el número n1 toma n - \mi valores, desde O hasta n - \mi - 1.
Teniendo también en cuenta que para un valor dado de !mi es aún posible elegir
funciones con m= ± \mi, encontramos que para el valor n dado se tienen en total
n-1
2 L (n-m)+(n-0) = n2
m=l
estados diferentes - de acuerdo con el resultado obtenido en el § 36.
Las funciones de onda 1Pn,u m del espectro discreto deben normalizarse por la
condición
2
f lt/in n ml
1
2
ao ao 2fl'
2
dV =
t
fff lt/in n ml (g+17) dcpdgd17 = l.
2
1
000
Las funciones normalizadas tienen la forma:
2
(37.14)
Movimiento en un campo coulombiano ( coordenadas parabólicas)
149
(37.15)
donde
1
fpm(p) = - -,,
1m.
J(P+lml)!F(-p, lml+l, p)e-P/2plml/2,
p.1
(37.16)
Las funciones de onda en coordenadas parabólicas, en contraste con las funciones
de onda en coordenadas esféricas, no son simétricas respecto del plano z = O. Para
n1 > n2 la probabilidad de encontrar la partícula en el semiespacio z > O es mayor
que la de encontrarla en el semiespacio z < O, y para n1 < n2 ocurre lo contrario.
Al espectro continuo (E> O) corresponde un espectro continuo de valores reales
de los parámetros {31 , /3 2 en las ecuaciones (37.8) (ligados, como antes, claro está,
por la relación (37.9)). No nos detendremos aquí en escribir las correspondientes
funciones de onda, puesto que por lo general no es necesario utilizarlas. Las ecuaciones (37.8), consideradas como ecuaciones de « valores propios» para las magnitudes /31 , /32 , poseen también (para E> O) un espectro de valores complejos /31 , /32 •
Las correspondientes funciones de onda se darán en el § 133, párrafo en el que las
utilizaremos para resolver el problema de la dispersión en un campo coulombiano.
En el movimiento clásico de una partícula en un campo de Coulomb se cumple
una ley de conservación específica de este campo (1)
A= pxl-r/r = constante.
(37.17)
En mecánica cuántica, no es posible que las tres componentes de este vector puedan
poseer simultáneamente valores determinados, ya que los operadores Áx, Áy, Áz no
conmutan entre sí. Cada uno de estos operadores, por ejemplo, el Áz, conmuta
(como la comr,onente-z de cualquier vector, véase (29.3)) con l, pero no conmuta
con el cuadrado del momento cinético 12, magnitud que se conserva. La existencia
de una nueva magnitud que se conserva, pero que no conmuta con otras magnitudes
conservativas, conduce (véase § 10) a una degeneración adicional de los niveles,
degeneración que constituye la degeneración « accidental » específica del campo
coulombiano.
La descripción del movimiento en un campo de Coulomb mediante las funciones
de onda "Pnzm en coordenadas esféricas, corresponde a estados en los que, junto con
la energía, poseen valores dados el cuadrado del momento cinético y su componente-z. En cambio, las funciones de onda VJn n n en coordenadas parabólicas, describen estados estacionarios en los que poseen valores determinados lz y Az, Se
puede demostrar que el valor de Az viene determinado en este caso por los números
cuánticos n1, n2, n de acuerdo con la fórmula
1
2
(37.18)
(1)
Véase tomo I, Mecánica,§ 15.
CAPÍTULO
VI
TEORÍA DE PERTURBACIONES
§ 38.
Perturbaciones independientes del tiempo
La solución exacta de la ecuación ScHRODINGER se puede encontrar tan sólo
en un número relativamente pequeño de los casos más simples. La mayor parte de
los problemas de la mecánica cuántica conducen a ecuaciones demasiado complicadas que no se pueden re.solver de manera exacta. Con frecuencia, sin embargo, en las
condiciones del problema figuran cantidades de diferente orden; entre ellas pueden
encontrarse pequeñas cantidades tales que si se prescinde de ellas, el problema se
simplifica hasta el punto de que sea posible su resolución exacta. En estas condiciones, el ·primer paso en la resolución del problema físico planteado consiste en
resolver e~actamente el problema simplificado, y el segundo, en el cálculo aproximado de las correcciones determinadas por los términos pequeños de los que se
ha prescindido en el problema simplificado. El método general para el cálculo de
estas correcciones se llama teoría de perturbaciones.
Supongamos que el hamiltoniano del sistema físico dado es de la forma:
fl = flo+ P",
donde V representa una pequeña corrección ( perturbación) al operador « no perturbado» H0 • En los §§ 38-39 consideraremos las perturbaciones V que no dependen
explícitamente del tiempo (lo mismo se supone acerca del operador H0). Las condiciones necesarias para q~e se pueda considerar el operador V como «pequeño»
en relación con el operador HO se deducirán más adelante.
EI°problema de teoría de perturbaciones para el espectro discreto se puede formular de la siguiente manera. Se supone que las funciones propias 1Pn (o) y los valores
propios En <o) del espectro discreto del operador no perturbado H0 se conocen, es
decir, que se conocen las soluciones exactas de la ecuación
flotf;<o> = E<º>tf;<o>
(38.1)
Se pide hallar soluciones aproximadas de la ecuación.
(38.2)
Perturbaciones independientes del tiempo
151
es decir, expresiones aproximadas de las funciones propias 1Pn y de los valores propios En del operador perturbado fi.
En este párrafo supondremos que ninguno de los valores propios del operador fJ
es degenerado. Además, para simplificar el razonamiento admitiremos que el espectro de valores propios es sólo discreto ;,,todas las fórmulas se generalizan de manera
inmediata al caso en que existe un espectro continuo.
Es conveniente realizar los cálculos ya desde el principio en forma matricial.
Para ello desarrollemos la función incógnita 1P en funciones "Pn (o):
(38.3)
Substituyendo este desarrollo en (38.2), obtenemos:
y multiplicando ambos miembros de esta igualdad por
"Pk(o)*
e integrando, se encuen-
tra:
(38.4)
Hemos introducido aquí la matriz Vkm del operador de perturbaciones P' definida mediante las funciones no perturbadas 1Pm(o):
Vkm
=
J V'k(O)*Vt/Jm(O) dq.
(38.5)
Buscaremos los valores de los coeficientes cm y de la energía E en forma de
series
E = E<0>+E<1>+E<2>+ ... , Cm = cm<0>+cm<1>+cm<2>+ ... ,
donde las cantidades Eü>, cm<1> son del mismo orden de magnitud que la perturbación V, las cantidades E< 2>, cm<2> son de segundo orden (considerando que V es una
magnitud de primer orden), y así sucesivamente.
Determinemos las correcciones al n-ésimo valor propio y a la correspondiente
función propia, de acuerdo con lo cual haremos: cn (o) = 1, cm(o) = O, m =f= n. Para
determinar la primera aproximación, substituyamos en la ecuación (38.4), los valores E= E,/º)+En<1 \ ck = c/0>+ck<ü, conservando solamente los términos de primer orden. La ecuación correspondiente a k = n nos da:
(38.6)
152
Teoría de perturbaciones
La corrección en primera aproximación al valor propio En (o) resulta así igual al
valor medio de la perturbación en el estado "Pn <oJ.
La ecuación (38.4) con k =I=- n nos da:
ck<1> = Vkn/(En<0>-Ek<0>) para k =I= n,
mientras que en <1 > queda indeterminado y debe elegirse de forma tal que la función
1Pn = "Pn (o)+ "Pn <1> resulte normalizada hasta los términos de primer orden inclusive.
Para ello se puede hacer en <1 > = O. En efecto, la función
V
I
,f, (1) 't'n
-
""
~
m
E
mn
,f, (O)
(O)_E (O)'t'm
n
(38.7)
m
(el apóstrofo en el signo de suma significa que al sumar respecto de m hay que prescindir del término m = n) es ortogonal a 1Pn (o) con lo que la integral de ]1Pn (o)+ 1Pn(l)J 2
difiere de la unidad tan sólo en términos que son de segundo orden.
La fórmula (38.7) determina la corrección en primera aproximación a las funciones de onda. De ella se deduce cuál es la condición de aplicabilidad del método
de perturbaciones que estamos considerando. Debe cumplirse, en efecto, la desigualdad
(38.8)
es decir, los elementos de matriz del operador V deben ser pequeños respecto de las
diferencias correspondientes entre los niveles de energía no perturbados.
Determinemos ahora la corrección de segundo orden relativa al valor propio En (o).
Substituyamos para ello en (38.4) E= En <0 )+E1/ 1 >+En <2 >, ck = ck< 0 >+ck<1 >+ck<2 >,
y consideremos los términos de segundo orden. La ecuación con k = n nos da
En<2>cn<0> = m~' Vnmem<1>,
de donde
E (2)
_
~'
n
-
L, E
m
1V mnl 2
n
(OLE (O)
(38.9)
m
(hemos substituido cm <1 > = Vmn/(E,/º>-Em co>), y se ha tenido en cuenta que, en
virtud del carácter hermítico del operador V, es Vmn =::f .Vnm*).
Obsérvese que la corrección de segundo orden a la energía del estado normal es
siempre negativa. En efecto, si En (o) corresponde al valor mínimo, todos los términos
en la suma (38.9) son negativos.
153
Perturbaciones imlependientes del tiempo
Las aproximaciones siguientes se pueden calcular de manera por completo análoga.
Los resultados obtenidos se generalizan de manera inmediata al caso en que el
operador Íf O posee también un espectro continuo (limitándonos siempre, como antes,
a la perturbación de los estados del espectro discreto). Para ello basta solamente
añadir a las sumas relativas al espectro discreto las correspondientes integrales relativas al espectro continuo. Caracterizaremos los diferentes estados del espectro
continuo mediante el índice v, que recorre una sucesión continua; convendremos
en que dicho índice representa un conjunto de valores de las magnitudes suficientes
para una determinación completa del estado (si los estados del espectro continuo
son degenerados, cual ocurre casi siempre, dar solamente el valor de la energía no
basta para definir el estado) (1 ). Entonces, por ejemplo, en vez de (38, 7) será necesario escribir
'Pn(l)
= ~,
Lm
E
'P
V mn
n
(O)_E (O)
m
f
(O)
m
+
E
'P (O) dv
Vvn
n
(O)_E
v
v
(38.10)
'
y análogamente para las demás fórmulas.
Conviene indicar también la fórmula que da los valores perturbados de los elementos de matriz de una magnitud física f, calculados, incluyendo los términos de
primer orden, mediante las funciones "Pn = "Pn(oJ + "Pn(n, con 11•11( 1 ; dada por (38,7).
Es fácil obtener la siguiente expresión:
I
_
(O)
Ínm -fnm
En la primera suma es k
V
""'
+
=/= n,
L E
k
I
(O)
nkJ km
I
(OLE (O)+
k
n
en la segunda, k
V
. ""'
L E
k
I (O)
kmJ nk
(38.11)
(OLE (O)
k
m
=/= m.
PROBLEMAS
1.
Determinar la corrección de segundo orden "Pn (2 ) a las funciones propias.
Solución. Los coeficientes ck( 2l, k =/= n, se calcularán a partir de las ecuaciones (38.4) con
k =/= n, incluyendo sólo hasta los términos de segundo orden, y el coeficiente cn< 2> se elegirá de
manera que la función 'Pn = 'Pn<ºl+"1n< 1 l+"1n< 2 J resulte normalizada dentro del mismo orden de
aproximación. El resultado que se obtiene es:
'
./, (2)
'f'n
= ""' ""'
Lm ¿k
I V
V
mk
1..2
IV V
kn ./, (O)_ ""'
r1, WnkWnm
'f'm
Lm
nn
1..2
I IV
mn,/, (O)_!·'· (O)""'
n Wnm
2'f'm
-'f'n
¿m
¡2
~
1;;2
n Wnm
2'
(1) En este caso las funciones de onda 1/'I' t()l deben estar normalizadas respecto de la función-ó de las
magnitudes v.
154
Teoría de perturbaciones
donde hemos introducido las frecuencias
2. Determinar la corrección de tercer orden a los valores propios de la energía.
Solución.
nemos:
Escribiendo en la ecuación (38.4), con k
=
n, los términos de tercer orden, obte-
2
V
nn
""'' 1Vnml
L..,
m
1::2
2
'" Wmn
3. Determinar los niveles de energía del oscilador lineal anarmónico caracterizado por el
hamiltoniano
Solución. Los elementos de matriz de x3 y x 4 se pueden obtener inmediatamente aplicando
la regla de multiplicación de matrices y teniendo en cuenta la expresión (23.4) para los elementos
de matriz de x. Para los elementos de matriz no nulos de x3 se encuentra:
(x3)n-3,n
= (x3)n,n-a = (li/mw) 3 12 y'[-ln(n-1)(n-2)],
(x3)n-1,n = (x3)n,n-1 = (li/mw)312y(9n3/8).
Los elementos diagonales en esta matriz son nulos, de forma que no existe corrección de primer
orden correspondiente al término cxx3 del hamiltoniano (término considerado como perturbación
del oscilador armónico). En cambio, la corrección de segundo orden correspondiente a este término es del mismo orden que la corrección de primer orden relativa al término {Jx 4 • Los elementos
de matriz diagonales de x 4 tienen la forma:
(x4)n,n =
(li/ mw) 2 . f(2n 2 +2n+ 1).
Mediante las fórmulas generales (38.6) y (38.9) encontramos finalmente la siguiente expresión
aproximada de los niveles energéticos del oscilador anarmónico:
En
§ 39.
=
)ª(n +n+-3011) +-~32 ( -mwli )2(n +n+i).
15 a.2 ( - /;,
liw(n+l)--4 liw mw
2
2
La ecuación secular
Pasemos ahora al caso en que el operador no perturbado H0 posee valores propios degenerados. Designaremos por VJn,(0 ), 'lfJn (0 ), ••• las funciones propias que corresponden al mismo valor propio de la energía En(o). La elección de estas funciones,
conforme sabemos, no es única, ya que en vez de ellas se pueden elegir un número s
de combinaciones lineales independientes cualesquiera de dichas funciones (s es la
multiplicidad del nivel deg,nerado En (o)). Sin embargo, dicha elección deja de ser
arbitraria si imponemos a, las funciones de onda la condición de que la variación
155
La ecuación secular
que en ellas determina la pequeña perturbación aplicada sea a su vez pequeña.
Por el momento supondremos que 'Pn <0 >, ifan,< 0 >, ••• , son funciones propias no
perturbadas elegidas arbitrariamente. Las funciones correctas que corresponden a la
aproximación de orden cero son combinaciones lineales de la forma en <O>ifan (O)+
Cn'<0>ifan,<0>+ •••• Los coefiéíentes de estas combinaciones se determinan, junto con
las correcciones de primer orden a los valores propios, de la siguiente manera.
Escribamos las ecuaciones (38.4) con k = n, n', ... , substituyendo en ellas en primera aproximaciónE = En< 0 >+E<1 >;y teniendo en cuenta que para las cantidades ck
basta limitarse a los valores de orden cero: en = en <0 >, en. = cn.< 0 >, ••• ; cm = O
para m '4= n, n', ... Obtenemos entonces
o bien
~
n1
(Vnn , -E<% nn ,)en ,<0> = O,
(39.1)
donde n, n' toman todos los valores que numeran los estados asociados con el valor
propio dado no perturbado En(o). Este sistema de ecuaciones lineales homogéneas
resP.etto de las cantidades cn<o) tiene soluciones diferentes de cero si se anula el determinante de los coeficientes de las incógnitas. Obtenemos así la ecuación.
(39.2)
Esta ecuación es de grados respecto de E(l) y posee, en general, s raíces reales distintas. Estas raíces constituyen precisamente las correcciones de primer orden buscadas relativas a los valores propios. La ecuación (39.2) se llama ecuación secular (1).
Observemos que la suma de sus raíces es igual a la suma de los elementos de matriz
diagonales Vnn, Vn·n·, ... (que es el coeficiente de [E<1 >J s-1 en la ecuación).
Substituyendo sucesivamente las raíces de la ecuación (39.2) en el sistema (39.1)
c,/0> y se determinan así
las funciones propias en la aproximación de orden cero.
y resolviendo este último, se encuentran los coeficientes
Obsérvese que, como resultado de la perturbación, el nivel de energía inicialmente
degenerado d~ja de ser, en general, degenerado (las raíces de la ecuación (39.2) son,
en general, diferentes): como se suele decir, la perturbación «rompe» la degeneración. La degeneración puede romperse bien sea del todo, bien tan sólo en parte (en
este último caso, como consecuencia de la perturbación resulta una degeneración
de multiplicidad menor que la inicial).
Puede ocurrir que todos los elementos de matriz correspondientes a las transi(1)
Este nombre se ha tomado de la mecánica celeste.
156
Teoría de perturbaciones
ciones entre estados n, n',
de un mismo nivel energético sean iguales a cero. En
este caso se anula la corrección de primer orden a la energía. Calculemos para el
mismo la corrección en segunda aproximación. En la ecuación (38.4) con k = n
hagamos en el primer miembro de la igualdadE = En< 0 >+E<2 >,y en vez de c11 escriba.mos e,?). En el segundo miembro son diferentes de cero solamente los términos
con m -=f= n, n', ... , y dado que cm(o) = O tenemos:
E<2>cn (o) =
~
m
V nmem (1) •
(39.3)
En cambio, la ecuación (39.4) con k = m -=/= n, n', ... da, hasta el primer orden de
magnitud:
[En(O)_Em(O)]cm(l)
= ~
V mn' Cn' (O),
n
de donde
e
=
(1)
m
¿
n
Vmn'
E
,
n
e ,(o>.
(O)_E (O) n
m
Substituyendo este resultado en (39.3), obtenemos:
Este sistema de ecuaciones en las en <0> substituye ahora al sistema (39.1); la condición
de compatibilidad de estas ecuaciones es
""
I
VnmV mn'
~E
m
n
(39.4)
(O)_E (O)
m
Por consiguiente, también aquí las correcciones relativas a la energía se calculan
como raíces de una ecuación secular en la cual, en vez de los elementos de matriz
vn n' aparecen las sumas
""
VnmV mn'
~E
m
n
(O)_E (O).
m
PROBLEMAS
1. Determinar en la aproximación de primer orden las correcciones correspondientes al valor
propio, y las funciones correctas en la aproximación de orden cero ,para un nivel doblemente degenerado.
Solución.
La ecuación (39.2) es aquí de la forma:
Vu-E<1>
li'."21
l.= o
La ecuación secular
157
(los índices 1, 2 corresponden a dos funciones propias no perturbadas elegidas arbitrariamente,
V't(o) y v• 2 (0 ), del nivel doblemente degenerado en cuestión). Resolviendo esta ecuación encontramos:
(1)
Si se resuelven luego las ecuaciones (39.1) con estos valores E(IJ, para los coeficientes que corresponden a las funciones correctas normalizadas en la aproximación de orden cero,i/¡(º>=c1 (0)i/¡1 (0)
+ c2< 0>iJ,2( 0>, se obtienen los valores
(2)
2. Deducir las fórmulas que dan las correcciones de primer orden a las funciones propias
y las correcciones de segundo orden relativas a los valores propios.
Solución. Supondremos que como funciones tpn(o) se han elegido las funciones correctas de
la aproximación de orden cero. La matriz que determinan, Vnn', es diagonal, evidentemente, respecto de los índices n, n' (que se refieren al mismo grupo de funciones del nivel degenerado), y los
elementos diagonales Vnn, Vn'n', son iguales a las correspondientes correcciones de la primera
aproximación En( 1 >, EnP>, ...
Consideremos la perturbación de la función propia "Pn(o), de forma que en la aproximación
de orden cero E=En< 0 >, cn< 0 > = 1, cm< 0 >=0, para m-=/=- n. En primeraaproximación,E=En<º>+ Vnn,
e,.= 1 +en<~>, c111 = c,,p>. Del sistema general (38.4), escribamos la ecuación con k-=/=- n, n', .. , ,
conservando en ella los términos de primer orden:
de donde
(1)
Escribamos luego la ecuación correspondiente a k
gundo orden:
=
n', conservando en ella los términos de se-
En<1>c n , <1> = V nn
, , en , <1>+ mI:" Vnmm
, e <1>
(en la suma respecto de m se prescinde de los términos con m = n, n', ... ). Substituyendo En< 1 > = Vnn
y la expresión (1) para cm( 1 ), obtenemos cuando n'-=/=- n:
(2)
(El coeficiente cn(i) en esta aproximación es, en cambio, igual a cero). Las fórmulas (1), (2) determinan la corrección tf,11<1 ) = }:;.cm< 1 >if,m<º> de primer orden relativa a las funciones propias.
158
Teoría de perturbaciones
Finalmente, escribiendo los términos de segundo orden en la ecuación (38.4) con k = n, obtenemos para la corrección de segundo orden al valor de la energía la fórmula
E (2)
_
n
-
"'
~
m
'
E
Vn m V mn
n
(O)_E (O)'
m
(3)
que coincide formalmente con (38.9).
3. En el instante inicial t = O el sistema se encuentra en el ,estado 'Pi (o), que corresponde a un
nivel doblemente degenerado. Determinar la probabilidad de que en un instante ulterior t el sistema se encuentre én el otro 'estado '1'2 (0 ) asociado a la misma energía; la transición ocurre por
la acción de una perturbación constante.
Solución.
Formemos las funciones correctas en la aproximación de orden cero
donde ci, c2 y c1 ', c2 ' son los dos pares de coeficientes definidos por las fórmulas (2) del problema 1
(en todas las cantidades se prescinde de los índices (O) para abreviar).
Recíprocamente:
Las funciones 'P y 'P' corresponden a estados cuyas energías perturbadas son E+E(1) y E+E( 1 )',
donde E(1 ), E( 1)' son los dos valores de la corrección (1) del problema l. Introduciendo los factores
temporales, pasamos a la función de onda dependiente del tiempo:
e-<ifll,)Et
'I"1 =
'
'
[c2'if;e-<i/1i)ECi>t_c2i/;' e-<i/11,)Eh>' ']
C¡Cz -C¡ Cz
(en el instante t = O es 'Y1 = '1jJ1). Finalmente, expresando de nuevo 'P, 'P' en función de 'Pi, 'P2
obtenemos 'Y1 como combinación lineal de 'Pi, 'P 2 con coeficientes que dependen del tiempo. El
cuadrado del módulo del coeficiente de 'P 2 determina la probabilidad buscada de la transición, w12 •
El cálculo da
o bien, substituyendo las fórmulas (1) y (2) del problema 1:
(1)
Vemos así que la probabilidad oscila periódicamente con una frecuencia (E< 1 >-E<1 >')/1i. Para
tiempos t pequeños en comparación con el correspondiente período, la expresión entre corchetes,
Y .con ella la probabilidad w12 , es proporcional a t 2: w 12 = ¡v12¡2t2;n2.
Perturbaciones dependientes del tiempo
159
esta fórmula se puede obtener de manera muy sencilla siguiendo el método que se expone en el
párrafo siguiente (mediante la ecuación (40.4)).
§ 40.
Perturbaciones dependientes del tiempo
Pasemos ahora a estudiar las perturbaciones que dependen explícitamente del
tiempo. Es imposible en este caso hablar de correcciones relativas a los valores propios de la energía, ya que cuando se trata de un hamiltoniano dependiente del tiempo
(como lo es el operador perturbado.B = B 0 + t\t)),la energía no se conserva, con
lo cual no existen estados estacionarios. El problema que aquí se plantea es el de
calcular aproximadamente las funciones de onda como combinaciones de las funciones de onda de los estados estacionarios del sistema no perturbado.
Aplicaremos para ello un método análogo al conocido método de vanac1on
de las constantes para la resolución de ecuaciones diferenciales lineales (P. A. M.
DIRAC, 1926). Sean 'fl'k(o) las funciones de onda (incluido el factor temporal) de los
estados estacionarios del sistema no perturbado. En estas condiciones, una solución
cualquiera de la ecuación de onda no perturbada se puede escribir en forma de suma:
'Y = ~ak'F k(O). Busquemos ahora la solución de la ecuación perturbada
in a'Y/ot = (H + -P)'F
0
(40.1)
como suma de la forma
(40.2)
donde los coeficientes del desarrollo son funciones del tiempo. Substituyendo (40.2)
en (40.1) y recordando que las funciones 'F/0> satisfacen la ecuación
ili 8'Yk<0>/ot
= B0'Yk<o>,
obtenemos
Multiplicando a la izquierda ambos miembros de la igualdad por 'Ym <0 >* e integrando, obtenemos
(40.3)
donde
V mit)
J
= 'Y m(O)*v''F k(O) dq
_ V mke'-'i /11,XE m(o~ E kCo\t
-
160
Teoría de perturbaciones
son los elementos de matriz de la perturbación, que incluyen el factor temporal
(es necesario tener en cuenta, sin embargo, que cuando V depende explícitamente del
tiempo, también las cantidades V mk son funciones del tiempo).
Como función de onda no perturbada eligiremos la función de onda del n-ésimo
estado estacionario, a la que corresponden los valores de los coeficientes en (40.2):
ªn(O) = 1, ak(O) = O para k =/= n. Pára determinar la aproximación de primer orden,
escribamos ak en la forma ak = ak< 0>+ak<1>, haciendo en el segundo miembro de
la ecuación (40.3) (que contiene ya las cantidades pequeñas Vmk•)ak = ak<o> . Esto
nos da:
(40.4)
Para indicar para cual de las funciones no perturbadas se calcula la corrección,
introduzcamos un segundo índice en los coeficientes ak, escribiendo
'f"n =
f akn(t)'f"k(OJ.
De acuerdo con esto, escribiremos el resultado de la integración de la ecuación (40.4)
en la forma:
(40.5)
(hemos introducido las frecuenciasrokn = (Ek< 0 >-En <0 >)/ñ.). Esta fórmula determina
las funciones de onda en la aproximación de primer orden.
De manera análoga es posible calcular las aproximaciones siguientes (de hecho,
en la mayor parte de los casos basta ya la primera aproximación).
Consideremos con mayor detenimiento el caso importante de una perturbación
que es función periódica del tiempo de la forma:
P'
= fte-iwt+(;eiwt,
(40.6)
donde F y G son operadores que no dependen del tiempo. En virtud de la hermiticidad de V, debe ser Vnm = V*mn, o bien
de donde
Gnm
= Fmn*,
igualdad que determina la relación entre los operadores
(40.7), obtenemos:
(40.7)
G y F.
Teniendo en cuenta
Vkn(t) = Vkneiwk,.'
= Fknei(wk11-w>t+Fnk•ei(wk11+w'Jt.
(40.8)
161
Perturbaciones dependientes del tiempo
Substituyendo en (40.5) e integrando, obtenemos la siguiente expresión para los
coeficientes del desarrollo de las funciones de onda:
(40.9)
Estas expresiones son aplicables si no se anula ninguno de los denominadores (1),
es decir, si para todo k (y el valor dado den)
(40.10)
Para muchas aplicaciones es útil tener las expresiones de los elementos de matriz
de una magnitud cualquiera f determinados mediante las funciones de onda perturbadas.
En primera aproximación tenemos
donde
fnm(Ol(t)
= J'Yn(O)*/'F m(O) dq = fnm(O)eiwnmt,
fnm(ll(t) =
f ['Y
n(O)*/'F m(l)+'f'n(l)*/'J! m(O)]
dq.
Substituyendo aquí
'}' (1) -
n
con las
cada.
akn (I)
~
-k
a kn (lYq," k(O),
determinadas por la fórmula (40.9), es fácil obtener la expresión bus-
(40.11)
Esta fórmula es aplicable si ninguno de los términos llega a ser grande, es decir, si
ninguna de las frecuencias wkn, wkm es excesivamente próxima al valor w. Para w = O
volvemos a la fórmula (38.11 ).
En todas las fórmulas escritas aquí se supone que el espectro de niveles energé(1) Más exactamente, los denominadores no deben ser tan pequeños que las cantidades
de ser pequeñas comparadas con la unidad.
Gkn(
1
)
dejen
162
Teoría de perturbaciones
ticos no perturbado es puramente discreto. Sin embargo, es posible generalizarlas
inmediatamente al caso en que existe también espectro continuo (si bien, como antes,
nos limitamos a la perturbación de estados del espectro discreto), lo que se consigue
simplemente añadiendo a las sumas relativas a los niveles del espectro discreto las
correspondientes integrales del espectro continuo. Para ello es necesario que en las
fórmulas.(40.9), (40.11) los denominadores wkm ± w sean diferentes de cero cuando
la energía Ek<o) recorre todos los valores, no sólo del espectro discreto, sino también
del continuo. Si, como ocurre de ordinario, el espectro continuo se encuentra por
encima de todos los niveles del espectro discreto, la condición (40.10), por ejemplo,
debe completarse con la condición
'Em.tn(O)_En(O)
donde
Emín (o)
> nw,
{40.12)
es la energía del nivel más bajo del espectro continuo.
PROBLEMA
Determinar el cambio en las soluciones n-ésima y m-ésima de la ecuación de Schrodinger debido
a la existencia de una perturbación periódica (de la forma (40.6)) cuya frecuencia w es tal que
E.,.< 0>-E.< 0>= li(w+E), donde e es una cantidad pequeña.
Solución. El método desarrollado en el texto no es aplicable en este caso dado que el coeficiente amn<1) en (40.9) es grande. Partamos de nuevo de las ecuaciones exactas (40.3) con Vmk(t)
dado por (40.8). Es evidente que el efecto más importante procede de aquellos términos de las
sumas que aparecen en el segundo miembro de las ecuaciones (40.3) en los que la dependencia
respecto del tiempo viene determinada por la pequeña frecuencia Wmn - w. Prescindiendo de
todos los demás. obtenemos el sistema de dos ecuaciones
i/idan/dt
= F mn•e-idam.
Efectuemos la substitución
con lo que se obtienen las ecuaciones
Eliminando entre ellas am, obtenemos:
Como par de soluciones independientes de estas ecuaciones podemos elegir
(1)
y
(2)
Transiciones , de una perturbación que actúa en un tiempo finito
163
donde A, B son constantes (que deben determinarse a partir de la condición de normalización)
y se ha introducido la notación
OC¡
f
= -
+ n,
CX2
=
f
+ n,
Q =
Ve: +-
~2
JFmnl
2
Así, pues, bajo la influencia de la perturbación, 'F11<0 >, 'F111<0 > se transforman en las funciones
a11'F11<º*a,,.'Y m< 0 >con an, am dados por (1) o (2).
Supongamos que en el instante inicial (t = O) el sistema se encontraba en el estado 'Ym<0>. El
estado del sistema en los instantes ulteriores se determina por la combinación lineal de las dos
funciones que hemos obtenido que se reduce a 'Y m<0> para t = O:
El cuadrado del módulo del coeficiente de 'Y n <0 > es igual a
(4)
Este cuadrado determina la probabilidad de encontrar el sistema, en el instante t, en el estado 'Yn(o).
Vemos así que esta probabilidad es una función periódica, con período n/0, que varía entre los
límites O y !Fnin\ 2/h20 2 •
Para e
=
O (resonancia exacta) la probabilidad (4) pasa a ser
i(l-cos 2¡Fmnlt/li).
Esta probabilidad varía periódicamente (con período nh/lFmn\) entre los límites O y 1; con otras
palabras, el sistema pasa periódicamente del estado 'Y m{o) al estado 'Yn<0 >.
§ 41.
Transiciones debidas a una perturbación que actúa durante un tiempo finito
Supongamos que la perturbación V(t) actúa tan sólo durante un intervalo de
tiempo finito (o bien, que V(t) disminuye con rapidez suficiente para t ~ ± oo).
Supongamos que antes de empezar a actuar la perturbación (o en el límite para
t ~ - oo) el sistema se encontraba en el n-ésimo estado estacionario (del espectro
discreto). En un instante ulterior cualquiera el estado del sistema vendrá determinado
por la función 'Y= akn'Y k(o), donde en primera aproximación
1.
akn
is' .
= akn(l) = -h
Vkne"-wknt
dt for
k =fa n,
-ao
(41.1)
t
ª••
= l+a••(ll = 1-~
fv••
-ao
dt;
164
Teoría de perturbaciones
los límites de integración en (40.5) se eligen de manera que para t-+ - = todos los
coeficientes akn (I) tienden a cero. Una vez transcurrido el tiempo durante el cual
actúa la perturbación (o en el límite t ----++ =), los coeficientes akn toman valores
constantes akn ( =), y el sistema se encontrará en un estado caracterizado por la
función de onda
'Y =
~
k
akn(co)'Yk(o>,
que satisface de nuevo la ecuación de ondas no perturbada, pero que difiere de la
función 'Yn (o). De acuerdo con las reglas generales, el cuadrado del módulo del coeficiente akn( =) determina la probabilidad de que el sistema tenga la energía Ek(0>,
es decir, de que se encuentre en el k-ésimo estado estacionario.
Así, pues, bajo la influencia de la acción de la perturbación el sistema puede pasar
del estado estacionario inicial a otro estado cualquiera. La probabilidad de la transición del estado inicial (el n-ésimo) al estado estacionario k-ésimo es igual a:
(41.2)
Consideremos ahora una perturbación que, una vez ha empezado a actuar, sigue
actuando indefinidamente (conservándose, claro está, pequeña durante todo el
tiempo). Con otras palabras, V(t) tiende a cero para t -+ - = y a un límite finito,
distinto de cero, para t-+ =. La fórmula (41.2) no es aquí aplicable de manera
inmediata, ya que la integral que aparece en ella es divergente. Sin embargo, esta
divergencia carece de importancia desde el punto de vista físico y se puede soslayar
fácilmente. Para ello escribamos, integrando por partes:
El valor del primer término se anula en el límite inferior, y en el límite superior
coincide formalmente con los coeficientes del desarrollo de la fórmula (38. 7) (la
presencia del factor periódico suplementario iw",.t se debe al hecho de que los akn
son los coeficientes del desarrollo de la función de onda total 'Y, mientras que los
ckn en el § 38 son los coeficientes del desarrollo de la función 1p, independiente del
tiempo). Es claro, por esto, que su límite para t -+ = determina simplemente la
variación de la función de onda inicial 'Yn (o) debida a la influencia de la « parte
constante» V(+=) de la perturbación y nada tiene que ver, por consiguiente, con
las transiciones a otros estados. La probabilidad de la transición viene determinada,
en cambio, por el cuadrado del segundo término y es igual a
(41.3)
Transiciones de una perturbación que actúa. en un tiempo finito
165
Las fórmulas obtenidas son válidas también cuando la transición tiene lugar
desde un estado del espectro discreto a un estado del espectro continuo. La diferencía consiste tan sólo en que se trata entonces de la probabilidad de la transición
desde el estado dado (el n-ésimo) a los estados que corresponden a valores de las
magnitudes v (véase § 38) que pertenecen al intervalo v, v+dv, de forma que, por
ejemplo, la fórmula (41.2) debe escribirse
f
00
dwn, = ~ 2\
V
,.,,w,., dt \"dv.
(41.4)
-00
Si la perturbación V(t) varía poco en intervalos de tiempo del orden del período
1/wkm el valor de la integral que aparece en (41.2) o en (41.3) será muy pequeño.
En el límite en que la perturbación aplicada varía tan lentamente cuanto se quiera,
la probabilidad de toda transición acompañada de variación de la energía (es decir
con un valor no nulo de la frecuencia wkn) tiende a cero. Así, pues, para una variación suficientemente lenta de la perturbación aplicada (variación adiabática) el sistema que se encuentra en un estado estacionario no degenerado cualquiera seguirá en
el mismo estado (véase también § 53).
En el caso límite opuesto de una perturbación que se introduce muy rápidamente
( conexión brusca), las derivadas ó V kn/ ót tienden a infinito en el « instante de conexión». En la integral de ( 8Vkn/ 8t)eiw1cnt, puede sacarse entonces fuera del signo
integral el factor eiw1cnt , que varía de forma relativamente lenta, tomando para él
el valor correspondiente a este instante. La integral se calcula luego inmediatamente
y se obtiene:
(41.5)
Las probabilidades de transición en el caso de perturbaciones bruscas se pueden
encontrar también cuando la perturbación no es pequeña.
Supongamos que el sistema se halla en un estado representado por una de las
funciones propias 1Pn'º> del hamiltoniano inicial H0 • Si la variación del hamiltoniano
tiene lugar «bruscamente» (es decir, durante un tiempo que es pequeño con relación a los períodos 1/ wkn de las transiciones desde el estado n dado a los demás),
la función de onda del sistema « no consigue » variar y permanece siendo la misma
que era antes de· 1a perturbación. Sin embargo, dicha función no será ya función
propia del nuevo hamiltoniano del sistema, fl, es decir, el estado 1Pn (o) no será estacionario. En cuanto a las probabilidades wkn de la transición del sistema a uno
cualquiera de los nuevos estados estacionarios, éstas vienen determinadas, de acuerdo
con las reglas generales de la mecánica cuántica, por los coeficientes del desarrollo
de la función 'lf)n(o) en funciones propias 'lf)n del hamiltoniano b:
Wnk
=
1
f
lfn <Olif;k*
dqj
2
•
(41.6)
166
Teoría de perturbaciones
Veamos cómo esta fórmula general se transforma en la fórmula (41.5) si el cambio del hamiltoniano P- = fJ -flo resulta ser pequeño. Multipliquemos las ecuaciones
respectivamente por 'IJ)k * y 'lf'n <0 )*, integremos respecto de q y restemos los resultados
miembro a miembro. Teniendo en cuenta también que el operador ít es autoconjugado, obtenemos:
Si la perturbación Pes pequeña, podemos susbstituir en primera aproximación
Ek por el nivel no perturbado próximo a dicho valor E/0 ) y la función de onda lfk
(en el segundo miembro de la igualdad) por la correspondiente función tp/0). Obtenemos entonces:
y la fórmula (41.6) pasa a ser la (41.5).
PROBLEMAS
1. A un oscilador cargado, que se encuentra en el estado fundamental, se aplica bruscamente
un campo eléctrico homogéneo. Determinar las probabilidades de transición del oscilador a los
estados excitados bajo la acción de esta perturbación.
Solución. La energía potencial del oscilador en un camno homogéneo (que actúa sobre aquél
con una fuerza F) es
U(x) = fmw2x2-Fx
= }mw2(x-x0)2+constante
(donde x0 = F/mw 2 ), es decir, su forma es de nuevo la de un potencial puramente oscilatorio (con
la posición de equilibrio desplazada). Por consiguiente, las funciones de onda de los estados estacionarios del oscilador perturbado son 'IJ)k(x - x 0), donde 'IJ)k(x) son las funciones del oscilador
(23.12); la función de onda inicial es, en cambio, la 'IJ)o(X) de (23.13). Mediante estas funciones y
la expresión (23.11) de los polinomios de Hermite encontramos:
donde se ha introducido la notación ~o = x 0
grando k veces por partes, a la integral
Vmw/h~ La integral que aquí aparece se reduce, inte-
Transiciones de una perturbación que actúa en un tiempo finito
167
00
-00
Para la probabilidad de transición buscada (41.6) se obtiene así en definitiva la fórmula
to2k
'WOk
= --e-fo2f2.
2kk!
Como función del número k, es una distribución de Poisson con valor medio de k igual a
= F 2/2mliw2.
La teoría de perturbaciones es aplicable cuando los valores de F son tan pequeños que k ~ 1.
Las probabilidades de excitación son entonces pequeñas y disminuyen rápidamente cuando crece k.
La mayor de ellas es wo1 ~ k.
k = tfo2
En el caso opuesto de grandes valores de F (k ~ 1), la excitación del oscilador tiene lugar
con probabilidad muy elevada: la probabilidad de que el oscilador permanezca en el estado normal es woo = e-k.
2. El núcleo <le un átomo que se encuentra en el estado normal experimenta un choque brusco
como resultado del cual adquiere una velocidad v ;· la duración de la colisión 1: se supone pequeña
tanto respecto de los períodos electrónicos, como comparada con a/v, donde a son las dimensiones atómicas. Determinar la probabilidad de excitación del átomo debida a una tal « colisión »
(A. B. MIGDAL, 1939).
Solución. Pasemos al sistema de referencia K' que se mueve con el núcleo después del choque.
En virtud de la condición 1: ~ a/v, se puede considerar que el núcleo prácticamente no se mueve
durante la colisión, de forma que las coordenadas de los electrones en el sistema K' y en el sistema inicial K coinciden inmediatamente después de la perturbación. La función de onda inicial
en el sistema K' es
¡/lo'
= ¡/lo exp( -iq . ~a ra),
q = mv/li,
donde "Po es la función de onda del estado normal para el núcleo en reposo y la suma en el exponente se extiende a todos los Z electrones del átomo (véase problema 2, § 15). La probabilidad
buscada de transición al k-ésimo estado excitado se determina ahora, de acuerdo con (41.6), mediante la fórmula
wok =
1
Jtpk* exp(-iq. f ra)tpo dVi ... dVzl 2 .
En particular, si qa ~ 1, desarrollando el factor exponencial que aparece en el integrando y observando que la integral de 'l/1k*tp0 se anula en virtud de la ortogonalidad de las funciones "Po y tJ)k'
obtenemos
wok =
1
J tpk*(q. ~ ra)tpo dVi ... dVzl 2 •
3. Determinar la probabilidad total de excitación e ionización del átomo de hidrógeno como
consecuencia de una « sacudida » brusca (véase el problema anterior).
Solución.
La probabilidad buscada se puede calcular como diferencia
1-woo = 1-I
J¡fJ 2e-iq.r dVj2 ,
0
168
Teoría de perturbaciones
donde w00 es la probabilidad de que el átomo permanezca en el estado fundamental (t/io = Tr-112e-rfa
es la función de onda del estado fundamental del átomo de hidrógeno; a es el radio de Bohr).
Calculando la integral, obtenemos:
l-w00 = 1-1/(1 +fq2a2)4.
En el caso límite en que qa ~ l, esta probabilidad tiende a cero como 1 qa ~ 1 tiende a la unidad como 1 - Woo ,...__, 1 - (2/qa) 8 •
Woo"-' q 2a 2, y para
4. Determinar la probabilidad de emisión de un electrón de la capa K de un átomo de número atómico Z elevado en la desintegración-¡5' del núcleo. La velocidad de la partícula-¡5' se considera grande con relación a la velocidad del electrón-K (A. B. MIGDAL, E. L. FEINBERG, 1941).
Solución (1). En las condiciones indicadas, la duración del paso de la partícula-¡5' a través de
la capa K es pequeña comparada con el período de rotación de un electrón, de modo que el cambio
de la carga del núcleo se puede considerar como instantáneo. El papel de perturbación lo representa aquí la variación V= 1/r del campo del núcleo para una variación pequeña de su carga
(en la razón de 1 a Z). De acuerdo con (41.5), la probabilidad de la transición de uno de los dos
electrones de la capa K con energía. E0 = - Z 2/2 (2) a un estado del espectro continuo con energía
E = k 2/2 en el intervalo dE = kdk es
dw = 2
41 v.Ok 12
(k2+z2)2
dk.
En la integral que determina el elemento de matriz Vok cuenta fundamentalmente el intervalo
de distancias próximas al núcleo(,_, 1/Z), intervalo en el que para la función de onda de un estado
del espectro continuo es también posible utilizar expresiones correspondientes a un sistema hidrogenoide. El estado final del electrón debe poseer un momento cinético l = O (que coincide con
el momento cinético del estado inicial). Mediante las funciones R 10 y Rko, normalizadas en la escala k, obtenidas en el § 36 y las fórmulas (f. 3) del apéndice matemático encontramos (3):
4yk
(1 +ik/Z)iZ/k(l-ik/Z)-iZ/k
y(l-e-211Z/k)
1 +k2/Z2
y dado que
1(1 + iet:)i/a¡2 = exp[ -(2/et:) tan-1 IX],
obtenemos finalmente
dw =
27
í.(k/Z)k dk
Z4(1+k2¡z2l'
,
donde se ha introducido la notación
f(et:) =
(1)
1
1-e-2rr/a
exp[-(4/a) tan-lal
En los problemas 4 y 5 utilizamos unidades atómicas.
Aquí y en lo que sigue se tiene en cuenta el carácter hidrogenoide del estado de los electrones-K
(véase § 74).
(ª) En el cálculo conviene utilizar unidades coulombianas, pasando luego a unidades atómicas en el
resultado final.
2
( )
Transiciones de una perturbación que actúa en un tiempo finito
169
Los valores límites de la función f(rx) son:
f
=
e- 4 para rx
~
1;
f
=
para rx ~ l.
rx/2 n
La probabilidad total de ionización de la capa K se obtiene integrando respecto de w para
todas las energías del electrón emitido. El cálculo numérico da w = 0,65· Z 2 •
5. Determinar la probabilidad de emisión de un electrón de la capa K de un átomo de gran Z
en la desintegración-rx del núcleo. La velocidad de la partícula-rx es pequeña respecto de la velocidad del electrón-K, pero el tiempo que emplea en escapar del núcleo es pequeño con relación
al tiempo de rotación del electrón (1).
Solución. Después de emitida la partícula-rx. la perturbación que actúa sobre el electrón es
de carácter adiabático. Por lo tanto, el efecto buscado viene determinado en esencia por el tiempo
próximo al « instante de conexión » de la perturbación en el que se viola el carácter adiabático,
tiempo durante el cual la partícula-rx, que ha escapado del núcleo y se mueve como una partícula
libre, se encuentra aún a distancias que son pequeñas respecto del radio de la órbita K. El papel
de la perturbación V, que provoca la ionización del átomo, lo representa aquí la desviación del
campo creado por el núcleo y la partícula-rx respecto del campo puramente coulombiano Z/r.
El momento dipolar de dos partículas de pesos atómicos 4 y A - 4 y cargas 2 y Z - 2 separadas
por una distancia vt (ves la velocidad relativa del núcleo y la partícula-rx) es igual a (2):
2(A-4)-(Z-2)4
2(A-2Z)
--------nt =
vt.
A
A
Por consiguiente, el término dipolar del campo del núcleo y la partícula-rx es (3):
2(A-2Z) z
V = -----vt-,
A
r3
donde el eje z está dirigido en el sentido de la velocidad v. El elemento de matriz de esta perturbación se reduce al elemento de matriz de z: de la ecuación del movimiento del electrón z = - Zz /r3,
se deduce, en efecto, el elemento de matriz:
(z/r 3 )ok = (E-Eo) 2zok/Z.
La probabilidad buscada de transición de uno de los dos electrones de la capa K es, según (41.2),
2
00
dw
=
21 JVokei(Eo-E>t dtl dk
o
=
8(A-2Z)2v2
A2z2
lzokl 2 dk·
'
Este problema fue estudiado por primera vez por A. B. MIGDAL (1941).
La necesidad de tener en cuenta en este problema a la vez el movimiento de la partícula-rx y el
del núcleo fue señalada por J. S. LEVINGER (1953).
(ª) Si la diferencia A - 2Z es pequeña, puede ser necesario tener en cuenta también el término sig11iente, el cuadripolar.
(1)
(2)
170
Teoría de perturbaciones
(para calcular la integral hemos introducido en el integrando un factor adicional de convergencia
A> O, después de lo cual se ha hecho A-+ O en el resultado obtenido). Para calcular el elemento de matriz de z = r cos O observemos que, dado que el momento cinético orbital en el estado
inicial es l =;: O, la expresión cos O tiene un elemento de matriz diferente de cero tan sólo para la
transición al estado l = 1 ; en este caso
e-M,
l
l(cos8)01l 2 = (cos8)oo =
y
lzokl
Calculando
rok
2
=
ilrokl
mediante las funciones radiales R00 y
dw
=
2-
Rki,
obtenemos en definitiva:
211(A-2Z)2v2
+-(k/Z)k dk
3A2Z6(1 +k2/Z2)5 JI
'
(la función .f es la definida en el problema 4).
§ 42.
Transiciones provocadas por una perturbación periódica
Para la probabilidad de la transición a estados del espectro continuo determinada
por la acción de una perturbación periódica, se obtiene otro tipo de resultados.
Supongamos que en el instante inicial t = O el sistema se encuentra en el n-ésimo
estado estacionario del espectro discreto. Supondremos que la frecuencia w de la
perturbación periódica es tal que
(42.1)
donde
Emín
es el valor de la energía a partir del cual comienza el espectro continuo.
Por los resultados del§ 40 es ya evidente que el papel fundamental lo representarán los estados cuyos valores de la energía E se encuentran en la vecindad inmediata
de la energía « de resonancia » E,,, <0 >+ liw, es decir, aquellos estados para los que la
diferencia wvn - w es pequeña (1). Por esta misma razón, en los elementos de matriz
de la perturbación (40.8) basta considerar solamente el primer término (con frecuencia wvn - w próxima a cero). Substituyendo este término en (40.5) e integrando,
obtenemos:
i
a.,n = -li
f
t
o
.
)t
ei<w""-w -1
(42.2)
V.,n(t) dt = -F.,n
.
li(w,n-w)
El límite inferior de integración se elige de manera que para t
acuerdo con la condición inicial impuesta.
=
O sea avn
De aquí se sigue para el cuadrado del módulo de avn la expresión:
1
( )
Recordemos que el índice v se refiere al espectro continuo (véase el final del § 38).
=-=
O, de
171
1'ransiciones provocadas por una perturbación periódica
(42.3)
Es fácil ver que para grandes valores de testa función se puede considerar proporcional a t.
Observemos para ello que la fórmula siguiente es válida:
sen 2ext
lim - - = 8(ex).
t_,,. co 71'tex2
(42.4)
En efecto, para ex -=f=. O el límite en cuestión es igual a cero, y para ex
O tenemos
. es 1gua
. 1a m
. fi mto.
.
s·m em bargo, mtegran
.
d o rest, de forma que e1 límite
sen2 ext
--- =
trx.2
pecto de
mos:
=
cx
entre los límites -
f
00
1
-
71'
-~
y
oo
+ oo (haciendo la substitución
sen 2cxt
1 foo sen
- - dcx = tcx2
71'
-~
o:t
= ~), obtene-
2
g2
f
df = l.
Así, pues, la función que aparece en el primer miembro de la igualdad (42.4) satisface,
en efecto, todas las condiciones que definen a la función-o.
De acuerdo con esta fórmula, podemos escribir para grandes valores de t
la.,nl 2 =
o bien, substituyendo liwvn
{l/li2)lF11nl 27TlS{!wm-lw),
= Ev-En <0 > y teniendo en cuenta que
lavnl 2
o(ax)
=
o(x)/a:
= (21r/li)IF11 nl 28(Ev-En(O)_Jiw)t.
La expresión lavnl 2 dv es la probabilidad de la transición desde el estado inicial
a los estados que se encuentran en el intervalo entre v y v+dv (cf. § 5). Vemos, pues,
que para grandes valores de t dicha expresión resulta proporcional al tiempo transcurrido desde el instante t = O. La probabilidad de transición dwnv por unidad de
tiempo es igual, en cambio, a (1):
(42.5)
De acuerdo con lo que era de esperar, esta probabilidad es diferente de cero tan
sólo para las transiciones a los estados cuya energía es Ev = En <0 >+ liro. Si los
niveles energéticos del espectro continuo no son degenerados, de forma que se puede
entender por v los valores de la energía solamente, todo el «intervalo» de estados dv se reduce a un solo estado con energía E = En <0 l+ñw,y la probabilidad de
(1) Es fácil comprobar que si se tiene en cuenta el segundo término de (40.8), término del que hemos
prescindido, se obtendrían expresiones adicionales que, divididas luei;o por t, tienden a cero para t-++CX).
172
Teoría de perturbaciones
transición al mismo es
(42.6)
§ 43.
Transiciones en el espectro continuo
Una de las aplicaciones más importantes de la teoría de perturbaciones es el
cálculo de la probabilidad de transición en el espectro continuo bajo la acción de una
perturbación constante (es decir, no dependiente del tiempo). Hemos mencionado
ya que los estados del espectro continuo son prácticamente siempre degenerados.
Una vez elegido de determinada manera el conjunto de funciones de onda no perturbadas que corresponden a un cierto nivel dado de energía, podemos plantear
el problema de la siguiente manera: sabiendo que en el instante inicial el sistema se
encontraba en uno de estos estados, se pide determinar la probabilidad de la transición a otro estado de igual energía. Si el estado inicial se caracteriza por el índice v0 ,
para las transiciones a los estados pertenecientes al intervalo entre v y v+dv se sigue
directamente de (42.5) (suponiendo w = O y cambiando la notación):
(43.1)
Esta expresión, comó debía ser, resulta diferente de cero tan sólo para Ev = Ev,:
bajo la acción de una perturbación constante, las transiciones tienen lugar tan sólo
entre estados de igual energía. Es necesario observar que para las transiciones a
partir de estados del espectro continuo, la magnitud dwvov no se puede considerar
sin más como igual a la probabilidad de transición; de hecho ni tan sólo posee las
dimensiones adecuadas (1/tiempo). La expresión (43.1) representa el número de
transiciones por unidad de tiempo y sus dimensiones dependen del criterio de normalización elegido para las funciones de onda del espectro continuo.
Calculemos la función de onda perturbada que coincide en el estado inicial con
la función no perturbada de partida 'Pv. <0 >. Según la fórmula (42.2) (en la que hacemos w = O y cambiamos la notación) se tiene:
La función de onda perturbada tiene la forma:
'Y V
=
0
'Y V
(o)+
Ja<I> 'Y (O) dv
V11e
8
V
'
o bien
'Y
v,
[ f
= .,.
'f'v 8
(O)+
V
.,.
vv 0 'f'v
l-e<iJli)(E.,,0 -E.,,)t
(O)
E -E
Vo
V
dv
]
e-<iJTt>E.,, 0 t
,
(43.2)
Transiciones en el espectro continuo
173
donde la integración se extiende a todo el espectro continuo (1).
Veamos cuál es la forma límite de esta función para grandes valores de t. Para
ello separemos en dv la diferencial dEv de la energía (escribiendo dv = dEv dT, donde
dT es el producto de las diferenciales de las demás magnitudes que determinan el
estado del espectro continuo) y consideremos formalmente Ev como una variable
compleja. La integral
que aparece en (43.2) se calcula a lo largo del eje real. Desplacemos un poco el camino
de integración hacia el semi plano inferior; es posible efectuar este desplazamiento
sin cambiar el valor de la integral, dado que el integrando carece de singularidades
sobre el eje real. Podemos luego descomponer la integral en dos partes:
(en la integración a lo largo del eje real estas integrales carecen de sentido, ya que
divergen en el punto Ev = Ev.). Dado que a lo largo del contorno de integración
se tiene Im(Ev) < O, al tender t a infinito la segunda de estas integrales tiende a cero
(debido a la presencia del factor exp[lm(Ev)t/h] en el integrando). En la primera
integral, en cambio es posible desplazar de nuevo el camino de integración hasta
hacerlo coincidir con el eje real, evitando tan sólo el punto Ev = Evo , que se
deja a la izquierda. Es cómodo representar esta manera de efectuar la integración en
otra forma, sumando a la constante Evo que figura en el denominador del integrando
una pequeña cantidad imaginaria positiva io. Con esto el polo del integrando se
desplaza hacia el semiplano superior y es posible efectuar la integración simplemente
a lo largo del eje real (que pasa ahora por debajo del polo), haciendo luego tender a
cero la cantidad o.
9
Obtenemos así para la función de onda la expresión
(43.3)
El factor temporal prueba que esta función corresponde, como debe ser, a la misma
energía Evo que la función no perturbada inicial. Con otras palabras, la función
,/,
'(Jv.
= ,/,
'(Jv,
(O)+
I
V""•
,/, (O)
E -E '(Jv
V•
dv
V
( 1)
Si existe también un espectro discreto, en esta fórmula (y en las siguientes) hay que añadir a la
integral la suma correspondiente a los estados del espectro discreto.
174
Teoría de perturbaciones
satisface la ecuac10n de SCHRODINGER (H 0 + t>)Pv. = Ev.V'v. Es natural por ello
que esta expresión corresponda exactamente a la fórmula (38. 7) (1).
Los cálculos que preceden corresponden a la primera aproximación de la teoría
de perturbaciones. No es difícil calcular también la segunda aproximación. Para ello
es necesario deducir la fórmula que corresponde a la aproximación siguiente de
'Y1, 0 , lo que se consigue fácilmente siguiendo el método del§ 38 (conocido ahora ya
el método que debe emplearse para tratar las integrales «divergentes»). Un cálculo
simple conduce a la fórmula:
'Y
v.
=
('f'v. f [ vv, f
,/,
{O)+
V
+
Vvv, Vv,v
º dv'
E -E ,
V0
V
]
if, (O) dv )
v
e-<i!A)E"ot,
E -E
(43.4)
Vo
(aplicando la misma regla que antes para evitar la singularidad en las integrales).
Comparando esta expresión con la fórmula (43.3), podemos escribir la fórmula
correspondiente para la probahilidad (mejor dicho, para el número de transiciones)
directamente por analogía con (43.1):
(43.5)
Puede ocurrir que el elemento de matriz Vvv 0 que corresponde a la transición
considerada sea igual a cero. No existe entonces efecto de primer orden, y para el
número de transiciones tenemos:
(43.6)
(en las aplicaciones de esta fórmula, el punto Ev' = Evo no es en general un punto
singular del integrando; por consiguiente, no importa cómo se integre respecto de
Ev y la integración se puede efectuar sin más a lo largo del eje real).
Los estados v•, para los que Vvv' y V v'vo son diferentes de cero, se suelen calificar de intermedios para la transición v0 -~ v. Puede ocurrir que la transición v0 --;. v
sea posible no pasando por un estado intermedio, sino tan sólo recorriendo una sucesión de tales estados. La fórmula (43.6) se generaliza de manera inmediata a estos
casos. Así, si son necesarios dos estados intermedios, se tendrá.
(43.7)
(1) Si se parte de esta fórmula, se puede establecer cómo hay que tomar la integral teniendo en cuenta
la condición de que la expresión asintótica de 'lfvo a grandes distancias contenga exclusivamente una onda
divergente, no una convergente (véase § 134).
La relación de indeterminación para la energía
§ 44.
175
La relación de indeterminación para la energía
Consideremos un sistema constituido por dos componentes que interactúan entre
sí débilmente. Supongamos que en un cierto instante se sabe que estas componentes
poseen valores determinados de la energía, que designaremos por E y e, respectivamente. Supongamos también que transcurrido un cierto intervalo de tiempo M
se efectúa de nuevo una medición de la energía; esta medición dará ciertos valores
E', e', en general distintos de E, e. Es fácil determinar cuál es el orden de magnitud
del valor más probable de la diferencia E' + l - E - i que puede resultar de dicha
medición.
De acuerdo con la fórmula (42.3) (con w = O), la probabilidad de la transición
del sistema (al cabo de un tiempo t), determinada por una perturbación independiente
del tiempo, desde el estado con energía E al estado con energía E', es proporcional a
sen
sen2 [(E'-E)t/2h]/(E' -E)2.
Vemos así que el valor más probable de la diferencia E' - E es del orden de magnitud ñ/t.
Aplicando este resultado al caso que consideramos (la perturbación es la interacción mutua de las dos partes del sistema), obtenemos la relación
(44.1)
Así, pues, cuanto menor sea el intervalo de tiempo M, tanto mayor será la variación
detectada de la energía. Es esencial observar que su orden de magnitud ñ/ M no depende del valor de la perturbación. La variación de la energía determinada por
(44.1) se manifestará por débil que sea la interacción entre las dos partes del sistema.
Este resultado es puramente cuántico y posee una profunda significación física.
Prueba que en mecánica cuántica la ley de conservación de la energía puede comprobarse mediante dos mediciones tan sólo con una precisión que es del orden den/ M,
donde M es el intervalo de tiempo transcurrido entre las mediciones.
Se suele decir que la relación (44.1) expresa la relación de indeterminación para
la energía. Sin embargo, hay que subrayar que su sentido es esencialmente distinto
del sentido que poseen la relación de indeterminación !::.p!::.x ,_, ñ relativa a la coordenada y al impulso. En esta última !::.p y !::.x son las indeterminaciones en los valores
del impulso y de la coordenada en un mismo instante y ponen de manifiesto que
estas dos magnitudes no pueden poseer simultáneamente valores rigurosamente
determinados. En cambio, las energías E, e pueden, por el contrario, ser medidas en
cada instante con la precisión que se quiera. La cantidad (E +e) - (E' +e') en
(44.1) es la diferencia entre dos valores de la energía E+ E medidos exactamente en
dos instantes distintos, y en modo alguno se refiere a la indeterminación en el valor
176
Teoría de perturbaciones
de la energía en un instante determinado.
Si se considera E como energía de un cierto sistema y E' como la energía del
« aparato de medida », podemos decir que la energía de interacción entre ellos se
puede tener en cuenta tan sólo con una precisión que es del orden de li./ M. Designemos por 11E, ~E', ••• los errores en las mediciones de las cantidades correspondientes. En el mejor de los casos, cuando E", E'' se conocen exactamente ( i1E" = 11e' = O),
tenemos:
D.(E-E') "'li./M.
(44.2)
De esta relación se pueden deducir importantes consecuencias relativas a la medición del impulso. El proceso de medición del impulso de una partícula (para concretar, hablaremos de un elect_rón) supone la colisión del electrón con alguna otra partícula (la « de medida ») cuyos impulsos antes y después del choque se pueden considerar conocidos exactamente (1). Si a esta colisión se aplica la ley de conservación
del impulso, obtenemos, tres ecuaciones (las tres componentes de una ecuación
vectorial) con seis incógnitas - las componentes del impulso del electrón antes
y después del choque. Para aumentar el número de ecuaciones cabe realizar una serie
de colisiones sucesivas del electrón con las partículas « de medida » y aplicar la ley
de conservación del impulso a cada una de dichas colisiones. Sin embargo, se aumenta
con esto también el número de incógnitas (los impulsos del electrón entre colisión
y colisión), y es fácil ver que cualquiera que sea el número de colisiones el número
de incógnitas excederá en tres al número de ecuaciones. Por consiguiente, para medir
el impulso de un electrón es necesario aplicar, junto con la ley de conservación del
.impulso, la ley de conservación de la energía en cada colisión. Con todo, esta última,
conforme vimos, sólo puede aplicarse con una precisión que es del orden de ñ/ M,
donde M es el tiempo transcurrido entre el principio y el final del proceso considerado.
Para simplificar el razonamiento que sigue conviene considerar un experimento
ideal en el que la « partícula de medida » es un espejo plano que actúa como un
reflector perfecto; entra entonces en juego solamente una componente del impulso
- la componente perpendicular al plano del espejo. Para determinar el impulso P
de la partícula, las leyes de conservación del impulso y de la energía nos dan las
ecuaciones
p'+P'-p-P = O,
(44.3)
je'+E'-e-E/ ,..._,Ji/f:..t,
(44.4)
(P, E son el impulso y la energía de la partícula, p, E' el impulso y la energía del espejo;
las cantidades sin y con apóstrofo se refieren respectivamente a los instantes antes
1
( )
Para el análisis que se efectúa aquí, no es esencial como se conoce la energía de la partícula « de
medida».
La relación de indeterminación para la energía
177
1
y después del choque). Las cantidades p, p', €, € que corresponden a la « partícula
de medida », se pueden considerar conocidas exactamente, es decir, sus errores son
iguales a cero. Para los errores que afectan a las restantes cantidades se tiene entonces, en virtud de las ecuaciones que preceden:
,
!lP = !lP', !lE'-!lE
l'-.J
ñ/!lt.
óE
Pero 11E = éJP 11P = v11P, donde v es la velocidad del electrón (antes del choque),
y análogamente 11E' = v' 11P' = v' 11P. Obtenemos, por lo tanto:
(44.5)
Hemos escrito explícitamente aquí los índices x para la velocidad y el impulso con el
fin de subrayar que esta relación vale para cada una de las componentes por separado.
Ésta es precisamente la relación buscada. Esta relación pone de manifiesto que la
medición del impulso de un electrón (con una precisión dada 11P) está inevitablemente ligada con una variación de su velocidad (es decir, con una variación del propio impulso). Este cambio es tanto mayor cuanto más corta es la duración del propio proceso de medida. Se puede conseguir que la variación de la velocidad sea tan
pequeña cuanto se quiera solamente si se hace M -+ =, pero las mediciones del
impulso que se prolongan durante un tiempo grande sólo pueden tener sentido
para una partícula libre. Se manifiesta aquí de manera particularmente clara la no
reproducibilidad de la medición del impulso al cabo de cortos intervalos de tiempo
y la « doble faz» que ofrece la medición en mecánica cuántica: la necesidad de
distinguir entre el valor medido de la magnitud y el valor que surje como resultado
del proceso de medición (1).
La conclusión a que hemos llegado al principio de este párrafo basándonos en la
teoría de perturbaciones, se puede deducir desde otro punto de vista considerando
la desintegración de un sistema provocada por una perturbación cualquiera. Sea E 0
un nivel de energía del sistema calculado prescindiendo por completo de la posi.bilidad de su desintegración. Designaremos por • la duración de la vida de este estado
del sistema, es decir, la cantidad igual al recíproco de la probabilidad de desintegración por unidad de tiempo. Procediendo igual que antes, encontramos entonces que
(44.6)
donde E, € son las energías de las dos componentes en que se ha desintegrado el sistema. Pero de la suma E+€ cabe deducir una estimación de la energía del sistema
antes de la desintegración. Por lo tanto, la relación obtenida prueba que la energía
de un sistema que puede desintegrarse y que se halle en un estado cuasiestacionario
(1) La relación (44.5), como la explicación del sentido físico que encierra la relación de indeterminación
de la energía, se debe a N. BOHR (1928).
178
Teoría de perturbaciones
se puede determinar tan sólo con una precisión que es del orden de magnitud de ñ/r.
Esta cantidad se suele llamar anchura r del nivel. Así, pues,
r t"-Jñ,J,r.
§ 45.
(44.7)
La energía potencial como perturbación
Merece particular atención el caso en que la energía potencial total de la partícula
en el campo exterior se puede considerar como una perturbación. La ecuación no
perturbada de ScHRODINGER es entonces la ecuación del movimiento libre de una
partícula
k = y'(2mE/Ji2) = p/li,
(45.1)
y tiene ondas planas como soluciones. El espectro energético del movimiento libre
es continuo, con lo que nos encontramos ante un caso característico de teoría de perturbaciones en el es¡:ectro continuo. La resolución del problema resulta aquí particularmente cómoda procediendo directamente, sin acudir a las fórmulas generales.
La ecuación que da la corrección de primer orden
onda es:
tp(I)
relativa a la función de
(45.2)
( U es la energía potencial). La solución de esta ecuación, como es sabido por electro-
dinámica, se puede escribir en la forma de potenciales retardados es decir, en la
forma (1):
¡J,<1l(x, y, z) =
-(m/21rli2)
f
¡J,<0lU(x',y', z')etkr
dV'Jr,
(45.3)
donde
dV' = dx'dy'dz',
r 2 = (x-x') 2 +(y-y')2+(z-z')2.
Veamos a que condiciones debe satisfacer el campo U para que podamos considerarlo como una perturbación. La condición de aplicabilidad de la teoría de perturbaciones puede resumirse en la condición de que sea if,<I> ~ if,<o>. Sea a el orden
de magnitud de las dimensiones de la región del espacio en las que el campo difiere
apreciablemente de cero. Supongamos primero que la energía de la partícula es
tan pequeña, que el producto ak es menor que o del orden de la unidad. El factor
eikr en el integrando de la expresión (45.3) carece entonces de importancia en la
estimáción del orden de magnitud, y toda la integral será del orden de tp(o)¡ Uja 2,
de forma que
(1) Es ésta una integral particular de la ecuación (45.2), a la que se puede añadir todavía una solución
cualquiera de la ecuación homogénea (es decir, de la ecuación no perturbada (45.1)).
La energfo potencial como perturbación
179
y obtenemos la condición
Uf~
1
li2/ma2
( para ka
< 1).
(45.4)
Obsérvese que la expresión que aparece en el segundo miembro posee un simple
significado físico; es el orden de magnitud de la energía cinética que poseería la
partícula limitada a un volumen cuyas dimensiones lineales fuesen del orden de a
(ya que, según la relación de indeterminación, su impulso sería del orden de ñ/a).
Consideremos, en particular, un pozo de potencial tan poco profundo que para
él se cumple la condición (45.4). Es fácil ver que en un tal pozo no existen niveles
de energía negativos (R. PEIERLS, 1929); nos hemos encontrado ya con esta situación
en el problema del § 33 para el caso particular de un pozo que presenta simetría
esférica. En efecto, para E = O la función de onda no perturbada se reduce a una
constante, que se puede tomar igual a la unidad: if;< 0 > = l. Dado que if;<1 > ~ if;< 0 >,
es claro que la función de onda del movimiento en el pozo, if; = 1 +if;<1 > no se anula
en ningún punto; pero una función propia que no presenta nodos corresponde al
estado normal, de forma que E = O sigue siendo el menor valor propio posible de la
energía de la partícula. Así, pues, si el pozo no es suficientemente profundo, es
sólo posible un movimiento infinito de la partícula - la partícula no puede ser
«capturada» por el pozo. Conviene llamar la atención sobre el hecho de que este
resultado posee un carácter típicamente cuántico: en la mecánica clásica la partícula
puede realizar un movimiento finito en un pozo de potencial cualquiera.
Es necesario subrayar que todo lo que acabamos de decir se refiere solamente
a un pozo tridimensional. En un pozo de una y de dos dimensiones (es decir, un pozo
en el que el campo es función solamente de una o de dos coordenadas) existen
siempre niveles de energía negativa (véanse los problemas de este párrafo). Ello
está ligado con el hecho de que, en los casos de una y de dos dimensiones, la teoría
de perturbaciones considerada no es aplicable para una energía E igual a cero (o
muy pequeña) (1).
En el caso de grandes energías, cuando ka ~ 1, el factor eikr del integrando representa un importante papel, ya que disminuye fuertemente el valor de la integral.
La solución (45.3) puede transformarse, en este caso, llevándola a otra forma, para
obtener la cual, sin embargo, es más cómodo partir directamente de la ecuación
(45.2). Elijamos la dirección del movimiento no perturbado como eje x; la función
de onda no perturbada tiene entonces la forma if;< 0 > = eikx (convendremos en tomar
(1) En el caso bidimensional, 'ljJ(I) se expresa (como es sabido por la teoría de la ecuación de las ondas
en dos dimensiones) en U(@ forma análoga a la de la integral (45.3), en la que en vez de eikr dx' dy' dz'
aparece inH0 ( 1 )(kr) dx' dy' (H0 ( 1 ) es la función de Hankel de orden cero de primera especie), y
r = l(x' -x)2+(y' -y) 2 •
Para k-+ O, la función de Hankel, y con ella toda la integral, tiende logarítmicamente a infinito.
A!'álogamente, en el caso de una dimensión, en el integrando de la fórmula que determina 1jJ( 1 ) aparece
2n/ eikr dx' (donde r = 1x' - x y para k-+ O la corrección "P(ll tiende a infinito como J/k.
1
)
180
Teoría de perturbaciones
el factor constante igual a la unidad). Busquemos la solución de la ecuación
6,fJ.l>+k2,¡Jl> = (2m/Ji2)Ueikx
en Ja forma ifi<I> = eikx¡; teniendo en cuenta que, dado que k se ha supuesto grande,
basta conservar en !J. 1/1) únicamente aquellos términos en los que se deriva (aunque
sólo sea una vez) al factor eikx. Obtenemos entonces para f la ecuación
2ik 8f/8x
= 2mU/li2 ,
de donde
J
,fJ<l) = eikx¡ = -(im/n 2k)eikx U dx.
(45.5)
La estimación de esta integral da !ifi<1>¡ ,._ mUa/Ji2k, de forma que la condición
de aplicabilidad de la teoría de perturbaciones será en este caso:
JU/ ~ (n2/ma2)ka
= ñv/a
(ka> 1),
(45.6)
(v = klitm es la velocidad de la partícula). Obsérvese que esta condición es menos
restrictiva que la (45.4). Por lo tanto, si es posible considerar el campo como una
perturbación para energías pequeñas de la partícula, ello será también posible para
grandes energías, mientras que el recíproco no vale en general (1).
La aplicabilidad de la teoría de perturbaciones que hemos desarrollado aquí
al campo de Coulomb exige un análisis especial. En el campo U= a/res imposible
separar una región finita del espacio fuera de la cual U sea considerablemente menor
que dentro de ella. La condición que se busca se puede obtener escribiendo en (45.6)
la distancia variable r en vez del parámetro a; ello conduce a la desigualdad
r,./Jiv ~ 1.
(45.7)
Así, pues, para grandes energías de la partícula el campo de Coulomb se puede
considerar como una perturbación (2).
Finalmente, deduzcamos la fórmula que determina aproximadamente la función
de onda de una partícula cuya energía E es, en todo el espacio, mucho mayor que la
energía potencial U (no se exige aquí que se cumpla ninguna otra condición). En
primera aproximación, la dependencia de la función de onda respecto de las coordenadas es la misma que en el movimiento libre (cuya dirección eligiremos como
(l) En el caso unidimensional, la condición de aplicabilidad de la teoría de perturbaciones viene dada
por la desigualdad (45.6) cualquiera que sea el producto ka. El método seguido para llegar a la condición
(45.4) en el caso de tres dimensiones, no se puede aplicar al caso unidimensional debido a la divergencia
de la función ,¡,( 1 ) construida de esta manera, divergencia que se hizo notar en la nota de la pág. 179).
2
( )
Hay que tener en cuenta que la integral (45.5) para el campo U= r1./r diverge (logarítmicamente)
para grandes valores de x/Vy2 +z 2:-l>or lo tanto, la función de onda obtenida mediante la teoría de perturbaciones en el caso de un campo de Coulomb, no es aplicable dentro de un estrecho cono cuyo eje
coincide con el eje x.
La energía potencial como perturbación
181
eje x). De acuerdo con esto, busquemos '1/J en la forma 1P = eikxF, donde Fes una
función de las coordenadas que varía lentamente con relación al factor eikx (sin que,
en general, sea posible afirmar que dicha función es próxima a la unidad). Substituyendo en la ecuación de SCHRODINGER, obtenemos para F la ecuación
2ik 8F/8x = (2m/lí 2) UF,
(45.8)
de donde
= eikxp =
,f,
constante xeikxe-<i!Av>Juctx.
(45.9)
Ésta es precisamente la expresión buscada. Con todo, no hay que perder de vista
que dicha expresión no es aplicable a distancias demasiado grandes. En la ecuación
(45.8) se ha prescindido del término ~F, que contiene las segundas derivadas de F.
La derivada [J2F/ox 2 , junto con la derivada primera oF/ox, tiende a cero a grandes
distancias. Las derivadas correspondientes a las direcciones transversales J', z, en
cambio, no tienden a cero y sólo es posible prescindir de ellas si se cumple la condición x ~ ka 2 •
PROBLEMAS
1. Determinar el nivel de energía en un pozo de potencial unidimensional de pequeña profundidad; se supone que se cumple la condición (45.4).
Solución. Supongamos - suposición que vendrá confirmada por el resultado - que el nivel
de energía es tal que :E: ~ U!. Entonces, en el segundo miembro de la ecuación de SCHRODINGER
1
d2,f,/dx2
= (2m/lí2)[U(x)-E]if,,
se puede prescindir de E dentro del pozo y también considerar 1P como una constante que, sin
restringir la generalidad, se puede tomar igual a la unidad:
d2,f,/dx2 = 2mU/lí2 •
Integremos esta igualdad respecto de x entre dos puntos ± x 1 tales que a ~- x 1 ~ 1/,c donde a
es la anchura del pozo y x = V2m[Ejh. Dada la convergencia de la integral de U(x), podemos
extender la integración del segundo miembro desde a + =:
=
00
d,f,]X1
[dx -~
1
2mf Udx.
=lí 2-00
Lejos del pozo, la función de onda es de la forma 1P
-2K =
=
e± Y.x. Substituyendo en (1 ), encontramos:
(2m/h')_Í U dx
o bien
IE/
=
(m/2h')[] U dx]'·
-X
(1)
182
Teoría de perturbaciones
Vemos así que, de acuerdo con la hipótesis hecha, el valor del nivel resulta ser una cantidad pequeña de orden superior (de segundo orden) con relación a la profundidad del pozo.
2.
Determinar el nivel de energía en un pozo de potencial de dos dimensiones U(r) (r es el
00
radio vector en el plano) de pequeña profundidad; se supone que la integral
f rUdr es convergente.
o
Solución.
Procediendo como en e1 problema anterior, obtenemos dentro del pozo la ecuación
Integrándola respecto de r desde O a r 1 (donde a~ r 1
clip
1
f
1/x), tenemos:
00
2
-]
=;
[ clr
r=r
li
~
'1
rU(r) dr.
(1)
o
Lejos del pozo, la ecuación del movimiento libre bidimensional
1 d ( clip) 2m
- - r- +-Eip = O,
r dr clr
li2
tiene la solución (que se anula en el infinito) '1/J = const· K 0 (xr), donde K 0 es la función de Hankel
de primera especie y orden cero de argumento imaginario; para valores pequeños del argumento,
el término principal en K 0 es proporcional a In xr. Teniendo esto en cuenta, igualaremos parar,._, a
las derivadas logarítmicas de '1/J, calculadas en el pozo (segundo miembro de (1)) y fuera de él, con
lo que obtenemos:
1
a
de donde
IE/ -
Iog Ka
2
_!!!_
/i2a
f
00
U(r)r dr,
o
m:: ex+ ~'[f¡u¡, dr] +
o
Vemos así que el nivel de energía es un infinitésimo de orden exponencial con relación a la profundidad del pozo.
CAPÍTULO
V11
EL CASO CUASICLÁSICO
~
46.
La función de onda en el caso cuasiclásico
Si las longitudes de onda de de Broglie de las partículas son pequeñas respecto
de las dimensiones características que determinan las condiciones del problema
concreto planteado, las propiedades del sistema se aproximan a las clásicas (1).
(Se trata aquí de un caso análogo al de la óptica ondulatoria, que se reduce a la
óptica geométrica cuando se hace tender a cero la longitud de onda.)
Analicemos ahora de manera más detenida las propiedades de los sistemas
« cuasiclásicos ». Para ello, en la ecuación de ScHROCINGER
substituyamos formalmente
ip =
e<tlnlu,
(46.1)
Para la función a obtenemos la ecuación
(46.2)
Dado que el sistema se supone casi clásico por sus propiedades, determinaremos a
en forma de serie
<J
= cro+(n/i)cr1 +(ñ/i) 2cr2+ ... ,
(46.3)
ordenada en potencias de li.
1
( )
Señalemos, en particular, que los estados del espectro discreto con valores grandes del número
rnántico n poseen un carácter cuasiclásico. En efecto, el número n -- número ordinal del estado - determina el número de nodos de la función propia (véase§ 21 ). Pero la distancia entre dos nodos consecutivos
coincide en orden de magnitud con la longitud de onda de de Broglie. Para valores grandes de n esta distancia es pequeña, de forma que la longitud de onda es pequeña con relación a las dimensiones de la región
en que tiene Jugar el movimiento.
184
El caso cuasiclásico
Consideremos primero el caso más simple, el movimiento unidimensional de
una partícula. La ecuación (46.2) se reduce entonces a la ecuación
(46.4)
cr' 2 /2m-iñcr" /2m = E- U(x),
(donde el apóstrofo significa derivación respecto de la coordenada x).
En primera aproximación hagamos a = a0 y prescindamos en la ecuación del
término que contiene ñ:
cr0 ' 2 /2m = E- U(x).
Se sigue de aquí:
O'o
=
±
f v'{2m[E- U(x)]} dx.
El integrando no es sino el impulso clásico p(x) de la partícula expresado en función
de la coordenada. Eligiendo para la función p(x) el signo + antes de la raíz, tendremos:
cr0 =
± f p dx,
p = v'[2m(E- U)],
(46.5)
lo que era de esperar teniendo en cuenta la expresión límite (6.1) para la función de
onda (1).
Es lícito prescindir de los términos de que hemos prescindido en la ecuación
(46.4) únicamente cuando el segundo término del primer miembro de la igualdad
es pequeño comparado con el primero, es decir, debe tenerse ñ[a"/a' 2 / ~ 1, o bien
jd(n/cr')/dxj ~ l.
En primera aproximación tenemos, de acuerdo con (46.5),
condición obtenida se puede escribir en la forma:
jd(.\/21r)/dxj
~
1,
a' = p,
de modo que la
(46.6)
donde ). = J./2n y }.(x) = 2nnlp(x) es la longitud de onda de de Broglie de la partícula expresada en función de x mediante la función clásica p(x). Hemos obtenido
así una condición cuantitativa que expresa el carácter cuasiclásico; la longitud de
onda de la partícula debe variar poco a lo largo de distancias que son del mismo
orden que ella misma. Las fórmulas deducidas aquí dejan de ser aplicables en aquellas regiones del espacio en las que esta condición no se cumple.
La condición (46.6) puede escribirse también en otra forma, observando que
(1) Como es sabido, J p dx es la parte de la acción que no depende del tiempo. La acción mecánica
total S de la partícula es S = - Et ± Jp dx. En a 0 el término - Et no existe debido a que la función
de onda considerada es la independiente del tiempo, "P·
185
La /unción de onda en el caso cuasiclásico
dp
-
dx
d
= -y[2m(E- U)]
dx
mdU
= -- -
pdx
mlF/
= -,
p
donde F = - dU/dx es la fuerza clásica que actúa sobre la partícula situada en el
campo exterior. Introduciendo esta fuerza, encontramos:
mlílF/(p3 ~ l.
(46.7)
Se sigue de aquí que la aproximación cuasiclásica deja de ser aplicable cuando el
impulso de la partícula es demasiado pequeño. En particular, es claramente inaplicable cerca de los puntos de retroceso, es decir, cerca de aquellos puntos en los que la
partícula, según la mecánica clásica, se pararía para empezar luego a moverse en
sentido opuesto. Estos puntos vienen determinados por la igualdad p(x) = O, es
decir, E = U(x). Para p -> O, la longitud de onda de de Broglie tiende a infinito y
es claro que en ningún caso se puede entonces considerar pequeña.
Pasemos ahora al cálculo del término siguiente en el desarrollo (46.3). Los términos de primer orden respecto de·ñ en la ecuación (46.4) nos dan
de donde
a'¡' = -a0 "/2a0 ' = -p'/2p.
Integrando, se encuentra:
a1 =
-! logp,
(46.8)
(prescindimos de la constante de integración).
Substituyendo la expresión obtenida en (46.1), (46.3), obtenemos la función de
onda en la forma:
(46.9)
Los términos siguientes en el desarrollo (46.3) conducirían a la aparición de términos
de primer orden y de orden superior respecto de ñ en los coeficientes de las exponenciales; por lo general, estos términos no son necesarios en los cálculos.
La presencia del factor 1!V p en la función de onda admite una simple interpretación. La probabilidad de encontrar la partícula en puntos cuyas coordenadas están
comprendidas entre x y x+dx viene determinada por el cuadrado 11') 2, es decir, es
proporcional en esencia a 1/p. Esto es precisamente lo que era de esperar para una
« partícula cuasiclásica », puesto que en el movimiento clásico el tiempo que pasa
la partícula en el segmento dx es inversamente proporcional a la velocidad (o al
impulso) de la misma.
J
El cmw cua.o1iclásico
186
En las regiones del espacio « clásicamente inaccesibles », donde E < U(x), la
función p(x) es imaginaria pura, de modo que los exponentes son reales. Escribiremos la función de onda en estas regiones en la forma:
C'
C'
vlPI
'\IIPI
Y, = _ 1_e-(l /11,)J IP I dx +-2-e{l /h)f IP ldx.
(46.10)
PROBLEMAS
Determinar la función de onda en la aproximación cuasiclásica hasta los términos del orden
de h inclusive en el coeficiente de la exponencial.
Solución.
Los términos del orden de lt 2 en la ecuación (46.4) nos dan
ªo' ª2' +icri' 2 +icri''
= O,
de donde (substituyendo (46.5) y (46.8) en vez de a 0 y a 1)
Integrando (el primer término se integra por partes) e introduciendo la fuerza F
=
pp'/m obtenemos:
La función de onda en esta aproximación es de la forma:
o bien
J(F2jp5) dx
.
. 2
3-}ilím
y, = constante [1-iimñF/p
vP
§ 47.
J
]e<illtl P dx.
Condiciones en los límites en el caso cuasi clásico
Sea x = a un punto de retroceso (de forma que U(a) = E) y supongamos que
U> E para todo x > a de forma que la región a la derecha del punto de retroceso
es clásicamente inaccesible. La función de onda debe tender a cero a medida que se
penetra en esta región. A suficiente distancia del punto de retroceso, dicha función
tiene la forma
para x > a,
(47.1)
que corresponde al primer término de (46.10). En cambio, a la izquierda del punto
de retroceso, la función de onda debe venir representada por la combinación real
187
Condiciones en los límites en el caso cua.,;iclásico
(46.9) de dos soluciones cuasiclásicas de la ecuación de SCHRODINGER:
~
= ~:
exp(H pdx)+ ~; exp(-H pdx) para
a
x < a.
(47.2)
a
Para determinar los coeficientes de esta combinación hay que seguir la marcha
de la función de onda desde valores positivos de x - a (donde es válida la expresión
(47.1)) a valores negativos. Sin embargo, al hacerlo habría que atravesar el dominio
en torno del punto de retroceso, donde la aproximación cuasiclásica es ·inaplicable
y es necesario considerar la solución exacta de la ecuación de ScHRODINGER (1).
Es posible evitar este paso si se considera formalmente '1/J como una función de
la variable compleja x y se pasa de valores positivos a valores negativos de x - a
a lo largo de un camino situado todo él en un dominio suficientemente alejado del
punto a, dominio en el cual se cumple formalmente la condición para el carácter
cuasi clásico.
Sigamos primero la variación de la función de onda (47.1) al rodear el punto a
de derecha a izquierda a lo largo de una semicircunferencia de radio grande situada
en el semiplano superior de la variable compleja x. Para mayor claridad escribamos
(47.1) en la forma
v(2m)
IX
)
if,(x)=!C[2m(U-E)]-lf4exp ( - l i - v[U(x)-E]dx,
(47.3)
a
poniendo de manifiesto explícitamente la función p(x). Es desde luego evidente que,
al recorrer el camino indicado, la función (47.3) debe en definitiva transformarse
en el segundo término que aparece en (47.2), dado que todo a lo largo de dicho camino
es precisamente ese término el fundamental en comparación con el primer término,
que tiende a cero exponencialmente a medida que penetramos en el semiplano
superior. Y, en efecto, cuando x varía a lo largo de dicho camino,la fase de la diferencia U(x) - E, junto con la fase de la diferencia x - a, aumenta en n. Por consiguiente, la función (47.3) pasa a coincidir con el segundo término de (47.2) con un
coeficiente C2 = !Ce-i11'!4. De manera análoga, al recorrer la semicircunferencia
de derecha a izquierda en el semiplano inferior, la función (47.3) se transforma en
el primer término de (47.2) con el coeficiente
A la función de onda (47.1) para x
> a corresponde así para x <ala función
(2)
(1) Cerca del punto de retroceso E - U "-' F0 (x - a) (donde F., = - (dU/dx)x=ª; la correspondiente solución exacta de la ecuación de ScHRODINGER viene dada por las fórmulas obtenidas en el § 24.
2
( )
Si la región en la que U < E se encontrara a la derecha del punto de retroceso x
(47.4) sería entonces necesario escribir:
b
~=
~P
cosGJ pdx+VT)
X
=
b, en vez de
X
= ~p
senG f p dx+!1r).
b
(47.4a)
188
El caso cuasiclásico
para x < a.
(47.4)
Las funciones (47.1) y (47.4) son expresiones aproximadas, a la derecha y a la izquierda del punto de retroceso, de la misma solución exacta de la ecuación de SCHRODINGER (H. KRAMERS, 1926).
Si la región clásicamente admisible está limitada (para x = a) por un « muro
de potencial » infinitamente alto, la condición de contorno para la función de onda
en x = a es 1p = O (véase § 18). La aproximación cuasiclásica es aplicable en este
caso hasta el propio « muro » y la función de onda es:
1f
X
e
if, = -senv'P ñ
para x < a,
pdx
(47.5)
a
para x > a.
§ 48.
Regla de cuantificación de Bohr-Sommerfeld
Los resultados obtenidos permiten deducir la condición que determina los niveles cuánticos de energía en el caso cuasiclásico. Para ello consideremos el movimiento
unidimensional finito de una partícula en un pozo de potencial; el dominio accesible
clásicamente, b s x s a, está limitado por los dos puntos de retroceso (1).
La condición de contorno en el punto x
del mismo) a la función de onda (47.4a)
=
b conduce (en la región a la derecha
(48.1)
(1) En la mecánica clásica, una partícula en un campo de esta naturaleza efectuaría un movimiento
periódico con período (tiempo empleado en el movimiento de ida y vuelta del punto b al punto a)
a
T = 2
f dx/v
b
(v
es la velocidad de la partícula).
a
=
f
2m dx/p,
b
Regla de cuantificación de Bohr-Sommer/eld
189
Aplicando la fórmula (47.4) a la región a la izquierda del punto x = a, obtenemos
la misma función en la forma
.¡, = v'P sen[1Ji f p dx+t,,-J
a
C'
:.r:
Para que estas dos expresiones coincidan en toda la región, la suma de las fases
(que es una constante) debe ser un múltiplo entero de n:
a
~
f
p dx+},r = (n+l),,,
b
(con C = (- l)nC'). De aquí resulta
.
donde la integral
fp
f p dx = 2 Jp d.x
dx
= 21rn(n+!),
(48.2)
se extiende a todo un período del movimiento
&
clásico de la partícula. Ésta es precisamente la condición que determina en el caso
cuasiclásico los estados estacionarios de una partícula. Dicha condición corresponde
a la regla de cuantificación de Bohr-Sommerfeld de la antigua teoría cuántica.
Es fácil ver que el número entero n es igual al número de ceros de la función
de onda y coincide, por consiguiente, con el número ordinal del estado estacionario.
En efecto, la fase de la función de onda (48.1) crece desde n/4 en el punto x = b
a (n+nn en el punto x = a, de forma que la función seno se anula en este intervalo n
veces (fuera del intervalo b s:: x ::;; a, la función de onda decrece con monotonía,
sin anularse en ningún punto a distancia finita) (1). Recordemos en relación con esto
que la aproximación cuasiclásica, y, por lo tanto, también la regla de cuantificación
(48.2), es aplicable solamente para grandes valores de n (2).
Para la normalización de la función de onda basta integrar j v,¡ 2 en el intervalo
b s:: x s:: a, ya que fuera de él v,(x) disminuye exponencialmente. Dado que el argumento del seno en (48.1) es una función que varía rápidamente, con precisión suficiente podemos substituir el cuadrado del seno por su valor medio, es decir, por 1/ 2 •
Obtenemos entonces:
(1) En rigor, el cálculo del número de ceros debería efectuarse teniendo en cuenta la forma exacta
de la función de onda cerca de los puntos de retroceso. Este análisis confirma el resultado indicado en el
texto.
2
( )
En algunos casos la expresión exacta de los niveles de energía E(n) (como función del número cuántico n) obtenida a partir de la ecuación exacta de SCHRODINGER es tal que paran---+ oo conserva su forma:
ejemplo de ello lo ofrecen los niveles de energía en un campo coulombiano y los niveles de energía del
oscilador armónico. Es natural que en estos casos la regla de cuantificación de BOHR, aplicada para valores
grandes den, dé para la función E(n) una expresión que coincide con la exacta.
190
El caso cuasiclásico
a
f
2
1"11 dx
f
~ tc ~
p(x)
2
b
=
TTC2/2mw = 1,
donde w = 2:n/T es la frecuencia del movimiento periódico clásico. Así, pues, la
función cuasiclásica normalizada es
~ = J1: se{Hp dx+!,rJ
(48.3)
b
Hay que recordar que la frecuencia w es, en general, diferente para los diferentes
niveles, siendo una función de la energía.
La relación (48.2) se puede interpretar de otra manera todavía. La integral
dx es el área limitada por la trayectoria cerrada clásica en el espacio de las
fases de la partícula (es decir, por la curva en el plano p, x del espacio de las fases
de la misma). Dividiendo esta área en celdas de área 2:nlf cada una, obtenemos en
total n celdas. Pero n es el número de estados cuánticos con energías que no superan
el valor dado de la energía (que corresponde a la trayectoria considerada en el espacio
de las fases). Podemos decir así que en el caso cuasiclásico a cada estado cuántico
corresponde una celda de área 2:n/ren el espacio de las fases. Dicho de otra manera,
el número de estados que corresponden al elemento de volumen !:l.p !:l.x del espacio
de las fases es
fp
(48.4)
b.p!ix/2Trñ.
Si se introduce en vez del impulso el número de onda k = p/li; este número se escribe
en la forma 6.k 6.x/2;i y coincide, como era de esperar, con la conocida expresión
del número de vibraciones propias de un campo de ondas (1).
Partiendo de la regla de cuantificación (48.2), se puede explicar el carácter general de la distribución de niveles en el espectro energético. Sea !:l.E la distancia entre
dos niveles consecutivos, es decir, entre dos niveles cuyos números cuánticos n
difieren en una unidad. Dado que !:l.E es pequeño tpara n grande) respecto a la propia energía de los niveles, basándonos en (48.2) podemos escribir:
M
f (8p/8E) dx
=
2Trñ.
Pero oE/óp = v, de modo que:
f (8p/8E) dx = f dx/v = T.
1
( )
Véase, por eJemplo, vol. II, Teoría Clásica de los Campos, § 52.
Regla de cuantificación de Bohr-Sommerfeld
191
Obtenemos, por lo tanto:
!lE = 21Tli/ T = liw.
(48.5)
Así, pues, la distancia entre dos niveles de energía consecutivos resulta ser igual
a liw. Para toda una serie de niveles vecinos (tales que la diferencia de sus números n
es pequeña comparada con los propios valores de n), las correspondientes frecuencias
w se pueden considerar iguales aproximadamente. Por lo tanto, llegamos a la conclusión de que en cada pequeño intervalo de la parte cuasiclásica del espectro los
niveles se distribuyen de manera uniforme, estando separados cada dos por el mismo
intervalo liw. Este resultado, dicho sea de paso, era ya de esperar, puesto que en el
caso cuasi clásico las frecuencias correspondientes a transiciones entre diferentes
niveles de nergía deben ser múltiplos enteros de la frecuencia clásica w.
Es interesante ver en qué se transforman los elementos de matriz de una magnitud
física f cualquiera al pasar al límite clásico. Partamos para ello del hecho de que el
valor medio f en un cierto estado cuántico debe transformarse, en el límite, simplemente en el valor clásico de dicha cantidad, con tal que el propio estado conduzca,
en el límite, a un movimiento de la partícula a lo largo de una trayectoria determinada.
A un estado de esta naturaleza corresponde un paquete de ondas (véase§ 6) que se
obtiene superponiendo toda una serie de estados estacionarios con valores de la
energía próximos entre. sí. La función de onda de dicho estado es de la forma:
donde los coeficientes an difieren apreciablemente de cero tan sólo en un cierto
intervalo ~n de valores del número cuántico n, intervalo tal que 1 ~ ~n ~ n; los
números n se suponen grandes, de acuerdo con el carácter cuasiclásico de los estados
estacionarios. El valor medio de fes igual, por definición, a
o bien, substituyendo la suma respecto de n, m por una suma respecto de n y de la
diferencia s = m - n:
f _ ns ªn+s*ªnJn+, • neiwst,
-
donde se ha hecho
wmn
=
~~
.f
¿,.,(.,¡
sw en correspondencia con (48.5).
Los elementos de matriz fnm calculados a partir de las funciones de onda cuasiclásicas disminuyen rápidamente en valor absoluto al aumentar la diferencia m - n,
resultando a la vez ser funciones lentamente variables del propio número n (para
un valor dado de m - n). En vista de esto, se puede escribir aproximadamente
f
= :E:E
J eiwst = :En lan ¡2 ~fseiwst,
ns a n*a ns
8
192
El caso cuasiclásico
donde se ha introducido la notación
f
8
=
f ñ+s,ñ, ñ
y ñ es un cierto valor medio del número cuántico en el intervalo lln. Pero
i:¡anl
2
= 1;
por lo tanto,
J=
~f,éwst.
8
La suma obtenida tiene la forma de una serie de Fourier ordinaria. Dado que f
debe coincidir en el limite con la cantidad clásica f(t), llegamos al resultado de que
los elementos de matriz.(mn se reducen, en el límite, a las componentes f m-n del desarroJlo de la función clásica f(t) en serie de Fourier.
Análogamente, los elementos de matriz correspondientes a las transiciones entre
estados del espectro continuo se transforman en las componentes de la representación de/(t) por una integral de Fourier. Para ello, sin embargo, las funciones de onda
de los estados estacionarios deben normalizarse respecto de la función-6 de la energía, dividida por lí.
Todos los resultados expuestos se generalizan desde luego a los sistemas con varios
grados de libertad que efectúan un movimiento finito tal que el problema de mecánica
(clásica) permite una separación completa de las variables en el método de Hamilton-Jacobi (es decir, en el llamado movimiento cuasiperiódico) (1). Después de separar las variables para cada grado de libertad, el problema queda reducido a un problema unidimensional y las correspondientes condiciones de cuantificación tienen la
forma:
(48.6)
donde la integral se extiende a un período de variación de la coordenada generalizada q; y}'; es un número del orden de la unidad que depende del carácter de las condiciones de contorno para el grado de libertad considerado (2).
En el caso general de un movimiento multidimensional cualquiera (no cuasiperiódico), no existen los números cuánticos n;. En cambio, el concepto de
«celdas» en el"espacio de las fases es siempre aplicable (en la aproximación cuasiclásica). Esto es claro por lo dicho antes acerca de la relación de este concepto con
(1)
(2)
Véase vol. I, Mecánica, § 50.
Así, para el movimiento en un campo central:
f Pr dr = 21rñ(nr+i), f Po dB = 21rli(l-m+i), f p'P dcf, = 21rlim,
(donde nr = n - 1 - 1 es el número cuántico radial). La última igualdad expresa simplemente el hecho
de que Pq> es la componente-z del momento cinético, igual a hm.
Movimiento cuasiclásico en un campo central
193
el número de vibraciones propias del campo de ondas en el volumen dado del espacio.
En el caso general de un sistema con s grados de libertad, a cada elemento del espacio
de las fases corresponden
(48.7)
~N = ~q1 ··· ~qs~Pi ... ~Ps/(21rli) 8
estados cuánticos.
PROBLEMAS
l. Determinar (aproximadamente) el número de niveles discretos de energía de una partícula que se mueve en un campo U(r) que satisface la condición relativa al carácter cuasiclásico.
Solución. El número de estados que « corresponden » al volumen del espacio de las fases
definido por los impulsos comprendidos en el intervalo O < p < Pmax y por las coordenadas de
la partícula pertenecientes al elemento de volumen d V es igual a
Para un r dado, la partícula puede poseer (en su movimiento clásico) un impulso que satisface
la condición E= p 2/2m+U(r) < O. Substituyendo Pmax = V-2mU(r), obtenemos el número
total de estados del espectro discreto:
v'2 m3/2
-31r2 li3
f
(-U)ªl 2 dV,
donde la integración se extiende a la región del espacio en la que U < O. Esta integral diverge
(el número de niveles es infinito) si U tiende a cero en el infinito como r- 8 , con s < 2, lo que está
de acuerdo con los resultados del § 18.
2.
El mismo problema, pero para un campo central clásico U(r) (V. L. Pokrovskii)
Solución. En un campo central, el número de estados no coincide con el número de niveles
de energía debido a la degeneración de estos últimos en la dirección del momento cinético. El
número buscado podemos hallarlo observando que el número de niveles con un valor dado del
momento cinético M coincide con el número de niveles (no degenerados) para el movimiento
unidimensional en un campo con energía potencial Ue¡ = U(r)+M 2/2mr 2 • El valor máximo posible
del impulso Pr para un r dado y energías E < O es Pr max = - V2mUe¡, Por consiguiente, el número de estados (es decir, el número de niveles) es igual a
f
dr dpr = v'(2m)
21rli
21rli
f J(-u- ~)
dr.
2mr2
El número total buscado de niveles discretos se obtiene a partir de aquí integrando respecto
de M/h (que substituye en el caso cuasiclásico a la suma respecto de /) y es igual a
(m/41i2)
§ 49.
f (- U)r dr.
Movimiento cuasiclásico en un campo central
Conforme sabemos, en el movimiento de una partícula en un campo central la
194
El caso cuasiclásico
función de onda se descompone en una parte angular y una parte radial. Consideremos ante todo la primera de ellas.
La dependencia de la función de onda angular respecto del ángulo <p (determinada por el número cuántico m) es tan sencilla, que para ella no se plantea la cuestión de hallar fórmulas aproximadas. En cambio, en lo que concierne a su dependencia respecto del ángulo polar o, esta dependencia es, de acuerdo con la regla
general, cuasiclásica si el númer9 cuántico que le corresponde, /, es grande (una
formulación más precisa de esta condición _se dará más adelante).
Nos limitaremos aquí a deducir la expresión cuasiclásica de la función angular
tan sólo para el caso de los estados con número cuántico magnético igual a cero
(m = O), que es el más importante en las aplicaciones. Esta función coincide, salvo
un factor constante, con el polinomio de Legendre P1(cos()) (véase (28,7)) y satisface
la ecuación diferencial
(49.1)
La substitución
Pz(cosB) = x(B)/y'senB
(49.2)
x" + [(l-H) 2 +i cosec2B]x = O,
(49.3)
conduce a la ecuación
que no contiene la derivada primera y que por su aspecto es análoga a la ecuación
unidimensional de ScHRODINGER.
En la ecuación (49.3) el papel de « longitud de onda de De Broglie » lo representa
la cantidad
,\ =
27T í(l+!)2+! cosec 2 BJ-l/2.
La condición de que la derivada dÁ/dx sea pequeña(condición (46.6)) conduce a las
desigualdad es
Bl
~
1,
(7r-B)l
~
1,
(49.4)
(condiciones para que la parte angular de la función de onda se pueda considerar
como cuasiclásica). Para grandes valores de l estas condiciones quedan satisfechas
ca5i en todo el intervalo de valores o, con la única excepción de los ángulos muy
próximos a cero o a n.
·
Si se cumplen las condiciones (49.4), se puede prescindir en la ecuación (49.3)
del segundo término entre paréntesis rectos frente al primero:
x" +(l+U2x
=
o.
195
Movimiento cuasiclásico en un campo central
La solución de esta ecuación da:
X= ysenO Pz(cosO) = Asen[(l+!)O+(X],
(A,
<1..
(49.5)
son constantes).
Para ángulos O ~ 1, en la ecuación (49 .1) se puede hacer ctgO ""' 1/O; substituyendo también aproximadamente en vez de l(l+ 1) el valor (1+ 1 / 2) 2, obtenemos la
ecuación
d2P
1 dP1
1
-+-+(l+!) P, =
d0
O dO
2
2
O
'
que tiene como solución la función de Bessel de orden cero
P1(cos0) =]0 [(l+!j8],
(49.6)
8 ~ l.
El factor constante lo hacemos igual a la unidad, puesto que para
e=
O debe ser
P 1 = l. La expresión aproximada de (49.6) para P 1 es válida para todos los ángulos
O ~ 1. En particular, es posible aplicarla también para ángulos en la región 1/ l ~ O ~ 1,
donde debe coincidir con la expresión (49.5), que es válida para cualesquiera O ~ 1/l.
Si 0/ ~ 1, la función de Bessel se puede substituir por su expresión asintótica para
grandes valores del argumento, con lo que obtenemos:
J_:_ sen[(l+!)O+t,r]
Pi ~
yO
1rl
(en el coeficiente se puede prescindir del sumando ! frente a /). Comparando con
(49.5), encontramos que A = VC2/ ni) <l.. = n/4. Se obtiene así en definitiva la siguiente
expresión para P1 ( cos O), válida en el caso cuasiclásico (1):
Pz(cosO)
~
2 sen[(l+!)O+b]
.
1rl
ysen8
J
(49.7)
La normalización de la función de onda 0 10 se consigue, según (28. 7), multiplicando
por ¡1 V(!+~) ,..., ¡1 V l:
0zo(8)
. J2sen[(l+!)0+!1r]
.
7T
ysenO
~ il
(49.8)
Pasemos a la componente radial de la función de onda. En el § 32 se demostró
que la función x(r) = rR(r) satisface una ecuación que es idéntica a la ecuación
(1) Conviene llamar la atención sobre el hecho de que, precisamente como resultado de la substitución
de /(/+ 1) por (/+} )2, hemos obtenido una expresión que queda multiplicada por (- J)I al cambiar O
por ::r -0, cual debe ser para la función Pz{cos 0).
196
unidimensional de
El caso cuasiclásico
ScHRODINGER
U1(r)
con una energía potencial
ñ2 l(l+ 1)
= U(r)+- - -2 .
2m
r
Por consiguiente, podemos aplicar los resultados obtenidos en los párrafos precedentes, entendiendo por energía potencial la función Uz(r ).
El caso más simple es el de l = O. No existe entonces energía centrífuga, y si el
campo U(r) satisface la condición necesaria (46.6), la función de onda radial será
cuasiclásica en todo el espacio. Para r = O debe ser x = O, por lo que la función
cuasiclásica x(r) viene determinada según las fórmulas (47.5).
En cambio, si l =I= O, también la energía centrífuga debe satisfacer la condición
( 46.6). En la región en que r es pequeño, región en que la energía centrífuga es del
mismo orden de magnitud que la energía total, la longitud de onda es A= li/p ,._ r/l,
y la condición (46.6) nos da l ~ l. Así, pues, si les pequeño, en la región en que
también r es pequeño la energía centrífuga no cumple la condición que impone el
carácter cuasiclásico. Es fácil comprobar que se obtiene el valor correcto de la fase
de la función de onda cuasiclásica x(r) si la calculamos mediante las fórmulas del
movimiento unidimensional substituyendo en la energía potencial Uz(r) el coeficiente l(l +1) por (l + n2 ( 1):
l]z(r)
=
n2 (Z+t)2
U(r)+ - - - .
2m ,2
(49.9)
La cuestión de la aplicabilidad de la aproximación cuasiclásica al campo coulombiano U= ± rf-/r exige consideración especial. De toda la región en que tiene
lugar el movimiento, la parte más importante es la que corresponde a distancias r
para las cuales IU/ ,. ., [EJ, es decir, r,...,, rf-/lE[. La condición para que el movimiento
sea cuasiclásico en este dominio se reduce a la condición de que la longitud de onda
A
2m[EI sea pequeña comparada con las dimensiones rf-/\E\ de la región; esto
nos da:
"'lí!V
(49.10)
es decir, el valor absoluto de la energía debe ser pequeño comparado con la energía
de la partícula en la primera órbita de Bohr. La condición (49.10) se puede escribir
también en la forma
rxjñv ~ 1,
(49.11)
(1) Así, en el caso más sencillo, que es el del movimiento libre ( U = O), la fase de la función calculada
según la fórmula (47.4) con el valor uz dado por (49.9) será igual, para grandes valores de r, a kr - nl/2,
cual debe ser.
197
Movimiento cuasiclásico en un campo central
V
donde v "' IE !fm es la velocidad de la partícula. Obsérvese que esta condición es
la opuesta a la condición de aplicabilidad de la teoría de perturbaciones al campo
cóulombiano (45. 7).
En cuanto a la región de distancias pequeñas (1 U(r)I ~ E), en un campo coulombiano repulsivo esta región carece de interés, ya que si U> E las funciones
de onda cuasiclásicas tienden a cero exponencialmente. Si, en cambio, el campo
es atractivo, para valores pequeños de l existe la posibilidad de que la partícula
penetre en una región en la que j UJ ~ jEJ, con lo cual se plantea la cuestión de los
límites de aplicabilidad de la aproximación cuasiclásica en este caso. Partamos de la
condición general (46. 7), haciendo en ella:
= -dU/dr
p ~ v'(2ml UI) ""'v'(m(J./r).
Se obtiene así que la región de aplicabilidad de la aproximación cuasiclásica viene
limitada a las distancias
F
= - (J./r 2,
r~
n/mrx.,
2
(49.12)
es decir, a distancias que son grandes comparadas con el «radio» de la primera
órbita de Bohr.
PROBLEMA
Determinar el comportamiento de la función de onda cerca del origen de coordenadas si para
± rx/r8 con s > 2.
r-+ O el campo tiende a infinito como
Solución.
Para valores de r suficientemente pequeños, la longitud de onda es tal que
" _, ñ/ v(m! Uf) _, lir8 12 / v(mcx),
con lo cual
d,\/dr-, ñ.r•/2-1/y(mcx)
~
1;
se cumple así la condición que supone el carácter cuasiclásico. En un campo de atracción se tiene
Ui-+ - oo para r-+ O. La región en tomo del origen de coordenadas es, en este caso, clásicamente
accesible y la función de onda radial es x ,_, 1/VP, de donde
!p-., rs/4-1.
En urt campo repulsivo, la región en que r es pequeño no es accesible clásicamente. En este
caso la función de onda tiende exponencialmente a cero para r-+ O. Prescindiendo del coeficiente
de la función exponencial, tenemos:
r
I" -
ex{ -~I f P drlJ. o
bien I" -
r
o
exp(
2v'(2m(J.)r-Cs/2-1>).
(s-2)/i
198
§ 50.
El caso cuasiclásico
Paso a través de una barrera de potencial
Consideremos el movimiento de una partícula en un campo de la forma representada en la figura 13, campo caracterizado por la existencia de una barrera de
potencial, es decir, por la existencia de un intervalo en el que la energía potencial
U(x) es mayor que la energía total E de la partícula. En la mecánica clásica, una
barrera de potencial es « impenetrable » para una partícula; en la mecánica cuántica,
en cambio, la partícula puede pasar « a través de la barrera» con una probabilidad
diferente de cero (véase también el problema 2, § 25). Si el campo U(x) satisface las
U(x)
a
b
Frn. 13
condiciones que requiere el carácter cuasiclásico, el coeficiente de transmisión de
una barrera se puede calcular de forma general. Observemos que estas condiciones
conducen, en particular, a que la barrera debe ser « ancha », y por ello el coeficiente
de transmisión será pequeño en el caso cuasiclásico.
Para no interrumpir cálculos ulteriores, resolvamos antes el sigu ente problema.
Supongamos que la función de onda cuasiclásica tiene la forma de una onda móvil
en la región a la derecha del punto de retroceso x = b (donde U(x) < E):
(50.1)
Se trata de hallar la función de onda de este mismo estado en la región en que
x < b (1). Busquemos para ella una expresión de la forma
(50.2)
que crece a medida que penetramos en la región x < b; prescindimos del término
que decrece exponencialmente frente al término creciente. Para determinar el coe(1) En el problema relativo al paso a través de una barrera de potencial nos encontramos ante un movimiento que es infinito en ambos sentidos; los correspondientes niveles son doblemente degenerados (véase
§ 21 ), con lo que las funciones de onda no son necesariamente reales.
Paso a través de una barrera de potencial
199
ficiente C' procederemos de la siguiente manera. Observemos que, según las fórmulas
(47 .1) y (47.4a), existe una correspondencia entre las funciones
(50.3)
if, = _l_
2v11P1
exp{-~I
fxp dxl) para
. 1t
x
< h.
b
Por otra parte, entre dos soluciones exactas diferentes, "Pi y
dimensional de ScHRODINGER existe la relación (21.2)
i/,1i/J2' -i/;2i/;i'
1P2,
de la ecuación uni-
=constante.
Apliquemos esta relación al caso en que "Pi es la solución definida por las fórmulas
(50.1-2) y tp2 es la solución (50.3). A la izquierda del punto x = b tenemos:
i/,1i/J2' -i/J2i/Ji'
=
-i/J22(i/J1N2)'
= C'Jñ,
mientras que a la derecha encontramos, en cambio:
i/J1i/J2' -i/J2i/Ji'
=
i/;i2(i/J2/i/;1)'
= -iC/ñ.
Igualando estas dos expresiones obtenemos C' = - iC. Así, pues, la función de
onda cuasiclásica buscada tiene la forma:
para
x
< b, .¡,
·e
= -
11
;/p/ exp(,¡
f pdxl)•
X
b
=; exp(H
(50.4)
X
para
x
> b, .¡,
pdx-li")·
b
Pasemos ahora al cálculo del coeficiente de penetrabilidad de la partícula a través de la barrera. Supongamos que la partícula incide sobre ella en el sentido de
izquierda a derecha. Dado que la probabilidad de que atraviese la barrera es pequeña
en el caso cuasiclásico, basta, con precisión suficiente, escribir la función de onda
en la región I (fig. 13), antes de la barrera, como si la barrera fuese totalmente impenetrable, es decir, en la forma (47,4):
X
.¡,
= ~v
co{~ fp dxH"J.
a
(50.5)
200
El caso cuasiclásico
(hemos introducido la velocidad v = p/m, y acerca de la elección del coeficiente de
normalización, véase más abajo). Si escribimos esta función como suma de dos
expresiones complejas
el primer término (que para x ~ - = se reduce a la onda plana '1/J
eipx/ll) representa una partícula que incide sobre la barrera, y el segundo término, una partícula
que es reflejada por ella. La normalización elegida corresponde a una densidad de
corriente de probabilidad igual a la unidad en la onda incidente.
f"'o,J
Al otro lado del punto de retroceso x = a (en la región II dentro de la barrera)
a la función de onda (50.5) corresponde, según los resultados del§ 47, la función
(50.6)
Escribiendo esta última en la forma:
(50.7)
y aplicando las fórmulas (50.4), encontramos la función de onda en la región III:
b
1
.¡, = Vv
exp
[
11
:,;
i
-¡¡lf dx/+¡¡f p dx+!i,J
a
(50.8)
b
La densidad de corriente en la región III calculada mediante esta función es
(50.9)
Dado que la densidad de corriente en la onda que incide"sobre la barrera se ha elegido igual a la unidad, la cantidad D representa precisamente el coeficiente de transmisión de la barrera. Subrayaremos que esta fórmula es solamente aplicable cuando la
expresión que aparece en el exponente es grande, de forma que el propio D es pequeño.
En lo que precede se ha supuesto que el campo U(") satisface la condición que
corresponde al caso cuasiclásico en toda la extensión de la barrera (excluyendo
solamente los entornos inmediatos de los puntos de retroceso). De hecho, sin embargo, con frecuencia hay que considerar barreras en las que la curva de la energía
Paso a través de una barrera de potencial
201
potencial es tan escarpada en uno de los lados, que la aproximación cuasiclásica
resulta inaplicable. El factor exponencial que aparece en D sigue siendo el mismo
que en la fórmula (50.9), pero el coeficiente de la exponencial (igual a la unidad en
(50.9)), cambia. Para calcularlo es necesario, en principio, calcular exactamente la
función de onda en la región « no cuasi<;lásica » y, de acuerdo con ella, determinar
la función de onda cuasiclásica dentro de la barrera. En la fórmula (50.6) aparece
entonces un coeficiente fJ distinto de la unidad, y en (50.9) un coeficiente /1 2 •
PROBLEMAS
1.
U(x)
Determinar el coeficiente de transmisión de la barrera de potencial representada en la fig. 14:
x < O, U(x) = U0 - Fx para x > O; calcular solamente el factor exponencial.
= O para
Solución.
Un cálculo simple conduce al resultado
4y'(2m)(U. -E)ª/2}
O
3hF
•
2. Determinar la probabilidad de que una partícula (con momento cinético igual a cero)
escape de un pozo de potencial que presenta simetría esférica: U(r) = - U0 parar< r0 , U(r) = cx/r
para r > r0 (fig. 15).
uCrJ
U(x)
FIG. 14
FIG. 15
Solución. El problema con simetría esférica se reduce a un problema unidimensional, de modo
que se pueden aplicar directamente las fórmulas obtenidas más arriba. Tenemos:
ro
Calculando la integral, se obtiene finalmente:
w ,_, exp
J {Er
E cos- JEr
{-,;¡2a.J2m[
1
0
--;--
0
--;-
(
Erº)}]) .
1----;-
202
El caso cuasiclásico
En el caso límite r 0 ~ O esta fórmula se transforma en la siguiente
w
~ e-(1ra/1i)V(2m/E)
=
e-2Tta/7tv.
Estas fórmulas son aplicables cuando el exponente es grande, es decir, cuando a/hv ~ l. Esta
condición, como debe ser, coincide con la condición (49.11) para que el movimiento en un campo
coulombiano se pueda considerar cuasiclásico.
3. El campo U(x) está constituido por dos pozos de potencial simétricos (1 y II, fig. 16) separados por una barrera. Si la barrera fuese impenetrable para la partícula, existirían niveles de
energía correspondientes al movimiento de la partícula en un pozo solamente o en el otro solamente, niveles que serían los mismos para ambos. La posibilidad de que se atraviese la barrera
conduce a un desdoblamiento de cada uno de estos niveles en dos niveles próximos que corresponden a estados en los que la partícula se mueve a la vez en ambos pozos. Determinar la magnitud del desdoblamiento (el campo U(x) se supone cuasiclásico).
Solución. Sea E0 un nivel cualquiera correspondiente al movimiento de la partícula en uno
de los pozos (digamos, en el pozo I), y %(X) la correspondiente función de onda (normalizada de
forma que la integral % 2 en la región del pozo I sea igual a la unidad). Al tener en cuenta la pequeña probabilidad de paso a través de la barrera, el nivel se descompone en los niveles E 1 y E 2 ,
con funciones de onda que son la combinación simétrica y antisimétrica de tpo(x) y %(-x):
ipi(x) = (1/y'2)[ip0(x)+ifio(-x)],
ip 2(x) = (1/y'2)[ip0(x)-ip0 (-x)].
(1)
La función cuasiclásica '1/Jo(X) decrece exponencialmente fuera del pozo, en particular para valores
negativos de x. Por consiguiente, en la región del pozo I la función tpo(- x) es despreciable comparada con '1/Jo(X), y en el pozo II ocurre lo contrario. Las funciones (1) se han normalizado de
forma que son iguales a la unidad las integrales de sus cuadrados extendidas a los pozos I y 11.
U(x)
a
FIG. 16
Escribamos las ecuaciones de
multipliquemos la primera por
tpi,
X
ScHRóDINGER
la segunda por "Po, restemos miembro a miembro e integremos
203
Paso a través de una barrera de potencial
respecto de x entre los límites O e
=. Teniendo en cuenta que para x = O es
tp1
=
y 2tpo,
tp1 '
=O
y que
f
f
C1J
a)
1
if,0¡/,1 dx ~ - y'2
o
= l/y'2,
¡/,0 2 dx
o
encontramos:
De manera análoga para E 2 -
E0 encontramos la misma expresión con signo opuesto. Así, pues,
Mediante la fórmula (47.1), con el coeficiente C de (48.3), encontramos que
donde v0
=
V2(U0 -Eo)/m. Por consiguiente,
a
E,-E, =
w: ex{-~ f !P!
dx
J.
-a
4. Determinar el valor exacto del coeficiente de transmisión D (sin suponerlo pequeño) para
una barrera de potencial parabólica U(x) = - (1/2)kx 2 (E. KEMBLE, 1935) (1).
Solución. Para valores cualesquiera k y E, el movimiento es cuasiclásico a distancias suficientemente grandes !xi, donde
p
y'[2m(E+}kx2 )]
=
~
xy'(mk)+Ey'(m/k)/x,
y la forma asintótica de la solución de la ecuación de ScHRÓDINGER es
2
if, = constante X e±if 12f±i•-11 2,
donde se han introducido las notaciones:
g = x(mk/li2 ) 1 14,
€
=
(E/li)y'(m/k).
Nos interesa la solución que para x--?"+= contiene solamente la onda que ha atravesado la
barrera, es decir, la onda que se propaga de izquierda a derecha. Hagamos:
-+ oo,
para
X
para
X -+
- oo,
ip = Beie12giE-1/2,
if,
= e-it121e1-ÍE-1/2 +Aé~2 /2lfli€-l/2.
(1)
(2)
(1) La solución de este problema se puede aplicar también al paso a través de una barrera cualquiera
U(x) a una altura suficientemente próxima de su máximo, barrera que depende cuadráticamente de x
cerca del mismo.
204
El caso cuasiclásico
El primer término en (2) representa la onda incidente, el segundo, la onda reflejada (el sentido
de propagación de una onda es aquél en que crece su fase). La relación entre A y B se puede determinar partiendo del hecho que la expresión asintótica 1P es válida en todo dominio, suficienSigamos la variación de la función (1) al
temente alejado, del plano complejo de la variable
recorrer una semicircunferencia de radio grande situada en el semiplano superior de~ (cf. § 47).
A lo largo de todo el camino, el término con ei$ 2 /2 es la parte principal de la solución, y por ello
la función (1) debe transformarse, al final del recorrido, en el segundo término de la función (2).
Por consiguiente,
r
A
=
B(é1T)ú-112 = -iBe-m.
Por otra parte, la condición de que se conserve el número de partículas es
A partir de estas dos relaciones encontramos el coeficiente de transmisión buscado D
=
IBl 2 :
Esta fórmula es válida cualquiera que sea E. Si la energía es negativa y grande en valor absoluto,
se obtiene D ~ e-211 IEI, de acuerdo con la fórmula (50.9). Para E > O la cantidad
R
= 1-D = 1/(1 +e21te)
es el coeficiente de « reflexión por encima de la barrera».
§ 51.
Cálculo de los elementos de matriz cuasiclásicos
El cálculo directo de los elementos de matriz de cualquier magnitud física J
mediante funciones de onda cuasiclásicas presenta grandes dificultades. Supondremos que las energías de los estados a los que se refiere la transición representada
por el elemento de matriz que se quiere calcular no son próximas entre sí, de forma
que dicho elemento no se reduce a la componente de Fourier de la magnitud!(§ 48).
Las dificultades proceden de que, en virtud del carácter exponencial (con exponente
imaginario grande) de las funciones de onda, el integrando resulta ser una cantidad
rápidamente oscilante, lo que complica extraordinariamente incluso una estimación
aproximada de la integral.
Consideremos el caso unidimensional (movimiento en un campo U(x)) y supongamos, para simplificar, que el operador de la magnitud física fes simplemente
función de la coordenada x. Sean "Pi y '11'2 las funciones de onda correspondientes a
ciertos valores, E 1 y E 2, de la energía de la partícula (siendo E 2 > E 1, fig. 17); admitiremos que 1P1, ip2 se han elegido reales. Hemos de calcular la integral
00
/12
=
Jf d ff2dx.
(51.1)
En las regiones a uno y otro lado del punto de retroceso x = a 1, pero no en la
inmediata proximidad de este último, la función de onda t/'i tiene la forma (47.1),
(47.4a):
Cálculo de los elementos de matriz cuasiclásicos
205
para x < a 1 ,
(51.2)
para x
y análogamente para
> a1 ,
1112 ( cambiando
el índice 1 por el 2).
(x)
-----E2
FIG. 17
Sin embargo, el cálculo de la integral (51.1) efectuado substituyendo en ella
estas expresiones asintóticas para las' funciones de onda daría un resultado incorrecto.
Ello se debe a que, como veremos más adelante, esta integral es una cantidad exponencialmente pequeña, mientras que la función integrando no es, de suyo, pequeña.
Por consiguiente, incluso una variación relativamente pequeña de esta última modi.fica, en general, el orden de magnitud de la integral. Esta dificultad puede soslayarse
de la siguiente manera.
Representemos la función tp2 = tp2 + + tp2- descomponiendo el coseno (en la
región x > aJ en suma de dos expresiones exponenciales. Según las fórmulas (50.4)
tendremos
[11 fz p dxI] ,
l/;2+ = --iC2
- - exp -
2v/P2I
para x
> a 2 , l/;2+
2
n
ªª
[iñ fz p
= -C
- - exp -
2v/P2/
2
2
ªª
J
dx-¡i1r ;
(51.3)
206
El caso cuasiclásico
la función
tp-2
es la conjugada compleja de
tJJ2 +[ tp2-
= ( tJJ2 +)*].
La integral (51.1) se descompone también en suma de dos integrales conjugadas
complejas, f 12 = f 12+ +f12- , que pasamos a calcular. Observemos ante todo que la
integral
00
/12+
=
f
if,ifif,2+
dx
-oo
converge. En efecto, aunque la función tp2 + en la región x < a 2 tiende exponencialmente a =, la función tp1 tiende exponencialmente a cero todavía con mayor rapidez
en la región x < a, (dado que en toda la región x < a2 tenemos !Pil > 1p 2 ¡).
Consideremos la coordenada x como una variable compleja y desplacemos el
camino de integración desde el eje real al semiplano superior. Cuando x presenta
una parte imaginaria positiva, en la función tp1(y en la región x > a1) aparece un
término creciente, pero en cambio la función tp2 + disminuye más rápidamente, ya
que en toda la región x > a. tenemos p2 > p 1• Por consiguiente, el integrando disminuye.
El camino de integración desplazado no pasa ya por los puntos x = a 1, a 2 situados sobre el eje re.al y cerca de los cuales la expresión cuasiclásica es inaplicable.
Por lo tanto, a lo largo de dicho camino se puede utilizar para tp1 y tp2 las funciones que
son sus expresiones asintóticas en el semiplano superior. Estas funciones son
o:
,f,,
= 2[2m(i~E,)]'''
expG fv'{Zm(U-E,)} dxJ.
ª1
(51.4)
donde las raíces se determinan de forma que sobre el eje real y en la región x
sean positivas
< a2
En la integral
/12+
-iC1 C2 f
= 4y(2m)
exp
li fa:v{2m(U-E1)} dx-¡1 fa:y{2m(U-E2)} dx
[1
f(x) dx
x~~~~~~~-
[(U-E1)(U-E )]1/4
J
X
(51.5)
207
Cálculo de los elementos de matriz cuasiclásicos
veamos de desplazar el camino de integración de forma tal que, en lo posible~ disminuya el factor exponencial. El exponente presenta un extremo tan sólo en los puntos en los que U(x) = = (para E 1 ,=/: E 2 su derivada respecto de x no se anula en
ningún otro punto). Por consiguiente, el contorno de integración desplazado al
semiplano superior viene limitado solamente por la necesidad de evitar los puntos
singulares de 1a función U(x); según la teoría general de las ecuaciones diferenciales
lineales, dichos puntos coinciden con los puntos singulares de las funciones de onda
v{x). La elección concreta del contorno depende de la forma concreta del campo
U(x). Así, si la función U(x) presenta en el semiplano superior tan sólo un punto
singular, x = x 0 , se puede efectuar la integración a lo largo de un camino del tipo
representado en la fig. 18. El papel principal lo representa en la integral la vecindad
inmediata del punto singular, de forma que el elemento de matriz buscado / 12 =
= 2 ref+ 12 es, en esencia, proporcional a una expresión exponencialmente pequeña
que se puede representar en la forma:
Xo
J12 -
Xo
exp(- ~im[ f v'[2m(E2-U)] dx- f v'[2m(E1-
U)] dx])
(51.6)
(L. LANDAU, 1932) (1). Como límites inferiores de las integrales se pueden elegir
puntos cualesquiera en la regiones clásicamente accesibles; la elección que se haga
no influye, evidentemente, sobre la parte imaginaria de las integrales. Si la función
U(x) presenta más de un punto singular en el semiplano superior, como punto x0
en (51.6) debe elegirse un punto para el que el exponente tome el menor valor absoluto (2).
FIG. 18
(1) La substitución de las funciones de onda por sus expresiones asintóticas que hemos efectuado al
deducir (51.5-6), es lícita, ya que el orden de magnitud de la integral, tomada a lo largo del contorno
representado en la fig. 18, viene determinado por el orden de magnitud del integrando, y, por lo tanto,
una variación relativamente pequeña de este último no influye esencialmente en el valor de la integral.
(2) Suponemos que la propia función f(x) no posee puntos singulares.
El caso cuasiclásico
208
El cálculo de los elementos de matriz cuasiclásicos correspondientes al movimiento en un campo central se efectúa siguiendo el mismo método. Sin embargo,
por U(r) debemos entender ahora la energía potencial efectiva (suma de las energías
potencial y centrífuga) y será distinta para estados con valores distintos de /. Con
vistas a aplicaciones ulteriores del método que acabamos de exponer, escribiremos
las energías potenciales efectivas en dos estados en una forma general, como funciones Ui(r) y U2(r). El exponente del factor exponencial en el integrando de 51.5)
presentará entonces un extremo no sólo en los puntos en los que o U1(r) o Ulr)
tienden a infinito, sino en los puntos en los que
(51.7)
Por lo tanto, en la fórmula
ro
/i2 -
r0
exp(-iim[f v'[2m(E2-U2)] dr- fv'[2m(E1-U1)] dr ])
(51.8)
entre los posibles valores de rO hay que considerar no solamente los puntos singulares de U1 (r) y de U2(r), sino también las raíces de la ecuación (51.7).
El caso de un potencial central difiere, además, en que la integración respecto
de r en (51.1) se efectúa entre los límites O (y no - oo) y + oo:
00
/12
=
fo xdx2 dr.
En relación con esto hay que distinguir dos casos. Si el integrando es una función
par de r, la integración se puede extender formalmente a lo largo de todo el intervalo desde - oo a + =, de modo que no existe diferencia ninguna con relación al
caso anterior. Este caso puede presentarse si Ui(r) y U2(r) son funciones pares de
r[ U(- r) = U(r)]. Las funciones de onda xi{r) y x2(r) son entonces o funciones pares o funciones impares (véase § 21) (1) y si la función f(r) es también par o impar,
el producto xifx2 puede resultar par.
En cambio, si el inteBrando no es par (lo que ocurre en cualquier caso si U(r)
no es par), el origen del camino de integración no puede desplazarse del punto r = O,
y entre los posibles valores de r 0 en (51.8) hay que incluir también el valor r 0 = O.
PROBLEMAS
1. Calcular los elementos de matriz cuasiclásicos (limitándose al factor exponencial) en el
campo U = U0e-·rr.x.
(1) Si U(r) es par, la función de onda radial R(r) es par (impar) si les par (impar), como se ve considerando su comportamiento para valores pequeños de r (donde R ,.._, rl).
Probabilidad de transición en el caso cuasiclásico
209
Solución. U(x) tiende a infinito solamente para x---+ - oo. De acuerdo con esto supondremos en (51.6) x 0 = - =. La integración se puede extender hasta +=. Cada una de las dos integrales por separado diverge en el límite - oo. Por ello las calcularemos primero entre los límites
- x y +oo y pasaremos luego al límite x---+ oo. Obtenemos como resultado
Jl'l, ,. ._, e-{1rm/a.'AXva-v >,
1
donde v1 = V(2E1 /m)v 2 =V(2E2 /m)son las velocidades de la partícula en el infinito (x---+ oo), donde
el movimiento es un movimiento libre.
2.
Igual problema en el campo coulombiano U
=
r:x./r y para transiciones entre estados con/ = O.
Solución. El único punto singular de la función U(x) es el punto r = O. La correspondiente
integral se ha calculado en el problema 2, § 50. Según la fórmula (51.8). obtenemos el resultado
§ 52.
Probabilidad de transición en el caso cuasiclásico
El paso a través de una barrera de potencial es ejemplo de un proceso que es
completamente imposible en la mecánica clásica. Otro ejemplo lo ofrece la « reflexión por encima de la barrera», es decir, la reflexión de una partícula cuya energía
es mayor que la altura de la barrera. En el caso cuasiclásico la probabilidad de tales
procesos es exponencialmente pequeña. El correspondiente exponente se puede
determinar como sigue.
Al considerar la transición de un sis.tema cualquiera desde un estado a otro,
resolvamos las correspondientes ecuaciones clásicas del movimiento, lo que nos
dará la «trayectoria» de la transición que, sin embargo, resultará ser compleja
de acuerdo con la imposibilidad del proceso en la mecánica clásica. En particular,
resulta, en general, complejo el « punto de transición » %, en el que tiene lugar la
transición formal del sistema de un estado al otro; la posición de este punto viene
determinada por las leyes clásicas de conservación. Calculemos luego la acción
S 1(q1 , %)+Sl%, q2 ) correspondiente al movimiento del sistema en el primer estado
a partir de una cierta posición inicial q1 hasta el « punto de transición» % y, luego,
en el segundo estado, desde% hasta la posición final q2 • La probabilidad buscada del
proceso se determina entonces mediante la fórmula (1)
w - exp (- : im [Si(q,,qo)
+ S2 (qo,q2)J}.
(52.1)
( 1)
Si el punto de transición es real, pero se encuentra en un dominio clásicamente inaccesible, la fórmula (52.1) corresponde (en el caso más simple de un movimiento unidimensional) a la fórmula (50.9)
para la probabilidad de atravesar una barrera de potencial. Un ejemplo de aplicación de la fórmula (52.l)
a un problema con varios grados de libertad (desintegración del deuteron en el campo de un núcleo) puede
verse en el trabajo de E. M. LIFSHITZ, ZhETF 8, 930, 1938.
210
El cmm cuasiclásico
Si la posición del « punto de transición » no es única, debe elegirse de manera,
que el exponente en (52.1) posea el menor valor absoluto (a la vez que, claro está,
este valor debe ser suficientemente grande para que la fórmula (52.1) sea en efecto aplicable) (1).
La fórmula (52.1) está de acuerdo con la regla obtenida en el párrafo anterior
para el cálculo de los elementos de matriz cuasiclásicos. Hay que subrayar, sin embargo, que el cálculo del coeficiente de la exponencial, que aparece en la expresión
de la probabilidad de las transiciones de este tipo, como cuadrado del correspondiente elemento de matriz sería incorrecto.
Si se aplica la fórmula (52.1) a la « reflexión por encima de la barrera » de la
partícula (en el caso unidimensional), hay que entender por % la coordenada compleja x 0 del « punto de parada», en el que la partícula cambia su sentido de movimiento por el opuesto, es decir, la raíz compleja de la ecuación U(x) = E. Veamos
cómo en este caso se puede calcular también, con gran precisión, el coeficiente de
reflexión - a la vez que el coeficiente de la exponencial.
De nuevo debemos establecer (al igual
las funciones de onda lejos a la derecha de
izquierda (ondas incidente+reflejada). Es
logo al aplicado en el § 47 considerando 1P
que en el § 50) la correspondencia entre
la barrera (onda transmitida) y lejos a la
fácil hacerlo siguiendo un método anácomo función de la variable compleja x.
Escribamos la onda transmitida en la forma
X
f+
=
:P expGJ P
dx ),
X¡
(donde x 1 es un punto cualquiera del eje real) y sigamos su variación al recorrer, en
el semiplano superior, el camino C que rodea (a distancia suficiente) el punto de
retroceso x0 (fig. 19); la última parte de este camino debe pasar por una región tan
alejada hacia la izquierda, que a lo largo de ella el error de la función de onda aproximada (cuasiclásica) de la onda incidente sea menor que la pequeña cantidad bus-
V
cada ,¡;_. Rodear el punto x0 conduce al cambio de signo de la raíz E - U(x),
y al volver al eje real la función '1/J+ se transforma, por consiguiente, en la onda 1p_,
que se propaga hacia la izquierda, es decir, en la onda reflejada (2). Dado que las
amplitudes de las ondas incidente y transmitida se pueden considerar iguales, el coeficiente de reflexión buscado R se determina simplemente como razón de los cuadra(1) Si la propia energía potencial del sistema presenta puntos singulares, estos puntos deben también
formar parte de los posibles valores de q0 •
2
( )
En cambio, recorrer un camino que pase por debajo del punto x 0 (por ejemplo, simplemente a lo
largo del eje real) transforma la función '1/J+ en la onda incidente.
Probabilidad de transición en el caso cuasiclásico
dos de los módulos de
1p_
211
y '/1+:
R =
lif;-¡
if;+
f
2
=
exp ( -
I )
zh1m
. p dx
.
(52.2)
e
Una vez: obtenida esta fórmula, en el exponente se puede deformar el camino
de integración de manera arbitraria; si lo reducimos al camino C' indicado en la
fig. 19, la integral f p dx se reduce al doble de la integral a lo largo del camino desde
xl a x 0 y obtenemos (1):
x,
FIG. 19
(52.3)
X1
Dado que en todo el eje real pes real, la elección de x 1 no influye sobre la parte imaginaria de la integral que aparece en el exponente.
Conforme se indicó ya, de todos los valores posibles x 0 debe elegirse aquél para
el que e] exponente en (52.3) presenta el menor valor absoluto (a la vez que este valor
debe ser asimismo suficientemente grande en comparación con 1) (2). Se supone
tamhién que si la propia energía potencial U(x) posee puntos singulares en el semiplano superior, la integral
Xo
unH
pdx
1
( )
Esta fórmula con el coeficiente de la exponencial (igual a la unidad) fue obtenida por primera
vez por V. L. POKROYSKII, s. K. SAYYINYJ, F. R. ULINICH (1958).
2
( )
Claro está, deben considerarse solamente puntos x 0 para los que
Jp
Xo
im
dx >
O,
es decir, puntos que se encuentran en el semiplano superior.
212
El caso cuasiclásico
toma en ellos grandes valores (en caso contrario, en efecto, uno de estos puntos determina el valor del exponente, pero el coeficiente de la exponencial no será ya el
que aparece en (52.3)). La última condición se viola, evidentemente, al aumentar
la energía E si U(x) tiende a infinito en algún punto del semi plano superior: llega un
momento en que el punto x 0 , en el que ú = E, se acerca tanto al punto x oo en el
que U = oo, que ambos dan una contribución comparable al coeficiente de reflexión (la integral
imH
Xo
pdx - 1),
Xoo
y la fórmula (52.3) pasa a ser inaplicable. En el caso límite en que E es tan grande
que la citada integral resulta pequeña comparada con la unidad, se puede aplicar la teoría de perturbaciones (véase el problema 1) (1).
PROBLEMAS
1. Determinar el coeficiente de reflexión por encima de la barrera cuando las energías de la
partícula son tates que es aplicable la teoría de perturbaciones.
Solución. Esta se obtiene aplicando la fórmula (43.1) en la que las funciones de onda inicial
y final son ondas planas que se propagan en sentidos opuestos y normalizadas según la densidad
de corriente unidad y según la función-<5 del impulso, respectivamente. Además, dv = dp', donde
p' es el impulso después de la reflexión. Efectuando en (43.1) la integración respecto de p' (teniendo
en cuenta la presencia de la tunción-<5) obtenemos:
R
I
1
= -m2- Joo U(x)e2ipx/1t dx\2·
ñ2p2
(1)
-00
Esta fórmula es válida si se cumple la condición de aplicabilidad de la teoría de perturbaciones:
Ua/hv ~ 1, donde a es la anchura de la barrera (véase la nota en la pág. 180), y a Ja vez pa/h ,:'.:, l,
La última condición garantiza el carácter no exponencial de la dependencia R(p); en el caso contrario, la cuestión de la aplicabilidad de la fórmula (1) requiere un estudio aparte.
2. Determinar el coeficiente de reflexión por encima de la barrera correspondiente a una
barrera cuasiclásica cuando la función U(x) presenta un punto anguloso.
Solución. Si la función U(x) posee una singularidad para x real, el coeficiente de reflexión
viene determinado en esencia por el campo cerca de este punto, y para calcularlo se puede aplicar
formalmente la teoría de perturbaciones sin exigir, con ello, que se cumpla la condición de aplicabilidad para todo x; basta que se cumpla la condición relativa al carácter cuasiclásico. Llegamos
así a la fórmula (1), con la única diferencia de que en vez del impulso de la partícula incidente debe
substituirse en ella el valor de la función p(x) para x = x 0 •
Eligiendo en el presente caso el punto anguloso como punto x
( )
El caso intermedio ha sido estudiado por
1713, 1961; JETP 13, 1207, 1961.
O, tenemos cerca del mismo:
U = - F2x para x < O,
U = -F1x para x > O,
1
=
v.
L.
POKROVSKII
y l.
M.
JALATNIKOV
(ZhETF,40,
213
Transiciones debidas a perturbaciones adiabáticas
con valores diferentes de F 1 y F 2 • La integración respecto de x se efectúa introduciendo en el integrando el factor de convergencia e±Ax ( después de lo cual se hace A.-,,. O). Obtenemos finalnente
donde Po
§ 53.
= p(O).
Transiciones debidas a perturbaciones adiabáticas
Hemos dtcho ya en el § 41 que en el caso límite de una perturbación que varía
con el tiempo tan lentamente cuanto se quiera, la probabilidad de la transición de
un sistema de un estado a otro tiende a cero. Examinemos ahora esta cuestión cuantitativamente, calculando la probabilidad de la transición provocada por una perturbación lentamente variable (perturbación adiabática).
Supongamos que el hamiltoniano del sistema es una función lentamente variable
del tiempo que tiende a límites determinados para t-+ ± =. Sean, además, 1Pn(q, t)
y En (t) las funciones propias y los valores propios de la energía (que dependen del
tiempo como parámetro) obtenidos resolviendo la ecuación de SCHRODINGER
fl(t)t/,n = Enz/,n ; teniendo en cuenta el carácter adiabático de la variación temporal
de Íl, la dependencia de En y de 1Pn con relación al tiempo resulta también ser lenta. El
proh:ema que se nos plantea consiste en determinar la probabilidad w12 de encontrar
el sistema para t --,,. -+ oo en un cierto estado lflz si cuando t --,,. se encontraba
en el estado tp 1 .
=
La lentitud de. la perturbación conduce a que la duración del << proceso de transición>, sea larga por lo que el cambio de la acción durante este tiempo (dado por
la integral - f E(t) dt) es grande. En este sentido, el problema planteado posee
un carácter cuasiclásico y en la determinación de la probabilidad de transición
buscada representan un papel esencial los valores t = t0 para los que
(53.1)
los cuales,. en cierto modo, corresponden al « instante de transición » en la mecánica
clásica (cf. § 52); en realidad, claro, esta transición es imposible desde el punto de
vista clásico, lo que se refleja en el hecho de que las raíces de la ecuación (53.1) son
complejas. Con ello surge la necesidad de examinar las propiedades de las soluciones
de la ecuación de ScHRODINGER para valores complejos del parámetro t en un entorno del punto t = t0 en el que los valores propios de la energía pasan a ser iguales.
Conforme veremos, cerca de este punto las funciones propias 1Pi, 1Pz dependen
fuertemente de t. Para determinar esta dependencia, introduzcamos primero las
combinaciones lineales de las mismas (designémoslas por <f,1, </> 2) que satisfacen las
condiciones:
214
El caso cuasiclásico
J</>1</>2 dq = J.
(53.2)
Esto se puede conseguir siempre mediante una elección adecuada de los coeficientes
complejos (que son funciones de t). Las funciones </,1, </>2 no son ya singulares para
t
=
t0 •
Buscaremos ahora las funciones propias en la forma de combinaciones lineales
(53.3)
Al hacerlo hay que tener presente que para valores complejos del « tiempo » t, el
operador .H(t) (de la_forma (17.4)), que depende de él._coincide, como antes, con su
transpuesto (íl = fl), pero no es ya hermítico (íl f= H*), ya que la energía potencial
U(t) f= U*(t).
Substituyamos (53.3) en la ecuación de ScHRODINGER, y multiplicándola a la
izquierda una vez por cp1 y otra por </,2, integremos respecto de q. Introduciendo la
notación:
(53.4)
y teniendo en cuenta que H 12 = H 21 en virtud de la propiedad antes indicada del
hamiltoniano, obtenemos el sistema de ecuaciones
H11a1 + H12a2 = Ea2,
H12a1 + H22a2 = Ea 1,
La condición de compatibilidad de este sistema nos da la ecuación (H12 = H 11H 22 , cuyas raíces determinan los valores propios de la energía
(53.5)
E)2 =
(53.6)
De (53.5) se deduce entonces:
(53.7)
De (53.6) resulta, evidentemente, que para que en el punto t = f 0 coincidan los
dos valores propios deben anularse en él o H 11 o H 22 ; supongamos que se anula H 11 •
La tendencia de una función a cero en un punto regular resulta, en general, proporcional a t - f 0. Por lo tanto,
E(t)-E(to) = ±constante X y(t-to),
(53.8)
es decir, E(t) presenta en t = f 0 un punto de ramificación. Además, también a 2 ,_,
,. ., V-¡=- f 0 , de forma que en el punto t =-~ f O se tiene sólo una función propia, que
coincide con <p 1 .
215
Transiciones debidas a perturbaciones adiabáticas
Vemos ahora que el problema planteado es formalmente del todo análogo al
problema estudiado en el § 52 relativo a la reflexión por encima de una barrera.
Se trata ahora de una función de onda 'F(t) « cuasiclásica » respecto del tiempo
(en vez de la función del § 52 que era cuasiclásica respecto de la coordenada) y se
trata de determinar un término de la forma c2lf;2e-iEP1t en la función de onda para
t -++ oo, si cuando t-+ - oo la función de onda era 'Y(t) = lJ;1e-iEp1t (problema
análogo al de la determinación de la función reflejada para x-+ - = cuando se
conoce la función transmitida para x -++ =); la probabilidad de transición buscada es w12 = hl 2 • La acción S = - f E(t) dt se expresa por una integral respecto
del tiempo de una función que presenta puntos de ramificación complejos (de manera
semejante a como la función p(x) presentaba puntos de ramificación complejos
en la integral f p dx). Por consiguiente, el problema considerado se resuelve por
deformación del camino de integración en el plano de la variable compleja t (desde
grandes valores negativos a grandes valores positivos) de manera del todo análoga
a cómo se procedió en el§ 52 en el plano de la variable x, por lo que no repetiremos
aquí los correspondientes razonamientos.
Supondremos que sobre el eje real es E 2 > E 1 ; entonces el camino de integración
debe recorrer el semiplano superior de la variable compleja t (al pasar al cual crece
la razón e-iEp1t¡e-iEp1t Obtenemos en definitiva la fórmula (análoga a la fórmula
(52.2)):
w12
= exp( -
~ im JE(t) dt),
(53.9)
C'
donde la integración se efectúa a lo largo del contorno representado en la fig. 19
(en el sentido de izquierda a derecha).
En la rama izquierda de este contorno es E = E 1 , y en la derecha, E
consiguiente, es posible escribir (53.9) en la forma
=
E 2 • Por
to
w12
= exp(-2im
f w21(t) dt),
(53.10)
ti
donde w 21 = (E2 - E 1)/li, t1 es un punto arbitrario sobre el eje real t, y para t0 se
debe elegir la raíI de la ecuación (53.1) que se encuentra en el semi plano superior
y para la que el exponente en (53.10) toma el menor valor absoluto (1). Además, con
la transición directa del estado 1 al estado 2 pueden competir también « caminos
de transición » que pasan por diferentes estados intermedios y cuyas probabilidades
se expresan por fórmulas análogas. Así, para la transición a lo largo del « camino »
(1) Entre los valores de t 0 posibles deben tenerse en cuenta también los puntos en los que E(t) tiende
a infinito (pero para dichos puntos el coeficiente de la exponencial en (53.9) sería diferente).
216
El caso cuasiclásico
1 _,.. 3 _,.. 2 la integral en (53.10) se substituye por la suma de las integrales
t/31)
t/23)
f w31(t) dt + f w23(t) dt,
cuyos límites superiores son los « puntos de intersección» de los términos E1(t),
Ez(t) y Ez(t), Fa(t), respectivamente; este resultado se obtiene integrando a lo largo
de un contorno que rodea a estos dos puntos del plano complejo (1).
(1)
El caso de estados intermedios relativos al espectro continuo exige un análisis especial.
CAPÍTULO
VIII
SPIN
§ 54.
Spin
Consideremos una partícula compuesta, digamos un núcleo atómico, que efectúa un cierto movimiento en conjunto. Supondremos que la energía interna del núcleo
posee un valor determinado. Sin embargo, con esto el estado interno del núcleo no
queda aún, en general, determinado por completo; así, el momento cinético « interno» del núcleo, L (es decir, el momento cinético de las partículas en su movimiento dentro del núcleo), puede todavía estar orientado de diferentes maneras en
el espacio. El número de posibles orientaciones distintas de este momento cinético
es igual, conforme sabemos, a 2L + 1.
De esta manera, al considerar el movimiento del núcleo (que se encuentra en un
estado interno dado) como un todo, debemos considerar, junto a sus coordenadas,
una variable discreta: la proyección de su momento cinético interno sobre una
dirección, cualquiera, en el espacio.
Vemos, por lo tanto, que el formalismo de la mecánica cuántica, al considerar el
movimiento de una partícula arbitraria, permite introducir junto a sus coordenadas
una cierta variable específica para cada partícula dada que puede tomar un número
limitado de valores discretos. No tenemos, a priori, ningún derecho a suponer que
dicha variable no existe cuando la partícula es elemental. Con otras palabras, debemos admitir, en general, que en la mecánica cuántica hay que atribuir a una partícula
elemental un cierto momento cinético « propio », no ligado a su movimiento en el
espacio. Esta propiedad de las partículas elementales es específicamente cuántica
(desaparece cuando se pasa al límite para ñ ~ O, véase la nota en la pág. 219) y no
admite así, por su propia esencia, una interpretación clásica. En particular, carecería
por completo de sentido el representarnos el momento cinético « propio » de una
partícula elemental como resultado de su rotación en torno de « su eje».
El momento cinético propio de una partícula se llama su spin, para distinguirlo
del momento cinético ligado al movimiento de la partícula en el espacio, al que nos
referimos cuando hablemos de momento cinético orbital {1). Se puede tratar en todo
(1)
La idea física acerca de la existencia en el electrón de un momento cinético propio se debe a G.
S. GouosMIT, 1925. En la mecánica cuántica el spin fue introducido por W. PAULI en 1927.
UHLENBECK y
218
Spin
esto tanto de una partícula elemental, como de una partícula que, si bien es compuesta, se comporta como elemental en una cierta área considerada de fenómenos
(por ejemplo, un núcleo atómico). El spin de una partícula (medido al iguai que el
momento cinético orbital en unidades li) lo representaremos por s.
En los capítulos precedentes hemos supuesto siempre que las tres coordenadas
constituyen un sistema completo de magnitudes para una partícula, dadas las cuales
queda totalmente determinado el estado de la misma. Vemos ahora que, en general,
no es así: para determinar por completo el estado de una partícula deben darse,
no sólo sus coordenadas, sino también la dirección del vector spin. Por ello, también
la función de onda de una partícula debe ser función de cuatro variables - las tres
coordenadas y la « variable spin », que indica el valor de la proyección del spin
sobre la dirección elegida en el espacio, y que toma un número limitado de valores
discretos. Estos valores se pueden atribuir a la función de onda en forma de índice.
De esta manera la función de onda de una partícula que tiene spin no nulo, es, en
realidad, no una, sino el conjunto formado por un cierto número de funciones de las
coordenadas distintas, funciones que difieren por su índice de spin.
El operador que en la mecánica cuántica corresponde al spin de una partícula
es tal que al aplicarlo a una función de onda actúa precisamente sobre la « variable
de spin ». Con otras palabras, dicho operador transforma linealmente entre sí las
funciones que difieren en el índice de spin. La forma de este operador se establecerá
más adelante. Pero, incluso partiendo de las consideraciones más generales, es fácil
comprobar que los operadores (,;, sv, §~ satisfacen las mismas condiciones de conmutación que los operadores de1 momento cinético orbital.
El operador del momento cinético coincide en esencia con el operador de una
rotación infinitesimal. Para deducir en el § 26 la expresión del operador del momento
cinético orbital, se estudió el resultado de aplicar la operación rotación a una función de las coordenadas. En el caso del momento cinético de spin, este razonamiento
pierde su significado, ya que el operador spin actúa sobre la « variable de spin »,
y no sobre las coordenadas. Por consiguiente, para obtener las relaciones de conmutación buscadas hemos de considerar la rotación infinitesimal de una manera general,
como rotación del sistema de coordenadas. Aplicando sucesivamente rotaciones
infinitesimales en torno del eje x y del eje y y luego en torno de estos mismos ejes,
pero en orden inverso, es fácil comprobar, mediante un cálculo inmediato, que la
diferencia entre los resultados de estas dos operaciones equivale a una rotación
infinitesimal en torno del eje z (caracterizada por un ángulo que es ig1J.al al producto
de los ángulos de giro en torno de los eje x y y). No nos detendremos aquí a efectuar estos sencillos cálculos, que conducen de nuevo a las relaciones ordinarias de
conmutación entre los operadores de las componentes del momento cinético, las
cuales, en consecuencia, deben valer también para los operadores de spin:
(54.1)
Spin
219
junto con todas las consecuencias físicas que se siguen de ellas.
Las relaciones de conmutación (54.1) permiten determinar los valores posibles
del módulo y de las componentes del spin. Todo el razonamiento desarrollado en el
§ 27 (fórmulas (27.7-9)) se basaba tan sólo en las relaciones de conmutación y es
por ello aplicable completamente también aquí; es necesario únicamente suponer
que en dichas fórmulas se tiene s en vez de L. De las fórmulas (27.7) se sigue que
los valores propios de la componente-z del spin forman una sucesión de números
que difieren en una unidad. Sin embargo, no podemos afirmar ahora que estos valores
deban ser números enteros, como ocurría en el caso de la proyección Lz del momento
cinético orbital (el razonamiento presentado al principio del § 27 no es aplicable
aquí, ya que se basa en la expresión (26.14) del operador lz, específica del momento
cinético orbital).
Además, la sucesión de valores propios Sz está limitada superior e inferiormente
por valores que son iguales en valor absoluto y de signos opuestos, valores que
designaremos por ± s. La diferencia 2s entre los valores máximo y mínimo de Sz
debe ser un número entero o cero. En consecuencia, el números puede tomar los
valores O, !, 1, }, ....
Así, pues, los valores propios del cuadrado del spin son iguales a
s 2 = s(s+ 1),
(54.2)
donde s puede ser un número entero (incluido el valor nulo) o un número semientero. Para un s dado, la componente Sz del spin puede tomar los valores s, s - 1, ... ,
- s, en total 2s + 1 valores. En relación con lo dicho antes, llegamos al resultado
de que el estado de una partícula con spin s debe describirse por una función de
onda que es el conjunto de 2s+ 1 funciones de las coordenadas (1).
Prueba la experiencia que la mayoría de partículas elementales - electrones,
positones, protones, neutrones, mesones-µ y todos los hiperones ( A, 1:, 8) - poseen
spin t. Además, existen partículas elementales - los mesones n y los mesones K que poseen spin O.
El momento cinético total de una partícula es la suma de su momento cinético
orbital I y del spin s. Los correspondientes operadores, que se aplican a funciones de
variables completamente distintas, conmutan entre sí, claro está.
Los valores propios del momento cinético total
(1) Puesto que ses un número dado para cada especie de partículas, al pasar al límite de la mecánica
clásica (h-+ O) el momento cinético de spin, hs, se anula. Este razonamiento carece de sentido en el caso
del momento cinético orbital, ya que l puede tomar valores cualesquiera. El paso a la mecánica clásica
se consigue mediante la tendencia simultánea de ha cero y del a oo, de forma que el producto hl se conserve
finito.
Spin
220
(54 3)
j = l+s
se determinan según la misma regla del « modelo vectorial » que se aplica a la suma
de los momentos cinéticos orbitales de dos partículas distintas (§ 31 ). Así, para valores dados l y s, el momento cinético total puede tomar los valores l+s, l+s - 1, ... ,
\l - si. Por ejemplo, para un electrón (spin l) de momento cinético orbital distinto
de cero, el momento cinético total puede ser j = l ± ! ; para l = O, el momento
cinético j posee, claro, solamente un valor, el j = ! .
El operador del momento cinético total J de un sistema de partículas es igual a la
suma de los operadores de los momentos cinéticos j de cada una de ellas, de modo que
sus valores vienen de nuevo determinados por las reglas del modelo vectorial. El
momento cinético J se puede representar en la forma:
J = L+ S,
S =
~ Sa,
a
(54.4)
donde S se puede llamar spin total, y L, momento cinético orbital total del sistema.
Obsérvese que si el spin total del sistema es semientero (o entero), lo mismo
valdrá también para el momento cinético total, ya que el momento cinético orbital
es siempre entero. En particular, si el sistema está constituido por un número par
de partículas idénticas, su spin total será siempre entero y, por consiguiente, también
será entero el momento cinético total.
Los operadores del momento cinético total de una partícula j (o de un sistema
de partículas J) satisfacen las mismas reglas de conmutación que los operadores del
momento cinético orbital o del spin, puesto que estas reglas son reglas generales
de conmutación, válidas para cualquier momento cinético. Las fórmulas (27.13)
para los elementos de matriz del momento cinético, que se siguen de las reglas de
conmutación, son también válidas para cualquier momento cinético si los elementos
de matriz se determinan respecto de las funciones propias de este mismo momento
cinético. Conservan también su validez (con el correspondiente cambio de notación)
las fórmulas (29.7-10) para los elementos de matriz de magnitudes vectoriales arbitrarias.
PROBLEMA
Una partícula de spin ! se encuentra en un estado con valor determinado Sz = !. Hallar las
probabilidades de los valores posibles de la proyección del spin sobre el eje z' que forma con el
eje z un ángulo ().
Solución. El vector medio de spin s está dirigido, evidentemente, a lo largo del eje z y su valor
es igual a t. Proyectándolo sobre el eje z', encontramos que el valor medio del spin en la dirección de este eje es sz' = ! cos O. Por otra parte, tenemos sz' = ! (w+ - w_), donde w+ son las
probabilidades de los valores sz' = ± t. Teniendo en cuenta también que w + +w_ = 1, encontramos:
w+ = cos2!B, W- = sen2!B.
Espinores
§ 55.
221
Espinores
Sea "P(x, y, z; a) la función de onda de una partícula de spin a; a representa la
componente-z del spin y toma los valores desde - s a +s. Llamaremos« componentes» de la función de onda a las funciones "P(a) con diferentes valores de a. Sometemos la elección de estas « componentes » a la condición de que la integral f j "I'( a)! 2 d V
determine la probabilidad de que la partícula tenga una componente-z del spin
igual a a. En cambio, la probabilidad de que la partícula se encuentre en el elemento
de volumen del espacio dV es dV
s
~
li/;(a)l 2 • Si la partícula se encuentra en un
u= -s
estado con valor determinado a = a0 , de todas las componentes "P(a) será diferente
de cero sólo la componente para la que a = a0 , es decir, la función de onda tiene
la forma:
ip(x,y, z; cr) = ip(x,y, z)8ªªº.
En este capítulo no nos interesará en lo que sigue la dependencia de las funciones
de onda con relación a las coordenadas. Por ejemplo, al hablar del comportamiento
de las funciones v{a) en una rotación del sistema de coordenadas, se puede suponer
que la partícula se encuentra en el origen de dicho sistema, con lo cual sus coordenadas no variarán al aplicar dicha rotación y los resultados obtenidos serán característicos precisamente del comportamiento de la función "P(a) con relación a la variable
de spin, a.
Efectuemos una rotación infinitesimal de ángulo <5</> en torno del eje z. El operador
de este giro se expresa mediante el operador del momento cinético (en el presente
caso, del spin) en la forma 1 +i8cp. sz. Por consiguiente, como resultado de la rotación, las funciones "P(a) se transforma en ip(a)+8¡/;(a), donde 8¡/;(a) = i8ef,. Szip(a)
Pero Szip(a) = aip(a), de modo que oip(a) = ia1p(a)8ef,. En una rotación de ángulo
finito ef,, las funciones '1/,'(a) se transforman, por consiguiente, en las funciones
i/,'( a)
= ew4>ip( a).
(55.1)
En particular, en una rotación de ángulo 2:n quedan multiplicadas por el factor
el mismo para todos los a e igual a (- 1)28 (2a tiene siempre la misma paridad
que 2s). Vemos así que en una rotación completa del sistema de coordenadas en
torno 9e un eje, las funciones de onda de la partícula con spin entero recobran su
valor inicial, y las funciones de onda de las partículas de spin semientero cambian
de signo.
e2Ttia ,
La variable a difiere de las variables ordinarias (las coordenadas) por su carácter
discreto. La forma más general de un operador lineal que se aplica a funciones de
una variable discreta a es
(/ip)( cr) = ~faú'P( a'),
(55.2)
222
Spin
donde Íaa' son constantes; al encerrar J'f/J entre paréntesis, queremos subrayar que
el argumento de spin a que le sigue no se refiere ya a la función inicial 'f/J, sino a la
función que resulta de la aplicación del operador/ Es fácil ver que las cantidadesfaa',
coinciden con los elementos de matriz del operador /definidos de la manera ordinaria. En efecto, la « función propia » del operador Sz que corresponde al valor Sz = a0
es tf;( cr) = Suuo. Para esta función tenemos:
JsCTCT.
o
= ~/c,c,'sc,'c,
ª'
o
= faa'
o
El último miembro de la igualdad puede escribirse también en la forma: ~iu'- Sª ,;
CT' "o C1
entonces
Js(T(To = ~CT' f a'u.o sua'·
(55.3)
Pero esta igualdad corresponde a la definición ordinaria de la matriz del operador J
respecto de las funciones propias del operador Sz,
Así, pues, los operadores que se aplican a funciones de a se pueden representar
en la forma de matrices de orden 2s + l. En particular, para los operadores de las
propias componentes del spin tenemos:
(55.4)
(y análogamente para §11 , sz) ( ). De acuerdo con lo dicho antes, las matrices de sx,
sy, Sz coinciden con las matrices obtenidas en el§ 27 para Lx, Ly, Lz en las que sólo
hay que cambiar las letras L y M por las letras s y a. De esta manera, los elementos
de matriz distintos de cero de los operadores de spin serán:
1
(s:r)a,crl = (s:r)u-1,a = h/[(s+ cr)(s-cr+ 1)],
}
(sv)c,,c,~ = -(sv)u-1,c, = -!iv[(s+cr)(s-cr+l)],
(55.5)
(sz)ao - cr
En el caso importante de spin igual a ! (s = t, a
segundo orden y tienen la forma:
=
± D,
estas matrices son de
1[O -1º].
1
(s.) =
(55.6)
Estas matrices (sin el factor i) se llaman matrices de Pauli. Escribamos también las
matrices para las combinaciones complejas s± = sx ± isy:
(s+) = [~
~J.
(55.7)
(1) Hay que observar que el orden de los índices en los elementos de matriz que aparecen en el segundo
miembro de la igualdad (55.4) es el opuesto, en cierto sentido, al orden ordinario que encontramos en (55.3).
223
Espinores
Multiplicando directamente las matrices de Pauli, es fácil comprobar que se
cumplen las relaciones:
(55.8)
Combinándolas con las reglas generales de conmutación (54. I), encontramos que
(55.9)
es decir, las matrices de Pauli « anticonmutan » entre sí.
Mediante estas relaciones es fácil comprobar la validez de las siguientes fórmulas
útiles:
§2 =
!,
(55.10)
(s. a)(s. b) = !(a. b)+!is. (ax b),
(55.11)
donde a y b son dos vectores arbitrarios (1 ).
s
s.
Observemos que toda expresión cuadrática respecto de las componentes de
se reduce así a términos que no dependen de y a términos de primer grado en
De aquí se sigue que cualquier función del operador (de spin D se reduce a una
función lineal (véase el problema 1).
s
s
Pasemos a un estudio más detenido de las propiedades « espinoriales » de las
funciones de onda. Para un spin igual a cero, la función de onda tiene una sola
componente, 1p(O). Al aplicarle los operadores de spin, se obtiene como resultado
el valor cero:
Sx'P = Sv'P = Szlf = O.
Dado que los operadores de spin están ligados con los operadores de rotac10n,
esto significa que la función de onda de una partícula con spin O no varía en las
rotaciones del sistema de coordenadas, es decir, es un escalar.
Las funciones de onda de las partículas de spin ! tienen dos componentes, ip( D
y 11{Por conveniencia con vistas a ulteriores generalizaciones, designaremos
estas componentes por 1P1 y 1P2, respectivamente (con los índices l y 2 escritos arriba).
En una rotación arbitraria del sistema de coordenadas, 1p1 y 1p2 experimentan una
transformación lineal:
n
(55.12)
(1) Los términos que no dependen de s en los segundos miembros de estas igualdades deben interpretarse, claro está, como constantes multiplicadas por la matriz unidad de segundo orden.
224
Spin
Los coeficientes :x, fJ, ¡·, r) (1), en general, son complejos y dependen de los ángulos
de la rotación. Estos coeficientes están ligados entre sí por una relación que deduciremos partiendo de la forma bilineal
(55.13)
donde ( 1p1,
y (cp1,
son dos funciones de onda que se transforman según (55.12).
Un cálculo sencillo da
v., 2)
</>2)
if,I'ef,2'-if,2'cf>1' = (a8-/3y)(if,I</>2-i¡,2ef,1),
es decir, en una rotación del sistema de coordenadas la magnitud (55.13) se transforma
linealmente en sí misma. Pero si existe sólo una función cuya transformada es un .
múltiplo de ella, dicha función puede considerarse como correspondiente a spin
nulo y, por lo tanto, debe ser un escalar, es decir, debe conservarse invariable en las
rotaciones del sistema de coordenadas. De aquí se sigue la igualdad
a8-f3y = l.
(55.14)
Ésta es precisamente la relación buscada.
Las transformaciones lineales (55.12) que dejan invariante la forma bilineal
(55.13) se califican de binarias. La magnitud de dos componentes ( "P1, "P2) que se
transforma en una rotación del sistema de coordenadas según una transformación
binaria, se llama espinar. Así, pues, la función de onda de una partícula de spin i
es un espinor.
Al álgebra de espinores se le puede dar una forma análoga a la del álgebra tensorial. Ello se consigue introduciendo un espacio vectorial de dos dimensiones en
el que la métrica se define por un tensor métrico anti simétrico:
(55.15)
Los vectores de este espacio son también espinores. Junto a las componentes contravariantes "P1, "P2 de un espinor, se pueden introducir las componentes covariantes
mediante las fórmulas ordinarias del álgebra tensorial
de modo que
(55.16)
(1)
Se les llama parámetros de Cay/ey-Klein.
Espinores
225
Las transformaciones binarias para las componentes covariantes de un espinor
tienen, evidentemente, la forma:
(55.17)
La transformación inversa, de componentes covariantes a contravariantes, se
puede escribir en la forma:
yi'A
= ~µ. gP.'Aif,µ.,
(55.18)
donde el « tensor métrico » contravariante gJ,µ tiene por componentes
gll g12]
[ Q
[ g21 g22 = -1
(55.19)
que coinciden con las componentes g;_µLa combinación invariante (55.13) se puede escribir en la forma de un « producto
escalar»
(55.20)
(aquí y en lo que sigue, con la repetición de dos índices se supone la suma respecto
de los mismos, de manera análoga a como se procede en el álgebra tensorial, es decir,
se aplica la llamada suma respecto de índices «mudos»). Obsérvese la siguiente
regla, que hay que tener en cuenta en el álgebra espinorial. Se tiene:
Así, pues,
(55.21)
De aquí se sigue, evidentemente, que el producto escalar de un espinor cualquiera
por sí mismo es igual a cero:
(55.22)
La expresión
que determina la probabilidad de encontrar la partícula en un punto dado del espacio, debe ser, evidentemente, un escalar. Comparándola con el escalar (55.20),
vemos que las componentes 11,,t*, 1P2*, conjugadas complejas de las 1P1 , 1P2 de la función de onda, se transforman como componentes covariantes de un espinor, es decir, .
como 1P2, - 1P1, respectivamente:
yiH=' = f>¡/,l*-y¡/,2*, ¡f,2*' = -fJif,l*+rxif,2*.
Por otra parte, escribiendo las igualdades conjugadas complejas de (55.12)
226
Spin
y comparándolas con las anteriores, encontramos que los coeficientes ~, /3, Y,
ligados entre sí, además, por las relaciones
f1
ex.= 8*,
o están
(55.23)
= -y*.
En virtud de las relaciones (55.14), (55.23), las cuatro cantidades complejas ~,
/3, y, o contienen en realidad tres parámetros reales independientes en total, lo que
corresponde a los tres ángulos que determinan una rotación del sistema de coordenadas de tres dimensiones.
El hecho de que vi*, tp2* se transformen como 11'2, - 1/, está íntimamente ligado
con la simetría respecto al cambio de signo del tiempo. Como se hizo observar en
el§ 18, en la mecánica cuántica al cambio de signo del tiempo corresponde el cambio
de la función de onda en su conjugada compleja. Pero al cambiar el signo del tiempo
cambia también el signo del momento cinético. Por ello ]as funciones conjugadas
complejas de las componentes tp1, tp2, que corresponden a las proyecciones del
spin a = ! y a = - t, deben ser equivalentes por sus propiedades a las componentes que corresponden, respectivamente, a las proyecciones del spin a = - ! y
ª=
L
PROBLEMAS
Reducir una función arbitraria del escalar a+ 2b • i, lineal respecto de
i ), a otra función que sea lineal.
Solución. Para determinar los coeficientes de la fórmula buscada
l.
s (s es el operador
de spin
J(a+2b. s)
=
cx+2,8b. s/b,
observemos que si se elige el eje z en la dirección del vector b, los valores propios del operador
a+2b.s son iguales a a±b, y los correspondientes valores propios del operador f(a+2b.s)son
f(a±b). De aquí se sigue:
ex
= i[f(a+b)+J(a-b)], f3 = i[f(a+b)-f(a-b)].
2. Determinar los valores del producto escalar s1 • s2 de los spins (D de dos partículas en
estados en los que el spin total del sistema S = s1 +s 2 posee valores determinados (O ó 1).
Solución. Según la fórmula general (31.2), que vale para la composición de dos momentos
cinéticos cualesquiera, encontramos:
-!paraS = O.
¿Qué potencias del operador s de un spin arbitrario s son independientes?
s1 • s2
3.
Solución.
= ;-paras = 1, s1 • 52 =
El operador
(sz-s)(sz-s+ 1) ... (sz+s),
producto de las diferencias de Sz y todos los valores propios posibles sz, da cero al aplicarlo a una
función de onda cualquiera y, por consiguiente, es el operador cero. De aqm se sigue que(Sz)2s+ 1
se expresa en función de las potencias más bajas del operador Sz, con lo que resultan independientes solamente sus potencias desde 1 hasta 2s.
Espinores de orden superior
§ 56.
227
Espinores de orden superior
De manera análoga a como se pasa de los vectores a los tensores en el álgebra
tensorial ordinaria, se puede introducir el concepto de espinares de orden superior.
Así, se llama espinor de segundo orden a una cantidad de cuatro componentes
"PAµ, cuyas componentes se transforman como los productos tpAcpµ de las componentes
de dos espinores (espinores de primer orden). Junto a las componentes contravariantes 1P;.µ, se pueden considerar las componentes covariantes, 1P).µ y las mixtas 1P)P,
que se transforman, respectivamente, como los productos w;.</>µ y n</>.u. El paso
de unas componentes a otras se efectúa mediante el « tensor métrico » g J.µ de acuerdo
con las fórmulas ordinarias
Así w12 = - 1¡,/ = - tp21 , 1Pn = "Pi2 = tp22 , etc. De manera análoga se definen los
es pin ores de orden cualquiera. Las propias cantidades g ;,1t forman un espinor ·antisimétrico de segundo orden. Se comprueba fácilmente que en las transformaciones
binarias no varían los valores de sus componentes.
Es fácil verificar que el producto g J.vg.uv es, cual debe ser, el espinor unidad de
segundo orden, es decir, el espinor de componentes S} = S~ = 1, S¡ = S} = O.
Así, pues,
(56.1)
Como en el álgebra tensorial ordinaria, en el álgebra espinorial se tienen dos
operaciones fundamentales: la multiplicación y la contracción respecto de un par
de índices. La multiplicación de dos espinores conduce a un espinor de orden más
elevado; así, a partir de dos espinores de segundo y de tercer orden 1P Aµ y tpvp j podemos formar el espinor de orden cinco 1P ;.µ tpi-pa. La contracción respecto de un par
de índices (es decir, la suma de las componentes con valores iguales de un determinado
índice covariante y un determinado índice contravariante) disminuye el orden del espinor en dos unidades. Así, la contracción del espinor "P ).µvpa respecto de los índices
µ y v da al espinor de tercer orden "P J.µPPª; la contracción del espinor '1/J ;_ll conduce
al escalar tp/. En todas estas operaciones vale una regla análoga a la expresada
por la fórmula (55.21); si se cambian las posiciones (superior e inferior) de los índices
respecto de los cuales se contrae, cambia el signo del resultado (es decir, n). =
= - 1P) ;.). De aquí se sigue, en particular, que si un espinor es simétrico respecto
de dos cualesquiera de sus índices, el resultado de la contracción respecto de ellos
es el valor cero. Así, para el espinor simétrico de segundo orden 1P J.µ tenemos tp).;,. = O.
Llamamos espinor simétrico de orden n un espinor que es simétrico con relación
a todos sus índices. A partir de un espinor no simétrico se puede formar un espinor
simétrico por simetrización, es decir, sumando las componentes que se obtienen
al aplicar a los índices todas las permutaciones posibles. En virtud de lo dicho antes,
a partir de las componentes de un espinar simétrico es imposible formar (mediante
228
Spin
contracción) un espinor de orden inferior.
En lo que concierne a los espinores antisimétricos (respecto de todos sus índices),
sólo puede serlo el espinor de segundo orden. En efecto, dado que cada índice puede
tornar, en total, sólo dos valores, cuando se trate de tres o más índices por lo menos
dos de ellos tendrán valores iguales y, por lo -tanto, las componentes del espinor
se anularán idénticamente. Todo espinor antisimétrico de segundo orden se reduce
a un escalar multiplicado por el espinor unidad g).µ- Observemos aquí la siguiente
relación, que resulta de lo que precede,
(56.2)
donde 'IJJ J. es un espinor arbitrario; esta regla es una mera consecuencia de que la
expresión que aparece en el primer miembro de la igualdad es (como se comprueba
fácilmente) un espinor antisimétrico de tercer orden.
El espinor formado multiplicando el espinor "P }.µ por sí mismo y contraído después con relación a un par de índices es antisimétrico respecto del otro par; en efecto:
lf>.vlf/ = -ip;/lfµ,v·
Por lo tanto, y en virtud de lo dicho antes, este espinor debe reducirse al espinor
g;,µ multiplicado por un escalar. Determinando este último de manera que la contracción respecto del segundo par de índices dé el resultado correcto, se encuentra:
(56.3)
Las componentes del espinor '1/J}.µ-··*, conjugado complejo del '1/Ji,1, ... , se transforman como las componentes de un espinor contravariante '1/J;P ... , y recíprocamente.
La suma de los cuadrados de los módulos de las componentes de un espinor cualquiera, es, por consiguiente, un invariante.
§ 57.
Funciones de onda de las partículas de spin arbitrario
Una vez desarrollada el álgebra formal de los espinores de orden cualquiera,
podemos pasar a nuestro problema inmediato: el estudio de las propiedades de las
funciones de onda de las partículas de spin arbitrario.
Es conveniente abordar este problema considerando un sistema de partículas
de spin ~. El máximo valor posible de la conponente-z del spin total del sistema es
igual a n/2 y se obtiene cuando, para cada una de las partículas, es Sz = ! (todos
los spins están dirigidos en el mismo sentido, a lo largo del eje z). En este caso, evi<lentemente, es posible afirmar que también el spin total S del sistema es igual a n/2.
Todas las componentes de la función de onda '1/J (a1' a 2 , ••• , a11 ) del sistema de
partículas son, en este caso, iguales a cero salvo una, la componente v{t, i, '. .. , D.
Funciones de onda de las partículas de spin arbitrario
229
Si se escribe la función de onda como producto de n espinores vicp.u ... , cada uno
de los cuales se refiere a una de las partículas, para cada uno de ellos será diferente
de cero tan sólo la componente con i., µ, ... = 1. Así, pues, será diferente de cero
únicamente el producto '1/hp ... Pero el conjunto de todos estos productos es un
cierto espinor de orden n, simétrico respecto de todos sus índices. Si se efectúa una
transformación del sistema de coordenadas (de manera que los spins no estén dirigidos en el sentido del eje z), obtenemos un espinor general de orden. n, pero como
antes simétrico.
Las propiedades « espinoriales » de las funciones de onda, que son esencialmente
sus propiedades respecto de las rotaciones del sistema de coordenadas, son idénticas, evidentemente, para una partícula de spin s y para un sistema de n = 2s partículas de spin ;· cuyos spins están dirigidos de tal forma que el spin total del sistema es
igual a s. De aquí se sigue que la función de onda de una partícula de spin ses un
espinor simétrico de orden n = 2s.
Es fácil ver que el número de componentes independientes de un espinor simétrico de orden 2s es también igual a 2s+ 1, como debía ser. En efecto, sólo serán
distintas las componentes entre cuyos índices se tengan 2s iguales a la unidad y O
iguales a dos, 2s - 1 iguales a la unidad y 1 igual a dos, etc., hasta O iguales a la unidad y 2s iguales a dos.
Desde un punto de vista puramente matemático, se puede decir que los espinores
simétricos permiten clasificar los tipos posibles de transformación de las cantidades
en las rotaciones del sistema de coordenadas. Si se tienen 2s+ 1 cantidades distintas,
que se transforman linealmente entre sí (no siendo posible disminuir su número
mediante combinaciones lineales de las mismas), se puede afirmar que su ley de transformación es equivalente a la ley de transformación de las componentes de un
espinor simétrico de orden 2s (1 ). Todo conjunto de un número cualquiera de funciones que se transforman linealmente entre sí en las rotaciones del sistema de coordenadas, se puede reducir (mediante una transformación lineal adecuada) a un o a
varios espinores simétricos.
Así, un espinor arbitrario de orden n, "P }.µv···, se puede reducir a espinares simétricos de órdenes n, n - 2, n - 4, ... Esta reducción se puede efectuar prácticamente
de la siguiente manera. Simetrizando el espinar "P ;.pv ... respecto de todos sus índices,
formamos un espinor simétrico del mismo orden, n. Por otra parte, contrayendo el
espinor de partida "P iµv .. , respecto diferentes pares de índices, obtenemos espinores
de.orden n - 2 de la forma "P;,_ Jv, .. , que a su vez simetrizamos, con lo que obtenemos
espinores simétricos de orden n - 2. Simetrizando los espinores que se obtienen
después de contraer "P ;,µ .. ,, respecto de dos pares de índices, obtenemos espinores
( 1)
Con otras palabras, los espinores simétricos son bases de las llamadas representaciones irreducibles
del grupo de rotaciones (véase § 98).
S11in
230
simétricos de orden n -
4, y así sucesivamente.
Nos queda todavía por establecer la relación entre las conponentes de un tensor
simétrico de orden 2s y las 2s+ 1 funciones w(a) (donde a = s, s - 1, ... , - s). La
componente
!f11 ••. 1 22 ... 2
s+a
s-a'
entre cuyos índices se repite el índice 1 s+a veces y el índice 2 se encuentra s - a
veces, corresponde a la proyección del spin sobre el eje z igual a a. En efecto, si
consideramos de nuevo el sistema de n = 2s partículas de spin ! en vez de una
partícula de spin s, a la componente antes escrita corresponderá el producto
ifAp1 ... x2p2 .••
~~
este producto corresponde a un estado en el que s+a partículas tiene una proyección
del spin igual a +t y s - a, una proyección igual a - i, de forma que la proyección
total es igual a i (s+a) -Hs - a) =- a. Finalmente, el coeficiente de proporcionalidad entre la componente considerada del espinor y '!/-'(a) lo eligiremos de forma que
valga la igualdad
•
~ lip( cr)l2 =
U=-S
2
~
).,µ, ... -1
ltJ,>iµ .•. ¡2
(57.1)
(esta suma es un escalar, como debe ser, ya que determina la probabilidad de encontrar la partícula en un punto dado del espacio). En la suma que aparece en el segundo
miembro de la igualdad, las componentes con s+a índices 1 se encuentran
(2s)!
(s+ cr)! (s-cr)!
veces. Es claro por ello que la correspondencia entre las funciones 1P(a) y las componentes del espinor viene dada por la fórmula
ip(cr) =
J[
(2s)!
(s+ cr)! (s- cr)!
Jtj,~~.
s+a
(57.2)
s-a
La relación (57.2) garantiza no sólo que se cumpla la condición (57.1), sino,
como es fácil comprobar, el que se cumpla también la condición más general:
ip>.µ ...'P;Jp, ... = ~ (-1) 8 -ªtf,( cr)cp(-cr),
(57.3)
donde "Pi.P ... y </)P ... son dos espinores diferentes de igual orden y "P(a), </>(a) son
funciones formadas con estos espinores de acuerdo con la fórmula (57.2) (el factor
(- 1y-a procede de que al elevar todos los índices en las componentes de un espinor,
231
La relación entre espinares y tensores
el signo cambia tantas veces cuantas veces veces aparezca el 2 entre los índices).
Las fórmulas (55.4) determinan el resultado de aplicar un operador de spin
a las funciones de onda tp( a). No ofrece dificultad el establecer cómo actúan estos
operadores al aplicarlos a una función de onda escrita en la forma de un espinor
de orden 2s. En el caso de spin !, las funciones 1P( +U, 1P(- !) coinciden con las
componentes 1P1, 1P2 de un espinor. De acuerdo con (55.4) y (55.6), el resultado de
aplicarles los operadores de spin será:
(Srx:!f)1 = ÍVJ2 , (s111P) 1 = -fi¡/; 2 , (szi/;) 1 = i¡/;1,
(sxi/;) 2 = !if,1, (s11ifi) 2 = iW, (szi/;)2 = -tif,2 •
(57.4)
Para pasar al caso general de un spin arbitrario, consideremos de nuevo un sistema de 2s partículas de spin ! y escribamos su función de onda como producto
de 2s espinores. El operador de spin del sistema de partículas es la suma de los operadores de spin de cada una de ellas, operadores que se aplican solamente al correspondiente espinor, viniendo determinado el resultado de su aplicación por las fórmulas (57.4). Pasando luego nuevamente a espinores simétricos arbitrarios, es decir,
a las funciones de onda de una partícula de spin s, obtenemos las siguientes fórmulas
(
A
,f,)= ~• -- .l(s + cr) ',,,fu' -...
2
Sa;'f'
s+u s-u
••• 22 ••• s 11',/,)11
f'-- A
(
s+a s-a
,, ·'·)11 ... 22
( Sz'f' -
... _
-
s+u s-u
--+ .l(s-cr)'''s+a+I s-u-1'
22 •••
s+u-l s-a+I
-
2
11 ••• 22 •••
'f'----
••• 22 ••• + 1 '(
),/, 11 ,., 22 •••
s + cr),/,11
'f'----i
2 s-cr ' f ' - - - -
1 '(
2i
s+a-I s-a+I
.,.11 ... 22 ...
cr'f'- --.
s+u s-o
1
/-
s+a+l s-u-1'
(57.5)
J
Observemos que, partiendo de estas fórmulas y de las relaciones (57.2), se podrían deducir las expresiones (55.5) para los elementos de matriz del operador de
spin que se aplica a las funciones 1P(a).
§ 58.
La relación entre espinores y tensores
Hasta aquí hemos hablado de los espinores en tanto que funciones de onda del
momento cinético propio de las partículas elementales. Sin embargo, desde un punto
de vista formal no existe ninguna diferencia entre el spin de una sola partícula y el
momento cinético total de un sistema cualquiera, considerado como un todo, prescindiendo de su estructura interna. Por ello es evidente que las propiedades de transformación de los espinores en relación con las rotaciones espaciales se refieren también y en igual medida al comportamiento de las funciones de onda "Pim de una
partícula cualquiera (o de un sistema de partículas) de momento cinético total j,
con independencia de su naturaleza (orbital o de spin). Debe existir, por lo tanto,
232
Spin
una determinada correspondencia entre las leyes de transformación de las funciones
propias '1/'im en las rotaciones del sistema de coordenadas y las leyes de transformación
de las componentes de un espinor simétrico de orden 2j.
Al establecer esta correspondencia es necesario, sin embargo, distinguir rigurosamente entre dos aspectos de la dependencia de las funciones de onda respecto de la
proyección del momento cinético, m (para un valor dado de j). Se puede tratar de
una función de onda en tanto que amplitud de probabilidad de los diferentes valores
de m, y se puede tratar de una función propia en tanto que correspondiente a un
valor dado de m.
Nos hemos encontrado ya con estos dos aspectos al principio del § 55, donde
se introdujo la « función propia » ,5ªªº del operador Sz correspondiente al valor
Sz = a 0 • La diferencia matemática entre ambos resulta particularmente clara para
una partícula de spin s = f. En este caso, la función espinorial es, respecto de la
variable a, un espinor contravariante de primer orden, es decir, debe escribirse, de
acuerdo con las notaciones espinoriales, en la forma o'1ao· Respecto de a 0 , dicha
función es, en consecuencia, un espinor covariante.
Esta circunstancia posee, evidentemente, un carácter general: las funciones propias tp¡m pueden hacerse corresponder con las componentes de un espinor simétrico
covariante de orden 2j de acuerdo con las fórmulas, análogas a la (57.2) (1):
lfjm =
J
(.
(2j)!
)'( .
/n . .
22 ... •
J+m. 1-m. -.--.-
(58.1)
J+m J-m
Los armomcos esféricos Y¡m son las funciones propias correspondientes a los
valores enteros del momento cinético j y la fórmula (58.1) establece su correspondencia con las componentes de un espinor covariante de orden par. Particularmente
importante es el caso j = 1. Los tres armónicos esféricos Y 1m son:
Y10
=i
Y1,:1::1 =
J: J:
::¡: z·
cos9
=i
n.,
j2-s~ sen Oe±i</> = ::¡: ij~nQ:±in")'
s~
(1) A este resultado se puede llegar también siguiendo un camino algQ. distinto. Si se desarrolla la
función de onda tp de una partícula en un estado de momento cinético j en funciones propias tp:Jm: tp =
= L Om'IJ'Jm, los coeficientes Om son las amplitudes de probabilidad de los diferentes valores m. En este
,n
sentido, los am corresponden a las « componentes » tp(m) de una función de onda espinorial, con lo que se
fija su ley de transformación. Por otra parte, el valor de 'P en un punto dado del espacio no puede depender
de la elección del sistema de coordenadas, es decir, la suma L-OmtpJm debe ser un escalar. Comparando con
el escalar (57.3), vemos que los am deben transformarse como (- l)J-m,¡'J,-m.
233
La relación entre espinores y tensores
(n es el vector unitario correspondiente al vector posición). La comparación de
estas expresiones con la fórmula (58.1) prueba que es posible hacer corresponder
las componentes de un vector con las componentes de un espinor de segundo orden
mediante las fórmulas (1):
i
t/,12 = -az,
(58.2)
v'2
o bien
'l
ip22 = - -(ax+iay).
v'2
(58.3)
Recíprocamente:
az = iy2ip12,
ax =
i
y2(ip22-ipll),
1
ay = - ( ipll
y2
+ ip22).
(58.4)
Es fácil comprobar que, con esta definición, es válida la igualdad
'Pil.µ'Pil.µ = a.b,
(58.5)
donde a y b son los vectores que corresponden a los espinores simétricos tp;.,µ y <p;.,µ.
Tampoco es difícil comprobar que al espinor
lfvil.cf,µv + lfvµ<pil.v
corresponde el vector
yZaxb.
La correspondencia (58.2) o (58.3) es caso particular de una regla general: a
cada espinor simétrico de orden par 2j, donde j es entero, se le puede hacer corres-·
ponder un tensor simétrico de orden mitad (j) cuya contracción respecto de un par
cualquiera de índices se anula (a un tensor de este tipo lo llamaremos irreducible).
Este resultado se sigue ya de que el número de componentes independientes en dicho
espinor y en dicho tensor es el mismo (igual a 2j+ 1), como es fácil comprobar
mediante un simple cálculo (2). La correspondencia entre las componentes del espinor
(1)
Entre las funciones
tp 1m y
las componentes de dicho vector existe la relación
(58.2a)
(2) Desde un punto de vista matemático cabe decir que las 2j+ l (j entero) componentes de un tensor
irreducible de ordenj, al igual que el conjunto de los 2j+ l armónicos esféricos Yjm, y al igual que las 2j+ 1
componentes de un espinor simétrico de orden 2j, son bases de una misma representación irreducible del
grupo de rotaciones.
234
Spin
y del tensor se puede hallar mediante las fórmulas (58.2-4) si se considera el espinor
de orden dado como producto de espinores de segundo orden, y el tensor como producto de vectores.
Finalmente, determinemos la relación entre los ángulos de rotación del sistema
de coordenadas y los coeficientes oc, /3, y, o de la transformación binaria. Para ello
lo más fácil es observar que, de una parte, los cosenos de los ángulos entre los ejes
de coordenadas originales y los nuevos son los coeficientes de las fórmulas de transformación de las componentes de un vector
(58.6)
y que, de otra, esta misma transformación se. puede efectuar mediante la transformación binaria utilizando las fórmulas (58.4), (55.12). Tenemos así, por ejemplo:
a',= iy2,f,12 ' = iy2[cxy,f,11 +f3Sys22 +(cxS+f3y),f,12]
=
(-cxy+f3S)ax+i(cxy+f3S)a 11 +(rx8+f3y)a,
De manera análoga se determinan los demás coeficientes r1.¡k y obtenemos en definitiva la siguiente tabla para los coeficientes de la transformación:
(58.7)
Las expresiones inversas, que dan los coeficientes oc, /3, y, o en función de los
ángulos de la rotación del sistema de coordenadas, se pueden encontrar utilizando
para definir la rotación los ángulos de Euler. La matriz de los coeficientes oc, /3, y, <5
que corresponde a una rotación de ángulo cp en torno del eje z (designémosla por
w(cp)), según la fórmula (55.1) con a= ± t, tiene la forma:
rx.
[ y
/3]
=w(</>) = [é<M'oJ
8
O
e-i</J/2
J
•
(58.8)
La matriz O(O) que expresa la rotación de ángulo O en torno del eje x se calcula
fácilmente a partir de las fórmulas (58.7), en las que hay que hacer
rxxx = 1,
rxyy = {Xzz = cose, rxyz = - ªzy = sen
e,
rxxy
=
rxyx
=
ªxz
=
ªzx
= O:
Se tiene entonces
!2(8) =
cos }8
[
t' sen iB
i sen
!8]
cos f 8
.
(58.9)
La relación entre espinores y tensores
235
La rotación determinada por los ángulos de Euler cf,, e, 1P (fig. 20; ON es la interseccción de los planos xy y x'y'), se efectúa en tres fases; giro de ángulo cf, en torno
del eje z, a continuación giro de ángulo e en torno de la nueva posición del eje x
y, finalmente, giro de ángulo 1P en torno de la dirección final que se obtiene para el
z
4>
y'
.,,....---,,
/
/
/
I
I
I
/
I
\
\
\
I
I
\
\
\
' , __ .....
I
I
/
FIG. 20
eje z. De acuerdo con esto, la matriz de la transformación total es igual al producto
w( tp)O.(fJ)w(cf,). Multiplicando, sin más, las matrices, obtenemos finalmente
[
rt.
f3]
y
8
= [
cos }8
. e~<cf,H)/2
i sen }8 . et<cf,- I/J)/2
i sen ¡o
cos }8
. ~-i(cf,-r/,J/2] •
. e-iCcf,+t/JJ/2
(58.10)
En particular, a la rotación de ángulo n en torno del eje y corresponden los valores
de los ángulos de Euler fJ = n, cf, - 1P = n, de forma que
rf.
=8=
o, /3
= 1, y = -1.
Esto significa que las componentes de un espinor se transforman en esta rotación
de acuerdo con 1P\' = 1P2, ,p21 = - 1P\ o bien
(58.11)
PROBLEMAS
Expresar la definición (57.4) del operador de spin 1/2 mediante las componentes espinoriales del vector s.
l.
Solución.
y el espinor
Teniendo en cuenta las fórmulas (58.3) que establecen el enlace entre el vector s
la definición (57.4) se escribe en la forma
sJ.µ,
236
Spin
2. Escribir las fórmulas que determinan el efecto de la aplicación del op,~rador de spin a la
función de onda de una partícula de spin 1.
Solución. La relación que liga las componentes de la función vectorial 1P con las componentes
del espinor 1PAµ viene dada por las fórmulas (58.3), y la última de las fórmulas (57.5) nos da:
-t/J+,
szt/J-
=
t/1-,
Sztpz
= O
Sztpx = - itf¡y,
Sztpy
=
it/Jx,
Sztpz
= O.
szt/J+
=
o bien
Las restantes fórmulas se obtienen a partir de éstas mediante permutación circular de los índices
x, y, z. Todas en conjunto se pueden escribir en la form.i
Es posible representar el vector complejo 1P en la forma 1P = eicx(u + iv), donde u y v son vectores reales que, mediante una elección adecuada de la fase común ét, se pueden suponer perpendiculares entre sí. Los dos vectores u y v determinan un plano que posee la propiedad de que la
proyección del spin sobre la perpendicular al mismo puede tomar sólo los valores ± 1.
§ 59.
Polarización parcial de las partículas
Mediante una elección adecuada del eje z, es siempre posible reducir a cero una
de las componentes (por ejemplo, la 1P2) de un espinor dado que es la función de
onda de una partícula de spin l. Esto es evidente, ya que una dirección en el espacio
viene determinada por dos cantidades (dos ángulos), es decir, el número de parámetros que tenemos a nuestra disposición es igual al número de cantidades que
queremos reducir a cero (la parte real y la parte imaginaria del número complejo 1P2).
Físicamente esto significa que si una partícula de spin !- (para concretar hablaremos de un electrón) se encuentra en el estado descrito por una cierta función de onda
de spin, existe una dirección en el espacio tal que la proyección del spin de la partícula
sobre la misma tiene el valor determinado a= t. Cabe decir que en dicho estado
el electrón está completamente polarizado.
Sin embargo, existen también estados del electrón que se pueden calificar de
parcialmente polarizados. Estos estados se describen, no por funciones de onda, sino
solamente por matrices densidad, es decir, son estados mezclados (respecto del
spin) (véase § 14).
La matriz densidad de spin del electrón es un espinor de segundo orden 2 i.p,
normalizado por la condición
237
Polarización parcial de las partículas
(59.1)
y que satisface la condición de « hermiticidad »
(pÁµ)* = p/.
(59.2)
En el caso de un estado de spin puro del electrón (es decir, completamente polarizado),
el espinor e;_µ se reduce al producto de las componentes de la función de onda 1p ;_:
(59.3)
Las componentes « diagonales »·de la matriz densidad, ei1 y ez2, determinan las
probabilidades de los valores
k y - ! de la proyección del spin del electrón sobre
el eje z. El valor medio de esta proyección es, por lo tanto:
+
s; = i(p11- p2 2),
o bien, teniendo en cuenta (59.1),
p11
= i+Sz,
(59.4)
En un estado puro el valor medio de la magnitud s ' = sx
mediante las fórmulas
±- isy
se calcula
S+ = iµA* s+iµA = ipl*¡/;2,
¡:_
= if;A* §_if;:>.. = if;2*if;l
(véase (55. 7)). Análogamente, en un estado mezclado tenemos:
Pl2
= S+,
p21
=
L.
(59.5)
En resumen, pues,
!! =
! ( 1 ~ 2§ · a)
Vemos así que todas las componentes de la matriz densidad de spin del electrón
se expresan en función de los valores medios de las componentes de su vector spin.
Con otras palabras, el vector real s determina por comp1eto las propiedades de polarización de una partícula de spin ! . En el caso límite de polarización completa, una
de las componentes de este vector (mediante la correspondiente elección de la dirección de los ejes) es igual a!, y las otras dos son nulas. En el caso opuesto de un estado
no polarizado, las tres componentes son iguales a cero. En cambio, en el caso general de polarización parcial arbitraria y de una elección arbitraria del sistema de
coordenadas, se cumple la desigualdad O s Q s l, donde
p
= 2(sx2 + .sy2 + .5z2)1/2
es una cantidad que se puede 11amar grado de polarización del electrón.
Para una partícula de spin cualquiera s, la matriz den sí dad es un espinor
Q }.µ ... pa ...
238
Spin
de orden 4s, simétrico respecto de los 2s primeros índices y de los 2s últimos, espinor
que satisface las condiciones
PAµ ••• Aµ ••• =
1,
(PAµ •• .Pu· .. )* = Ppa'···Aµ ••••
(59.6)
(59.7)
Para calcular el número de componentes independientes de la matriz densidad,
observemos que entre los posibles sistemas de valores de los índices A, µ, ... ( o de los
índices !!, a, ... ) existen solamente 2s+ 1 esencialmente distintos. Teniendo en cuenta
también que las componentes del espinor !! ¡_ 11 ••• P11 ••• están ligadas por la relación
(59.6), encontramos que el número de componentes distintas es igual a (2s+ 1)2 - 1 =
= 4s(s+I). Aunque estas componentes son números complejos, sin embargo y en
virtud de las relaciones (59. 7), este hecho no aumenta el número total de cantidades
independientes que caracterizan el estado de polarización parcial de la partícula,
número que es igual, por lo tanto, 4s(s+ 1) (1). Como término de comparación,
obsérvese que un estado de polarización total de la partícula se define por 4s cantidades (las 2s+ 1 componentes complejas de la función de onda v/µ ... , ligadas por una
condición de normalización y que contienen una fase común que carece de importancia para la descripción del estado).
Como todo espinor de orden 4s, el espinor 1P ).µ ... pa... equivale a un conjunto de
tensores irreducibles de órdenes 4s, 4s - 2, ... , O. En el presente caso; se tiene un
solo tensor de cada uno de estos órdenes, ya que, en virtud de las propiedades de
simetría del espinor 11' ¡_1, •.• Pª···, cada una de las contracciones se puede realizar de
una sola manera - respecto de uno (cualquiera) de los índices }., µ, ... y uno de los
p, a, ... Además, no existe el escalar (tensor de orden cero), ya que se reduce a la
unidad en virtud de la condición (59.6).
~
60.
Inversión del tiempo y teorema de Kramers
La simetría del movimiento respecto del cambio de signo del tiempo se traduce
en mecánica cuántica en el hecho de que si 1P es la función de onda de un estado
estacionario del sistema, también la función de onda« invertida respecto del tiempo»
(designémosla por 1Pinv) describe un posible estado que corresponde precisamente
a la misma energía. Al final del § I 8 se demostró que 'IJ'inv coincide con la función
conjugada compleja 1P*. En esta simple forma, la afirmación que precede se refiere
a las funciones de onda sin tener en cuenta el spin de las partículas. Cuando existe
spin es necesario precisar más.
Representemos la función de onda de una partícula de spin s como espinor con(1) Dar estas cantidades eguivale a dar los valores medios de las componentes del vector s y de todas
las potencias y los productos de 2, 3, ... , 2s, componentes que no se reducen aun a potencias más bajas
(véase el problema 3, § 55).
239
Inversión del tiempo y teorema ,le K ramers
travariante 1/,µ .. , (de orden 2s). AJ pasar a ]as funciones conjugadas complejas,
tp).µ ... *, obtenemos, sin embargo, un conjunto de cantidades que se transforman
como las componentes de un espinor covariante. A la operación de inversión del
tiempo corresponde por ello el paso de la función de onda 1p'-! 1··• a una nueva
función de onda cuyas componentes covariantes se determinan de acuerdo con la
igualdad
(60.1)
Para un conjunto dado de valores de los índices J., ¡,, ... las componentes covariantes y contravariantes de los espinores corresponden a valores de la proyección
del momento cinético que difieren en el signo. Por lo tanto, en términos de las funciones 1Pscr, a la inversión del tiempo corresponde el paso de 'Y\ 7 a 1ps, -:,, como
debía ser, ya que el cambio de signo del tiempo cambia el sentido del momento
cinético. La correspondencia exacta se establece de acuerdo con (60. 1):
i//n__: = lfs<T*( -
J)S-<T.
Con otras palabras, la operación inversión del tiempo exige la substitución
'Pscr
~
lps ,-<T( - 1)S-<T.
(60.2)
Consideremos un sistema arbitrario de partículas en interacción mútua. En general, los momentos cinéticos orbital y de spin de un tal sistema no se conservan,
cada uno por separado, si se tienen en cuenta las interacciones relativistas. Se conserva
tan -,ólo el momento cinético total J. Si no existe ningún campo exterior, cada uno
de los niveles de energía del sistema es degenerado de orden (21 + 1). Al dejar actuar
un campo exterior, esta degeneración, en general, se rompe. Se plantea la cuestión
de si la degeneración se puede romper por completo, es decir, de tal manera que el
sistema posea solamente niveles simples. Este problema está íntimamente ligado
con la simetría respecto de la inversión del tiempo.
En la electrodinámica clásica se cumple la invariancia de las ecuaciones respecto
del cambio de signo del tiempo si se conserva el campo eléctrico y se cambia el
signo del campo magnético (1). Esta propiedad fundamental del movimiento debe
conservarse también en la mecánica cuántica. Por consiguiente, la simetría respecto
de la inversión del tiempo se cumple no solamente en el caso de un sistema aislado,
sino también cuando existe un campo eléctrico exterior cualquiera (en ausencia
de campo magnético).
Las funciones de onda del sistema son espinares tp J.,u ••• , cuyo orden n es igual
al doble de la suma de los spins de todas las partículas (n = 2 ~ sa); esta suma puede
no coincidir con el spin total S del sistema. De acuerdo con lo antes dicho, cabe
afirmar que en un campo eléctrico arbitrario la función de onda y la función que
1
( )
Véase tomo 11, Teoría clásica de los c:impos, § 17. Véase también la nota al final del§ 110.
240
Spin
resulta de invertir el sentido del tiempo deben corresponder a estados de igual
energía. Para que el nivel sea no degenerado, es necesario en cualquier caso que estos
estados coincidan, es decir, que las correspondientes funciones de onda coincidan
salvo un factor constanteº Se supone, claro está, que ambas funciones se expresan
en la forma de espinores de igual tipo (covariantes o contravariantes).
Escribamos
11·~~~- = C1p;.p ... ,
o bien, según (60.1)
.,.).µ.... •
'f'
= e,,.\
'f'I\µ. ••• ,
(60.3)
donde Ces una constante. Formando las expresiones conjugadas complejas de ambos
miembros de esta igualdad, obtenemos:
.,.).µ....
'f'
=
e•.,.\ •.
'f'Aµ ••.
Bajemos los índices en el primer miembro de la igualdad, subiendo a la vez los del
segundo miembro. Esto significa que multiplicamos ambos miembros de la igualdad
por g,y_;_g~µ ... y sumamos respecto de los índices Ji., µ, ... ; al hacerlo, en el segundo
miembro hay que tener en cuenta que
ga).g/3µ •. • = { -1 )ng).<Xgµ/1 •.••
Obetenemos así:
'P>..µ,... = C*( -1 tl/J).µ ...=11=.
Substituyendo
1p).p ...
*
por la expresión dada por (60.3), encontramos:
IP..\p...
= ( -1
rcc•ipAµ ....
Esta igualdad debe quedar satisfecha idénticamente, es decir, debe tenerse
(-- I)nCC* = l.
2
Pero dado que
es positivo en cualquier caso, es claro que esta igualdad es sólo
posible si n es par (es decir, si el valor de la suma ~sa es un número entero). Sin
es impar (es decir, cuando el valor de ~sa e'.; semientero) (1 ) la condición (60.3) no
puede quedar satisfecha.
J
cJ
Llegamos así al resultado de que el campo eléctrico puede romper la degeneración
por completo tan sólo en un sistema en el que la suma de los spins de las partículas
es un número entero. En un sistema en el que dicha suma es un número semientero,
todos los niveles deben ser doblemente degenerados cuando aquél se encuentra en
un campo eléctrico arbitrario, y a dos estados distintos de igual energía corresponden espinores conjugados complejos (2) (H. A. KRAMERS, 1930).
(1) Cuando la suma ~sa es un número entero (semientero) son también enteros (semienteros) todos
los posibles valores del spin total S del sistema.
2
( )
Si el campo eléctrico posee una simetría elevada (cúbica), puede presentarse también una degeneración de orden cuarto (véase § 99 y el problema propuesto en el mismo).
Inversión del tiempo y teorema de Kramers
241
Hagamos aún una observación de carácter matemático. Una correspondencia
de la forma (60.3) con una constante C rea], representa, desde e] punto de vista
matemático, ]a condición de que a las componentes del espinor se pueda hacer
corresponder un conjunto de ciertas cantidades reales; dicha condición se puede
llamar condición de «realidad» de] spinor (1). La imposibilidad de que se satisfaga
]a relación (60.3) cuando n es impar significa que a ningún espinor de orden impar
se puede asociar una magnitud reaJ. Por el contrario, si n es par, la condición (60.3)
puede quedar satisfecha con C igual a un número reaJ. En particular, a un espinor
simétrico de segundo orden se le puede hacer corresponder un vector real si se cumple
la condición (60.3) con C = 1:
if;Aµ=YF = 'PJ..µ
{lo cual es fácil comprobar mediante las fórmulas (58.2-3)). En genera], la condición
(60.3) con C = 1 es la condición de « realidad» de un espinor simétrico de orden
par cualquiera.
(1)
Hablar del carácter real de un espinor en sentido literal carece en general de significado, ya que
los espinores conjugados complejos poseen leyes de transformación diferentes.
CAPÍTULO
IX
PARTÍCULAS IDÉNTICAS
§ 61 . Principio de indistinguibilidad de las partículas idénticas
En la mecánica clásica las partículas idénticas (por ejemplo, los electrones),
a pesar de la identidad de sus propiedades físicas, no pierden, sin embargo, su
«individualidad». Así, cabe imaginar que las partículas que forman parte del sistema
físico dado se <<numeran» en un cierto instante y que luego se sigue el movimiento
de cada una de ellas a lo largo de su trayectoria; entonces en un instante cualquiera
será posible identificar las partículas.
En la mecánica cuántica, sin embargo, la situación cambia por completo, conforme se sigue directamente del principio de indeterminación. Más de una vez se
ha señalado ya que, en virtud de este principio, el concepto de trayectoria de un electrón pierde por completo su sentido. Si se conoce exactamente la posición de un
electrón ahora, ya en un instante infinitamente próximo sus coordenadas no tienen
ningún valor determinado. Por ello, localizando los electrones y numerándolos en un
cierto instante, nada conseguimos con vistas a identificarlos en un instante ulterior;
al localizar uno de los electrones en otro instante en un cierto punto del espacio no
podremos indicar cuál de los electrones precisamente fue a parar a este punto.
Así, pues, no existe por principio posibilidad ninguna de seguir por separado
cada una de las partículas idénticas y con ello distinguirlas. Cabe decir que en mecánica cuántica las partículas idénticas pierden por completo su « individualidad ».
La identidad de las partículas en lo que concierne a sus propiedades físicas tiene
aquí un sentido muy profundo: conduce a la indistinguibilidad completa de las
partículas.
Este principio, llamado principio de indistinguibilidad de las partículas idénticas,
representa un papel fundamental en el estudio mecánico-cuántico de un sistema
constituido por partículas idénticas. Consideremos primero un sistema formado
por sólo dos partículas. En virtud de su identidad, los estados del sistema que se
obtienen mediante la simple permutación de las dos partículas deben ser completamente equivalentes desde el punto de vista físico. Esto significa que como resultado
de esta permutación, la función de onda del sistema puede variar tan sólo en un factor
Principio de indistinguibilidad
243
de fase carente de importancia. Sea 11'(~1 , ~2) la función de onda del sistema y convengamos en designar por ~1, ~ 2 el conjunto de las tres coordenadas y la proyección
del spin de cada una de las partículas. Debe tenerse entonces
iµ(g1, g2) = eiªiµ(g2, g1),
donde c1 es una constante real. El resultado de permutar de nuevo las dos partículas
es volver al estado inicial, mientras que la función 11' queda multiplicada por e2 irx.
De aquí se sigue que e2 irx = 1 o bien ei:I- = ± l. Así, pues, ip(~1, ~ 2) = ± 11' (~2 l 1).
Llegamos así al resultado de que existen sólo dos posibilidades: la función de
onda o es simétrica (es decir, no cambia en absoluto como resultado de la permutación de las partículas), o es antisimétrica (es decir, cambia de signo al efectuar la
permutación). Es evidente que las funciones de onda de los diversos estados de un
mismo sistema deben poseer la misma simetría; de no ser así, la función de onda
de un estado que es superposición de estados de simetrías diferentes, no sería ni simétrica ni antisimétrica.
Este resultado se generaliza inmediatamente a sistemas constituidos por un
número arbitrario de partículas idénticas. En efecto, en virtud de la identidad de
las partículas, es claro que si un par cualquiera de ellas tiene la propiedad de poderse
describir por funciones de onda, digamos, simétricas, también cualquier otro par
de dichas partículas poseerá la misma propiedad. Por consiguiente, la función de
onda de un sistema de partículas idénticas debe ser tal que o no. varía al permutar
un par cualquiera de partículas (con lo que tampoco variará en una permutación
cualquiera de partículas) o cambia de signo al permutar las partículas de cada par.
En el primer caso la función de onda se dice que es simétrica, en el segundo caso,
que es antisimétrica.
La propiedad de poderse describir o por funciones de onda simétricas o por
funciones de onda antisimétricas depende del género de partículas. De las partículas
que se describen mediante funciones antisimétricas se dice que obedecen a la estadística de Fermi-Dirac o que son fermiones, y de las partículas que se describen
por funciones simétricas, se dice que obedecen a la estadística de Base-Einstein, o que
son bosones (1 ).
La mecánica cuántica relativista demuestra que la estadística a que obedecen
las partículas está ligada unívocamente con su spin: las partículas de spin semientero
son fermiones, y las de spin entero son bosones.
(1) Esta terminología está ligada con el nombre de las estadísticas mediante las cuales se describe
un gas perfecto constituido por partículas cuyas funciones de onda son antisimétricas o simétricas, respectivamente. En realidad, nos encontramos aquí no sólo ante estadísticas distintas, sino ante mecánicas
esencialmente distintas. La estadística de Fermi fue propuesta por E. FERMI para los electrones en 1926
y su relación con la mecánica cuántica fue puesta de manifiesto por P. A. M. DIRAC (1926). La estadística
de Bose fue propuesta por S. N. BosE para los cuanta de luz y generalizada por A. EINSTEIN ( 1924).
244
Partículas idénticas
La estadística de las partículas compuestas se determina por la paridad del
número de fermiones elementales que entran en su constitución. En efecto, la permutación de dos partículas idénticas compuestas es equivalente a la permutación
simultánea de algunos pares de partículas elementales idénticas. La permutación
de bosones no modifica la función de onda en absoluto, y la permutación de fermiones cambia su signo. Por ello, las partículas compuestas que contienen un número
impar de fermiones elementales obedecen a la estadística de Fermi, y las que contienen un número par, obedecen a la estadística de Bose. Este resultado está de
acuerdo, naturalmente, con la regla general antes indicada, ya que una partícula
compuesta tiene spin entero o semientero según sea par o impar el número de partículas de spin semientero que entran en su composición.
Así, los núcleos atómicos de peso atómico impar (es decir, formados por un
número impar de protones y neutrones) obedecen a la estadística de Fermi, y los
de peso par, a la estadística de Bose. En cambio, para los átomos, que, además
del núdeo, contienen también los ·electrones, la estadística viene determinada, evidentemente, por la paridad de la diferencia entre el peso atómico y el número
atómico.
Consideremos un sistema formado por N partículas idénticas de cuya interacción
mutua se puede prescindir. Sean 1/'i, tp2 , ••• las funciones de onda de los diferentes
estados estacionarios en que pueden encontrarse cada una de las partículas por
separado (1). El estado del sistema como un todo se puede determinar indicando los
números que caracterizan los estados en que se encuentran las diferentes partículas.
Se plantea el problema de ver cómo se puede construir la función de onda o/ del
sistema como un todo a partir de las funciones tp1, tp2 , •••
Sean Pi, p 2 , ••• , P.-v los números que fijan los estados en los que se encuentran las
partículas por separado (entre estos números puede haberlos iguales entre sí). Para
un sistema de bosones, la función de onda o/(,;1 , ~2 , ••• , ~s) se expresa como suma de
productos de la forma:
q,"'l (f1)q,f!2 (f2) ••• q,flB (fN),
con todas las permutaciones posibles de los diferentes índices Pi, p2 ••• ; esta suma
posee, evidentemente, la propiedad de simetría exigida. Así, por ejemplo, para un
sistema de dos partículas
(61.1)
(suponemos que p 1 =f=. p 2 ). El factor J"fV 2 se introduce para normalizar 'lº (todas las
funciones 'f'i, ,,,2 , ••• son ortogonales dos a dos y se suponen normalizadas).
(1)
estados.
Si existiera una fuerte interacción entre las partículas, sería imposible, claro está, hablar de tales
Interacción de intercambio
245
Para un sistema de fermiones, la función de onda 'F es la combinación antisimétrica de los productos indicados. Esta función se puede escribir en forma de determinante
'P1> (t1)
'P1> (t2)
'P1> (tN)
'P112 (t1)
'P1>2 (t2)
'P1>2 (tN)
1
1
'f" = vN!
1
1
(61.2)
'P1>)t1) 'P1>8 (t2)
'P1>N (tN)
A la permutación de dos partículas corresponde aquí la permutación de dos columnas del determinante, cuyo resultado, como es sabido, es cambiar el signo del mismo.
Para un sistema constituido por dos partículas tenemos:
(61.3)
De la expresión (61.2) se deduce el siguiente importante resultado. Si entre los
números Pi, P2, ... hay dos que son iguales, dos filas del determinante resultan ser
iguales y éste se anula idénticamente. El determinante será distinto de cero solamente
cuando todos los números Pi, p 2 , ••• sean diferentes. Así, pues, en un sistema de fermiones idénticos dos (o más) partículas no pueden encontrarse a la vez en el mismo
estado. Éste es el llamado principio de Pauli (1925).
§ 62.
Interacción de intercambio
El hecho de que en la ecuación de ScHRODINGER no se tenga en cuenta la existencia del spin de una partícula, en modo alguno hace perder su valor ni a esta ecuación
ni a los resultados que se obtienen a partir de ella. Y ello es así porque la interacción
eléctrica de las partículas no depende de sus spins (1 ). Desde el punto de vista matemático, esto significa que el hamiltoniano de un sistema de partículas en interacción
eléctrica (y si no existe campo magnético) no contiene los operadores de spin y,
por lo tanto, al aplicarlo a una función de onda, no actúa sobre las variables espinoriales. Por lo tanto, en realidad, satisfacen a la ecuación de SCHRODINGER cada una
de las componentes de la función de onda; con otras palabras, la función de onda
'J:(r1, a 1 ; r 2 , a2 ; ••• ) de un sistema de partículas se puede escribir en forma de producto
x( ª1, ª2, ••. )<fo(r1, r2, •.. )
de una función <p que depende solamente de las coordenadas de las partículas y una
función x de los spins (llamaremos a la primera función de onda de coordenadas
( 1)
Esto vale sólo en tanto se trata de la aproximación no relativista. Si se tienen en cuenta los efectos
relativistas, la interacción de las partículas cargadas resulta depender del spin.
246
Partículas idénticas
u orbital, y a la segunda, función de onda de spin). La ecuación de ScHRODINGER
determina esencialmente tan sólo la función de coordenadas cp, dejando arbitraria
la función X· En todos los casos en que no nos interesa el propio spin de las partículas,
es posible, por consiguiente, aplicar la ecuación de ScHRODINGER considerando
como función de onda únicamente la función de coordenadas, que es precisamente
lo que se hizo en cuanto se ha expuesto hasta aquí.
Sin embargo, resulta que, a pesar de la independencia que hemos señalado de la
interacción eléctrica de las partículas con relación a su spin, existe una dependencia
peculiar de la energía del sistema respecto de su spin total, dependencia que procede
en último término del principio de indistinguibilidad de las partículas idénticas.
Consideremos un sistema constituido solamente por dos partículas idénticas.
Como resultado de resolver la ecuación de ScHRODINGER, encontramos toda una
serie de niveles energéticos a cada uno de los cuales corresponde una determinada
función de onda de coordenadas cp(r1, r 2) que es simétrica o antisimétrica. En efecto,
en virtud de la identidad de las partículas, el hamiltoniano del sistema (y, por consiguiente, también la ecuación de ScHRODINGER) es invariante respecto la permutación de las mismas. Si los niveles de energía no son degenerados, al permutar las
coordenadas r 1 y r 2 , la función cp(r1 , r 2) puede cambiar tan sólo en un factor constante;
pero si se aplica de nuevo la permutación, se observa que este factor únicamente
puede ser igual a ± 1 (1).
Supongamos primero que las partículas tienen spin nulo. No existe factor de
spin para tales partículas y la función de onda se reduce solamente a una función
de las coordenadas cp(r1, r 2), que debe ser simétrica (ya que las partículas de spin
nulo obedecen a la estadística de Bose). Así, pues, no todos los niveles de energía
que se obtienen al resolver formalmente la ecuación de SCHRODINGER pueden existir
en realidad~ aquéllos a los que corresponden funciones </> anti simétricas son imposibles para el sistema considerado.
La permutación de dos partículas idénticas equivale a invertir el sistema de coordenadas (cuyo origen se elige de forma que coincida con el punto medio del segmento
que une ambas partículas). Por otra parte, como resultado de la inversión, la función
de onda </> debe quedar multiplicada por (- 1)1, donde les el momento cinético orbital del movimiento relativo de ambas partículas (véase § 30). Comparando estas
consideraciones con lo dicho antes, llegamos a la conclusión de que un sistema de
dos partículas idénticas de spin nulo tan sólo puede poseer momentos cinéticos
orbitales pares.
(1) Cuando existe degeneración, es siempre posible elegir combinaciones lineales de las funciones
relativas al nivel dado, tales que dichas combinaciones satisfacen también esta condición.
Interacción de intercambio
247
Supongamos ahora que el sistema está constituido por dos partículas de spin !
{por ejemplo, dos electrones). La función de onda total del sistema (es decir, el
producto de la función cp(r1, r 2) y la función de spin x(a1 , a 2)) debe ser entonces nece.
sariamente antisimétrica respecto de permutación de ambos electrones. Por ello,
si la función de las coordenadas es simétrica, la función de spin debe ser antisimétrica,
y recíprocamente. Escribiremos la función de spin en forma espinorial, es decir,
como espinor de segundo orden x},µ, cada uno de cuyos índices corresponde al spin
de uno de los electrones. A una función simétrica respecto de los spins de ambas
partículas corresponde un espinor simétrico (xAµ = xµA), y a una función antisimétrica, un espinor antisimétrico (xAp, = - xµA). Pero sabemos que un espinor
simétrico de segundo orden representa un sistema cuyo spin total es igual a la unidad, y que un espinor antisimétrico se reduce a un escalar, que corresponde a un
spin igual a cero.
Llegamos así al siguiente resultado. Los niveles de energía a los que corresponden soluciones </>(r1, r2) de la ecuación de SCHRODINGER simétricas pueden efectivamente existir para un spin total del sistema igual a cero, es decir, cuando los spins
de ambos electrones son « antiparalelos », lo que da una suma nula. En cambio,
los valores de la energía ligados a funciones cp(r1, rJ, antisimétricas exigen un spin
total igual a la unidad, es decir, los spins de los dos electrones deben ser« paralelos».
Con otras palabras, los valores posibles de la energía de un sistema de electrones
dependen de su spin total. Basándose en esto, cabe hablar de una cierta interacción
peculiar de las partículas, interacción que conduce a dicha dependencia. Esta interacción se llama interacción de intercambio. Se trata de un efecto puramente cuántico
que desaparece por completo (como el propio spin) al pasar al límite de la mecánica
clásica.
He aquí una circunstancia que es característica del caso que acabamos de examinar, el de un sistema de dos electrones. A cada nivel de energía corresponde un determinado valor del spin total: O ó 1. Esta correspondencia entre los valores del spin
y los niveles de energía se conserva también, como veremos a continuación (§ 63),
en los sistemas constituidos por un número arbitrario de electrones. Sin embargo,
dicha correspondencia deja de existir en los sistemas constituidos por partículas de
spin mayor que !.
Consideremos un sistema de dos partículas de spin arbitrario s. Su función de
onda de spin es un espinor de orden 4s
>.µ ••.
p(I •••
X~2s'
de cuyos índices la mitad (2s) corresponden al spin de una partícula, y la otra mitad,
al spin de la otra. Este espinor es simétrico con relación a los índices de cada uno
248
Partículas idénticas
de estos grupos de índices. A la permutación de ambas partículas corresponde
]a permutación de todos ]os índices }., ,,, ... del primer grupo con los índices Q,
a, ... del segundo grupo. Para obtener la función de spin de un estado del sistema
con spin total S, hay que contraer este espinor respecto de 2s - S pares de índices
(cada par contiene uno de los índices }., p, ... y uno de los índices !.!, a, ... ) y simetrizar luego respecto de los restantes; se obtiene como resultado un espinor simétrico
de orden 2S.
Pero, conforme sabemos, la contracción de un espinor respecto de un par de
índices significa construir una combinación de componentes antisimétrica respecto
de estos índices. Por lo tanto, al permutar las partículas la función de onda de spin
queda multiplicada por (- 1)2s-s.
Por otra parte, la función de onda total del sistema de dos partículas ·debe quedar
multiplicada por (- 1)2s al permutarlas (es decir, por + 1 para s entero y por - l
paras semientero). De aquí se sigue que la simetría de la función de onda de coordenadas respecto de la permutación de las partículas viene dada por el factor (- l)\
que depende sólo de S.
Llegamos así al resultado de que la función de onda de coordenadas de un
sistema de dos partículas idénticas es simétrica cuando el spin total es par, y antisimétrica cuando es impar.
Recordando lo antes dicho respecto de la permutación de las partículas y de la
inversión del sistema de coordenadas, llegamos a la conclusión de que cuando el
spin Ses par (impar), el sistema puede poseer solamente un momento cinético orbital par (impar).
Vemos, por lo tanto, que también en este caso se manifiesta una cierta dependencia entre los valores posibles de la energía del sistema y el spin total, pero esta dependencia no es del todo unívoca. Los niveles de energía a los que corresponden funciones de onda de las coordenadas simétricas (antisimétricas) pueden existir para todos
)os valores de S pares (impares).
Determinemos cuántos estados diferentes de un sistema de dos partículas de
spin s existen en total con valores de S pares e impares. La cantidad S toma 2s+ 1
valores: 2s, 2s - 1, ... , O. Para cada S dado, se tienen 2S + 1 estados que difieren
en el valor de la componente-z del spin (en total (2s+I)2 estados distintos). Supongamos que ses entero. Entonces entre los 2s+ 1 valores S hay s+ 1 pares y s impares.
El número total de estados con S par es igual a la suma
~
(2S+l) = (2s+l)(s+l);
8-0,2,...,28
249
Interacción de i1J,tercambio
los restantes s(2s+ 1) estados tienen spin Simpar. De manera análoga encontramos
que cuando s es semientero se tienen (2s +1) estados con valores S pares y (s + 1)
(2s+ 1) con valores impares.
PROBLEMAS
1. Determinar el desdoblamiento de intercambio de los niveles de energía de un sistema de
dos electrones: la interacción de los electrones se considera como una perturbación.
Solución. Supongamos que las partículas se encuentran (sin tener en cuenta su interacción
mutua) en estados cuyas funciones de onda orbitales son cf,i(r) y cf,lr). A los estados del sistema
con spin total S = O y S = 1 corresponden, respectivamente, los productos simetrizados y antisimetrizados:
Los valores medios del operador interacción de las partículas U(r2 iguales a A ± J, donde
r1) en estos estados son
(la integral J se llama integral de intercambio). Prescindiendo de la constante aditiva A, que no
tiene el carácter de intercambio, encontramos así para los desplazamientos de los niveles: llEo = J,
llE1 = - J (el subíndice indica el valor de S). Estas cantidades pueden interpretarse como valores propios del « operador de intercambio» de spin (1)
Vcamb =
-V(l +4s1. s2);
(1)
(en cuanto a los valores propios del producto s1 • s2 , véase el problema 2, § 55).
Si los electrones pertenecen, por ejemplo, a átomos diferentes, la integral de intercambio disminuye exponencialmente al aumentar la distancia R entre los átomos. La estructura del integrando
pone claramente de manifiesto que esta integral viene determinada por el « solapamiento » de
las funciones de onda de los estados cf,1(r1) y ,"2(r2); teniendo en cuenta la ley asintótica (cf. (21.6))
del decrecimiento de las funciones de onda de los estados del espectro discreto, encontramos que
Kl
= y1(2mlE11)/n,
donde Ei, E 2 son los niveles de energía del electrón en uno y otro átomo.
2.
El mismo problema, pero para un sistema de tres electrones.
Solución. Teniendo en cuenta la fórmula (1) del problema 1, escribiremos el operador de
interacción binaria de intercambio para un sistema de tres electrones en la forma
(1)
1
( )
Este operador fue introducido por primera vez por
DIRAc.
250
Partículas idénticas
donde la suma se extiende a todos los pares de partículas 12, 13 y 23. Los elementos de matriz
de los operadores
8b entre estados con valores diferentes de los pares de números ªª' ab se
determinan mediante las fórmulas (55.6) y son iguales a:
sa.
Determinemos primero la energía que corresponde al máximo valor posible de la proyección
del spin total Ms = a 1 +a2 +a3 , es decir, al valor Ms = 3/2; con ello determinamos también la
energía del estado con spin total S = 3/2. Calculando el correspondiente elemento de matriz
diagonal del operador (1 ), encontramos:
Pasemos ahora a los estados con Ms = t. Este valor de Ms puede obtenerse de tres maneras,
que dependen de cuál de los números O'i, a 2 , a 3 es igual a - ! (y los otros dos iguales a ~ ). Obtendríamos así para estos estados una ecuación secular de tercer grado. Sin embargo, el cálculo se
puede simplificar sin más que observar que una de las raíces de esta ecuación debe corresponder
a la energía ya encontrada del estado con S = 3/2, y que, por lo tanto, la ecuación secular ha de
ser divisible por ll.E - ll.E3, 2; esta circunstancia permite en el caso presente eludir el cálculo del
término independiente de la ecuación cúbica (1).
Así, calculando los términos de mayor grado de la ecuación, obtenemos
(.6.E)3 + (li2 + lia + l2a)(.6.E2) + [li2l1a + l12l2a + lial2a- 9(1122 + lia2 + 12a2)/4 ].6.E + ... = O.
y dividiendo por ll.E+J12 +J13 +J21i, se encuentran los dos niveles de energía que corresponden
a los estados con spin S
= ~:
Se tienen así en total tres niveles de energía, de acuerdo con el cálculo efectuado en el problema del § 63.
3. ¿En qué estados el núcleo Be8 puede desintegrarse en dos partículas rx?
Solución. Dado que una partícula rx carece de spin, el sistema de dos partículas rx puede poseer solamente un momento cinético orbital par (que coincide con el momento cinético total),
y sus estados son pares. Por consiguiente, la desintegración en cuestión es tan sólo posible a
partir de estados pares del núcleo Be8 con momento cinético total par.
§ 63.
Simetría respecto de las permutaciones
Al considerar un sistema formado por dos partículas solamente, podíamos
afirmar que las funciones de onda de coordenadas de sus estados estacionarios,
cp(r1, r2), deben ser o simétricas o antisimétricas. En cambio, en el caso general
de un sistema formado por un número arbitrario de partículas, las soluciones de la
ecuación de SCHRODINGER (funciones de onda de las coordenadas) no tienen porqué
1
( )
Este método es particularmente útil en cálculos análogos para sistemas con un gran número de
partículas.
Simetría respecto de las permutaciones
251
ser, sin más, simétricas o antisimétricas respecto de la permutación de un par cualquiera de partículas, como sí ocurre para las funciones de onda totales (que incluyen
el factor de spin). Ello se debe a que permutar tan sólo las coordenadas de dos partículas no corresponde aún a su permutación física. La identidad física de las partículas
conduce aquí únicamente a que el hamiltoniano del sistema sea invariante respecto
de una permutación cualquiera de aquéllas y, por lo tanto, si una cierta función
es solución de la ecuación de SCHRODINGER, también serán solución las funciones
que se obtienen a partir de ella mediante permutaciones diferentes de las variables.
Antes de proseguir haremos algunas observaciones acerca de las permutaciones
en general. En un sistema de N partículas son posibles en total N! permutaciones
diferentes. Si imaginamos que las partículas están numeradas, cada permutación
se puede representar mediante una determinada sucesión de los números 1, 2, 3, ...
Cada una de estas sucesiones se puede obtener a partir de la sucesión natural 1,
2, 3, ... mediante permutaciones sucesivas de pares de partículas. La permutación
se llama par o impar según sea par o impar el número de permutaciones de pares.
Designemos por P los operadores de permutación de N partículas e introduzcamos
la cantidad op, igual a + 1 si¡, es una permutación par e igual a - 1 si la permutación
es impar. Si </> es una función simétrica respecto de todas las partículas, se tendrá
Pef,
= cfo,
y si es una función antisimétrica respecto de todas ellas, será
A partir de una función arbitraria <f>(r1, r 2 , ••• , r.v) es posible formar una función
simétrica mediante la operación de simetrización, que se puede escribir así:
cf,sim
= constante X ~
Pq,,
(63.1)
donde Ja suma se extiende a todas las permutaciones posibles. En cambio, la operación que conduce a una función antisimétrica (esta operación se llama a veces alternación) se puede escribir en la forma:
'Pant = constante
X
~
p
8pP<f,.
(63.2)
Volvamos a la cuestión de cómo se comportan las funciones de onda cp de un
sistema de partículas idénticas respecto de las permutaciones (1). El hecho de que el
hamiltoniano del sistema B es simétrico respecto de todas las partículas, significa
matemáticamente que fl conmuta con todos los operadores de permutación P. Sin
embargo, estos operadores no conmutan entre sí, y por ello no pueden reducirse
simultáneamente a la forma diagonal. Esto quiere decir que las funciones de onda cp
( 1)
Desde el punto de vista matemático, el problema consiste en encontrar las representaciones irreducibles del grupo de las permutaciones. Para una exposición detallada de la teoría matemática de los grupos
de permutaciones (de los llamados grupos simétricos), véase: H. WEYL, Gruppentheorie und Quantenmechanik, 1931; D. E. RuTHERFORD, Substitutional Analysis, University Press; Edinburgh, 1949; F. D. MuRNAGHAN, The theory of group representations, Johns Hopkins Press, Baltimore, 1938.
252
Partículas idénticas
no se pueden elegir de manera que cada una de ellas sea simétrica o antisimétrica
con relación a todas las permutaciones binarias por separado (1).
Planteémonos el problema de determinar los tipos posibles de simetría de las
funciones cf,(r1, r 2 , ••• , rN) de Nvariables (o de conjuntos de algunas de tales funciones)
respecto de las permutaciones de las variables. La simetría debe ser tal que « no
pueda ser aumentada », es decir, que toda operación adicional de simetrización
o alternación, al ser aplicada a estas funciones, las reduciría o bien a una combinación
lineal de ellas mismas, o idénticamente a cero.
Conocemos ya dos operaciones que conducen a funciones de máxima simetría:
la simetrización respecto de todas las variables y la alternación respecto de todas las
variables. Estas operaciones se pueden generalizar de la siguiente manera.
Descompongamos el conjunto de las Nvariables r 1, r 2, ... , rN (o, lo que es lo mismo,
el conjunto de los índices 1, 2, 3, ... , N) en filas que contienen N 1, N 2 , ••• elementos
(variables); N 1 +N2 +... = N. Una tal descomposición se puede representar gráficamente por un diagrama (el llamado diagrama de Young), en el cual cada uno
de los números N 1, N 2 , ••• se representa por una fila de varias celdillas (así, en la
fig. 21 se representan los esquemas de las descomposiciones 6+4+4+3+3+1 +1
y 7 + 5 + 5 + 3 + 1 + 1 para N = 22); en cada uno de los cuadrados hay que colocar
uno de los números 1, 2, 3, ... Si se distribuyen las filas en orden de longitudes decrecientes (conforme se ha hecho en la fig. 21), el esquema contendrá no solamente
sucesivas filas horizontales, sino también columnas verticales.
1 1
-
-
1 1
-FIG. 21
Simetricemos la función arbitraria </>(r1, r 2, ... , rN) respecto de las variables que
aparecen en cada una de las filas. Después de esta operación, la alternación se puede
aplicar solamente a las variables que se encuentran en diferentes filas; la alternación
respecto de pares de variables que se encuentran en una misma fila da, claro está,
un resultado idénticamente nulo.
(1) Tan sólo para un sistema de dos partículas se tiene un unico operador de permutación, operador
que se puede reducir a la forma diagonal a la vez que H.
Simetría respecto de las permutaciones
253
Al elegir una variable de cada fila, podemos suponer sin restringir la generalidad
que dicha variable se encuentra en la primern celdilla de cada una (después de
la simetrización, el orden en que se distribuyen las variables entre las diferentes
celdillas de una fila carece de importancia); efectuemos la alternación respecto de
estas variables. Suprimiendo luego la primera columna, apliquemos la alternación a variables elegidas una en cada una de las filas del diagrama así « acortado >>; al hacerlo. podemos de nuevo suponer que las variables se encuentran
en las primeras celdillas de las filas «acortadas». Iterando este proceso, llegamos
a una función simetrizada primero respecto de las variables de cada fila, y sometida
luego a alternación respecto de las variables de cada columna (después de la alternación, la función, claro está, en general deja de ser simétrica respecto de las variables de cada fila; el carácter simétrico se conserva solamente con relación a las
variables que se encuentran en las celdillas de la primera fila que sobres,alen de las
restantes filas).
Distribuyendo las N variables de diferentes maneras según las filas del diagrama
de Y oung (la distribución entre las celdillas de cada fila carece de importancia),
obtenemos una sucesión de funciones que en una permutación arbitraria de las variables se transforman linealmente entre sí (1). Sin embargo, es necesario subrayar que
no todas estas funciones son linealmente independientes; el número de funciones
independientes es, en general, menor que el número .de distribuciones posibles de las
variables entre las filas del diagrama; no nos detendremos aquí en los pormenores (2).
De esta manera, cada diagrama de Young determina un cierto tipo de simetría
de las funciones respecto de las permutaciones. Formando todos los diagramas de
Young posibles (para un N dado), encontramos todos los tipos posibles de simetría.
El problema se reduce a descomponer el número N, de todas las maneras posibles,
en suma de sumandos más pequeños, incluyendo también en el número de las descomposiciones posibles el propio número N (así, para N = 4 son posibles las descomposiciones: 4,3+1,2+2,2+ 1+1,1 +l +I + 1).
A cada nivel de energía del sistema se puede hacer corresponder un cierto diagrama de Y oung que determina la simetría de permutación de las correspondientes
soluciones de la ecuación de ScHRODINGER; a cada valor de la energía corresponde,
en general, un cierto número de funciones diferentes que se transforman entre sí
al aplicarles una permutación (3). Sin embargo, es necesario subrayar que este hecho
(1) Sería posible efectuar la simetrización y la alternación en el orden contrario - alternar primero
respecto de las variables de cada columna, y simetrizar luego con relación a las variables de las diferentes
filas. Sin embargo, nada nuevo conseguiríamos con ello, ya que las funciones obtenidas siguiendo uno
y otro método son combinaciones lineales unas de otras.
2
( )
Para el caso de partículas de spin ! , el número de funciones independientes (es decir, la dimensión
de la representación irreducible) se determina en el problema propuesto en este párrafo.
(•) La existencia de esta « degeneración permutativa » está ligada con el hecho de que los operadores
de permutación, que conmutan con el hamiltoniano, no conmutan, en general, entre sí (véase§ 10, pág 34).
254
Partículas idénticas
no significa que exista una degeneración física adicional de los niveles de energía.
Todas estas diferentes funciones de onda de las coordenadas, una vez multiplicadas
por las funciones de spin, conducen a una determinada combinación - la función
de onda total - que cumple la condición de ser simétrica o antisimétrica (según sea
el número de partículas).
Entre los diferentes tipos de simetría existen siempre (para un N dado) dos a los
que corresponden, a cada uno, tan sólo una función. A uno de estos tipos corresponde una función que es simétrica respecto de todas las variables; al otro, una
que es anti simétrica (en el primer caso, el diagrama de Y oung consta de una sola
fila de N celdillas; en el segundo, hay una sola columna).
Pasemos ahora a las funciones de onda de spin x( a 1, a 2 , ••• , ªN ). Sus tipos de
simetría respecto de las permutaciones de las partículas se determinan mediante
los mismos diagramas de Y oung en los que el papel de variables lo representan
ahora las proyecciones de los spins de las partículas. Se plantea la cuestión de qué
diagrama debe corresponder a la función de spin para un diagrama dado de la función de coordenadas. Supongamos primero que las partículas poseen spin entero.
La función de onda total 111 debe ser entonces simétrica respecto de todas las partículas. Para que así sea, la simetría de las funciones de spin y de coordenadas debe
venir determinada por un mismo diagrama de Y oung y la función de onda total tp
se expresa en la forma de ciertas combinaciones bilineales de unas y otras; no nos
detendremos aquí a considerar el problema de cómo construir estas combinaciones.
Supongamos ahora que las partículas poseen spin semientero. La función de
onda total debe entonces ser antisimétrica respecto de todas las partículas. Se puede
demostrar que para ello los diagramas de Young de las funciones de coordenadas
y de spin deben poderse obtener substituyendo las filas del uno por las columnas
del otro, y recíprocamente (dos de estos esquemas se representan, por ejemplo, en
la fig. 21).
Analicemos más detenidamente el caso importante de las partículas con spin !
(por ejemplo, electrones). Cada una de las variables de spin a 1 , a 2 , ... toma aquí
solamente dos valores, ±t. Dado que una función antisimétrica respecto de dos
variables cualesquiera se reduce a cero cuando estas variables poseen valores iguales, es claro que la función x puede ser sometida a alternación solamente respecto
de pares de variables; ya al alternar respecto de tres variables, dos de ellas tendrán,
necesariamente, los mismos valores, de forma que se obtendrá un resultado idénticamente nulo.
Así, pues, para un sistema de electrones los diagramas de Young de las funciones
de spin pueden contener columnas cuya longitud es solamente de una o dos celdillas
(es decir, una o dos filas en total); en cambio, en los diagramas de Young de las
Simetría respecto de las permutaciones
255
funciones de coordenadas, esto mismo vale para la longitud de una fila. El número
de tipos posibles de simetría de permutación para un sistema de N electrones es
igual, por consiguiente, al número de descomposiciones posibles (particiones) del
número Nen suma de unos y doses. Cuando N es par, este número es igual a N/2 + 1
(descomposición en O, 1, ... , N/2 doses), y cuando N es impar, es igual a (N+l)/2
(descomposición en O, 1, ... , (N - 1)/2 doses). Así, por ejemplo, en la fig. 22 se representan los posibles diagramas de Young (de coordenadas y de spin) para N = 4.
Es fácil ver que cada uno de estos tipos de simetría (es decir, cada uno de los
diagramas de Y oung) corresponde a un determinado spin total S del sistema de
electrones. Consideraremos las funciones de spin en su forma espinorial, es decir,
en la forma de un espinor
de orden N, cuyos índices (cada uno de los cuales
corresponde al spin de una sola partícula) serán las variables que se distribuirán
entre las celdillas de los diagramas de Y oung. Consideremos un diagrama de Y oung
de spin constituido por dos filas, que contienen N 1 y N 2 celdillas, respectivamente
(N1 +N2 = N, N 1 > N 2). En las N 2 primeras columnas se tienen en cada una dos
celdillas y el espinor debe ser antisimétrico respecto de los correspondientes pares
de índices. En cambio, respecto de los índices que se encuentran en las n = N 1 - N2
últimas celdillas de la primera fila, el espinor debe ser simétrico. Pero, conforme
sabemos, un espinor de orden N de este tipo se reduce a un espinor simétrico de orden
n, al que corresponde un spin total S = n/2. Volviendo a los diagramas de Y oung
de las funciones de coordenadas, podemos decir que un diagrama con n filas que
contienen una celdilla cada una, corresponde a un estado con spin total S = n/2.
Cuando N es par, el spin total puede tener los valores enteros comprendidos entre
cero y N/2, y cuando N es impar, los valores semienteros entre ! y N/2, como debía
ser.
i1.µ ...
Subrayemos que esta correspondencia unívoca entre los diagramas de Young
y el spin total vale solamente para los sistemas de partículas de spin 4 ; que así es
lo comprobamos ya en el párrafo anterior para el caso de un sistema con sólo dos
partículas (1).
(1) En la nota de la pág. 70 se señaló que para un sistema de varias partículas idénticas es imposible
afirmar que la función de onda correspondiente al estado estacionario de energía mínima carece de nodos.
Podemos ahora precisar esta observación y aclarar su origen.
Una función de onda (se trata de la función de coordenadas) que no posee nodos, debe ser necesariamente simétrica respecto de todas las partículas; si fuese antisimétrica respecto de la permutación de un
par cualquiera de partículas 1, 2, se anularía para r 1 = r 2 • Pero si el sistema consta de tres o más electrones,
una función de onda de coordenadas completamente simétrica es inadmisible (en un diagrama de Young
de la función de coordenadas, ninguna fila puede contener más de dos celdillas).
Así, pues, aunque la solución de la ecuación de ScHRODINGER que corresponde al valor propio mínimo
carece de nodos (de acuerdo con el teorema del cálculo de variaciones), esta solución puede resultar físicamente inadmisible; al estado normal del sistema no corresponderá entonces el menor de los valores
propios de la ecuación de ScHRODINGER, y la función de onda de este estado presentará, en general, nodos.
Para partículas de spin semientero s esta situación se da en los sistemas que contienen más de 2s+ 1
partículas. En cambio, para sistemas formados por bosones, una función de onda de las coordenadas completamente simétrica es siempre posible.
256
Partículas idénticas
S:2
S =1
5:0
FIG. 22
PROBLEMA
Determinar el número de niveles de energía con valores diferentes del spin total S para un
sistema de N partículas de spin i.
Solución.
se211ir de
Un valor dado de la proyección del spin total del sistema M s
f(Ms)
=
=
kO' se puede con-
N!/(iN+Ms)!(}N-Ms)!
maneras (igual al número de combinaciones de orden N/2+Ms de N elementos; a N/2+Ms
partículas atribuimos a = t, a las restantes, a = - -! ). A cada nivel de energía con el valor dado
del spin S corresponden 2S + 1 estados con valores M s = S, S - 1, ... , - S de la proyección
del spin. Se comprende fácilmente, por el1o, que el número de niveles de energía diferentes con
el valor dado S es igual a
n(S)
El número total n
= f(S)-f(S+ 1) = N! (28+ 1)/(!N+S+ 1)! (!N-S)t
= kn(S)
s
de niveles de energía distintos es igual a
n = Z n(S) = f(O) = N!/fü-N)!]2
s
para N par, o bien
n =
f (!)
=
N!/(}N+!)! (!N-!)!
para N impar.
§ 64.
Segunda cuantificación. Estadística de Hose
En el estudio mecánico cuántico de los sistemas constituidos por un número
muy grande de partículas idénticas que interactúan arbitrariamente, resulta útil
un método particular de análisis conocido por el nombre de segunda cuantificación.
Este método es absolutamente necesario en la teoría relativista, en la que se estudian
Segunda cuantificación. Estadística de Bose
257
sistemas en los que el propio número de partículas es una variable (1). Consideremos
primero sistemas de partículas que obedecen a la estadística de Bose.
Designemos por tpi(;), tpl;), ... un sistema completo, cualquiera, de funciones
de onda ortogonales y normalizadas. Estas funciones pueden corresponder, por
ejemplo, a los estados estacionarios de una sola partícula en un cierto campo exterior.
Hay que subrayar que la elección de este campo es arbitraria y no tiene por qué
coincidir necesariamente con el campo real en el que se encuentran las partículas
del sistema físico estudiado. Como en el § 61, ~ representa el conjunto de las coordenadas y de la proyección del spin a de una partícula.
Consideremos de una manera puramente formal un sistema de N partículas
que no interactúan entre sí y que se encuentran en el campo que hemos elegido.
Cada partícula se halla entonces en uno de los estados tp1 , tp2 , ••• Sea N 1 el número
de partículas que se encuentran en el estado 'Pi· Este número, claro está, puede ser
igual a cero. Dar los números N 1, N 2 , ••• (es evidente que "i:.N¡ == N) determina un
estado del sistema en conjunto; lo representaremos mediante subíndices en la,función de onda del sistema 'Y N.N•...• Se trata de construir un formalismo matemático
en el que los números de ocupación de los estados, N 1, N 2 , ... (y no las coordenadas
de las partículas) representen el papel de variables independientes.
La función 'YNi N es la suma simetrizada (las partículas obedecen a la estadística de Bose) de productos de las funciones tp¡. Escribámosla en la forma:
2
•••
(64.1)
Pi, p 2, ••• , p N son aquí los números que fijan los estados en los que se encuentran
las diferentes partículas, y la suma se extiende a todas las permutaciones de los
índices Pi, p 2 , ••• , PN· Los números N¡ indican cuántos de los índices Pi, p 2 , ••• , PN
poseen los valores dados i. El número total de términos enJa suma (64.1) es igual,
evidentemente, a
Nf/N1!N2! ....
El factor constante en (64.I) se ha elegido de manera que la función resulte normalizada (en virtud de la ortogonalidad de las funciones tp¡, en la integración (2) del
cuadrado l'Y[N1N2 •••2 respecto de ; 1, ; 2, ••• , ;N se anulan todos los términos con la
única excepción de los cuadrados de los módulos de cada uno de los términos de
la suma).
1
( )
El método de la segunda cuantificación fue desarrollado por DIRAC en el caso de partículas que
obedecen a la estadística de Bose (1927) y extendido luego por E. W1GNER y P. JoRDAN (1928) a las partículas de Fermi.
2
( )
Por integración respecto de ~ convenimos en entender la integración respecto de las coordenadas
junto con la suma respecto de a.
258
Partículas idénticas
Sea ahora J<1 >ª el operador de una magnitud física cualquiera correspondiente
a la a-ésima partícula, es decir, este operador se aplica solamente a funciones de
~a· Introduzcamos el operador, simétrico respecto de todas las partículas,
fl'(l}
= ~/<1>a,
(64.2)
(la suma se extiende a todas las partículas) y determinemos sus elementos de matriz
respecto de las funciones de onda (64.1). Es fácil ver, ante todo, que los elementos
de matriz serán diferentes de cero únicamente para las transiciones en las que no
varían los números N 1, N 2 , ... (elementos diagonales) y para las transiciones en las
que uno de estos números aumenta en una unidad a la vez que otro disminuye en
una unidad. En efecto~ dado que cada uno de los operadores J <1 >a actúa solamente
sobre una función en el pr:oducto t/JpJt1)t/ip (t2) ••• t/ip/tN), sus elementos de matriz
pueden ser diferentes de cero tan sólo para las transiciones en las que varía el estado
de una única partícula; pero esto significa que el número de partículas que se encuentran en un estado disminuye en una unidad y las que se encuemran en otro aumenta
asimismo en una unidad. El cálculo de estos elementos de matriz es en esencia muy
simple; es más fácil realizarlo uno mismo, que seguir su explicación. Por ello presentaremos solamente el resultado. Los elementos no diagonales son iguales a
1
(64.3)
Indicamos únicamente lo~ índices respecto de los cuales el elemento de matriz no
es diagonal, prescindiendo de los restantes para abreviar. J;_k(I) es aquí el elemento
de matriz
(64.4)
No hay que perder de vista que los operadores/ <1 >ªdifieren tan sólo en las variables
a que se aplican, por lo que las integrales /¡ 1_{1) no dependen del índice a. Los elementos de matriz diagonales de p(l) son los valores medios d@ la magnitud p(U en
los estados 'Y N,N 2••• • El cálculo da:
(64.5)
Introduzcamos ahora los operadores ái, fundamentales en el método de segunda
cuantificación, operadores que se aplican no ya a las funciones de las coordenadas,
sino a las variables N 1 , N2 , ... , y que se definen del siguiente modo. La aplicación
del operador oi a la función 'YN,N disminuye el índice Ni en una unidad y a la
vez multiplica la función de onda por Ni:
2
••• ,
V
(64.6)
Cabe decir que el operador ái disminuye en una unidad el número de partículas que
se encuentran en el i-ésimo (se le llama por ello operador de destrucción de las partí-
Segunda cuantificación. Estadística de Bose
259
culas). Este operador se puede representar en forma de matriz cuyo único elmento
no nulo es
(64.7)
El operador ái +, conjugado del ái, se representa, por definición (véase § 3), por
la matriz cuyos elementos son
es decir,
(64.8)
Esto significa que al aplicarlo a la función 'Y N,N
2
,..,
aumenta Ni en una unidad:
(64.9)
Con otras palabras, el operador ái + aumenta en una unidad el número de partículas
que se encuentra en el i-ésimo estado (por ello se le llama operador de creación
de las partículas).
Al aplicar el producto de operadores ái+ái a la función de onda, el resultado es,
evidentemente, multiplicarla por una constante, conservando todas las variables N 1,
N 2 , ••• : el operador ái disminuye Ni en una unidad y el operador ái + vuelve Ni a su
valor inicial. El producto de las matrices (64.7) y (64.8) prueba, sin más, que ái+ai
se representa, como debía ser, por una matriz diagonal cuyos elementos diagonales
son iguales a Ni. Podemos escribir que
(64.10)
Análogamente, se encuentra que
(64.11)
Por consiguiente, la regla de conmutación de los operadores ái y ái + será la siguiente:
(64.12)
En cuanto a los operadores ái y ák (o ái y ak +) con subíndices i y k distintos, que
actúan sobre diferentes variables (Ni y Nk), conmutan, claro está. entre sí:
(i =I= k).
(64.13)
Partiendo de las propiedades de los operadores ái, ái +, es fácil ver que el operador
fl'Cl) = ~ jCl) .ká .+ák
i,k
i
i
(64.14)
Partículas idénticas
260
coincide con el operador (64.2). En efecto, todo& los elementos de matriz calculados
mediante (64.7), (64.8) coinciden con los elementos (64.3), (64.5). Este resultado es
muy importante. En la fórmula (64.14) las cantidadesfik(l) son simplemente números.
De esta manera hemos conseguido expresar un operador ordinario (hasta ahora
solamente de la forma (64.2)), que actúa sobre funciones de las coordenadas, como
operador que actúa sobre funciones de las nuevas variables - los números de ocupación Ni (1).
El resultado obtenido se generaliza fácilmente a operadores de otro tipo. Sea
fl'(2)
=
~ j(2>ab,
a>b
(64.15)
donde J <2 >ab es el operador de una magnitud física que se refiere de modo inmediato
a un par de partículas, por lo que actúa sobre una función de;ª y ;b. Cálculos análogos demuestran que un tal operador se puede expresar en función de los operadores ái, ái + mediante la igualdad
ftc2> =
1 ~
1" i,k,l,m
(jC2))iká,+á
lm •
k+á m á z,
(64.16)
donde
Las matrices calculadas para (64.15) y (64.16) coinciden. La generalización de esras
fórmulas a operadores de cualquier otro tipo simétricos respecto de todas las partícu]as (por ejemplo, de la forma.P<3 > = ~ J<3 >abc' etc.) es obvia.
Finalmente nos queda por expresar en función de los operadores ái el hamiltoniano H del sistema físico realmente estudiado y constituido por N partículas
idénticas en interacción mútua. El operador fI, claro está, es simétrico respecto
de todas las partículas. En la aproximación no relativista (2), no depende de sus
spins y se puede representar en forma general de la siguiente manera:
(64.17)
1
( )
La fórmula (64.14) es análoga a la expresión (11-1)
para el valor medio de una magnitud f, expresado en función de los coeficientes ai del desarroilo de la
función de onda del estado dado en funciones de onda de los estados estacionarios. Con este hecho está
ligado el nombre de segunda cuantificación aplicado al método expuesto.
(
2
)
Cuando no existe campo magnético.
Segunda cuantificación. Estadística de Bose
261
1l<1 >ª es aquí la parte del hamiltoniano que depende de las coordenadas de una sola
partícula (la a-ésima) :
(64.18)
donde u<1 )(ra) es la energía potencial de una partícula en el campo exterior. Los
demás términos de (64.17) corresponden a la energía de interacción mútua, habiendo
separado, por comodidad, unos de otros los términos que dependen de las coordenadas de 2, de 3, etc., partículas, respectivamente.
La representación del hamiltoniano en esta forma permite aplicar directamente
las fórmulas (64.14), (64.16) y las demás análogas a ellas. Así, pues,
(64.19)
Con esto hemos conseguido hallar la expresión buscada del hamiltoniano en forma
de operador que actúa sobre una función de los números de ocupación.
Para un sistema de partículas que no interactúan entre sí, en la expresión (64.19)
queda sólo el primer término:
ll
= l: ¡¡o.>,ká,+ák.
i,k
Si como funciones 'lfi se eligen las funciones propias del hamiltoniano 0<1 > de una
sola partícula, la matriz Hik< 1> es diagonal y sus elementos diagonales son los valores
~propios de la energía de la partícula, Ei· De esta manera
n=
~
Eiá/ái;
1,
substituyendo el operador ái+á¡ por sus valores propios (64.10), obtenemos para los
niveles de energía del sistema la expresión
E=~
f:iNi,
1,
- resultado trivial, que es precisamente el que debía obtenerse.
El formalismo desarrollado aquí se puede presentar en una forma algo más
compacta, introduciendo los operadores (1)
(64.20)
donde las variables ; se consideran como parámetros. En virtud de lo dicho antes
acerca de los operadores á¡, ái + es claro que el operador 'Y disminuye en una unidad
el número total de partículas del sistema, mientras que el operador 't+ aumenta
dicho número en una unidad.
(1) Conviene llamar la atención sobre la analogía entre esta expresión y el desarrollo 'f' = La¡'Yi
de una función de onda en funciones propias de un operador (cf. la nota en la pág. anterior).
:262
Partículas idénticas
Es fácil ver que el operador 'l'+(f0 } crea una partícula que se encuentra en el
punto ; 0 • En efecto, al aplicar el operador ai + se crea una partícula en el estado cuya
función de onda es v,¡(~). De aquí se sigue que el resultado de la aplicación del operador 'l'+(f0) es crear una partícula en el estado cuya función de onda L1JJ¡*(nw¡(~0},
o, de acuerdo con la fórmula general (5. 12), con la función de onda o(; - ; 0) ( 1),
lo que corresponde a una partícula con valores determinados de las coordenadas
(y del spin).
Las reglas de conmutación para 'Y y 'l'+ se obtienen inmediatamente a partir
de las reglas de conmutación para áh ái +. Es evidente que
(64.21)
además, obtenemos
o bien
(64.22)
Mediante nuestros nuevos operadores, la expresión (64.14) del operador (64.2)
se escribe en la forma:
(64.23)
Se supone aquí que el operador /<1) actúa en '1"( f). sobre funciones de los parámetros~.
En efecto, substituyendo (64.20), tenemos:
L /Cl) i'ká,+ák ,
i,k
que coincide con (64.14). Análogamente, en vez de (64.16) tendremos:
(64.24)
En particular, a una magnitud físicaf(~), que es función sólo de las~' corresponde
un operador (64.23) que en este caso se puede escribir en la forma:
f /(f)'Y+(f)'P(g) df.
Vemos así que 'l'+(f)'Y(t) dg es el operador del número de partículas que se encuentran en el intervalo d.;.
(1)
Se conviene en que o(~ -~o) representa el producto
Segunda cuantificación. Estadística de Fermi
Una vez expresado en función de los operadores 11",
en la forma
263
11"+, el operador H se escribe
(64.25)
Hemos utilizado aquí la expresión (64.18) para _f/(1), y se ha integrado por partes
(respecto de las coordenadas) el término que contiene el laplaciano.
La fórmula (64.25) puede hacerse más intuitiva si se observa lo siguiente. Supongamos que tenemos un sistema de partículas cada una de_ las cuales se describe
(en un instante dado) por una misma función de onda "P(~), que supondremos normalizada de manera que f 1"11 2
= N. Entonces, como se ve inmediatamente, si
en la expresión (64.25) substituimos el operador 4· por la función 1p, esta expresión
pasa a ser la energía media del sistema en el estado considerado. Esta circunstancia
conduce a la siguiente regla para determinar el hamiltoniano en el formalismo de
segunda cuantificación. Se escribe la expresión correspondiente a la energía media
en función de la función de onda de una partícula individual (normalizada del modo
indicado), y se substituye luego esta última por el operador 'Í\ debiendo además
escribir los operadores conjugados 11"+ a la izquierda de los operadores 11".
de
Si el sistema está constituido por bosones de especie diferente, en el método
de segunda cuantificación deben introducirse para cada especie de partículas los
correspondientes operadores á, á+ ó 11", 11"+ En este caso, evidentemente, los operadores que se refieren a especies distintas de partículas conmutan entre sí.
§ 65.
Segunda cuantificación. Caso de la estadística de Fermi
Todos los rasgos fundamentales del método de segunda cuantificación se conservan invariables al pasar a sistemas constituidos por fermiones idénticos. Sin embargo, cambian, naturalmente, las fórmulas concretas relativas a los elementos
de matriz de las distintas magnitudes y a los operadores ái.
La función de onda 'YN,N
2
•••
tiene ahora la forma (61.2):
,¡,,,l (f1)
'P111 U2)
'P1>1 (fN)
(65.1)
264
Partículas idénticas
Ligada con el carácter antisimétrico de esta función, se plantea ante todo la
cuestión de elegir su signo. En el caso de la estadística de Bose no se planteaba este
problema, ya que, en virtud del carácter simétrico de la función de onda, una vez
elegido su signo éste se conserva en todas las permutaciones de las partículas. Para
hacer del signo de la función (65.1) algo determinado, convendremos en fijarlo de
la siguiente manera. Numeremos, una vez para todas, todos los estados 1Jli mediante
número consecutivos. Una vez hecho esto, las filas del determinante (65.1) se dispondrán siempre de tal manera que sea
P1 <P2 <Pa < ... <PN,
(65.2)
mientras que en las columnas aparecerán funciones de las diferentes variables en el
orden ~1, ~2, ••• S.N, Entre los números Pi, p 2, ••• no puede haber dos iguales, ya que
de haberlos el determinante se anularía. Con otras palabras, los números de ocupación Ni pueden tomar solamente los valores O ó 1.
Consideremos de nuevo un operador de la forma (64.2), 1J'C1> = ~/ <1>ª. Por
las mismas razones que en el § 64, sus elementos de matriz serán diferentes de cero
únicamente para las transiciones sin cambio en los números de ocupación y para
las transiciones en las que uno de ellos (N¡) disminuye en una unidad (pasando a ser
igual a cero, en vez de igual a 1), y otro (Nk) aumenta en una unidad (pasando de
cero a uno). Es fácil hallar que para i < k
(65.3)
Por Ot, Ii designamos aqui los valores Ni
O, Ni
l, y el simbolo í:.(k, l) representa la suma de los números de ocupación para todos los estados desde el k-ésimo
al l-ésimo (1):
l
:E (k, l) = :E Nn,
n=k
Para los elementos diagonales, en cambio, se obtiene la fórmula anterior {64.5)
F(l>; =
"f J< >uN,.
1
(65.4)
Para que el operador P<1 > se pueda representar en la forma (64.14), los operadores ái deben definirse como matrices cuyos elementos son:
(a¡);,
'
= (ai+)o1, = (-1)¡{1, i-1>.
(65.5)
1
1
( )
Cuando i > k, en el exponente de (65.3) hay que escribir Í:.(k+ 1, i-1). Si i
sumas hay que substituirlas por ceros.
k
± 1, estas
Segunda cuantificación. Estadística de Fermi
Multiplicando estas matrices, se encuentra (para k
>
265
i)
o bien
(65.6)
Si, en cambio, i
unidad para N¡
= k, la matriz ái+ái es diagonal y sus elementos son iguales a la
= 1 e iguales a cero para Ni = O; esto se puede expresar en la
forma:
(65.7)
Substituyendo estas expresiones en (64.14), obtenemos en efecto (65.3-4).
Multiplicando á; +, ák en orden contrario, tendremos
o bien
(65.8)
Comparando (65.8) con (65.6), vemos que estas cantidades son de signos opuestos,
es decir, se puede escribir:
(i # k).
Para la matriz diagonal áiái+, encontramos:
(65.9)
Sumando con (65. 7), obtenemos:
Las dos igualdades así obtenidas se pueden escribir en forma de una sola igualdad:
(65.10)
Efectuando cálculos análogos, para los productos á¡ák, se obtienen las relaciones
(65.11)
(en particular, á¡á¡ = O).
Vemos así que los operadores á¡ y d¡ (oák+) con i # k resultan« anticonmutativos », mientras que en el caso de la estadística de Bose conmutaban entre sí. Esta
266
Partículas idénticas
diferencia es completamente natural. En el caso de la estadística de Bose, los operadores á¡ y á,. eran del todo independientes; cada uno de los operadores á¡ actuaba
solamente sobre una variable N¡, y el resultado de su aplicación no dependía de los
valores de los demás números de ocupación. En cambio, en el caso de la estadística
de Fermi, el resultado de aplicar el operador G¡ depende no sólo del propio número
N¡, sino también de los números de ocupación de todos los demás estados anteriores, conforme se ve en la propia definición (65.5). Por ello los efectos de la aplicación
de los operadores distintos á¡, á,. no se pueden considerar como independientes.
Una vez determinadas de esta manera las propiedades de los operadores á¡, á¡ +,
todas las demás fórmulas (64.14-19) conservan completamente su validez. Valen
también las fórmulas (64.23-25), que expresan los operadores de las magnitudes
físicas en función de los operadores 'l"(t),'tr+(g) definidos por (64.20). En cambio,
las reglas de conmutación (64.21-22) se substituyen ahora, evidentemente, por las
igualdades
'Y+(fl'Y([)+ 'Y(fl'Y+(f) = 8([-g'),
'l"(f)'Y(t)+ 'Y(g)'Y(r)
=
O.
(65.12)
Si el sistema está formado por partículas de diferente especie, para cada especie
de partículas deben introducirse los correspondientes operadores de segunda cuantificación (como se señaló ya al final del párrafo anterior). Los operadores que se
refieren a bosones y a fermiones conmutan entre sí. En lo que concierne a los operadores que corresponden a diferentes fermiones, dentro de los límites de la teoría
no relativista es posible considerarlos formalmente o como operadores que conmutan,
o como operadores que anti conmutan; en ambos supuestos la aplicación del método
de segunda cuantificación conduce a los mismos resultados.
Sin embargo~ con vistas a una ulterior aplicación a la teoría relativista, que admite
las transformaciones de diferentes partículas entre sí, debemos considerar como
anticonmutativos los operadores de creación y de destrucción de fermiones diferentes.
Este hecho resulta evidente si se consideran como partículas « diferentes » dos
estados « internos » distintos de una misma partícula compleja.
CAPÍTULO
X
EL ÁTOMO
§ 66.
Niveles atómicos de energía
En la aproximación no relativista, los estados estacionarios de un átomo se
determinan mediante la ecuación de ScHRODINGER para un sistema de electrones
que se mueven en el campo coulombiano del núcleo y que interactúan eléctricamente
entre sí; en esta ecuación no intervienen en absoluto los operadores de spin de los
electrones. Conforme sabemos, para un sistema de partículas en un campo exterior
central se conserva e1 momento cinético orbital total, L, y también la paridad del
estado. Por ello cada estado estacionario de un átomo se caracterizará por valores
determinados del momento cinético L y por su paridad. Además, las funciones· de
onda de coordenadas de los estados estacionarios de un sistema de partículas idénticas poseen una determinada simetría respecto de las permutaciones. Vimos en el
§ 63 que, para un sistema de electrones, a cada tipo determinado de simetría de
permutación (es decir, a un determinado esquema de Young) corresponde un valor
determinado del spin total del sistema. Por lo tanto, cada estado estacionario del
átomo se caracterizará también por el spin total S de los electrones.
Sin embargo, claro está, el recíproco no es cierto: dar L, S y la paridad no determina aún de manera unívoca la energía del estado.
Un nivel energético con valores dados de S y Les degenerado con relación a las
distintas direcciones posibles de los vectores L y S. El orden de degeneración respecto
de estas últimas es igual, a 2L + 1 y 2S + 1, respectivamente. El orden de degeneración del nivel con L y S dados es igual, por consiguiente, al producto (2L+ 1) (2S + 1).
Con todo, siempre existe, en realidad, una cierta interacción electromagnética
relativista de los electrones, interacción que depende también de sus spins. Esta
interacción conduce a que la energía del átomo dependa no sólo de los valores absolutos de los vectores del momento cinético orbital y del spin, sino también de su
posición relativa. Rigurosamente hablando, si se tienen en cuenta los términos
relativistas en el operador de Hamilton, éste ya no conmuta con los operadores
L y S, es decir, el momento cinético orbital y el de spin no se conservan por separado.
268
El átomo
Solamente se conserva el momento cinético total, J = L+S. La conservación del
momento cinético total es una ley exacta que resulta directamente de la isotropía
del espacio con relación a un sistema aislado. Debido a ello, los niveles de energía
deben caracterizarse por los valores J del momento cinético total.
Sin embargo, si los efectos relativistas son relativamente pequeños (como ocurre
en muchos casos), es posible tenerlos en cuenta considerándolos como una perturbación. Bajo la acción de ésta, un nivel con valores dados de L y S y degeneración
de orden (2L+ 1) (2S + 1) se « desdobla» en una serie de diferentes niveles (próximos
entre sí) que difieren en los valores del momento cinético total J. Estos niveles vienen
determinados (en primera aproximación) por la correspondiente ecuación secular
(§ 39) y sus funciones de onda (en la aproximación de orden cero) son ciertas combinaciones lineales de las funciones de onda del nivel degenerado de partida con
valores dados de L y S. Por consiguiente, en esta aproximación es posible considerar,
al igual que antes, los valores absolutos del momento cinético orbital y del spin
(pero no sus direcciones) como magnitudes que se conservan y caracterizar los
niveles también por los valores L y S.
De esta manera, como resultado de los efectos relativistas, un nivel con valores
dados L y S se descompone en una serie de niveles con diferentes valores J. Este
desdoblamiento se llama estructura fina (o desdoblamiento multiplete) del nivel.
Conforme sabemos, J toma todos los valores entre L+S y jL - s¡; por ello un nivel
con valores dados L y S se desdobla en 2S+l (si L > S) o 2L+1 (si L < S) niveles
diferentes. Cada uno de estos niveles es degenerado respecto de las direcciones del
vector J; el orden de esta degeneración es igual a 2J + l. Es fácil comprobar que
la suma de los números 2J + 1, con todos los valores posibles de J, es igual, como
debe ser, a (2L+l) (2S+l).
Los niveles atómicos de energía (o también, los términos espectrales de los átomos) se suelen designar por símbolos análogos a los que se utilizan para designar
los estados de las partículas individuales con valores determinados del momento
cinético (§ 32). Así, los estados con valores distintos del momento cinético orbital
L se representan por letras mayúsculas del alfabeto latino de acuerdo con la siguiente
correspondencia:
L = O 1 2. 3 4
5 6 7 8 9 10
SPDFGHIKLMN
A la izquierda y en la parte superior de un símbolo, se indica el número 2S + 1,
llamado multiplicidad del término (es necesario, sin embargo, no perder de vista
que este número determina el número de componentes de la estructura fina del
nivel tan sólo cuando L 2 S). A la derecha y en la parte inferior, se indica el valor
del momento cinético total J. Así, los símbolos 2P 112 , 2P 3, 2 representan niveles con
L=1,S=i,J=t,t
Estado.'> de los electrones en un átomo
§ 67.
269
Estados de los electrones en un átomo
Un átomo con más de un electron es un sistema compuesto de electrones en
interacción mútua que se mueven en el campo del núcleo. Para un sistema de esta
naturaleza, rigurosamente hablando, es sólo posible considerar los estados del
sistema como un todo. A pesar de ello, el hecho es que en un átcmo es posible, con
buena precisión, introducir el concepto de estados de cada uno de los electrones
por separado en el sentido de estados estacionarios del movimiento de un electrón
en un cierto campo central efectivo creado por el núcleo y todos los demás electrones.
Para diferentes electrones en un átomo estos campos, en general, son diferentes,
y deben determinarse todos a la vez, ya que cada uno de ellos depende de los estados
de todos los demás electrones. Este campo se llama campo autoconsistente (véase
§ 69).
Dado que el campo autoconsistente es un campo central, cada estado de un
electrón se caracteriza por un valor determinado de su momento cinético orbital l.
Los estados de un electrón individual, para l dado, se numeran (en el orden de las
energías crecientes) mediante el número cuántico principal n, que toma los valores
n = l + 1, l + 2, ... ; esta manera de elegir el orden de numeración está de acuerdo
con la adoptada para el átomo de hidrógeno. Hay que hacer notar, sin embargo,
que el orden de crecimiento de los niveles de energía asociado. con los diferentes
valores de /, difiere, en general, en los átomos complejos del que encontramos en
el átomo de hidrógeno. En este último las energías no dependen de /, de forma que
los estados con valores mayores den poseen siempre una energía mayor. En cambio,
en los átomos complejos, un nivel, por ejemplo, con n = 5, l = O se encuentra por
debajo del nivel con n = 4, l = 2 (para más detalles, véase el§ 73).
Los estados de los electrones individuales con diferentes valores n y l se suelen
designar mediante un símbolo formado por una cifra, que indica el valor del número
cuántico principal, y una letra, que indica el valor de l (1). Así, 4d representa el estado
con n = 4, l = 2. Una descripción completa del estado de un átomo exige, junto con
la indicación de los valores de L, S y J, la enumeración de los estados de todos los
electrones. Así, el símbolo ls 2p 3P 0 representa el estado de un átomo de helio en
el que L = 1, S = 1, J = O y los dos electrones se encuentran en los estados ls y 2p.
Si algunos electrones se encuentran en estados con iguales valores de l y n, se simplifica la notación indicando este hecho con un exponente; así 3p2 representa dos
electrones en estados 3p. Una distribución de los electrones en un átomo entre
estados con diferentes valores /, n se llama configuración electrónica.
Para valores dados de n y !, el electrón puede poseer valores distintos de las
proyecciones del momento cinético orbital (m) y de spin (a) respecto del eje z. Para l
1
( )
n
=
También se emplea la terminología en la que de los electrones con números cuánticos principales
l, 2, 3, ... se dice que son electrones de las capas K, L, M, ... , respectivamente (véase § 74).
270
El átomo
dado, m toma 21 + 1 valores; el número a, en cambio, queda limitado a los dos valores ± t. Por lo tanto, se tienen en total 2(2/ +1) estados diferentes con los mismos n,
/; estos estados se llaman equivalentes. En cada uno de ellos se puede encontrar, de
acuerdo con el principio de PAULI, un solo electrón. Así, pues, en un átomo pueden
tener a la vez iguales valores de n y l no más de 2(2/ + 1) electrones. Del conjunto de
electrones que ocupan todos los estados con n, l dados se dice que constituye una
capa cerrada (o completa) del tipo considerado.
La diferencia en energía de los niveles atómicos a los que corresponden valores
L, S distintos, pero una misma configuración electrónica (1), se debe a la interacción
electrostática de los electrones. Dicha diferencia es, de ordinario, relativamente
pequeña - varias veces menor que la distancia entre niveles correspondientes a configuraciones distintas. Acerca de la distribución relativa de niveles de una misma
configuración, pero con valores L, S distintos, existe la siguiente regla establecida
empíricamente (regla de Hund):
La mínima energía la posee el término con el máximo valor posible S para la
configuración electrónica dada y el mayor valor de L (posible para este S) (2).
Veamos cómo se pueden hallar los términos atómicos posibles para una configuración electrónica dada. Si los electrones no son equivalentes, la determinación
de los valores L, S posibles se efectúa directamente aplicando la regla de composición de momentos. Así, por ejemplo, para la configuración np, n'p (con n, n' distintos) el momento cinético orbital L puede tomar los valores, 2, 1, O, y el spin total S
es S = O, 1; combinándolos entre sí, obtenernos los términos 1 •3 S, 1 •3P, 1 ·ªD.
Pero si se trata de electrones equivalentes, nos encontrarnos con limitaciones
impuestas por el principio de PAULI. Consideremos, por ejemplo, una configuración
de tres electrones-p equivalentes. Cuando l = 1 (estado-p), la proyección m del
momento cinético orbital puede tener los valores m = 1, O, - 1, de forma que son
posibles seis estados con los siguientes pares de índices m, a:
(a) 1, !
(a') 1,
-!
(b) O, l
(b') O,
-!
(e) -1, !
(e') -1,
-f.
Los tres electrones se pueden distribuir en tres cualesquiera de estos estados, uno
en cada uno. Obtenernos así los estados del átomo con los siguientes valores de las
Prescindimos aquí de la estructura fina de cada nivel multiplete.
La condición de que S sea máximo se puede justificar de la siguiente manera. Consideremos. por
ejemplo, un sistema de dos electrones. En este caso, puede ser S = O ó S = 1, correspondiendo al spin 1
una función de onda de coordenadas antisimétrica f(ri, r 2). Para r 1 = r 2 esta función se anula idénticamente; con otras palabras, ·en el estado con S = I la probabilidad de encontrar ambos electrones cerca
e! ui:io del otro es pequeña. Esto conduce a una repulsión electrostática relativamente menor, y, por consiguiente, a una energía más baja. Análogamente, en un sistema de varios electrones, al spin máximo
corresponde la función de onda de coordenadas « más antisimétrica ».
(1)
2
( )
271
Estados de lo.i; electrones en un átomo
proyecciones ML = '1:.m, Ms= '1:.cr de los momentos cinéticos orbital y de spin
totales:
(a+a' +b) 2, i
(a+a' +e) 1, i
(a+b+c) O,%
(a+b+b') 1, !
(a+b+c') O, i
(a+b' +e) O,!
(a' +b+c) O,¡.
(podemos dejar de escribir los estados con valores negativos M L, M s porque nada
dan de nuevo). La existencia de un estado con ML = 2, Ms = ! demuestra que
debe tenerse un término 2D; a este término deben corresponder todavía uno de los
estados (1, i) y uno de los (O,
Además, queda aún un estado con (1, t), de forma
que debe tenerse un término 2P; a éste corresponde también uno de los estados con
(O, t). Finalmente, quedan todavía los estados (O, ü y (O, i), que corresponden a un
término 4 S. Así, pues, para la configuración de tres electrones p equivalentes son
posibles tan sólo un término de cada uno de los tipos 2D, 2P, 4S.
n.
TABLA
1
Términos posibles para las configuraciones de electrones equit·alentes
p,ps
pz, P'
Pª
d, d 9
a2,
dª
2p
ap
SD
'-PD
1
'S
zv
1
SDG
d3 , d 1
2PDFGH
d4, d 6
1
ªPF
'PF
2
SDFGl
2 2
d5
2
ZSPDFGHI
ªPDFGH
2
5D
2
'PDFG
6S
3 2 2
En la tabla 1 se dan los términos posibles para diferentes configuraciones de
electrones-p y electrones-d equivalentes. Los números debajo de los símbolos de los
términos indican el número de términos del tipo en cuestión que se tienen para la
configuración dada, si este número es mayor que la unidad. Para la configuración
con el mayor número posible de electrones equivalentes (s 2 , p6 , d 1º, ...) el término
es siempre un término 1 S. Obsérvese la coincidencia del carácter de los términos que
corresponden a dos configuraciones cada una de las cuales posee tantos electrones
cuantos faltan a la otra para llenar una capa. Esto es un resultado evidente de que
la falta de un electrón en una capa se puede considerar como un hueco cuyo estado
El átomo
272
se determina por los mismos números cuánticos que caracterizan el estado del electrón
que falta.
Al aplicar la regla de HUND a la determinación del término normal de un átomo
cuando se conoce la configuración electrónica, hay que considerar únicamente la
capa no completa, ya que los momentos cinéticos de los electrones que se encuentran en las capas cerradas se compensan entre sí. Por ejemplo, supongamos que
fuera de las capas completas de un átomo se tienen cuatro electrones-d. El número
cuántico magnético de un electrón-d puede tomar cinco valores: O, ± 1, ± 2. Por
ello, los cuatro electrones pueden tener la misma proyección del spin a = l, de modo
que el spin entero máximo posible es S = 2. Hay que atribuir luego a los electrones
los diferentes valores del número m que dan el mayor ML = :Em; éstos son 2, 1,
O, - 1, de modo que ML = 2. Esto significa que también es igual a 2 el mayor valor
de L posible para S = 2 (término 5D).
PROBLEMA
Hallar las funciones de onda orbitales de los posibles estados de un sistema de tres electrones-p
equivalentes.
Solución. En el estado 4 S los spins <1 de los tres electrones son iguales y, por consiguiente,
los valores m son distintos. La función de onda viene dada por un determinante 'de la forma (61.2)
formado por las funciones %, tpi, tp_1 (el subíndice indica el valor de m).
Para el término 2D, consideremos el estado con el mayor valor posible ML = 2. En estas condiciones, dos de las proyecciones m deben ser iguales a l, y una, a O. Supongamos que los electrones 2, 3 tengan a = + ! y el electrón 1, a = - ! (de acuerdo con el spin total S = ! ). La correspondiente función de onda orbital que cumple la condición exigida de simetría es
(el número en el argumento de una función indica el número del electrón a que dicha función se
refiere).
Para el término 2P, consideremos el estado con ML = 1 y los mismos valores de las proyecciones del spin de los electrones que en el caso anterior. Este estado se puede construir con dos
sistemas distintos de valores m, de modo que la función de onda orbital viene dada por la combinación lineal
tp = atp-m + bi/;100,
r/s-111 = tp1(1)[r/s-1(2)tp1(3)-i/;-1(3)i/;1~)],
i/;100
= tpo(l )[tft1(2)tfto(3)-,f,1(3),f,o(2) ].
Para determinar los coeficientes utilizaremos la relación
Niveles de energía hidrogenoides
a la que debe satisfacer la función de onda con ML
de matriz (27 .12) encontramos que
=
273
L (véase (27.8)). Mediante los elementos
y, por lo tanto,
l+i/; = y2(a+b)i/;on = O.
De aquí se sigue a+b = O; teniendo también en cuenta la condición de normalización, resulta
a= -b = }.
Las funciones de onda de los estados con M L < L se obtienen a partir de las funciones que
acabamos de· haliar aplicándoles el operador
§ 68.
Niveles de energía hidrogenoides
El único átomo para el que la ecuación de SCHRODINGER se puede resolver exactamente es el más simple de todos los átomos: el átomo de hidrógeno. Los niveles
de energía del átomo de hidrógeno, y también de los iones He+, Li + + , ... , que contienen cada uno tan sólo un electrón, se determinan por la fórmula de BoHR (36.1 O):
E=
1
(68.1)
2li2(l+m/M)
Ze es aquí la carga del núcleo, M su masa y m la masa del electrón. Obsérvese que la
dependencia respecto de la masa del núcleo es muy débil.
La fórmula (68.1) no tiene en cuenta ningún efecto relativista. En esta aproximación, se presenta la degeneración adicional específica del átomo de hidrógeno ( degeneración accidental) de la que ya se habló en el § 36: para un número cuántico
principal n dado, la energía no depende del momento cinético orbital l.
En otros átomos existen estados que por sus propiedades recuerdan los estados
del átomo de hidrógeno. Se trata de estados fuertemente excitados en los que uno
de los electrones posee un gran número cuántico principal y se encuentra, por ello,
prácticamente siempre a grandes distancias del núcleo. El movimiento de un electrón
de este tipo se puede considerar, en una cierta aproximación, como el movimiento
en el campo coulombiano del átomo residual con una carga efectiva igual a la unidad. Los niveles de energía que así se obtienen resultan ser, sin embargo, demasiado inexactos y hay que añadirles una corrección que tenga en cuenta la desviación del campo, a pequeñas distancias, respecto de un campo puramente coulombiano. Es fácil poner de manifiesto el carácter de esta corrección mediante las consideraciones que siguen.
Dado que los estados con números cuánticos grandes son cuasiclásicos, los
274
El átomo
niveles de energía se pueden determinar en este caso mediante las reglas de cuantificación de BoRH-SOMMERFELD (48.6). La desviación del campo respecto del coulombiano a distancias del núcleo que son pequeñas (comparadas con el « radio de
la órbita »), se puede tener en cuenta formalmente modificando la condición de
contorno impuesta a la función de onda para r = O. Esto conduce a cambiar la constante· y en la condición de cuantificación del movimiento radial. Dado que, por lo
demás, esta condición no se modifica, podemos concluir que para los niveles de
energía se obtiene una expresión que difiere de la correspondiente al hidrógeno en
el cambio del número cuántico radial, o, lo que es lo mismo, del número cuántico
principal n, que pasa a ser n + A 1, donde Az es una constante (la llamada corrección
de Rydberg):
E=
me4
(68.2)
La corrección de Rydberg no depende de n (por su propia definición), pero es,
naturalmente, función del número cuántico acimutal I del electrón excitado (que
atribuimos a A en forma de subíndice), y también de los momentos cinéticos L y S
del átomo en conjunto. Para L y S dados, A 1 disminuye rápidamente cuando aumenta
l. Cuanto mayor es /, tanto menos tiempo pasa el electrón cerca del núcleo, y por ello
los niveles de energía deben acercarse tanto más a los del hidrógeno (1).
§ 69.
El campo autoconsistente
La ecuación de ScHRODINGER para los átomos que contienen más de un electrón
no se puede resolver prácticamente de un modo directo, ni tan sólo por métodos
numéricos. Debido a esto cobran valor los métodos aproximados para el cálculo
de las energías y de las funciones de onda de los estados estacionarios de los átomos.
El más importante de estos métodos es el llamado método del campo autoconsistente.
La idea central de este método consiste en que se considera que cada electrón del
átomo se mueve en un campo autoconsistente creado por el núcleo junto con todos
los demás electrones.
Tomemos como ejemplo el átomo de helio limitándonos a aquellos términos
del mismo en los que ambos electrones se encuentran en estados-s (con valores den
(1) Como ejemplo, damos los valores empíricos de la corrección de Rydberg para estados fuertemente
excitados del átomo de helio. El spin total de éste puede tener los valores S = O, 1, y el momento cinético
orbital total L coincide, en los estados considerados, con el momento cinético l del electrón excitado (el
segundo electrón se encuentra en un estado Is). Las correcciones de Rydberg son:
para S = O: Lio = -0.140,
Li1
= +0.012,
para S = 1: ~o= -0.296,
Li 1 =
~2 =
-0.0022;
-0.068, ~ 2 = -0.0029.
275
El campo autoconsistente
iguales o distintos); en estas condiciones, también los estados de todo el átomo
serán estados-S. Sean 1P1(r 1) y 1P2(r 2) las funciones de onda de los electrones; en los
estados s estas funciones dependen solamente de las distancias r 1, r 2 entre los electrones y el núcleo. La función de onda 1P(r1, rJ del átomo como un todo se representa
por el producto simetrizado
(69.1)
o antisimetrizado
(69 2)
de ambas funciones, según se trate de estados con spin total S = O o ·spin total
S = 1 (1). Consideraremos el segundo de estos casos; las funciones "Pi y 1P2 se pueden
suponer entonces ortogonales entre sí (2).
Veamos cómo se puede determinar una función de la forma (69.2) que resulte
ser la mejor aproximación de la función de onda real del átomo. Para ello es natural
partir del principio variacional, considerando en él como funciones admisibles tan
sólo funciones de la forma (69.2) (el método que se expone, fue propuesto por V.
A. FoK, 1930).
Conforme sabemos, es posible obtener la ecuación de
del principio variacional
SCHRODINGER
a partir
con ]a condición suplementaria
(la integración se efectúa respecto de las coordenadas de los dos electrones del
átomo de helio). La variación conduce a la ecuación
(69.3)
de donde, se sigue, para una variación arbitraria de la función de onda tp, la ecuación ordinaria de ScHRODINGER. En cambio, en el método del campo autoconsisLos estados del átomo de helio con S = O se suelen llamar estados de parahelio, y los estados con
l, estados de ortohelio.
2
( )
Las funciones de onda lf'i, lp 2 , ••• de los distintos estados del electrón que se obtienen con el método del campo autoconsistente no son, en general, ortogonales dos a dos, ya que son soluciones no de una
misma ecuación, sino de ecuaciones diferentes. Sin embargo, en (69.2) es posible substituir '1{' 2 por
(1)
S
=
lp/ = lp 2 +const· '1{'1
sin modificar la función 1P del átomo en conjunto; eligiendo la constante de manera adecuada, se puede
siempre conseguir que "Pi y ip/ sean ortogonales entre sí.
276
El átomo
tente se substituye en (69.3) la expresión (69.2) para 1P y la variación se aplica a las
funciones '!/Ji y 1P2 por separado. Con otras palabras, se busca el extremo de la integral con relación a las funciones 1P de la forma (69.2); como resultado se obtiene,
naturalmente, un valor propio de la energía que no es exacto, como tampoco lo es
la función de onda, pero sí la mejor de todas las funciones que se pueden representar
en dicha forma.
El hamiltoniano del átomo de helio se escribe (1):
f1 = f11 +f12 + 1/r12 , f11 = -l6 1 -2/r1 ,
(69.4)
(r12 es la distancia entre los dos electrones). Substituyendo (69.2) en (69.3), efectuando
la variación e igualando a cero los coeficientes de t5 "Pi y t5 i¡,2 en el integrando, obtenemos fácilmente las siguientes ecuaciones:
[!6 +2!r+E-H22 -G2ir)]if,1(r)+[H12 +G12(r)]if, 2(r)
=
O,
[!6 +2/r+E-H11 -G11 (r)]if, 2(r)+ [H12 +G12(r)]if,1 (r)
=
O,
(69.5)
donde
Gair1) =
Hab =
J1fa(r2)1fb(r2) d V2/r12,
J'Pa[-!6-2/r ]if,b d V
(a, b = 1, 2).
(69.6)
Éstas son precisamente las ecuaciones finales a que conduce el método del campo
autoconsistente; "SU solución es sólo posible, claro está, en forma numérica (2).
De manera análoga deben deducirse las ecuaciones en casos más complicados.
La función de onda del átomo que hay que substituir en la integral del principio
variacional se construye como combinación lineal de productos de funciones de onda
de los electrones individuales. Esta combinación debe elegirse tal que, en primer
lugar, su simetría de permutación corresponda al spin total S del estado considerado
del átomo y, en segundo lugar, ha de corresponder al valor dado de su momento
cinético orbital total L.
Al utilizar en el principio variacional una función de onda que posea la simetría
de permutación debida, tenemos con ello en cuenta la interacción de intercambio
de los electrones en el átomo. Se obtienen ecuaciones más sencillas (pero que conducen
(1) En este párrafo y en los problemas que en él se proponen utilizamos unidades atómicas (véase la
nota en la pág. 136).
(2) La comparación de los niveles de energía de los átomos ligeros calculados siguiendo el método del
campo autoconsistente con los datos espectroscópicos permite estimar la precisión del método en un
5 %, aproximadamente.
El campo autoconsistente
277
a resultados menos precisos) si se prescinde de la interacción de intercambio, como
también de la dependencia de la energía del átomo con relación a L para una configuración electrónica dada (D. R. HARTREE, 1928). Tomando de nuevo como ejemplo
el átomo de helio, podemos entonces escribir directamente las ecuaciones para las
funciones de onda de los electrones como ecuaciones ordinarias de ScHRODINGER
(69.7)
en las que Va es la energía potencial de un electrón que se mueve en el campo del
núcleo y en el campo de la carga distribuida del segundo electrón:
(69.8)
(y análogamente para VJ. Para hallar la energía E del átomo, hay que observar
que en la suma E 1 + E 2 se cuenta dos veces la interacción electrostática de los dos
electrones entre sí, ya que dicha interacción interviene en la energía potencial tanto
del primer electrón, V1(r1), como del segundo, Vlr 2 ). Por ello E resulta de la suma
E 1 +E 2 restando una vez el valor medio de dicha interacción, es decir,
(69.9)
Para mejorar los resultados obtenidos mediante este método simplificado, la
interacción de intercambio y la dependencia de la energía respecto de L se pueden
tener luego en cuenta considerándolas como una perturbación.
PROBLEMAS
1. Determinar aproximadamente la energía del nivel fundamental del átomo de helio y de
los iones helioides (un núcleo de carga Z y dos electrones), considerando la interacción entre
electrones como una perturbación.
Solución. En el estado fundamental del ion, ambos electrones se encuentran en estados-s.
El valor no perturbado de la energía es igual al doble (dos electrones) de la energía del nivel fundamental de un ion hidrogenoide:
ECO>=
2c-1z2) = _z2.
La corrección de primer orden viene dada por el valor rtí.edio de la energía de interacción de los
electrones relativa a un estado con función de onda
za
if, = i/ii(r1),P2(r2) = -e-Z(r1+r2>
(1)
1T
(producto de dos funciones hidrogenoides con l
=
O). La manera más fácil de calcular la integral
El átomo
278
es considerarla en la forma
oo
f
r2
:,J
¡;;i.11 = 2 dV2 ·P•
p1dV1,
o
o
dV, = 4""12dr1,
(que es la energía de la distribución de cargas e2 = 111'2 12 en el campo central de la distribución
= 111'1 12 ; el integrando de la integral respecto de V 2 es la energía de la carga Qir 2) en el campo
de la esfera r1 < r 2 ; el factor 2 ante la integral tiene en cuenta la contribución de las configuraciones
en las que r 1 > r 2). Obtenemos así E(1l = 5Z/8 y, finalmente,
e1
Para el átomo de helio (Z = 2) esta fórmula da - E= 11/4 = 2,75 (el valor real de la energía
del estado fundamental de este átomo es, en cambio, - E= 2,90 u.a. = 78,9 eV).
2. Resolver el mismo problema aplicando el principio variacional y aproximando la función
de onda mediante un producto de dos funciones hidrogenoideas con una cierta carga efectiva del
núcleo.
Solución.
Calculemos la integral
Z
Z
1
lJ = -!(61 + 62)----+r1
r2
r12
con la función 11' dada por la expresión (1) del problema anterior, y escribiendo en ella Zet en vez
de Z. La integral de 1P2/r12 se calcula como en el problema 1 ; la integral de 1jJÍl 11P se puede reducir
a la integral 11'2/ri, observando que, en virtud de la ecuación de Schrodinger,
El resultado que se obtiene es:
Esta expresión, como función de Zet, presenta un mínimo para Zet
=
Z -
t
6
. El correspondiente
valor de la energía es:
E= -(Z - ¡56)2.
Para el átomo de helio esta igualdad da - E
=
2,85.
Hay que hacer notar que la función de onda (1) con el valor hallado para Zet es efectivamente
la mejor, no sólo de todas las funciones de la forma (1), sino también de todas las funciones que
dependen solamente de la suma r 1 +r 2 •
Ecuación de Thomas-Fermi
§ 70.
279
Ecuación de Thomas-Fermi
Los cálculos numéricos de la distribución de carga y del campo en un átomo
siguiendo el método del campo autoconsistente son extraordinariamente engorrosos,
en particular para átomos complejos. Pero precisamente para estos átomos existe
otro método aproximado cuyo valor consiste justamente en su simplicidad; verdad
es que conduce a resultados mucho menos buenos que el método del campo autoconsistente.
En la base de este método (E. FERMI y L. THm.tAS, 1927) se encuentra el hecho
de que en los átomos complejos, con un gran número de electrones, la mayoría de
ellos poseen números cuánticos principales relativamente altos. En estas condíciones,
es aplicable la aproximación cuasiclásica. Podemos por ello aplicar a los .estados
de los electrones individuales del átomo el concepto de « celdas en el espacio de las
fases » (§ 48).
El volumen del espacio de las fases que corresponde a los electrones cuyo impulso
es menor que p y que se encuentran en el elemento de volumen d V del espacio físico,
4:rp 3d V
«celdas» (1), es decir,
es igual a i:rp 3 dV. A este volumen corresponden - 3(2 :-r) 3
éste es el número de estados posibles, en los que se pueden encontrar simultáneamente
no más de
Pª
3772
4-rrpª
2--dV =-dV
3
3(277)
electrones (dos electrones en cada «celda», con spins opuestos). En el estado normal del átomo, los electrones que se encuentran en cada elemento de volumen d V,
deben llenar (en el espacio de las fases) las celdas que corresponden a un impulso
desde cero hasta un cierto valor máximo p0 • La energía cinética de los electrones
tendrá entonces, en cada punto, el menor valor posible. Si el número de electrones
en el volumen d V se escribe en la forma n d V (donde n es la densidad de número
de electrones), podemos afirmar que el valor máximo p0 del impulso de los electrones
en cada punto está ligado con n por la relación
Pl/3772
= n.
El valor máximo de la energía cinética de los electrones en un punto en el que 1a
densidad electrónica es n será, por consiguiente:
(70.1)
(1)
En este párrafo utilizamos unidades atómicas.
El átomo
280
Sea ahora <f,(r) el potencial electrostático, que tomamos igual a cero en el infinito.
La energía total del electrón es p2/2 - q>. La energía total de cada electrón debe
ser negativa, evidentemente; de no serlo, el electrón escaparía al infinito. Designemos
el valor máximo de la energía total del electrón en cada punto por - </>0 , donde 'Pu
es una constante positiva (si esta cantidad no fuera constante, los electrones pasarían de los puntos con valor menor de </>0 a puntos con valor mayor de </>0). Así, pues,
podemos escribir:
iPo2
=
c/>-<f,o.
(70.2)
Igualando las expresiones (70.1) y (70.2), obtenemos
n = [2(cf>-ef,0)]ª/2/31r2,
(70.3)
-
relación que liga la densidad electrónica y el potencial en cada punto del átomo.
Para </> = </>0 la densidad n se anula; es evidente que n debe ser igual a cero también en todo dominio en el que </> < </>0 , dominio en que la relación (70.2) conduciría
a una energía cinética máxima negativa. De esta manera la ecuación</> = </>0 determina
el límite del átomo. Pero fuera de una distribución central de cargas cuya carga total
es igual a cero no existe campo. Por ello en la frontera de un átomo neutro debe ser
</> = O. De aquí se sigue que, para un átomo neutro, la constante </>0 debe tomarse
igual a cero. En cambio, para un ion la constante </>0 no es nula.
Consideraremos a continuación un átomo neutro y, de acuerdo con ello, haremos
Según la ecuación electrostática de Poisson, tenemos ~</> = 4nn; substituyendo aquí (70.3), obtenemos la ecuación fundamental de Thomas-Fermi:
'Po e::::: O.
.64>
= (8y2/31r)<f>312•
(70.4)
La distribución del campo en el estado normal de un átomo se determina como
solución, con simetría esférica, de esta ecuación que satisface las siguientes condiciones de contorno: para r -+ O el campo debe reducirse al campo coulombiano del
núcleo, es decir, ha de tenerse </>r -+ Z; parar -+ oo, debe ser lim <f,r = O. Introduciendo en vez de la variable r una nueva variable x definida por
r = xbz-113, b =
Hf17) 2'ª
=
o,885,
(70.5)
y en vez de <p una nueva función incógnita x: (1)
</>(r)
z ( r z1¡3)
=-x - T
b
Z4/3 x(x)
=--,
b
X
(70.6)
obtenemos la ecuación
(70.7)
1
( )
En unidades ordinarias:
cf,(r) = ( Ze/r)x(r Z1/ 3 me2/0,885n 2).
281
Ecuació,1 de Thomas-Fermi
con las condiciones de contorno x = l para x = O y x = O para x = =. Esta ecuación no contiene ya ningún parámetro y determina así una función universal x(x).
En la tabla 2 se dan los valores de esta función obtenidos por integración numérica
de la ecuación (70.7). La función x(x) disminuye con monotonía, anulándose únicaTABLA
2
Valores de la función x(x)
X
0,00
0,02
0,04
0,06
0,08
0.10
0,2
0,3
0,4
0;5
0,6
0.7
0,8
0,9
1,0
1,2
x(x)
X
x(x)
1,000
0,972
0,947
0,924
0,902
0,882
0,793
0,721
0,660
0,607
0,561
0,521
0,485
0,453
0,424
0,374
1,4
1,6
1,8
2,0
2,2
2.4
2,6
2,8
3,0
3,2
3,4
3,6
3,8
4,0
4,5
5,0
0.333
0,298
0,268
0,243
0,221
0,202
0,185
0,170
0,157
0,145
0,134
0,125
0,116
0,108
0,0919
0,0788
X
x(x)
6
7
8
9
10
11
12
13
14
15
20
25
30
40
50
60
0,0594
0,0461
0,0366
0,0296
0,0243
0.0202
0,0171
0,0145
0,0125
0,0108
0,0058
0,0035
0,0023
0,0011
0,00063
0,00039
1
mente en el infinito (1). Con otras palabras, en el modelo de Thomas-Fermi el átomo
carece de fronteras y se extiende formalmente hasta el infinito. El valor de la derivada
x'(x) para x = O es x'(O) = -· 1,59. Por ello, cuando x--* O la función x(x) tiene la
forma x ,. ._., 1 - 1,59x y, de acuerdo con esto, el potencial </>(r) es:
cp(r)
~
Z/r- l,80Z4f3.
(70.8)
El primer término es el potencial del campo del núcleo, el segundo (-l,80me3Z41ª/ñ2
en unidades ordinarias) es el potencial creado por los electrones en el origen de
coordenadas. Substituyendo (70.6) en (70.3), encontramos para la densidad electrónica una expresión de la forma
n = Z2f(rZ1!3/b), f(x) = (32/91T3)(x/x)3!2.
(70.9)
_(1) La ecuacion (70.7) tiene la solución exacta x<x) = 144x-:i, que se anula en el infinito, pero que no
satisface la condición de contorno en x = O. Cabría utilizarla como expresión asintótica de la función
7.(x) para grandes valores de x. Sin embargo, esta expresión da valores más o menos correctos tan sólo
para valores muy grandes de x, mientras que precisamente a grandes distancias la ecuación de ThomasFermi es del todo inaplicable (véase más adelante).
282
El átomo
Vemos así que en el rr:odelo de Thomas-Fermi la distribución de la densidad
de carga presenta la misma fcrma. en los diferentes átomos, representando el papel
de parámetro de longitud característico la cantidad z-113 (en unidades ordinarias:
h2/me 2Z 113 , es decir, el cociente del radio de Bohr por Z 1 ' 3). En particular, si se miden
las distancias en unidades atómicas, las distancias a las que la densidad electrónica
es máxima será la misma para tcdcs los Z. Podemos afirmar, por lo tanto, que la
mayor parte de los electrones en un átomo de número atómico Z se encuentran
a distancias del núcleo que son del orden de z-113 • El cálculo numérico prueba que
la mitad de la carga electrónica total de un átomo se encuentra dentro de una esfera
de radio l ,33Z-1 ' 3 .
Razonamientos análogos demuestran que la velocidad media de los electrones
en un átomo (considerada, en orden de magnitud, como igual a la raíz cuadrada
de la energía) es del orden de z 2 13 _
La ecuación de Thomas-Fermi deja de ser aplicable tanto a distancias del núcleo
demasiado pequeñas, como a distancias demasiado grandes. Su dominio de aplicación, para valores pequeños de r, queda limitado por la desigualdad (49.12); a distancias menores en el campo coulombiano del núcleo, la aproximación cuasiclásica
deja de ser aplicable. Haciendo en (49.12) 'Y. = Z, encontramos como límite inferior
de dichas distancias el valor 1/Z. La aproximación cuasiclásica deja también de ser
aplicable, en núcleos complejos, para grandes valores der. En efecto, es fácil ver que
para r ,.._, la longitud de onda de de Broglie del electrón pasa a ser del orden de esta
misma distancia, de modo que se viola por completo la condición necesaria para
el carácter cuasiclásico. Cabe comprobar que así es estimando el valor de los diferentes términos en las ecuaciones (70.2) y (70.4); por lo demás, el resultado era de
prever, evidentemente, sin cálculo alguno, ya que la ecuación (70.4) no contiene Z.
De esta manera, la aplicabilidad de la ecuación de Thomas-Fermi viene limitada
a un intervalo de distancias grandes respecto de 1/ Z y pequeñas con relación a l.
Sin embargo, en los átomos complejos la mayor parte de los electrones se encuentran
en este intervalo.
Esta última circunstancia significa que· 1a « frontera exterior» del átomo en el
modelo de Thomas-Fermi se encuentra en r ,.._, 1, es decir, las dimensiones de los
átomos no dependen de Z. Junto con ellas resulta ser también independiente de Z
la energía de los electrones exteriores, es decir, el potencial de ionización del átomo (1).
Siguiendo el método de Thomas-Fermi se puede calcular la energía total de
ionización E, es decir, la energía necesaria para separar todos los electrones del
(') Este modelo no refleja, naturalmente, la dependencia periódica de las dimensiones de los átomos
Y de sus potenciales de ioniLación respecto de Z, propiedades que se manifiestan en el sistema periódico
de lm, elementos. Además, los datos empíricos revelan también la existencia de un aumento sistemático,
no despreciable, de las dimensiones del átomo y una disminución de los potenciales de ionización a medida
que aumenta 7.
283
Ecuación de Thomas-Fermi
átomo neutro. Para ello es necesario calcular la energía electrostática de la distribución de Thomas-Fermi que corresponde a las cargas en el átomo; la energía total
que se busca será igual a la mitad de esta energía electrostática, ya que en un sistema
de partículas que interactúan entre sí según la ley de Coulomb, la energía cinética
media es igual (de acuerdo con el teorema del virial) a la mitad de la energía potencial
media cambiada de signo. La dependencia de E respecto de Z se puede determinar
de antemano a partir de sencillas consideraciones: la energía electrostática de Z
electrones en el campo de un núcleo de carga Z y que se encuentran a una distancia
media z-1 13 del mismo, es proporcional a Z · z;z-1 13 = Z 7 13 . El cálculo numérico
conduce al resultado: E= 20,8Z7 / 3 eV. La dependencia con relación a Z concuerda
bien con los datos experimentales; en cambio, el valor empírico del coeficiente se
aproxima a 16.
Hemos señalado ya que los valores no nulos y positivos de la constante cp0 corresponden a átomos ionizados. Si se define la función x por la relación <p - </>0 = Zx/r,
obtenemos para X la anterior ecuación (70.7). Sin embargo, nos deben interesar
ahora no las soluciones que se anulan en el infinito, como ocurre para el átomo
neutro, sino las que se anulan para valores finitos x = x 0 ; tales soluciones existen
para cualquier x 0 • En el punto x = x 0 , la densidad de carga se anula a la vez que X,
pero el potencial se conserva finito. El valor x 0 depende del grado de ionización de la
siguiente manera. Según el teorema de Gauss, la carga total dentro de una esfera
de radio r es igual a
- r 2 ~<p
cr
=
1Z7.(x) ·
x7.'(x). I
·
(La carga total del ion, z, se obtiene si se hace aquí x
se tendrá
=
x 0 ; dado que x(x0 )
=
O,
(70.10)
En la fig. 23 la línea continua de trazo grueso representa la curva x = x(x) para el
átomo neutro y debajo de ella se han trazado dos curvas para iones con diferentes
grados de ionización. La razón z/Z viene representada gráficamente por la longitud
del segmento que determina sobre el eje de ordenadas la tangente a la curva en el
punto x = x 0 •
La ecuación (70.7) tiene también soluciones que no se anulan en ningún punto;
estas soluciones divergen en el infinito. Es posible considerarlas como soluciones
correspondientes a valores negativos de la constante </,0 . En la misma fig. 23 se han
representado dos de tales curvas x = x(x); todas pasan por encima de la curva
que corresponde al átomo neutro. En el punto x = x 1, para el que
(70.11)
la carga total, contemda dentro de la esfera x
< x 1, se anula (gráficamente, este punto
284
El átomo
coincide, claro está, con el punto en el que la tangente a la curva pasa por el origen
de coordenadas). Interrumpiendo la curva en este punto, podemos decir que dicha
curva determina z(x) para un átomo neutro en cuya frontera la densidad de carga
se conserva diferente de cero. Físicamente esta situación corresponde a un átomo
como si dijéramos « comprimido », « encerrado » en un cierto volumen finito
dado (1 ).
1·0
0·8
06
X
02
o
2
3
4
7
5
8
9
10
11
12
)(
FIG. 23
La ecuación de Thomas-Fermi no tiene en cuenta la interacción de intercambio
entre los electrones. los efectos ligados a ella son del orden siguiente de magnitud
respecto de z-·m. Por consiguiente, tener en cuenta la interacción de intercambio
en el método de Thomas-Fermi exige tener a la vez en cuenta todos los efectos de
este orden (2 ).
PROBLEMA
Hallar la relación entre la energía de interacción electrostática de los electrones entre sí y la
energía de su interacción con el núcleo en un átomo neutro, según el modelo de Thomas-Fermí.
Solución. El potencial ef>e del campo creado por los electrones se obtiene restando del potencial total ef, el potencial del núcleo Z/r. Por ello la energía de interacción entre electrones es
Uee =
J<pendV
-!
(1) Esta interpretación puede ser útil en el estudio de la ecuación de estado de la materia sometida
a elevados niveles de compresión.
e) Esto han hecho A. s. KOMPANrlFTS y E. S. PAVLOVSKI. (ZhETF, 31,427, 1956) y D. A. KtRZHNITS
(ZhETF, 32, 115, 1957).
Funciones de onda de los electrones cerca del núcleo
285
(hemos expresado</, en función den de acuerdo con (70.3)). Por otra parte, la energía de interacción
de los electrones con el núcleo Uen y su energía cinética T son iguales a:
Uen=
-zf¿v,
ff
Po
T= 2
¡p2. +rrp2dpd V
o
=3
f
(31r2)2/3
n5/3dV.
10
Comparando estas expresiones con la igualdad ant~rior. obtenemos la relación
Al mismo tiempo, según el teorema del virial (1), para un sistema de cargas que interactúan de
acuerdo con la ley de Coulomb tenemos 2 T = - U = - Ven - Uee·
Encontramos así finalmente:
§ 71.
Funciones de onda de los electrones exteriores cerca del núcleo
Hemos visto (basándonos en el modelo de Thomas-Fermi) que en los átomos
complejos (grandes valores de Z) los electrones exteriores se encuentran esencialmente a distancias r ,_, 1 del núcleo (2). Sin embargo, toda una serie de propiedades
atómicas dependen fundamentalmente de la densidad electrónica cerca del núcleo
(encontraremos tales propiedades en los §§ 72 y 120). Para determinar el orden
de magnitud de esta densidad, veamos cómo varía la función de onda de un electrón
en el átomo, l/'(r), al variar r desde grandes distancias (r ,..._, 1) a distancias pequeñas.
En la región r ,_, 1 el campo del núcleo está apantallado por los restantes electrones, de forma que la energía potencial U(r) ,_, 1/r ,..._, l. La energía del nivel del
electrón en este campo es E,_, l. En cambio, a distancias que son del orden de magnitud del radio de Bohr en el campo de una carga Z, es r ,..._, I/ Z, y el campo del
núcleo puede considerarse que no está apantallado: U= - Z/r. En la región de
transición, 1/Z ~ r ~ 1, la energía potencial \U\ es ya grande comparada con la
energía del electrón E y se cumple la condición
d ( 1)
dr
(1)
(2)
p
d
"'dr
v
Véase tomo I, Mecánica, § 10.
En este párrafo utilizamos unidades atómicas.
1
~1
U1
I
286
El átomo
(p es el impulso), de modo que el movimiento de aquél es cuasi clásico. La función
de onda cuasiclásica con simetría esférica es tal que
1
1
1tf,(r) 1 " ' - - - -
1
para -~r~l,
ryp rj Ujl/4
Z
(71.1)
y el orden de magnitud del coeficiente en ella (,....,, 1) viene determinado por la condición '1/J ""' 1 de « empalme » con la función de onda para r ,....,, 1.
Aplicando la expresión (71.1) en orden de magnitud parar ""'1/Z (substituyendo
en ella U= - Z/r), obtenemos el valor buscado de la función de onda cerca del
núcleo (1):
tf,(1/Z)- yZ.
(71.2)
De acuerdo con las propiedades generales de las funciones de onda en un campo
central (§ 32), si sigue disminuyendo la distancia, o tp(r) se conserva constante en
orden de magnitud (para un electrón-s), o empieza a decrecer (para l =I= O).
La probabilidad de encontrar el electrón en la región r ·-;; l / Z es;
w- 1tJ, 12,3_, 1¡z2.
(71.3)
Las fórmulas (71.2-3) determinan, claro está, solamente la marcha sistemática
de la variación de las diferentes cantidades al aumentar Z, sin tener en cuenta las
variaciones no sistemáticas que se presentan al pasar de un elemento al siguiente.
~
72.
Estructura fina de los niveles atómicos
El estudio detenido de las interacciones relativistas se realizará más adelante,
en el tomo IV de este curso. Pero algunas propiedades de dichas interacciones las
indicaremos ya aquí.
Los términos relativistas en el hamiltoniano de un átomo se distribuyen en dos
categorías: unos son lineales respecto de Ios operadores de spin de los electrones,
los otros dependen cuadráticamente de dichos operadores. Los primeros corresponden a algo así como una interacción del movimiento orbital de los electrones con sus
spins; es la llamada interacción spin-órhita. Los segundos, en cambio, corresponden
a la interacción entre los spins de los electrones ( interacción spin-spin). Ambas
formas de interacción son del mismo orden (de segundo) respecto de v/c - de la
razón de la velocidad de los electrones a la velocidad de la luz. De hecho, sin embargo,
en los átomos pesados la interacción spin-órbita es considerablemente mayor que la
(')
Para determinar el coeficiente en esta fórmula (cuando se conoce la función de onda en la región
,:S. 1/Z.
r""" 1) sería necesario utilizar la expresión (36.25) en ta región r
Estructura fin.a de los niveles atómico ..,
287
interacción spin-spin. Ello está ligado con el hecho de que la interacción spin-órbita
crece rápidamente al aumentar el número atómico, mientras que la interacción
spin-spin no depende en esencia de Z (véase más adelante).
El operador de interacción spin-órbita tiene la forma:
v',i =
~ A.a • Sa
(72.1)
a
(la suma se extiende a todos los electrones del átomo), donde sa son los operadores
de spin de los electrones y Áa ciertos operadores « orbitales », es decir, operadores
que se aplican a funciones de las coordenadas. En la aproximación del campo autoconsistente, los operadores Áa resultan ser proporcionales a los operadores 10 del
momento cinético orbital de los electrones, y entonces se puede escribir v'8 z en la
forma
(72.2)
Los coeficientes de la suma se expresan en función de la energía potencial U(r) < O
del electrón en el campo autoconsistente de la siguiente manera:
h2
dU(ra)
eta=----
2m2c2ra
dra
Dado que \U(r)\ decrece al alejarnos del núcleo, todas las
(72.3)
IY.a
> O.
Considerando la interacción (72.1) como una perturbación, para calcular la
energía hay que promediar (72.1) respecto de un estado no perturbado. La contribución principal a la misma procede de la región de distancias próximas al núcleo
- distancias que son del orden de magnitud del radio de Bohr ( "'h2/ Zme 2) para
un núcleo de carga Ze. En esta región, el campo del núcleo prácticamente no está
apantallado y la energía potencial es
U(r),...., Ze2/r- z2me4¡ n2,
de modo que
(J."-'
h2U/m2c2r2
,...., Z4(e2/hc)2me4/ñ2.
El valor medio IY. se obtiene de aquí multiplicando por la probabilidad w de encontrar el electrón cerca del núcleo. Según (71.3), es w ~ z-2, de modo que para la
energía de la interacción spin-órbita del electrón obtenemos finalmente
ci,...., ( Ze2
ne
)2 me4
n2 ,
288
El átomo
es decir, dicha energía difiere de Ja energía fundamental del electrón exterior en el
átomo ("' me4ffi2) sólo en el factor (Ze2/fic)2. Este factor crece rápidamente al aumentar el número atómico y en los átomos pesados alcanza valores que son del orden
de magnitud de la unidad.
El promedio del operador (72.1) se realiza de hecho en dos etapas. Ante todo,
se promedia respecto de los estados electrónicos con valores absolutos dados L y S
de los momentos cinéticos totales orbital y de spin, pero no respecto de sus direcciones. Después de este promedio, t>"sz sigue siendo todavía, claro está, un operador,
que representaremos por t>"sL (1). Por razones de simetría, es evidente que los valores
medios sª deben estar dirigidos según S - el único vector de spin que caracteriza
el átomo en conjunto (hay que recordar que, en la aproximación de orden cero,
las funciones de onda se descomponen en productos de una función de spin por
una función de coordenadas). Análogamente, los valores medios iª deben estar
dirigidos según I.. Así, pues, el operador t>"sL tiene la forma:
frsL
= A s.L.
(72.4)
donde A es una constante característica del término dado (no desdoblado), es decir,
una constante que depende de S y L, pero no del momento cinético total J del átomo.
Para calcular la energía de desdoblamiento de un nivel degenerado (con S y L
dados) hay que resolver la ecuación secular formada por los elementos de matriz
del operador (72.4 ). En el presente caso, sin embargo, conocemos ya las funciones
correctas de la aproximación de orden cero, respecto de las cuales la matriz VsL
es diagonal. Éstas son las funciones de onda de los estados con valores dados del
momento cinético total J. Promediar con relación a un tal estado significa substituir
el operador S.L por sus valores propios. que, de acuerdo con la fórmula general
(31.2), son iguales a:
L.S = tl/U+l)-L(L+l)-S(S+l)].
Dado que para todas las componentes del multiplete los valores S y L son los mismos, y que nos interesa solamente su posición relativa, se puede escribir la energía
de desdoblamiento en Ja forma:
!AJ(J+l).
(72.5)
Los intervalos entre dos componentes consecutivas (caracterizadas por los números
1) son iguales, por consiguiente, a
J y J-
!::iEJ,J-1 =
Aj.
(72.6)
Esta fórmula expresa la llamada regla de los intervalos de Landé (1923).
(1) Dicho promedio significa, en esencia, formar las matrices de elementos (nM'LM'si V8 1tnMLMs)
con todos los valores posibles ML, M'L y Ms, M's y diagonales respecto de los demás números cuánticos
(cuyo conjunto designamos por n).
Estructura fina de los niveles atómicos
289
La constante A puede ser tanto positiva como negativa. Cuando A > O, la más
baja de las componentes del nivel multiplete es el nivel con el menor valor posible
de J, es decir, J = [L - s¡; tales multipletes se califican de normales. Si, en cambio,
A < O, el nivel más bajo corresponde a J = L+S (multiplete invertido).
Es fácil determinar el signo de A para los estados normales de los átomos si ta
configuración electrónica es tal que sólo existe una capa incompleta. Si esta capa
está ocupada sólo hasta la mitad como máximo, según la regla de H und (§ 67) los
n electrones que se encuentran en ella tienen todos spins paralelos, de forma que
el spin total tenga el mayor valor posible, S = n/2. Substituyendo en (72.2) sa = S/n
y sacando factor común ::xª (que es la misma para todos los electrones de una misma
capa), obtenemos:
Pú = (rx/2S)S •L,
es decir, A = ::x/2S > O. Si, en cambio, la capa está ocupada hasta más de la mitad,
sumemos y restemos antes de (72.2) la misma suma extendida a los estados vacantes
- a los « huecos » de la capa incompleta. Dado que para una capa totalmente
ocupada sería V.~, = O, el operador Vs 1 se presenta finalmente como suma
Vsz = - ~ ex.a ia.Sa,
extendida tan sólo a los «huecos», siendo el spin y el momento cinético orbital
totales del átomo S = - ~sa, L = - 1:lw De Ja misma manera que antes, obtenemos así A = - ::x!2S, es decir, A < O.
De Jo dicho resulta una simple regla que determina el valor J en el estado normal
de un átomo con una capa no ocupada del todo. Si en esta última se encuentran
no más de la mitad del número máximo de electrones posibles en ella, será J = IL-s¡.
Si, en cambio, la capa está ocupada en más de su mitad, se tiene J = L+S.
Conforme se indicó ya, la interacción spin-spin, a diferencia de la interacción
spin-órbita, no depende esencialmente de Z. Esto es evidente en virtud de su propia
naturaleza - la de una interacción directa de los electrones entre sí que nada tiene
que ver con el campo del núcleo.
Para el operador promediado de la interacción spin-spin debe obtenerse, como
en el caso de la fórmula (72.4), una expresión que es cuadrática respecto de S. Las
expresiones cuadráticas en S son S2 y (S.L) 2 • La primera tiene valores propios que
no dependen de J, por lo que no conduce a un desdoblamiento del término. Podemos
así prescindir de ella y escribir
Vss = B(S.L)2,
(72.7)
donde B es una constante. Los valores propios de este operador contienen términos
que no dependen de J, términos proporcionales a J(J + I ), y, finalmente, términos
290
El átomo
proporcionales a P(J + 1)2. De ellos, los primeros no contribuyen al desdoblamiento
y carecen, por lo tanto, de interés; los segundos pueden incluirse en la expresión
(72.5), lo que equivale simplemente a un cierto cambio de la constante A. Finalmente,
a los terceros corresponde en la energía del término la expresión
(72.8)
El esquema de construcción de los niveles atómicos expuesto en los §§ 66-67
se basa en un modelo en el que los momentos cinéticos orbitales de los electrones se
componen entre sí para dar lugar al momento cinético orbital total L del átomo, y
en el que de la misma manera sus spins forman el spin total S. Como se indicó ya, esta
representación es únicamente posible si se cumple la condición de que los efectos
relativistas sean pequeños; más exactamente, los intervalos de estructura fina deben
ser pequeños respecto de las diferencias entre niveles con valores distintos L, S.
Esta aproximación se llama aproximación de Russe/1-Saunders ; se la llama también
enlace del tipo LS (o acoplamiento LS).
De hecho, sin embargo, el campo de aplicabilidad de esta aproximación es limitado. De acuerdo con' el tipo LS se construyen los niveles de los átomos ligeros,
pero a medida que aumenta el número atómico, las interacciones relativistas en el
átomo se intensifican y la aproximación de Russell-Saunders llega a ser inaplicable (1).
Hay que hacer observar también que esta aproximación es inaplicable, en particular,
a los niveles fuertemente excitados en los que el átomo contiene un electrón en un
estado con un valor de n grande, electrón que, por ello, se encuentra prácticamente
a gran distancia del núcleo (§ 68). La interacción electrostática de este electrón con
el movimiento de los restantes es relativamente débil; en cambio, la interacción
relativista en el « átomo residual » no disminuye.
En el caso límite opuesto, la interacción relativista es grande respecto de la
electrostática (más exactamente, respecto de aquella parte de esta última con la
que está ligada la dependencia de la energía respecto de S y L). Es imposible en este
caso hablar de momento cinético orbital y de spin por separado, ya que ni uno ni
otro se conservan. Los electrones individuales se caracterizan por sus momentos
cinéticos totales j, que se componen para formar el momento cinético total del
átomo J. Este esquema de construcción de los niveles atómicos se llama enloce dt:i
Tipo .ii (o acoplamiento ji). En su aspecto puro, no se encuentra de hecho este tipo
de enlace; entre los niveles de los átomos muy pesados se observan algunas formas
de enlace intermedias entre los tipos LS y jj (2).
(1) Hay que decir, sin embargo. que a pesar de que las fórmulas cuantitativas que describen este tipo
de enlace dejan también entonces de ser aplicables, el propio método de clasificación de los niveles basado
en este esquema puede tener sentido incluso para átomos más pesados, en particular para los estados más
bajos (entre ellos, para el estado normal).
(') Más detalles acerca de los tipos de enlace y del aspecto cuantitativo de la cuestión se pueden ver,
por ejemplo, en: E. U. CoNDON y J. H. SHORTLEY, The theory of atomic sp,:ctm, Cambridge University
Press, 1935.
El sistema periódico de D. l. Mendeleev
291
Un tipo peculiar de enlace se observa en algunos estados fuertemente excitados.
El << átomo residual» puede encontrarse en este caso en un estado Russell-Saunders,
es decir, puede venir caracterizado por los valores de L y de S; en cambio, su acoplamiento con el electrón fuertemente excitado es del tipo ¡¡ (lo que de nuevo está
ligado con el carácter débil de la interacción electrostática para este electrón).
La estructura fina de los niveles de energía del átomo de hidrógeno posee ciertas
características específicas; esta estructura se calculará en el tomo IV de este curso.
Indicaremos aquí solamente que, para un valor dado del número cuántico principal n,
la energía depende tan sólo del momento cinético total j del electrón. De esta manera,
la degeneración de los niveles no se rompe más que en parte: al nivel con valores
dados den y j corresponden dos estados con momentos cinéticos orbitales 1 = j ± 1
(con tal que j no tenga su mayor valor posible para el valor dado de n, j = n - 1).
Así, el nivel con n = 3 se desdobla en tres niveles, de los cuales a uno corresponden
]os estados s1¡ 2 , p 1¡ 2 , al otro, los estados p 312 , d3 ., 2 y al tercero, el d 512 •
§ 73.
El sistema periódico de los elementos de D. l. Mendeleev
Para explicar la naturaleza de la periodicidad en el cambio de las propiedades
que se observan en la serie de los elementos, colocados en orden de números atómicos crecientes, hay que examinar las singularidades que se dan en el proceso de
completar sucesivamente las capas electrónicas de los átomos (N. BoHR, 1922).
Al pasar de un átomo al siguiente, la carga aumenta en una unidad y a una capa
se le añade un electrón. A primera vista cabría esperar que las energías d:: enlace
de cada uno de los electrones que se añaden sucesivamente presentasen una variación monótona al aumentar el número atómico. En realidad, sin embargo, esto no
es así.
En el estado normal del átomo de hidrógeno se tiene sólo un electrón que se
encuentra en el estado Is. En el átomo del siguiente elemento - el helio - se añade
un electrón más en el mismo estado Is. La energía de enlace de cada uno de los
electrones Is en el átomo de helio es, sin embargo, considerablemente mayor que la
energía de enlace del electrón en el átomo de hidrógeno. Esta circunstancia es una
consecuencia natural de la diferencia entre el campo en que se encuentra un electrón
en el átomo H y el campo a que se ve sometido el electrón que se añade al ion He :
a grandes distancias, estos campos coinciden, aproximadamente, pero cerca del
núcleo con carga Z = 2 el campo del ion He+ es más intenso que el campo del
núcleo del átomo de hidrógeno con Z = 1.
En el átomo de litio (Z = 3), el tercer electrón va a parar a un estado 2s, ya que
en estados Is no pueden encontrarse más de dos electrones a la vez. Para un valor
El átomo
292
Z dado, el nivel 2s está situado por encima del nivel Is; a medida que aumenta la
carga de.l núcleo, descienden tanto el uno como el otro. Sin embargo, cuando se
pasa de Z = 2 a Z = 3, el primer efecto predomina considerablemente respecto del
segundo, y por ello la energía de enlace del tercer electrón en el átomo Li es considerablemente más pequeña que la energía de enlace de los electrones en el átomo
de helio. En los átomos desde el Be (Z = 4) hasta el Ne (Z = 10), se añaden, sucesivamente, al principio un electrón 2s más y luego seis electrones 2p. Las energías
de enlace de los electrones que se añaden en este orden, crecen, en general, debido
al aumento de la carga del núcleo. El electrón siguiente que se añade al pasar al
c:itomo Na (Z = I I) va a ocupar un estado 3s; el efecto del paso a una capa más
alta predomina en este caso sobre el efecto de aumento de la carga del núcleo, y la
energía de enlace disminuye de nuevo fuertemente.
Este cuadro de la manera cómo se llenan las capas electrónicas es característico
para toda la serie de los elementos. Todos los estados electrónicos se pueden distrihuir en grupos que se completan sucesivamente: a medida que cada uno de ellos se
va completando al avanzar en la serei de los elementos, la energía de enlace en general crece, pero en el momento en que comienzan a ocuparse los estados del grupo
siguiente, la energía de enlace disminuye fuertemente.
En la fig. 24 se presentan los potenciales de ionización de los elementos, obtenidos
a partir de datos espectroscópicos; estos potenciales determinan las energías de enlace
de los electrones que se añaden al pasar de cada elemento al siguiente.
Los diferentes estados se distribuyen de la siguiente manera en grupos que se
llenan sucesivamente:
ls
2s,
3s,
4s,
5s,
6s,
2p
3p
3d, 4p
4d, 5p
4/, 5d, 6p
7s, 6d, 51, ...
2 electrones
8
,,
8
,,
18
,,
18
,,
32
,,
l
(73.1)
J
EJ primer grupo se completa en el H y el He; la ocupación de1 segundo y tercero
corresponde a los dos primeros períodos (los cortos) del sistema periódico, que
contienen 8 electrones cada uno. Siguen luego dos períodos largos de I 8 elementos,
y un período largo que incluye las tierras raras y que contiene en total 32 elementos.
El último grupo de estados no llega a ocuparse por completo en los elementos que
existen en la naturaleza (ni en los transuránicos artificiales).
25t- He
Ne
~
~·
;(I¡
;:
=i
Ar
~
.,....
~h
~
Kr
~
ev
;:;·
Xe
Q
Hg
I
I
Rn
~
/'·
~
\
\
~
Po'1
5t- Li
Pr \ Gd
Lo
Bo
Sm Eu
V
Al
No
K
Rb
es
.,.°1....
~
1 Ac
Hf
. . --o.J
YbLu
'{\
Ro
;:i
~
;-
\
b
u
~
\'!t
0 ~,---=-5----~,o,,_---,L5----2~0----2~5~--3~0-----3L5----40.1-...---4~5----5~0----~55_____60.,_____6~5----7~0----7~5----~80L-----8L5----90-L--
Frn. 24
~
~
294
El átomo
Para comprender la marcha del cambio de las propiedades de los elementos a
medida que se ocupan los estados de cada grupo, es esencial la siguiente propiedad
de los estados d y f, que los distingue de los estados s y p. Las curvas de la energía
potencial efectiva del campo central (constituido por el campo electrostático y el
campo centrífugo) para un electrón en el campo de un átomo pesado, después de
una caída rápida, casi vertical, cerca del origen de coordenadas, presentan un mínimo
acentuado, a continuación del cual comienzan a crecer, tendiendo asintóticamente
a cero. Para los estados s y p estas curvas marchan, en su parte creciente, muy cerca
la una de la otra. Esto significa que en estos estados el electrón se encuentra aproximadamente a iguales distancias del núcleo. En cambio, las curvas para los estados
d y, en particular, para los estados f pasan mucho más a la izquierda; la región
« clásicamente accesible» que limitan termina considerablemente más cerca que
la correspondiente a los estados s y p para una misma energía total del electrón.
Con otras palabras, en los estados d y f el electrón se encuentra, esencialmente, mucho
más cerca del núcleo que en los estados s y p.
Toda una serie de propiedades de los átomos (entre ellas Jas propiedades químicas de los elementos, véase § 81) dependen, principalmente, de Jas regiones exteriores de las capas electrónicas. En relación con esto es muy importante la particularidad de los estados d y f que hemos señalado. Así, por ejemplo, a medida que se
ocupan los estados 4/ (en los elementos de tierras raras, véase más abajo), los electrones que se añaden se colocan mucho más cerca del núcleo que los electrones
en los estados ocupados antes. Como resultado de ello, estos electrones no se manifiestan casi en las propiedades químicas y todos los elementos de tierras raras resultan
ser muy parecidos químicamente.
Los elementos que contienen capas d y f completas (o que carecen de ellas) se
llaman elementos de los grupos principales; los elementos en los que se van ocupando
dichos estados, se llaman elementos de los grupos de transición. Conviene considerar
por separado los elementos de estos grupos.
Comencemos por los elementos de ]os grupos principales. El hidrógeno y el helio
tienen los estados normales:
(el subíndice a 1a izquierda de un símbolo químico representa siempre el rtúmero
atómico). Las configuraciones electrónicas de los restantes elementos de los grupos
principales se dan en la tabla 3.
En cada átomo, están del todo completas las capas indicadas a la derecha de la
tabla en la misma línea y en todas las anteriores. La configuración electrónica de las
capas que se están ocupando se indica en la parte superior, indicándose con un número el número cuántico principal de los electrones en estos estados, número que
295
El sistema periódico de D. l. Mendeleev
aparece a la izquierda de la tabla en la misma línea. Debajo se indican los estados
normales del átomo en conjunto. Así, el átomo Al tiene la configuración electrónica
1s22s22p63s23p2P112·
TABLA
3
Configuraciones electrónicas de los elementos de los grupos principales
----il-__
n
=
2
3
4
4
5
5
6
6
7
s_
_ s_ª_
aLi
uNa
19K
29Cu
37Rb
47Ag
ssCs
79Au
s1Fr
4Be
12Mg
20Ca
soZn
asSr
4sCd
saBa
soHg
ssRa
_!!__
szpz
~1~1~
szp•
sB
1aAl
aC
14Si
7N
1sP
sO
10S
9F
11Cl
10Ne
1sAr
31Ga
a2Ge
aaAs
34Se
asBr
aaKr
49ln
soSn
s1Sb
s2Te
sal
54Xe
s1Tl
s2Pb
saBi
s4Po
ssAt
saRn
I____
1s2
2s1 2p•
3s2 3pª
3d1 º
4s 2 4p 8
4d 1 º
Ssª Sp•
4f1' Sd 10
6s 1 6p 6
Los valores L y Sen el estado normal del átomo se pueden determinar (cuando
se conoce la configuración electrónica) mediante la regla de Hund (§ 67), y el valor
de J se determina siguiendo la regla indicada en el ~ 72.
Los átomos de gases nobles (He, Ne, Ar, Kr, Xe, Rn) ocupan en la tabla una
posición especial: en cada uno de ellos se completan los grupos de estados enumerados en (73.1 ). Sus configuraciones electrónicas gozan de particular estabilidad (los
potenciales de ionización son los mayores en las correspondientes series). Con ello
está ligada también la inercia química de estos elementos.
Vemos así que en la serie de elementos del grupo principal los diferentes estados
se van ocupando de manera muy regular: se ocupan primero los estados s y luego
los estados p de cada número cuántico principal n. También son regulares las configuraciones electrónicas de los iones de estos elementos (hasta que la ionización
afecta a los electrones de las capas d y f): cada ion tiene una configuración que corresponde a la del átomo precedente. Así, el ion Mg+ tiene la configuración del átomo
Na, el ion Mg+ + la configuración del Ne.
Pasemos ahora a los elementos de los grupos de transición. Las capas 3d, 4d,
5d se van completando en los grupos de elementos llamados, respectivamente,
grupos del hierro, del paladio y del platino. En la tabla 4 se presentan las configuraciones electrónicas y los términos de los átomos de estos grupos deducidos de datos
espectroscópicos experimentales. Conforme se ve en ella, las capas d se ocupan
de manera mucho menos regular que las capas s y p en los átomos de los elementos
296
El átomo
de los grupos principales. Un rasgo característico es aquí la «competencia» entre
los estados s y d. Esta competencia se manifiesta en que, en vez de una sucesión
regular de configuraciones del tipo dPs 2 con p creciente, son a menudo más ventajosas
las configuraciones del tipo dJJ+ls o dP+ 2 • Así, en el grupo del hierro, el átomo Cr
tiene la configuración 3d54s y no la 3d44s2 ; después del Ni, con ocho electrones d,
sigue inmediatamente el átomo de Cu con la capa d totalmente ocupada {por lo que
lo hemos atribuido a los grupos principales). Esta misma falta de regularidad se
observa también en los términos de los iones: las configuraciones electrónicas de los
iones frecuentemente no coinciden con la configuración de los átomos precedentes.
Por ejemplo, el ion v+ tiene la configuración 3d4 (y no la 3d24s2, como el Ti), el ion
Fe+ tiene la configuración 3d64s (en vez de la configuración 3d54s2 del átomo Mn).
4
TABLA
Configuraciones electrónicas de los átomos de los elementos de los grupos del hierro,
paladio y platino
Grupo del hierro
22Ti
21Sc
Capa Ar+
3d 4s
2
2
3d 4s
2Da;2
2aV
2
3
3d 4s
ªF2
24Cr
2
2sMn 1 ~ ~ 1 2 s N i
3d 4s
3d5 4s2
3d 8 4s 2 3d 7 4s2 3d 8 4s1
7Sa
ªS&¡2
,,D,
5
'Fa¡2
'Fo/2
ªF,
Grupo del paladio
sgY
Capa Kr+
4d 5s2
2
41Nb
42Mo
4d2 5s2 4d4 Ss
4d6 Ss
ªF2
1sª
40Zr
Da¡2
ªD1;2
l
4sPd
44Ru
4sRh
4d5 5s2 4d 7 Ss
4d 8 Ss
4dl0
'Fo¡2
1so
43Tc
r,F&
6 Ss¡2
Grupo del platino
Capa Xe+
Sd 6s 2
Da;2
2
nLu
Capa Xe+4f14 + )
1
72Hf
7sTa
74W
1
7sRe
1
760s
nlr
7sPt
- - - - - -2 - - - - - - - - - ' - - - - - - - - Sd 6s
2
2
D 3¡ 2
2
5d 6s
ªF2
3
,
5d 6s
1
4Fa¡2
2
l 5d' 6s
6
D
0
5
2
5d 6s
,
6
S 5¡ 2
11
Sd6 6s2 5d7 6s2
5
D4
4F9¡2
5d 9 6s
3
D3
TABLA
5
Configuraciones electrónicas de los átomos de los elementos de tierras raras
ssCe
--Capa Xe+
sgPr
6oNd
4f 2 6s 2 4J3 6s 2 4J' 6s1
3H4
•1,,, I •1,
s1Pm
63EU
s2Sm
&sTb
64Gd
&&DY
&sEr
67HO
69Tm
70Yb
~
--- --- - - - ----
~-
4f5 6s2 4J 6 6s1 4J 7 6s1 4J 7 5d6s1 4f 8 Sd 6s2 4f1º 6s2 4f 11 6s2 4f126s2 4f ia 6sl 4¡1c 6sl
::
6Hs¡2
8
7Fo
•D.,.
S1¡1
'H11,·
I
~
~
l ·1is,.
·1,
~
3H6
'F1¡1
1so
'ti
~
Q~
~
§"
TABLA
6
~
Configuraciones electrónicas de los átomos del grupo de los actínidos
s9Ac
Capa Rn+
6d 7s1
1
Da;1
90Th
01Pa
-----
6d2 7s2 5J 2 6d7s 2
3 F2
4K11;2
92U
9sNp
:--
¡..
Pu
5/3 6d7s1 5f4 6d7s 2 5f 6 1s2
r.La
6
L11¡2
~
7Fo
9sAm
96cm
Sf 7 7s1
5f7 6d7s 1
8
S1¡2
:
;:s
r
8
D2
1
~
.....,
El átomo
298
Obsérvese que todos los iones que se encuentran de manera natural en cristales y en
soluciones, contienen en las capas no completas solamente electrones d (pero no
electrones s y p ). Así, el hierro se encuentra en los cristales o en las soluciones sólo
en la forma de iones Fe++ y Fe+++, con las configuraciones 3d6 y 3d5 , respectivamente.
Una situación análoga se presenta también cuando se llena la capa 4f, lo que
tiene lugar en la serie de elementos conocidos con el nombre de tierras raras (tabla 5) (1). El llenado de la capa 4/ se efectúa también de manera no del todo regular,
caracterizándose por la « competencia » entre los estados 4f, 5d y 6s.
El último grupo de elementos de transición empieza con el actinio. En este
grupo se van ocupando las capas 6d y 5f, de modo análogo a como ocurre en la serie
de elementos de tierras raras (tabla 6).
Para terminar este párrafo, consideremos una interesante aplicación del método
de Thomas-Fermi.Vimos que los electrones de la capa p aparecen por primera vez
en el elemento quinto (8), los electrones d, para Z = 21 (Se), y los electrones f,
para Z = 58 (Ce). Estos valores de Z pueden predecirse con ayuda del método de
Thomas-Fermi de la siguiente manera.
Un electrón con momento cinético orbital l que pertenece a un átomo complejo
se mueve con una « energía potencial efectiva» (2) igual a
U1(r) = -cp(r)+!(l+i)2/r2 •
El primer término es la energía potencial en el campo eléctrico definido por el potencial de Thomas-Fermi </>(r). El segundo término es, en cambio, la energía centrífuga,
2
en la que hemos substituido
en vez de l(l+ 1) teniendo en cuenta el carácter
cuasiclásico del movimiento. Dado que la energía total del electrón en el átomo
es negativa, es claro que si (para valores dados de Z y/) es U1(r) > O para todo r,
en el átomo dado no pueden existir electrones con aquel valor,/, del momento cinético.
Si se considera un valor determinado cualquiera,/, y se hace variar Z, resulta que para
valores Z demasiado pequeños efectivamente será -en todo el espacio U1(r) > O.
A medida que Z aumenta, llega un momento en que la curva U1 = U1(r) es tangente
al eje de abcisas, y para valores mayores de Z se tiene ya un dominio en el que
U1(r) < O. De esta manera, el momento en que aparecen en el átomo electrones con
el valor dado del viene determinado por la condición de tangencia de la curva U1(r)
y el eje de abcisas, es decir, por las ecuaciones
u+n
Ui(r) = -c/>+!(l+t)2/r2 = O,
Uz'(r) = -c/>'(r)-(l+};:)2/r3 = O.
(1) En los cursos de química, con frecuencia se incluye también el Lu entre los elementos de tierras
raras. Esto, sin embargo, no es correcto, ya que en él la capa 4/ está ya completa; el Lu debe colocarse
en el grupo del platino, como se hace en la tabla 4.
2
( )
Como en el § 70, utilizamos unidades atómicas.
299
Términos de rayos X
Substituyendo aquí la expresión (70.6) del potencial, obtenemos las ecuaciones
Z213x(x)/x = ( 4/31r) 213 (l+i)2/x2,
Vl 3 [xx'(x)-x(x)]/x = -2(4/31r) 21ª(l+i)2/x2.
(73.2)
Dividiendo miembro a miembro la segunda de estas ecuaciones por la primera, se
encuentra para x la ecuación
x'(x)/x(x) = -1/x,
que junto con la primera de las ecuaciones (73.2) permite calcular Z. El cálculo
numérico da:
Z = 0·155(21+1) 3 •
Esta fórmula determina los valores Z para los que aparecen por primera vez en un
átomo electrones con un valor dado del (el error es de un 10 % aproximadamente).
Valores muy precisos se obtienen si en vez del coeficiente O, 155 se toma 0.17:
Z = 0·17(21+1) 3 •
(73.3)
Para l = 1, 2, 3 esta fórmula da, después de redondear al número entero más próximo, justamente los valores correctos 5, 21, 58. Para l = 4 la fórmula (73.3) da
Z = 124; esto significa que los electrones g deberían aparecer por vez primera solamente en el elemento 124.
§ 74.
Términos de rayos X
La energía de enlace de los electrones interiores en un átomo es tan grande, que
si uno de ellos pasa a una capa exterior incompleta (o si escapa del átomo), el átomo
excitado (o el ion) resulta mecánicamente inestable respecto de la ionización acompañada de una reordenación de la nube electrónica y la formación de un ion estable.
Sin embargo, en virtud del carácter relativamente débil de las interacciones electrónicas en el átomo, la probabilidad de esta transición es relativamente pequeña, de
modo que el tiempo de vida r del estado excitado es grande. Por ello la «anchura»
del nivel h/r (véase § 44) resulta suficientemente pequeña para que pueda tener sentido considerar las energías del átomo con un electrón interior excitado como niveles
discretos de estados « cuasiestacionarios » del mismo. Estos niveles se llaman términos de rayos X (1).
Los términos de rayos X se clasifican, en primer lugar, indicando la capa de la
que ha partido el electrón o, como se suele decir, en la que se ha producido un « hueco». Adónde va a parar precisamente el electrón, no se manifiesta casi en la energía
del átomo y carece por ello de importancia.
(1) Este nombre procede de que las transiciones entre dichos niveles conducen a la emisión de rnyos X
por el átomo.
El átomo
300
El momento cinético total del conjunto de los electrones que llenan una cierta
capa es igual a cero. Después de haber escapado de ella un electrón, la capa tiene
un cierto momento cinético j. Para la capa (n, /) el momento cinético j puede tomar,
evidentemente, los valores I ± ! . Obtenemos así niveles que se podrían representar
por ls1¡2 , 2s1¡ 2, 2p 112 , 2p312 , ••• , donde el valor de j se añade como subíndice al símbolo
que indica la posición del« hueco». Sin embargo, se suelen utilizar símbolos especiales de acuerdo. con la siguiente correspondencia:
ls112
2s112
3d5¡2
K
L1
Mv
Los niveles con n
=
4, 5, 6 se designan de manera análoga con las letras N, O, P.
Los niveles con igual valor de n (designados con la misma letra mayúscula) son
próxim,os entre sí y se encuentran lejos de los niveles con otros valores de n. Ello
se debe a que, gracias a la relativa proximidad de los electrones interiores al núcleo,
el campo en que se encuentran es el campo del núcleo casi no apantallado. Sus estados son así del tipo « hidrogenoide » y su energía, en primera aproximación, es
'igual a - Z2/2n 2 (en unidades atómicas), es decir, depende sólo de n.
Cuando se tienen en cuenta los efectos relativistas, se produce un alejamiento
mutuo de los términos con valores j distintos (cf. lo dicho en el § 72 acerca de la
estructura fina de los niveles del hidrógeno), como, por ejemplo, L 1 y L 11 respecto
de L 111 ; M 1 y Mu respecto de M 1 11 y Mrv- Tales pares de niveles se llaman dobletes regulares (o relativistas).
En cambio, la separación de los términos con valores l diferentes e igual valor
dej (por ejemplo, L 1 de L 11 , M1 de M 11 ) se debe a la desviación del campo en que
se encuentran los electrones interiores respecto del campo de Coulomb del núcleo,
es decir, aparece al tener en cuenta las interacciones del electrón con los demás
electrones. Tales dobletes se califican de irregulares (o apantallados). El término
correctivo principal que afecta a la energía « hidrogenoide » del electrón resulta
del potencial creado por los restantes electrones en el dominio próximo al núcleo;
dicho término es proporcional a Z4 13 (véase (70.8)). Sin embargo, dado que esta
corrección no depende ni de n ni de /, no se manifiesta en los intervalos entre niveles.
Por ello los términos correctivos principales en las diferencias de niveles resultan de
la interacción de un electrón con los electrones más próximos a él. Dado que la
distancia entre electrones interiores es r ,_, 1/Z (radio de Bohr en el campo de una
carga Z), la energía de dicha interacción es ,_, 1/r ,_, Z. Si se tiene en cuenta esta
corrección, se puede escribir la energía de un término de rayos X, con igual precisión,
en la forma - (Z - <5)2/2n 2, donde b = <5(n, /) es una cantidad pequeña (comparada
con Z) que podemos considerar como índice del grado de apantallamiento de la
carga del núcleo.
Términos de rayos X
301
Además de los términos de rayos X con un « hueco » en las capas electrónicas,
pueden existir también términos con dos y tres « huecos ». Dado que la interacción
spin-órbita es fuerte para los electrones interiores, el enlace de los huecos entre sí
es del tipo jj.
La anchura de un término de rayos X se determina por la probabilidad total
de todos los procesos posibles de reordenación de la capa electrónica del átomo
cuando se llena el « hueco » dado. En los átomos pesados, representan un papel
fundamental en este proceso las transiciones de un hueco desde la capa dada a otra
más alta (es decir, las transiciones inversas de los electrones), acompañadas de la
emisión de un cuanto X. Las probabilidades de estos procesos « radiativos », y con
ellas la parte correspondiente de la anchura del nivel, crecen muy rápidamente
- como Z 4 - al aumentar el número atómico, pero decrecen (para un Z dado)
al pasar de los niveles más bajos a otros que lo son menos (1).
Para átomos más ligeros (y para niveles más altos) un papel importante e incluso
preponderante lo representan las transiciones no acompañadas de radiación, transiciones en las que la energía que se libera al llenarse un hueco por un electrón procedente de un nivel más alto, se utiliza para arrancar del átomo otro electrón interno
(éste es el llamado efecto Auger); como resultado de este proceso, el átomo queda
en un estado con dos huecos. La probabilidades de estos procesos, y su correspondiente contribución a la anchura del nivel, no dependen en primera aproximación
(respecto de 1/Z) del número atómico (véase el problema) (2).
PROBLEMA
Hallar la ley límite que liga la anchura Auger de los términos de rayos X con el número atómico para valores suficientemente grandes de este último.
Solución. La probabilidad de una transición Auger es proporcional al cuadracto de un elemento de matriz de la forma:
donde "Pi, 1jJ2 y "Pi', 1jJ2 ' son las funciones de onda iniciales y finales de los dos electrones que toman
parte en la transición, y V= e2/r12 es su energía de interacción. Para valores Z suficientemente
grandes, las funciones de onda de los electrones interiores se pueden considerar como del tipo
hidrogenoide y cabe prescindir del apantallamiento del campo del núcleo por los demás electrones
(hidrogenoide es también la función de onda del electrón de ionización en la región interior del
átomo que es esencial para la integral M). Si se efectúa el cálculo expresando todas las cantidades
en unidades coulombianas (con la constante tX = Ze 2 ; véase § 36), la única cantidad que depende
de Zen la integral M será V= 1/Zr12 , de forma que M"" 1/Z. La probabilidad de la transición,
y con ella también la anchura Auger, t:.E, del nivel, será proporcional a z-2 •.Pasando de nuevo
a unidades ordinarias (la unidad coulombiana de energía es Z 2me4/h 2 ), encontramos que t:.E no
depende de Z.
e)
Véase el tomo siguiente de este curso.
Indicaremos como ejemplo que la anchura Auger del nivel K es del orden de 1 eV, mientras para
niveles más altos alcanza valores ......, 10 eV.
(2)
302
§ 75.
El átomo
Momentos multipolares
Como es sabido, las propiedades eléctricas de un sistema de partículas se caracterizan en la teoría clásica por los momentos multipolares de diferentes órdenes,
momentos que se expresan en función de las cargas y de las coordenadas de las
partículas. En la teoría cuántica, las definíciones de estas cantidades conservan
la misma forma, pero deben considerarse como relativas a operadores.
El primero de los momentos multipolares es el momento dipolar, definido como
igual al vector
d= ~er,
(la suma se extiende a todas las partículas del sistema; hemos prescindido, P.ara
simplificar, del índice que numera las partículas). La matriz de este operador - como
la de todo vector polar (véase § 30) - tiene elementos distintos de cero solamente
para las transiciones entre estados de diferente paridad. Por ello son iguales a cero,
en cualquier caso, todos los elementos diagonales. Con otras palabras, los valores
medios del momento dipolar de un sistema cualquiera de partículas (por ejemplo,
de un, átomo) son iguales a cero en los estados estacionarios (1).
Evidentemente, lo mismo vale en general para todos los momentos 21-polares
con valores impares de /. Las componentes de uno de estos momentos constituyen
un polinomio de grado impar (/-ésimo) en las coordenadas, que cambia de signo
- al igual que las componentes de un vector polar - en la inversión de las coordenadas; también para ellos es válida, por lo tanto, la misma regla de selección
relativa a la paridad.
El momento cuadripolar de un sistema se define como tensor simétrico
Qik = ~e(3xixk-Dikr2),
(75.1)
cuya suma de los términos diagonales es igual a cero. La determinación de los
valores de estas cantidades en un estado cualquiera de un sistema (por ejemplo,
de un átomo) exige promediar el operador (75.1) respecto de la correspondiente
función de onda. Este promedio conviene efectuarlo en dos etapas (cf. § 72).
Llamemos
Qu, el
operador del momento cuadripolar promediado respecto de
(1) Para evitar interpretaciones erróneas, subrayaremos que se trata aquí de un sistema aislado de partículas o de un sistema de partículas en un campo eléctrico exterior central. Así, si se consideran los núcleos
como «fijados», aquella afirmación general vale para el sistema electrónico de un átomo, pero no para
una molécula.
Se supone también que no existe ninguna degeneración adicional(« accidental») del nivel de energía
aparte de la degeneración asociada con las direcciones posibles del momento cinético total. En el caso
contrario, cabe construir funciones de onda de estados estacionarios tales que no posean paridad determinada, y los correspondientes elementos diagonales del momento dipolar no tienen entonces por qué
anularse.
Momentos multipolares
303
los estados electrónicos con un valor dado del momento cinético total J (pero sin
que se dé su proyección MJ). El único vector que caracteriza al átomo en conjunto
es el « vector » J Por ello, el único operador tensorial simétrico de traza nula es un
tensor de la forma:
(75.2)
La constante Q se define de tal manera, que en el estado con M J = J sea Qzz = Q;
esta cantidad se suele llamar, simplemente, momento cuadripolar.
Hay que interpretar los operadores ji como las matrices conocidas del momento
cinético para el valor dado J, que son no diagonales respecto de M. 1 ; el operador J 2
puede substituirse, claro está, por su valor propio J(J+I), sin más.
Para J = O (con lo que también MJ = O), wdos los elementos de estas matrices
son iguales a cero, es decir, los operadores se anulan idénticamente. Idénticamente
se anulan también para J = i. Es fácil comprobarlo sin más que multiplicar directamente las matrices de Pauli (55.6), que son las matrices de las componentes de
todo momento cinético igual a t.
Esta circunstancia no es casual y constituye un caso particular de una regla general: el tensor del momento 2t_polar (con l par) es diferente de cero tan sólo para los
estados del sistema cuyo momento cinético total J > l/2 (1).
PROBLEMAS
1. Hallar la relación entre los operadores del momento cuadripolar de un átomo en los estados corre~pondiehtes a las distintas componentes de estructura fina de un nivel (esto es, a los·
estados con valores diferentes de J para valores dados L y S).
Solución. En los estados con valores dados de L y de S, el operador del momento cuadripolar,
en tanto que magnitud puramente «orbital», depende tan sólo del operador L y se expresa así
mediante la misma fórmula (75.2) cambiando en ella J por L (y con otra constante Q). El operador (75.2) se obtiene a partir de él promediando, además, respecto del estado con el valor dado J:
(1) Esta regla es consecuencia de las propiedades generales de simetría respecto '1e las rotaciones.
El tensor del momento 21-polar D(l) es un tensor irreducible de orden l (véase torno II, Teoría clásica de
los campos, § 41); por sus propiedades de transformación, este tensor corresponde a un espinor simétrico
de orden 2/ (véase § 58). Las funciones de onda 'PJ corresponden, en cambio, a un espinor de orde~ 2J.
Los elementos de matriz del operador D(l) son distintos de cero si en las integrales que los definen el mtegra!ld<!(,J,.1• .6<1> ,¡,.,)contiene una parte escalar. Esta parte se obtiene contrayendo respecto de tos.tos los pares
de md1ces de spin, debiendo referirse los índices de cada para factores diferentes (i/u*, ,¡,., y D< 1>) - de lo
~on_trario, el resultado es cero. Es evidente que esta contracción es posible tan sólo cuando la suma de los
md1ces en tpJ y tpJ* no es menor que el número de índices en D(l). es decir, cuando 41? 21.
El átomo
304
3QJ
AJ
Udk+ ]k i-iJU+ l)Sik]
2](2]-1)
3
QL [Ltlk+Lklt-iL(L+ 1)8ik]•
2L(L-1)
A
A
Qik =
A
(1)
Se trata de hallar la relación entre los coeficientes QJ y QL. Multipliquemos para ello la igualdad (1) a la izquierda por Ji y a la derecha por Jk (sumando respecto de i de k) y pasemos a los
valores propios de los operadores diagonales. En todo esto es
donde, según la fórmula (31.3),
2J.L =
En cambio, el producto
.A l1c l, jk
](] +
l)+L(L+ 1)-S(S+ 1).
se transforma mediante las fórmulas
de manera parecida a como se hizo en el problema 2, § 29, lo que da:
Análogamente
J,],Jk]k
=
(12)2,
J,Jk]1]k
=
J2(J2-l).
De (1) se deduce así la siguiente relación:
QJ= QL
En particular, para S
=
!
3J.L(2J.L-1)-2](] + l)L(L+ 1)
(]+1)(2]+3)L(2L-1)
.
(2)
esta fórmula da
QJ= QL
QJ= QL
(L-1)(2L+3)
L(ZL+l)
para
J = L+l,
para
J
=
(3)
L-!.
2. Expresar el momento cuadripolar de un electrón (carga - e) con momento cinético orbital l en función del valor medio del cuadrado de su distancia al centro.
Solución.
Hemos de promediar la expresión
respecto de un estado con momento cinético orbital dado l y con proyección del m_ismo m = l.
El valor medio del factor angular se determina directamente aplicando la fórmula obtenida en el
305
Momentos multipolares
problema 2 del § 29 (en la que hay que substituir lz por/), y encontramos en definitiva:
21
Qz=er2--.
(4)
21+3
El signo de esta cantidad es opuesto al signo de la carga (- e) del electrón, como debe ser;
una partícula que se mueve con movimiento cinético dirigido a lo largo del eje z, se encuentra
esencialmente en la cercanía del plano z = O, por lo cual cos2 8< t.
Para un electrón con valor dado j
=
l ± 1/2 la aplicación de la fórmula (3) da
tS)
Qi = ;;2(2j-1)/(2j+2).
3. Determinar el momento cuadripolar de un átomo (en el estado fundamental) en el que
todos los electrones, en número de v, por encima de las capas ya completas se encuentran en estados
equivalentes con momento cinético orbital /.
Solución. Dado que el momento cuadripolar total de las capas completas es igual a cero,
el operador del momento cuadripolar del átomo es la suma
Qtk =
extendida a los
l'
3 2
er
~[hfk+Mi-il(l+ l)Sik-J,
(21-1)(21+3) ~
electrones exteriores (se utiliza aquí la fórmula (4)).
Supongamos primero que v < 21 + 1, es decir, que en la capa están ocupados la mitad o menos
de la mitad de los puestos. Entonces, según la regla de Hund (§ 67), los spins de todos los v electrones son paralelos (de modo que S = v/2). Esto significa que la función de onda de spin del
átomo es simétrica y, por consiguiente, la función de onda de coordenadas es antisimétrica respecto de estos electrones. En consecuencia, todos los electrones deben tener valores m distintos,
de modo que el mayor valor posible ML (y el de L, que coincide con él) es igual a
L
= (ML)max =
z
L m = !v(2l-v+ 1).
m=l-v+l
El valor buscado QL es el valor propia Qzz para ML = L. Tenemos por esto:
6er2
QL =
z
~ [m 2 -1-l(l+
1)]
3
(21-1)(21+3) ~
m=l-v+l
de donde, después de calcular la suma:
21(2l-2v+ 1) _
QL = (2/-1)(21+3(
El paso final de QL a QJ se efectúa según la fórmula (2).
2
º
'
El átomo
306
El caso de un átomo con la capa exterior ocupada hasta más de la mitad se reduce al anterior
pasando a considerar los « huecos » en vez de los electrones; por ello la respuesta nos la da la
misma fórmula (6) cambiada de signo (la carga de un «hueco» es igual a +e), debiéndose entender ahora por v. no el número de electrones, sino el número de puestos vacantes en la capa.
4. Determinar el desdoblamiento cuadripolar de los niveles en un campo eléctrico exterior
que presenta simetría axil (1).
Solución. En virtud de la simetría axil de] campo (cuyo eje de simetría supondremos es el
eje z), tenemos:
fAf,/ox2
=
o2cf,/oy2
donde cf, es el potencial del campo, y en virtud de la ecuación electrostática Í!J.cf,
fAf,/8z2
=
=
O, resulta
-282c/,/8x2
El hamiltoniano del momento cuadripolar en el campo exterior es (2):
de donde en el presente caso:
Í1 = A(}x+ Jy2)-2A}2 2
=
A(J2_3J z2),
Do
A=---
2](2]-1) ax2.
Substituyendo los operadores por sus valores propios, obtenemos el desplazamiento de los niveles:
§ 76.
Efecto Stark
Si se coloca un átomo en un campo eléctrico exterior, cambian sus niveles de
energía; este fenómeno se llama efecto Stark.
Al colocar un átomo en un campo eléctrico exterior homogéneo, nos encontramos ante un sistema de electrones situados en un campo con simetría axil (el campo
del núcleo más el campo exterior). Debido a ello, el momento cinético total del
átomo, rigurosamente hablando, deja de conservarse; tan sólo se conserva la proyección MJ del momento cinético total J sobre la dirección de este campo. Los
estados con diferentes valores M J tendrán energías diferentes, es decir, el campo,
(1)
(2)
El problema análogo para un campo arbitrario puede verse en el problema 5, § J03.
Véase el tomo 11, Teoría clásica de los campos,§ 42.
Efecto Stark
307
eléctrico rompe la degeneración asociada con las direcciones posibles del momento
cinético. Sin embargo, esta ruptura de la degeneración no es completa: los estados
que difieren tan sólo en el signo de MJ siguen siendo degenerados entre sí, como
antes. En efecto, un átomo en un campo eléctrico exterior homogéneo es simétrico
respecto de la reflexión en cualquier plano que pasa por el eje de simetría (eje que pasa
por el núcleo y tiene la dirección del campo; lo e1egiremos luego como eje z). Por
ello los estados que se obtienen uno de otro mediante una de estas reflexiones deben
tener la misma energía. Pero en la reflexión en un plano que pasa por un cierto eje
el momento cinético respecto del mismo cambia de signo (el sentido positivo de
rotación en torno del eje se transforma en el negativo).
Supondremos que el campo eléctrico es suficientemente débil como para que la
energía adicional que determina sea pequeña respecto de las distancias entre los
niveles de energía del átomo vecinos, en particular, respecto de los intervalos de
estructura fina. Para calcular el desplazamiento de los niveles en el campo eléctrico
podemos entonces utilizar la teoría de perturbaciones desarrollada en los §§ 38, 39.
El operador de perturbación es, en este caso, la energía del sistema de electrones
en el campo homogéneo 8, igual a
(76.1)
donde d es el momento dipolar del sistema. En la aproximación de orden cero, los
niveles de energía son degenerados (respecto de las direcciones del momento cinético
total); sin embargo, esta degeneración carece de importancia en el presente caso
y al aplicar la teoría de perturbaciones se puede proceder como si se tratase de niveles
no degenerados. Esto se sigue de que en la matriz de la magnitud dz (como la de la
componente z de cualquier otro vector) son diferentes de cero únicamente los elementos que corresponden a transiciones sin cambio en el valor de MJ (véase § 29), y,
por consiguiente, los estados que difieren en el valor de MJ se comportan con independencia entre sí al aplicar la teoría de perturbaciones.
El desplazamiento de los niveles de energía viene determinado en primera aproximación por los correspondientes elementos diagonales de la matriz de perturbación. Sin embargo, los elementos de matriz diagonales del momento dipolar se
anulan idénticamente (§ 75). Por ello el desdoblamiento de los niveles en el campo
eléctrico es un efecto de segundo orden y proporcional al cuadrado del campo (1).
El cálculo de aquél debe efectuarse siguiendo las reglas generales de la teoría de
perturbaciones, pero la dependencia del desplazamiento de los niveles respecto
del número cuántico MJ se puede establecer ya partiendo de consideraciones más
generales.
(1) El átomo de hidrógeno constituye una excepción, ya que en él el efecto Stark es lineal respecto
del campo (véase el párrafo siguiente). De manera análoga al hidrógeno se comportan también, en campos
suficientemente intensos, los átomos de otros elementos que se encuentran en estados fuertemente excitados
<y por ello del tipo hidrogenoide, véase § 68).
El átomo
308
En tanto que magnitud cuadrática respecto del campo, el desplazamiento ó.Ek
del nivel En debe expresarse mediante una fórmula del tipo
(76.2)
donde rx¡/ ) es un tensor simétrico de segundo orden; eligiendo el eje z en la dirección del campo, obtenemos:
11
(76.3)
El tensor rx¡/ ) caracteriza el nivel dado (no desdoblado) y depende también del
número MJ. Los valores rx¡¡/ 11 ) para diferentes valores MJ se pueden considerar como
valores propios del operador
11
(76.4)
Ésta es la forma general de un tensor simétrico de segundo orden que depende del
vector J (cf. § 75). De (76.3) y (76.4) se sigue:
(76.5)
Obsérvese que al sumar respecto de todos los valores MJ, el segundo término
entre corchetes se anula, de forma que el primer término representa el corrimiento
común del « centro de gravedad » del nivel desdoblado. Obsérvese también que
según (76.5) el nivel con J = t no se desdobla, de acuerdo con el teorema de Kramers (§ 60).
El tensor rx¡k(n) que figura en las fórmulas que acabamos de escribir representa
a la vez la polarizabilidad del átomo en el campo eléctrico exterior. En efecto, según
una fórmula general,
(oH/o:>t.)nn = oEn/o>..
(véase el problema del § 11 ). Considerando en ella como parámetros A las componentes del vector 8 y haciendo H = H0 -tff.d, encontramos para el valor medio
del momento dipolar del átomo
(76.6)
Si el átomo se encuentra en un campo exterior no homogéneo (que cambia poco
en una región de las dimensiones del átomo), puede existir también un efecto de
desdoblamiento lineal respecto del campo ligado con el momento cuadripolar de
aquél. El operador de interacción cuadripolar del sistema con el campo tiene una
forma que corresponde a la expresión clásica de la energía cuadripolar (1):
(76.7)
1
( )
Véase tomo 11, Teoría clásica de los campos, § 42.
Efecto Stark
309
donde <p es el potencial del campo eléctrico (los valores de las derivadas son los correspondientes al lugar en que se encuentra el átomo).
En particular, es posible aplicar esta fórmula a un átomo neutro que se encuentra
en el campo de un electrón cuya distancia al átomo es grande respecto de las dimensiones atómicas. El campo del electrón en el lugar donde se halla el átomo satisface
entonces la condición de ser cuasihomogéneo, y la primera aproximación de la teoría de perturbaciones conduce a una energía de la perturbación electrón-átomo
que es proporcional a 1/r3 (puesto que </> ,_, 1/r).
Este resultado se refiere, sin embargo, tan sólo a estados con valores dados de
la proyección MJ del momento cinético total. Si se promedia respecto de todas las
direcciones del mismo (es decir, respecto de todos los valores MJ) la interacción
proporcional a l/r 3 se anula, ya que Qii = O. Además, esta interacción tampoco
existe si el momento cinético del átomo es J = O ó ! (en estos casos Que - O, véase
§ 75).
De orden siguiente respecto de las potencias de 1/r, y siempre diferente de cero,
es la interacción que aparece en la aproximación de segundo orden de la teoría de
perturbaciones aplicada al operador dipolar (76.1). Dado que el campo del electrón
es tff "' 1/r2,la energía U de esta interacción resulta proporcional a 1/r4 • Si el átomo
se encuentra en su estado normal, esta energía (como toda corrección de segundo
orden a la energía del estado fundamental, véase § 38) es negativa, es decir, entre
el átomo y el electrón actúa una fuerza atractiva.
La atracción entre un electrón y un átomo es la causa de que algunos átomos
tengan la propiedad de formar iones negativos uniendo a ellos un electrón (1). De
esta propiedad, sin embargo, no gozan, ni con mucho, todos los átomos. Ello se
debe a que en un campo que disminuye a grandes distancias como 1/r 4 (o como
1/r3), el número de niveles (que corresponden a un movimiento finito del electrón)
es siempre finito, y en ciertos casos particulares puede ocurrir que ni tan solo existan.
PROBLEMAS
1. Determinar la dependencia respecto de J del desdoblamiento por efecto Stark de las diferentes componentes de un nivel multiplete.
Solución. Conviene resolver el problema cambiando el orden en que se aplican Jas perturbaciones: consideraremos primero el desdoblamiento del nivel por efecto Stark sin tener en cuenta
la estructura fina, e introduciremos luego la interacción spin-órbita. Dado que el spin del átomo
no interactúa con el campo eléctrico exterior, el desdoblamiento por efecto Stark de un nivel con
momento cinético orbital L se determina por una fórmula del mismo tipo (76.2), con un tensor
1
( )
Así, los átomos de halógenos se unen con un electrón con una energía de enlace del orden de
2 a 4 eV, mientras que el átomo de hidrógeno lo hace con una energía de enlace de 0,7 eY.
310
El átomo
<Xtkque se expresa en función del operador L de la misma manera que
función de J :
rxik
en (76.4) se expresa en
(prescindimos en todo esto del índice n). Después de introducir la interacción spin-órbita, los
estados del átomo deben caracterizarse por el momento cinético total J. El promedio del operador .<Xtk respecto de estados con valor dado del momento cinético J (pero no de su proyección M J)
coincide formalmente con el promedio que se calculó en el problema 1 del § 75. Volvemos entonces a las fórmulas (76.4), (76.5) con constantes rx, f3 que se expresan en función de las constantes a, b de acuerdo con las relaciones:
r1..
3J.L[2J.L-1]-2J(] +l)L(L+ 1)
](] + 1)(2]-1)(2] +3)
·
= a, f3 = b
De la misma manera se determina la dependencia del desdoblamiento respecto de J (pero no,
claro está, la dependencia respecto de L y S, cantidades de las que - al igual que de otras características del término no desdoblado-, dependen también las constantes a, b).
2. Determinar la descomposición de un nivel doblete (spin S
arbitrario (no débil).
=
t)
en un campo eléctrico
Solución. Si la magnitud del desdoblamiento no e·s pequeña comparada con el intervalo
entre las componentes del doblete, la perturbación del campo eléctrico y la interacción spin-órbita
deben considerarse a la vez, es decir, el operador perturbación es la suma:
t
= AS.L-¡c2{a+2b[Lz2-!L(L+ 1)]}
(cf. (72.4) y el problema que precede). Prescindiendo de términos constantes que no son esenciales
para el desdoblamiento, escribiremos este operador en la forma (véase (29.11))
Para cada valor dado MJ, los valores propios de este operador se determinan por las raíces de la
ecuación secular formada por sus elementos de matriz respecto de los estados:
(1) ML = MJ-!,
(2) ML = MJ+t,
Ms=i,
Ms=-!,
Mediante las fórmulas (27.12) se encuentra:
Vu = iA(MJ-!)-bC2(MJ-!)2,
Vi2 = -!A(MJ+!)-bC2(MJ+f)2,
Vi2 = iAv[(L+MJ+i)(L-MJ+i)].
Para el desplazamiento de los niveles obtenemos finalmente (véase problema 1, § 39):
(1)
El e/ecto Stark en el hidrógeno
311
(se ha prescindido aquí de todos los términos que son iguales para todas las componentes del
doblete descompuesto). Esta fórmula (con ambos signos ante la raíz) vale para todos los niveles
con IMJ/ < L - t. Para MJ = L+ 1 [o MJ = - (L+!)] no existe el estado que hemos llamado
estado 2 (ó 1); para este nivel el desplazamiento viene dado simplemente por el elemento de matriz V11 (o V22), es decir [eligiendo la constante aditiva de la misma manera que en (l)J:
t:,.E = (lA+bC2)(L+!)-bC2(L+l)2.
(2)
(que coincide con el resultado obtenido según la fórmula (1) con uno de los signos ante la raíz).
3. Determinar el desdoblamiento cuadripolar de los niveles en un campo eléctrico con simetría axil.
Solución.
En un campo que es simétrico respecto del eje z, tenemos:
82ef,/ox2
= é)2q,/oy2 = a,
o2ef,/oz2
=
-2a,
las demás derivadas segundas son iguales a cero. El operador (76.7) de la energía cuadripolar
tiene la forma:
Substituyendo los operadores por sus valores propios, obtenemos para el desplazamiento de los
niveles:
!:,.E= a
ºº
2](2]-l)
§ 77.
[](] + 1)-3MJ2].
El efecto Stark en el hidrógeno
Los niveles del átomo de hidrógeno difieren de los niveles de los demás átomos
en que, en un campo eléctrico homogéneo, experimentan un desdoblamiento proporcional a la primera potencia del campo ( efecto Stark lineal). Este hecho está
ligado con la degeneración accidental de los términos del hidrógeno, degeneración
en virtud de la cual los estados con valores l diferentes (para un número cuántico
principal dado n) poseen las mismas energías. Los elementos de matriz del momento
dipolar para las transiciones entre estos estados no son nunca nulos, por lo cual la
ecuac1on secular da, ya en primera aproximación, un corrimiento de los niveles
diferente de cero.
Para efectuar el cálculo (1) conviene elegir las funciones de onda no perturbadas
de manera que la matriz de perturbación sea diagonal respecto de cada grupo de
estados degenerados entre sí. Esto se consigue cuantificando el átomo de hidrógeno
(1) En los cálculos que siguen no tenemos en cuenta la estructura fina de los niveles del _hidróge!1º·
Por ello, el campo no sólo debe ser débil (condición de aplicabilidad de la teoría de perturbac10nes), smo
a l;l vez tal que el desdoblamiento por efecto Stark sea grande comparado con la estructura fina.
El átomo
312
en coordenadas parabólicas. Las funciones de onda V'n,n.m de los estados estacionarios del átomo de hidrógeno en coordenadas parabólicas vienen definidas por las
fórmulas (37.15-16).
El operador de perturbación (1) (energía del electrón en el campo C ) es
Gz
= t
C(g-r¡);
(el campo está dirigido en el sentido positivo del eje z, y la fuerza que actúa sobre
el electrón, en el sentido negativo). Nos interesan los elementos de matriz correspondientes a las transiciones n1n2m ~ n1'n 2'm', para las que la energía (es decir, el
número cuántico principal n) no cambia. Es fácil ver que de ellos son diferentes de
cero tan sólo los elementos de matriz diagonales:
oooo27r
f l'Pn n ml <fz d V = i<f fff (g2-r¡ )!'Pn n m!
2
1
2
2
1
2
2
d</>d[dr¡
ooo
=
¡tff
fJÍn m2(P1)fn m (P2)(P1 -pl)
2
1
2
2
dp¡dp2
(77.1)
o o
(hemos efectuado la substitución ~ = ne 1, r1 = ne 2). El carácter diagonal de lamatriz considerada respecto del número m es evidente; en lo que concierne a los números n1, n2 , el carácter diagonal respecto de los mismos se sigue de la ortogonalidad
dos a dos de las funciones fn,m con diferentes n1 e iguales valores n (véase más abajo).
Las integraciones respecto de e1 y de Q2 en (77.1) se pueden efectuar por separado;
se obtienen así las integrales calculadas en el § f del apéndice matemático [integral
(f, 6)J. Después de un cálculo simple, obtenemos finalmente para la corrección de
primer orden relativa a los niveles de energía (2}.
(77.2)
o en unidades absolutas:
E<1> = !n(n1 -n 2 )eCn 2/me 2 •
Las dos componentes extremas del nivel que se desdobla corresponden a n1 = n - 1,
n2 = O y n1 = O, n2 = n - l. La distancia entre dichos dos niveles es, según (77.2),
3c9'n(n-1),
es decir, el desdoblamiento total del nivel en el efecto Stark e,s proporcional aproximadamente a n2 • Es natural que el desdoblamiento aumente con el número cuántico principal: cuanto más lejos del núcleo se encuentran los electrones, tanto mayor
1
( )
En este párrafo utilizamos unidades atómicas.
Este resultado fue obtenido por K. SCHWARTZSCHILD y P. EPSTEIN (l 913) basándose en ia antigua
teoría cuántica, y por W. PAULI y E. ScHRODINGER ( 1926) mediante la mecánica cuántica.
2
( )
El efecto Stark en el hidrógeno
313
es el momento dipolar del átomo.
La existencia de un efecto lineal significa que en un estado no perturbado el
átomo posee un momento dipolar cuyo valor medio es
(77.3)
Esto está de acuerdo con que, en un estado determinado por los números cuánticos
parabólicos, la distribución de las cargas en el átomo no es simétrica respecto del
plano z O (véase§ 37). Así, para n1 > n2 el electrón se encuentra preferentemente
en el semiespacio de valores z positivos, por lo que el momento dipolar del átomo
está dirigido en sentido opuesto al campo exterior (¡la carga del electrón es negativa!).
En el párrafo anterior se demostró que un campo eléctrico homogéneo no puede
romper por completo la degeneración - queda siempre la doble degeneración de
los estados que difieren en el signo de la proyección del momento cinético sobre la
dirección del campo (en el presente caso, la degeneración de los estados con proyecciones del momento cinético iguales a ± m). Sin embargo, por las fórmulas
(77 .2) es claro que en el efecto Stark lineal del hidrógeno no se alcanza ni aún este
grado de ruptura de la degeneración: el desplazamiento de los niveles (para valores
dados den y de n1 n2) no depende en absoluto ni de m ni de n2 • Una ulterior ruptura de la degeneración tiene lugar en el efecto de segundo orden; el cálculo de este
efecto es tanto más interesante cuanto que en los estados con n1 n2 desaparece
el efecto Stark lineal.
Para calcular el efecto cuadrático no conviene utilizar la teoría ordinaria de perturbaciones, ya que, de hacerlo, sería necesario manejar sumas infinitas de forma
complicada. En vez de ello utilizaremos el siguiente método, que es una ligera variante de aquélla.
La ecuación de SCHRODINGER para el átomo de hidrógeno en un campo eléctrico
homogéneo tiene la forma:
(V~+E+l/r-Cz)t/J
=
o.
Al igual que la ecuación con 8 = O, esta ecuación admite la separación de variables
en coordenadas parabólicas. La misma substitución (37.7) del§ 37 conduce a las dos
ecuaciones:
2
~(TJd/ )+(!E11-~+!c!112)/2
d17
d17
17
/31 +/32 = 1,
(77.4)
=
-f3J2,
314
El átomo
que difieren de (37.8) en la presencia de los términos que contienen l. En estas ecuaciones consideraremos la energía E como un parámetro que tiene un valor dado,
y las cantidades /31, /32 , como valores propios de los correspondientes operadores
(es fácil comprobar que estos operadores son autoconjugados). Al resolver las ecuaciones, estas cantidades se determinan como funciones de E y de I , hecho lo cual
la condición /31 +/32 = 1 conduce a ]a re]ación que debe existir entre E y 8, es decir,
a la energía como función del campo exterior.
Al resolver aproximadamente las ecuaciones (77.4), consideraremos los términos
que contienen el campo 8 como una pequeña perturbación~ En la aproximación
de orden cero ( 8 = O), las ecuaciones poseen las soluciones ya conocidas
(77.5)
donde las funciones fn m son las mismas que en (37 .16), y donde en vez de la energía
se ha introducido el parámetro
1
E=
y(-2E).
(77.6)
Los correspondientes valores de las cantidades /31, /32 (según las igualdades (37.12),
en las que hay que substituir n por 1/e) serán:
(77.7)
Las funciones / 1 con diferentes valores n1 y un valor dado e son ortogonales entre
sí en tanto que funciones propias de un operador autoconjugado (hemos utilizado
ya antes este hecho, al considerar el efecto lineal); en (77.5) están normalizadas por
las condiciones
co
ffl d11 = 1.
o
Las correcciones de primer orden para /31 y /32 se determinan por los elementos
diagonales de la matri'.l de perturbación:
ex,
00
/J1(l)
=
f
llif f1?d,'
o
fJ2(1>
= -!G
f 112Ndr¡.
o
El cálculo da:
{J1(1> = i8(6ni2+6nilm(+m2 +6n1 +3lml+2)/E2 •
La expresión para 132<1) difiere de ésta en la substitución de n1 por n2 y en el cambio
de signo.
315
El efecto Stark en el hidrógeno
En segunda aproximación tenemos, de acuerdo con las fórmulas generales de la
teoría de perturbaciones:
Las integrales que intervienen en los elementos de matriz (~2Jn n, se han calculado
en el § f del apéndice matemático. Son diferentes de cero tan sólo los elementos
1
(g2)v11 -1
1
,
= (g2\-1,'\ = -2(2n1+!ml)y'(n¡(n¡+lml)]/E2,
(f2\,n 1 -s = (g2)n1 -s,n1 = v'[n1(n1-l)(n¡+ !ml)(n1+lm!-1)]/E2•
Las diferencias que aparecen en los denominadores son iguales a
/31<0>(n1)-/31<0>(n¡') = E(n¡-n1').
Como resultado del cálculo se obtiene:
/31<2> = _ g 2(lml +2n1+ 1)[4m2 + 17(2lmln1+2n12 +lml +2n1)+ 18]/16E5 ;
(la expresión para /3,/ 2) difiere de ésta en la substitución de n1 por n2). Reuniendo las
expresiones obtenidas y substituyéndolas en la relación /31 +/32 = 1, llegamos a la
ecuación
€n-G2n(l7n2 +51(n1-n2)2-9m2 + 19]/16e5+-!Gn(n1-n2)/€2 = l.
Resolviéndola por aproximaciones sucesivas, obtenemos en segunda aproximación
e2
para la energía E = -
2
la expresión
(77.8)
El segundo término es el efecto Stark lineal que ya conocemos, y el tercero, el efecto
cuadrático buscado (G. WENTZEL, l. WALLER, P. EPSTEIN, 1926). Obsérvese que esta
cantidad es siempre negativa, es decir, gracias al efecto cuadrático los términos
siempre se desplazan hacia abajo. El valor medio del momento dipolar se obtiene
derivando (77 .8) respecto del campo; en los estados con n1 = n2 es igual a
(77.9)
Así, la polarizabilidad del átomo de hidrógeno en el estado normal (n = 1, m = O)
es igual a 9/2 (en unidades absolutas: (9/2) (ñ2/me 2)3).
El valor absoluto de la energía de los términos del hidrógeno disminuye rápida-
316
El átomo
mente al aumentar el número cuántico principal n, y el desdoblamiento por efecto
Stark crece. En relación con esto es interesante considerar el efecto Stark en los niveles
fuertemente excitados cuando los campos son tan intensos que el desdoblamiento
que provocan es comparable con el valor de la energía del propio nivel, con lo cual
1a teoría de perturbaciones es inaplicable (1). Esto puede hacerse utilizando el carácter cuasiclásico de los estados con grandes valores de n.
La substitución
/1
=
x1/v'f,
(77.10)
lleva las ecuaciones (77.4) a la forma:
(77.11)
Pero cada una de estas ecuaciones tiene la forma de una ecuación de ScHRODINGER
unidimensional, representando el papel de energía total de la partícula el término
E/4, y el papel de energía potencial, las funciones
(77.12)
respectivamente.
En las figs. 25 y 26 se presenta la forma típica de estas funciones (para m > I ).
De acuerdo con las reglas de cuantificación de BoHR-SOMMERFELD (48.2), escribiremos:
e.
f v'{2[!E- Ui(,)]} dg = (n +fr;r,
1
f1
(77.13)
711
f v'{2[!E- Ul71)]} d71
= (n2+Hrr,
711
(1) La aplicabilidad de la teoría de perturbaciones a los niveles elevados exige que la perturbación
sea pequeña tan sólo respecto de la energía del propio nivel (de la energía de enlace del electrón), y no
respecto de los intervalos entre niveles. En efecto, en el caso cuasiclásico (al que corresponden precisamente
los estados fuertemente excitados) la perturbación puede considerarse pequeña si la fuerza que ejerce
es pequeña con relación a las fuerzas que actúan sobre la partícula en el sistema no perturbado; pero esta
condición es equivalente a la indicada más arriba.
317
El efecto Stark en el hidrógeno
(n1, n2 son números enteros) (1). Estas ecuaciones determinan en forma implícita la
dependencia de los parámetros {J1 , {J2 respecto de E. Junto con la igualdad {J1 + {J2 = 1,
determinan, por consiguiente, las energías de los niveles desplazados por el campo
eléctrico. Las integrales en las ecuaciones (77 .13) se pueden reducir a integrales
elípticas; la resolución de estas ecuaciones es sólo posible numéricamente.
El efecto Stark en campos intensos se complica todavía con otro fenómeno
- la ionización del átomo por el campo eléctrico. La energía potencial del electrón
en un campo exterior tfz toma valores negativos tan grandes cuanto se quiera para
z ~ - oo. Al sumarse a la energía potencial del electrón dentro del átomo, aquella
energía conduce a que el dominio en que es posible el movimiento del electrón
(cuya energía total E es negativa) pasa de quedar limitado a la región interior del
átomo, a extenderse a gran distancia del núcleo en la dirección del ánodo. Estas
dos regiones están separadas por una barrera de potencial cuya anchura disminuye
<12
E,4
FIG. 25
FIG. 26
al aumentar el campo. Pero sabemos que en mecánica cu'ántica existe siempre una
cierta probabilidad no nula de que la partícula atraviese la barrera de potencial.
En el caso presente, el paso del electrón desde el oominio interior del átomo al exterior
a través de la barrera no es ni más ni menos que el proceso de ionización del mismo.
En campos débiles la probabilidad de esta ionización es sumamente pequeña. Sin
embargo, dicha probabilidad crece exponencialmente con el campo y en campos
suficientemente fuertes llega a ser considerable (2).
1
( )
Un estudio detenido muestra que se obtiene un resultado más preciso si se escribe m2 en vez de
m2 - 1 en las expresiones de Ui, U2 • Los números enteros ni, n2 coinciden entonces con los números cuánticos parabólicos.
2
( )
Este fenómeno puede servir de ilustración de cómo una perturbación pequeña puede cambiar el
carácter del espectro energético. Ya un campo débil tf basta para crear una barrera de potencial y hacer
de la región a gran distancia del núcleo un dominio en principio accesible al electrón. Como consecuencia,
el movimiento del electrón pasa a ser, estrictamente hablando, un movimiento infinito, con lo cual el
espectro energético pasa de ser discreto a ser continuo. Con todo, la solución formal obtenida por el método
de la teoría de perturbaciones tiene un significado físico. Dicha solución determina los niveles de energía
de los estados que, si no del todo estacionarios, sí son « casi estacionarios». El átomo que se encuentra
en uno de estos estados en un cierto instante inicial, permanece en él durante un intervalo muy largo de
tiempo.
Por otra parte, la serie a que conduce la teoría de perturbaciones para la descomposición de los niveles
por efecto Stark no puede ser convergente en el sentido estricto de la palabra, sino tan sólo de manera
asintótica; a partir de un determinado término de la serie (tanto más alejado cuanto menor es la magnitud
de la perturbación) los términos que siguen no tienden a cero, sino que crecen.
318
El átomo
PROBLEMA
Determinar la probabilidad (por unidad de tiempo) de ionización de un átomo de hidrógeno
(en el estado fundamental) en un campo eléctrico fuerte.
Solución. En coordenadas parabólicas se tiene una barrera de potencial « a lo largo de la
coordenada r¡ » (fig. 26); al proceso de «arrancar» el electrón del átomo en la dirección z~ - oo
corresponde su paso al dominio de grandes valores r¡. Para determinar la probabilidad de ionización hay que investigar la forma de la función de onda para grandes valores r¡ (y valores no
grandes de ~; veremos más adelante que en la integral que determina el flujo total de probabilidad
del electrón que escapa del átomo intervienen los valores pequeños de ~). La función de onda del
electrón en el estado normal (cuando no existe el campo) es
(1)
Cuando existe el campo, la dependencia de tp respecto de ~ en la región que nos interesa se puede
considerar que es la misma que en (1) y para determinar la dependencia respecto de r¡ tenemos
la ecuación
(2)
donde x = Vr¡tp (esta es la ecuación (77.11) con E = - !, m = O, /32 = D. Sea r¡0 un valor de 1J
(perteneciente al «interior» de la barrera) tal que 1 ~ 1/o ~ 1/8. Para 11 ~ 1/o, la función de onda
es cuasiclásica. Por otra parte, dado que la ecuación (2) tiene la forma de una ecuación de SCHRODINGER unidimensional, podemos utilizar las fórmulas (50.4). Aplicando en el punto r¡ = r¡0 la
expresión exacta (1) de la función de onda, obtenemos en el dominio exterior a la barrera la
expresión
donde
J[-i+ ~+-+!811]·
1
P('ri) =
27}
41]2
En lo que sigue nos interesa solamente el cuadrado lxl 2, Carece por ello de importancia la parte
imaginaria del exponente. Llamando r¡ 1 la raíz de la ecuación p(r¡) = O, tenemos:
lxl 2 =
?Jo IPol
711
-e-f-exp[-2 JIPI d71-710]·
'TT'
p
710
En el coeficiente de la exponencial hagamos
en el exponente, en cambio, hay que conservar también el término siguiente del desarrollo:
319
El efecto Stark en· el hidrógeno
lxl2
=
f
111
-e exp[1ry(t.i'r¡-l)
TJo
f
d
111
v(l-t.i'r¡) dr¡+
'lo
r¡
r¡y(l-t.i'r¡)
TJo],
110
(donde T/i ~ 1/C ). Efectuando la integración y prescindiendo donde sea posible de 1704frente a
la unidad, obtenemos:
lxl2
4
e-f
= -e-21st1
.
(3)
v( Cr¡-1)
1rt.i'
La corriente total de probabilidad a través de un plano perpendicular al eje z (es decir, la probabilidad de ionización buscada, w) es
00
W
=
f lifal vz21T1' dr.
2
o
Para 17 grande (y
~
pequeña) se puede hacer
dr = dy(fr¡) ~ !v(r¡/f) df.
Substituyendo también en vez de la velocidad del electrón
va;~ vr2<-1+1cr¡)J = v(Cr¡-1),
obtenemos
00
w
f
= lxl 21ry( Cr¡-1) df
o
4
tB'
fo e-f df'
00
= -e-2 ¡st!
es decir, en definitiva:
w =
o bien, en unidades ordinarias:
(4/C)e-2 13t1,
CAPÍTULO
XI
LA MOLÉCULA DIATÓMICA
§ 78.
Términos electrónicos de una molécula diatómica
En la teoría de las moléculas representa un papel fundamental el hecho de que
las masas de los núcleos de los átomos son muy grandes comparadas con la masa
de los electrones. Gracias a esta diferencia entre las masas, las velocidades del movimiento de los núcleos en la molécula son pequeñas respecto de las velocidades de
los electrones. Esto ofrece la posibilidad de considerar el movimiento electrónico
suponiendo los núcleos en reposo y situados a distancias dadas unos de otros. Al
determinar los niveles de energía Un de un tal sistema, encontramos los llamados
términos electrónicos de la molécula. A diferencia de los átomos, en los que los
niveles energéticos eran números determinados, los términos electrónicos son no
números, sino funciones de ciertos parámetros - las distancias entre los núcleos
de la molécula. En la energía Un se incluye también la energía electrostática de
interacción de los núcleos entre sí, de forma que Un es por su propia esencia la energía
total de la molécula para una distribución dada de los núcleos en reposo.
Comenzaremos el estudio de las moléculas con las de tipo más simple - las
moléculas diatómicas, que son las que admiten un análisis teórico más completo.
Uno de los principios fundamentales de la clasificación de los términos atómicos
era la clasificación de acuerdo con los valores del momento orbital total L. En las
moléculas, en cambio, no existe en general una ley de conservación del momento
cinético orbital total de los electrones, ya que el campo eléctrico de los varios núcleos
no presenta simetría central.
En las moléculas diatómicas, sin embargo, el campo posee ~imetría axil respecto
del eje que pasa por los dos núcleos. En consecuencia, se conserva aquí la proyección
del momento cinético orbital sobre dicho eje y podemos clasificar los términos
electrónicos de la molécula según los valores de esta proyección. El valor absoluto
de lá proyección del momento cinético orbital sobre el eje de la molécula se suele
designar con la letra .\; esta cantidad toma los valores O, 1, 2, ... Los términos con
valores diferentes .\ se designan con letras mayúsculas griegas, que corresponden
a los símbolos latinos de los términos atómicos con valores L distintos. Así, para
Término.'> electrónico.., de u11a molPcula dfotómica
321
.\ = O, 1, 2, se habla de términos 2:, n, ~' respectivamente; de ordinario, no hay
que considerar valores de .\ mayores.
Cada estado electrónico de la molécula se caracteriza, además, por el spin total
5 de todos sus electrones. Cuando 5 es diferente de cero, se produce la degeneración
asociada con las direcciones posibles del spin total, cuya multiplicidad es 25 :- I (1).
El número 25 + 1, al igual que en los átomos, se llama multiplicidad del término y se
escribe en forma de superíndice del símbolo del mismo; así, :311 representa un término con ~1 = 1, S = 1.
Junto con los giros de ángulo arbitrario en torno del ~je, la simetría de la molécula
admite también la reflexión en un plano cualquiera que pase por dicho eje. Si se
aplica esta reflexión, la energía de la molécula se conserva invariable, evidentemente.
En cambio, el estado que se obtiene como resultado de esta aplicación no será
exactamente idéntico al estado de partida. Así, en la reflexión en un plano que pase
por el eje de la molécula, cambia el signo del momento cinético respecto de este eje.
Llegamos así al resultado que todos los términos electrónicos con valor .. 1 distinto
de cero son doblemente degenerados - a cada valor de la energía corresponden dos
estados que difieren en el sentido de la proyección del momento cinético orbital
sobre el eje de la molécula. En lo que concierne al caso A = O, en general no varía
el estado de la molécula en la reflexión, de modo que los términos 2: no son degenerados. La función de onda de un término 2: puede tan sólo quedar multiplicada
por una constante como resultado de una reflexión. Dado que aplicar dos veces
una reflexión respecto de un mismo plano equivale a la transformación idéntica,
esta constante debe ser igual a
l. De esta manera es necesario distinguir los términos ~ cuya función de onda no cambia de signo en la reflexión y los términos
cuya función de onda cambia de signo. Los primeros se representan por ~>, y los
segundos, por ~-.
Si la molécula está constituida por dos átomos idénticos, aparece una nueva
simetría y con ella una característica más de los términos electrónicos. U na molécula
diatómica formada por núcleos iguales posee además un centro de simetría, que
coincide con el punto medio del segmento que une a los dos núcleos (2). (Elegimos
este punto como origen de coordenadas). Por ello el hami1toniano es invariante
respecto del cambio simultáneo de signo de las coordenadas de todos los electrones
de la molécula (dejando fijas las coordenadas de los núcleos). Dado que el operador
de esta transformación (3) conmuta también con el operador del momento cinético
(') Pn:scindiremos aquí de la estructura tina, ligada con las interacciones relativistas (véase más adelante,~~ 83, 84).
(') Fsta molécula posee también un plano de simetría que es perpendicular al eje de la molécula en
su punto medio. Sin embargo, no hay necesidad de considerar este elemento de simetría en particular, ya
que la existencia de este plano se sigue automáticamente del hecho de que exista aquel centro y aquel eje
de simetría.
(ª) ¡No se la confunda con la inversión de las coordenadas de todas las partículas del sistema (cf. § 86)!
322
La molécula diatómica
orbital, vemos la posibilidad de clasificar los términos con valores dados A teniendo
en cuenta, además, su paridad: la función de onda de los estados pares (g) no cambia
al cambiar el signo de las coordenadas de los electrones, y las impare'i (u), cambian
de signo. Los índices u, g, que indican la paridad, se suelen escribir como subíndices
del símbolo del término: Ilu, Iry, etc.
Indicaremos finalmente una regla empírica según la cual en la inmensa mayoría
de moléculas diatómicas químicamente estables el estado electrónico normal posee
simetría completa - la función de onda electrónica es invariante respecto de todas
las transformaciones de simetría de la molécula. Como se verá en el § 81, en la inmensa mayoría de los casos es también igual a cero el spin total Sen el estado normal. Con otras palabras, el término fundamental de una molécula es 1 l:+, y si la
molécula está formada por átomos iguales, dicho término es 1 l:+ a (1).
PROBLEMA
Efectuar la separación de variables en la ecuación de ScHRÓDINGER para los términos electrónicos del ion H 2 + utilizando coordenadas elípticas.
Solución.
reposo es:
La ecuación de Schrodinger para un electrón en el campo de dos protones en
(utilizamos unidades atómicas). Las coordenadas elípticas ~. r¡ se definen por las relaciones
y la tercera coordenada cf, es el ángulo de giro en tomo del eje que pasa por los dos núcleos, situados a una distancia R el uno del otro (2). El operador de Laplace ~e escribe en estas coordenadas:
Haciendo
obtenemos para X e Y las siguientes ecuaciones:
(') Una excepción a estas reglas lo son las moléculas 0 2 (término normal ªl:-g)y NO (término normal "11).
2
( )
Véase tomo 1, Mecánica, § 48.
La intersección de término.-. electrónicos
323
dXJ + ( .lER2g2+zRt+A--A2 ) X= O
-d [ (t2-1)2
dg
dg
s
g2 - 1
'
dYJ + ( -fER2r¡2-A- -A2-) Y= O,
-d [ (l-172)d17
d77
l-17 2
donde A es el parámetro de separación.
Cada término electrónico se caracteriza por tres números cuánticos: ~\ y los dos números n;,
n,¡, que determinan el número de ceros de las funciones X(~) e Y(17). Dado que todos estos números
están ligados con funciones de
la intersección de los términos
lesquiera, entre ellos los valores
también la misma simetría (cf.
§ 79.
variables diferentes, no hay, en general, razón alguna que impida
E(R) que difieran en los valores de dos números cuánticos cuadel par n~, n,1 para el mismo valor~\, aunque tales términos poseen
la nota en la pág. 325).
La intersección de términos electrónicos
Los términos electrónicos de una molécula diatómica son funciones de un parámetro - la distancia r entre núcleos. Estas funciones se pueden representar gráficamente expresando la energía como función de r. La cuestión relativa a la intersección de las curvas que representan los diferentes términos ofrece entonces fundamental interés.
Sean Vi(r), Ulr) dos términos electrónicos diferentes. Si se cortan en un cierto
punto, cerca de éste las funciones U1 , V 2 tomarán valores próximos. Para resolver
el problema de si es o no posible esta intersección, conviene plantearlo de la siguiente
manera.
Consideremos un punto r 0 en el que las funciones U1(r), Ulr) toman valores muy
próximos entre sí, pero no iguales (llamémoslos E 1 y E 2) y consideremos si no sería
posible hacer que V1 y V 2 se igualen desplazando este punto en una pequeña cant:dad ,5r. Las energías E 1 y E 2 son los valores propios del hamiltoniano H0 del sistema
de electrones en el campo de los núcleos, que se encuentran a la distancia rO uno de
otro. Si se incrementa la distanciar en or, el hamiltoniano se transforma en I10 +P-,
donde P- = 8r. oll0 /or es una pequeña corrección; los valores de las funciones U1, U2
en el punto r0 +,5r se pueden considerar como valores propios del nuevo hamiltoniano. Esta manera de abordar el problema permite determinar los valores de
los términos Ui(r) y U2(r) en el punto r0 +,,r mediante la teoría de perturbaciones,
considerando r como una perturbación del operador H0 •
Sin embargo, el método ordinario de la teoría de perturbaciones es aquí inaplicable, ya que los valores propios de la energía, E 1 y E 2 , del problema no perturbado
son muy próximos entre sí y su diferencia, en general, no es grande comparada con
la magnitud de la perturbación (no se cumple la condición (38.8)).
La molécula diatómica
324
Dado que cuando, en el límite, la diferencia E 2 - E 1 se anula pasarnos a un caso
de valores propios degenerados, es natural intentar aplicar al caso de valores propios
próximos un método análogo al desarrollado en el § 39.
Sean tp1 , tp2 las funciones propias del operador no perturbado H0 , correspondientes a las energías E 1 , E 2 • Como aproximación inicial de orden cero tornemos, en vez
de las funciones 1Pi y 1P2 , combinaciones lineales de las mismas de la forma
lf =
(79.1)
C1'f1 +Cz'f2•
Substituyendo esta expresión en la ecuación perturbada
(79.2)
obtenernos:
Multiplicando esta ecuación a la izquierda, sucesivamente, por
grando, se obtienen dos ecuaciones algebraicas:
c 1 (E1
+ V 11-E)+c 2V 12
c1V21 +clE2+
v•i*
y
= O,
"1/' 2
*
e inte-
(79.3)
V22-E) = O,
donde Vik = Sifi/P-tf,k dq. En virtud del carácter herrnítico del operador V, las
cantidades V11 y Vi 2 son reales, y V12 = V21 *. La condición de compatibilidad de
estas ecuaciones es
E 1+ V 11 -E
V21
V12
E2+ V22-E
1
=
o,
de donde se sigue:
E= }(E1+E2+ Vn+ V22)±v[HE1-E2+ Vu-V22) 2+l V12l 2J.
(79.4)
Esta fórmula determina en primera aproximación los valores propios buscados de la
energía.
Si los valores de la energía de ambos términos pasan a ser iguales en el punto
r0 +<5r (los términos se cortan), esto significa que los dos valores E determinados
por la fórmula (79.4) coinciden. Para ello es necesario que el radicando en (79.4)
se anule. Dado que éste es suma de dos cuadrados, como condición para que exista
un punto de intersección de los términos obtenernos las ecuaciones
(79.5)
Sin embargo, disponernos de un solo parámetro arbitrario, que determina la perturbación V - el valor del desplazamiento r5r. Por esto las dos ecuaciones (79.5)
La intersección de términos electrónicos
325
(suponemos que las funciones "Pi,, v·2 se han elegido reales; entonces también V12
es real) no pueden en general quedar satisfechas simultáneamente.
Puede ocurrir, sin embargo, que el elemento de matriz V12 se anule idénticamente;
queda entonces tan sólo una ecuación (79.5), la cual puede quedar satisfecha mediante una elección adecuada de ,5r. Esto ocurre en todos los casos en que los dos
términos considerados poseen simetría diferente. Por simetría entendemos aquí
todas las formas posibles de simetría - respecto de rotaciones en torno del eje,
de reflexiones en planos que pasan por el mismo, de la inversión, y también respecto
de las permutaciones de los electrones Para una molécula diatómica, esto significa
que se puede tratar de términos con valores A diferentes, de distinta paridad o multiplicidad, y para términos I:, además, de términos 1: + y 1:-.
En la demostración de esta proposición es esencial el hecho de que el operador V
(como el propio hamiltoniano) conmuta con todos los operadores de simetría de
la molécula - con el operador del momento cinético respecto del eje, con los operadores de reflexión e inversión, con los operadores de permutación de los electrones.
En los§§ 29, 30 se demostró que para una magnitud escalar cuyo operador conmuta
con los operadores del momento cinético y de inversión son solamente diferentes
de cero los elementos de matriz para las transiciones entre estados de igual momento
cinético e igual paridad. Esta demostración, esencialmente en la misma forma, conserva su validez en el caso general de un operador de simetría arbitrario. No nos
detendremos en repetirla aquí, tanto más cuanto que en el § 97 se dará otra demostración general basada en la teoría de grupos.
Llegamos de esta manera al resultado de que en una molécula diatómica pueden
cortarse solamente los términos de diferente simetría, mientras que, en cambio, la intersección de términos de simetría igual es imposible (E. WIGNER y J. VON NEUMANN,
1929). Si como resultado de cualquier cálculo aproximado obtuviéramos dos términos de igual simetría que se cortan, al calcular la siguiente aproximación dichos
términos se separarían conforme se indica en la fig. 27 mediante líneas de trazo
continuo (1).
Subrayemos que este resultado se refiere no sólo a las moléculas diatómicas,
sino que, en realidad, es un teorema general de mecánica cuántica válido siempre
que el hamiltoniano contiene un parámetro, como consecuencia de lo cual también
sus funciones propias son funciones de dicho parámetro.
En una molécula poliatómica los términos electrónicos son funciones no de un
parámetro, sino de varios - las distancias entre los diferentes núcleos. Sea s el
(1) De esta regla existe una singular excepción, excepción que se presenta cuando el problema relativo
a la determinación de los términos electrónicos admite la total separación de variables (véase el problema
del § 78).
326
La molécula diatómica
u<r>
FIG. 27
número de distancias independientes entre núcleos; en una molécula N-atómica
(N > 2), para una distribución arbitraria de los núcleos este número es igual a s =
= 3N - 6. Cada término Un(r 1 , ... , rs) representa, desde el punto de vista geométrico,
una superficie en un espacio des+ I dimensiones y se puede hablar de intersecciones
de estas superficies según multiplicidades de diferentes dimensiones - desde O
(intersección en un punto) hasta s - l. Todos los razonamientos desarrollados antes
conservan su validez, con la única diferencia de que la perturbación V viene determinada ahora no por un parámetro, sino por s parámetros (los corrimientos or1, ... ,
ór8 ). Pero ya para dos parámetros las dos ecuaciones (79.5) pueden, en general,
,quedar satisfechas. Llegamos así al resultado de que en las mol~culas poliatómicas
dos términos cualesquiera pueden cortarse. Si los términos tienen la misma simetría,
la intersección se determina por las dos condiciones (79.5), de lo que se sigue que el
número de dimensiones de la variedad determinada por la intersección es s - 2.
Pero si los términos son de diferente simetría, queda sólo una condición y la intersección es una variedad de s - I dimensiones.
u
Fm. 28
Relación entre términos moleculares y atómicos
327
Así, para s = 2 los términos se representan por superficies en un sistema de coordenadas tridimensional. La intersección de estas superficies es una línea (s - 1 = 1),
cuando los términos son de diferente simetría, y un punto (s - 2 = O) cuando la
simetría es la misma. No es difícil determinar qué forma tienen en el último caso
las superficies cerca del punto de intersección. Los valores de la energía cerca del
punto en que se cortan los términos vienen determinados por la fórmula (79.4).
En esta expresión, los elementos de matriz V11 , V22 . V12 son funciones lineales de los
desplazamientos ,5r 1, r5r 2 , y, por ello, son también funciones lineales de las propias
distancias r 1 , r2 • Pero una ecuación de este tipo define, como es sabido por geometría
analítica, un cono elíptico. Por lo tanto, cerca del punto de intersección los términos
vienen representados por la superficie de un cono elíptico completo colocado arbitrariamente (fig. 28).
§ 80.
Relación entre los términos moleculares y los atómicos
Aumentando en una molécula diatómica la distancia entre núcleos, obtenemos
en el límite dos átomos aislados (o dos iones). En relación con esto surge la cuestión
de qué correspondencia existe entre un término electrónico de la molécula y los estados
de los átomos que se obtienen al descomponerla. Esta relación no es biunívoca: al
acercar dos átomos que se encuentran en determinados estados, se puede obtener
una molécula en diferentes estados electrónicos.
Supongamos primero que la molécula está constituida por dos átomos distintos.
Supongamos, además, que los átomos aislados se encuentran en estados con momentos cinéticos orbitales L 1, L 2 y spins S1 , S2 y sea L 1 > L 2 • Las proyecciones de los
momentos cinéticos sobre la recta que une los dos núcleos toman los valores M 1 =
= - L1 , - L1 + 1, ... , L1 y M 2 = - L 2 , - L2 + 1, ... , L 2 • El valor absoluto de la suma
M 1 +M 2 determina el momento cinético A que se obtiene al aproximar los átomos.
Combinando todos los valores posibles M 1 y M 2, encontramos que los diferentes
valores A = JM1 + M 2 / se obtienen tantas veces como se indica a continuación:
A= L1+L2
L1+Lz-l
dos veces
cuatro veces
L1-L2
2(2L 2+ 1) veces
Li-La-1
2(2L 2+ 1) veces
1
2(2L 2 + 1) veces
o
2L 2 +1 veces
328
La molécula diatómica
Recordando que todos los términos con A =f=. O son doblemente degenerados
y que no lo son aquéllos para los que A= O, encontramos que se pueden obtener:
1 término con A = L1 + L2 ,
2 términos con A = L1 + L 2 - l,
2L 2 + 1 términos con A
= L1 -L 2
(80.1)
2L 2 +l términos con A= L1 -L 2 -l,
2L 2 + 1 términos con A = O;
en total (2L 2 + 1) (L1 + 1) términos con valores A desde O hasta L1 + L 2 •
Los spins S1 , S2 de los dos átomos se componen para formar el spin total de la
molécula de acuerdo con la regla general de composición de momentos, dando los
siguientes valores posibles de S:
(80.2)
Combinando cada uno de estos valores con todos los valores de A (80.1 ), obtenemos
la lista completa de todos los términos posibles de la molécula que se forme.
Para los términos í: se plantea aun la cuestión de cuál sea su signo. Es fácil
resolverla observando que las funciones de onda de la molécula se pueden escribir,
parar---+ =, en forma de productos (o de suma de productos) de funciones de onda
de ambos átomos. El momento cinético A = O puede obtenerse o como resultado
de componer los momentos cinéticos no nulos de los átomos M 1 = - M 2 , o bien
para M 1 = M 2 = O. Las funciones de onda del primer átomo y del segundo las
designaremos por 11m.w,, 1P( 2 )~w Para M = \M 1 \ = \M2 =f=. O, formemos los producros simétricos y antisimétricos
2
•
1
tf;+ = tf;<1lMtf;<2 )-M+tJPl_Mtf;<2lM,
¡f;- = ¡f;(l)Mtp(2)_M_tp(1}_Mtp(2}M·
La reflexión en un plano vertical (un plano que pase por el eje de la molécula) cambia el signo de la proyección del momento cinético sobre el eje, de modo que vP>M,
1P( 2 >¡w se transforman, respectivamente, en 1P( 1 >_.,1 , 11'( 2)_.w, y recíprocamente. Con
esto la función 1J!+ no varía, y la 1p-, cambia de signo: la primera corresponde, por
consiguiente, a un término í:+, y la segunda, a un término í:-. Así, pues, para cada
valor M se obtiene un término í:+ y un término í:-. Dado que M puede tener L2
valores diferentes (M = 1, ... , L2), obtenemos en total L 2 términos í:+ y L2 términos
í:-
329
Relación entrt> términos moleculares y atómicos
Si, en cambio, se tiene .M1 = .M2 = O, la función de onda de la molécula es de la
forma '!jJ = %lI)%( 2). Para ver cuál es el comportamiento de la función %(I) en una
reflexión en un plano vertical, elijamos el sistema de coordenadas con origen en el
centro del primer átomo y el eje z a lo largo del eje de la molécula y observemos que
la reflexión en el plano vertical xz equivale al producto de la inversión respecto
del origen de coordenadas y una rotación de 180º en torno del eje y. En la inversión
la función %(I) queda multiplicada por 11 , donde 11 = ± 1 es la paridad del estado
dado del primer átomo. Por otra parte, el resultado de aplicar a la función de onda
una rotación infinitamente pequeña (y con ella, el de toda rotación finita) viene
determinado completamente por el momento cinético orbital total del átomo. Por
consiguiente, basta considerar el caso particular de un átomo con un solo electrón
de momento cinético orbital l (y componente z del momento m = O); escribiendo
en el resultado L en vez de /, obtenemos la solución buscada para un átomo cualquiera. La parte angular de la función de onda de un electrón con m = O es, salvo
un coeficiente constante, P 1(cos8) (véase (28. 7)). Una rotación de 180º en torno
del eje y equivale a la transformación x _,.. - x, y_,.. y, z _,.. - z o bien, en coordenadas esféricas r _,.. r, e _,.. n - e, <p _,.. n - <p. Con esto coso _,.. - cose, y la
función P 1(cos 8) queda multiplicada por (- 1)1.
Llegamos así a la conclusión de que, como resultado de la reflexión en un plano
vertical, la función %l1 ) queda multiplicada por (- l)L 1J1 . Análogamente, %( 2)
queda multiplicada por (- l)L J2 , de modo que la función de onda '!jJ = %(I) ,¡} 2)
quedará en definitiva multiplicada por (- l)L 1 +L 2J/2. El término será :E+ o 1:según este factor sea
1 o - l.
2
+
+
Reuniendo los resultados obtenidos, vemos que del número total 2L2 1 de
términos :E (de cada una de las multiplicidades posibles) L 2 1 términos serán
términos :E+, y L 2 términos serán términos :E- (si (- lf 1 +L 2J/2 = + 1), o recíprocamente (si (- 1f,+L f/2 = - 1).
+
2
Pasemos ahora a considerar una molécula constituida por átomos idénticos.
Las reglas de composición de los spins y de los momentos orbitales de los átomos
para formar los valores totales S y A de la molécula siguen siendo aquí las mismas
que para una molécula constituida por átomos diferentes. La novedad consiste en
que los términos pueden ser pares o impares. En relación con esto hay que distinguir
dos casos: la unión de átomos que se encuentran en estados iguales y la unión de
átomos que se encuentran en estados diferentes.
Si los átomos se encuentran en estados distintos (1), el número total de términos
posibles queda multiplicado por dos con relación al número que se obtendría en el
caso de átomos diferentes. En efecto, la reflexión en el origen de coordenadas (que
(')
En particular, puede tratarse de la unión de un átomo neutro y un átomo ionizado.
La molécula diatómica
330
coincide con el punto medio del eje de la molécula) conduce a una permutación de
los estados de ambos átomos. Simetrizando o antisimetrizando la función de onda
de la molécula respecto de la permutación de dichos estados, se obtendrán dos términos (con iguales A y S), de los cuales uno será par, y el otro, impar. Obtenemos
así, en total, números iguales de términos pares e impares.
Si, en cambio, ambos átomos se encuentran en el mismo estado, el número total
de estados sigue siendo el mismo que para una molécula constituida por átomos
distintos. En lo que concierne a la paridad de estos estados, el análisis (que no efectuamos aquí debido a su complejidad) (1) conduce a los resultados siguientes:
Sean Ng y Nu los números de términos pares e impares con valores dados A y
S. Entonces:
si A es impar, Ng = Nu;
si A es par y Ses par (S = O, 2, 4, ... ), Ng = N 11 +l;
si A es par y Simpar (S = 1, 3, ... ), Nu = Ny+I.
Finalmente, entre los términos L hay que distinguir todavía entre términos L+
y L-. Vale aquí la siguiente regla:
si Ses par, N+ g = N- 11 +I = L+1,
si Ses impar, N+ u= N-g+1 = L+I
(donde L 1 = L 2 == L). Todos los términos L+ tienen paridad (- I)S, y todos los
términos L-, paridad (- 1)8 +1.
Junto a la cuestión que hemos analizado de cuál es la relación entre los términos
moleculares y los términos atómicos que se obtienen cuando r -+ oo, cabe también
plantearse el problema de cuál es la relación entre los términos moleculares y los
términos del « átomo compuesto» que se obtendría parar--+ O, es decir, si los dos
núcleos se reunieran en un mismo punto (por ejemplo, la relación entre los términos
de la molécula H 2 y los del átomo He). Acerca de esto se pueden obtener sin dificultad las siguientes reglas. A partir de un término del átomo « compuesto » con
spin S, momento cinético orbital L y paridad I pueden obtenerse, al « separar los átomos componentes », términos moleculares con spin igual a S y momento cinético relativo al eje igual a A = O, 1, ... , L, obteniéndose un término para cada uno de estos valores A. La paridad del término molecular coincide con la paridad I del término atómico
(g para I = + 1 y u para I = - 1). El término molecular A = O será un término
L+, si (- l)Lf =+l, o un término L- si (- I)LJ = -1.
(')
Puede encontrarse en el trabajo original: E.
WIGNER,
E.
W1TMER.
Zs.f Physik, 51,859, 1928.
331
La valencia
PROBLEMAS
J. Determinar los términos posibles de las moléculas H 2 , N 2 , 0 2 , Cl 2 , que se pueden obtener
al unir dos átomos en sus estados normales.
Solución. De acuerdo con las reglas expuestas en el texto, encontramos los siguientes términos posibles:
molécula H 2 (átomos en estados 2S):
»
N2 (
»
»
»
'S):
lL+a,
»
Cl 2
(
21L+a,
»
02 (
»
»
lL-u,
»
»
21L+a,
lL-u,
ªL+u,
sL+a,
7L+u;
2P):
»
lIJa,
»
lIJu,
1~ª'
23L+u,
aL-a,
ªIIa,
ªIlu,
3~u;
l~a,
23L+u,
3L-a,
ªIlu,
ªIla,
3~u,
5L-u,
5IJa,
ªP):
lIJa,
lIJu,
25L+a,
5IJu,
5~a·
(el número delante del símbolo de un término indica el número de términos del tipo dado, si este
número es mayor que la unidad) ..
2.
Lo mismo para las moléculas HCI, CO.
Solución. Al unir átomos diferentes, es también esencial la paridad de sus estados. De acuerdo
con la fórmula (31.5), encontramos que los estados normales de los átomos H, O, C, son pares,
y los de los átomos CI, impares (véanse en la tabla 3 las configuraciones electrónicas de estos
átomos). Según las reglas expuestas en el texto, se encuentra:
molécula HCl (átomos en estados ªSu 2P.u):
1,aL+, 1,aIJ;
))
co ( ))
»
»
ªPu, ªPu):
z1.a,sL+,
§ 81.
1,s,sL-,
zi.s.sII, ·1,s,s~.
La valencia
La propiedad de los átomos de unirse unos con otros para formar una molécula
se describe mediante el concepto de valencia. A cada átomo se le atribuye una determinada valencia, y en la unión de los átomos sus valencias deben saturarse mutuamente, es decir, a cada enlace de valencia de un átomo debe corresponder un enlace
de valencia de otro átomo. Por ejemplo, en una molécula de metano, CH.1, cuatro
enlaces de valencia del átomo tetravalente de carbono se saturan por los enlaces
332
La molécula diatómica
de valencia de los cu<;1.tro átomos univalentes de hidrógeno. Al pasar a la interpretación física de la valencia, comenzaremos por el ejemplo más simple - la unión
<le dos átomos de hidrógeno en la molécula H 2 •
Consideremos dos átomos de hidrógeno que se encuentran en el estado fundamental (2S). Al acercarlos puede obtenerse un sistema que se encuentra en el estado
molecular 1 L + g o en el 3 L + u· El término singlete corresponde a la función de onda
de spin antisimétrica, y el término triplete, a la función simétrica. Por el contrario, la
función de onda de coordenadas en el término 1 ~ es simétrica, y en el término 3 L,
antisimétrica. Es evidente que tan sólo el término 1 L puede ser el término fundamental de la molécula H 2 • En efecto, la función de onda antisimétrica cf,(r1, r2) (r1 , r2 son
los vectores posición de los dos electrones) presenta siempre nodos (se anula para
r1 = r2) y no puede por ello corresponder al estado más bajo del sistema.
El cálculo numérico prueba que el término electrónico 1 L presenta efectivamente
un mínimo acentuado, mínimo que corresponde a la formación de la molécula
estable H 2 • En cambio, en el estado 3 L la energía U(r) disminuye con monotonía
al aumentar la distancia entre núcleos, lo que corresponde a la repulsión mutua de
los dos átomos H (1) (fig. 29).
r
FIG. 29
De esta manera, el spin total de la molécula de hidrógeno en el estado fundamental
es igual a cero, S = O. Las moléculas de prácticamente todos los compuestos químicamente estables de los elementos de los grupos principales poseen, de hecho,
(l) Prescindimos aquí de las fuerzas de atracción de van der Waals entre los átomos (véase§ 89). La
existencia de estas fuerzas trae consigo la existencia de un mínimo (situado a mayores distancias) también
para la curva U(r) del término 3 L. Este mínimo, sin embargo, es muy poco profundo comparado con el
mínimo de la curva 1L y a la escala de la fig. 29 ni tan solo se notaría.
La valencia
333
esta propiedad. Entre las moléculas inorgánicas constituyen excepción las moléculas
<.liatómicas 0 2 (estado fundamental 3 ~) y NO (estado fundamental 2 II) y las moléculas triatómicas N02, Cl02 (spin total S = !). En lo que concierne a los elementos de
los grupos de transición, éstos gozan de propiedades peculiares de las que hablaremos
más adelante, una vez hayamos estudiado las propiedades de los elementos de los
grupos principales desde el punto de vista de la valencia.
La capacidad de los átomos de combinarse entre sí está ligada, por consiguiente,
con sus spins (W. HEITLER y H. LoNDON, 1927). La unión se efectúa de tal manera
que los spins de los átomos se compensan. Como característica cuantitativa de la
capacidad de los átomos para combinarse en la molécula resulta cómodo utilizar
un número entero: el doble del spin del átomo. Este número coincide con la valencia
química del mismo. En relación con esto hay que tener presente que un mismo
átomo puede poseer valencias distintas según sea el estado en que se encuentre.
Examinemos desde este punto de vista los elementos de los grupos principales
del sistema periódico. Los elementos del primer grupo (columna primera de la tabla 3, grupo de los metales alcalinos) en el estado normal tienen spin S = ! y, según
esto, su valencia es igual a la unidad. Un estado excitado con spin mayor se puede
obtener tan sólo excitando un electrón de una capa completa. Estos estados se
encuentran por ello tan altos, que el átomo excitado no puede formar una molécula
estable (1).
Los átomos de los elementos del segundo grupo (segunda columna de la tabla 3,
grupo de los metales alcalinotérreos) tienen spin S = O en el estado normal. Por
consiguiente, en este estado dichos átomos no pueden combinarse químicamente.
Sin embargo, relativamente cerca del estado fundamental se encuentra un estado
excitado que posee en la capa incompleta la configuración sp en vez de la s 2 y un
spin total S = 1. La valencia del átomo en este estado es igual a 2 ~ ésta es precisamente la valencia fundamental de los elementos del segundo grupo.
Los elementos del tercer grupo tienen en su estado normal la configuración
electrónica s2p con spin S = t Sin embargo, por excitación de un electrón de la
capa s completa se obtiene un estado excitado con la configuración sp 2 y spin S = 1,
estado situado cerca del normal. De acuerdo con esto, los elementos de este grupo
se comportan como univalentes y como trivalentes. Los primeros elementos del
mismo (B, Al) se comportan solamente como trivalentes. La tendencia a que se manifieste la valencia 1 crece al aumentar el número atómico y el TI se comporta ya en
igual medida como elemento univalente y trivalente (por ejemplo, en los compuestos
TlCl y TlCl3). Este comportamiento está ligado con el hecho de que, en los primeros
elementos del grupo, la ventaja energética vinculada a la gran energía de enlace en
(1)
Acerca de los elementos Cu, Ag, Au, véase el final de este párrafo.
334
La molécula diatómica
los compuestos de un elemento tri valen te (comparada con la de los compuestos
de un elemento univalente) predomina sobre la energía de excitación del átomo.
En los elementos del cuarto grupo el estado fundamental tiene la configuración
s 2p 2 con spin I y el estado excitado próximo a él presenta la configuración sp3 con
spin 2. A estos estados corresponden las valencias 2 y 4. Como en el grupo tercero,
los primeros elementos del cuarto grupo (C, Si) se comportan en esencia según la
valencia más alta (constituye excepción, por ejemplo, el compuesto CO), y la tendencia a que aparezca la valencia más pequeña crece al aumentar el número atómico.
En los átomos de los elementos del quinto grupo el estado fundamental presenta
la configuración s2p 2 con spin S = t de forma que la correspondiente valencia es
igual a 3. Un estado excitado con valor mayor del spin puede conseguirse tan sólo
mediante el paso de uno de los electrones a la capa con el siguiente valor del número
cuántico principal. El más próximo de estos estados tiene la configuración sp2s'
y spin igual a f (con s' convenimos en designar aquí el estados del electrón con número cuántico principal mayor en una unidad al del estado s). Aunque la energía
de excitación de este estado es relativamente grande, el átomo excitado puede, con
todo, formar un compuesto estable. De acuerdo con esto, los elementos del grupo
quinto se comportan como trivalentes y pentavalentes (así, el nitrógeno en NH3
es trivalente y en HN03 pentavalente).
En el sexto grupo de elementos, el espin es igual a 1 en el estado fundamental
(configuración s2p 4 ), de modo que el átomo es divalente. La excitación de uno de los
electrones p conduce al estado s2p 3s' con spin 2, y la ulterior excitación de un electrón s
lleva al estado sp2s'p' con spin 3. En ambos estados excitados el átomo puede formar
moléculas estables, manifestándose, respectivamente, como tetra y hexavalente. El
primer elemento del grupo sexto (oxígeno) presenta sólo la valencia 2, mientras que
los siguientes elementos del grupo presentan también valencias más elevadas (por
ejemplo, el azufre en H 2S, S02, S03, es, respectivamente, di, tetra y hexavalente).
En el séptimo grupo (grupo de los halógenos) los átomos son monovalentes en
el estado fundamental (configuración s2p 5 , spin S = i ). Sin embargo, pueden formar compuestos estables encontrándose en estados excitados, con las configuraciones
s2p 4s', s2p 3s'p', sp3s'p' 2, cuyos spins son iguales a i, !, {, respectivamente, lo que corresponde a valencias 3, 5, 7. El primer elemento del grupo (F) es siempre monovalente y los siguientes elementos poseen también valencias más elevadas .(por ejemplo,
el cloro en HCl, HC102, HC103, HC104, es, respectivamente, mono, tri, penta y heptavalente).
Finalmente, los átomos de los elementos del grupo de los gases nobles tienen,
en su estado fundamental, completas todas sus capas (de forma que el spin S = O),
y sus energías de excitación son grandes. De acuerdo con esto, la valencia es igual
La valencia
335
a cero y sus elementos son químicamente inertes (1).
A propósito de todas estas consideraciones, es necesario hacer la siguiente observación general. Decir que un átomo integra una molécula con una valencia propia de uno de sus estados excitados, en modo alguno significa que al separar los átomos a gran distancia obtengamos necesariamente un átomo excitado. Dicha afirmación significa solamente que la distribución de la densidad electrónica en la molécula es tal, que en torno del núcleo del átomo dado dicha distribución se aproxima
a la distribución electrónica en el átomo excitado aislado. En cambio, el límite a que
tiende la distribución electrónica al aumentar la distancia entre núcleos puede coresponder a átomos no excitados.
Cuando los átomos se unen en una molécula, las capas electrónicas completas
de los mismos varían poco. La distribución de la densidad electrónica en las capas
incompletas puede, en cambio, variar esencialmente. En los casos más acusados
del llamado enlace heteropolar todos los electrones de valencia pasan de unos átomos
a otros, de modo que es posible decir que la molécula está constituida por iones
con cargas iguales (en unidades e) a sus valencias. Los elementos del primer grupo
son electropositivos ~ en los compuestos heteropolares ceden electrones, formando
iones positivos. Al pasar a los grupos siguientes, el carácter electropositivo va disminuyendo, tendiendo al carácter electronegativo, característico en su mayor grado
de los elementos del séptimo grupo. Acerca de la naturaleza heteropolar hay que hacer
la misma observación que se hizo antes acerca de los átomos excitados en una molécula. Si la molécula es heteropolar, esto no significa en absoluto que al separar los
átomos obtengamos necesariamente dos iones. Así, a partir de la molécula KCl
obtendríamos, en efecto, iones K + y c1-, pero la molécula NaCI da, en el límite, los
átomos neutros Na y Cl (debido a que la afinidad del cloro para un electrón es mayor
que el potencial de ionización del potasio, pero menor que el potencial de ionización
del sodio).
En el caso límite opuesto, el del llamado enlace homopolar, los átomos en la
molécula se conservan en promedio neutros. Las moléculas homopolares, en contraste con las heteropolares, no poseen un momento dipolar apreciable. La diferencia entre los tipos de enlace heteropolar y homopolar es puramente cualitativa y
pueden darse todos los casos intermedios.
1
( )
Los elementos Xe, Rn (y con mayor dificultad, el Kr) forman, a pesar de todo, compuestos estables
con el flúor. Es posible que estas valencias se deban a la transición de los electrones desde una capa interior
completa a estados no ocupados del tipof(o d). relativamente próximos desde el punto de vista energético.
Señalaremos también el particular efecto atractivo que se manifiesta en la interacción de un átomo
de gas noble con un átomo excitado del mismo elemento. Este efecto se debe a la duplicación del número
de estados posibles que se obtiene al unir dos átomos idénticos que se encuentran en estados distintos
(véase § 80). El paso de la excitación de un átomo al otro substituye en este caso a la interacción de intercambio que conduce a la valencia ordinaria. Un ejemplo de tales moléculas Jo ofrece la molécula He2.
Este mismo tipo de enlace se presenta en los iones moleculares constituidos por dos átomos idénticos
(por ejemplo, H 2+).
336
La molécula diatómica
Pasemos ahora a los elementos de los grupos de transición. Los elementos de los
grupos del paladio y del platino difieren poco de los elementos de los grupos principales en lo que concierne a sus propiedades de valencia. La diferencia consiste
en que, gracias a la posición relativamente profunda de los electrones d en el átomo,
su interacción con los otros átomos de la molécula es débil. De aquí resulta que
entre los compuestos de estos elementos se encuentran con relativa frecuencia
compuestos « no saturados», cuyas moléculas tienen un spin diferente de cero (de
hecho, no mayor que f). Cada uno de estos elementos puede comportarse con distintas valencias, y éstas pueden diferir ahora en una unidad, y no tan sólo en dos
unidades como en el caso de los elementos de los grupos principales (para los que el
cambio de valencia se debe a la excitación de un electrón cuyo spin estaba compensado, y como consecuencia de lo cual quedan libres de pronto los spins de un par
de electrones).
Los elementos del grupo de las tierras raras ·se caracterizan por la existencia
de una capa f incompleta. Los electrones f se encuentran a una profundidad mucho
mayor que los electrones d, y debido a ello no contribuyen a la valencia. Como
consecuencia, la valencia de los elementos de ferras raras viene determinada solamente por los electrones s y p de las capas incompletas (1 ). Sin embargo, hay que
tener en cuenta que, en la excitación de un átomo, los electrones f pueden pasar
a estados s y p, aumentando así la valencia en una unidad. Por ello, también los
elementos de tierras raras presentan valencias que difieren en una unidad (de hecho,
todos son tri y tetravalentes).
Los elementos del grupo del actm10 ocupan una pos1c10n muy particul~r. El
Ac y el Th no contienen, en general, electrones f y a su valencia contribJyen los
electrones d; por consiguiente, en sus propiedades químicas son análogos a los elementos de los grupos del paladio y del platino, y no a los elementos de tierras raras.
En lo que concierne al uranio, aunque en el estado normal el átomo U contiene electrones f, en sus compuestos tampoco posee electrones de este tipo. Finalmente, los
átomos de los eJementos Np, Pu, Am y Cm conservan electrones f incluso en los
compuestos, pero los electrones que intervienen en la valencia son electrones s y d.
En este sentido se parecen al uranio. El número máximo posible de electrones s y d
« no apareados» es igual, respectivamente, a I y 5; por ello la valencia máxima
de los elementos en el grupo del actinio es igual a seis, mientras que la valencia
máxima de los elementos de tierras raras (con electrones s y p que contribuyen a la
valencia) es igual a 1 +3 = 4.
Los elementos del grupo del hierro ocupan, desde el punto de vista de sus propiedades de valencia, una posición intermedia entre los elementos de tierras raras
(1) Los electrones d que encontramos en las capas incompletas de los átomos de algunos elementos
de tierras raras carecen de importancia, ya que de hecho estos átomos forman siempre parte de un compuesto en estados excitados en los que no existen electrones rl
La valencia
337
y los elementos de los grupos del paladio y del platino. En sus átomos, los electrones d
están situados a una profundidad relativamente grande y en toda una serie de compuestos no toman parte en el enlace de valencia. En estos compuestos, por consiguiente, los elementos del grupo del hierro se comportan de manera semejante a los
elementos de tierras raras. A este tipo corresponden los compuestos del tipo iónico
(por ejemplo, FeCl 2, FeCl3), en los que el átomo del metal interviene en la forma de
simple catión. De manera análoga a los elementos de tierras raras, los elementos del
grupo del hierro pueden presentar en estos compuestos las más diferentes valencias.
Otro tipo de compuestos de los elementos del grupo del hierro son los llamados
compuestos complejos. Éstos se caracterizan por el hecho de que el átomo del ele-
mento de transición interviene en la molécula, no en la forma de un ion simple,
sino que es parte de un ion complejo (por ejemplo, el ion Mnü; en KMn04, el
ion Fe(CN)f- en K 4 Fe(CN) 6 • En tales iones complejos, los átomos están situados
más próximos entre sí que en los compuestos iónicos simples, y en ellos los electrones d
participan en el enlace de valencia. De acuerdo con esto, los elementos del grupo
del hierro se comportan en los compuestos complejos de manera análoga a los elementos de los grupos del paladio y del platino.
Finalmente, es necesario señalar que los elementos Cu, Ag y Au, que hemos
atribuido en el § 73 a los grupos principales, en toda una serie de compuestos se
comportan como elementos de transición. Estos elementos son capaces de presentar
valencias mayores que la unidad debido a la transición de electrones de la capa d
a la capa p, próxima en energía (por ejemplo, en el Cu, de 3d a 4p). En tales compuestos los átomos tienen una capa d incompleta y se comportan así como elementos
de transición (el Cu, como elemento del grupo del hierro, y el par Ag, Au, como
elementos del grupo del Pd y del Pt).
PROBLEMA
Determinar los términos electrónicos del ion molecular H 2 + que se obtienen al unir un átomo
de hidrógeno en el estado normal con un ion H + cuando la distancia R entre núcleos es grande
(comparada con el radio de Bohr).
Solución. Este problema, por su planteo, es análogo al problema 3 del § 50: en vez de dos
pozos de potencial unidimensionales tenemos aquí dos pozos de tres dimensiones (en torno de
los dos núcleos) con una simetría axil común respecto de la recta que une los núcleos. El nivel
E 0 = - i (nivel fundamental del átomo de hidrógeno) (1) se desdobla en dos niveles Ug(R) y Uu(R)
(términos 2~u + y 21:u +), que corresponden a las funciones de onda electrónicas
1
lfg,u(x,y,z) =
(')
Utilizamos aquí unidades atómicas.
V
2
[ifio(x,y,z) ± i/io(-x,y,z)],
338
La molécula diatómica
simétrica y antisimétrica respecto del plano x = O perpendicular en su punto medio al segmento
determinado por los núcleos (que se encuentran en los puntos x = ±R/2 del eje x). 1JJo(X, y, z) es
aquí la función de onda del electrón en uno de los pozos de potencial. De manera análoga a como
se procedió en el problema 3 del § 50, obtenemos
U0 ,u(R)-Eo =
+
donde la integración se efectúa en el plano x
ff
éifao
ifaoa:; dy dz,
(1)
= O.
Para la función "Po (que corresponde al movimiento, por ejemplo, en torno del núcleo 1 situado
en el punto x = R/2) buscaremos una expresión de la forma:
(2)
donde a es una función lentamente variable (en el átomo de hidrógeno sería a
debe satisfacer la ecuación de Schrodinger
l.6ifa+ ( -!- -1 + -1 + -1 ) 1P = o,
R
r1
=
1). La función "Po
(3)
r2
(ri, r 2 son las distancias del electrón a los núcleos 1 y 2); como energía total del electrón figura
en esta ecuación la diferencia E 0 -1/R, ya que en E 0 se incluye también la energía 1/R del campo
de Coulomb repulsivo de los núcleos.
Dado que la función "Po disminuye ripidamente al alejarnos del eje x, en la integral (1) solamente cuenta el dominio de valores y, z pequeños (comparados con R). Para y, z ~ R, la substitución de (2) en (3) da:
ca
a
a
-+-----=O;
óx
fR+x
R
(se ha prescindido de las derivadas segundas de la función lentamente variable a y hemos hecho
r 2 ,....._,}R + x). La solución de esta ecuación que tiende a la unidad para X-* R/2 (es decir, cerca
del núcleo 1), es
a
=
-3!!__ exp (--=R+2x
R
La fórmula (1) nos da ahora:
f
G()
U0 ,u-Eo =
4
+1re
R/2
+(2/e)Re-R.
-!) .
Estructuras de bibración y rotación de los términos singlete
339
A distancias suficientemente grandes, esta expresión, que disminuye exponencialmente, llega
a ser menor que el efecto de segundo orden respecto de 1a interacción dipolar del átomo H con
el ion H+. Dado que la polarizabilidad del átomo de hidrógeno en el estado normal es igual a 9/2
(véase (77.9)), y que el campo del ion es ~- = 1/R2, la correspondiente energía de interacción es
igual a - 9/4R4 y teniéndola en cuenta resulta:
Uu,u(R)-Eo =
2
9
e
4R4
+ -Re-R- - .
(4)
El segundo término es comparable con el primero tan sólo para R = 10,8. Indicaremos también que el término Uu presenta para R = 12,6 un mínimo, igual a -5,8· l0-5u.a. (- l,6· 10-3 eV)(1)
§ 82.
Estructuras de vibración y rotación de los términos singlete de una moJécuJa
diatómica
Conforme se indicó ya al principio de este capítulo, la gran diferencia entre la
masa de los núcleos y la de los electrones ofrece la posibilidad de descomponer el
problema que plantea la determinación de los niveles energéticos de una molécula
en dos partes. Se determinan primero los niveles de energía del sistema de electrones, suponiendo los núcleos inmóviles, como función de la distancia entre estos
últimos (términos electrónicos). Se puede estudiar luego el movimiento de los núcleos para un estado electrónico dado; esto se reduce a considerar los núcleos como
partículas que interactúan entre sí según la ley Un(r ), donde Un es el correspondiente
término electrónico. El movimiento de la molécula se compone de su movimiento
de translación en conjunto y del movimiento de los núcleos respecto de su centro
de masas. El movimiento de traslación carece de interés, claro está, y podemos suponer que el centro de masas se encuentra en reposo .
.Para facilitar la exposición estudiaremos primero los términos electrónicos en
los que el spin total S de la molécula es igual a cero (términos singlete). El problema
del movimiento relativo de dos partículas (dos núcleos) que interactúan según una
ley U(r) se reduce, conforme sabemos, al problema del movimiento de una partícula
de masa M (masa reducida de las dos partículas) en un campo central U(r). La
función U(r) representa aquí la energía del término electrónico considerado. Pero
el problema del movimiento en un campo central U(r) se reduce, a su vez, a un problema de movimiento unidimensional en un campo con una energía efectiva igual
a la suma de U(r) y la energía centrífuga.
Designemos por K el momento cinético total de la molécula, resultante del
momento cinético orbital de los electrones L y del momento cinético de rotación
de los núcleos. El operador de la energía centrífuga de éstos será entonces
B(r)(R-t)2,
Este mínimo, ligado con las fuerzas de van der Waals, es muy poco profundo comparado ~º!1 el
mínimo principal del término Ug(R), que corresponde al estado normal del ion estable Ht·: este ultimo
mínimo se encuentra en R = 2,0 y su valor es de 0,60 u. a. (- 16,3 eV).
1
( )
340
La molécula diatómica
donde hemos introducido la notación
B(r) = li 2/2Mr 2
(82.1)
que resulta cómoda para simplificar las fórmulas de la teoría de las moléculas diatómicas. Promediando esta magnitud (para un valor dado r), obtenemos la energía
centrífuga como función de r, energía que debe conducir a la energía potencial
efectiva UK(r ). De esta manera
U K(r) = U(r)+B(r)(K-L)2,
donde el trazo superior significa el promedio ya indicado. Desarrollando el paréntesis y recordando que el cuadrado K2 del momento cinético total, que se conserva,
tiene un valor determinado, igual a K(K + 1) (K es un número entero), escribiremos
esta expresión en la forma:
UK(r) = U(r)+B(r)K(K+l)+B(r)(L2-2L. K);
(82.2)
(se ha prescindido del trazo sobre la magnitud conservativa K).
En un estado con valor determinado de Lz = A, los valores medios de las otras
dos componentes del momento cinético orbital son ·-iguales a cero: L x = LY = O;
esto se sigue directamente de que en la representación en la que Lz es diagonal los
elementos de matriz diagonales de los operadores ix Ly son iguales a cero(véase §27).
Por ello, el valor medio del vector L está dirigido según el eje z y podemos escribir
L =nA,
donde n es e] vector unitario correspondiente al eje de la molécula. Además, en la
mecánica c1ásica, el momento cinético de un sistema constituido por dos partículas
(los núc1eos) es perpendicular a la recta que las une; en la mecánica cuántica ocurrirá lo mismo para el operador del momento cinético. Podemos escribir, por lo
tanto, (1t-L). n = O, ó 1t. n =L. n. De aquí se sigue para los valores propios
K.n =L.n =A.
(82.3)
Así, pues, la proyección del momento cinético total K sobre el eje de la molécula
resulta también igual a A. De aquí se sigue que en un estado con valor -dado A, el
número cuántico K puede tomar valores sólo a partir de .\:
K;>A.
Finalmente, substituyendo en (82.2)
L-K =
(82.4)
An·K = .\ 2 , obtenemos:
U K(r) = U(r)+B(r)K(K+ l)+B(r)(L2 -2A2 ).
(82.5)
El último término del segundo miembro es una cierta función de r que depende
únicamente del estado electrónico y que no contiene el número cuántico K. Esta
función se puede incluir en la energía U(r), con lo cual (82.5) adopta la forma:
Estructuras de vibración y rotación de los términos singlete
U x(r) = U(r)+B(r)K(K+ 1).
341
(82.6)
Resolviendo la ecuación unidimensional de SCHRODINGER con esta energía potencial, obtenemos toda una serie de niveles energéticos. Se suele convenir en numerar estos niveles (para cada K dado) en orden creciente mediante un número v que
toma los valores v = O, 1, 2, ... ; v = O corresponde al nivel más bajo. El movimiento
de los núcleos conduce, pues, al desdoblamiento de cada término electrónico en una
serie de niveles que se caracterizan por los valores de los dos números cuánticos
K y v.
El número de estos niveles (para cada término electrónico dado) puede ser
tanto finito como infinito. Si el estado electrónico es tal que en el límite r ---+ =
la molécula se convierte en dos átomos neutros aislados, la energía potencial U(r)
(y con ella también UK(r)) tiende a un límite constante U(=) parar~ = (límite que
es la suma de las energías de los dos átomos aislados) más rápidamente que 1/r
(véase § 89). El número de niveles en este campo es finito (véase § 18); pero la verdad es que, de hecho, en las moléculas resulta ser muy grande. Los niveles están
distribuidos de tal manera que para cada valor dado K se tiene un número determinado de niveles (que difieren en el valor de v), número de niveles que va disminuyendo
al aumentar K hasta que se alcanza un valor de este número para el cual los niveles ya
no existen.
Pero si para r ---+ = la molécula se descompone en dos iones, a grandes distancias la diferencia U(r) - U(=) pasa a ser la energía de atracción de los mismos
de acuerdo con la ley de Coulomb ( ,.._, 1/r). En este campo se tiene un número infinito
de niveles, que se adensan a medida que nos acercamos al valor límite U(=). Obsérvese que el primer caso se da para la mayor parte de las moléculas en el estado
normal; tan sólo un número relativamente pequeño de moléculas dan lugar a iones
al separar los núcleos.
La dependencia de los niveles energéticos con relación a los números cuánticos
no se puede calcular por completo de manera general. Este cálculo es posible tan
sólo para niveles cuya excitación es relativamente débil y que se encuentran no muy
por encima del nivel fundamental (1). A estos niveles corresponden pequeños valores de los números cuánticos K y v. En la mayor parte de los casos son precisamente
estos niveles los que hay que considerar al estudiar los espectros moleculares, por
lo que presentan particular interés.
El movimiento de los núcleos en estados débilmente excitados se puede caracterizar como pequeñas vibraciones respecto de la posición de equilibrio. De acuerdo
con esto, podemos desarrollar U(r) en serie de potencias de la diferencia~ = r - re,
donde re es el valor de r para el que U(r) presenta el mínimo. Dado que U'(re) = O,
hasta términos de segundo orden se tiene
U(r) = Ue+}Mw/t2,
(1)
Se trata siempre de niveles que se obtienen a partir de un mismo término electrónico dado.
342
La molécula diatómica
donde Ue = U(re) y we es la frecuencia de las vibraciones (1). En el segundo término
de (82.6) - la energía centrífuga - basta hacer r = re, dado que dicho término
contiene ya la pequeña cantidad K(K 1). De esta manera tenemos:
+
(82.7)
donde Be=· k 2/2Mr e2 = li. 2/21 es la llamada constante de rotación (I
el momento de inercia de la molécula).
= Mre 2 es
Los dos primeros términos de (82. 7) son constantes y el tercero corresponde a
un oscilador armónico unidimensional. Por ello podemos escribir, sin más, para
los niveles de energía buscados:
(82.8)
Así, pues, en la aproximación considerada los niveles energéticos se componen
de tres partes independientes:
(82.9)
Aquí Ec1 = Ue es la energía electrónica (que incluye la energía de la interacción
coulombiana de los núcleos para r = re);
(82.10)
es la energía de rotación (o rotatoria), debida a la rotación de la molécula (2);
(82.11)
es la energía de vibración de los núcleos en la molécula. El número v numera, de
acuerdo con la definición adoptada, los niveles que corresponden a un valor dado
de K en orden creciente; este número se llama número cuántico de vibración (o vibratorio).
Para una forma dada de la curva U(r) de la energía potencial, la frecuencia we
es inversamente proporcional a
Por ello también los intervalos b.Ev entre
niveles de vibración son proporcionales a 1/V M. Los intervalos b.Er entre niveles
de rotación contienen en el denominador el momento de inercia /, es decir, son
proporcionales a 1/M. En cambio, los intervalos b.Eez entre niveles electrónicos,
al igual que los propios niveles, no contiene M en absoluto. Dado que m/ M (m es
la masa del electrón) es un pequeño parámetro en la teoría de las moléculas diatómicas, vemos que
VM.
{') En la teoría de las moléculas diatómicas se adoptan determinados símbolos, a los que nos atenemos aquí.
2
( )
Un sistema constituido por dos partículas rígidamente unidas entre sí y que se encuentra en rotación se suele llamar rotador. La fórmula (82. JO) determina los niveles cuánticos de la energía de un rotador.
Las funciones de onda de los estados estacionarios del mismo corresponden, evidentemente, al caso A = O
y coinciden con los armónicos esféricos ordinarios (véase el problema de este párrafo).
E.dructuras de bibración y rotación de los términos singlete
343
Así, pues, la distribución de niveles energéticos de la molécula posee un caracter
peculiar. El movimiento vibratorio de los núcleos desdobla los términos electrónicos
en niveles que están situados relativamente cerca unos de otros. Estos niveles experimentan, a su vez, un desdoblamiento todavía más fino bajo la acción del movimiento de rotación de la molécula (1).
En las aproximaciones siguientes, la descomposición de la energía en una componente de vibración y otra de rotación independientes resulta ya imposible; aparecen términos de rotación-vibración que contienen a la vez K y v. Calculando las
siguientes aproximaciones, obtendríamos los niveles E en la forma de series de potencias de los números cuánticos K y v.
Calculemos aquí la aproximación que sigue a la (82.8). Hay que continuar para
ello el desarrollo de U(r) en potencias de ; hasta los términos de cuarto orden (cf.
el problema acerca del oscilador anarmónico en el § 38). De acuerdo con esto, desarrollaremos la energía centrífuga hasta los términos que incluyen ; 2 • Se obtiene
entonces:
U x(r) = Ve+l¿Mw/t 2 +(ñ,2J2Mr/)K(K+ l)-ag8+bt4-(n2/Mr/)K(K+ l)t+(3n 2/2Mr6 4)K(K+ l)t2•
(82.12)
Calculemos ahora la corrección a los valores propios (82.8) mediante la teoría
de perturbaciones considerando los cuatro últimos términos (82.12) como operador
de perturbación. Al hacerlo, en los términos con ; 2 y ; 4 basta limitarse a la primera
aproximación de la teoría de perturbaciones, y en los términos con ; y ; 3 hay que
calcular la segunda aproximación, ya que los elementos de matriz diagonales de
; y ; 3 se anulan idénticamente. Todos los elementos de matriz necesarios para el
cálculo se obtuvieron en el§ 23 y en el problema 3 del§ 38. Como resultado de los
cálculos se obtiene una expresión que se suele escribir en la forma:
(82.13)
donde
(82.14)
Las constantes Xe, Be,
oce,
De están ligadas con las constantes que intervienen en
(82.12) por las relaciones
B6 =
n /21,
2
D6 = 4Be3/n 2 w6 2 ,
Los términos que no dependen ni de v ni de K se incluyen en Eel·
(1)
Como ejemplo indicaremos los valores Ue, ñwe y Be (en electrón-voltios) para algunas moléculas:
H2
N2
02
4,7
7,5
5,2
-Ue
0,54
0,29
0,20
hwe
7•6
0,25
0,18
10 3 X Be
I,a molécula diatómica
PROBLEMA
Determinar la parte angular de la función de onda de una molécula diatómica cuyo spin es
igual a cero (F. REICHE, 1926).
Solución. Las funciones buscadas no son sino las funcione propias del momento cinético
total de 1a molécula. K. El operador momento cinético total ef la suma
donde p es el impulso del movimiento relativo de los núcleos, r es el vector posición que éstos
determinan y ra, Pa son los vectores posición y los impulsos de los electrones (respecto del centro
de masas de la molécula). Introduciendo el ángulo polar e y el acimut ef, del eje de la molécula
respecto de un sistema.de coordenadas fijo x, y, z, tenemos para las componentes del operador K
expresiones análogas a las (26.14-15), de forma que
(8'
8')
K+ =él> -+icot8- +l+,
88
8</>
8'
8') +L '
1{_ =
e-i<P(--+i cot (J -
Kz
-i-+lz,
8()
Ó<p
8'
=
8</J
(1)
j
son los operadores del momento cinético de los electrones; los apóstrofos en las
que la derivación debe efectuarse manteniendo constantes Xa, Ya, za,.
a;ae y 8/8</, indican
Introduzcamos, además del sistema de coordenadas fijo x, y, z, un sistema móvil,;, r¡, !; que
tiene el mismo origen, cuyo eje !; coincide con el eje de la molécula y cuyo eje ,; se encuentra en
el plano x, y. Las coordenadas $a, t'/a, Ca de los electrones en este sistema están ligadas con las
coordenadas Xa, Ya, za por las relaciones
fa = -x 0 sen <f>+Ya cos<f,,
7Ja = -Xa cosB cos</>-Ya cos8sen<f,+zasen8,
{a= xasenB cos<f,+y0 sen8sen<f,+za cosO.
Transformemos mediante estas fórmulas las derivadas:
Estructuras de vibración y rotación de lo.~ términos singlete
-
ó
ó
345
ó
=sen8-+cos8-, etc.,
OZa
ª'ª
Ó~a
donde 8/80 y 8/84> (sin apóstrofo) representan la derivación manteniendo constantes .;a, r¡a, ;°a.
Se obtiene así para los operadores de las componentes del momento cinético total respecto del
sistema fijo las expresiones:
(-+i
a ctg8 -a) +--lt;,
88
84>
sen8
( a
a)
K- = e-i</> --;:;-+ictg8- +--lt;,
l
Kz =
J
ei</>
K+ = ei</>
e-i<f>
08
8</>
sen8
- i a¡a4>,
(2)
donde
es el operador del momento cinético de los electrones respecto del eje de la molécula.
Sea
(3)
la función de onda de un estado con valores determinados del módulo K y de la componente-z,
M x, del momento cinético total de la molécula y del valor A de la componente-( del momento
cinético de los electrones (n representa el conjunto de los demás números cuánticos que determinan el estado de la molécula). 'Pn.l\.K es la función de onda electrónica, que depende de r como
parámetro,Qn.l\.K es la « parte radial» de la función de onda de los núcleos, 0.1\.KMx es la función
buscada del ángulo e; la dependencia de '1/J respecto del ángulo </> es evidente:
<J>M
K
(<p) =
1
--eiMKr/>.
,V(21r)
346
La molécula diatómica
Al aplicar a la función (3) los operadores
de modo que
/(_+
Í{z,
L, cabe substituirlos por sus valores propios Mx, A,
8
)
ei</>
= ei</> ( --MK
ctge +--A,
sene
8()
8
)
e-it/>
/(__ = e-i</> ( ---MKctgfJ
+--A.
sene
8()
El resto del razonamiento corresponde exactamente al que se desarrolló al final del § 28. Al
aplicar el operador Í{+ a la función '1/JnAKK (con Mx = K) se obtiene el valor cero; de aquí se
sigue la ecuación
= O,
( !_-Kctg8+~)@AKK
88
sene
cuya solución es (1):
@AKK = ( - i)I{
{2K+l)!
J
22K+I(K + A)!(K -A)!
X
(1- cos 8)<1{-A)/2(1 + cos 8)(K+A)/2· (4)
'
(la función está normalizada por la condición
1T
f eiKK sene dB
o
= 1,
la integral de normalización se reduce a la función B de Euler). Las demás funciones se calculan
luego mediante la fórmula:
(2K)l(K-MK)!
------@AKM = Í(_K-MK@AKK,
(K+MK)!
K
J
y se obtiene finalmente:
.J
@AKMx = ( - t)K
(2K+l)!(K+MK)I
(K+A)!(K-A)!(K-MK)!
E)
x [ (- 8 cos8
Para A
=
(1-cos8)(·\-Jh)/2
X
X
(1 +cosB)<A+MK)/2
)K-MK
]
(1-cos B)K-A(I+cosO)K+A .
O estas funciones se reducen, como debe ser, a los armónicos esféricos ordinarios
E>oKM
K
= constante x pMK( cos 8)
K
'
y son las funciones de onda del rotador (funciones propias del momento cinético libre K).
(') La elección del factor de fase está de acuerdo con la definición de las funciones propias del momento cinético libre (§ 28), que se obtienen para _\ = O.
Términos multiplete
§ 83.
347
Términos multiplete. Caso a
Pasemos ahora a la cuestión de cómo clasificar los niveles moleculares con spin S
no nulo. En la aproximación de orden cero, y prescindiendo por completo de los
efectos relativistas, la energía de la molécula, como la de cualquier sistema de partículas, no depende de la dirección del spin (spin «libre»), lo que conduce a una degeneración de los niveles de orden 2S + 1. Pero si se tienen en cuenta las interacciones
relativistas, los niveles degenerados se desdoblan, y como resultado de ello, la energía
pasa a depender del valor de la proyección del spin sobre el eje de la molécula.
Llamaremos interacción spin-eje a las interacciones relativistas en las moléculas.
El papel principal lo representa en este caso (al igual que en el de los átomos) la
interacción de los spins con el movimiento orbital de los electrones (1).
El carácter y la clasificación de los niveles moleculares depende esencialmente
del papel relativo que desempeñan la interacción del spin con el movimiento orbital,
de una parte, y la rotación de la molécula, de otra. El papel de esta última se caracteriza por las distancias entre niveles de rotación vecinos. De acuerdo con esto, hay
que considerar dos casos límite. En uno de ellos la energía spin-eje es grande comparada con las diferencias entre los niveles de rotación, y en el otro, es pequeña.
El primer caso se suele llamar, según Hund, caso a (o enlace tipo a), el segundo,
caso b.
El que se da con mayor frecuencia es el caso a. Constituyen una excepción los
términos k, en los que esencialmente se presenta sólo el caso b debido a que el efecto
de la interacción spin-eje es para ellos pequeño (véase más adelante) (2). Para los
demás términos, el caso b se encuentra a veces en las moléculas más ligeras como
consecuencia de que la interacción spin-eje es aquí relativamente débil y las distancias entre niveles de rotación son grandes (momento de inercia pequeño).
Claro está, son también posibles casos intermedios entre el a y el b. Tampoco
hay que perder de vista que un mismo estado electrónico puede pasar de manera
continua del caso a al caso b al variar el número cuántico de rotación. Ello se debe
a que las distancias entre niveles de rotación vecinos crecen al aumentar el número
cuántico de rotación y, en consecuencia, para grandes valores de éste dichas distancias pueden llegar a ser grandes comparadas con la energía de enlace spin-eje
(caso b), incluso si para los niveles de rotación bajos se daba el caso a.
(1) Además de las interacciones spin-órbita y spin-spin existe también la interacción del spin y del
n:1?Vimiento orbital de los electrones con la rotación de la molécula. Sin embargo, esta parte de la interacc1on es muy pequeña y el considerarla sólo puede presentar interés para términos con spin S = ! (véase
§ 84).
2
( )
El término electrónico normal de la molécula 0 2 (término 3 ~ ) es un caso singular. En él se pre<;enta
un tipo de enlace que es intermedio entre el a y el b (véase el problema 3 del § 84).
La molécula diatómica
348
En el caso a, la clasificación de los niveles difiere en esencia poco de la clasificación de ]os términos con spin igual a cero. Consideremos primero los términos
el~trónicos para núcleos en reposo, es decir, prescindiendo por completo de la
rotación; junto a la proyección .\ del momento orbital de los electrones, hay que
considerar ahora la proyección del spin total sobre el eje de la molécula; esta proyección se designa por I: (1 ); toma los valores S, S - 1, ... , - S. Convendremos
en considerar I: positiva cuando el sentido de la proyección del spin coincida con
el sentido del momento cinético orbital respecto del eje (recordemos que .\ representa el valor absoluto de este último momento). Las cantidades .\ y I: se componen
para formar el momento cinético total de los electrones respecto del eje de la molécula:
Q
= A+~;
(83.1)
!l toma los valores .\ +s.. \ +s - 1, ... , .\ - S. Así, pues, el término electrónico
con momento cinético orbital .\ se desdobla en 2S + I términos que difieren en los
valores de n (este desdoblamiento se llama, como en el caso de los términos atómicos, estructura fina o desdoblamiento de los niveles electrónicos en multipletes).
El valor n se suele indicar en forma de subíndice en el símbolo del término: así.
para.\= I y S = t obtenemos los términos 2 11 112 , 2 11:312 •
El tener en cuenta el movimiento de los núcleos conduce, para cada uno de estos
términos, a la aparición de estructuras de vibración y de rotación. Los diferentes
niveles de rotación se caracterizan por los valores del número cuántico J, es decir,
del momento cinético total de la mo.lécula, que incluye los momentos cinéticos orbital
y de spin de los electrones y el momento cinético de rotación de los núcleos (2).
Este número toma valores enteros a partir de I
nJ:
l>IDJ,
(83.2)
(generalización evidente de la regla (82.4)).
Deduzcamos ahora las fórmulas cuantitativas que determinan los niveles moleculares en el caso a. Consideremos ante todo la estructura fina de un término electrónico. Al estudiar en el 72 la estructura fina de los términos atómicos, utilizamos la
fórmula (72.4) según la cual el valor de la interacción spin-órbita es proporcional
a la proyección del spin total del átomo sobre el vector momento cinético orbital.
De manera completamente análoga, la interacción spin-eje en una molécula diatómica (promediada respecto del estado electrónico para una distancia dada r entre
núcleos) es proporcional a la proyección }: del spin total de la molécula sobre su
*
1
( )
¡No se confunda con el símbolo de los términos con .\ = O!
(2) La notación K sigue representando, conforme se ha convenido, el momento cinético total de la
molécula sin tener en cuenta el spin. En el caso a el número cuántico K no existe, ya que el momento cinético K no se conserva ni tan sólo aproximadamente.
Términos multiplete
349
eje, de manera que podemos escribir el término electrónico desdoblado en la forma:
U(r)+A(r)~,
donde U(r) es la energía del término de partida (no desdobladq) y A(r) es una cierta
función de r; esta función depende del término inicial (en particular., del valor .\),
pero no depende de ~- Dado que de ordinario se utiliza el número cuántico n y no
el ~' en vez de A~ conviene más escribir A n; estas expresiones difieren en la can
tidad A.\, que se puede incluir en U(r). De esta manera tenemos para un término
electrónico la expresión
U(r)+A(r)D.
(83.3)
Obsérvese que las componentes del término desdoblado están uniformemente
distanciadas entre sí - la distancia entre dos componentes vecinas (con valores n
que difieren en una unidad) es igual a A(r) y no depende de n.
Mediante consideraciones generales es fácil ver que para los términos 1: la cantidad A es igual a cero. Apliquemos para ello la operacivn de cambiar el signo del
tiempo. La energía debe entonces conservarse invariable, mientras que el estado de
la molécula varía en el sentido de que la dirección del momento cinético orbital
y del spin respecto del eje se cambia por la opuesta. En la energía A(r)}:~ cambia el
signo de I:, y para que se conserve invariable, es necesario que A(r) cambie de signo.
Si .\ =/= O, no cabe sacar de aquí ninguna conclusión respecto del valor de la cantidad A(r), ya que esta última depende del momeni.0 cinético orbital, que cambia
de signo. Si, en cambio, .\ = O, es siempre posible afirmar que A(r) no cambia y,
por consiguiente, debe anularse idénticamente. De esta manera, para los términos I:
la interacción spin-órbita, en primera aproximación, no conduce a desdoblamiento;
se produciría un desdoblamiento (proporcional a 1:2) solamente si se tuviera en cuenta
esta interacción en la aproximación de segundo orden, o la interacción spin-spin
en la aproximación de primer orden, y sería relativamente pequeño. Con esto está
relacionado el hecho que hemos señalado ya, a saber, que para los términos ~ se
presenta de ordinario el caso b.
Una vez determinado el desdoblamiento en un multiplete, se puede tener en
cuenta la rotación de la molécula como una perturbación de manera completamente
análoga a como se procedió al principio del párrafo anterior. El momento cinético
de rotación de los núcleos se obtiene a partir del momento cinético total restando
de éste el momento cinético orbital y de spin de los electrones. Por consiguiente, el
operador energía centrífuga tiene ahora la forma:
B(r)(j-L-S)2.
Promediando esta magnitud respecto del estado electrónico y sumando con (83.3),
obtenemos la energía potencial efectiva buscada UJ(r):
La molécula diatómica
350
UJ(r)
= U(r)+A(r)O+B(r)(J-L- S) 2
= U(r)+A(r)O+B(r)[J 2 -2J. (L+ S)+L2 +2L. s+ S2 ].
~
El valor propio de J 2 es J(J -t- 1). Además, por las mismas razones que en el
tenemos:
L
y también {j-L-S) . n
=
= nA.
S
= n~,
82,
(83.4)
O . de donde resulta para los valores propios:
J. n = (L+ S) . n = A+~ =
Q.
(83.5)
Substituyendo estos valores encontramos
UJ(r)
= U(r)+A(r)O+B(r)[J(] + 1)-202 +L2+2L. S+ S2 ].
El promedio respecto del estado electrónico se efectúa mediante las funciones de
onda de la aproximación de orden cero (1). Pero en esta aproximación se conserva
el valor del spin; por consiguiente S 2 = S(S+I). La función de onda es, en cambio,
el producto de la función de spin por la función de las coordenadas; por ello el promedio de los momentos cinéticos L y S se efectúa con independencia e] uno del otro
y obtenemos:
L. S = An. S = AL.
Finalmente, el valor medio del cuadrado de] momento cinético orbital V no depende
del spin y es una función de r característica del término electrónico dado (no desdoblado). Todos los términos que son funciones de r y que no dependen ni de J
ni de ~ se pueden incluir en U(r), y el término proporcional a L (o, lo que es Jo mismo,
a !1) puede incluirse en la expresión A(r)!!. Tenemos así para la energía potencial
efectiva la fórmula
UJ(r) = U(r)+A(r)O+B(r)[J(]+ 1)-202].
(83.6)
Los niveles de energía de la molécula pueden obtenerse a partir de aquí siguiendo
el mismo método que se aplicó en el § 82 a la fórmula (82.6). Desarrollando A(r)
y U(r) en serie de potencias de ~ y conservando en el desarrollo de U(r) los términos
hasta el segundo orden inclusive, y en los desarrollos del segundo y del tercer término, solamente los términos de orden cero, obtenemos los niveles de energía en
la forma:
(83.7)
(l) De orden cero tanto con relación al efecto de rotación de la molécula, como a la interacción
spin-eje.
Términos mriltiplete
351
donde Ae = A(re); las Be son constantes características del término electrónico
dado (no desdoblado). Continuando el desarrollo, obtendríamos toda una serie
de términos con potencias más elevadas de los números cuánticos; no nos detendremos en escribirlos aquí.
§ 84.
Términos multiplete. Caso b
Pasemos ahora al caso b. El efecto de rotación de la molécula predomina aquí
sobre el desdoblamiento en multiplete. Por ello debemos considerar primero el
efecto de la rotación, prescindiendo de la interacción spin-eje, y únicamente después
debe tenerse en cuenta esta última en forma de perturbación.
En una molécula con spin «libre» se conserva, no solamente el momento cinético total J, sino también la suma del momento cinético orbital de los electrones K
y el momento cinético de rotación de los núcleos, suma ligada con J por la relación
J
=
K+S.
(84.1)
El número cuántico K distingue los diferentes estados de la molécula en rotación
con spin libre que se obtienen a partir del término electrónico dado. La energía
potencial efectiva UK.(r) en un estado con valor dado de K se determina, evidentemente, por la misma fórmula (82.6) que en el caso de los términos con S = O:
U K(r) = U(r)+B(r)K(K+ 1),
(84.2)
donde K toma los valores .\, .\ + 1, ...
Jncluir la interacción spin-eje conduce a un desdoblamiento de cada término
en 2S + 1 términos, en general (o en 2K + 1, si K < S), que difieren en los valores
del momento cinético J (1 ). Según la regla general de composición de momentos,
el número J toma (para un K dado) valores desde K +s a \K - SJ:
IK-S/ <J < K+s.
(84.3)
Para calcular la energía de desdoblamiento (en la primera aproximación de la
teoría de perturbaciones) hay que determinar el valor medio del operador energía
de la interacción spin-eje relativo al estado correspondiente a la aproximación de
orden cero (respecto de esta interacción). En el caso considerado esto significa
promediar tanto respecto del estado electrónico, como respecto de la rotación de
la molécula (parar dado). Como resultado del primer promedio se obtiene, conforme
sabemos, un operador de la forma A(r)n. S, proporcional a la proyección del
operador de spin sobre el eje de la molécula. Promediemos luego este operador
respecto de la rotación de esta última, considerando arbitraria la dirección del vector
(1) En el caso b, la proyección n· S del spin sobre el eje de la molécula no tiene un valor determinado,
de forma que el número cuántico ~ (y 0) no existe.
La molécula diatómica
352
de spin; entonces n. S = ñ. S. El valor medio ñ es un vector que, por razones de
simetría, debe tener la misma dirección que el «vector» K - el único vector que
caracteriza la rotación de la molécula. Podemos escribir, por lo tanto,
ñ = constante x K.
El coeficiente de proporcionalidad se determina fácilmente multiplicando los dos
miembros de esta igualdad por K; observando que ]os valores propios de n · K y K 2
son, respectivamente (véase (82.3)), .\ y K(K I ), encontramos:
+
A/K(K+l).
De esta manera
n.S = Aít.S/K(K+l).
Finalmente, el valor propio del producto K · S, según la fórmula general (31.2), es
igual a:
K. S = i[T(J + 1)-K(K+ 1)-S(S+ 1)].
(84.4)
Llegamos así a la siguiente expresión para el valor medio buscado de la energía
de interacción spin-eje:
A(r)A[J(J + 1)-S(S+ 1)-K(K+ 1)]/2K(K+ 1)
= A(r)A[(J-S)(J +s+ 1)]/2K(K+ 1)-iA(r)A.
Esta expres10n debe sumarse a la energía (84.2). Al hacerio, el término !A(r).\,
en tanto que no depende ni de K ni de J, se puede incluir en U(r), de modo que obtenemos finalmente para la energía potencial efectiva la expresión
U x(r) = U(r)+B(r)K(K+ l)+A(r)A(J-S)(J +s+ 1)/2K(K+ 1).
(84.5)
El desarrollo en serie de potencias de f = r - re conduce, como de ordinario,
a la siguiente expresión para los niveles de energía de la molécula en el caso h:
(84.6)
Conforme se indicó ya en el párrafo anterior, en los términos ~ la interacción
spin-órbita no conduce en primera aproximación a un desdoblamiento en multiplete,
y para determinar la estructura fina hay que tener en cuenta la interacción spin-spin,
cuyo operador es cuadrático respecto de los spins de los electrones. Nos interesa
ahora no el propio operador, sino el resultado de promediarlo respecto del estado
electrónico de la molécula, de manera análoga a como se hizo para el operador de
interacción spin-órbita. Es evidente, por razones de simetría, que el operador promediado que buscamos ha de ser proporcional al cuadrado de la proyección del
spin total de la molécula sobre el eje, es decir, que se puede escribir en la forma:
C1.(r)
(S. n)2,
(84.7)
Términos multiplete
353
donde '.X(r) es de nuevo una cierta función de la distancia r característica del término
electrónico dado (la simetría admite también un término proporcional a S2 ; sin
embargo, este término carece de interés, ya que el valor absoluto del spin es simplemente una constante). No nos detendremos aquí a deducir la complicada fórmula
general para el desdoblamiento que determina el operador (84.7); en el problema
( 1) de este párrafo se deduce la fórmula para los términos L triplete.
Un caso particular lo constituyen los términos L doblete. Según el teorema
de KRAMERS (§ 60), en un sistema de partículas con spin total S = ! la degeneración
de segundo orden se mantiene necesariamente incluso cuando se consideran del
todo las interacciones relativistas internas que se dan -en el mismo. Por ello los
términos 2 L no se desdoblan ni aun teniendo en cuenta (en cualquier aproximación)
tanto la interacción spin-órbita, como la spin-spin.
Se llegaría aquí al desdoblamiento tan sólo introduciendo la interacción relativista del spin con la rotación de la molécula; este efecto es muy pequeño. El operador promediado de esta interacción debe tener, evidentemente, la forma y:R:.. S,
y sus valores propios se determinan por la fórmula (84.4), en la que hay que hacer
S=!, J = K ± !. Para los términos 2 L obtenemos la fórmula
E = Ue+nwe(v+t)+BeK(K+ l)±}y(K+t);
(en Ve hemos incluido la constante -
(84.8)
y/4).
PROBLEMAS
1.
Determinar el desdoblamiento en multiplete del término 3 L en el caso b. (H.
KRAMERS,
1929).
Solución. El desdoblamiento buscado se determina mediante el operador (84.7), que debe
promediarse respecto de la rotación de la molécula. Escribámoslo en la forma rxenmkStSk, donde
rxe = rx(r0 ). Dado que S es un vector que se conserva, hay que promediar solamente el producto
nink. Según la fórmula análoga obtenida en el problema 2 del § 29, tenemos:
l?.a<k+J?.kl?.i
- (2K-1)(2K+3) + ... ;
no se han escrito aquí los terminas (proporcionales a ,5il.) que darían para la energía una contribución independiente de J, por lo que no conducen al desdoblamiento que nos interesa. Así, pues,
este último viene determinado por el operador
Dado que S conmuta con K, es
354
La molécula diatómica
donde el valor propio de S. K resulta de la fórmula (84.4). Además, tenemos:
siskK1cl<.i = siskK.iKk + isiskekuKi
= (S. K)2+t(SiSk- SkSi)ieikzKi
= (S. K)2+}eikleikmSmKz
=(S.K)2+S.K.
A las tres componentes EK del triplete 3 L (S = 1) corresponden J
valos entre estas componentes, obtenemos los valores:
=
K, K ::!:: l. Para los inter-
2. Determinar la energía del término doblete (con A -=f=. O) para casos intermedios entre el
a y el b (E. HILL, J. VAN VLECK, 1928).
Solución. Dado que la energía de rotación y la energía de interacción spin-eje se suponen
del mismo orden de magnitud, hay que considerarlas a la vez en la teoría de perturbaciones, de
modo que el operador de perturbación tiene la forma (1):
V = B R2 +Aen. S.
Como funciones de onda de la aproximación de orden cero es conveniente utilizar las funciones
de onda de estados en los que los momentos cinéticos K y J tienen valores determinados (es decir,
las funciones del caso b). Puesto que para el término doblete es S = J, para un valor dado de J
el número cuántico K puede tomar los valores K = J ± i. Para establecer la ecuación secular
:;J (n designa el conjunto de los números cuánticos
hay que calcular los elementos de matriz
que determinan el término electrónico), donde K, K' toman los valores indicados. La matriz del
operador K. 2 es diagonal (los elementos diagonales son iguales a K(K + 1)). En cambio, los elementos de matriz de (n· S) se calculan mediante la fórmula general (109.5) (en la que el papel de
j 1 ,j 2 , J lo representan S, K, J); los elementos de matriz den vienen dados por las fórmulas (87.1).
Como resultado del cálculo se llega a la ecuación secular
v;f
Be(]+!)(] +!)-AeA/(2] + l)-E<1>
1
Aev[(J +!) 2 -A 2 ]/(2J + 1)
Aev[(J +!)2-A 2]/(2J + 1)
1
Be(] +!)(J-!)+AeA/(2] + l)-E<1 > =
o.
Resolviendo esta ecuación y sumando E< 1J a la energía no perturbada, obtenemos:
(en Ue se ha incluido la constante Be/4). Al caso a corresponde Ae
contraria.
~
Be J, al caso b, Ja desigualdad
3. Determinar los intervalos entre las componentes del nivel triplete 3 L en un caso intermedio
entre el a y el b.
1
( )
El promedio respecto de las vibrar.iones se debe efectuar antes de promediar respecto de fa rotación. Por ello hemos substituido (limitándonos a los primeros términos del desarrollo en potencias de~)
las funciones B(r) y A(r) por los valores Be, Ap y los niveles no perturbados de la energía por:
E< 0 > = Ue+ nwe(v + ~ ).
355
Términos multiplete
Solución. Como en el problema 2, la energía de rotación y la energía de interacción spin-spin
se consideran simultáneamente en la teoría de perturbaciones. El operador de perturbación tiene
la forma:
Como funciones de onda de la aproximación de orden cero utilizaremos las funciones del
caso b. Los elementos de matriz (n . S)~, (se prescinde de todos los índices respecto de los cuales
la matriz es diagonal) los calculamos de nuevo según las fórmulas (109.5) y (87.1), esta vez con
A = O y S = 1. Diferentes de cero lo serán los elementos de la forma:
(n. S)r_ 1 = v[(J + 1)/(2] + 1)], (n. S)f+i =
vU/(2] + 1)].
Dado J, el número K puede tomar los valores K = J, J ± 1. Para los elementos de matriz Vf,
encontramos:
VJ
J
VJ+i
J+I
= BeJU + l)+r1.e,
VJ-I
J-1
= Be(J-1)] +ae(J + 1)/(2] + 1),
=Be(]+ l)(J +2)+aef/(2] + 1),
V~~~ = V~~~ = r1.ev[J(] + 1)]/(2] + 1).
Vemos así que no son posibles las transiciones entre los estados con K = J y los estados con
K = J ± 1. Por ello uno de los niveles es, simplemente, E 1 = Vf Los otros dos (E 2 , E:i) se obtienen como resultado de resolver la ecuación secular de segundo grado construida a partir de los
elementos de matriz v~:L
Interesándonos solamente la distribución relativa de las
componentes del triplete, restemos de éstas tres energías E1,2,:i la constante 'Y.e. Obtenemos así:
V~+L V~+i·
En el caso b ('Y. pequeña), si se consideran tres niveles con el mismo valor de K y valores diferentes de J (J = K, K
1), se obtienen de nuevo las fórmulas que encontramos en el problema 1.
§ 85.
Términos multiplete. Casos e y d
Además de los casos de enlace a y h y de los intermedios entre ambos, existen
también otros tipos de enlace. El origen de éstos consiste en Jo que sigue. La aparición del número cuántico .\ se debe, en último término, a la interacción eléctrica
de los dos átomos en la molécula, interacción que conduce a que el problema de
la determinación de los términos electrónicos presente simetría axil (esta interacción
en la molécula se llama enlace del momento cinético orbital con el eje). Una medida
de la magnitud de esta interacción lo es la distancia entre 'los términos con diferentes
valores de .\. En todo lo que precede se ha supuesto tácitamente que esta interacción
es tan fuerte que estas distancias son grandes, tanto respecto de los intervalos del
desdoblamiento en multiplete, como respecto de los intervalos de la estructura de
rotación de los términos. Sin embargo, existen también los casos opuestos, en los
que la interacción del momento cinético orbital con el eje es comparable e incluso
356
La molécula diatómica
pequeña respecto de los otros efectos; en tales casos, claro está, es imposible hablar,
en ninguna aproximación, de conservación de la proyección del momento cinético
orbital sobre el eje, de modo que el número _\ pierde su sentido.
Si el enlace del momento cinético orbital con el eje es pequeño comparado con
el enlace spin-órbita, se habla del caso c. Este caso se presenta en moléculas que contienen un átomo de un elemento de tierras raras. Estos átomos se caracterizan por
la existencia de electrones f con momentos cinéticos no compensados; su interacción
con el eje de la molécula queda debilitada debido a la profundidad a que se encuentran los electrones f en el átomo. Los tipos de enlace intermedios entre el a y el e
se presentan en moléculas constituidas por átomos pesados.
Si el enlace del momento cinético orbital con el eje es pequeño comparado con
los intervalos de la estructura de rotación, se habla del caso d. Este caso se presenta
para niveles de rotación elevados (con grandes valores de J) de algunos términos
electrónicos de las moléculas más ligeras (H 2 , He2). Estos términos se caracterizan
por la existencia en la molécula de un electrón fuertemente excitado cuya interacción
con los demás electrones (o, como suele ·decirse, con la molécula «residual») es
tan débil, que su momento cinético orbital no se cuantifica a lo largo del eje de aquélla (mientras que el « residuo » de la misma posee un momento cinético determinado
Ares respecto del eje).
Al aumentar la distancia r entre los núcleos, la interacción de los átomos se
debilita y llega al final a ser pequeña respecto de la interacción spin-órbita en los
propios átomos. Por ello, al considerar los términos electrónicos para valores de r
suficientemente grandes, nos encontramos en el caso c. Esta circunstancia debe
tenerse presente al establecer la correspondencia entre términos electrónicos de la
molécula y los estados de los átomos que se obtienen para r-+ =. En el § 80 estudiamos esta correspondencia prescindiendo de la interacción spin-órbita. Pero si
se considera la estructura fina de los términos, surge además la cuestión de cuál es
la correspondencia entre los valores J 1 y 1 2 de los momentos cinéticos totales de los
átomos aislados y los valores del número cuántico n de la molécula. Presentaremos
aquí los resultados sin repetir los razonamientos, que son por completo análogos
a los que se desarrollaron en el § 80.
Si la molécula está constituida por átomos diferentes, los valores posibles de
1 y 1 2 ( ]1 > 1 2 )
vienen dados por la misma tabla (80.1) en la que en vez de L1 , L 2 hay que escribir
1 1, 1 2 y en vez de _\ hay que substituir In¡. La única diferencia consiste en que, para
1 1 +12 semientero, el menor valor de [n[ no será cero, según indica la tabla, sino
L. En cambio, para 1 1 +12 entero se tienen 212 + 1 términos con n = O para los que
1
n¡ (1) que se obtienen al unir los dos átomos con momentos cinéticos 1
(1) Al componer los dos momentos cinéticos totales J 1 y J 2 de los átomos para formar el momento
resultante n, el signo de n, evidentemente, no es esencial.
Términos multiplete
357
(como también para los términos L cuando se prescinde de la estructura fina) se
plantea la cuestión de cuál sea su signo. Si 1 1 y 12 son ambos semienteros, el número
(212 +1) es par y se tiene un número igual de términos, que convendremos en representar por o+ y 0-. Pero si 1 1 y 1 2 son ambos enteros, 12 + 1 términos serán o+ y 12
serán o- (si ( - l f1 +J.¡1/ 2 = 1), o recíprocamente (si (-l)J1+J,J1/ 2 = -1).
Si la molécula está formada por átomos idénticos que se encuentran en estados
diferentes, los estados moleculares resultantes serán los mismos que en el caso de
átomos distintos, con la única diferencia de que el número total de términos queda
multiplicado por dos, interviniendo cada término una vez como par y otra ve7 como
impar.
Finalmente, si la molécula está formada por átomos idénticos en los mismos
estados (con momentos 1 1 = 1 2 == J), el número total de estados es el mismo que
en el caso de átomos distintos y su distribución atendiendo la paridad es tal que
si J entero y n par: Nu = N 11 +I
s1 J entero y n impar: Na= Nu
s1 J semientero y n par: Nu = Na
si J semientero y n impar: Nu = Ng+ l.
Todos los términos o+ son aquí pares, y todos los términos o,- impares.
A medida que se acercan los núcleos, el enlace del tipo e se transforma de ordinario en un enlace del tipo a (1). Cuando así ocurre, puede presentarse la siguiente
interesante situación.
Conforme se dijo ya, un término con A = O pertenece al caso b; desde el punto
de vista de la clasificación del caso a, en cambio, esto significa que a los niveles
multiplete con diferentes valores de n (y el mismo A = O) corresponde la misma
energía. Pero tales niveles pueden aparecer al acercar dos átomos que se encuentran
en diferentes estados de estructura fina.
Así, pues, puede ocurrir que a pares distintos de estados atómicos de estructura
fina corresponda el mismo término molecular. Una situación análoga puede presentarse para aquellos términos con n =Oque, al acercar los núcleos, se convierten
en un término molecular con A =/= O (y, según esto, con L = - ~\); tales niveles
resultan doblemente degenerados, ya que a los términos o+ y o- (que pueden proceder de diferentes pares de estados atómicos) corresponde en el caso a la misma
energía (2).
(1) La correspondencia entre la clasificación de los términos de tipo a y la del tipo e no se puede establecer de forma general. Se exige para ello un estudio concreto de las curvas de la energía potencial teniendo
en cuenta la regla 'de no intersección de los niveles con igual simetría (§ 79).
(2)
Prescindimos aquí de la llamada duplicación A (véase § 88).
358
§ 86.
La molécula diatómica
Simetría de los términos moleculares
En el § 78 examinamos ya algunas propiedades de la simetría de los términos
de una molécula diatómica. Estas propiedades se caracterizaban por el comportamiento de las funciones de onda en las transformaciones que no alteran las coordenadas de los núcleos. Así, la simetría de una molécula en la reflexión en un plano
que pasa por su eje conduce a la diferencia entre los términos I:+ y t-; la simetría
respecto del cambio de signo de las coordenadas de todos los electrones (1) (para
moléculas formadas por átomos idénticos) conduce a la clasificación de los términos
en pares e impares.
Estas propiedades de simetría caracterizan los términos electrónicos y son las
mismas en todos los niveles de rotación que se refieren a un mismo término electrónico.
Además, los estados de la molécula (como el de cualquier sistema de partículas
- véase § 30) se caracterizan por su comportamiento respecto de la inversión - cam":Ó
bio simultáneo del signo de las coordenadas de todos los electrones y de los núcleos.
En relación con esto, todos los términos de una molécula se dividen en positivos
- aquéllos cuyas funciones de onda no cambian al cambiar de signo las coordenadas
de los electrones y de los núcleos-, y negativos - aquéllos cuyas funciones de onda
cambian de signo en la inversión (2).
Para A=/= O cada término es doblemente degenerado en correspondencia con
los dos posibles sentidos del momento cinético respecto del eje de la molécula.
Como resultado de la inversión, el momento cinético, él, no cambia de signo,
pero sí cambia de sentido el eje de la molécula (¡los átomos cambian sus posiciones!), y con ello también el sentido del momento cinético A respecto de la
molécula pasa a ser el opuesto. Por consiguiente, dos funciones de onda relativas
al nivel dado de la energía se transforman entre sí, y a partir de ellas se puede siempre
construir una combinación lineal que es invariante respecto de la inversión y una
combinación que en dicha transformación cambia de signo. Para cada término obtenemos de este modo dos estados -de los que uno será positivo, y el otro, negativo.
De hecho, cada término con A=/= O se desdobla de todas maneras (véase § 88) de
forma que estos dos estados corresponderán a diferentes valores de la energía.
(1) Se supone que se ha elegido como origen de coordenadas el punto medio entre los dos núcleos
sobre el eje de la molécula.
(2) Nos atenemos a la terminología generalmente adoptada. Ésta es, sin embargo, poco afortunada,
ya que, en el caso de un átomo, al considerar el comportamiento de los términos respecto de la inversión
se habla de su paridad, no de su signo.
¡Para los términos I:, no se confunda el signo de que se trata aquí con los signos + y - que aparecen
como superíndice!
Simetría de los términos moleculares
359
Los términos L exigen consideración aparte para determinar su signo. Ante
todo, es claro que el spin no tiene relación ninguna con el signo del término; la
operación de inversión afecta solamente a las coordenadas de las partículas, dejando invariable la parte de spin de la función de onda. Por ello todas Jas componentes de la estructura multiplete de cada término dado tienen el mismo signo.
Con otras palabras, el signo del término dependerá solamente de K, pero no de J (1).
La función de onda de la molécula es el producto de las funciones de onda de
los electrones y de los núcleos. En el ~ 82 se demostró que en los estados L el movimiento de los núcleos es equivalente al movimiento de una partícula con momento
cinético orbital K en un campo central U(r ). Podemos por e11o afirmar que al cambiar el signo de las coordenadas, la función de onda de los núcleos queda multiplicada por {- J)K (véase (30.7)).
La función de onda electrónica caracteriza el término electrónico y para determinar su comportamiento en la inversión hay que considerarla en un sistema de
coordenadas rígidamente unido a los núcleos y que gira junto con ellos. Sea x, y, z
el sistema de coordenadas fijo en el espacio y~. 11, ; el sistema de coordenadas en
rotación en el que la molécula está en reposo como un todo. La dirección de los
ejes t 1¡, !; se tomará de tal manera que el eje ; coincida con el eje de la molécula,
estando dirigido, por ejemplo, del núcleo 1 a] núcleo 2, y que la posición relativa de
los sentidos positivos de los ejes ;, >¡, !; sea la misma que en el sistema x, y, z (es
decir, si el sistema x, y, z es directo, también debe ser directo el sistema ;, 1¡, ;).
Como resultado de la inversión, los sentidos de los ejes x, y, z se cambian en los
opuestos, y el sistema de coordenadas pasa de ser directo a ser retrógrado. Con
esto también el sistema ;, 1¡, : debe pasar a ser retrógrado. Pero dado que el eje :
está rígidamente unido a los núcleos, conserva su sentido anterior; por el1o es necesario cambiar el sentido de uno de los ejes; o 1¡ en el opuesto. Así, pues, la inversión en el sistema de coordenadas fijo es equivalente, en el sistema en movimiento.
a la reflexión en un plano que pasa por el eje de la molécula. Pero en una tal reflexión la función de onda electrónica de un término L no varía, y la de un término L- cambia de signo.
-1-
El signo de las componentes de rotación de un término L + viene así determinado
por el factor (- 1) K; todos los niveles con K par son positivos, y aquéllos para los
que K es impar son negativos. Para un término L- el signo de los niveles de rotación
queda determinado por el factor {- 1) 1' +1 y todos los niveles con K par son negativos,
y con K impar, positivos.
Recordaremos que para los términos
números cuánticos K y J.
(1)
]o<;
~
se da de ordinario el caso b, por lo cual hay que utilizar
360
La molécula diatómica
Si la molécula está constituida por átomos idénticos (1), su hamiltoniano es
también invariante respecto de la permutación de las coordenadas de los dos núcleos.
El término se llama simétrico respecto de los núcleos si su función de onda no cambia
al permutarlos, y antisimétrico, si la función de onda cambia de signo. La simetría
respecto de los núcleos está íntimamente ligada con la paridad y el signo del término.
La permutación de las coordenadas de los núcleos es equivalente al cambio de signo
de las coordenadas de todas las partículas (electrones y núcleos) seguida del cambio
de signo de las coordenadas de los electrones únicamente. De aquí se sigue que
si un término es par (impar) y a la vez positivo (negativo), es simétrico respecto de
los núcleos. Si, en cambio, un término es par (impar) y a la vez negativo (positivo),
es antisimétrico respecto de los núcleos.
Al final del § 62 se estableció un teorema general según el cual la función de onda
de coordenadas de un sistema formado por dos partículas idénticas es simétrica si el
spin total del sistema es par, y antisimétrica, si es impar. Si aplicamos este resultado
a los dos núcleos de una molécula formada por átomos idénticos, encontramos que
la simetría del término está ligada con la paridad del spin total I que se obtiene
como resultado de componer los spins i de ambos núcleos. El término es simétrico
si I es par, y antisimétrico, si I es impar(2). En particular, si los núcleos carecen
de spin (i = O), también I es igual a cero; por ello la molécula no puede en modo
alguno tener entonces términos antisimétricos. Vemos, pues, que el spin nuclear
influye de manera indirecta, pero fundamental, sobre los términos moleculares, a
pesar de que su acción directa (estructura hiperfina de los términos) es completamente despreciable.
El tener en cuenta el spin de los núcleos conduce a una degeneración adicional
de los niveles. En el mismo § 62 se estableció el número de estados con valores pares
e impares de I que se obtienen al componer dos spins i. Así, si i es semientero, el
número de estados con I par es igual a i(2i + 1), y con I impar es igual a (i + 1) (2i + 1).
Teniendo en cuenta lo dicho antes, llegamos a la conclusión de que la razón de las
multiplicidades g~, gª de la degeneración (3) de los términos simétricos y antisimétricos para i semi entero es igual a:
gs/ga = i/(i+ 1).
(86.1)
En cambio, para i entero se obtiene, de manera análoga, que esta razón es igual a:
g 8 /ga = (i+ 1)/i.
(86.2)
( )
Es necesario que ambos átomos pertenezcan no sólo al mismo elemento, sino también al mismo
isótopo.
1
(2) Teniendo en cuenta la relación entre paridad, signo y simetría de los términos, llegamos a la conclusión que para un spin total de los núcleos I par los niveles positivos son pares, y los negativos, impares;
para I impar, ocurre lo contrario.
3
( )
Refiriéndose a la multiplicidad de la degeneración de un nivel, desde este punto de vista, se suele
hablar de su peso estadístico. Las fórmulas (86.1-2) determinan las razones de los pesos estadísticos nucleares de los niveles simétricos y antisimétricos.
Elementos de la matriz para una molécula diatómica
361
Vimos que el signo de las componentes de rotación del término ~+ viene determinado por el número (- 1) 1{. En consecuencia, por ejemplo, las componentes de
rotación del término L+ 9 para K par son positivas y, por consiguiente, simétricas,
y para K impar, negativas y, por lo tanto, antisimétricas. Teniendo presente los
resultados obtenidos antes llegamos a la conclusión de que los pesos estadísticos
nucleares de las componentes de rotación de un nivel L+ !I con valores consecutivos
de K cambian alternativamente en correspondencia con (86.1) o (86.2). Una situación
completamente análoga encontramos para los niveles ~+ 11 y también para los ~-!,,
~-". En particular, para i = O son iguales a cero los pesos estadísticos de los niveles
con K par en los términos :~::+ 11 , L-r, y los de los niveles con K impar en los términos
~+ 9 , L- 11 • Con otras palabras, en los estados electrónicos ~+m L- y no existen
estados de rotación con K par, y en los estados L+ 9 , ~-,, no existen estados de rotación con K impar.
Dado que la interacción de los spins nucleares con los electrónicos es extraordinariamente débil, la probabilidad del cambio de I es muy pequeña, incluso en las
colisiones moleculares. Por esto las moléculas que difieren en la paridad de I y que
poseen, por consiguiente, o tan sólo términos simétricos o tan sólo antisimétricos,
se comportan prácticamente como modificaciones diferentes de la materia. Así
ocurre, por ejemplo, con los llamados ortohidrógeno y parahidrógeno; en una molécula del primero los spins i = ! de ambos núcleos son paralelos (I = I ), y en una
del segundo, anti paralelos (I = O).
§ 87.
Elemeótos de matriz para una molécula diatómica
Iniciaremos el cálculo de las matrices de las diferentes magnitudes asociadas
con una molécula diatómica con el de los elementos de matriz para las transiciones
entre estados con spin igual a cero.
Sea n el vector unitario del eje de la molécula. El vector n, considerado como
operador, conmuta con los operadores de energía de los electrones y con el de la
energía de vibración, pero no con el momento cinético K de la molécula. Por ello
la matriz n es diagonal respecto de todos los números cuánticos con la única excepción de los números K y M 1{ (por M K designamos el valor de la proyección del momento cinético K sobre el eje z fijo en el espacio). Prescindiendo de todos los índices
salvo estos dos, escribiremos los elementos de matriz en la forma (K'M'K\nJKMK).
Su dependencia con relación a M K se determina mediante las fórmulas generales
(29. 7), (29.9), en las que en vez de L y M se escribe ahora K y MR (y el índice n se
puede suprimir). Los coeficientes en estas fórmulas los representaremos en el presente
caso por n-ff, de modo que, por ejemplo,
(K.ll1KlnzlKMK) =
MK
K
nK.
\i[K(K+ 1)(2K+ 1)]
La molécula diatómica
362
Para calcular las cantidades n{, partiremos de las igualdades n .
escritas en la forma (véase (29. 11 )) :
1t =
A, n 2
=
1,
fn+K++fn1-+nz.Kz = A,
n+n-+nz 2 = 1,
y de la relación de conmutación
Formando los elementos de matriz diagonales que se siguen de estas igualdades (los
elementos de matriz de K se determinan mediante las fórmulas generales (27.12)
con K, M nen vez de l, M), después de un cálculo del que prescindimos aquí obtenemos las siguientes fórmulas para. las cantidades buscadas (H. H6NL y F. LONDON,
1925):
K
nK
=A
J
2K+l
K(K+ 1)'
n~- 1 = (n~_ 1 )* = iy'[(K2-A2)/K].
(87.1)
Para .\ = O estas fórmulas dan:
nK
K
=
Ü
nK-1 =
K
'
iy'K;
que, como era de esperar, son precisamente los que corresponden a los elementos
de matriz de un vector unidad para el movimiento en un campo central (véase el
problema 1, § 29).
Sea ahora A una magnitud física vectorial cualquiera que caracteriza el estado
de la molécula cuando los núcleos están en reposo (1). Consideremos primero esta
cantidad en el sistema de coordenadas~' 1¡, ; que gira junto con la molécula (coincidiendo el eje ( con el eje de fa misma). Aplicar aquí todos los resultados del § 29
es imposible, ya que el mornt·nto cinético de la molécula respecto del sistema de
coordenadas t, 1¡, ( (es decir, el momento cinético electrónico L) no se conserva;
únicamente se conserva su componente ;, es decir, .\. En cambio, los resultados
que se refieren a las reglas de selección correspondientes al número cuántico .\
(M en el § 29), conservan, evidentemente, toda su validez. Por lo tanto, los elementos
de matriz del vector A diferentes de cero serán:
(A { )ni\
n A'
1
(A
+ iA 1J )ni\
n',i\-1'
g
(A1:-iA
\>
)n,A-i.
1J n'i\
'
(87.2)
(n representa aquí el conjunto de los números cuánticos del término electrónico,
excluido .\).
(1) Una magnit.ud de este tipo puede ser, por ejemplo, el momento dipolar o el momento magnético
de la molécula.
Elementos de la matriz para una molécula diatómica
363
_Si ambos términos son términos I:, hay que tener también en cuenta la regla
de selección ligada con la simetría respecto de la reflexión en un plano que pasa
por el eje de la molécula (eje ;). En una reflexión de este tipo la componente C de
un vector ordinario (polar) no cambia, mientras que la de un vector axil cambia de
signo. De aquí deducimos que, para un vector polar, A, tiene elementos de matriz
diferentes de cero tan sólo para las transiciones I;+ --+ }:+ y }:- --+ L-, y para una
vector axiL únicamente para las transiciones L+ --+ L-. No se habla aquí de las
componentes ÁE, Ar, dado que para ellas son absolutamente imposibles las transiciones sin cambio de "\.
Si la molécula está constituida por átomos idénticos, existe todavía una regla
de selección respecto de la paridad. Las componentes de un vector (polar) cambian
de signo en la inversión. Por eJJo sus elementos de matriz son diferentes de cero
tan sólo para las transiciones entre estados de paridad distinta (para un vector axil
ocurre lo contrario). En particular, se anulan idénticamente todos los elementos
de matriz diagonales de las componentes de un vector polar.
Se plantea ahora la cuestión de cómo están ligados los elementos de matriz
(87.2) con los elementos de matriz de las componentes del mismo vector A en el
sistema de coordenadas fijo. En este sistema podemos utilizar nuevamente las fórmulas generales (29.7), (29.9), que permiten determinar la dependencia de los elementos de matriz (n .\KM KJAjn' "\' K' M' H) respecto del número cuántico M 1{_. Es
natural designar los coeficientes en dichas fórmulas por A~,f~,; se trata de ligarlos
con las cantidades (87.2).
Es claro. por (87.2), que se tienen elementos de matriz diagonales respecto de
A tan sólo para la componente a lo largo del eje de la molécula. Podemos escribir
por ello la siguiente igualdad
particular.
(nAKMKIAzln'AK' MK) = (A,):~A(KMKlnzlK' MK).
Poniendo de manifiesto la dependencia respecto de M 1,, obtenemos
AnAK _ nK (A )nA
(87.3)
n AK
K
n A'
donde n~. se determina mediante las fórmulas (87.1 ). Hemos hallado así parte de las
relaciones que nos interesan.
1
1
-
1
{
1
Para hallar las restantes (las relaciones para las componentes no diagonales
respecto de .\) observemos que dado que la magnitud A se refiere a una molécula
cuyos núcleos están en reposo, los operadores Ag, A11 , A, conmutan, evidentemente,
con el vector n. Pero las componentes del vector A en el sistema x, y, =se expresan
364
La molécula diatómica
linealmente en función de las componentes en el sistema t, ,1, :;, expresándose los
coeficientes que aparecen en estas relaciones lineales en función de nx, ny, nz. Por
consiguiente, también Ax, A Y' A z conmutan con el vector n. En particular,
Áz11z-nzÁz
= O.
Formando en esta igualdad los elementos de matriz para las transiciones.\, K--+ .\ - 1, K' con K' = K, K ± 1, obtenemos tres ecuaciones que permiten determinar
la dependencia de las cantidades buscadas
respecto de K. Los coeficientes
en las fórmulas que se obtienen se pueden ligar con las cantidades (87.2) comparando
los elementos de matriz del escalar A2 , calculados, una vez, en el sistema de coordenadas x, y, z y, otra, en el sistema t, ,1, :; (1). Se obtienen así las siguientes fórmulas
finales:
A:1~t.K'
A:~A-1,K
l
= !(Ae+iA7]1~1-1 v[(2K+l)(K+A)(K-A+l)/K(K+ 1)],
A:~:-i.K-i = -!(Ag+iA 77 ):,~_1 y'[(K+A)(K+A-l)JK],
An.\,K-1
n ,A-1,K
1
=
(87.4)
!(A,:+iA,,,)nn~.A-i'\l[(K-A)(K-A+
1)/K].
¡,
.,
Las componentes con _\ que hemos escrito.
1 _,.. .\ son iguales a las conjugadas complejas de las
Finalmente, hemos de ver cómo deben modificarse las fórmulas obtenidas para
el caso de las transiciones entre estados con valores del spin diferentes de cero.
Es aquí fundamental el hecho de que los estados correspondan al caso a o al caso b.
Supongamos primero que ambos estados correspondan al caso a. El vector
unitario n conmuta con el vector de spin S y por ello su matriz es diagonal respecto
de los números S y L (o, lo que es lo mismo, respecto de S y n, ya que O= A+L,
y respecto de .\ esta matriz es también diagonal). Los números cuánticos K y M 1\.
no existen, y en vez de ellos se tienen el momento cinético total J y su proyección
M sobre el eje z. En vez de la relación n.k = ,\ que utilizamos para deducir (87. l ),
tenemos ahora n · J = n. De acuerdo con esto, resultan de nuevo las mismas fórmulas (87.1), en las que es necesario solamente substituir K y _\ por J y n, respectivamente (prescindimos del índice diagonal S).
Lo mismo vale también para cualquier vector orbital A (es decir, no dependiente
del spin). Un vector de este tipo conmuta con S y, por ello, su matriz es diagonal
respecto de S y L; pero si se utiliza en vez de L el número cuántico n, en los elementos de matriz diferentes de cero dicho número cambia junto con .\ (es decir,
(1) Conviene efectuar el cálculo aplicando la fórmula (29.12) en la que hay que hacer A
tituir L por K y suponer que n significa 11, _\.
=
B. subs-
Elementos de la matriz para una molécula diatómica
365
si A = A ± 1, también !Y = n ± 1). Las fórmulas (87.3), (87.4) cambian tan sólo
en el sentido de que hay que introducir los indices n, n' y substituir en todas partes
(incluso en los índices) K y A por J y n.
1
Pero, si el vector A depende del spin, cambian las reglas de selección. El vectór S
conmuta con el momento cinético orbital, y también con el hamiltoniano, y por ello
su matriz es diagonal respecto den y A (prescindimos de estos índices). Sin embargo,
dicha matriz no es diagonal respecto de ~ (o de O). Los elementos de matriz de las
componentes de S en el sistema t;, 1í, ( se determinan mediante las fórmulas (27.13)
C''Jn S, ~ en vez de L, M, hecho lo cual el paso al sistema x, y, z se efectúa según
las fórmulas (87.3-4), en las que hay que substituir en todas partes (incluso en los
índices) K, A por J, n.
Supongamos ahora que ambos estados corresponden al caso b. El cálculo de los
elementos de matriz se efectúa en dos fases. Consideremos primero la molécula en
rotación sin tener en cuenta la composición del spin y el momento cinético K; los
elementos de matriz se determinan entonces por las mismas fórmulas (87.1-4). El
vector A se supone orbital, de forma que él, al igual que n, conmuta con S y, por
consiguiente, las matrices son diagonales respecto del número cuántico S, del que
prescindimos en tanto que índice. Se compone luego el momento cinético K con el
S, formando el momento cinético total J, y el paso a los nuevos elementos de matriz
se efectúa según las fórmulas generales (109.3) (el papel de j 1, j 2 , J lo representan
ahora en estas fórmulas S, K, J, y en vez de n1 hay que escribir n, A).
Si uno de los estados corresponde al caso a y el otro al caso b, el cálculo de los
elementos de matriz para las transiciones entre ellos es más complicado; no nos
detendremos a considerar esta cuestión (1).
PROBLEMAS
1. Determinar el desdoblamiento de los términos por efecto Stark para una molécula diatómica cuyo momento dipolar es constante; el término corresponde al caso a.
Solución. La energía del dipolo d en el campo eléctrico C es igual a -d. tf. Por razones
de simetría, es evidente que el momento dipolar de la molécula diatómica está dirigido en el sentido de su eje: d = dn (d es una constante). Eligiendo como eje z la dirección del campo, obtenemos para el operador de perturbación -dnz<ff.
Determinando los elementos de matriz diagonales de nz de acuerdo con las fórmulas obtenidas
en el texto, se encuentra que en el caso a el desdoblamiento de los niveles viene determinado por
la fórmula (2)
!J,.EM = -CdMJD./J(]+l).
J
(1)
Véase el artículo: E.
HILL,
J.
VAN VLECK,
Phys. Rev., 32, 250, 1928.
Puede parecer que existe aquí una contradicción con la afirmación general (§ 76) acerca de la no
existencia de un efecto Stark lineal. En realidad, claro está, no existe tal contradicción, ya que el efecto
lineal está ligado en este caso con la doble degeneración de los niveles cuando O =l= O; la fórmula obtenida
es por ello aplicable con tal que la energía del desdoblamiento por efecto Stark sea grande comparada con
la energía de la llamada duplicación A rn 88).
(2)
366
2.
La molécula diatómica
El mismo problema, pero para un término correspondiente al caso b (con A
Solución.
Siguiendo el mismo método, encontramos:
](] + 1)-S(S+ l)+K(K+ 1)
!J.EM = - <ffdMJA
J
3.
-=p O).
2K(K+1)](]+1)
.
El mismo problema para un término 1I:.
Solución. Para A = O no existe efecto lineal y hay que acudir a la aproximación siguiente
de la teoría de perturbaciones. Al sumar en la fórmula general (38.9), basta conservar únicamente
los términos que corresponden a transiciones entre componentes de rotación del término electrónico dado (en los demás términos las diferencias de energías que aparecen en los denominadores
son grandes). Se encuentra de esta manera
donde Ex
=
BK(K + J ). Un cálculo sencillo conduce al resultado
d2<f 2
K(K+ 1)-3MK2
B 2K(K+ 1)(2K-1)(2K+3)
§ 88.
Duplicación A
La doble degeneración de los términos con .\ -=/=- O (§ 78) es, en realidad, aproximada. Se presenta tan sólo debido a que, conforme se hizo en toda la teoría que
precede, se ha prescindido de la influencia de la rotación .de la molécula sobre el
estado electrónico (y también de aproximaciones de orden superior respecto de la
interacción spin-órbita). Cuando se tiene en cuenta la interacción entre estados
electrónicos y estados de rotación, los términos con A-=/=- O se desdoblan formando
dos niveles vecinos. Este fenómeno se llama duplicación .\ (E. HILL, J. VAN VLECK
y R. de l. KRONIG, 1928).
El estudio cuantitativo de este efecto lo iniciaremos, una vez más, con los términos singlete (S = O). El cálculo de la energía de los niveles de rotación se efectuó
(en el§ 82) en la primera aproximación de la teoría de perturbaciones, determinando
los elementos de matriz diagonales (valores medios) del operador
B(r) (R-t)2.
Para calcular las aproximaciones siguientes es necesario considerar los elementos
de este operador no diagonales respecto de .\. Los operadores K2 y L2 son diagonales
respecto de .\, de modo que es necesario considerar sólo el operador -2Bit. L.
'367
Duplicación A
El cálculo de los elementos de matriz de 1t . L se efectúa sin dificultad mediante
la fórmula (29.12), en la que hay que hacer A= K, B = L; el papel de L, M lo
representan K, MK, y en vez den debemos escribir n, A, donde n representa el conjunto de los números cuánticos (excluido A) que determinan el término electrónico.
Dado que la matriz del vector conservativo K es diagonal respecto de n, A y que
la matriz del vector L contiene elementos no diagonales tan sólo para las transiciones
en las que A cambia en una unidad (cf. lo dicho en el§ 87 acerca del vector arbitrario A), encontramos, utilizando las fórmulas (87.4):
(nAKMKjK.Lln', A-1, KMK) = i(L~+iL11 ):~A-i y[(K+A)(K+l-A)]. (88.1)
No existen elementos de matriz correspondientes a una mayor variación de A.
La acción perturbadora de los elementos de matriz con A --+ A - 1 puede manifestarse en la aparición de una diferencia de energías entre los estados con ± A
tan sólo en la 2A-ésima aproximación de la teoría de perturbaciones. De acuerdo
con esto, el efecto será proporcional a B 2 A, es decir, a (m/ .M)2 A (M es la masa del
núcleo, m la masa del electrón). Para A> 1 esta cantidad es tan pequeña que carece
en absoluto de interés. Así, pues, el efecto de la duplicación A es importante únicamente para los términos II ( A = 1), que cortsideramos a continuación.
Para A = 1 hay que acudir a la aproximación siguiente. Las correcciones a los
valores propios de la energía se pueden determinar mediante la fórmula general
(38.9). En los denominadores de los términos de la suma que aparece en esta ecuación encontramos diferencias de energía de la forma EnAK -En',A-i.K· En estas
diferencias los términos que contienen K se reducen entre sí, ya que para una distancia r dada entre núcleos la energía de rotación es exactamente la misma cantidad~
B(r)K(K + 1), para todos los términos. Por ello la dependencia buscada del desdoblamiento tl.E con relación a K queda completamente determinada por los cuadrados
de los elementos de matriz que aparecen en los numeradores. Entre ellos habrán
cuadrados de los elementos para transiciones con cambio de A de 1 a O y de O a
- 1; unos y otros dan, según (88.1 ), la misma dependencia respecto de K, y encontramos así que el desdoblamiento del término 1 II tiene la forma:
!J..E = constante xK(K+ 1),
expresión en la que (en orden de magnitud) const ,.._, B2/s, donde
magnitud de la diferencia entre términos electrónicos vecinos.
(88.2)
E
es del orden de
Pasemos a los términos con spin diferente de cero (términos 2 II y 3 II; valores
mayores de S no se encuentran en•la práctica). Si el término corresponde al caso b,
el desdoblamiento multiplete no se manifiesta, en general, en la duplicación A de
los niveles de rotación, la cual, como antes, se determina mediante la fórmula (88.2).
En cambio, en el caso a la influencia del spin es, por lo contrario, fundamental.
368
La molécula diatómica
Cad¡l. término electrónico se caracteriza ahora, además de por el número _\, también
por el número n. Si se substituye simplemente _\ por - .\, cambia n = ;\+ 1:, de
modo que obtenemos un término completamente distinto. Los estados con _\, n
y - .\, - n son degenerados entre sí. La ruptura de esta degeneración puede ocurrir aquí no sólo debido al efecto antes considerado de la interacción del momento
cinético orbital con la rotación de la molécula, sino también a causa de la interacción
spin-órbita. Ello se debe a que la conservación de la proyección n del momento
cinético total sobre el eje de la molécula es (en el caso de núcleos en reposo) una ley
exacta de conservación y no puede quedar violada por la interacción spin-órbita;
esta última puede, sin embargo, cambiar a la vez .\ y 1: (es decir, puede tener elementos de matriz no nulos para las correspondientes transiciones) de tal manera,
que n se conserve invariable. Este efecto, de por sí o en combinación con la interacción órbita-rotación (que cambia _\ sin cambiar 1:), puede conducir a la duplicación _\.
Consideremos primero los términos 2 I1. Para el término 2 II 112 (-\ = 1, 1: = - !,
n = D el desdoblamiento se consigue al tener en cuenta a la vez las interacciones
spin-órbita y órbita-rotación (cada una de ellas en primera aproximación). En
efecto, la primera da la transición .\ = 1, 1: = - 1 -j>- A = O, 1: = !, después
de Jo cual la segunda lleva el estado .\ = O, 1: = ! al estado con _\ = - I, 1: = fr,
que difiere del de partida en el cambio de signo de _\ y n. Los elementos de matriz
de la interacción spin-órbita no dependen del número cuántico de rotación J, y para
la interacción órbita-rotación la dependencia respecto de dicho número viene dada
por la fórmula (88.1), en la que hay que substituir (en el radicando) K y A por J
y n. Obtenemos así para la duplicación _\ del término 2 II112 la expresión
~E1¡ 2
= constante X
(]
+!),
(88.3)
2
donde const ""'AB/e. Para el término II112 , en cambio, la descomposición se produce tan sólo en las aproximaciones de orden superior, de modo que prácticamente
~E3/2 = O.
Finalmente, consideremos los términos 3 II. En el término 3 II 0 (A
1, ~ = - 1)
el desdoblamiento se consigue al tener en cuenta la interacción spin-órbita en segunda aproximación (debido a las transiciones _\ = 1, 1: = - 1 -j>- .\=O, ~ =
=O-+ A = - I, 1: = 1). Según esto, la duplicación .\ no depende en absoluto
de J en este caso :
=.;
~E0 = constante ,.., A2/E.
(88.4)
donde const
A 2/F. Para el término 3 II 1 es ~ = O, por lo que el spin no influye
en modo alguno en el desdoblamiento y obtenemos así de nuevo una fórmula del
tipo (88.2), con K substituido por J:
r-..;
b.E1 = constante xj(J + 1).
(88.5)
Interacción de los átomos
369
En cambio, para el término 3 Il 2 son necesarias aproximaciones de orden más elevado,
de forma que se puede considerar que D.E2 = O.
Uno de los niveles del doblete que resulta de la duplicación .\ es siempre positivo, y el otro negativo; de esto hablamos ya en el § 86. El estudio de las funciones
de onda de la molécula permite establecer el orden en que se siguen los niveles positivos y negativos. Indicaremos aquí solamente los resultados de este estudio (1).
Según éstos, si para un cierto valor J el nivel positivo es más bajo que el negativo,
en el doblete con J + l el orden será el inverso - el nivel positivo será más alto
que el negativo, y así sucesivamente; el orden de sucesión cambia alternativamente
con los valores sucesivos del momento cinético total (nos referimos a términos del
caso a; en el caso b ocurre lo mismo respecto de los sucesivos valores del momento
cinético K).
PROBLEMA
Determinar la duplicación A para un término 1D..
Solución. El efecto aparece aquí en el cuarto orden de aproximación de la teoría de perturbaciones. Su dependencia respecto de K viene determinada por el producto de cuatro elementos
de matriz (88.1) para las transiciones con los cambios de A : 2--?- l, 1--?- O, O-?" - l, - 1---?" - 2.
Esto da
tJ.E
= constantex(K-l)K(K+l)(K+2),
donde const .-, B4 /c3.
§ 89.
La interacción de los átomos a grandes distancias
Consideremos dos átomos, en estados S, que se encuentran a gran distancia
uno del otro (respecto de sus dimensiones) y determinemos su energía de interacción.
Con otras palabras, se trata de determinar la forma de los términos electrónicos
Un(r) cuando las distancias entre los núcleos son grandes.
Para resolver este problema aplicaremos la teoría de perturbaciones, considerando
los dos átomos aislados como un sistema no perturbado y la energía potencial de su
interacción eléctrica como operador de perturbación. Es sabido por la electrostática que la interacción eléctrica entre dos sistemas de cargas que se encuentran a
gran distanciar una de otra se puede desarrollar en serie de potencias de 1/r, correspondiendo los sucesivos términos de este desarrollo a la interacción de las cargas
totales, de los momentos dipolar, cuadripolar, etc., de ambos sistemas. En los átomos
neutros las cargas totales son iguales a cero. El desarrollo comienza entonces con la
interacción dipolar-dipolar ( _, 1/r3); a ella siguen los términos dipolar-cuadripolar
(1)
Se puede encontrar en el artículo de
WIGNER y WrrMER
370
La molécula diatómica
(,_, Jjr 4), cuadripolar-cuadripolar (y dipolar-octopolar) ( ,.._, 1/r5), etc.
En la primera aproximación de la teoría de perturbaciones, la energía de interacción de los átomos viene determinada como elemento de matriz diagonal del
operador de perturbación calculado mediante las funciones de onda no perturbadas del sistema (expresadas como producto de funciones no perturbadas de los
átomos) (1). Pero en los estados S los elementos de matriz diagonales, es decir,
los valores medios de los momentos di polar, cuadripolar, etc., son iguales a cero;
esto se sigue por meras razones de simetría, sin más, dado que la distribución de
cargas en un átomo en el estado S posee en promedio simetría esférica. Por ello,
cada uno de los términos del desarrollo del operador de perturbación en potencias
de 1/r da el valor cero en la primera aproximación de la teoría de perturbaciones (2).
En la segunda aproximación basta limitar el operador de perturbación a lcl¡ interacción dipolar, en tanto que es éste el término que más lentamente disminuye al
aumentar r, es decir, basta tomar
(89.1)
(n es el. vector unitario correspondiente a la posición relativa de los dos átomos).
Dado que los elementos de matriz no diagonales del momento dipolar son, en general, diferentes de cero, en la segunda aproximación de la teoría de perturbaciones
obtenemos un resultado no nulo que, siendo cuadrático respecto de V, es proporcional a l/r 6 • La corrección de segundo orden al más bajo valor propio es, conforme
sabemos, siempre negativa (§ 38). Obtenemos así para la energía de interacción
de los átomos que se encuentran en sus estados normales una expresión de la
forma (3):
U(r) = -constante/r6,
(89.2)
donde constes una constante positiva (F. LONDON, 1928).
Así, pues, dos átomos en estados S normales que se encuentran a gran distancia
uno de otro se atraen con una fuerza (- dU/dr) que es inversamente proporcional
a la séptima potencia de la distancia. Las fuerzas de atracción entre átomos a grandes
distancias se suelen llamar fuerzas de van der Waals. Estas fuerzas conducen a que
(1) Prescindimos aquí de los efectos de intercambio que disminuyen exponencialmente al aumentar la
distancia (cf. pág. 7 3).
(2) Esto no significa, claro está, que el valor medio de la energía de interacción de los átomos sea
igual a cero exactamente. Esta energía disminuye con la distancia exponencialmente, es decir, más rápidamente que cualquier potencia finita de 1/r, hecho que conduce a la anulación de cada uno de los términos
del desarrollo. En rigor, de lo que se trata es de que el propio desarrollo del operador de perturbación en
momentos multipolares se basa en la hipótesis de que las cargas de los dos átomos están, separadas una
de otra por una gran distanciar. En cambio, la distribución de densidad electrónica a que conduce la mecánica cuántica posee un valor no nulo (aunque exp<1nencialmente pequeño) también a grandes distancias.
3
( )
Para abreviar prescindimos aquí y en lo que sigue de un término constante en U(r) que no nos
interesa (el valor U(=), que es igual a la suma de las energías de los dos átomos aislados).
Interacción de los átomos
371
aparezca una depresión también en las curvas de energía potencial de los términos
electrónicos de los átomos que no forman una molécula estable. Estas depresiones,
sin embargo, son muy poco pronunciadas (sus profundidades son del orden de las
décimas o incluso de las centésimas de electrón-voltio), y están situadas a distancias
varias veces mayores que la distancia entre átomos en las moléculas estables.
Si en el estado S se encuentra solamente uno de los átomos, para la energía
de interacción se obtiene el mismo resultado (89.2), ya que para la anulación de la
aproximación de primer orden basta que se anulen los momentos- dipolar, cuadripolar, etc., de uno solo de los átomos. La constante en el numerador (89.2) depende
ahora no sólo de los estados de ambos átomos, sino también de su orientación
relativa, es decir, del valor n de la proyección del momento cinético sobre el eje
que los une.
Pero si ambos átomos tienen momentos cinéticos orbitales y totales distintos
de cero, la situación cambia. En lo que concierne al momento dipolar, su valor
medio es igual a cero en cualquier estado del átomo (§ 75). El valor medio del momento cuadripolar (en los estados con L :/: O, J i= O, D es, en cambio, diferente de
cero. Por ello el término cuadripolar-cuadripolar en el operador de perturbación
da un resultado no nulo ya en primera aproximación, y encontramos así que la
energía de interacción de los átomos disminuye, no según la sexta potencia de la
distancia, sino según la potencia quinta:
U(r) = constante /r 5 •
(89.3)
La constante puede ser aquí tanto positiva como negativa, es decir, puede tener
lugar tanto una atracción como una repulsión. Como en el caso anterior, esta constante depende no solamente de la distancia entre los átomos, sino también del estado
del sistema formado por uno y otro.
Un caso particular es el de la interacción de dos átomos idénticos que se encuentran en estados distintos. El sistema no perturbado (los dos átomos aislados) presenta ahora una degeneración adicional ligada con la posibilidad de permutar los
estados entre los átomos.
De acuerdo con esto, la corrección de primer orden se determinará mediante la
ecuación secular en la que intervienen no sólo los elementos diagonales, sino también los elementos de matriz no diagonales de la perturbación. Si los estados de los
dos átomos tienen diferente paridad y momentos cinéticos L que difieren en ± 1
ó O, sin ser ambos nulos (exigiéndose lo mismo de J), los elementos de matriz no
diagonales del momento dipolar para las transiciones entre estos estados son, en
general, diferentes de cero. El efecto de primer orden se obtiene, por consiguiente,
ya a partir del término dipolar del operador de perturbación.
372
La molécula diatómica
De esta manera la energía de interacción de los átomos será en este caso proporcional a l/r 3 :
(89.4)
U(r) = constante/r3;
la constante puede tener ambos signos.
Sin embargo, de ordinario tiene interés la interacción de los átomos promediada
respecto de todos los estados posibles del sistema (para estados dados de los átomos),
incluidas todas las orientaciones posibles de los momentos cinéticos de aquéllos (1).
Como resultado de este promedio todos los efectos lineales respecto de los momentos dipolar y cuadripolar de cada uno de los átomos (es decir, todos los efectos
de primera aproximación de la teoría de perturbaciones) se anulan. Por ello las fuerzas de interacción promedias entre los átomos, a gran distancia uno de otro, siguen
en todos los casos la ley (89.2) (2).
PROBLEMA
Para dos átomos idénticos que se encuentran en estados S, obtener una fórmula que determine las fuerzas de van der Waals a partir de los elementos de matriz de sus momentos dipolares.
Solución. La respuesta se obtiene aplicando la fórmula general de la teoría de perturbaciones (38.9) al operador (89.1). Dada la isotropía de los átomos en un estado S, es desde luego evidente que, al sumar respecto de todos Jos estados intermedios, los cuadrados de los elementos
de matriz de fas tres componentes de cada uno de los vectores d1 y d2 dan la misma contribución,
y que los términos que contienen el producto de componentes diferentes se anulan. El resultado
que se obtiene es
6
U(r) = - -
r6
¿
n,n'
(dz)on 2(dz)on 12
,
2Eo-En-En'
donde E 0 , En son los valores no perturbados de la energía de los estados fundamental y excitados
del átomo. Dado que, por hipótesis, en el estado fundamental es L = O, los elementos de matriz (dz)on son diferentes de cero tan sólo para las transiciones a estados P (L = 1) (3). Mediante
las fórmulas (29.7), escribiremos U(r) en la forma definitiva:
2
U(r) = _ _ ""'
(dºº)2(dº? )2
nl
n 1
3r6 ~ 2Eo- En1 - En'l
n,n'
,
1
( )
A este promedio corresponde, por ejemplo, el problema de determinar la interacción de los átomos en un gas.
2
( )
Esta ley, obtenida basándonos en la teoría no relativista, es válida tan sólo en tanto se pueda
prescindir de los efectos de retardo de las interacciones electromagnéticas. Para ello la distancia r entre
átomos debe ser pequeña respecto de c/Won, donde Won es la frecuencia de las transiciones entre los estados
fundamental y excitados del átomo.
3
( )
El spin de los átomos nada tiene que ver con el problema considerado.
Predisociación
373
donde en los índices matriciales nL el segundo número da el valor L y el primero representa el
conjunto de los restantes números cuánticos que· determinan el nivel de energía (1).
§ 90.
Predisociación
La hipótesis fundamental de la teoría de las moléculas diatómicas expuesta en
este capítulo consiste en admitir que la función de onda de la molécula se descom
pone en el producto de la función de onda electrónica (que depende de la distancia
entre los núcleos como parámetro) y la función de onda del movimiento de los
núcleos. Esta hipótesis es equivalente a prescindir en el hamiltoniano exacto de la
molécula de algunos términos pequeños que corresponden a la interacción del
movimiento nuclear con el de los electrones.
Tener en cuenta estos términos al aplicar la teoría de perturbaciones conduce
a la aparición de transiciones entre diferentes estados electrónicos (2). Físicamente
son particularmente importantes las transiciones entre estados uno por lo menos
de los cuales pertenece al espectro continuo.
En la fig. 30 se representan las curvas de la energía potencia] para dos términos
electrónicos ( ª). La energía E' (línea de puntos inferior en la fig. 30) es la energía
de un cierto nivel de vibración de la molécula estable en el estado electrónico 2.
En el estado 1, esta energía va a parar al dominio del espectro continuo. Con otras
palabras, al pasar del estado 2 al estado 1 tiene lugar una desintegración espontánea
de la molécula; este fenómeno se llama predisociación (4). Como resultado de la
predisociación, un estado del espectro discreto que corresponde a la curva 2 posee,
en realidad, una vida de duración finita. Esto significa que el nivel discreto de energía « se difumina», es decir, adquiere una cierta anchura (véase el final del § 44).
En cambio, si la energía total E se encuentra en ambos estados por encima del
límite de disociación (recta de puntos superior en la fig. 30), la transición de un estado
a otro corresponde a la llamada colisión de segunda especie. Así, la transición 1 ~ 2
representa el choque de dos átomos como resultado del cual éstos pasan a estados
excitados y se separan con menor energía cinética (para r ~ oo la curva 1 pasa
por debajo de la curva 2; la diferencia Ul oo) - U1( oo) es la energía de excitación
de los átomos).
1
( )
El cálculo da para el coeficiente en U= - Ar- 6 (todas las cantidades se expresan en unidades
atómicas) los siguientes valores: para dos átomos de hidrógeno, A = 6,5; para átomos de helio, A = 1,6.
Y también al desdoblamiento de los niveles, a la duplicación A (§ 88).
Rigurosamente hablando, estas curvas deben representar la energía potencial efectiva UJ en los
estados de rotación dados de la molécula.
(4) La curva I puede también no presentar un mínimo, lo que ocurre si corresponde a fuerzas entre
·
los átomos puramente repulsivas.
(2)
3
( )
374
La molécula diatómica
t&(r
-------------E
2
FIG. 30
Dado el gran valor de la masa de los núcleos, su movimiento es cuasiclásico.
El problema de determinar la probabilidad de las transiciones consideradas corresponde por ello a la categoría de problemas de los que se habló en el § 52. A la luz
de las consideraciones generales expuestas allí podemos afirmar que el papel determinante para la probabilidad de transición lo representará el punto en que la transición se pueda efectuar de manera clásica (1). Dado que la energía total del sistema
de los dos átomos (de la molécula) se conserva en la transición dada, la condición
de que sea « clásicamente realizable» exige la igualdad de las energías potenciales
efectivas UJ 1(r) = UJlr). Teniendo en cuenta que también el momento cinético
total de la molécula se conserva, la energía centrífuga es la misma en ambos estados
y, por lo tanto, la condición que acabamos de escribir se reduce a la igualdad de las
energías potenciales:
(90.1)
igualdad que no contiene el valor del momento cinético.
Si la ecuación (90.1) no tiene raíces reales en la región clásicamente accesible
(región donde E> UJ 1, UJ 2), la probabilidad de la transición es, según el § 52,
exponencialmente pequeña (2). Las transiciones ocurrirán con una probabilidad
apreciable tan sólo si las curvas de energía potencial se cortan en dicha región
(como se representa en la fig. 30). En tal caso el exponente en la fórmula (52.1) se
anula (de modo que esta fórmula, claro está, es inaplicable), y en consecuencia la
(1)
O el punto r = O, en el que la energía potencial se hace infinita.
Una situación singular debe presentarse en el caso de una transición en la que toma parte un
término molecular que puede formarse a partir de dos pares distintos de estados atómicos (véase el final
del§ 85), es decir, cuando la curva de la energía potencial en cierto modo se desdobla formando dos ramas,
en la dirección de las distancias crecientes. En esta situación la probabilidad de la transición debe crecer
considerablemente; este problema no se ha considerado todavía en la literatura física.
2
( )
Predisociación
375
probabilidad de transición viene determinada por una expres1on no exponencial
(que se obtendrá más adelante). la condición (90. 1) puede interpretarse de modo
intuitivo de la siguiente manera. Para una igual energía potencial (y total), son
también iguales los impulsos. Por consiguiente, en vez de (90. l) se puede escribir:
(90.2)
donde p es el impulso del movimiento radial relativo de los núcleos y los índices I
y 2 se refieren a los dos estados electrónicos. Podemos así decir que, en el momento
de la transición, la distancia mutua y el impulso de los núcleos se conserva invariable
(principio de Franck-Condon). Físicamente, ello se debe al hecho de que las velocidades electrónicas son grandes comparadas con las nucleares y así « durante la
transición electrónica» los núcleos no consiguen cambiar apreciablemente ni su
posición ni su velocidad.
No es difícil establecer las reglas de selección para las transiciones consideradas.
Ante todo, se cumplen dos reglas exactas evidentes. En la transición no deben
cambiar ni el momento cinético total J ni el signo del término (su carácter positivo
o negativo, véase § 86). Esto se sigue, sin más, del hecho de que la conservación del
momento cinético total y la conservación del carácter de la función de onda respecto
de la inversión del sistema de coordenadas son leyes exactas para cualquier sistema
(aislado) de partículas.
Además, con gran precisión se cumple la regla que prohibe (en una molécula
formada por átomos idénticos) las transiciones entre estados de diferente paridad.
En efecto, la paridad de un estado viene unívocamente determinada por el spin
nuclear y el signo del término. Pero la conservación del signo del término es una ley
exacta y el spin nuclear se conserva dentro de límites muy próximos debido al carácter débil de su interacción con los electrones.
la condición de que exista un punto de intersección de las curvas de energía
potencial significa que los términos deben poseer distinta simetría (véase § 79).
Consideremos las transiciones que aparecen ya en la primera aproximación de la
teoría de perturbaciones (la probabilidad de las transiciones asociadas a las aproximaciones de orden superior es relativamente pequeña). Observemos primero que los
términos que en el hamiltoniano conducen a las transiciones consideradas son precisamente los que determinan la duplicación ~\ de los niveles. Entre ellos se tienen,
ante todo, los términos que corresponden a la interacción spin-órbita. Estos términos son el producto de dos vectores axiles, de los cuales uno tiene carácter espinorial (es decir, está formado por los operadores de spin de los electrones), y el otro
es un vector de coordenadas; sin embargo, hay que subrayar que estos vectores en
modo alguno se reducen simplemente a los vectores S y L. Poseen por elJo elementos
de matriz no nulos para transiciones en las que S y .\ cambian en O,
I.
376
La molécula diatómica
Hay que prescindir del caso en que se tiene simultáneamente ~S = ~ .\ = O
(con .\. =/=- O), dado que entonces la simetría del término no cambiaría en la transición.
La transición entre dos términos L es posible si uno de ellos es un término L _:_,
y el otro, un término L- (un vector axil tiene elementos de matriz únicamente para
transiciones entre L+ y L-, véase § 87).
El término en el hamiltoniano que corresponde a la interacción entre la rotación
de la molécula y el momento cinético orbital es proporcional a J ·L. Sus elementos
de matriz son diferentes de cero para las transiciones con ~ .\. = ± l sin cambio
del spin (en cambio, se tienen elementos de matriz con ~ .\ = O tan sólo para la
componente C de un vector, es decir, para L:; pero L: es diagonal respecto de Jos
estados electrónicos).
Además de los términos considerados, existe todavía una perturbación ligada
con el hecho de que el operador de energía cinética de los núcleos (el de derivación
respecto de las coordenadas de Jos mismos) actúa no solamente sobre la función
de onda de los núcleos, sino también sobre la de los electrones, que depende de r
como parámetro.
Los correspondientes términos en el hamiltoniano tienen la misma simetría
que en el hamiltoniano no perturbado. Por lo tanto, pueden conducir solamente
a transiciones entre términos electrónicos de igual simetría, transiciones cuya probabilidad es despreciable debido a que los términos no se cortan.
Pasemos al cálculo de la probabilidad de transición. Para concretar, consideraremos una colisión de segunda especie. Según la fórmula general (43.l), la probabilidad buscada viene determinada por Ja expresión
w = 27TI
h
f
Xnuc,2""V(r)xnuc,1 dr 12,
(90.3)
donde Xnuc = f'I/Jnuc { l/'nuc es la función de onda del movimiento radial de los núcleos),
y V(r) es la energía de perturbación (como magnitud v en (43.1 ), elegimos la energía E
e integramos respecto de ella). La función de onda final Xnuc, 2 debe normalizarse
respecto de la función <5 de la energía. La función cuasiclásica (47.4a), normalizada
de esta manera, tiene la forma:
2
Xnuc,2
J-
1
= 1TnV2 COS {n-
f
r
a,
P2 dr-i7T
i.)
(90.4)
(el factor de normalización se determina mediante la regla indicada al final del § 21).
La función de onda del estado inicial la escribiremos, en cambio, en la forma:
Predisociación
2
1
377
r
cosÍl-f
P1 dr-!1r l.
VV1
/i
)
Xnuc,l = -
(90.5)
ª1
Ésta se ha normalizado de manera que la densidad de corriente sea igual a la unidad
en cada una de las ondas móviles en las que se descompone la onda estacionaria
(90.5); v1 y v 2 son las velocidades del movimiento relativo radial de los núcleos.
Substituyendo estas funciones en (90.3), se obtiene la probabilidad de transidón
sin dimensiones, w. Podemos considerar w como probabilidad de transición para
un doble paso de los núcleos por el punto r = r 0 (punto de intersección de los niveles);
hay que tener en cuenta que la función de onda (90.5) corresponde, en cierto sentido,
a un doble paso por este punto, ya que contiene tanto la onda incidente como la
onda reflejada.
El elemento de matriz de V(r), calculado mediante las funciones (90.4-5), presenta en el integrando un producto de cosenos que se puede desarrollar en cosenos
de la suma y de la diferencia de los argumentos. Al integrar en torno del punto
r = r O de intersección de los términos, sólo cuenta el segundo coseno, de modo
que se obtiene:
f
w = -4
n2
1
cos [1-
n
Jrp
ª1
1
dr--1
/i
Jrp drJV(r) dr 12.
2
V(V¡V2)
ª•
La integral converge rápidamente al alejarnos del punto de intersección. Por ello
cabe desarrollar el argumento del coseno en potencias de ~ = r - rO y efectuar la
integración respecto de t entre los límites - = y +=(substituyendo al mismo tiempo
el coeficiente lentamente variable del coseno por su valor para r = ; 0). Teniendo en
cuenta que en el punto de intersección es Pi = p 2 , encontramos:
donde S 0 es el valor de la diferencia de las integrales en el punto r = r0 • La derivada
del impulso se puede expresar en función de la fuerza F = - dU/dr; derivando la
2
igualdad }!J___ + U1
2µ
De esta manera,
2
=
p 2 + V 2 (p es la masa reducida de los núcleos), se obtiene:
2µ
La molécula diatómica
378
(ves el valor común de v 1 y v 2 en el punto de intersección). La integración se efectúa
mediante la conocida fórmula
00
J
cos(,x+¡¡~) d!
=
Ji
cos(,xH,r),
-co
y obtenemos en definitiva:
(90.6)
La cantidad S0 /ñ es grande y varía rápidamente al cambiar la energía E. Por
ello, al promediar, incluso en un intervalo no muy grande de energías. se puede
substituir el cuadrado del coseno por su valor medio. Se obtiene así la fórmula
(90.7)
(L LANDAU, 1932). Todas las cantidades que aparecen en el segundo miembro
de la igualdad se toman en el punto de intersección de las curvas de la energía potencial.
Al aplicar estas consideraciones a la predisociación, nos interesa la probabilidad
de desintegración de la molécula por unidad de tiempo. En su movimiento de vibración, los núcleos pasan 2·<•42n veces, por unidad de tiempo, por el punto r = r0
((1) es la pulsación de las vibraciones). La probabilidád buscada de predisociación
se obtiene, por ello, multiplicando w (probabilidad de un doble paso) por <•> 2n, es
decir, es igual a:
(90.8)
Acerca de todos estos cálculos es necesario hacer la siguiente observación. Al
hablar de intersección de los términos nos referíamos a los valores propios del hamiltoniano « no perturbado» f/ 0 del movimiento electrónico en la molécula, hamiltoniano en el que no se han tenido en cuenta los términos V que conducen a las
transiciones consideradas. Pero si incluimos estos términos en el hamiltoniano,
será imposible que los términos se corten y las curvas se separan un poco (conforme
representa la fig. 31 ). Esto se sigue de los resultados del 79, considerados desde un
punto de vista un tanto distinto.
*
Sean U.1i(r) y U.1 2(r) dos valores propios del operador H0 (en el que r se considera
como un parámetro). En un dominio próximo al punto r 0 de intersección de las
curvas U.1 1(r) y U., 2(r), para determinar los valores propios U(r) del operador perturbado R0 +·P hay que utilizar el método expuesto en el* 79, con lo que se ohtiene
la fórmula
379
Predisociación
(los elementos de matriz V11 , V22 , V12 , como los propios U.lJ, U. 12 , son funciones
de r). El intervalo entre dos niveles es ahora igual a:
(90.10)
Vemos así que si existen transiciones entre ambos estados (et elemento de matriz
V12 es diferente de cero), los niveles dejan de cortarse. La distancia mínima entre
las curvas será ahora igual a:
- - - - - - - - - - -E
r
r¡,
FIG. 31
Las fórmulas obtenidas antes para la probabilidad de transición son aplicables
solamente en tanto que la « divergencia » de las curvas sea suficientemente pequeña.
Pero si ésta llega a ser considerable, la probabilidad de transición no se puede calcular mediante la teoría ordinaria de perturbaciones.
Para investigar esta cuestión aplicaremos el siguiente método (C. ZENER, 1932).
Sean lf'i, 11 12 las funciones de onda de los estados electrónicos que corresponden a los
términos « no perturbados» U. 11 y U. 12 , es decir, estas funciones son soluciones
de las ecuaciones
Hof1 = UJ1!f1, Hof2
= UJ21f2·
Para la solución de la ecuación de onda perturbada
ili o'Y/ot = (fl0 + t>)'Y
buscaremos una expresión de la forma:
(90.11)
380
La molécula diatómica
Substituyéndola en la ecuación de onda, multiplicando ésta primero por VJ 1 y luego
por 1.p2 e integrando, obtenemos dos ecuaciones para las funciones h 1(t) y h2(t):
(90.12)
(hemos incluido Vu, V22 en U.Ji, U. 12 , y V12 se ha representado simplemente por
V(r), en correspondencia con las notaciones de las fórmulas anteriores). El movimiento de los núcleos lo consideramos en la aproximación cuasiclásica ~ de acuerdo
con esto, las variables r y t están ligadas entre sí por la relación dr/dt = v, donde v
es la velocidad clásica de los núcleos.
Cerca del punto r 0 de intersección de las curvas UJ 1(r) y U.1 2 (r) (representadas
por puntos en la fig. 31) se puede desarrollar U. 11 y U., 2 en seiie de potencias de E =
= r - r0 , escribiendo
(90.13)
donde U. 1 es el valor común de U.1 1 y U.1 2 en el punto r =-= r 0 y hemos introducido
la notación F., = - (8U.1/ór),.0 • Introduciendo también en vez de las cantidades
h 1, b 2 nuevas incógnitas a 1, a 2 de .acuerdo con
(90.14)
y substituyendo la derivación respecto de t por la derivación respecto de ~ (d/dt =
= vd/d~), obtenemos las ecuaciones (90.12) en la forma:
(90.15)
(para v y V basta tomar, con precisión suficiente, sus valores en el punto de intersección).
Si se resuelven las ecuaciones (90. I 5) con las condiciones de contorno a 1 = 1,
2
a 2 = O para t -:,- + =, ia 1( determina la probabilidad de que al pasar los
núcleos por el punto ~ = O la molécula permanezca en el estado electrónico 'Pi,
lo que significa pasar de la curva 12' a la curva 21' (véase fig. 31). Análogamente,
ial- 00)¡ 2 = 1 - ja1( - =)\2 es la probabilidad de la transición al estado electrónico lf'z, es decir, la probabilidad de que la molécula permanezca sobre la curva 12'.
En cambio, el paso de la curva I a la curva 2 (para ~ --~--:- Y)) mediante el doble
paso por el punto de intersección se puede efectuar de dos maneras: o bien mediante
I --+ l' --+ 2 (al acercarse los núcleos tiene lugar el paso de la curva I 2' a la curva 21 ',
y al separarse los mismos la molécula permanece sobre la curva 21 '), o bien mediante
I --+ 2' --+ 2. Por ello la probabilidad buscada de dicha transición es
=)\
No nos detendremos aquí a exponer la marcha de la resolución de las ecuaciones
(90.15) (se reducen a una ecuación de segundo orden que se puede resolver siguiendo
381
Predisociación
el método de Laplace) y únicamente daremos el resultado final (1):
lai(- 00)12 =
(la diferencia
esta manera
e-21TV2;11,v1F.-F1i
F., 2 - F.'1 se substituye por la diferencia F2 - F1 , igual a ella). De
(90.16)
Vemos así que la probabilidad de la transición considerada es pequeña en ambos
casos límite -- para valores suficientemente pequeños y para valores suficiente
mente grandes de V. Para V 2 ~ ñv¡F2 -F1 1, la fórmula (90.16) se reduce a la (90.7).
Finalmente, consideremos el fenómeno de las llamadas perturbaciones en el espectro de las moléculas diatómicas, fenómeno emparentado con el de la predisociación.
Si dos niveles moleculares discretos E1 y E2 , que corresponden a dos términos electrónicos que se cortan, son próximos entre sí, la posibilidad de la transición entre
ambos estados electrónicos conduce a un desplazamiento de los niveles. Según la
fórmula general de la teoría de perturbaciones (79.4), para los niveles desplazados
tenemos la expresión
(90.17)
donde V12 , 11111 • es el elemento de matriz de la perturbación para la transición entre
los estados moleculares I y 2 (los elementos de matriz V11 , 11111 • y V22 • 11111., en cambio,
deben incluirse, evidentemente, en E1 y E 2 ). Esta fórmula nos hace ver que ambos
niveles se ramifican, desplazándose en sentidos opuestos (el mayor nivel aumenta,
el menor. disminuye). El valor del desplazamiento es tanto mayor cuanto menor
es la diferencia IE 1 -
Ezl.
El elemento de matriz V12 ,nul' se calcula exactamente de la misma manera como
se determinó antes la probabilidad de una colisión de segunda especie. La diferencia
consiste tan sólo en que las funciones de onda lnut·•i y 7. 1111 (', 2 corresponden al espectro discreto y deben normalizarse, por consiguiente, a la unidad. Según (48.3), tenemos para estas funciones:
J l !i f
)
r
Xnuc,1
=
2w1
(1
7TV¡ COS
P1 dr-b f ,
a1
J
2
Xnuc,2
=
2
w cos
1TV2
1
( )
Véase C.
ZFNfR,
r
j~
ln
f P dr-vr ~.
2
ª2
Proc. Roy. Soc. A 137, 696, 1932.
J
382
La molécula diatómica
La comparación con las fórmulas (90.3-5) prueba que el elemento de matriz ahora
considerado, V12,nue, está ligado con la probabilidad H' de la transición en un doble
paso por el punto de intersección por la relación
(90.18)
PROBLEMAS
1. Determinar la sección eficaz total de las colisiones de segunda especie en función de la
energía cinética E de los átomos que chocan y para transiciones ligadas con la interacción spinórbita.
Solución. Teniendo en cuenta el carácter cuasiclásico del movimiento de los núcleos, es posible introducir el concepto de « parámetro de impacto»(! (es decir, el de distancia a que pasarían
los núcleos uno de otro si no existiera interacción entre ellos) y determinar la sección eficaz da
como producto del « área de impacto» 2n(! d(! por la probabilidad de la transición w((!) correspondiente a una colisión (1). La sección eficaz total a resulta integrando respecto de (!.
Para la interacción spin-órbita, el elemento de matriz V(r) no depende del momento cinético M
de los átomos que chocan. Escribamos la velocidad v en el punto r = r0 de intersección de las
curvas en la forma:
v
= v[(2/µ)(E-U-M 2/2µr 02 )] = v[(2/µ)(E- U-p 2E/r0 2 )].
U es aquí e. valor común de U1 y U2 en el punto de intersección, pes· la masa reducida de los átomos
y el momento cinético M = f'(]Voo (voo es la velocidad relativa de los átomos en el infinito). El origen
de energías lo elegiremos de manera que la energía de interacción de los átomos en el estado inicial
sea igual a cero en el infinito; entonces E = ¡1.r/2=/2. Substituyendo en (90. 7) encontramos:
da = 27Tp dp. w
81r2 V2
pdp
lílF2-F1I v[2(E- U-p 2E/rl)/µ]
La integración respecto de (! hay que efectuarla entre los límites cero y el valor de (! para el cual
la velocidad v es nula. Como resultado se obtiene:
4y(2µ)7T 2 V2r02 v(E-U)
(j
= ------- -----
h!F2-F1I
E
2. El mismo problema para las transiciones ligadas con la interacción de la rotación de la
molécula con el momento cinético orbital.
Solución. El elemento de matriz V tiene la forma V(r) = M D/¡u- 2 , donde D(r) es el elemento
de matriz del momento cinético orbital de los electrones. Siguiendo el mismo método que en el
problema 1, obtenemos:
16y27T2D 2
(E- U)s/2
3hvµIF2-F1l
E
------(1)
Cf. tomo 1, Mecánica,§ 18.
383
Predisociación
3. Determinar la probabilidad de transición para energías E próximas al valor U. 1 de la
energía potencial en el punto de intersección.
Solución. Para valores pequeños de E - UJ la fórmula (90.7) no es aplicable, ya que es
imposible considerar constante la velocidad de los núcleos v cerca del punto de intersección y,
por ello, es asimismo imposible sacarla fuera de la integral, como se hizo al deducir (90.7).
Cerca del punto de intersección substituiremos las curvas de U. 11 , VJ 2 por las rectas (90. 13).
Las funciones de onda Znuc 1 y Znuc 2 coinciden en esta región con las funciones de onda del movimiento unidimensional en un campo uniforme (§ 24). El cálculo se efectúa de manera fácil mediante las funciones de onda en la representación de impulsos. La función de onda normalizada
respecto de la función a de la energía tiene la forma (véase el problema del § 24):
( i
1
y(21rñlFJ 2 1)
)
exp-l: -[(E- UJ)p-ps/6µ,]),.,
ñFJ 2
y la función normalizada a la densidad de corriente unidad en las ondas incidente y reflejada se
obtiene multiplicando por l' 2nh:
Al integrar, la energía de perturbación V (el elemento de matriz) se puede de nuevo sacar fuera
de la integral substituyéndola por su valor en el punto de intersección:
~Jv f
CX)
w =
a,a,•
dp/'.
-co
Se obtiene así:
donde <l>(.;) es la función de Airy (véase § b de los apéndices matemáticos). Para grandes valores
de E - UJ esta fórmula pasa a ser la (90. 7).
CAPÍTULO
XII
TEORÍA DE LA SIMETRÍA
§ 91.
Transformaciones de simetría
La clasificación de los términos de una molécula poliatómica está ligada de
manera esencial, como en el caso de la molécula diatómica, con su simetría. Por
ello comenzaremos con un estudio de los tipos de simetría que puede presentar
una molécula.
La simetría de un cuerpo viene determinada por el conjunto de aquellas transformaciones que llevan al cuerpo a coincidir consigo mismo; estas transformaciones
se llaman transformaciones de simetría. Cada una de las posibles transformaciones
de simetría se puede representar como combinación de una o algunas transformaciones pertenecientes a tres tipos fundamentales. Estos tipos esencialmente distintos,
son: la rotación del cuerpo en torno de un cierto eje y de ángulo determinado, la
reflexión en un cierto plano y la translación del cuerpo en cierta dirección a una
cierta distancia. De ellos, únicamente pueden presentar el último tipo de simetría
los cuerpos de extensión infinita (red cristalina), evidentemente. En cambio, un cuerpo
de dimensiones finitas (en particular, una molécula), puede ser simétrico tan sólo
respecto de las rotaciones y las reflexiones.
Si un cuerpo pasa a coincidir consigo mismo en una rotación en torno de un
cierto eje y de amplitud 2n/n, este eje se llama eje de simetría n-aria. El número n
puede tomar cualquier valor entero: 11 = 2, 3, ... ; el valor 11 = 1 corresponde a una
rotación de ángulo 2n o, lo que es lo mismo, de ángulo nulo, es decir, corresponde
a Ja transformación idéntica. La operación definida por la rotación en torno del
eje dado de ángulo 2n/ n la represen.taremos simbólicamente por C n- Repitiendo
esta operación dos, tres, ... veces, obtenemos rotaciones de ángulos 2(2n/n), 3(2n/n),
... , que hacen coincidir el cuerpo consigo mismo; estas rotaciones se pueden representar en la forma C11 2, C,,3, ... Es evidente que si n es un múltiplo de p, se tendrá
CnP
=
cn/11·
(91.1)
En particular, aplicando la rotación n veces, volvemos a la posición de partida, es
decir, aplicamos la transformación idéntica; esta última se suele designar por E, o
sea, se puede escribir:
Transformacione.-. de simetría
385
(91.2)
Si el cuerpo pasa a coincidir consigo mismo en una reflexión en un cierto plano,
este plano se llama plano de simetría. La operación de reflexión en un plano la designaremos con el símbolo a. Es evidente que la doble reflexión en un plano es la transformación idéntica:
cr 2 = E.
(91.3)
la aplicación simultánea de ambas transformaciones - rotación y reflexión conduce a lo que se llama un eje de giro reflejado. Un cuerpo presenta un eje n-ario
de giro reflejado si pasa a coincidir consigo mismo en una rotación en torno de este
eje de ángulo 2n/n seguida de una reflexión en un plano perpendicular al eje (fig. 32).
Es fácil comprender que ésta es una nueva forma de simetría tan sólo cuando n
es un número par. En efecto, sin es un número impar, aplicar n veces el giro reflejado
equivaldrá, simplemente, a la reflexión en un plano perpendicular al eje (ya que el
ángulo de rotación será igual a 2n y un número impar de reflexiones en un mismo
plano es una simple reflexión). Repitiendo esta transformación todavía n veces,
Jlegamos al resultado de que un eje de giro reflejado se reduce a la existencia simultánea de un eje de simetría n-ario y de un plano de simetría perpendicular al mismo
independientes. Si, en cambio, n es un número par, aplicar n veces la transformación
reflexión-rotación vuelve el cuerpo a su posición inicial.
~--.--.op
,
2rr/n
')
Fm. 32
La transformación reflexión-rotación la designaremos con el símbolo S,,. Representando la reflexión en un plano perpendicular a un eje dado por a11., podemos
escribir, por definición:
(91.4)
(el orden en que se aplican las operaciones C11 y ah no influye, evidentemente, en el
resultado).
386
Teoría de la simetría
Un caso particular importante es el de un eje de giro reflejado binario. Es fácil
ver que una rotación de ángulo n seguida de la reflexión en un plano perpendicular
al eje de rotación es precisamente la operación inversión, en la que un punto P del
cuerpo se transforma en otro punto P' que se encuentra sobre la recta que une el
punto P con el punto O de intersección del eje con el plano y tal que las distancias
OP y OP' son iguales. De un cuerpo que es simétrico respecto de esta transformación
se dice que posee un centro de simetría. Representaremos la operación inversión
por el símbolo I; tenemos:
(91.5)
Es evidente también que /ah = C2 , IC2 = a¡¡; con otras palabras, un eje binario,
un plano de simetría perpendicular al mismo y un centro de simetría en el punto
de su intersección, dependen entre sí: la existencia de dos cualesquiera de estos
elementos conduce automáticamente a la existencia del tercero.
Señalaremos aquí toda una serie de propiedades puramente geométricas de las
rotaciones y las reflexiones que conviene tener presente al estudiar la simetría de los
cuerpos.
La aplicación de dos rotaciones en torno de ejes que se cortan en un cierto punto
es una rotación en torno de un tercer eje que pasa por el mismo punto. El producto
de dos reflexiones en planos que se cortan es equivalente a una rotación; el eje
de esta rotación, evidentemente, coincide con la recta de intersección de los planos
y el ángulo de rotación es igual, como es fácil ver mediante una simple construcción
geométrica, al doble del ángulo formado por los dos planos. Si designamos el giro
de ángulo <p en torno de un eje por C(<p) y la reflexión en dos planos que pasan por
este eje mediante lm símbolos a,1 y a' 11 (1), la proposición que acabamos de enunciar
se puede escribir en la forma:
(91.6)
donde <pes el ángulo formado por los dos planos. Es necesario observar que el orden
en que se aplican las dos reflexiones no es indiferente: el producto a,/a 11 equivale
a un giro en el sentido que lleva del plano a'n al av, y al permutar los factores obtenemos un giro de sentido contrario. Multiplicando la igualdad (91.6) a la izquierda
por rrn, se obtiene:
(91.7)
con otras palabras, aplicar una rotación y una reflexión en un plano que pasa por el
eje equivale a la reflexión en otro plano que corta al primero formando un ángulo
igual a la mitad del ángulo de rotación. En particular, de aquí se sigue que un eje
de simetría binario y dos planos de simetría perpendiculares entre sí que pasan
(1) Con el índice v se suele distinguir la reflexión en un plano que pasa por el eje dado (plano« vertical»), y con el índice h, la reflexión en un plano perpendicular al eje (plano «horizontal»).
Tram,f ormaciones de simetría
387
por él dependen entre sí: la existencia de dos de ellos implica la existencia del tercero.
Demostremos que el producto de dos rotaciones de ángulo n en torno de dos
ejes que se cortan formando el ángulo </> ( Oa y Oh en la fig. 33) es una rotación de
ángulo 2</> en torno de un eje perpendicular a los dos primeros (PP' en la fig. 33).
En efecto, es claro desde luego que la transformación resultante es también una
rotación; después de la primera rotación (en torno de Oa) el punto P pasa a coincidir con P', y después de la segunda (en torno de Oh) vuelve a la posición de partida.
Esto significa que la recta PP' no cambia y, por consiguiente, es un eje de rotación.
Para determinar el ángulo de giro basta observar que en la primera rotación el eje
Oa queda en reposo, y que después de la segunda pasa a ocupar la posición Oa',
que forma con Oa el ángulo 2</>. De la misma manera es fácil comprobar que al
permutar el orden en que se aplican ambas transformaciones obtenemos una rotación en sentido contrario.
p
p'
FIG. 33
Aunque el resultado de dos transformaciones sucesivas depende, en general,
del orden en que se aplican, hay muchos casos en que el orden de las operaciones
carece de importancia -- las transformaciones son conmutables. Esto ocurre para
las siguientes transformaciones:
I) dos rotaciones en torno de un mismo eje;
2) dos reflexiones en planos perpendiculares entre sí (equivalen a un giro de
ángulo n en torno de la recta de intersección de los dos planos);
3) dos rotaciones de ángulo n en torno de dos ejes perpendiculares entre sí
(equivalentes a una rotación de ángulo igual en torno de un tercer eje perpendicular
a aquéllos);
4) rotación y reflexión en un plano perpendicular al eje de rotación;
5) una rotación (o una reflexión) cualquiera y la inversión respecto de un punto
que se encuentra sobre el eje de rotación (o en el plano de reflexión); esto se sigue
de l y 4.
388
§ 92.
Teoría de la simetría
Grupos de transformaciones
El conjunto de todas las transformaciones de simetría de un cuerpo dado se
llama su grupo de transformaciones de simetría o, simplemente, su grupo de simetrías.
Hemos hablado antes de estas transformaciones como cambios geométricos del
cuerpo. En las aplicaciones a la mecánica cuántica es más conveniente, sin embargo,
considerar las transformacior..:s de simetría como transformaciones de coordenadas
que dejan invariante el hamiltoniano del sistema en cuestión. Es evidente que si
el sistema pasa a coincidir consigo mismo en un cierto giro, la correspondiente
transformación de coordenadas no cambia su ecuación de ScHRODINGER. Hablaremos así de un grupo de transformaciones respecto del cual es invariante la ecuación
de SCHRODINGER de que se trate (1).
El estudio de los grupos de simetrías conviene esfectuarlo con ayuda del formalismo matemático general de la teoría de grupos, cuyos fundamentos exponemos a
continuación. Consideraremos primero los grupos que contienen un número finito
de transformaciones diferentes (los llamados grupos finitos). De cada una de las
transformaciones que forman parte del grupo se dice que es un elemento del grupo.
Los grupos de simetrías poseen las siguientes propiedades evidentes. De cada
grupo forma parte la transformación idéntica E (que se llama elemento unidad
del grupo). Los elementos del grupo se pueden <<multiplicar>> entre sí; se entiende
por producto de dos ( o de varias) transformaciones del grupo el resultado de su
aplicación sucesiva. Es evidente que el producto de dos elementos del grupo es un
elemento del propio grupo. En la multiplicación de elementos vale la ley asociativa (AB)C = A(BC), donde A, B, C son elementos del grupo. En cambio, la ley
conmutativa en general no se cumple; en el caso general es AB i= BA. Para cada
elemento del grupo, A, existe en el propio grupo el elemento inverso A-1 (la transformación inversa), tal que AA-1 = E. En algunos casos un elemento puede coincidir con su inverso, en particuiar E-1 = E. Es evidente que dos elementos A y A-1
inversos el uno del otro conmutan entre sí.
(1) Este punto de vista permite incluir en los razonamientos no sólo los grupos de las rotaciones y de
las reflexiones, de los que tratamos aquí, sino también otros tipos de transformaciones que dejan invariante
la ecuación de ScHRODINGER. A ellos pertenecen las permutaciones de las coordenadas de las partículas
idénticas que forman parte del sistema dado (la molécula o el átomo). Del conjunto de todas las permutaciones posibles de partículas idénticas en el sistema considerado se dice que constituye su grupo de permutaciones (tratamos ya de él en el § 63). Las propiedades generales de los grupos que se presentan a continuación
valen también para los grupos de permutaciones; no nos ocuparemos aquVen estudiar más detenidamente
este tipo de grupos.
Acerca de las notaciones que hemos adoptado en este capítulo hay que hacer la siguiente observación.
Las transformaciones de simetría son, en esencia, operadores como los que hemos considerado todo a lo
largo del libro (en particular, el operador de inversión, se estudió ya en el§ 30). Por ello habría que designarlos por letras con circunflejo. No lo haremos así; tanto para respetar la notación generalmente admitida,
como teniendo en cuenta el hecho de que ello no puede conducir a confusiones en el presente capítulo.
Por la misma razón, para representar la transformación idéntica utilizamos el símbolo E, y no 1, como
correspondería a las notaciones empleadas en los demás capítulos.
Grupos de transformaciones
389
El elemento inverso del producto AB de dos elementos es igual a
(AB)- 1 = B-IA-1,
y análogamente para el producto de un mayor número de elementos; es fácil comprobarlo efectuando el producto y utilizando la propiedad asociativa.
Si todos los elementos de un grupo conmutan entre sí, este grupo se llama abeliano. Un caso particular de grupo abeliano lo constituyen los grupos cíclicos. Se
entiende por grupo cíclico un grupo cuyos elementos se pueden obtener elevando
a las sucesivas potencias uno de los elementos del grupo, es decir, un grupo formado
por los elementos
donde n es un número entero.
Sea G un cierto grupo (1 ). Si es posible separar de él un conjunto de elementos H
tal que este conjunto forme también un grupo, el grupo II se llama subgrupo del
grupo G. Un mismo elemento del grupo puede pertenecer a diferentes subgrupos.
Si se elige un elemento cualquiera A del grupo y lo elevamos a potencias sucesivas,
obtendremos finalmente el elemento unidad (ya que el número total de elementos
del grupo es finito). Si n es el menor número para el cual A 11 = E, el número n se
llama orden del elemento A, y el conjunto de los elementos A, A 2 , ••• , An = E, período
de A. El período se representa por {A}; forma a su vez un grupo, es decir, es un
subgrupo del grupo inicial, y, además, un subgrupo cíclico.
Para verificar si un conjunto dado de elementos de un grupo forma un subgrupo
del mismo, basta comprobar si al multiplicar dos cualesquiera de sus elementos se
obtiene un elemento que pertenece al mismo conjunto. En efecto, si así ocurre, con
cada elemento A se tendrán también todas sus potencias, entre ellas A11 - 1 (n es el
orden del elemento) que representa el papel de inverso (ya que All-IA = An = E);
en él se tendrá también, evidentemente, el elemento unidad.
El número total de elementos del grupo se llama orden del grupo. Es fácil ver que
el orden de un subgrupo es un divisor del orden del grupo. Para ello consideremos
un subgrupo H del grupo G y sea G1 un elemento del grupo G que no pertenezca
a H. Multiplicando todos los elementos de H por G1 (por ejemplo, a la derecha),
obtenemos un conjunto de elementos (o, como se suele decir, un complejo) que representaremos por JIG 1 . Todos los elementos de este complejo pertenecen, evidentemente, al grupo G. Sin embargo, ninguno de ellos pertenece a ll; en efecto, si
para dos elementos Ha, Hb de H fuera HaG 1 = H¡,, de aquí se seguiría G1 = Ha- 1 H1,,
(1)
Representaremos simbólicamente los grupos por negrillas en cursiva.
390
Teoría de la simetría
es decir, G1 también pertenecería al subgrupo H, en contra de lo supuesto. Análogamente se puede demostrar que si G2 es un elemento del grupo G, que no pertenece
ni a JI ni a HG1, ningún elemento del complejo HG 2 pertenecerá ni a JI ni a JIG1.
Continuando este proceso agotaremos finalmente todos los elementos del grupo
finito G. De esta manera todos los elementos se reparten entre los complejos
H, HGi, HG2•
••• ,
HGm
(donde mes un cierto número), cada uno de los cuales contiene h elementos, donde h
es el orden del subgrupo JI. De aquí se sigue que el orden g del grupo Ges g = hm,
como se trataba de demostrar.
Si el orden de un grupo es un número primo, de lo que acabamos de demostrar
se deduce que este grupo no posee ningún subgrupo (salvo E y el propio grupo).
Es también válida la proposición recíproca: todo grupo que carece de subgrupos
es de orden primo y, además, debe ser cíclico (de no serlo, contendría elementos
cuyos períodos constituirían subgrupos).
Introduzcamos el importante concepto de elementos conjugados: dos elementos A
y B se llaman conjugados entre sí si se tiene
A= CBC- 1 ,
donde C es también un elemento del grupo (multiplicando la igualdad anterior
a la derecha por C y a la izquierda por c-1 obtenemos la igualdad inversa B = c-1
AC). Una propiedad fundamental de la conjugación consiste en que si A es conjugado con B, y B lo es con C, A es conjugado con C; en efecto, de B = p-1 AP,
C = Q-1 BQ (donde P, Q son elementos del grupo) se sigue que C = (PQ)- 1A(PQ).
Por esto se puede hablar del conjunto de los elementos del grupo que son conjugados
entre sí. Estos conjuntos de elementos se llaman clases del grupo. Cada clase viene
por completo determinada por uno cualquiera de sus elementos A; en efecto, dado A
obtenemos toda la clase formando los productos GAc-1, donde Ges uno cualquiera
de los elementos del grupo (con ello, claro está, cada elemento de la clase se puede
obtener más de una vez). De esta manera cabe descomponer todo el grupo en clases;
cada elemento del grupo puede pertenecer, evidentemente, tan sólo a una clase.
El elemento unidad del grupo forma de por sí una clase, ya que para cualquier
elemento del grupo GEG-1 == E. Si el grupo es abeliano, lo mismo vale para cada uno
de sus elementos; dado que todos los elementos de un grupo de este tipo conmutan,
por definición, entre sí, cada elemento es conjugado tan sólo consigo mismo y
constituye así, él sólo, una clase. Hay que subrayar que una clase de un grupo (que
no coincida con E) no es nunca un subgrupo; ello resulta claramente de que no
contiene el elemento unidad.
Todos los elementos de una misma clase poseen el mismo orden. En efecto,
Grupos puntuale...
391
sin es el orden del elemento A (de forma que An = E), igual ocurrirá con el elemento
conjugado B = CAC-1 : (CAC-1)11 = CAnc-1 = E.
SeaH un subgrupo de G y G1 un elemento de G que no pertenezca aH. Es fácil
comprobar que el conjunto de elementos G1I1G 1- 1 satisface todas las condiciones
que caracterizan un grupo, es decir, dicho conjunto es un subgrupo del grupo G.
Los subgrupos JI y G1I1G- 1 se califican de conjugados; cada elemento de uno de
ellos es conjugado con un elemento del otro grupo. Dando a G 1 diferentes valores,
obtenemos toda una serie de subgrupos conjugados que, en parte, pueden coincidir
unos con otros. Puede ocurrir que todos los subgrupos conjugados con lJ coincidan con JI. En este caso 11 se llama divisor normal del grupo G. Así, por ejemplo,
todo subgrupo de un grupo abeliano es, evidentemente, un divisor normal del mismo.
Consideremos un grupo A con n elementos A, A', A", ... y un grupo R con 111
elementos B, B', B", ... y supongamos que todos los elementos de A (salvo el elemento
unidad E) son diferentes de los elementos de R y que conmutan con ellos. Si multiplicamos cada elemento del grupo A por cada elemento del grupo B, obtenemos
un conjunto de nm elementos que forman también un grupo. En efecto, para cada
dos elementos de este conjunto tenemos AB·A'B'=AA'·BB'=A"B", es decir,
de nuevo un elemento del mismo conjunto. El grupo de orden nm así obtenido se
designa por A X B y se llama producto directo de los grupos A y B.
Finalmente, introduzcamos el concepto de isomorfismo de dos grupos. Dos
grupos A y B del mismo orden se llaman isomo,fos si entre sus elementos es posible
establecer una correspondencia biunívoca tal que si al elemento A corresponde el
elemento By al elemento A' el elemento B', al elemento A" == AA' corresponde el
elemento B" = BB'. Dos de tales grupos, considerados en abstracto, poseen, evidentemente, las mismas propiedades, aunque el significado concreto de sus elementos sea diferente.
§ 93.
Grupos puntuales
Las transformaciones que forman parte del grupo de simetrías de un cuerpo
de dimensiones finitas (en particular, de una molécula), deben ser tales que por lo
menos un punto de éste quede en reposo al aplicar una cualquiera de dichas transformaciones. Con otras palabras, todos los ejes y planos de simetría de una molécula
deben tener por lo menos un punto de intersección común. En efecto, la rotación
sucesiva de un cuerpo en torno de dos ejes que no se cortan o la reflexión del mismo
en dos planos que no se cortan, conduce a un movimiento del cuerpo que no puede,
evidentemente, llevarlo a coincidir consigo mismo. Los grupos de simetrías que poseen aquella propiedad se llama grupos puntuales.
392
Teoría de la simetría
Antes de pasar a la construcción de los tipos posibles de grupos puntuales, expondremos un simple método geométrico que permite clasificar fácilmente en clases
a los elementos de un grupo. Sea Oa un cierto eje y A un elemento del grupo que
representa precisamente una rotación de determinado ángulo en torno de este eje.
Sea, además, G una transformación del mismo grupo (rotación o reflexión), que
aplicada al mismo eje Oa lo lleva a la posición Ob. Demostremos que el elemento
B = GAG·-1 corresponde entonces a una rotación en torno del eje Ob de ángulo
igual al que el elemento A hace girar e'1 torno de Oa. En efecto, consideremos el
efecto de la transformación GAG-1 sobre el propio eje Ob. La transformación c-1 ,
inversa de G, lleva el eje Ob a la posición Oa, de modo que la rotación siguiente A
Jo mantiene en esta posición; finalmente, G lo vuelve a la posición de partida. De
esta manera, como resultado de la operación, el eje Ob sigue en el mismo sitio,
de modo que B es una rotación en torno de este eje. Dado que A y B pertenecen
a la misma clase, el orden de estos elementos es el mismo; esto significa que determinan una rotación de ángulo igual.
Llegamos así al resultado de que dos rotaciones de igual ángulo pertenecen
a una misma clase si entre los elementos del grupo existe una transformación mediante la cual uno de los ejes de rotación se puede hacer coincidir con el otro. Exactamente de la misma manera es posible demostrar que también dos reflexiones en
planos distintos pertenecen a una misma clase si una cierta transformación del grupo
lleva a uno de los planos a coincidir con el otro. De los ejes o de los planos de simetría que se pueden llevar a coincidir uno con otro se dice que son equivalentes.
Algunas observaciones más son necesarias en el caso en que ambas rotaciones
se efectúan en torno de un mismo eje. El elemento inverso de la rotctción C,/' (k = l,
2, ... , n - l) en torno de un eje de simetría n-ario es el elemento c 11 -k = C,/l-k,
es decir, la rotación de ángulo (n - k) · (2n/n) en el mismo sentido o, lo que es lo
mismo, la rotación de ángulo 2kn/n en sentido contrario. Si entre las transformaciones del grupo existe una rotación de ángulo n en torno de un eje perpendicular a
aquél (una tal rotación cambia el sentido del eje considerado en el sentido contrario),
según la regla general ya demostrada las rotaciones C,/' y C11 -k pertenecerán a la
misma clase. La reflexión a1z en un plano perpendicular al eje cambia también su
sentido en el opuesto; sin embargo, hay que tener presente que la reflexión cambia
el sentido de la rotación. Por ello la existencia de ah no hace que los elementos
C,/" y c 11 -k sean conjugados. En cambio, la reflexión en un plano que pasa por el
eje no altera el sentido de éste, pero cambia el sentido de la rotación, y por ello
c/1-k = ª1,C,/"av, de forma que cuando existe un tal plano de simetría, e,/ Y c/1-k
pertenecen a una misma clase. Si las rotaciones en torno de un eje, de ángulos iguales y sentidos contrarios, son conjugadas, este eje se llamará bilateral.
La determinación de las clases de un grupo puntual se facilita con frecuencia
por la siguiente regla. Sea G un cierto grupo que no contiene la inversión /, y C¡
Grupo.~ puntuales
393
el grupo formado por los dos elementos I y E. Entonces el producto directo G >< ( ';
es un grupo que contiene un número doble de elementos que el G; la mitad de ellos
coinciden con los elementos del grupo G y los demás se obtienen multiplicando
estos últimos por /. Dado que I conmuta con cualquier otra transformación del
grupo puntual, es claro que el grupo G >< ( '¡ contiene un número de clases doble
que el G; a cada clase ...-1 del grupo G corresponden en el grupo G x C; dos clases:
la .-1 y la A l. En particular, la inversión 1 siempre constituye de por sí una clase.
Pasemos ahora a enumerar todos los posibles grupos puntuales. Los construiremos empezando por los más simples, añadiéndoles luego nuevos elementos de simetría. Los grupos puntuales los designaremos por carácteres cursivos en negrillas
con los correspondientes índices.
l. Grupos C 11
El tipo más simple de simetría posee solamente un eje de simetría de orden n.
El grupo C 1 es el grupo de las rotaciones en torno de un eje n-ario. Este grupo,
evidentemente, es cídico. Cada uno de sus 11 elementos forma de suyo una clase.
El grupo ('1 contiene solamente la transformación idéntica, E, y corresponde a la
ausencia total de simetría.
I l. Grupo S 2n
El grupo S 211 es el grupo de las rotauones en torno de un eje de giro reflejado
de orden par 211. Contiene 211 elementos y es, evidentemente, cíclico. En particular,
el grupo S 2 contiene tan sólo dos elementos: E e 1; se le representa también por C;,
Observemos también que si el orden del grupo es un número de la forma 2n = 4p--;-2.
entre sus elementos figura la inversión; es evidente que (Swt2f' 1 +1 = Cp1, = !.
Un grupo de estas características se puede escribir como producto directo: S 4p+ 2 =
_
X ( '¡; se le designa también por (' 211 +1,;.
211 1
0
('
111. Grupos C 11 1,
Estos grupos se obtienen añadiendo a un eje de simetría n-ario un plano de simetría perpendicular a él. El grupo C 11 1i contiene 2n elementos: las 11 rotaciones del
grupo (' 11 y las 11 transformaciones de reflexión-rotación C,/a1i, k = 1, 2, ... , n
(entre ellas la reflexión C,/'a 11 = a11 ). Todos los elementos del grupo son conmutables, es decir, el grupo es abeliano; el número de clases es igual al número de el~mentos. Sin es par (n = 2p), el grupo contiene un centro de simetría (ya que C2;/a1i =
= C..p1, = 1). El grupo más simple C 11t contiene en total dos elementos: E y a1i; se
le representa también por ( \.
IV. Grupo (' 1111
Si a un eje de simetría n-ario se añade un plano de simetría que pasa por él, esto
394
TPoria ,/(• la .~imPtria
conduce automáticamente a la aparición de otros (11 -- 1) planos que se cortan
a lo largo del eje formando üngulos :r n (esto se sigue directamente del teorema
geométrico (91.7) demostrado en el ~ 91 (1). El grupo (' 11 " que así se obtiene posee,
por consiguiente, 211 elementos: 11 rotaciones en torno del eje n-ario y 11 reflexiones
rr,1 en planos verticales. En la fig. 34 se representan como ejemplos los sistemas de
ejes y planos de simetría de los grupos ( ':l/! y ( '-tw
FIG. 34
Para determinar las clases observemos que, gracias a la existencia de planos
de simetría que pasan por el eje de simetría, este eje es bilateral. La clasificación
efectiva de los elementos en clases es diferente según 11 sea par o impar.
Si n es impar (11 = 2p7 I ), las sucesivas rotaciones C 211 + 1 hacen coincidir cada
uno de los planos con todos los restantes 2p planos sucesivamente, de modo que todos
los planos de simetría son equivalentes y las reflexiones en ellos conducen a una sola
clase. Entre las rotaciones en torno del eje, se tienen 2p operaciones distintas de la
idéntica, que son conjugadas dos a dos y forman p clases, cada una de las cuales
consta de dos elementos (C 2 µ+/' y C:!,,+ 1-"", k = 1, 2, ... , p); además, E forma una
clase separada. De esta manera, en total tenemos p- 2 clases.
Si, en cambio, n es par (n = 2p), mediante las sucesivas rotaciones C 21 , se pueden
intercambiar solamente pares de planos alternados; dos planos consecutivos no
pueden intercambiarse entre sí. De esta manera se tienen dos conjuntos de p planos
equivalentes cada uno y, de acuerdo con esto, dos clases de p elementos (reflexiones)
cada una. En lo que concierne a las rotaciones en torno del eje, C.21 ?''' = E y C 21 t = C2
cada una constituye una clase de por sí, y las restantes 2p - 2 rotaciones son conjugadas a pares y dan p - I clases de dos elementos cada una. Todo el grupo ( '211 , 11
tiene, por consiguiente, p ~ 3 clases.
(') Es fácil ver que e111 un grupo finito no pueden haber dos planos de simetría que se corten formando
un úngulo que no sea igual a una fracción racional de 2:r. Del hecho de la existencia de dos de tales planos
se seguiría la existencia de un número infinito de otros planos de simetría que -.e cortarían a lo largo de
una misma recta y que se obtendrían reflejando un número infini,o de veces un plano en otro. Con otras
palabras, la existencia de dos de tales planos conduce inmediatamente a la simetría axil total.
Grupo.-; puntuale...
395
V. Grupos 1) 11
Si a un eje de simetría de orden 11 se añade un eje binario perpendicular al primero, esto conduce a la aparición de otros 11 - l ejes del mismo tipo, de forma
que en total habrán 11 ejes horizontales de orden dos que se cortan formando ángulos
:r n. El grupo 1) 11 que así se obtiene posee 211 elementos: 11 rotaciones en torno del
eje 11-ario y 11 rotaciones de ángulo ;-r en torno de los ejes horizontales (convendremos
en designar estas últimas por U"!,, conservando la notación C'2 para el giro de ángulo ;-r
en torno de un eje vertical). En la fig. 34 se representan, como ejemplo, los sistemas
de ejes de los grupos l>:1 y 1) 4 •
De manera completamente análoga al caso anterior, se comprueba que el eje
de orden 11 es bilateral y que los ejes horizontales binarios son todos equivalentes,
si 11 es impar, o forman dos conjuntos no equivalentes, si 11 es par. Por consiguiente,
el grupo 1>'2.,i tiene las siguientes p+3 clases: E, 2 clases de p rotaciones 1/2 cada una,
la rotación C'2 y p - l clases de dos rotaciones en torno del eje vertical. En cambio,
el grupo 1)'211 1 tiene p~2 clases: E, 2p+ l rotaciones 1/2 y p clases de dos rotaciones
cada una en torno del eje vertical.
Un caso particular importante es el grupo 1)'2. Su sistema de ejes está constituido
por tres ejes de segundo orden perpendiculares entre sí. Este grupo se designa también por J'.
VI. Grupo /) 1111
Si se añade al sistema de ejes del grupo l)n un plano horizontal de simetría que
pasa por los 11 ejes bina:-ios, aparecen con ello automáticamente 11 planos verticales,
cada uno de los cuales pasa por el eje vertical y uno de los ejes horizontales. El grupo
así obtenido 1) 1111 contiene 411 elementos; además de los 2n elementos del grupo l)m
de él forman parte también 11 reflexiones au y 11 giros reflejados C,/'ah. En la fig. 35
se representa el sistema de ejes y planos del grupo 1)311 •
ª"
La reflexión
conmuta con todos los demás elementos del grupo; por ello se
puede escribir 1),, 11 como producto directo l)nh = /) 11 x ( \, donde ( 's es el grupo
formado por los dos elementos E y a 11 • Para n par, entre los elementos del grupo
figura la inversión y se puede escribir también JJ 21 i,h = 1J;,i >< ('¡.
De aquí se sigue que el número de clases en el grupo J) 11 1i es igual al doble del
número de clases en el grupo l)w La mitad de ellas coincide con las clases del grupo J),,
(rotaciones en torno de los ejes), y el resto se obtiene a partir de elias multiplicando
por ªh· Las reflexiones a 11 en los planos verticales pertenecen todas a una misma
clase (si 11 es impar) o forman dos clases (cuando 11 es par). Las transformaciones de
reflexión-rotación a1,Ckn y a1,c-1.,, son conjugadas a pares.
396
Teoría ,le la simetría
02d
FIG. 35
VI l. Grupos IJ 11 t1
Existe todavía otra posibilidad de añadir planos de simetría al sistema de ejes
del grupo l)w Cabe, en efecto, hacerlos pasar por el eje n-ario bisecando el ángulo
entre cada dos ejes horizontales consecutivos de segundo orden. Una vez más, la
adición de uno de estos planos trae consigo la aparición de otros n - 1 planos.
El sistema que se obtiene de ejes y de planos de simetría determina el grupo D 11 ,1
(en la fig. 35 se representan los ejes y planos de los grupos D 2t1 y D 3 i1).
El grupo l),u 1 contiene 4n elementos. A los 2n elementos del grupo D 11 se añaden
las n reflexiones en los planos verticales ( representadas por ai1-reflexiones en los
planos «diagonales>>) y 11 transformaciones del tipo G = U.pi1. Para poner de mafiesto el carácter de estas últimas, observemos que la rotación U2 se puede escribir,
es la reflexión en el plano vertical
según (91.6), en la forma U2 = a1ia,,, donde
que pasa por el eje dado de segundo orden; entonces G = a 1p,p" (de suyo, las transformaciones a 11 y ª1i no son, claro está, elementos del grupo). Dado que los planos
de reflexión a,, y ªr1 se cortan a lo largo del eje n-ario formando el ángulo (:r,1211)
(2/.: I ), donde k = 1, 2, ... , (n -- I) (ya que aquí el :ingulo entre planos contiguos
es igual a :r2n), en virtud de (91.6) tenemos a1,a" = C 2 /"+ 1 • Encontramos de esta
manera que G = a 11 C211 2"+ 1 = S 2,/·+ 1, es decir, estos elementos son giros reflejados,
en torno del eje vertical, que es, por consiguiente no un simple eje de simetría n-aria,
sino un eje de reflexión-rotación de orden 211.
ªu
+
Los planos diagonales reflejan entre sí dos ejes horizontales consecutivos de
segundo orden; por ello, en los grupos considerados todos los ejes binarios son equivalentes (tanto para 11 par como para 11 impar). Análogamente, son equivalentes
todos los planos diagonaíes. Los giros reflejados S 2,,2 1·+ 1 y S 211 - 2"- 1 son conjugados
a pares (1).
(1)
En efecto, tt,nemos:
Grupos puntuales
397
Aplicando estas consideraciones al grupo /) 211 ,,1, encontramos que contiene ]as
siguientes 2p _J._ 3 clases: E, la rotación C2 en torno del eje n-ario, p -- I clases de
rotaciones conjugadas en torno del mismo eje con dos elementos cada una, la clase
de 2p rotaciones U2 , la clase de 2p reflexiones <rt1, y p clases de transformaciones de
reflexión-rotación con dos elementos en cada clase.
Para n impar (n == 2p---':- l ), entre los elementos del grupo figura la inversión
(lo que se deduce de que uno de los ejes horizontales es, en este caso, perpendicular
al plano vertical). Por ello se puede escribir /) 211 +1,t1 = /) 211 + 1 x ('¡, de modo que
el grupo D 2µ+i,d contiene 2p+4 clases, que se obtienen inmediatamente de las p__J._2
clases del grupo D 21 1+i·
C3
/
('.-
'
e2
'
-¿
/
-
/
'
'..J.,"
/
T
FIG. 36
V 111. Grupo T (grupo del tetraedro)
El sistema de ejes de este grupo es el sistema de ejes de simetría del tetraedro.
Se puede obtener añadiendo al sistema de ejes del grupo r cuatro ejes oblicuos
de tercer orden, las rotaciones en torno de los cuales transforman entre sí los tres
ejes binarios. Es cómodo representar este sistema de ejes haciendo pasar los tres
ejes binarios por los centros de las caras opuestas de un cubo y representando los
ejes de tercer orden como diagonales espaciales de este cubo. En la fig. 36 se indica
1a posición de estos ejes en el cubo y en el tetraedro (un eje de cada tipo).
Los tres ejes binarios son equivalentes entre sí. Los ejes terciarios son también
equivalentes, ya que se transforman entre sí por las rotaciones C2 , pero no son ejes
bilaterales. De aquí se sigue que los 12 elementos del grupo T se distribuyen en
cuatro clases: E, las tres rotaciones C2, las cuatro rotaciones C3 y las cuatro rotaciones C/.
IX. Grupo T<i
Este grupo contiene todas las transformaciones de simetría del tetraedro. El
sistema de sus ejes y planos se puede obtener añadiendo a los ejes del grupo T planos
de simetría tales que cada uno de ellos pasa por un eje binario y dos ejes ternarios.
Al hacerlo, los ejes binarios pasan a ser ejes de reflexión-rotación de orden cuatro
Teoría tle la simetría
398
(de manera análoga a lo que ocurre en el grupo /) 2 i1). Es cómodo representar este
sistema trazando los tres ejes de reflexión-rotación por los centros de los pares de
caras opuestas de un cubo. los cuatro ejes ternarios, en forma de diagonales espaciales y los seis planos de simetría, uno por cada par de aristas opuestas (en la fig. 37
se representa uno de cada uno de estos tipos de ejes y de planos).
I
-------...11
I
/
/
1
1
/
L_
1
1
1
1
1
1
1
1
--J
/
I
I
1I /
~------
FIG.
/
37
Dado que los planos de simetría son verticales respecto de los ejes ternarios,
éstos son ejes bilaterales. Todos los ejes y planos de cada tipo son equivalentes.
Por ello, los 24 elementos del grupo se distribuyen entre las 5 clases siguientes: E,
las ocho rotaciones Ca y C/, las seis reflexiones en los planos, los seis giros reflejados S 1 y S/ y las tres rotaciones C2 =--- S/.
X. Grupo 1'¡,
Este grupo se obtiene a partir del 1' añadiendo un centro de simetría: 1',,
=
-==
T i< ( '¡. Como resultado de ello aparecen tres planos de simetría perpendiculares
entre sí, que pasan por cada dos ejes binarios. y los ejes ternarios pasan a ser ejes
de reflexión-rotación de orden seis (en la fig. 38 se representa uno de cada uno
de estos ejes y planos).
El grupo contiene 24 elementos. distribuidos en g clases, que se obtienen inmediatamente a partir de las clases del grupo T.
399
Grupo.~ puntuales
XI. Grupo () (grupo del octaedro)
El sistema de ejes de este grupo es el sistema de ejes de simetría del cubo: tres
ejes de cuarto orden pasan por los centros de las caras opuestas, cuatro ejes ternarios pasan por vértices opuestos y seis ejes binarios pasan por los puntos medios
de pares de aristas opuestas (fig. 39).
Es fácil ver que todos los ejes de igual orden son equivalentes y que cada uno
de ellos es bilateral. Por lo tanto, los 24 elementos se distribuyen en las siguientes
5 clases: E, las ocho rotaciones Ca y C/·, las seís rotaciones C-1 y C.¡2, las tres rotaciones
C/' y las seis rotaciones C-2.
¡r-1 1
I
C2
1
(f
f-+-
1
1
1
1
1
1
1
1
,1
-------;71
--71
I¡
C4
---(
1
1
1
1
I¡
1
1
1
1
c2
/
1
-¡--J
I
I
1
1/
__ _y
iL __
1
1
1
J._-¿
/
¡
/
1
/
¡¿_ _____ _
/
1¡
o
7i;
FIG. 38
FIG. 39
XI l. Grupo (}¡¡
Este es el grupo de todas las transformaciones de simetría del cubo (1 ). Se obtiene
añadiendo al grupo () un centro de simetría: 01, = () ,. ( '¡. Con ello los ejes de
tercer orden del grupo () se transforman en ejes de reflexión-rotación de sexto orden
(diagonales espaciales del cubo); adem~is, aparecen todavía seis planos de simetría,
------7!
¡ t
C4
1
1
(Í
1
1
I
f- r--1 '
1
10'
1
1
1
1
1
I
I
1
''
1
/
~'
'
1
1
-}
/
I¡
ll_,_ _ _ _ _ _ _
oh
FIG. 40
(
1
)
Los grupos '/', '/',¡, '/',,, O, 0
11
se llaman con frecuencia grupos tf,,f cuho, o cúhicos.
400
Teoría de la .'limetría
que pasan por cada par de aristas opuestas, y tres planos, que son paralelos a las
caras del cubo (fig. 40). El grupo contiene 48 elementos distribuidos en 10 clases,
que se pueden obtener directamente a partir de las clases del grupo O. Así, 5 coinciden con ]as clases del grupo O, y las restantes son : /; los ocho giros reflejados
S 6 y S 6 5 , ]os seis giros reflejados C4ah y C}ah en torno de los ejes de cuarto orden;
las tres reflexiones ah en los planos que son horizontales respecto de los ejes cuaternarios, y las seis reflexiones a,, en planos verticales respecto de estos ejes.
XIJI
y XIV.
Grupos
r, r1i
(grupos del icosaedro)
Estos grupos no tienen interés desde el punto de vista físico, ya que no se presentan en la naturaleza como grupos de simetría de las moléculas. Por ello aquí
nos limitaremos a indicar que }' es el grupo de las 60 rotaciones en torno de ]os ejes
de simetría del icosaedro (poliedro regular de 20 caras triangulares) o del dodecaedro pentagonal (poliedro regular de 12 caras pentagonales), con seis ejes de quinto
orden, 1O de tercero y 15 de segundo. El grupo r1i se obtiene añadiendo un centro
--=
.>( ( '; y representa el grupo completo de transformaciones de
de simetría:
simetría de los poliedros en cuestión.
r,,
r
Con estos grupos se agotan todos los tipos posibles de grupos puntuales que
contienen un número finito de elementos. A ellos hay que añadir los llamados grupos
puntuales continuos, que contienen un número infinito de elementos. Tales grupos
se estudiarán en el 98.
*
§ 94.
Representaciones de los grupos
Consideremos un grupo cualquiera de simetría y sea ~, 1 una función uniforme
de las coordenadas (1). En la transformación del sistema de coordenadas que corresponde al elemento G del grupo, esta función se transforma en otra. Aplicando sucesivamente todas las g transformaciones del grupo (g es el orden del grupo), obtenemos a partir de ~, 1, en general, g funciones diferentes. Sin embargo, para determinadas funciones ~, 1, algunas de estas funciones transformadas pueden resultar ser
linealmente dependientes. Obtenemos así un cierto número f (f <. g) de funciones
linealmente independientes 1¡ 1, ~,2 , ... , ~'! que al aplicar las transformaciones de
simetría que ;orman el grupo considerado se transforman linealmente entre sí.
Con otras palabras, como resultado de la transformación G cada una de las funciones ~';(i = l, 2, ... , f) pasa a ser una combinación lineal de la forma:
1
f
~
k-1
Gki'Pk,
donde los G¡¡, son constantes que dependen de la transformación G. Se llama matri::
de la transformación (2 ) al conjunto de estas constantes.
1
En el espacio de las configuraciones del sistema físico en cuestión.
Dado que las funciones '/'i se suponen uniformes, a cada elemento del grupo corresponde una
determinada matriz.
(
)
{2)
401
Representación de los grupos
En relación con esto conviene considerar los elementos G del grupo como operadores que actúan sobre las funciones "Pi, de modo que se podrá escribir:
(94.1)
Las funciones "Pi se pueden siempre elegir de tal manera que sean ortogonales dos
a dos y normalizadas. El concepto de matriz de la transformación coincide entonces
con el concepto de matriz de un operador en la forma como se la definió en el § 11 :
(94.2)
Al producto de dos elementos G y. H del grupo corresponde la matriz definida
por las matrices G y H de acuerdo con la regla ordinaria de multiplicación de matrices (l l.12):
(94.3)
Del conjunto de las matrices de todos los elementos del grupo se díce que constituyen una representación del grupo. Las funciones "Pi, ... , "Pt, mediante las cuales
se definen estas matrices, se llama base de la representación. El número f de estas
funciones determina k llamada dimensión de la representación.
Consideremos la integral fl1P[ 2 dq, donde 1P es una cierta función de las coordenadas. Dado que la integral se extiende a todo el espacio, es evidente que en cualquier rotación o reflexión del sistema de coordenadas su valor no variará. Por ello,
para cualquier transformación de simetría G se puede escribir;
f (G*i/¡*)(Gi/¡) dq f if¡*if¡ dq.
lntroduciendo el operador
G transpuesto
del
G,
tenemos
f (G*¡/J*)(G¡/J) dq = f if¡ÚG*if¡* dq f if¡*if¡ dq,
=
de donde sigue, dada la arbitrariedad de 1p, que (;(;•
es decir, los operadores
G son
º*
1, ó
= (;-1,
unitarios.
Así, pues, una representación del grupo realizada mediante funciones de base
ortonormalizadas es unitaria, es decir, el grupo viene representado por matrices
unitarias.
Aplicando a las funciones "Pi, ... , "Pt una transformación lineal unitaria
402
Teoría de la simetría
(94.4)
obtenemos un nuevo sistema de funciones "P'i,
1P't, también ortonormalizadas
(véase § 12) (1). Tomando como base de la representación las funciones 1P' ¡, tendremos una nueva representación cuya dimensión será la misma. Tales representaciones,
que se obtienen una de otra mediante una transformación lineal de las funciones de
base, se IJaman equivalentes; es evidente que no son esencialmente distintas.
Las matrices de dos representaciones equivalentes están ligadas entre sí por una
sencilla relación: según (12. 7), la matriz del operador G en la nueva representación
es igual a la matriz del operador
C' =S-1GS
(94.5)
en la representación primera.
La suma de los elementos diagonales (es decir, la traza) de la matriz que representa
a un elemento G del grupo se llama su carácter; designaremos los caracteres por x(G).
El hecho de que los caracteres de las matrices de representaciones equivalentes coinciden es muy importante (véase el final del § 12). Este hecho hace particularmente
útil el describir la representación de un grupo por sus caracteres; ello permite distinguir inmediatamente las representaciones esencialmente distintas de las representaciones equivalentes. En lo que sigue, cuando hablemos de representaciones
distintas nos referimos solamente a representaciones no equivalentes.
Si por S se entiende en (94.5) el elemento del grupo que liga dos elementos conjugados G y G', llegamos al resultado de que, en una representación dada cualquiera
del grupo, los caracteres de las matrices que representan a los elementos de una
misma clase son iguales.
Al elemento unidad del grupo, E, corresponde la transformación idéntica. Por
ello la matriz que lo representa es diagonal en cualquier representación y, además,
los elementos diagonales son iguales a la unidad. El carácter x(E) es, por consiguiente, igual simplemente a la dimensión de la representación
x(E) =
f.
(94.6)
(1) Obsérvese también que una transformación unitaria deja invariable la suma de los cuadrados
de los módulos de las funciones que se transforman. En efecto, teniendo en cuenta (12.6), tenemos:
Representación de los grupos
403
Consideremos una representación de dimensión f Puede ocurrir que, como
resultado de una transformación lineal de la forma (94.4), las funciones de base
se agrupen en conjuntos def1,h, ... funciones U~+f2 +... =!) de tal manera que, al
aplicar todos los elementos del grupo, las funciones de cada conjunto se transforman
tan sólo entre sí, sin que intervengan funciones de los otros conjuntos. Se dice en
tal caso que la representación dada es reducible.
Si, en cambio, el número de funciones de base que se transforman entre sí no
se puede disminuir mediante combinaciones lineales de las mismas, la representación que proporcionan se llama irreducible. Toda representación reducible se puede
descomponer, conforme suele decirse, en representaciones irreducibles. Esto significa que, mediante la correspondiente transformación lineal, las funciones de base
se distribuyen en una serie de conjuntos, cada uno de los cuales se transforma al
aplicar los elementos del grupo de acuerdo con una representación irreducible.
Puede suceder que algunos conjuntos diferentes se transformen según la misma
transformación irreducible; en tal caso se dice que la representación irreducible
está contenida en la inicial el correspondiente número de veces.
Las representaciones irreducibles son características esenciales de un grupo y
desempeñan un importante papel en todas las aplicaciones de la teoría de grupos
a la mecánica cuántica. Veamos cuáles son las propiedades fundamentales de dichas
representaciones (1).
Se puede demostrar que el número de representaciones irreducibles de un grupo
diferentes es igual al número r de clases del grupo. Distinguiremos los caracteres
de las diferentes representaciones irreducibles mediante superíndices; los caracteres
de las matrices del elemento G en las distintas representaciones serán
x<1 >(G), x<2 >(G), ... , x<r>(G).
Los elementos de matriz de las representaciones irreducibles satisfacen toda una
serie de relaciones de ortogonalidad. En primer lugar, para dos representaciones
irreducibles distintas vale la relación
~
G G(a.)i "kG(/J)l m
*=o
(94.7)
donde rL =/= fJ caracterizan dos representaciones irreducibles y la suma se extiende
a todos los elementos del grupo. Para cada representación irreducible se tiene, en
cambio. la relación
LG c<a.>i .kG<ª'z m * = .!_3
fa. i..,8k m
(94.8)
(1) La demostración de estas propiedades se puede encontrar en los cursos especiales de teoría de
grupos, por ejemplo, en el libro de V. l. SMIRNOV, Kurs vysshei matematiki, tomo III, parte I, Fizmatgiz,
1958 (existe traducción inglesa; A course of higher Mathematics, Pergamon Press, 1964).
Teoría de la simetría
404
es decir, son diferentes de cero tan sólo las sumas de los cuadrados de los módulos
de los elementos de matriz:
~ [G(:x)ik[ 2 =
G
glfa.•
Las relaciones (94.7-8) se pueden escribir juntas en la forma:
~ G<cx.>ikG(JJ)im* = ~a./>izSkm·
(94.9)
Ícx.
G
En particular, a partir de aquí es posible obtener una importante relación de
ortogonalidad para los caracteres de las representaciones; sumando los dos miembros
de la igualdad (94.9) respecto de los pares de índices i, k y /, m, obtenemos:
(94.10)
Para
et.
= f3 se tiene:
ti [x<º:l(G)l2 = g,
es decir, la suma de los cuadrados de los módulos de los caracteres de una representación irreducible es igual al orden del grupo. Obsérvese que esta relación se puede
utilizar como criterio de irreducibilidad de una representación - para una representación reducible esta suma es siempre mayor que g (y, además, igual a ng, donde n
es el número de representaciones irreducibles contenidas en ella).
De (94.10) se sigue también que la igualdad de los caracteres de dos representaciones irreducibles es, no sólo condición necesaria, sino también suficiente para
que sean equivalentes.
Dado que los caracteres que se refieren a los elementos de una clase son iguales,
en la suma (94.10) se tienen realmente, en total, r términos independientes y es posible escribirla también en la forma:
(94.11)
donde la suma se extiende a las r clases del grupo (que convenimos en designar por
la letra C), y ge es el número de elementos en la clase C (1).
( 1)
Dado que el número de representaciones irreducibles coincide con el número de clases, las cantidades /a.e = Vgclgx(ix)(C) forman una matriz cuadrada de orden r.
De las relaciones de ortogonalidad respecto del primer índice ("E-fa.cff3*c = Oa.f3) St; siguen entonces
e
,
automáticamente las relaciones de ortogonalidad respecto del segundo índice: "E-Ja.c/a.*c,
=
<5cc, Por
(J.
ello, junto a las (94.11), valen también las fórmulas:
(94.lla)
405
Representación de los grupos
La relación (94.10) permite muy fácilmente llevar a cabo la descomposición
de toda representación reducible en representaciones irreducibles si se conocen los
correspondientes caracteres.
Sean x(G) los caracteres de una cierta representación reducible de dimensión f
y supongamos que los números aül, a< 2 >, ... , a<r> indican cuantas veces están contenidas en ella las correspondientes representaciones irreducibles, de modo que
,.
~ d/J>J13
P-1
=!,
(94.12)
(f{J son las dimensiones de las representaciones irreducibles). Los caracteres x(G)
se pueden escribir entonces en la forma:
r
x( G) =
~
d/Jlx</Jl( G).
{3-1
(94.13)
Multiplicando esta igualdad por x(~l(G)* y sumando respecto de todos los G, obtenemos en virtud de (94.1 O):
1
a<cx> = - ~ x(G)x<cxl(G)*.
g G
(94.14)
Consideremos la representación de dimensión!= g cuya base son las g funciones
G1f), donde 1P es una función general cualquiera de las coordenadas (de modo que
todas las g funciones G'lj) que se obtienen a partir de ella son linealmente independientes); dicha representación se llama regular. Es claro que los elementos diagonales
de las matrices de esta representación serán nulos, con la única excepción de la
matriz que corresponde al elemento unidad; por ello será x(G) = O para G =/= E
y x(E) = g. Descomponiendo esta representación en representaciones irreducibles,
para los números a(~) obtenemos, según (94.14), los valores a<cx> = (1/g)g¡<rx> = ¡<ex>,
es decir, cada representación irreducible está contenida en la representación reducible
considerada un número de veces igual a su dimensión. Substituyendo este resultado
en (94.12), encontramos la relación
N+N+ ··· +fr2 = g;
(94.15)
la suma de los cuadrados de las dimensiones de las representaciones irreducibles
de un grupo es igual a su orden (1). De aquí se sigue, en particular, que en los grupos
abelianos (en los que r = g) todas las representaciones irreducibles son unidimensionales (f1 =J; = ... =fr = 1).
Haremos notar también, sin demostrarlo, que las dimensiones de las representaciones irreducibles de un grupo son divisores de su orden.
(1) Obsérvese que, para los grupos puntuales, y dados r y g, la ecuación (94.15) puede de hecho quedar
satisfecha tan sólo para un sistema de números enteros .(1, ••• , fr.
406
Teoría de la simetría
Entre las representaciones irreducibles de cualquier grupo existe siempre una
que es trivial, representación realizada por una función de base invariante respecto
de todas las transformaciones del grupo. Esta representación unidimensional se
llama representación unidad; todos los caracteres son en ella iguales a 1.
Consideremos dos sistemas diferentes de funciones "Pi(rt.), ... , "Pt/rt.) y 1p//3), ... ,
'I.J)¡¡/!3> que constituyen dos representaciones irreducibles de un grupo. Formando
los productos 1p/'Xl1JJ1}f3), obtenemos un sistema de f 'Y..f¡-3 funciones nuevas que pueden·
servir como base de una nueva representación de dimensión f 'Y..f(3. Esta representación
se llama producto directo de las dos primeras, y es irreducible tan sólo si uno por lo
menos de los números f 'Y. o !{3 es igual a la unidad. Es fácil ver que los caracteres del
producto directo son iguales a los productos de los caracteres de las dos representaciones componentes. En efecto, si
(j,l,.(rx) =~G.(rx),/,(rx)
'l'i
l
h 'l'l ,
se tendrá
de aquí se sigue para los caracteres, que designaremos por (i'X) x x<:'1>)(G), la relación:
es decir,
(94.16)
En particular, las dos representaciones irreducibles que se multiplican pueden
coincidir; en este caso se tienen dos sistemas distintos de funciones 1JJ1 , ... , "Pt y
c/,1, ••• , </>¡ que realizan una y la misma representación, y el producto directo de la
representación por si misma tiene como base las f2 funciones 1JJ¡</>1,: y como caracteres
los valores
(xxx)(G) = [x(G)]2.
Esta representación reducible se puede descomponer inmediatamente en dos representaciones de menor dimensión (pero, en general, asimismo reducibles, con todo).
Una de ellas tiene como base las/(/+ 1)/2 funciones 1JJ¡</>1,:+1JJ1,:</>¡; la otra, las/(/- 1)/2
funciones 1JJ¡<p1,: - 1Pk'Pi, i =/= k (es evidente que las funciones de cada uno de estos
sistemas se transforman únicamente entre sí). El primer sistema se llama producto
simétrico de la representación por sí misma (sus caracteres se designan por el símbolo [x 2 J(G)), y el segundo, producto antisimétrico (sus caracteres se designan por el
iÍmbolo {.7.2 }( G)).
Representación de los grupos
407
Para determinar los caracteres del producto simétrico escribamos:
G(t/¡i</>k+'Pk'Pi) =
GuGmi'Pi'Pm+'Pm'Pz)
l,~
=
! l:n(GzPmk+GmPi1c)(tpz</>m+'Pm'Pz).
De aquí resulta para el carácter
[x2 ](G) =
Pero~• Gii
la fórmula
=
x(G), y~
GikGki
í,k
=
t i,k
~ (Gipkk+GikGki).
x(G 2); de esta manera obtenemos en definitiva
[x2](G) = i{[x(G)]2+x(G2)},
(94.17)
que permite determinar los caracteres del producto simétrico de una representación
por sí misma en función de los caracteres de la representación de partida. De manera
del todo análoga encontramos para los caracteres del producto antisimétrico la
fórmula
{x2}(G) = füx(G)] 2-x(G2)}.
(94.18)
Si las funciones '!f)¡ y <p¡ coinciden, a partir de ellas es posible determinar, evidentemente, tan sólo el producto simétrico, cuya base está constituida por los cuadrados
'!f)? y los productos '!f)¡'lf'k, i ==/= k. En las aplicaciones es necesario considerar también
productos simétricos de grado más elevado; sus caracteres se pueden obtener de
manera análoga.
Hay que hacer notar una propiedad de los productos directos cuya importancia
se verá más adelante. La descomposición del producto directo de dos representaciones irreducibles distintas en componentes irreducibles nunca contiene la representación unidad; en cambio, el producto directo de una representación irreducible por
sí misma (es decir, su parte simétrica, evidentemente) siempre contiene dicha representación - y precisamente una sola vez. En efecto, para saber si en la representación (94.16) está o no contenida la representación unidad, es necesario (según
(94.14)) tan sólo sumar sus caracteres respecto de G (y dividir el resultado por el
orden del grupo g). Pero teniendo en cuenta las relaciones (94. 10), obtenemos en
este caso el valor cero si ==/= fJ o la unidad si 'Y. = fJ.
(X
Para las aplicaciones es útil conocer una fórmula que permite representar una
función arbitraria '!f) como suma de funciones que se transforman según las representaciones irreducibles de un grupo, es decir, en la forma:
lf =
LJLJ tp.(CX)
°' i
i
(94.19)
'
donde las funciones '!f)/x) (i = 1, 2, ... , /,y_) se transforman de acuerdo con la representación irreducible 'Y.-ésima. El problema consiste en determinar las funciones
408
Teoría de la simetría
1P/'Y..) dada la función 1P y se resuelve mediante la fórmula
(94.20)
Para demostrarlo basta probar que la expresión que aparece en el segundo miembro
de la igualdad se reduce idénticamente a 1P/'Y..) si hacemos 1P = 1P/r:1.), y a cero, si
hacemos 1P = 'lf)¡/fJ) con k =J=. i o fJ =J=. r:,.; tanto lo uno como lo otro se siguen inmediatamente de las relaciones de ortogonalidad (94.7-8) si en ellas se hace Cif;k(JJ)
= 1:: G lk (JJ>if; ¡<P>.
l
Si se substituye (94.20) en (94.19) y se efectúa la suma respecto de i, obtenemos
un desarrollo más simple de la función arbitraria 1P en funciones 1P('Y..~ asociadas
a las distintas representaciones irreducibles, pero no a determinadas filas de las
mismas:
(94.21)
Finalmente, haremos algunas observaciones acerca de las representaciones irreducibles de un grupo que es producto directo de otros dos grupos (¡no se confunda
con el producto directo de dos representaciones de un mismo grupo!). Si las funciones 1P/rt.> son base de una representación irreducible del grupo-A. y las funciones
'lf)/fl> lo son para el grupo B, los productos 1P/f1>1P/rt.) serán la base de una representación del grupo A X B de dimensión f J (J, y esta representación es irreducible. Los
caracteres de la misma se obtienen multiplicando los correspondientes caracteres
de las representaciones de partida (cf. la deducción de la fórmula (94.16)); al elemento C = AB del grupo A x B corresponde el carácter
x(C) = x<cx>(A)x<P>(B).
(94.22)
Multiplicando de esta manera todas las representaciones irreducibles de los grupos
A y B, obtenemos todas las representaciones irreducibles del grupo A x B.
§ 95.
Representaciones irreducibles de los grupos puntuales
Pasemos ahora a la determinación concreta de las representaciones irreducibles
de los grupos puntuales que son interesantes desde el punto de vista físico. La mayor
parte de las moléculas poseen solamente ejes de simetría de segundo, tercero, cuarto
y sexto orden. Por ello no hay necesidad de considerar los grupos del icosaedro
Y, Y h; los grupos Cm C nh, C nv, D n, D nh los estudiaremos tan sólo para los valores
n = 1, 2, 3, 4, 6, y los grupos S 2n, Dnd sólo paran = 1, 2, 3.
Los caracteres de las representaciones de estos grupos se dan en las tablas adjun-
409
Representaciones irreducibles de grupos puntuales
tas. Los grupos isomorfos tienen las mismas representaciones y se presentan juntos
en una sola tabla. Los números ante los símbolos de los elementos del grupo que
aparecen en las primeras filas indican los números de elementos en las correspon7
TABLA
Caracteres de las representaciones irreducibles
de los grupos funcionales
E 1
E
E
A
1
A;z
a
¡
E; x±iy
A;z
A';x,y
Au;x,y,z B;x,y A";z
1
1
-1
1
E 2C 3
3a,,
a' 11
E 2C 3
3U1
1
1
A 1 ;z
-1
A
-1
-1
E;x,y
-1
1
-1
-1
E;x,y
2
-1
o
-1
Ca
A;z
A;z
A
1
B
B;z
1 -1
E;x±iy E;x±iy
¡
1
1
1
1
-1
B
E1
-1 -i
- i -1
E,; x±iy
¡
¡
1
1
1
1
1
1
-1
1
-1
1
-1
w1
-,.JJ
1 -e.u
1 w
w 1 -w
w1 1
-w w 1
w 2 -1 -w -w 1
1 -w2 -w -1
w1
w
Teoría de la simetría
410
TABLA
7 (Continuación)
c...,
E
C2
2e, 2a 11
2a' 11
E
e2
2e, 2U2
2U'i
Du
E
e,.
2s, 2u.
2a 11
D,
A1;z
A1
A1
1
1
1
1
1
A2
A2;z
Aa
1
1
1
-1
-1
B1
B1
B1
1
1
-1
1
-1
B2
B2
B 2; z
1
1
-1
-1
1
E;x,y
E;x,y
E;x,y
2
-2
o
o
o
E
e,.
2e. 2e1
3Ua
3U'1
E
c.
2e1 2ee
3a 11
3a' 11
Du
E
ª"
2e, 2s,
3Ua
3a' 11
1
1
1
1
1
1
-1
-1
De
Co
1
A1
A1;z
A1'
A2; z
A2
A2'
B1
B2
Ai''
1
-1
1
-1
1
-1
Bs
Bi
A,/'; z
1
-1
1
-1
-1
1
Ea
Ea
E';x,y
2
2
-1
-1
2
-2
-1
1
o
o
o
o
E 1 ;x,y Ei;x,y E"
1
o
T,
E se, 3e2 6a 4 6S,
A1
A1
1
1
e:I
As
A1
1
1
1
-1 -1
e:
E
E
2
-1
2
o o
Fa
F2 ;x,y, z
3
o
o
-1
T
E 3e1 4e, 4e1 2
A
1
1
1
1
1
1
e:
1
e:•
E
F; x,y, z
{
3
-1
E Se, 3e2 6e1 6e,
o o
F1;x,y,z Fi
3
1
1
-1 -1
-1
1
Representaciones irreducibles de grupos puntuales
411
dientes clases (véase § 93). En las primeras columnas se indican los símbolos de las
representaciones generalmente adoptados. Las representaciones unidimensionales
se designan por las letras A, B, las de dos dimensiones por la letra E y las de tres,
por F (¡no se confunda la notación E para una representación irreducible bidimensional con la notación E para el elemento unidad del grupo!) (1). Las funciones de
base de las representaciones A son simétricas, y las funciones B, antisimétricas,
respecto de las rotaciones en torno del eje principal n-ario. Las funciones de distinta
simetría respecto de la reflexión ah se distinguen entre sí mediante apóstrofos (uno
o dos), y los índices g y u indican la simetría respecto de la inversión. Junto con los
símbolos de las representaciones, se indica con las letras x, y, z respecto de qué
representación se transforman las propias coordenadas (con vistas a las ulteriores
aplicaciones a la mecánica cuántica); el eje z se elige siempre de forma que coincida
con el eje principal de simetría. Las letras e y w significan:
• = él:rri/3,
w
= e?.rri/6 = _ w'.
La determinación de las representaciones irreducibles de los grupos cíclicos
(grupos Cm Sn) es la más simple de todas. Un grupo cíclico, como todo grupo abeliano, tiene sólo representaciones unidimensionales. Sea G el elemento generador
del grupo (es decir, el elemento cuya aplicación sucesiva da todos los elementos
del mismo). Dado que GY = E (g es el orden del grupo), es claro que al aplicar el
operador G a una función de base "P esta última únicamente puede quedar multiplicada por
u
V1,
es decir (2),
(;i¡,
= e2TTikJo,¡,
(k
= 1, 2, ... , g).
El grupo C"h (v sus isomorfos C 20 y D 2) es abeliano, de modo aue todas sus repre·
sentaciones irreducibles son también unidimensionales, pudiendo ser sus caracteres
tan sólo iguales a ± 1 (ya que el cuadrado de cada elemento es igual a E).
Consideremos ahora el grupo Cav· Comparado con el grupo Ca, se añade aquí
las reflexiones a0 en los planos verticales (que pertenecen todas a una misma clase).
Una función invariante respecto de la rotación en torno del eje (función de base
de la representación A del grupo Ca), puede ser simétrica o antisimétrica respecto
de las reflexiones ªv· En cambio, las funciones que en la rotación Ca quedan multiplicadas por e y e2 (funciones de base de las representaciones conjugadas complejas E), se transforman entre sí en una reflexión (3). De estas consideraciones se sigue
( 1)
La razón por la que dos representaciones conjugadas complejas unidimensionales se representan
como una bidimensional se explica en el § 96.
( 2)
Para el grupo puntual C n se puede elegir como función VJ, por ejemplo, la función ,p = eik</>,
k = l, 2, ... , n, donde ,f, es el ángulo de rotación en torno del eje contado a partir de una dirección determinada.
(3) Estas funciones se pueden elegir, por ejemplo, de la forma tp1 = et</>, tp2 = e-t</> En una reflexión
en un plano vertical ,f, cambia de signo.
Teoría de la simetría
412
que el grupo C 3v (y su isomorfo el grupo D 3) tiene dos representaciones unidimensionales y una representación bidimensional irreducibles con caracteres que se dan
en la tabla. Hemos obtenido así efectivamente todas Jas representaciones irreducibles,
como puede comprobarse observando que la suma 12 +1 2 +22 = 6, es decir, es
igual al orden del grupo.
Consideraciones análogas permiten hallar los caracteres de las representaciones
de otros grupos del mismo tipo ( C 4v, C 6v),
El grupo T se obtiene a partir del grupo V añadiendo las rotaciones en torno
de los cuatro ejes oblicuos ternarios. Una función que es invariante respecto de las
transformaciones del grupo V (base de la representación A), puede quedar multiplicada en una rotación C 3 por 1, s o s2 • En cambio, las funciones de base de las
tres representaciones unidimensionales B1 , B2 , B3 del grupo V, en las rotaciones en
torno del eje de tercer orden se transforman entre sí (lo que se ve fácilmente si,
por ejemplo, se toman para estas funcion~1as propias coordenadas x, y, z). De
esta manera obtenemos tres representaciones unidimensionales y una tridimensional
irreducibles (1 2 +1 2 +1 2 +3 2 = 12).
Finalmente, consideremos los grupos isomorfos O y T d· El grupo T d se obtiene
a partir del grupo T añadiendo las reflexiones ad en planos tales que cada uno. pasa
por dos .ejes ternarios. La función de base de la representación unidimensional A
del grupo T puede ser simétrica o anti simétrica respecto de estas reflexiones (que
pertenecen todas a una misma clase), lo que da dos representaciones unidimensionales del grupo T d· Las funciones que quedan multiplicadas por s o s2 en una rotación
en torno de un eje ternario (base de las representaciones conjugadas complejas E
del grupo T), en la reflexión en un plano que pase por este eje se transforman entre
sí, de modo que se obtiene una representación bidimensional. Finalmente, de las
tres funciones de base de la representación F del grupo T una se transforma en sí
misma en la reflexión (pudiendo conservar su signo o cambiarlo) y las otras dos se
transforman entre sí. Obtenemos de esta manera, en total, dos representaciones
unidimensionales, una bidimensional y dos de tres dimensiones.
En cuanto a los demás grupos puntuales que nos interesan, sus representaciones
se pueden obtener directamente de las que preceden observando que estos grupos
son productos directos de los grupos ya considerados por el grupo C i ( o C s). Se
tiene, en efecto:
C311, = C3 XC 8
D 211, = D 2 xC,
D 3 ci = D 3 XCi
C411, = c,xci
D,11, = D,xci
D 6 11, = D 6 xC,
Ca11, = CaxCi
S6
= C3 xC,
T11, = TxCi
oh
=
oxci
Representaciones irreducibles y clasificación de los términos
413
Cada uno de estos productos directos posee un número de representaciones irreducibles doble que el grupo de partida, de las cuales la mitad son simétricas respecto
de la inversión (se designan por el índice g), y la otra mitad, antisimétricas (índice u).
Los caracteres de estas representaciones se obtienen a partir de los caracteres de las
representaciones del grupo inicial multiplicando por ± 1 (de acuerdo con la regla
(94.22)). Así, por ejemplo, para el grupo Dad se obtienen las representaciones:
Dad
§ 96.
E
Á¡g
1
A2u
1
Eu
2
A1u
1
A2u
1
Eu
2
2C3
3U2
1
1
-1
1
1
-1
1
-1
1
1
o
1
2S6
3ad
1
-1
2
1
1
-1
1
-1
-1
-1
-1
-1
-1
1
1
o
-2
o
o
Representaciones irreducibles y la clasificación de los términos
Las aplicaciones de la teoría de grupos a la mecánica cuántica se basan en que
la ecuación de SCHRODINGER correspondiente a un sistema físico (átomo, molécula)
es invariante respecto de las transformaciones de simetría de este sistema. De aquí
se sigue, sin más, que después de aplicar los elementos del grupo a una función que
satisface la ecuación de ScHRODINGER para un cierto valor de la energía (valor propio), debe obtenerse de nuevo una solución de la misma ecuación con igual valor
de la energía. Con otras palabras, en una transformación de simetría las funciones
de onda de los estados estacionarios del sistema que corresponden a un mismo nivel
de energía se transforman entre sí, es decir, constituyen la base de una cierta representación del grupo. El hecho de que esta representación es irreducible es importante.
En efecto, las funciones que se transforman entre sí en las transformaciones de simetría deben corresponder, en cualquier caso, al mismo nivel energético; pero la coincidencia de los valores propios de la energía ligados a diferentes grupos de funciones
(en los que se puede descomponer la base de una representación reducible), grupos
que no se transforman entre sí, sería una casualidad totalmente improbable (con tal
que para ello no exista alguna causa especial, véase más adelante).
Así, pues, a cada nivel de energía del sistema corresponde una representación
irreducible de su grupo d~ simetría. La dimensión de esta representación determina
la multiplicidad de la degeneración del nivel dado, es decir, el número de estados
diferentes que poseen la energía dada. Una vez dada la representación irreducible,
quedan determinadas todas las propiedades de simetría del estado en cuestión,
414
Teoría de la simetría
es decir, su comportamiento con relación a las distintas transformaciones de simetría.
Representaciones irreducibles con dimensiones mayores que la unidad se encuentran tan sólo para aquellos grupos que contienen elementos no conmutativos (los
grupos abelianos poseen solamente representaciones irreducibles de una dimensión).
Recordemos, a propósito de esto, que la relación entre la degeneración de un nivel
y la existencia de operadores que no conmutan entre sí (pero sí con el hamiltoniano)
se hizo notar ya antes partiendo de consideraciones no ligadas con la teoría de
grupos (§ 1O).
Todas estas afirmaciones están sujetas a una restricción fundamental. Conforme se
indicó antes(§ 18), la simetría respecto del cambio de signo del tiempo (que se cumple
cuando no existe campo magnético) conduce en mecánica cuántica a que las funciones de onda conjugadas complejas deban pertenecer a un mismo valor propio de
la energía. De aquí se sigue que si un cierto sistema de funciones y el sistema de funciones conjugadas complejas de aquéllas son bases de representaciones irreducibles distintas de un mismo grupo, estas dos representaciones conjugadas complejas deben
considerarse, desde un punto de vi ~ta físico, como una misma representación de
dimensión doble. En el párrafo anterior encontramos ejemplos de estas representaciones. Así, el grupo C 3 tiene solamente representaciones unidimensionales; sin
embargo, dos de ellas son conjugadas complejas y corresponden, físicamente, a niveles de energía doblemente degenerados. (Cuando existe campo magnético, la simetría respecto del cambio de signo del tiempo no se presenta, y por ello a las representaciones conjugadas complejas corresponden diferentes niveles de energía.)
Supongamos que el sistema físico se somete a la acción de una perturbación
(es decir, el sistema se coloca en un campo exterior). Se plantea la cuestión de en
qué medida puede la perturbación conducir a un desdoblamiento de los niveles
degenerados. El campo exterior posee, de por sí, una cierta simetría propia (1).
Si esta simetría es igual o mayor (2) que la simetría del sistema no perturbado, la
simetría del hamiltoniano perturbado 11 = 110 + t>" coincide con la simetría del
operador no perturbado h 0 • Es claro que, en este caso, no puede producirse ningún
desdoblamiento de los niveles degenerados. Pero si la simetría de la perturbación
es menor que la simetría del sistema no perturbado, la simetría del hamiltoniano fi
coincidirá con la simetría de la perturbación V. Las funciones de onda que son
base de una representación irreducible del grupo de. simetría del operador fi 0 , serán
también base de una representación del grupo de simetría del operador perturbado
h, y como puede ocurrir que esta representación sea reducible, esto significa un
1
( )
Por ejemplo, puede tratarse de los niveles de energía de las capas d y f de los iones en una red
cristalina, iones que se encuentran en interacción débil con los átomos que los rodean. La perturbación
(campo exterior) es, en este caso. el campo que actúa sobre un ion debido a los demás átomos.
(2) Si el grupo de simetría H es subgrupo del grupo G, se dice que JI corresponde a una simetría
menor que la simetría (mayor) del grupo G. Es evidente que la simetría de la suma de dos expresiones,
de las cuales una tiene la simetría de G, y la otra, la de H, coincide con la simetría menor, la de H.
Reglas de .i;elección para los elementos de matriz
415
posible desdoblamiento del nivel degenerado. Veamos en un ejemplo cómo el formalismo matemático de la teoría de grupos permite resolver efectivamente el problema del desdoblamiento de un cierto nivel.
Supongamos que el sistema no perturbado posee la simetría T d y consideremos
un nivel degenerado de orden tres que corresponde a la representación irreducible
F 2 de este grupo: los caracteres de esta representación son iguales a:
E
o
3
1
-1
-1
Imaginemos que el sistema se somete a la acción de una perturbación que posee
la simetría Cw (con el eje ternario coincidente con uno de los ejes ternarios del
grupo T d). Tres funciones de onda del nivel degenerado constituyen la base de una
representación del grupo C 3v (que es subgrupo del grupo 7 1a), siendo los caracteres
de esta representación iguales, simplemente, a los caracteres de los mismos elementos
en la representación inicial del grupo T d, es decir,
E
2Ca
3
o
1
Sin embargo, esta representación es reducible. Si se conocen los caracteres de las
representaciones irreducibles del grupo C3v, es fácil conseguir su descomposición
en partes irreducibles (siguiendo la regla general (94.14)). Encontramos de esta
manera que aquélla se descompone en las representaciones A 1 y E del grupo Cav·
Por consiguiente, el nivel triplemente degenerado F 2 se descompone en un nivel
no degenerado A 1 y un nivel doblemente degenerado E. Si el mismo sistema se
somete a la acción de una perturbación dotada de la simetría C 2v ( que es también
subgrupo del grupo T d), las funciones de onda del mismo nivel F2 proporcionan una
representación con los caracteres
I
E
3
(J V
-1
1
1
Descomponiéndola en partes irreducibles, encontramos que dicha representación
contiene las representaciones A1 , B1 , B2 . Así, pues, en este caso se consigue un completo desdoblamiento del nivel en tres niveles no degenerados.
§ 97.
Reglas de selección para los elementos de matriz
La teoría de grupos permite no solamente efectuar la clasificación de los términos
de cualquier sistema físico simétrico, sino que da también un método simple para
hallar las reglas de selección de los elementos de matriz de las diferentes magnitudes
416
Teoría de la Rimetría
que lo caracterizan.
Este método se basa en el siguiente teorema general. Sea 'f/J/ ix) una de las funciones
de base de una representación irreducible (distinta de la representación unidad)
del grupo de simetrías. Su integral extendida a todo el espacio (1) es entonces idénticamente nula:
Ji¡4cx> dq = O.
(97.1)
La demostración se basa en el hecho evidente de que la integral extendida a todo
el espacio es invariante respecto de cualquier transformación del sistema de coordenadas, en particular, respecto de una transformación cualquiera de simetría.
Por ello
Sumemos esta igualdad para todos los elementos del grupo. La integral que aparece
en el primer miembro queda simplemente multiplicada por el orden del grupo, g,
y obtenemos:
Pero para cada representación irreducible distinta de la representación unidad se
tiene idénticamente (éste es un caso particular de las relaciones de ortogonalidad
(94. 7), aquél en que una de las representaciones irreducibles es la unidad). Con esto
queda demostrado el teorema.
Si 1P es una función que corresponde a una cierta representación reducible del
grupo, la integral f 1P dq será diferente de cero únicamente cuando la representación
contenga la representación unidad. Este teorema es consecuencia inmediata del que
precede.
Sea/ el operador de una magnitud física escalar. Por definición, este operador
es invariante respecto de todas las transformaciones de simetría. Sus elementos
de matriz son las integrales
(97.2)
(1)
Se trata del espacio de configuraciones del sistema físico considerado.
Reglas de selección para los elementos de matriz
417
donde los índices ce, fJ distinguen los diferentes términos del sistema, y los índices i,
k numeran las funciones de onda de los estados correspondientes a un mismo término degenerado. Designemos simbólicamente las representaciones irreducibles del
grupo de simetría del sistema dado de las que son base las funciones 1J)/ce) y 'lfJk(/J)
por n<ce) y n</J). Los product~s 1/<J.)'lfJk(.B) son base de la representación D (ce) x n</J);
dado que el propio operador fes invariante con relación a todas las transformaciones,
todo el integrando corresponderá a esta representación. Pero (véase§ 94) el producto
directo de dos representaciones irreducibles diferentes no contiene la representación
unidad; en cambio, el producto directo de una representación irreducible por sí
misma la contiene siempre (y sólo una vez, y las integrales (97 .2) son iguales a const
cJik, donde const no depende ni de i ni de k). Llegamos así a la conclusión de que,
para una magnitud escalar, son diferentes de cero tan sólo los elementos de matriz
que corresponden a transiciones entre estados del mismo tipo (es decir, que corresponden a la misma representación irreducible). Ésta es la formulación más general
de un teorema cuyos casos particulares hemos encontrado ya más de una vez.
Consideremos ahora una magnitud física vectorial A. En las transformaciones
de simetría, las tres componentes Ax, Ay, Az se transforman entre sí y constituyen
de esta manera una cierta representación del grupo de simetría que designaremos
por DA (1). Los productos 1ft,,,<cx>J..tJ¡k <P> son base de una representación n<ce) x DA x
x n</J); los elementos de matriz son diferentes de cero si esta representación contiene la representación unidad. Desde el punto de vista práctico, conviene más
descomponer en partes irreducibles el producto directo n<rx) x DA; de esta manera
se reconocen inmediatamente todos los tipos D(1) de estados para los que las transiciones (desde un estado del tipo fl(<J.)) poseen elementos de matriz diferentes de
cero.
Los elementos de matriz diagonales (en contraste con los elementos para transiciones entre estados diferentes de un mismo tipo) requieren un examen especial.
En este caso tenemos, en total, sólo un sistema de funciones 'lfJ/rx); y no dos sistemas
distintos, y sus productos a pares constituyen el producto simétrico [D<rx> 2J de la
representación n<a.) por sí misma (y no el producto directo n<a.) X n<ce)). Por ello,
en el caso de una magnitud vectorial, la existencia de elementos de matriz diagonales
exige la existencia de la representación unidad en la descomposición del producto
[n<a.) 2J x DA, o, lo que es lo mismo, la existencia de DA en [n<ce) 2J (2).
De modo análogo se pueden hallar las reglas de selección para los elementos de
matriz de un tensor. Ejemplo3 de aplicación de estas reglas se presentan en los prOF
blemas propuestos en este párrafo.
DA, en general, es diferente para los vectores polares y axiles.
No hicimos esta salvedad al considerar una magnitud escalar f teniendo en cuenta que el producto
simétrico [D(il:)2], al igual que el producto directo n<a> X D<ª>, conti~ne _siempre la representación ~nidad.
Por consiguiente, para una magnitud escalar los elementos de matnz diagonales son, en general, siempre
distintos de cero.
(1)
( 2)
Teoría de la simetría
418
PROBLEMAS
1. Hallar las reglas de selección para los elementos de matriz de un vector polar cuando
existe la simetría O.
Solución. Las componentes del vector se transforman según la representación irreducible F 1 •
Las descomposiciones de los productos directos de F 1 con otras representaciones del grupo O serán:
F 1 xA 1 = F 1 ,
F 1 XA 2
= F 2,
F 1 xE = F 1 +F2 ,
FíXF1 = A 1+E+F1+F2 , F 1 XF2 = A 2+E+F1+F2.
(1)
Por lo tanto, serán distintos de cero los elementos de matriz no diagonales para las transiciones:
Los productos simétricos de las representaciones irreducibles del grupo O son iguales a:
F 1 no está contenida en ninguno de ellos; por consiguiente, no existen elementos de matriz diagonales.
2.
El mismo problema, pero cuando existe la simetría D 3d.
Solución. La componente z del vector se transforma según la representación A 2u, y las componentes x, y, según la Eu. Tenemos:
Eu.XA1g = Eu.XA2g = Eu,
EuXEu = A 1g+A 211 +E11 ,
EuXA1u = EuXA2u
=
Eg,
(1)
Eu.XEg = A 1u+A 2u+Eu.
Por ello son distintos de cero los elementos de matriz no diagonales de Ax, Ay para las transiciones
Eu~A 1 11,A11 ,E11 ;E11 ~A1u,A2u- De la misma manera se hallan las reglas de selección para
los elementos de matriz de Az: A111 ~ A2u, A211 ~ A1u, E11 ~ Eu.
Los productos simétricos de las representaciones irreducibles son iguales a:
[A¡g 2] = [A 1 u.2 ] = [A 2g 2] = [A2u2] = A 1 g,
[E 11 2 ]
=
[E,/]
=
(2)
E 11 +A1g·
Estos productos no contienen ni A 2u, ni Eu; por lo tanto, los elementos de matriz diagonales son
nulos, tanto para Az como para Ax y Ay.
3. Hallar las reglas de selección para los elementos de matriz de un tensor simétrico de segundo orden Aa; (con Axx + Ayy + Azz = O) cuando existe la simetría O.
Solución. Las componentes Axy, Axz, Ayz se transforman según F 2 • Descomponiendo los
productos directos de F 2 por todas las representaciones del grupo O, encontramos las reglas de
selección F1 ~ A2, E, F1, F 2; F2 ~ A 11 E, F 11 F 2 • Los elementos de matriz diagonales existen
(conforme se vé en virtud de (2), problema 1) para los estados F 1 y F 2 •
Las sumas Axx+ e:Ayy+ e: 2Azz, Axx+ e: 2Ayy+ e:Azz ( e: = e277' /3 ) se transforman según la representación E. Las reglas de selección para los elementos no diagonales son: E~ A 1 , Aa, E;
F1 ~Fi, F2; F 2~ F2• Los elementos diag'males son diferentes de cero para los estados E, Fi, F 2
4.
El mismo problema para la simetría D 3a.
419
Grupo.,; continuo.-.
S0/11cjú11. Azz se transforma según A1<,, es decir, Azz se comporta como un escalar. Las com-,
ponentes A_,.;· -- A,1,1 y A,,1 se transforman según E11 : lo mismo vale para las componentes A.,,,
A.,iz· Descomponiendo los productos directos de E!, por todas las representaciones del grupo l>;¡I/,
encontramos las reglas de selección para los elementos de matriz no diagonales: Eg ~ A 1 g, A 2 g, Eg;
Eu ~ A 1 u, A 2 u, Eu. Los elementos diagonales son diferentes de cero (conforme se deduce de (2),
problema 2) sólo para los estados E,1 y E,,.
*98.
Grupos continuos
Además de los grupos puntuales finitos considerados en el § 93, existen los llamados grupos puntuales continuos que poseen un número infinito de elementos.
Estos grupos son los de simetría axil y de simetría esférica.
El grupo más simple de simetría axil es el grupo C =, que contiene las rotaciones
C(</>) de ángulo arbitrario <p en torno del eje de simetría (es el llamado grupo de rotaciones bidimensional). Este grupo se puede considerar como caso límite del grupo ( \ 1
para n ~ =. Análogamente, como casos límite del grupo (; 11 1z, l\¡1¡, D 11 1i, Dn se
obtienen los grupos continuos C =Ji, C =v, D =, D =h·
Una molécula posee simetría axil únicamente cuando está formada por átomos
situados sobre una misma recta. Si en estas condiciones no es simétrica respecto
de su punto medí.o, su grupo puntual será el grupo C =v, que contiene, además
de las rotaciones en torno del eje, las reflexiones av en cualquier plano que pase
por el mismo. Pero si la molécula es simétrica respecto de su punto medio, su grupo
puntual será el grupo D =h =
o:JI/ X (1¡. En cuanto a los grupos
o::i, e o::ih, D o::i,
no pueden ser grupos de simetrías de una molécula.
e
e
El grupo de simetría esférica completa contiene las rotaciones de ángulo arbitrario en torno de cualquier eje que pase por el centro y las reflexiones en cualquier
plano que pase por dicho punto; este grupo (que designaremos por K1i) es el grupo
de simetría de un átc.no aislado. Contiene como subgrupo el grupo K de todas las
rotaciones espaciales (el llamado grupo de rotaciones tridimensional, o, simplemente, grupo de rotaciones). El grupo K1z se puede obtener a partir del grupo l(
añadiendo el centro de simetría (K 11 = K x l\).
Los elementos de un grupo continuo se pueden distinguir mediante uno o más
parámetros cuyos valores forman sucesiones continuas. Así, en el grupo de rotaciones los parámetros pueden ser, por ejemplo, dos ángulos que determinen la dirección
del eje y el ángulo de rotación en torno del mismo.
Las propiedades generales de los grupos finitos descritas en el § 92 y los conceptos ligados a ellas( como los de subgrupo, de elementos conjugados, clases, etc.)
se generalizan directamente a los grupos continuos. Claro está, pierden su sentido
todas las proposiciones que están ligadas de modo inmediato con el concepto de
420
Tt>oría de la ..;imetría
orden del grupo (por ejemplo, la proposición según la cual el orden de un subgrupo
es divisor del orden del grupo).
En el grupo C =v todos los planos de simetría son equivalentes, de modo que todas
las reflexiones a 0 constituyen una clase formada por una sucesión continua de elementos; el eje de simetría es bilateral, de forma que se tiene una sucesión continua
de clases, cada una de las cuales contiene dos elementos C(± <p). Las clases del grupo
D =h se obtienen inmediatamente a partir de las clases del grupo D =h = (; =v X ( '¡.
En el grupo de rotaciones K, todos los ejes son equivalentes y bilaterales; por ello
las clases de este grupo son las rotaciones de ángulo dado en valor absoluto (c/>l en
torno de un eje cualquiera. Las clases del grupo K 11 se obtienen directamente a partir
de las clases del grupo K.
Las representaciones irreducibles del grupo de rotaciones tridimensional las
encontramos ya, en esencia (sin utilizar entonces la terminología de la teoría de grupos), cuando determinamos los valores propios y las funciones propias del momento
cinético total. El operador momento cinético es (salvo un factor constante) el operador de una rotación infinitesimal. y sus valores propios caracterizan el comportamiento de las funciones de onda respecto de las rotaciones espaciales. Al valor .i
del momento cinético corresponden 2j + 1 funciones propias diferentes 'lfJjm que
difieren en los valores de la proyección m del momento y que corresponden a un
nivel energético degenerado de orden ~¡ + 1. En las rotaciones del sistema de coordenadas, estas funciones se transforman entre sí, proporcionando de esta manera
una representación irreducible del grupo de rotaciones. En consecuencia, desde el
punto de vista de la teoría de grupos, los números j numeran las representaciones
irreducibles del grupo de rotaciones, correspondiendo a cada j una representación
de 2j + 1 dimensiones. El número j recorre el conjunto de los números enteros y
semienteros, de modo que la dimensionalidad 2j+ 1 de ]as representaciones recorre
la sucesión de los números enteros l, 2, 3, ...
Las funciones de base de estas representaciones se estudiaron ya, en esencia,
en el capítulo VIII. La base de la representación con un j dado está constituida por
las 2j + 1 componentes independientes de un espinor simétrico de orden 2j (a las
que es equivalente el conjunto de las 2j + 1 funciones "PfoJ
Las representaciones irreducibles del grupo de rotaciones que corresponden a
valores j semienteros se distinguen por una característica fundamental. Consiste
ésta en que en una rotación de ángulo 2n sus funciones de base (componentes de
un espinor de orden impar) cambian de signo. Pero dado que una rotación de ángulo 2n coincide con el elemento unidad del grupo, llegamos a la conclusión de que
las representaciones con valores j semi enteros son, como se suele decir, bivalentes:
a cada elemento del grupo (a cada rotación en torno de un eje de ángulo <p, O ::;;: <p ::;;:
Grupo .., continuos
421
2n) corresponde en dicha representación no una, sino dos matrices cuyos carac-
teres difieren en el signo (1).
Un átomo aislado posee, conforme se hizo ya notar, la simetría K1i = K x C i·
Por ello, desde el punto de vista de la teoría de grupos, a cada término del átomo
corresponde una cierta representación irreducible del grupo de rotaciones K (que
viene determinada por el valor del momento cinético total J del átomo) y una representación irreducible del grupo {1¡ (que viene determinada por la paridad del
estado) (2).
Si se coloca el átomo en un campo eléctrico exterior, sus niveles de energía se
desdoblan. El número de niveles distintos que así aparecen y la simetría de los
correspondientes estados se pueden determinar siguiendo el método descrito en el
§ 96. Para esto es necesario descomponer la representación reducible de 21 + 1 dimensiones del grupo de simetría del campo exterior (que proporcionan las funciones
'lj)J :u) en representaciones irreducibles del mismo grupo. Se plantea con ello la
necesidad de conocer los caracteres de la representación de que son base las funcio~
nes '1.J).T.\I·
En una rotación de ángulo <p en torno de un cierto eje, las funciones de onda 1Pn1
quedan multiplicadas, conforme sabemos, por eiJtr/J, donde Mes la proyección del
momento cinético sobre dicho eje. Por ello la matriz de transformación de ]as funciones 'lj)J ..w será diagonal, con el carácter
o bien
(98.1)
(') Hay que decir que las representaciones bivalentes de un grupo no son representaciones en el sentido
estricto de la palabra, ya que sus funciones de base no están definidas unívocamente: véase también§ 99.
(") Además, el hamiltoniano del átomo es invariante respecto de las permutaciones de los electrone~
En la aproximación no relativista. las funciones de onda de coordenadas y las de spin se separan, y cabt:
hablar de representaciones del grupo de permutaciones cuyas bases son las funciones de coordenadas.
Al dar la representación irreducible del grupo de las permutaciones, se determina a la vez el spin total
del átomo S (§ 63). Pero si se tienen en cuenta las interacciones relativistas, la descomposición de ias
funciones de onda en una parte dependiente de las coordenadas y otra dependiente del spin es imposible.
La simetría respecto de las permutaciones de las coordenadas y de los spins de las partículas simultáneamente no conduce a ninguna característica del término, ya que, por el principio de PAl u son admisibles
solamente las funciones de onda completas que son antisimétricas respecto de todos los electrones. Esto
.:orresponde a que, al tener en cuenta las interacciones relativistas, el spin, rigurosamente hablando, no se
conserva (se conserva solamente el momento cinético total J).
422
Respecto a la inversión !, en cambio, todas ias funciones 'lfJJ., 1 con valores M
distintos se comportan de la misma manera - quedan multiplicadas por + 1 o por
- 1 según sea par o impar el estado del átomo. El carácter es, por consiguiente,
i.Jl(I)
=
:±: (21 + 1).
(98.2)
Finalmente, los caracteres que corresponden a la reflexión en un plano a y al giro
reflejado de ángulo cp se calculan mediante la representación de estas transformaciones de simetría en la forma
r;
=-=
IC'!.,
S(cp) = JC("+cb).
Consideremos ahora las representaciones irreducibles del grupo de simetría
axil ( v. Esta cuestión fue ya resuelta esencialmente cuando expusimos la clasificación de los términos electrónicos de una molécula diatómica, que precisamente
posee la simetría (1c'°u (si ambos átomos son diferentes). A los términos O+ y o(términos con n = O) corresponden dos representaciones unidimensionales: la representación unidad A 1 y la representación A 2 , en la que la función de base es invariante respecto de todas las rotaciones y cambia de signo en las reflexiones en los
planos
Doblemente degenerados son, en cambio, los términos con U = 1, 2, ...
a los que corresponden representaciones bidimensionales que designaremos por E 1 ,
E 2 , ••• Sus funciones de base quedan multiplicadas por e:: ¡n9 en una rotación de
ángulo cp en torno del eje, mientras que en una reflexión en planos av se transforman
entre sí.
1
00
ªv·
Las representaciones irreducibles del grupo Dcx;h = C ::iov x ('¡ se obtienen directamente a partir de las representaciones del grupo (1=1! (y corresponden a la clasificación de los términos de una molécula diatómica con núcleos idénticos).
Si se toman para n valores semienteros, las funciones e±m</, conducen a representaciones irreducibles bivalentes del grupo ( 1 e-e,, que corresponden a los términos
de la molécula con spin semientero (1).
*99.
Representaciones bivalentes de los grupos puntuales finitos
A los estados de un sistema con spin sernientero (y, por lo tanto, de momento
cinético total también semientero) corresponden representaciones bivalentes del
grupo puntual de simetría de dicho sistema. Es ésta una propiedad general de los
espinares, y vale, por consiguiente, tanto para los grupos puntuales continuos como
(') En contraste con el grupo de rotaciones en tres dimensiones. eligiendo de manera adecuada \alorcs
fraccionarios de .!.2 ~cría aquí posible obtener, no solamente n:prescntacioncs univalcntcs y birnlentes, sino
también representaciones trivalentes e incluso de orden superior. Sin embargo, los \alores propios del
momento cinético físicamente posibles, en tanto que operador de rotación infinitesimal. se determinan
precisamente por las representaciones del grupo de rotaciones tridimensionales. Por ello las rcprcscntacionc, trivalcntes (y de orden superior) del grupo de rotaciones bidimensionales (y rambién de cualquier
grupo finito de simetría). aunque se pueden definir matcmúticamente. carecen de significado físico.
para los finitos. Con esto se plantea el problema de hallar las representaciones irreducibles bivalentes de los grupos puntuales finitos.
Conforme se hizo ya notar, las representaciones bivalentes no son, en realidad,
representaciones de un grupo en sentido estricto. En particular, no valen para ellas
las relaciones de las que se trató en el ~ 94, y cuando en estas relaciones ( por ejemplo,
en la relación (94.15) para la suma de los cuadrados de las dimensiones de las representaciones irreducibles) se hablaba de todas las representaciones irreducibles,
por todas se entendía solamente las representaciones propiamente tales, las univalentes.
Para estudiar las representaciones bivalentes conviene adoptar el siguiente artificio ( H. BETHE, 1929). De manera puramente formal, introduzcamos en el grupo
un nuevo elemento (que designaremos por Q) - elemento que corresponde a la
rotación de ángulo 2.:-r en torno de un eje arbitrario --- que es diferente del elemento
unidad, pero que coincide con E al aplicarlo dos veces: Q2 = E. De acuerdo con
esto, las rotaciones C 1 en torno de un eje de simetría n-ario conducirán a las transformaciones idénticas tan sólo después de aplicarlas 211 veces (y no después de n
veces):
cnzn
= E.
(99.1)
La inversión /, en tanto que elemento que conmuta con todas las rotaciones, debe
dar, como antes, el elemento E después de aplicarla dos veces. Pero la doble reflexión
en un plano será igual a Q, y no igual a E:
a2
= Q,
cr 4
= E;
(99.2)
(esto se sigue de que una reflexión se puede escribir en la forma ª1i = /C2 ). Obtenemos así, en definitiva, un conjunto de elementos que forman un cierto grupo puntual
de simetría ficticio cuyo orden es el doble del orden del grupo de partida; llamaremos
a estos grupos, grupos puntuales dobles. Las representaciones bivalentes del grupo
puntual real serán, evidentemente, representaciones univalentes, es decir, representaciones fieles, del correspondiente grupo doble, de forma que para hallarlas se pueden aplicar los métodos ordinarios.
El número de clases en el grupo doble es mayor que en el grupo inicial (pero,
en general, no el doble). El elemento Q conmuta con todos los demás elementos
del grupo (1) y, por lo tanto, constituye de suyo siempre una clase. Si el eje de simetría
es bilateral, esto significa que en el grupo doble son conjugados los elementos C,/'
y C,? 11 - 1.- = QC,/1-J.-. De aquí resulta que cuando existen ejes binarios, la distribución
de los elementos en clases depende también de si estos ejes son o no bilaterales ·(en los
1
( )
P:.1ra las rotaciont:s) la i,nersión. est0 .:s e'.idcnte: rara las reAexiones en planos. ello se -;igue de
que una reAexión se puede representar como producto de una i,nersión y una rotación.
Teoría de la simetría
4.24
grupos puntuales ordinarios esto carece de importancia, ya que C 2 coincide con Ja
rotación inversa c2- 1).
Así, por ejemplo, en el grupo T los ejes binarios son equivalentes, y cada uno
de ellos es bilateral, mientras que los ejes ternarios son equivalentes, pero no bilaterales. Por ello los 24 elementos del grupo doble T' (1) se distribuyen en 7 clases:
E, Q, la clase de las tres rotaciones C2 y de las tres C2 Q, y las clases 4C3 , 4C/, 4C3 Q,
4ClQ.
Del conjunto de todas las representaciones irreducibles de un grupo puntual
doble forman parte, en primer lugar, las representaciones que coinciden con las
representaciones univalentes del grupo simple (en las que al elemento Q, de la misma
manera que al E, corresponde la matriz unidad) y, en segundo lugar, las representaciones bivalentes del grupo simple, en las que al elemento Q corresponde la matriz
unidad con signo negativo; nos interesan ahora precisamente estas últimas representaciones.
Los grupos dobles (' 11 ' (n = 1, 2, 3, 4, 6) y S 4', como también los grupos simples
correspondientes, son grupos cíclicos C} Todas sus representaciones irreducibles
son unidimensionales y se pueden hallar sin dificultad conforme se explicó en el
§ 95.
Las representaciones irreducibles del grupo /J,/ (o sus isomorfos ('' 1111 ) se pueden
determinar siguiendo el mismo método que en el caso de los correspondientes grupos simples. Estas representaciones admiten como base funciones de la forma
e±ik</>, donde cp es el ángulo de rotación en torno del eje n-ario, y para k se toma
un valor semientero (los valores enteros corresponden a las representaciones univalentes ordinarias). Las rotaciones en torno de los ejes horizontales binarios transforman estas funciones entre sí, y la rotación C11 las multiplica por e±21rik¡n.
Algo más difícil es hallar las representaciones de los grupos cúbicos dobles. Los
24 elementos del grupo T' se distribuyen en siete clases. Se tienen por ello en total
siete representaciones irreducibles, de las cuales cuatro coinciden con las representaciones del grupo simple ''J'. La suma de los cuadrados de las dimensiones de las
tres representaciones restantes debe ser igual a 12, de donde se sigue que todas ellas
son bidimensionales. Dado que los elementos C 2 y C 2 Q se encuentran en una misma
clase, se tendrá x( C 2 ) = x( C 2 Q) = - z( C 2), de donde se deduce que en las tres
representaciones es x( C 2) = O. Además, una por lo menos de éstas debe ser real,
ya que las representaciones complejas pueden aparecer solamente formando pares
conjugados. Consideremos esta representación y supongamos que la matriz del
(
1
)
Distmguircmo,;; los grupos dobles por un apóstrofo en el ,;imbolo del grupo ordinario.
En cambio. los grupos
pero no cíclicos.
('!)
S 2'
= C/, Ss' = C ¡', que contienen la inversión /, son grupo-; abcliano~.
3
425
H ,•prt>.'if'll t<u·io11P.'i l,i1,alt>n t,•.'i ,/,• lo.o; l{TUpO.'i puntuale.o; finitos
TABLA
8
Representaciones hirnle111e.1· de los Krllpos p111111,a/es
C~(xl
C\(X)Q
D/
E
Q
E'
2
-2
D'
3
E
Q
C3
C3 2Q
-1
-1
-1
-1
o
C/Y)Q
C2(zl
C2<zlQ
o
o
C/
C3Q
3U2
C2<Yl
3U2º
-i
E'
'l
-i
o
E2'
2
-2
Ds'
E
Q
E¡'
2
-2
o
-1
E2'
2
-2
o
-1
Ea'
2
-2
o
D'
4
E
Q
E¡'
2
-2
o
,12
E/
2
-2
o
_ \12
T'
E
Q
E'
2
-1
C2
C3
C2Q
ClQ
Co5
3U2
3U'2
C6Q
3U2Q
3U'2Q
,13
-,13
o
o
-y3
v'3
o
o
o
o
o
o
2U2
2U2 Q
2U'2
2U'2 Q
-,12
o
o
'\12
o
o
4C/Q
3C2
3C2Q
C32
C3Q
-2
2
C2
C4
C/
C2Q
C4 3 Q
C4Q
4C/
4C 3Q
-2
-1
-1
2
-2
- €2
-E
2
-2
-e
-
E
Q
4C 3 2
4C 3 Q
3C 4 2
O'
E1'
2
-2
-1
o
E/
2
-2
-1
G'
4
-4
4Ca
o
Cs
Cs 5 Q
o
€2
G'
€2
4Ca
4(\2Q
-1
o
o
c2
3Cl
3C4Q
6C2
6C2Q
,12
-,12
o
o
-,12
,/2
o
o
o
o
o
3C/Q
3C4
3C4 3 Q
426
Teoría de la simetría
elemento C3 se ha reducido a la forma diagonal (sean a 1 , a 2 sus elementos diagonales).
Dado que ca3 = Q, se tendrá a¡3 =al= - l. Para que x(C3) = a 1 +a2 sea real
hay que tomar a 1 = e'"i/3 , a2 = e-'"i/ 3• De aquí deducimos que x(C3) = 1, x(C:l) =
= a¡2+al = - l. De esta manera hemos encontrado una de las representaciones
buscadas. Comparando sus productos directos con las dos representaciones unidimensionales conjugadas complejas del grupo T, encontramos las dos representaciones restantes.
Consideraciones análogas, que no nos detendremos en desarrollar aquí, permiten
hallar las representaciones del grupo O'. En la tabla 8 adjunta se dan los caracteres
de las representaciones de los grupos dobles citados (únicamente para las representaciones que corresponden a representaciones bivalentes de los grupos ordinarios).
Estas mismas representaciones poseen los grupos dobles isomorfos.
Los restantes grupos puntuales o son isomorfos con los ya considerados, o se
obtienen como resultado de la multiplicación directa de éstos por el grupo C ¡, de
modo que sus representaciones no requieren un cálculo especial.
Por las mismas razones que en el caso de las representaciones ordinarias, dos
representaciones bivalentes que son conjugadas complejas deben considerarse, desde
el punto de vista físico, como una sola representación de dimensión doble. En cambio, las representaciones bivalentes unidimensionales deben aparearse incluso en
el caso en que sus caracteres sean reales. Ello se debe (véase § 60) a que en un sistema cuyo spin es semientero las funciones de onda conjugadas complejas son
linealmente independientes. Por lo tanto, si tenemos una representación unidimensional bivalente (1) con caracteres reales (cuya base es una cierta función '1./J), aunque
la función conjugada compleja '1./J* se transforma de acuerdo con la misma representación, con todo cabe afirmar que '1./J y '1./J* son linealmente independientes. Dado
que, por otra parte, las funciones de onda conjugadas complejas deben pertenecer
a un mismo nivel de energía, vemos así que en las aplicaciones físicas dicha representación debe ser duplicada.
PROBLEMA
Determinar cómo se desdoblan los niveles de un átomo (con valores dados del momento
cinético total J) situado en un campo que posee simetría cúbica O (1).
Solución. Las funciones de onda de los estados del átomo con momento cinético J y diferentes valores lvfJ son base de una representación reducible de dimensión 2J+ 1 del grupo O,
(1) Tales representaciones se encuentran en los grupos C'n con
iguales a x(Cé) = ( - J)k.
II
impar; en ellos los caracteres son
(1) Puede tratarse, por ejemplo, de un átomo en una red cristalina. Obsérvese también que la existencia
o no existencia de un centro de simetría en el grupo de simetría del campo exterior carece de importancia
para el problema considerado, ya que el comportamiento de la función de onda en una inversión (paridad
o no paridad del nivel) nada tiene que ver con el momento cinético J.
RPprP.'iPnlarionP.'i l1iralt>nt<'.'i <IP
lo.,; grupo.,; puntuale.'i finito.i,
427
con caracteres determinados por la fórmula (98.1 ). Descomponiendo esta representación en partes
irreducibles (univalentes para J entero o bivalentes para J semientero), se determina el desdoblamiento buscado (cf. ~ 96). He aquí las partes irreducibles de las representaciones que corresponden a los primeros valores de J:
J
=Ü
A1
1/2
E'
1
F1
3/2
2
5/2
3
G'
E+F2
E 2'+G'
A 2 +F¡-t-F2
CAPÍTULO
XIII
MOLÉCULAS POLIATÓMICAS
§ 1OO.
Gasificación de las vibraciones moleculares
En su aplicación a las moléculas poliatómicas, la teoría de grupos ante todo
resuelve directamente el problema de la clasificación de sus términos electrónicos,
es decir, el de la clasificación de los niveles de energía para una distribución dada
de los núcleos. Estos términos se clasifican de acuerdo con las representaciones
irreducibles del grupo puntual de simetría que admite la configuración de los núcleos
que se considera. Sin embargo, acerca de ello hay que subrayar el hecho evidente
de que la clasificación que se obtiene de esta manera se refiere precisamente a la
distribución determinada de los núcleos, de forma que cuando éstos se desplazan
la simetría de la configuración, en general, queda modificada. Dicha distribución
es, de ordinario, la distribución correspondiente a la posición de equilibrio de los
núcleos. En este caso la clasificación sigue poseyendo un cierto sentido también
para pequeñas vibraciones de los núcleos, pero pierde su significado, claro está,
si las vibraciones no se pueden considerar pequeñas.
En una molécula diatómica no se planteaba esta cuestión, ya que su simetría
axil se conserva, evidentemente, para cualquier desplazamiento de los núcleos.
Una situación análoga tiene también lugar para las moléculas triatómicas. Tres
núcleos se encuentran siempre en un plano, que es plano de simetría de la molécula.
Por ello es siempre posible la clasificación de los términos electrónicos de una molécula triatómica respecto de este plano (simetría o antisimetría de las funciones de
onda en la reflexión en el mismo).
Para los términos electrónicos normales de las moléculas poliatómicas vale
una regla empírica según la cual, en la mayor parte de las moléculas, la función
de onda del estado electrónico normal posee simetría completa (para las moléculas
diatómicas se señaló ya esta regla en el § 78). Con otras palabras, dicha función es
invariante respecto de todos los elementos del grupo de simetrías de la molécula,
es decir, corresponde a la representación irreducible unidad del grupo.
La aplicación de los métodos de la teoría de grupos es particularmente importante en el estudio de las vibraciones moleculares (E. WIGNER, 1930). Antes de con-
Clasificación de las vibraciones moleculares
429
siderar esta cuestión desde el punto de vista mecánicocuántico, es necesario proceder a un examen puramente clásico de las vibraciones de una molécula considerada como un sistema constituido por un cierto número de partículas en interacción (los núcleos).
Como es sabido (1) un sistema de N partículas (no situadas sobre una misma
recta) posee 3N-6 grados de libertad vibratorios; del número total de grados de
libertad 3N, tres corresponden al movimiento de translación y tres al movimiento
de rotación del sistema en conjunto (2). La energía de un sistema de partículas que
efectúan pequeñas vibraciones se puede escribir de la siguiente forma:
(100.1)
donde m¡k, k¡k son coeficientes constantes y u¡ son las componentes de los vectores
desplazamiento de las partículas a partir de sus posiciones de equilibrio (los índices i,
k indican tanto las componentes del vector como las partículas). Mediante una
transformación lineal adecuada de las cantidades u¡, es posible eliminar en (100.1)
las coordenadas que corresponden al movimiento de translación y de rotación
del sistema, y elegir las coordenadas vibracionales de tal manera que las dos formas
cuadráticas que aparecen en (100.1) se reduzcan a sumas de cuadrados. Normalizando
estas coordenadas de manera que todos los coeficientes en la expresión de la energía
cinética se reduzcan a la unidad, obtenemos la energía vibratoria en la forma:
(100.2)
Las coordenadas vibracionales Qa¡ se llaman normales; wa son las frecuencias
de las vibraciones independientes que les corresponden. Puede ocurrir que a algunas
coordenadas normales corresponda una misma frecuencia (de ella se dice entonces
que es múltiple); el índice a en una coordenada normal corresponde al número de
la frecuencia, y el índice i = 1, 2, ... , fa numera las coordenadas correspondientes
a una misma frecuencia (fa es la multiplicidad de ésta).
La expresión (100.2) para la energía de la molécula debe ser invariante respecto de las transformaciones de simetría. Esto significa que en toda transformación
relativa al grupo puntual de simetría de la molécula, las coordenadas normales
Qa¡, i = 1, 2, ... Ja (para cada a dado) se transforman linealmente entre sí, y precisamente de tal manera que la suma de los cuadrados ~ Q(Y.l permanece invariable.
Con otras palabras, las coordenadas normales que se refieren a cada frecuencia
propia dada de las vibraciones moleculares, constituyen la base de una representación
Véase tomo I, M?cánica, §§ 23 y 24.
Si todas las partículas están situadas sobre una misma recta, el número de grados de libertad
vibratorios es 3N-5 (en este caso, a la rotación corresponden, en total, dos coordenadas, ya que hablar
de la rotación de una molécula lineal en torno de su eje carece de sentido.
(1)
(2)
430
Moléculas poliatómicm;
irreducible de su grupo de simetrías; la multiplicidad de la frecuencia determina
las dimensiones de la representación. El carácter de irreducible se sigue de las mismas consideraciones que se hicieron en el§ 96 al tratar de las soluciones de la ecuación de SCHRODINGER. La coincidencia de las frecuencias que corresponden a dos
representaciones irreducibles distintas sería una casualidad improbable. De nuevo
constituyen una excepción las representaciones irreducibles con sistemas de caracteres conjugados complejos. Dado que las coordenadas normales, por su propia
naturaleza, son cantidades reales, dos representaciones conjugadas complejas corresponden físicamente a una frecuencia propia de multiplicidad dos veces mayor.
Estas consideraciones permiten llevar a cabo la clasificación de las vibraciones
propias de una molécula sin necesidad de resolver el complicado problema que
plantea la determinación efectiva de sus coordenadas normales. Para ello hay que
hallar, primero (siguiendo el método que se indica más adelante), la representación
que proporciona el conjunto de todas las coordenadas vibracionales (la llamaremos
representación total); esta representación es reducible, y descomponiéndola en sus
partes irreducibles determinamos precisamente la multiplicidad de las frecuencias
propias y las propiedades de simetría de las correspondientes vibraciones. Al hacerlo
puede ocurrir que una misma representación irreducible esté contenida en la representación total un cierto número de veces: esto significa que se tienen ciertas frecuencias distintas, de igual multiplicidad, con vi_braciones de la misma simetría.
Para hallar la representación total partiremos del hecho de que los caracteres
de una representación son invariantes respecto de una transformación lineal de las
funciones de base. Por ello, para calcularlos podemos utilizar como funciones de
base, no las coordenadas normales, sino simplemente las componentes u¡ de los
vectores desplazamiento de los núcleos con relación a sus posiciones de equilibrio.
Ante todo, es evidente que al calcular el carácter de un cierto elemento G del
grupo puntual hay que considerar tan sólo los núcleos cuyas posiciones (más exactamente, cuyas posiciones de equilibrio) no varían al aplicar la transformación de
simetría dada. En efecto, si en la rotación o en la reflexión considerada, G, el núcleo 1
pasa a ocupar un nuevo lugar en el que antes se encontraba otro núcleo 2, esto
significa que en la operación G el desplazamiento del núcleo 1 se transforma en el
desplazamiento del núcleo 2. Con otras palabras, en las filas de la matriz G¡k que
corresponden a este núcleo (es decir, a su desplazamiento u¡) no aparecerán nunca
elementos diagonales. En cambio, las componentes del vector desplazamiento de
un núcleo cuya posición de equilibrio no se ve modificada por la operación G, se
transforman entre sí exclusivamente, de modo que es posible considerarlas con
independencia de los vectores desplazamiento de los demás núcleos.
Consideremos primero la rotación C(</>) de ángulo </>entorno de un eje de simetría. Sean ux, uy, Uz las componentes del vector desplazamiento de uno de los núcleos
Clasificación de la... vibraciones moleculares
431
cuya posición de equilibrio se encuentra sobre este mismo eje, por lo que no se ve
afectada por la rotación. Como la de cualquier vector ordinario (polar), estas componentes se transforman en una rotación de acuerdo con las fórmulas (el eje z coincide con el eje de simetría)
u' x =
Uz
cos<f>+u'Ysen<f,,
u' v = -uxsen<f>+u 11 cos<f,,
U'z
=
Uz.
El carácter, es decir, la suma de los términos diagonales de la matriz de la transformación, es igual a 1 +2 cos cp. Si sobre el eje en cuestión se encuentran situados Ne
núcleos, el carácter total es igual a:
Nc(1+2 cos<f,).
(100.3)
Sin embargo, este carácter corresponde a la transformación de todos los 3N desplazamientos ui; debemos por ello separar la parte correspondiente a las transformaciones de translación y rotación (pequeña) de la molécula en conjunto. La translación
se define por el vector desplazamiento U del centro de masas de la molécula; la
parte correspondiente del carácter, por consiguiente, es igual a 1 +2 cos cp. En cambio, la rotación de la molécula en conjunto se determina mediante el vector b n del
ángulo de rotación (1). El vector b n es un vector axil; pero con relación a las rotaciones del sistema de coordenadas, un vector axil se comporta de la misma manera
que un vector polar. Por ello también al vector b n le corresponde un carácter igual
a 1 +2 cos cp. Por consiguiente, de (100.3) debemos restar en total el valor 2(1 +2
cos cp). Encontramos así finalmente el carácter x( C) de la rotación C( cp) en la representación vibracional total:
x(C)
= (Nc-2)(1+2 cos<f,).
(100.4)
El carácter del elemento unidad E es igual, evidentemente, al número total de
grados de libertad vibratorios: x(E) = 3N-6 (como se obtiene también de (100.4)
para Ne= N, cp = O).
De manera por completo análoga se calcula el carácter del giro reflejado S(cp)
(la rotación de ángulo cp en torno del eje z y la reflexión en el plano xy). En esta
transformación, un vector se transforma de acuerdo con las fórmulas
u' x =
Uz
cos<f>+u 11 sen</>,
u' v = -uxsen<f>+uv cos<f,,
U'z
=
-Uz,
(1) Como es sabido, el ángulo d~ una rotació_n in~?itesimal. se pu~de. considerar como ~n vector <~~.
cuyo módulo es igual al ángulo de giro y cuya d1recc10n y sentido comc1den con los del eJe de rotac10n
de acuerdo con la regla del sacacorchos. El vector <50 determinado de esta manera es, evidentemente, un
vector axil.
432
Moléculas poliatómicas
a lo que corresponde un carácter igual a (- 1 +2 cos </>). Por lo tanto, el carácter
de la representación cuya base es el conjunto de los 3N desplazamientos ui es igual a
Ns(-1+2 coscp),
(100.5)
donde Ns es el número de núcleos no afectados por la operación S(</>) (este número,
evidentemente, puede ser o cero o la unidad). Al vector desplazamiento del centro
de masas U corresponde el carácter - 1 + 2 cos <p. En lo que concierne al vector <5 n,
dado que éste es un vector axil no cambia en la inversión del sistema de coordenadas;
por otra parte, el giro reflejado S(</>) se puede representar en la forma:
S(<fo) = C(cp)crh = C(cp)C21 = C(7T+cp)I,
es decir, como rotación de ángulo n+</> seguida de la inversión. Por lo tanto, el
carácter de la transformáción S(</>) aplicada al vector <50, es igual al carácter de la
transformación C(n+</>) aplicada a un vector ordinario, es decir, es igual a 1 +2
cos (n+</>) = 1 - 2 cos <p. La suma (- 1 +2 cos 4,)+(1- 2 cos </>)=O, de modo
que llegamos al resultado de que la expresión (100.5) es igual, sin más, al carácter
buscado x(S) del giro reflejado S(</>) en la representación total:
x(S) = Ns(-1+2 cos<f,).
(100.6)
En particular, el carácter de la reflexión en un plano (</>=O) es igual a x(a) = Na,
y el carácter de la inversión (</> = n) es x(l) = - 3N1 .
Una vez determinados los carácteres x de la representación total, falta tan sólo
descomponerla en representaciones irreducibles, lo que se efectúa según la fórmula
(94.14) con ayuda de las tablas de caracteres que se dieron en el§ 95 (véanse los problemas de este párrafo).
Para clasificar las vibraciones de una molécula lineal, no hay necesidad de acudir
a la teoría de grupos. El número total de grados de libertad vibratorios es igual
a 3N - 5. Entre las vibraciones, hay que distinguir aquéllas en las que los átomos se
mantienen sobre una misma recta y aquéllas en las que no se cumple esta condición (1).
El número de grados de libertad en el movimiento de N partículas a lo largo de una
recta es igual a N; de ellos, uno corresponde a la translación de la molécula como
un todo. Por consiguiente, el número de coordenadas normales de las vibraciones
que conservan los átomos sobre una recta es igual a N - 1 ; a ellas corresponden,
en general, N - 1 frecuencias diferentes. Las restantes (3N - 5) - (N - 1) =
= 2N - 4 coordenadas normales corresponden a vibraciones que no conservan
el carácter lineal de la molécula; a ellas corresponden N - 2 frecuencias dobles
diferentes (a cada frecuencia van ligadas dos coordenadas normales, las cuales corresponden a vibraciones idénticas en dos planos perpendiculares entre sí) (2).
(1) Si la molécula es simétrica respecto de su punto medio, existe todavía una característica más de las
vibraciones, de la que se trata en el problema I O de este párrafo.
(2) Utilizando las notaciones de las representaciones irreducibles del grupo Coo v (véase § 98), podemos
decir que se tienen N - 1 vibraciones del tipo A 1 y N - 2 vibraciones del tipo E1 •
Clasificación de las vibraciones moleculares
433
PROBLEMAS
1. Clasificar las vibraciones normales de la molécula NH3 (pirámide regular con el átomo N
en la cúspide y los átomos H en los vértices de la base - fig. 41 ).
Solución. El grupo puntual de simetría de la molécula es el C 3 v. Las rotaciones en torno del
eje de tercer orden conservan en su sitio únicamente un átomo (el N) y la reflexión en los planos
dejan invariables las posiciones de dos átomos (el N y uno de los H). Aplicando las fórmulas
(100.4) y (100.6) encontramos los caracteres de la representación total:
N
Descomponiendo esta representación en partes irreducibles, se encuentra que contiene dos veces
la representación A1 y dos veces la E. Se tienen así dos frecuencias simples, que corresponden a
vibraciones del tipo A1 y conservan la simetría completa de la molécula (son las llamadas vibraciones totalmente simétricas), y dos frecuencias dobles, que corresponden a las coordenadas normales que se transforman entre sí de acuerdo con la representación E.
E
o
6
2.
2
El mismo problema para la molécula H 20 (fig. 42).
Solución. El grupo de simetría es el C 2 i·· La transformación C 2 conserva la posición del
átomo O, la transformación a v (la reflexión en el plano de la molécula), las de los tres átomos,
y la reflexión a\., tan sólo la de un átomo, el O. Los caracteres de la representación total serán
iguales a:
,
E
3
(J 11
1
3
1
Esta representación se descompone en las representaciones irreducibles: 2Ai, 1B1 , es decir, se
tienen dos vibraciones totalmente simétricas y una con una simetría determinada por la representación B1 ; todas las frecuencias son simples (en la fig. 42 se representan las correspondientes
vibraciones normales).
3.
El mismo problema para la molécula CHCL 3 (fig. 43, a).
Solución. El grupo de simetrías de la molécula es el C3 v, Siguiendo el mismo método, se encuentra que existen tres vibraciones totalmente simétricas A1 y tres vibraciones dobles del tipo E.
4. El mismo problema para la molécula CH 4 (el átomo C en el centro, y los átomos H en
los vértices de un tetraedro; fig. 43, b).
Solución.
5.
La simetría de la molécula es la Td. Las vibraciones son lAi, lE, 2F2 •
El mismo problema para la molécula C 6 H6 (fig. 43, c).
434
Moléculas poliatómicas
Fm. 42
Solución.
La simetría de la molécula es la
n 6 h.
Las vibraciones son:
6. El mismo problema para la molécula OsF 8 (el átomo Os en el centro, los átomos F en los
vértices de un cubo; fig. 43, d).
Solución.
La simetría de la molécula es
oh.
Las vibraciones son:
7. El mismo problema para la molécula UF6 (el átomo U en el centro, los átomos F en los
vértices de un octaedro; fig. 43, e).
Solución.
La simetría de la molécula es Oh. Las vibraciones son:
1A1,, 1E,, 2Fiu, 1F2g, 1F,u.
8.
El mismo problema para la molécula C 2 H 6 (fig. 43, f).
Solución.
9.
La simetría de la molécula es D 3d. Las vibraciones son:
El mismo problema para la molécula C 2 H 4 (fig. 43, g; todos los átomos en un mismo plano).
Solución.
La simetría de la molécula es ]} 2h, Las vibraciones son:
(los ejes de coordenadas se han elegido conforme se indica en la figura).
435
Clasificación de las vibracione... moleculare...
H
(o)
~
CL
CL
H
H
H
{b
,H~
CL
H
H
H
H
H
F
F
F
(f )
( d)
H
H
(e)
F
F
F ~
H
F
F
H
F
(g)
H
H
Frn. 43
10. El mismo problema para una molécula lineal formada por N átomos que es simétrica
respecto del punto medio.
Solución. A la clasificación de las vibraciones de una molécula lineal considerada en el texto
se añade la clasificación relativa al comportamiento en la inversión respecto del centro. Hay que
distinguir los casos en que N es par y aquéllos en que es impar.
Si N es par (N = 2p), en el centro de la molécula no hay ningún átomo. Desplazando arbitrariamente a lo largo de la recta los p átomos de una de las mitades de la molécula y atribuyendo
a los p restantes átomos desplazamientos iguales y opuestos, encontramos que p de las vibraciones
que conservan los átomos sobre la recta son simétricas respecto del centro y las restantes (2p - 1) - p = p - 1 vibraciones de este tipo son antisimétricas respecto del mismo. Además, p átomos
poseen 2p grados de libertad para movimientos en los que los átomos no se mantienen sobre la
recta. Aplicando a los átomos colocados simétricamente desplazamientos iguales y opuestos,
obtendríamos 2p vibraciones simétricas; de este número hay que restar, sin embargo, las dos que
corresponden a la rotación de la molécula. De esta manera se tienen p - 1 frecuencias dobles
de vibraciones que separan los átomos de la recta y que son simétricas respecto del centro, y otras
tantas ((2p - 2) - ( p - l) = p - 1) que son antisimétricas. Utilizando las notaciones de las
representaciones irreducibles del grupo l)ooh (véase el final del § 98), podemos decir que se tienen p
vibraciones del tipo A117 y p - 1 vibraciones para cada uno de los tipos A 1 u, Ew, E 1 u.
Si N es impar (N ~-= 2p-L J ), consideraciones análogas prueban que se tienen p vibraciones
para cada uno de los tipos A 1 y, A 111 , E 1 11 y p - 1 vibraciones del tipo E¡g.
436
Moléculas poliatómicas
§ 1O1.
Niveles de la energía de vibración
Desde el punto de vista de la mecánica cuántica, la energía de vibración de la
molécula se determina por los valores propios del hamiltoniano
Írx
fl(v) = l.
~ ~
2
oc i =l
donde P . =
p
Írx
.2+1. ~ w 2 ~
°'' 2 oc °' i -1
Q .2
°'' '
(101.l)
o
- in -son los
operadores impulso que corresponden a las cooróQtti
denadas normales Qtti· Dado que este hamiltoniano se descompone en suma de sumandos independientes t(Pa:?+wo:2Qa:?) , los niveles de energía son sumas de la
forma
<n
(101.2)
donde Vtt = LiVoci y ftt es la multiplicidad de la frecuencia wtt. En cuanto a las funciones de onda, son productos de las correspondientes funciones de onda de los osciladores armónicos lineales:
(101.3)
Hv designa el polinomio de Hermite de grado V y Ctt
= v~'Y./ñ.
(101.4)
Si entre las frecuencias wtt existen frecuencias múltiples, los niveles vibratorios
de la energía son degenerados, en general. La energía (101.2) depende solamente
de la suma vtt = LiVoci· Por ello la multiplicidad de la degeneración del nivel es igual
al número de maneras que permiten formar el conjunto dado de números Voc a
partir de los números Voci· Para un sólo v'Y., aquel número es igual a {1):
(vo:+/<X-1)!/vo:!(/°'-1)!.
Por consiguiente, el grado total de degeneración es igual a:
n
(voc+fo:-1)!
(101.5)
vo.!(/°'-1)!
Para frecuencias dobles, los factores de este producto son iguales a vtt+l, y para las
triples, son iguales a Hvtt+I)(vtt+2).
No hay que perder de vista que esta degeneración se presenta solamente en tanto
(1)
Éste es el número de maneras que permiten distribuir ·r-x bolas entre {'X urnas.
Nivele.,; de la energía de vibración
437
que se consideren vibraciones armónicas puras. Si se tienen en cuenta en el hamiltoniano términos de grados más elevados respecto de las coordenadas normales
(vibraciones anarmónicas), la degeneración, en general, desaparece, aunque no sea
del todo (para más detalles acerca de esto, véase el § 104).
Las funciones de onda (101.3) correspondientes a un mismo término vibracional
degenerado permiten una representación (en general, reducible) del grupo de simetrías de la molécula. Pero las funciones que corresponden a frecuencias distintas se
transforman con independencia las unas de las otras. Por lo tanto, la representación
cuya base está constituida por todas las funciones (101.3) es el producto de las representaciones cuyas bases son las funciones (101.4), de modo que basta considerar
estas últimas.
El factor exponencial en (101.4) es invariante respecto de todas las transformaciones de simetría. En los polinomios de Hermite, los términos de un mismo grado se
transforman entre sí únicamente (es evidente que una transformación de simetría
no modifica los grados de los diferentes términos). Dado que, de otra parte, cada
polinomio de Hermite queda completamente determinado por su término de mayor
grado, escribiendo
fa.
/}
1
Hva.lccx.Qcx.i) = constante x Qcx.1 va.1Qcx. 2 va., ••• Qcx.1 /a.ia.+
+
términos de grado inferior,
basta considerar tan sólo el término de grado más alto.
A un mismo término corresponden las funciones para las que la suma Vix = Li Vixi
toma el mismo valor. Tenemos así una representación realizada por los productos
de Vix cantidades Qix¡; ésta no es sino el producto simétrico (véase § 94) de Vix veces
la representación irreducible de que son base las cantidades Qix¡ por sí misma.
Para las representaciones unidimensionales, hallar los caracteres del producto
simétrico de una de ellas v veces por sí misma es trivial (1):
Xv(G)
= [x(G)]V.
Para las representaciones bi y tridimensionales es conveniente utilizar el siguiente
artificio matemático (2). La suma de los cuadrados de las funciones de base de una
representación irreducible es invariante respecto de todas las transformaciones de
simetría. Por lo tanto, es posible considerarlas como componentes de un vector
de dos o de tres dimensiones, y las transformaciones de simetría, como ciertas rotaciones (o reflexiones) aplicadas a estos vectores. Hay que subrayar que estas rotacio(1)
e)
Utilizamos aquí la notación z,,(G) en vez de la más engorrosa [7.vl(G).
Aplicado con este fin por A. S. KOMPANEÍETS ( 1940).
438
Moléculas poliatómicas
nes y reflexiones no tienen, en general, nada en común con las transformaciones
reales de simetría y (para cada elemento dado del grupo G) dependen también de la
representación particular considerada.
Consideremos más detenidamente las representaciones bidimensionales. Sea x( G)
el carácter de un elemento del grupo en la representación bidimensional dada, siendo
x( G) -=f= O. La suma de los elementos diagonales de la matriz de transformación de
las componentes x, y de un vector bidimensional en una rotación de ángulo <p en
el plano es igual a 2 cos <p. Igualando estos valores
2 cos<fo
= x(G),
(101.6)
encontramos el ángulo de rotación que corresponde formalmente al elemento G
en la representación irreducible dada. El producto simétrico de la representación v
veces por sí misma es la representación cuya base son las v+ 1 cantidades xv, xv-1y,
... , yv. Los caracteres de esta representación son iguales a (1):
xv(G)
= sen(v+ l)<fo/sen<fo.
(101.7)
El caso x(G) = O requiere examen aparte, dado que un carácter igual a cero corresponde tanto a la rotación de ángulo n/2, como a la reflexión. Si x( G2) = - 2, se
trata de la rotación de ángulo n/2 y para Xv(G) obtenemos:
(101.8)
En cambio, si x( G2) = 2, hay que considerar x( G) como el carácter de la reflexión
(es decir, de la transformación x---+ x, y---+ - y); entonces
(101.9)
De manera análoga se pueden obtener fórmulas para los productos simétricos
de representaciones tridimensionales. Hallar la rotación (o la reflexión) que corresponde formalmente a un elemento del grupo en la representación dada, se consigue
fácilmente con ayuda de la tabla 7. Dicha rotación (o reflexión) será la transformación que corresponde al x(G) dado en aquel de los grupos isomorfos en el que las
coordenadas se transforman de acuerdo con esta representación. Así, para la representación F 1 de los grupos O y T d hay que elegir la transformación del grupo O,
y para la representación F2 , la del grupo T d· No nos entretendremos aquí en deducir
las fórmulas correspondientes para los caracteres xv< G).
(1)
Para el cálculo conviene elegir las funciones de base en la forina:
la matriz de la rotación es entonces diagonal y la suma de los elementos diagonales tiene la forma:
Estabilidad de las configuraciones simétricas de una molécula
§ 102.
439
Estabilidad de las configuraciones simétricas de una molécula
Para una distribución simétrica de los núcleos, un término electrónico de la
molécula puede ser degenerado si entre las representaciones irreducibles del grupo
de simetría figuran representaciones cuya dimensión es mayor que la unidad. Veamos si una tal configuración simétrica es una configuración de equilibrio estable
de la molécula. Prescindiremos por completo de la influencia del spin (si lo hay)
dado que en las moléculas poliatómicas esta influencia es, en general, prácticamente
nula. La degeneración de los términos electrónicos de que vamo.s a tratar es, por
ello, tan sólo una degeneración « orbital », no ligada con el spin.
Para que la configuración dada sea estable, la energía de la molécula, como función de las distancias entre los núcleos, debe presentar un mínimo para esta distribución de los mismos en el espacio. Esto significa que la variación de la energía
para un pequeño desplazamiento de los núcleos no debe contener términos lineales
en los desplazamientos.
Sea H el hamiltoniano del estado electrónico de la molécula, hamiltoniano en
el que las distancias entre los núcleos se consideran como parámetros. Designaremos
por H O este hamiltoniano para la configuración simétrica dada. Como magnitudes
que definen los pequeños desplazamientos de los núcleos se pueden utilizar las
coordenadas vibracionales normales Qrxi· El desarrollo de H en potencias de Qrx;
tiene la forma:
(102.1)
Los coeficientes V, W, ... del desarrollo son funciones solamente de las coordenadas
de los electrones. En una transformación de simetría, las cantidades Qrxi se transforman entre sí. Las sumas en ( 102.1) pasan a ser entonces otras sumas de la misma
forma. Podemos, por lo tanto, considerar formalmente una transformación de simetría como una transformación de los coeficientes que aparecen en estas sumas,
conservando invariables las coordenadas Qrxi· En particular, los coeficientes Vrxi
(para cada rx dado) se transformarán de acuerdo con la misma representación del
grupo de simetría que las correspondientes coordenadas Qrxi· Esto se sigue inmediatamente del hecho de que, en virtud de la invariancia del hamiltoniano respecto
de todas las transformaciones de simetría, la misma invariancia debe valer también
para el conjunto de los términos del mismo orden en su desarrollo, en particular
para los términos lineales (1).
(1) Rigurosamente hablando, las cantidades Vll(i deben transformarse de acuerdo con la representación
conjugada compleja de la representación según la mal se transforman las QO(i, Sin embargo, conforme se
indicó si dos representaciones conjugadas complejas no coinciden entre sí, físicamente hay que considerarlas en' cualquier caso a la vez, formando una sola representación cuya dimensión es dos veces mayor.
Por consiguiente, la restricción señalada carece de importancia.
440
Moléculas poliatómicas
Consideremos un término electrónico degenerado (en una configuración simétrica) de energía E 0 • Un desplazamiento de los núcleos que rompa la simetría de la
molécula conduce, en general, a un desdoblamiento del término. La magnitud
del desdoblamiento se determina, con una precisión limitada a los términos de
primer orden respecto de los desplazamientos de los núcleos, mediante la ecuación
secular formada con los elementos de matriz del término lineal del desarrollo (102.1)
(102.2}
donde "Pp, "Pa son las funciones de onda de los estados electrónicos correspondientes al término degenerado dado (habiéndose elegido reales estas funciones). La
estabilidad de la configuración simétrica exige que no exista un desdoblamiento
lineal en las Q, es decir, todas las raíces de la ecuación secular deben anularse idénticamente y esto significa que también debe anularse toda la matrtz Vp:r· En todo
esto, claro está, debemos considerar solamente las vibraciones normales que rompen la simetría de la molécula, es decir, hay que prescindir de las vibraciones totalmente simétricas (correspondientes a la representación unidad del grupo).
Dado que las Qrxi son arbitrarias, los elementos de matriz (102.2) se anulan solamente si se anulan todas las integrales
(102.3)
Sea D(el) una representación irreducible según la cual se transforman las funciones
de onda electrónicas "Pp, y Drx la correspondiente transformación para las cantidades
V rxi; conforme se indicó ya, las representaciones Drx coinciden con aquellas de acuerdo
con las cuales se transforman las correspondientes coordenadas normales Qrxi·
Según los resultados del§ 97, las integrales (102.3) serán diferentes de cero si el producto [D(eZ)2 ] x Drx contiene la representación unidad, o bien, lo que es lo mismo, si
[D(e0 2J contiene la representación Drx. En el caso contrario, todas las integrales se
reducen a cero.
Así, pues, la configuración simétrica es estable si la representación rn<eo 21 no
contiene ni una tan sólo de las representaciones irreducibles Da. (excluida la representación unidad) que caracterizan las vibraciones de la molécula. Para los estados
electrónicos no degenerados esta condición se cumple siempre, ya que el producto
simétrico de una representación unidimensional por sí misma es la representación
unidad.
Consideremos, por ejemplo, una molécula del tipo CH4, en la que un átomo
(el C) se encuentra en el centro y cuatro átomos (los H) en los vértices de un tetraedro. Una tal configuración tiene la simetría T d· Los términos electrónicos degenerados corresponden a las representaciones E, F 1, F 2 de e'.)te grupo. La molécula posee
Cuantificación de la rotacíón de un sólido
441
una vibración normal A1 (vibración totalmente simétrica), una vibración E doble
y dos F 2 triples (véase el problema 4, § 100). Los productos simétricos de las representaciones E, F 1, F2 por sí mismas son iguales a:
[E2 ] = A 1 +E,
Vemos, pues, que cada uno de ellos contiene por lo menos una de las representaciones E, F 2 , y, en consecuencia, la configuración tetraédrica considerada resulta ser
inestable para los estados electrónicos degenerados.
Este resultado constituye una regla general (H. JAHN y E. TELLER, 1937). El
estudio (análogo al que acabamos de realizar) (1) de todos los tipos posibles de
distribuciones simétricas de los núcleos prueba que, para un estado electrónico
degenerado, toda distribución simétrica de los núcleos (con la única excepción de su
distribución sobre una misma recta) es inestable. Como resultado de esta inestabilidad, los núcleos se desplazan de tal manera que la simetría de su configuración se
rompe hasta el punto en que la degeneración del término desaparece por completo.
En particular, se puede afirmar que el término electrónico normal de una molécula
simétrica (no lineal) puede ser únicamente un término no degenerado.
Conforme se señaló ya, constituyen excepción solamente las moléculas lineales.
Es fácil verlo incluso sin la ayuda de la teoría de grupos. El desplazamiento de un
núcleo en el que éste abandona el eje de la molécula, es un vector ordinario con
componentes ~ y r¡ (el eje ( coincide con el eje de la molécula). Vimos en el § 87
que estos vectores poseen elementos de matriz tan sólo para transiciones que van
acompañadas de un cambio del momento cinético A respecto del eje de una unidad.
Sin embargo, a un término degenerado de una molécula lineal corresponden estados
con momentos cinéticos A y - A respecto del eje (siendo A 2 1). Una transición
entre ellos va acompañada de una variación del momento cinético que es, por lo
menos, igual a 2 y, por consiguiente, los elementos de matriz son nulos en cualquier
caso. De esta manera la distribución lineal de los núcleos en una molécula puede
ser estable incluso para un estado electrónico degenerado.
§ 103.
Cuantificación de la rotación de un sólido
El estudio de los niveles de rotación de una molécula poliatómica se ve con frecuencia complicado por la necesidad de considerar a la vez la rotación y las vibraciones. Como problema preliminar, consideremos la rotación de una molécula
considerada como un cuerpo sólido, es decir, con los átomos « rígidamente unidos
entre sí».
Sea;, r¡, ( un sistema de coordenadas cuyos ejes coinciden con los ejes de inercia
(1)
Véase el artículo de H. A.
JAHN,
E.
TELLER,
Proc. Roy. ~oc., A 161, 220, 1937.
442
Moléculas poliatómicas
del sólido y que giran junto con él. El correspondiente hamiltoniano se obtiene
substituyendo en la expresión clásica de la energía las componentes J~, lr¡, lt de
su momento de rotación por los correspondientes operadores, es decir,
(103.1)
donde /A, In, le son los momentos de inercia principales del cuerpo.
Je, J J,
,
que corresponden a las
Las reglas de conmutación de los operadores
11
componentes del momento cinético en el sistema de coordenadas en rotación no
son evidentes, ya que la manera ordinaria de deducir las reglas de conmutación se
aplica a las componentes v J y, Jzen un sistema de coordenadas en reposo. Sin
embargo, es fácil obtener aquéllas utilizando la fórmula
J
(J .a)(J .b)-(j .b)(J .a)= -ij .axb,
(103.2)
donde a, b son dos vectores cualesquiera que caracterizan el cuerpo dado (y que
conmutan entre sí). Es fácil verificar esta fórmula calculando el primer miembro
de la igualdad en el sistema de coordenadas en reposo x, y, z mediante las reglas
generales de conmutación de las componentes del momento cinético entre sí y con
las componentes de un vector arbitrario.
Sean a y b los vectores de los ejes~ y r¡. Entonces a x b es el vector del eje Cy
(103.2) nos da:
(103.3)
Análogamente se obtienen las otras dos relaciones. Llegamos así a la conclusión
de que las reglas de conmutación de los operadores correspondientes a las componentes del momento cinético en el sistema de coordenadas en rotación, difieren
de las reglas de conmutación en el sistema en reposo tan sólo en el signo del segundo
miembro de la igualdad. De aquí se sigue que también los resultados que antes
obtuvimos a partir de las reglas de conmutación, acerca de los valores propios y
de los elementos de matriz, subsisten para los operadores J~, Ir¡, h con la única
diferenci~ de que todas las expresiones se deben substituir por sus conjugadas complejas. En particular, los valores propios J~ (al igual que lz) serán números enteros,
k=-1, ... , +J.
La determinación de los valores propios de la energía de un cuerpo en rotación
(o, como suele decirse, de un trompo) resulta particularmente simple cuando sus
tres momentos principales de inercia son iguales entre sí: /.4 = In = I,c == I ( trompo
esférico). Esto ocurre para una molécula en aquellos casos en q\le ésta posee la simetría de uno de los grupos puntuales cúbicos. El hamiltoniano (103.1) toma la forma:
Cuantificación de la rotación de un sólido
443
y sus valores propios son iguales a
E=
n](J+l)/21.
2
(103.4)
Cada uno de estos niveles de energía es degenerado respecto de las 21 + 1 direcciones
del momento cinético referido al propio cuerpo (es decir, respecto de los valores
l¡; = k) (1).
Tampoco ofrece dificultad calcular los niveles de energía cuando coinciden
solamente dos de los momentos de inercia del cue~po: !A= In=/=- Ir. (trompo simétrico). Esto ocurre para las moléculas que poseen un eje de simetría de orden superior al segundo. El hamiltoniano (103.1) toma la forma:
fJ
=
=
n 2(} r.2+ j 1,2)/2JA+n2j 1:,2/2/e
n2J2/2JA+tn2(~-~);,2.
le
]A
(103.5)
Vemos así que, en un estado con valores determinados de 1 y k, la energía es igual a
2
E=
n
-J(J+l)+!n
2JA
2(
1 1)k2,
---
fe ]A
(103.6)
con lo que se determinan los niveles energéticos del trompo simétrico.
La degeneración que encontramos en el caso del trompo esférico respecto de
los valores k se rompe aquí en parte. Los valores de la energía coinciden sólo para
los valores de k que difieren únicamente en el signo, lo que corresponde a sentidos
opuestos del momento cinético respecto del eje del trompo. Por ello los niveles de
energía del trompo simétrico son doblemente degenerados para k =/=- O.
Para I A =/=- I B =/= I e ( trompo asimétrico) el cálculo de los niveles de energía es
imposible en forma general. La degeneración debida a las diferentes direcciones
del momento cinético referido al cuerpo se rompe ahora por completo, de modo
que a un valor dado de 1 corresponden 21 + 1 diferentes niveles no degenerados.
Para calcularlos hay que resolver la ecuación de SCHRODINGER en forma matricial.
lo que a su vez se reduce a resolver una ecuación secular de grado 21 + 1 formada
con los elementos de matriz H::Z, con los valores dados de 1 (O. KLEIN, 1929). Los
elementos de matriz
se determinan mediante las funciones de onda "P.Jk de los
estados en los que el valor absoluto y la proyección-( del momento cinético tienen
valores definidos (la energía, en cambio, no posee ningún valor determinado). Por
H:Jz,
(1) Aquí y en lo que sigue prescindimos de la degeneración de orden 21 + 1 correspon?!ente a la~ direcciones del momento cinético respecto del sistema de coordenadas en reposo, degenerac10n que siempre
existe, pero que físicamente carece de importancia. Si la _tenemos en cuenta, la multiplicidad total de la
degeneración de los niveles energéticos del trompo esfénco es (21 + 1)2 •
444
Moléculas poliatómicas
el contrario, en los estados estacionarios del trompo asimétrico la proyección Je
del momento cinético no tiene, claro está, valores determinados, es decir, es imposible atribuir a los niveles de energía valores determinados de k.
J J.,.,
Los operadores g,
tienen elementos de m~atriz tan sólo para las transiciones
en las que k varía en una unidad, y el operador J t posee únicamente elementos diagonales (véanse las fórmulas (27.13), en las que hay que escribir J, k en vez de L,
2
,
M). Por consiguiente, los operadores J l,
,;2, y con ellos también Íl, tienen
elementos de matriz solamente para las transiciones con k --+ k_, k ± 2. El que no
existan elementos de matriz para las transiciones entre estados con valores k pares
e impares conduce a que la ecuación secular de grado 21 + 1 se descomponga automáticamente en dos ecuaciones independientes de grados J y J + l. Una de ellas está
formada con elementos de matriz para las transiciones entre estados con valores
pares de k, y la otra, con valores impares. Cada una de estas ecuaciones puede
reducirse, a su vez, a dos ecuaciones de menor grado. Para ello hay que utilizar
elementos de matriz determinados, no mediante las funciones 1fJJk, sino mediante
las funciones
J.,., J
1Jk+ = c1Jk+1J.-k)1v2,
VJJk- = c1Jk-1J.-k)1v2
(ki=O);
(103.7)
(en cambio, la función 1fJJo coincide con la función 'lfJJo + ). Las funciones que difieren
en los índices + y - poseen simetría diferente (respecto de la reflexión en un plano
que pase por el eje (, que cambia el signo de k), y se anulan por ello los elementos
de matriz para las transiciones entre dichos estados.
Por consiguiente, es posible establecer ecuaciones seculares para los estados
por separado.
+
y los estados -
El hamiltoniano (103.1), junto con las reglas de conmutación (103.3), poseen
una simetría peculiar: son invariantes respecto del cambio simultáneo de signo
de dos cualesquiera de los operadores Jg, J.,.,, J,. Esta simetría corresponde formalmente al grupo D 2 • Por lo tanto, es posible clasificar los niveles del trompo asimétrico
de acuerdo con las representaciones irreducibles de este grupo. Así, pues, se tienen
cuatro tipos de niveles degenerados, correspondientes a las representaciones A,
B 1, B 2 y B 3 (véase tabla 7).
Es fácil establecer cuáles son precisamente los estados del trompo asimétrico
que corresponden a cada uno de estos tipos. Para esto hay que determinar las propiedades de simetría de las funciones (103.7). Como funciones 1fJJk se puede entender,
simplemente, las funciones conjugadas complejas de las funciones propias del momento cinético, que coinciden con aquéllas desde el punto de vista de la simetría
(el paso a una expresión conjugada compleja se debe a la variación del signo en los
f:uantificación de la rotación de un sólido
445
segundos miembros de las relaciones de conmutación (103.3)):
lpJk,..., e-ik</JE)Jk(8),
donde(), ef, son los ángulos esféricos en el espacio~, r¡, (. La rotación de ángulo :rr;
en torno del eje C (es decir, la operación de simetría el:.>) multiplica esta función
por
l)k:
C2<t.>: rpJr~{ -1 )kr/JJk·
La operación C2 <1í> se puede considerar como resultado de aplicar, sucesivamente,
la inversión y la reflexión en el plano
la primera operación multiplica 1/)Jk por
l)J, y la segunda (cambio del signo de ef,) equivale a cambiar el signo de k. Teniendo en cuenta la definición de la función 8J, -k (28.6), obtenemos por consiguiente:
C2<11>: rpJ1c-+(-l)J+kr/JJ,-k·
c 2 <r¡>c2<C> tenemos:
Finalmente, en la transformación C/~>
C2<El: rpJ1c-+(- l)JrpJ,-k•
Teniendo en cuenta estas leyes de transformación, encontramos que los estados
definidos por las funciones (103.7) corresponden a los siguientes tipos de simetría:
rar,
J par,
lpJk/
k par,
tipo A
k impar, tipo B 3
J impar, k par, tipo B1
J impar, k impar, tipo B2
[J
k
tipo B1
par,
~ _ ] par,
Jk
par,
(103.8)
k impar, tipo B2
] impar, k par,
tipo A
J impar, k impar, tipo B3
Mediante una simple cuenta es fácil encontrar el número de estados de cada
tipo para un valor dado de J. Así, al tipo A y a cada uno de los tipos B1, B2, B3
corresponden los siguientes números de estados:
A
]par,
J impar,
!J+l
!J-t
B1,B2,B3
t]
!J+t
(103.9)
Finalmente, he aquí algunas observaciones acerca del cálculo de los elementos
de matriz de diferentes magnitudes físicas que caracterizan al trompo (a la molécula).
Se trata, claro está, de los elementos de matriz respecto de las puras funciones de
onda de rotación de los estados estacionarios de la molécula (sin alterar ni su estado
446
.Moléculas poliatómicas
electrónico ni el de vibración).
Las funciones de onda del trompo simétrico coinciden, en esencia (con el correspondiente cambfo de notación de los números cuánticos), con la parte angular de la
función de onda de una molécula diatómica. En efecto, si se describe la rotación
mediante los ángulos de Euler (), <p, 1P (fig. 20, pág. 235), la función de onda del estado
caracterizado por los números cuánticos k, J, MJ es
1PkJ1\1J
=
1
(103.10)
7T eLUJt:/Jeiki/10kJMJ(O),
2
donde 0 son las funciones calculadas en el problema del § 82.
La dependencia de los elementos de matriz para el trompo simétrico respecto
de los números cuánticos J y M J se determina por las mismas fórmulas que se obtuvieron en el § 87 para la molécula diatómica (sin spin). En ]as fórmulas (87.1-4)
hay que substituir para ello K, M K y A, respectivamente, por el momento cinético
del trompo J, su proyección MJ sobre el eje en reposo z y la proyección k sobre el
eje en movimiento(.
El cálculo de los elementos de matriz para el trompo asimétrico es más complicado. La resolución de la ecuación secular relativa a la matriz H'!,z. determina
las combinaciones lineales de las funciones 1/JJk, introducidas antes, que reducen el
hamiltoniano a la forma diagonal. Substituyendo en estas combinaciones de las
funciones 1/JJk las funciones de onda puras del trompo asimétrico (103.10) (con los
mismos valores MJ en todas las funciones), obtenemos las funciones de onda puras
de los estados estacionarios del trompo asimétrico caracterizadas por los valores de
los pares de números J, MJ. En definitiva, el cálculo de los elementos de matriz
de una magnitud cualquiera para el trompo asimétrico se reduce a los elementos de
matriz, ya conocidos, del trompo simétrico.
Para el caso del trompo asimétrico, existen reglas de selección relativas a los
elementos de matriz de las transiciones entre estados de los tipos A, B 1, B 2 , B 3 , reglas
que se obtienen fácilmente de la manera usual por consideraciones de simetría.
Así, para las componentes de una magnitud física vectorial A valen las reglas de
selección:
para Ag:
A~B3<íl,
B1(C)~
para A 11
:
A~Bt1>,
BlJ~Ba<fl,
para A,:
A~Bl<C>,
B2<TJ>~BaW,
Bt1>,
(para mayor claridad, como superíndice del símbolo de la representación se indica
el eje en torno del cual la rotación tiene carácter +1 en la representación de que
se trate).
447
Cuantificación de la rotación de un sólido
PROBLEMAS
Calcular los elementos de matriz
H~:, para el trompo asimétrico.
Mediante las fórmulas (27.13) encontramos que:
Solución.
{];2): = (J,,2): = i[](]+l)-k 2 ],
{Jt.2) !+2 = (j t.2)1:: = - u ,,2):+2 = - u ,,2)
2
=
t
2
iv'[( J-k)(]-k- l)(J +k+ l)(] +k+2)];
(para abreviar, prescindimos de los índices diagonales J, J en los elementos de matriz). A partir
de aquí se obtiene para los elementos de matriz buscados de H:
(1)
Hk
= Hk+2 = ¡1t2(~-~)v[(J-k)(j-k-l)(]+k+l)(]+k+2)].
k+2
k
]A
IB
Los elementos de matriz respecto de las funciones (103.7) se expresan en función de los elementos de las fórmulas (1) de acuerdo con las relaciones
Hk+ = Hk- = Hk (k i= 1)
k+
k-
Hk+
k
'
Hl+ = H1+ H1
1+
= Hk= Hk (k-¡:
(k+2)+
(k+2)k+2
2.
1
H1- = H1-H1 ,
-1'
O)
'
1-
1
Ho+ = y'2H0 •
2+
Determinar los niveles de energía del trompo asimétrico para J
-1
(2)
2
=
1.
Solución. La ecuación secular de tercer grado se descompone en tres ecuaciones de primero.
Una de ellas es E 1 = Hgt, de donde
(3)
Esto permite escribir, sin más, los otros dos niveles de energía, ya que es a priori evidente que
los tres momentos de inercia lA, 18 , le representan en el problema un mismo papel. Por consiguiente, basta substituir simplemente los momentos de inercia lA, lB una vez por lA, le, y la otra,
por lB, le. De esta manera,
(4)
Los niveles E 1 , E 2 , E 3 corresponden, respectivamente, a los tipos Bi, B 2 , B 3 (si l.4, lB, le (1) son
los momentos de inercia respecto de los ejes ~. r¡, O.
(1) Esto resulta inmediatamente por consideraciones de simetría. Así, la energía E 1 es simétrica respecto de los momentos de inercia J.4 e IB; igual debe ocurrir para la energía del estado cuya simetría
respecto de los ejes~ y r¡ es la misma (un estado del tipo B1).
Moléculas poliatómicas
448
3. El mismo problema para J
=
2.
Solución. La ecuación secular es de quinto grado y se descompone en tres ecuaciones· de primero y una de segundo. Una de las ecuaciones de primer grado tiene la forma: E 1 =
de donde
H~=·
E1 =
2lí2
le
(
1 1)
(5)
-+!lí2 -+- '
lA lB
(nivel del tipo B1). De aquí deducimos, sin más, que deben haber todavía dos niveles más (de los
tipos B 2 Y Ba):
1 1) .
1 1) ,
2
( -+2lí
E2 = -+!lí2
lB
le lA
2/i2
(
Ea = -+!lí2 -+lA
lB le
La ecuación de segundo grado será 1a siguiente:
H.O+-E y2+
o+
H2+
o+
o+
=0.
H2+-E
(6)
2+
Resolviéndola, obtenemos:
(7)
Estos niveles corresponden al tipo A.
4.
El mismo problema para J
=
3.
Solución. La ecuación secular es de séptimo grado y se descompone en una de primero y
tres de segundo. La ecuación de primer grado tiene la forma: E 1 = Ht, de donde
E1 = 21t2
1 1 1) '
(-+-+]A
]B
Je
(8)
(nivel del tipo A). Una de las ecuaciones de segundo grado es la ecuación (6) del problema anterior
(con otro valor de J). Sus raíces son:
(9)
(niveles del tipo B1). Los restantes niveles se obtienen a partir de aquí permutando /A, / 8 e fe.
5. Determinar el desdoblamiento de los niveles de un sistema, que posee momento cuadripolar, en un campo eléctrico exterior arbitrario.
Solución.
Eligiendo como ejes de coordenadas los ejes principales del tensor Ó2t/J/óxi}xk (véase
Interacción de las vibraciones y de la rotación de una molécula
449
el problema 4, § 75), reducimos la parte cuadripolar del hamiltoniano del sistema a la forma:
Dada la completa analogía formal de esta expresión con el hamiltoniano (103.1), el problema
planteado es equivalente al problema de hallar los niveles de energía de un trompo asimétrico,
con la única diferencia de que ahora la suma de los coeficientes A+ B+ C = O, y el momento
cinético puede tener también valores semienteros. Para estos últimos los cálculos deben efectuarse
de nuevo, siguiendo el mismo método, y para los valores J enteros se pueden utilizar los resultados
de los problemas 2-4. En definitiva obtenemos los siguientes valores del desplazamiento de la
energía tl.E para los primeros valores de J:
J = 1:
ilE = -A,-B,-C;
J = 3/2: ilE =
J = 2:
± y'[3(A2+B2+c2)/2];
ilE = 3A, 3B, 3C, ± y'[6(A2+B2+ C2)].
Para J = 3/2 los niveles de energía siguen siendo doblemente degenerados, de acuerdo con el
teorema de KRAMERS (§ 60).
§ 104.
Interacción de las vibraciones y de la rotación de una molécula
Hasta aquí hemos considerado la rotación y las vibraciones como movimientos
independientes de una molécula. Sin embargo, en realidad, la existencia simultánea
de ambas conduce a una interacción característica entre ellas (E. TELLER, L. T1szA
y G. PLACZEK, 1932-1933).
Consideremos primero las moléculas poliatómicas lineales. Una molécula poliatómica puede efectuar vibraciones de dos tipos (véase el final del§ 100): vibraciones
longitudinales, con frecuencias simples, y vibraciones transversales, con frecuencias
dobles. Nos interesan ahora estas últimas.
Una molécula que efectúe vibraciones transversales posee, en general, un cierto
momento cinético. Esto es ya evidente por simples consideraciones mecánicas (1),
pero se puede demostrar también acudiendo a la mecánica cuántica. Esta última
permite determinar además los posibles valores de este momento cinético en un
estado de vibración dado.
Supongamos que en la molécula se ha excitado una frecuencia doble cualquiera
wa.. El nivel de energía con número cuántico vibratorio Va. es degenerado de orden
(va.+l). Al mismo corresponden va.+1 funciones de onda
lfva. 1 va.. = constante X e-ca.ª<Qa./+Qa./>!2Hva. 1(c0t.Q0t. 1 )Hva.. (c0t.Q0t. 2),
(donde Va.1 -f--va.2 =vr:x.) o cualesquiera combinaciones lineales independientes de las
mismas. La mayor potencia total (respecto de Qa.1 y Qa.2) del polinomio por el que se
(1) Así, dos vibraciones ·transversales perpendiculares entre sí, con una diferencia de fase de n/2,
se pueden considerar como una rotación pura de la molécula curvada en torno del eje longitudinal.
450
Moléculas poliatómicas
multiplica el factor exponencial es la misma para todas estas funciones e igual a Vix.
Es evidente que siempre es posible elegir, como funciones fundamentales, combinaciones lineales de las funciones '1/J 'Z'oc1 Voc 2 de la forma:
,f.,'IJa.la.
= constante xe-c/!Qa/+Qa.S>!2 [(Qx1+iQo:2)(va+la)/2(Qo:1-iQ<X2)<'"a-1ix>!2+ ..• ].
(104.1)
Entre los paréntesis rectos aparece un cierto polinomio del cual hemos escrito solamente el término de mayor grado. El parámetro loc es un número entero que puede
tomar voc+ l valores diferentes: lix = Voc, Voc - 2, Vix - 4, ... , - Voc.
Las coordenadas normales Qoc1 , Qoc2 de la vibración transversal representan dos
desplazamientos perpendiculares entre sí a partir del eje de la molécula. En una
rotación de ángulo <p en torno de este eje, el término de mayor grado del polinomio
(y con él también toda la función '1/J voc 1 Voc 2) queda multiplicado por
é<fl..Va.+l/X)/2e-i<J,(VIX-la.)/2 = eila.<J,.
Vemos así que las funciones (104.1) corresponden a un estado con momento cinético loc
respecto del eje.
De esta manera llegamos al resultado de que en el estado en el cual está excitada
una frecuencia doble woc (con número cuántico vix), la molécula posee un momento
cinético (respecto de su eje) que toma los valores
(104.2)
De este momento se dice que es el momento cinético vibratorio de la molécuh,. Si se
excitan a la vez varias vibraciones transversales, el momento vibratorio total es igual
a la suma '2:../oc. Al componerlo con el momento cinético orbital de los electrones
a.
'
se obtiene el momento cinético total, /, de la molécula respecto de su eje.
El momento cinético total de la molécula J (al igual que en una molécula diatómica) no puede ser menor que el momento cinético respecto del eje, es decir, J
toma los valores
J = ¡z¡, 1z1+1, ....
Con otras palabras, los estados con J
=
O, 1, ... , !l / - 1 no existen.
En las vibraciones armónicas, la energía depende únicamente de los números
y no de loc. La degeneración de los niveles vibracionales (respecto de los valores /oc)
desaparece en el caso en que la vibración es anarmónica. Sin embargo, la desaparición no es completa: los niveles siguen siendo doblemente degenerados, poseyendo
la misma energía los estados que difieren en el cambio simultáneo del signo de todos
los lix y /; en la aproximación siguiente (después de la armónica), en la expresión
de la energía aparece un término cuadrático respecto de los momentos loc, término
que es de la forma goc15lr:1J{J (las gix{J son constantes). Esta doble degeneración <lesaVoc,
0
~
Interacción de las vibraciones y de la rotación de una molécula
451
parece debido a un efecto análogo a la duplicación A en las moléculas diatómicas.
Al pasar a las moléculas no lineales, es necesario ante to<lo hacer la siguiente
observación de carácter puramente mecánico. Para un sistema de partículas arbitrario (no lineal) se plantea la cuestión de cómo es posible, en general, separar el movimiento vibratorio de la rotación, con otras palabras, la pregunta de qué hay que
entender por « sistema no en rotación». A primera vista, se podría pensar que el
criterio que indica la ausencia de rotación puede consistir en la anulación del momento
cinético:
l:mrxv
=O
(104.3)
(la suma se extiende a las partículas del sistema). Sin embargo, la expresión que
aparece en el primer miembro no es la derivada total respecto del tiempo de una
función de las coordenadas. Como consecuencia, no cabe integrar la igualdad anterior respecto del tiempo de modo que se pueda formular como equivalente a la
igualdad a cero de una cierta función de las coordenadas. Sin embargo, es precisamente esto último lo que es necesario para que sea posible formular de manera
lógica el concepto de « vibraciones puras» y de « rotación pura».
Por ello como definición de ausencia de rotación hay que tomar la condición
(104.4)
donde r 0 son los vectores que fijan las posiciones de equilibrio de las partículas.
Haciendo r = r 0 + u, donde u es el desplazamiento para pequeñas vibraciones,
tenemos v = r = ü. La ecuación (104.4) se integra respecto del tiempo, y en definitiva obtenemos:
l: mr0 Xu
=
O.
(104.5)
El movimiento de una molécula lo consideramos como superposición de un movimiento puramente vibratorio, en el que se satisface la condición (104.5), y una rotación de la molécula considerada como un todo (1).
Escribiendo el momento cinético en la forma:
l: mrxv
=
l: mr0 xv+
~
muxv,
vemos que, de acuerdo con la definición (104.4) relativa a la ausencia de rotación,
hay que entender por momento cinético vibratorio la suma ~mu x v. Sin embargo,
es necesario no perder de vista que este momento cinético, que es sólo una parte del
momento cinético total del sistema, no se conserva. Por ello a cada estado vibracional se puede atribuir solamente el valor medio del momento cinético vibratorio.
(1) El movimiento de translación se supone eliminado desde un principio eligiendo como sistema
de coordenadas aquél en que el centro de masas de la molécula se encuentra en reposo.
452
Moléculas poliatómicas
Las moléculas que no poseen ningún eje de simetría de orden superior al segundo
pertenecen al tipo del trompo asimétrico. En ellas· todas las frecuencias de vibración son simples (sus grupos de simetría poseen sólo representaciones irreducibles
unidimensionales). Por lo tanto, ningún nivel vibracional es degenerado. Pero en
todo estado no degenerado el momento cinético medio es nulo (véase § 26). Luego,
en las moléculas del tipo del trompo asimétrico el momento cinético vibratorio
medio es nulo en todos los estados.
Si entre los elementos de simetría de la molécula se tiene un eje de orden superior
al segundo, la molécula pertenece al tipo del trompo simétrico. Una tal molécula
posee vibraciones correspondientes tanto a frecuencias simples como a frecuencias
dobles. El momento cinético vibratorio medio de las primeras es de nuevo igual a
cero. En cambio, a las frecuencias dobles corresponde un valor medio no nulo
de la proyección del momento sobre el eje de la molécula.
Es fácil hallar una expresión para la energía del movimiento de rotación de una
molécula (del tipo del trompo simétrico) teniendo en cuenta el momento cinético
de rotación. El operador de esta energía difiere del (103.5) en la substitución del
momento cinético de rotación de) trompo por la diferencia entre el momento cinético total de la molécula J (que se conserva) y su momento vibratorio J(v):
(104.6)
La energía buscada es el valor medio Drot· Los términos en (104.6) que contienen
los cuadrados de las componentes de J dan la energía de rotación pura, que coincide
con (103.6). Los términos que contienen los cuadrados de las componentes J(v),
dan valores constantes que no dependen de los números cuánticos de rotación;
se puede prescindir de ellos. En cambio, los términos que contienen los productos
de las componentes de J y J(v) constituyen el efecto que aquí nos interesa, el de la
interacción de las vibraciones de la molécula con su rotación; a este efecto se le
1lama interacción de Coriolis (teniendo en cuenta que corresponde a las fuerzas de
Coriolis de la mecánica clásica). Al promediar estos términos hay que tener presente
que los valores medios de las componentes transversales(~, r¡) del momento cinético
vibratorio son iguales a cero. Por ello, para la energía de la interacción de Coriolis
obtenemos:
Ecor = -li 2kkv/Ic,
(104.7)
donde k (un número entero) es, como en e] § 103, la proyección del momento cinético total sobre el eje de la molécula, y kv = 1,<v> es el valor medio de la proyección
del momento cinético vibratorio que caracteriza el e3tado vibracional dado; kv,
no tiene por qué ser un número entero, a diferencia de k.
Interacción de las vibraciones y de la rotación de una molécula
453
Finalmente, consideremos las moléculas del tipo del trompo esférico. A este
tipo pertenecen las moléculas con una simetría cualquiera de los grupos cúbicos.
Tales moléculas poseen frecuencias simples, dobles y triples (de acuerdo con el hecho
de que entre las representaciones irreducibles de los grupos cúbicos existen representaciones de una, dos y tres dimensiones). Como siempre, la degeneración de los
niveles vibracionales desaparece en parte en la aproximación anarmónica; una
vez se han tenido en cuenta estos efectos, subsisten, junto con los no degenerados,
tan sólo niveles cuya degeneración es de segundo y de tercer orden. Discutiremos
ahora precisamente estos niveles que se desdoblan debido al carácter anarmónico
del movimiento.
Es fácil ver que, en las moléculas del tipo del trompo esférico, el momento cinético vibratorio medio es nulo no solamente en los estados vibracionales no degenerados, sino también en los degenerados de orden dos. Esto se sigue ya de simples
consideraciones basadas en las propiedades de· simetría. En efecto, los vectores
de los momentos cinéticos medios en dos estados que corresponden a un mismo
nivel degenerado de la energía deberían transformarse entre sí en todas las transformaciones de simetría de la molécula. Pero ni uno solo de los grupos cúbicos de
simetría admite la existencia de dos direcciones que se transforman entre sí; esto
ocurre tan sólo para el conjunto de tres direcciones por lo menos.
Pero de estas mismas consideraciones se sigue que, en los estados correspondientes a niveles vibracionales triplemente degenerados, el momento cinético vibratorio medio es diferente de cero. Después de promediar respecto del estado vibracional, este momento es un operador representado por una matriz cuyos elementos
corresponden a las transiciones entre tres estados mútuamente degenerados. De
ªcuerdo con el número de tales estados, este operador debe ser de la forma CÍ, donde
i es el operador del momento cinético igual a la unidad (para el cual 2/ + 1 = 3)
y Ces una constante característica del nivel vibratorio en cuestión. EJ hamiltoniano
del movimiento de rotación de la molécula
firot = {lí2/2I)(J- J<vl)
se transforma, después de dicho promedio, en el operador
(104.8)
Los valores propios del primer término definen la energía de rotación ordinaria
(103.4), y el segundo término da una constante sin importancia que no depende
del número cuántico de rotación En cambio, el último término en (104.8) proporciona la energía buscada del desdoblamiento de Coriolis del nivel vibratorio. Los
valores propios de la magnitud J, 1 se calculan de la manera usual; dicha magnitud
puede tener (para J dado) tres valores distintos (correspandientes a los valores
Moléculas poliatómicas
4S4
J+l, J -
1, J del vector l+J). Finalmente, obtenemos:
Ecor'J+l> = -li2,J/I,
EcoP-1>= li 2 ,(J+ 1)//,
Ecor'J>
§ 105.
= li 2,/l.
}
(104.9)
Clasificación de los términos moleculares
La función de onda de una molécula es el producto de la función de onda electrónica, de la función de onda del movimiento vibratorio de los núcleos y de la
función de onda de rotación. Hemos discutido ya la clasificación y los tipos de simetría de estas funciones por separado. Nos queda ahora por considerar el problema
de la clasificación de los términos moleculares en conjunto, es decir, el de la posible
simetría de la función de onda total.
Es claro que el dar la simetría de estos tres factores respecto de una transformación cualquiera determina también la simetría del producto con relación a esta
misma transformación. Para una completa caracterización de la simetría del estado
hay que indicar, además, el comportamiento de la función de onda total en la inversión simultánea de las coordenadas de todas las partículas (de los electrones y de
los núcleos) en la molécula. El estado se llama negativo o positivo según que la función de onda cambie de signo o lo conserve en esta transformación (1).
Sin embargo, es necesario tener en cuenta que la característica de un estado
respecto de la inversión tiene sentido solamente para las moléculas que no poseen
estereoisómeros. La existencia de estereoisómeros significa que, en la inversión, la
molécula adopta una configuración que ninguna rotación espacial puede llevar
a coincidir con la de partida (moléculas de las modificaciones « dextrogira » y
« levógira » de una substancia) (2). Por ello, cuando existe esteroisomería, las funciones de onda que se obtienen una de otra mediante la inversión corresponden
fundamentalmente a moléculas diferentes y carece de sentido compararlas (3).
Vimos en el § 86 que el spin de los núcleos determina en las moléculas diatómicas un importante efecto indirecto sobre el esquema de los términos moleculares,
fijando la multiplicidad de su degeneración y prohibiendo en algunos casos niveles
(1) Como se suele hacer, utilizamos aquí la misma terminología, poéo afortunada, que en el caso de
las moléculas diatómicas (§ 86).
(2) Para que puedan existir estereoisómeros es necesario que la molécula no posea ningún elemento
de simetría ligado con una reflexión (centro de inversión, plano de simetría, o eje de giro reflejado).
(ª) Rigurosamente hablando, la mecánica cuántica conduce siempre a una probabilidad no nula
para la transición que lleva de una modificación a la otra. Sin embargo, esta probabilidad, vinculada al
paso de los núcleos a través de una barrera, es tan pequeña que no hay necesidad de considerar dicho
fenómeno.
Clm,ificación de lo.i, término,., moleculare.i,
455
de una u otra simetría. Lo mismo cabe decir de las moléculas poliatómicas. Sin
embargo, aquí el estudio del problema es considerablemente más complejo y exige
la aplicación de métodos de la teoría de grupos a cada caso particular.
La idea del método consiste en lo siguiente. La función de onda total debe contener, además de la parte dependiente de las coordenadas (que es la única que hemos
considerado hasta ahora), también un factor dependiente del spin, factor que es
función de las proyecciones de los spins de todos los núcleos sobre una dirección
cualquiera elegida en el espacio. La proyección a del spin de un núcleo toma 2i + 1
valores (i es el spin del núcleo); dando a todos los a 1 , a 2, ••• , as (N es el número de
átomos de la molécula) todos los valores posibles, obtenemos en total (2i1 + 1) (2i2 + 1)
... (2iN + 1) valores distintos del factor espinorial. En cada transformación de simetría, algunos núcleos (de la misma especie) cambian de lugar, y si imaginamos que
los valores de los spins « se mantienen en los mismos lugares», la transformación
será equivalente a una permutación de los valores de los spins entre los núcleos.
De acuerdo con esto, los diferentes factores de spin se transformarán entre sí, realizando, de esta manera, una representación (en general reducible) del grupo de
simetría de la molécula. Descomponiéndola en partes irreducibles, encontramos los
tipos posibles de simetría de la función de onda de spin.
Es fácil escribir una fórmula general para los caracteres Xsp( G) de la representación de la que son base los factores espinoriales. Para ello basta observar que, en
una transformación, solamente no cambian los factores de spin de aquellos núcleos
que sí cambian de lugar, pero que tienen el mismo valor de ªª; en el caso contrario,
un factor de spin se transforma en otro factor de spin y no contribuye al valor del
carácter. Teniendo en cuenta queªª toma 2ia + 1 valores, encontramos que
Xsp(G) = TI (2ia+ 1),
(105.1)
donde el producto se extiende a los grupos de átomos que cambian entre sí sus
posiciones en la transformación dada G (con un factor de cada grupo en el producto).
Sin embargo, no nos interesa tanto la simetría de la función de spin como la
simetría de la función de onda de las coordenadas (es decir, la simetría respecto de
las permutaciones de las coordenadas de los núcleos, conservando invariables las
coordenadas de los electrones). Pero estas simetrías están ligadas directamente
entre sí por el hecho de que la función de onda total debe permanecer invariable
o cambiar de signo en la permutación de cada par de núcleos que obedecen a la
estadística de Bose o a la de Fermi, respectivamente (con otras palabras, debe quedar multiplicada por (- 1)2i, donde i es el spin de los núcleos permutados). Introduciendo el correspondiente factor en los carácteres (105.1 ), obtenemos el sistema
de caracteres x( G) de la representación que contiene todas las representaciones
irreducibles y de acuerdo con la cual se transforman las funciones de onda de coor-
456
Moléculas poliatómicas
denadas:
(105.2)
(na es el número de núcleos en cada grupo de núcleos que intercambian sus posi-
ciones entre sí en la transformación dada). Descomponiendo esta representación
en partes irreducibles, obtenemos los tipos posibles de simetría de las funciones de
onda de coordenadas de la molécula, a la vez que la multiplicidad de la degeneración
de los correspondientes niveles de energía (aquí y en lo que sigue se trata de la degeneración respecto de los diferentes estados de spin del sistema de núcleos) (1).
Cada tipo de simetría de los estados está ligado con valores determinados de los
spins totales de los grupos de núcleos equivalentes en la molécula (es decir, de los
grupos de núcleos que intercambian entre sí sus posiciones en una transformación
cualquiera de simetría de la molécula). Esta relación no es biunívoca: cada tipo
de simetría de los estados puede realizarse, en general, con valores diferentes de los
spins de los grupos de núcleos equivalentes. En cada caso particular, es también
posible establecer dicha relación mediante los métodos de la teoría de grupos.
Consideremos por ejemplo una molécula del tipo del trompo asimétrico - la
molécula de etileno C122 H\ (fig. 43, g, grupo de simetría Du,, ). El superíndice en
un símbolo químico indica a qué isótopo pertenece el núcleo; esta indicación es
necesaria, ya que los núcleos de isótopos diferentes poseen diferente spin. En el
caso presente el spin del núcleo H1 es igual a ! y el núcleo C12 carece de spin. En
consecuencia, sólo hay que considerar los átomos de hidrógeno.
Elijamos el sistema de coordenadas como se indica en la fig. 43, g (el eje z es
perpendicular al plano de la molécula, el eje x está dirigido en el sentido de su eje).
La reflexión en el plano a(xy) conserva todos los átomos en sus posiciones y las demás reflexiones y rotaciones cambian de posición los átomos de hidrógeno a pares
Según la fórmula (105.2) obtenemos los siguientes caracteres de la representación
E
a(xy)
a(xz)
a(yz)
1
16
16
4
4
4
4
4
4
Descomponiéndola en partes irreducibles, encontramos que en ella están contenidas
las siguientes representaciones irreducibles del grupo D 2h: 7Ag, 3B¡g, 3B2 u, 3B3 u,
El coeficiente indica la multiplicidad con que la representación irreducible dada
aparece en la reducible; estos números son también los pesos estadísticos nucleares
de los niveles con la correspondiente simetría (2).
(1) La multiplicidad de la degeneración de un nivel. considerada desde este punto de vista, se suele
llamar su peso estadístico nuc/P.ar (cf. la nota en la pág. 360).
(2) La relación entre la simetría de los estados y los valores del spin total de los cuatro núcleos de H
en la molécula de etileno se establece en el problema 1.
Cla.-.if icación de los término.-. moleculare.-.
457
La clasificación que hemos obtenido de los estados de una molécula de etileno
se refiere a la sinJetría de la función de onda total (de coordenadas), que incluye las
partes electrónica, vibracional y de rotación. Sin embargo, de ordinario presenta
interés llegar a estos resultados desde otro punto de vista. Así, conociendo las posibles simetrías de la función de onda total cabe encontrar directamente qué niveles
de rotación son posibles (y con que peso estadístico) para un estado electrónico
y vibracional dado, cualquiera.
Consideremos, por ejemplo, la estructura de rotación del más bajo nivel vibratorio (en el que las vibraciones no están excitadas) del término electrónico normal,
suponiendo que la función de onda electrónica del estado normal es completamente
simétrica (lo que tiene lugar prácticamente para todas las moléculas poliatómicas).
La simetría de la función de onda total respecto de las rotaciones en torno del eje
de simetría coincide entonces con la simetría de la función de onda de rotación.
Comparando con los resultados antes obtenidos, llegamos a la conclusión de que
en la molécula de etileno los niveles de rotación de los tipos A y B1 (véase § 103)
son positivos y tienen pesos estadísticos 7 y 3, mientras que los niveles de los tipos
B2 y B3 son negativos y tienen peso estadístico 3.
Como en el caso de las moléculas diatómicas (véase el final del § 86), a causa
de la extraordinaria debilidad de la interacción de los spins nucleares con los electrones, prácticamente no se producen transiciones entre estados de la molécula
de etileno con diferente simetría nuclear. Por ello las moléculas que se encuentran
en estos estados se comportan como modificaciones diferentes de la materia, de
modo que el etileno C 122 H\ posee cuatro modificaciones con pesos estadísticos
nucleares 7, 3, 3, 3. Para esta conclusión es esencial el hecho de que los estados
con diferente simetría corresponden a niveles distintos de la energía (los intervalos
entre los cuales son grandes comparados con la energía de interacción de los spins
nucleares). No es válida, por consiguiente, para aquellas moléculas en las que existen estados de diferente simetría nuclear y correspondientes a un mismo nivel degenerado de energía.
Consideremos otro ejemplo todavía: la molécula de amoníaco N 14H\ del tipo
del trompo simétrico (fig. 41, grupo de simetría C 3v). El spin del núcleo N 14 es igual
a 1, el spin del H 1 es -}. Mediante la fórmula ( 105.2) encontramos los caracteres de
la representación que nos interesa del grupo C 3 ":
E
24
6
-lz'
Esta contiene las siguientes representaciones irreducibles del mismo: 12A 2, 6E.
Resultan así ser posibles dos tipos de niveles; sus pesos estadísticos son iguales
458
Moléculas poliatómicas
a 12 y 6 (1).
Los niveles de rotación del trompo simétrico se clasifican (para J dado) según
los valores del número cuántico k. Consideremos, como en el ejemplo anterior, la
estructura de rotación del estado electrónico y vibratorio normal de la molécula
NH3 (es decir, supongamos que las funciones de onda electrónica y de vibración son
totalmente simétricas). Al determinar la simetría de la función de onda de rotación,
no hay que perder de vista que sólo tiene sentido hablar de su comportamiento
respecto de las rotaciones en torno del eje. Por ello substituiremos los planos de
simetría por ejes de simetría de segundo orden perpendiculares a los mismos (la
reflexión en un plano es equivalente a la rotación en torno de uno de estos ejes
seguida de la inversión). En el presente caso, por consiguiente, en vez del C 3u hay
que considerar el grupo isomorfo D 3 .
Las funciones de onda de rotación con k = ± JkJ quedan multiplicadas por
en una rotación C3 en torno de un eje vertical de tercer orden, y se transforman entre sí en la rotación U2 en torno de un eje horizontal de segundo orden,
realizando así una representación bidimensional del grupo D 3 . Para JkJ no múltiplo
de tres, esta representación es irreducible - es la representación E. La representación del grupo C 3 /I que corresponde a la función de onda total se obtiene multiplicando el carácter x( U2 ) por + 1 o por - 1, s~gún se trate de un término positivo
o negativo. Pero dado que en la representación E tenemos x( U2 ) = O, en ambos
casos obtenemos de nuevo la misma representación E (pero esta vez ya como representación del grupo C 3 u, no del D 3). Teniendo en cuenta los resultados antes obtenidos, llegamos así a la conclusión de que, cuando fk[ no es múltiplo de tres, son
posibles tanto los niveles positivos como los negativos, con pesos estadísticos nucleares iguales a 6 (niveles con una simetría dei tipo E de la función de onda total
de coordenadas).
e±2rrílkl¡a
Para Jkl múltiplo de tres (pero diferente de cero), las funciones de rotación son
base de una representación (del grupo D 3) con caracteres
E
2
2
o
Esta representación es reducible y se descompone en las representaciones A1 y A2 •
Para que la función de onda total corresponda a la representación A 2 del grupo C 3 u,
el nivel de rotación A1 debe ser negativo, y A2 positivo. Así, pues, para ikl múltiplo
de tres y no nulo son posibles tanto los niveles positivos como los negativos, con
pesos estadísticos nucleares iguales a 12 (niveles del tipo A 2).
C)
A los términos con la simetría A:! corresponde el spin total de los núcleos de hidrógeno igual a 3/2,
y al término F, el spin ~.
459
Clasi/icación de lo.~ términos moleculares
Finalmente, a la proyección del momento cinético k = O corresponde solamente
una función de rotación, que es base de una representación con los caracteres (1)
E
1
1
Para que la función de onda total tenga la simetría A 2 , su comportamiento respecto
de la inversión debe quedar determinado, por consiguiente, por el factor (- IV.
De esta manera, para k = O los niveles con J par (impar) pueden ser solamente
negativos (positivos); el peso estadístico en ambos casos es igual a 6 (niveles del
tipo A2).
Resumiendo estos resultados, obtenemos la siguiente tabla de estados posibles
para valores distintos del número cuántico k en el caso del término normal electrónico
y de vibración de la molécula N 14H 13 ( + y - designan los estados po'sitivos y netivos):
k
1 k
1
1
1
no múltiplo de tres
múltiplo de tres
k = O
f J par
l ] impar
+
6E
6E
12A2
12A2
6A2
6A2
Para valores dados de J y k, los niveles de energía de la molécula NH3 resultan
ser, en general, degenerados (véase también la tabla para la molécula ND3 en el
problema 3). Esta degeneración en parte se rompe y ello debido a una efecto característico ligado con la forma aplanada de la molécula de amoníaco y a la pequeña
masa de los átomos de hidrógeno. Mediante un desplazamiento vertical relativamente pequeño de los átomos de esta molécula se puede conseguir la transición
entre dos configuraciones que se obtienen una de otra por reflexión en un plano
paralelo a la base de la pirámide (fig. 44). Estas transiciones conducen a un desdoblamiento de los niveles en el que se separan los niveles positivos y negativos (efecto
análogo al caso unidimensional considerado en el problema 3 del § 50). La magnitud
del desdoblamiento es proporcional a la probabilidad del paso de los átomos por
la « barrera de potencial» que separa ambas configuraciones de la molécula. Aunque, debido a las propiedades antes indicadas de la misma, en la molécula de amoníaco esta probabilidad es relativamente grande, con todo,la magnitud del desdoblamiento es pequeña (1 x 10-4 eV).
Un ejemplo de molécula del tipo del trompo esférico se estudia en el problema 5
de este párrafo.
(1) En la rotación de ángulo :r, la función propia del momento cinético con el valor J y proyección
igual a cero queda multiplicada por (- J)-1.
460
Moléculas poliatómicas
N
HO~H
HO~oH
~
N
Fm. 44
PROBLEMAS
l. Establecer la relación entre la simetría del estado de la molécula C 122 H 14 y el spin total de
los núcleos de hidrógeno de la misma.
El spin total de los cuatro átomos H 1 puede tener los valores 1 = 2, 1, O, y su
proyección M 1 toma valores entre 2 y - 2. Consideremos las representaciones dadas por los
factores de spin correspondientes a cada valor l'vf; por separado, comenzando por el mayor de ellos.
Solución (1).
Al valor M 1 = 2 corresponde tan sólo un factor de spin, en el que todos los núcleos tienen
como proyección del spin el valor + t. Al valor M1 = 1 van asociados cuatro factores de spin
distintos que difieren entre sí en que a cada uno de los cuatro núcleos se atribuye una proyección
del spin igual a - t. Finalmente, el valor M 1 = O se obtiene con seis factores de spin según sea
el par de núcleos al que se atribuyen las proyecciones - t del spin. Los caracteres de las tres representaciones correspondientes son:
M1 = 2
M1 = 1
M1 = O
E
1
4
6
a(xz)
1
4
o
a(yz)
1
o
o
6
2
2
2
a(xy)
1
I
1
La primera de estas representaciones es la representación unidad Au; dado que el valor M 1 = 2
se puede conseguir solamente para 1 = 2, llegamos a la conclusión de que al spin J = 2 corresponde un estado con la simetría Ag.
El valor M 1 = 1 se puede conseguir tanto para 1 = 1 como para I = 2. Restando, de acuerdo
con esto, de la segunda representación la primera y descomponiendo el resultado en partes irreducibles, encontramos que al spin 1 = 1 corresponden estados B 1u, B 2 u, B 3 u.
Finalmente, el valor M1 =Ose puede conseguir en todos los casos en los que es posible M 1 = J,
y, además, para 1 = O. Restando, de acuerdo con esto, de la tercera representación la segunda,
encontramos dos estados Au que corresponden al spin I = O.
2. Determinar los tipos de simetría de las funciones de onda totales (de coordenadas) y los
pesos estadísticos de los correspondientes niveles para las moléculas CL 22 H\, C 1ª2 H\, N 1\0 164
(todas estas moléculas tienen la misma forma; los spins son i(H 2) = 1, i(C 13) = t, i(N 14) = 1).
1
( )
Un método para la resolución de problemas análogos basado en la teoría de grupos de permutaciones puede verse en E. G. KAPLAN, ZhETF, 37, 1050 (1959).
Clasificación de los términos moleculares
461
Solución. Siguiendo el mismo método que se aplicó en el texto a la molécula C 1\H 14 , encontramos los siguientes estados (los ejes de coordenadas se eligen al igual que antes):
+
Molécula
C 122H 24
C 13 2H 1 4
N14 2 Q16 4
3.
18B2u, 18Bau
12B2u, 24B:iu
3Bsu
27Ag, 18B1u
16Au, 12B1u
6Au
El mismo problema para la molécula N 14H\.
Solución. De manera análoga a como se procedió en el texto para la molécula N 1 4H 13 , encontramos los estados: 30A 1 , 3A 2 , 24E.
Para el término electrónico y de vibración normal y diferentes valores del número cuántico k
son posible~ los siguientes estados:
lkl
lkl
k
4.
=
no múltiplo de tres
múltiplo de tres
] par
O { ] impar
+
24E
30Ai, 3A2
30A1
3A2
24E
30Ai, 3A1
3A2
30A1
El mismo problema para la molécula C 12 2 H\ (véase la fig. 43, f; simetría D 3 a).
Solución.
Son posibles estados de los siguientes tipos: 7A 1g, 1A 1 u, 3A 2 g, 13A 2 u, 9Eu, 11 Eu.
Para el término electrónico y de vibración normal se obtienen los siguientes estados:
lkl
!kl
k
=
O
{
no múltiplo de tres
múltiplo de tres
par
J impar
J
+
9Eu
7Au, 3Au
7A 1 u
3A211
11Eu
1A1u, 13A2u
1A1u
13A2u
5. El mismo problema para la molécula de metano C 12H 14 (los átomos H en los vértices, el
átomo C en el centro de un tetraedro).
Solución. La molécula pertenece al tipo del trompo esférico y tiene la simetría Ta. Siguiendo
el mismo método, encontramos que son posibles estados de los tipos: 5A 2 , JE, 3F1 (a ellos corresponde un spin total de la molécula igual, respectivamente, a 2, O, 1).
Los estados de rotación del trompo esférico se clasifican según los valores J del momento
cinético total. Las 2J + 1 funciones de rotación ligadas a un valor dado de J, son base de una representación de 2J + 1 dimensiones del grupo O, isomorfo del grupo Ta, a partir del cual se obtiene
substituyendo todos los planos de simetría por ejes de segundo orden perpendiculares a ellos.
Los caracteres de esta representación se determinan mediante la fórmula (98.1 ). Así, por ejemplo,
para J = 3 obtenemos una representación con los caracteres
E
7
-1
-1
-1
En ella están contenidas las siguientes representaciones irreducibles del grupo O: A 2 , Fi, F 2 • Considerando de nuevo la estructura de rotación del término electrónico y de vibración normal, deducimos de aquí que para J = 3 los estados de la función de onda total con la simetría A 2 pueden
ser solamente positivos, y los niveles del estado F 1 , tanto positivos como negativos. Para los primeros valores J se obtienen, de la misma manera, los siguientes estados (los escribimos junto con
462
Moléculas poliatómicas
sus pesos estadísticos nucleares):
]=O
]=1
]=2
]=3
]=4
+
SA2
3F1
1E
SA2 , 3F1
1E, 3F1
1E, 3F1
3F1
5A21 1E, 3F1
CAPÍTULO
XIV
COMPOSICIÓN DE MOMENTOS CINÉTICOS
§ 106.
Símbolos-3j
La regla obtenida en el § 31 para la composición de momentos cinéticos determina los valores posibles del momento cinético total de un sistema formado por
dos partículas (o por partes más complejas) que poseen momentos cinéticos j 1 y
j 2 ( 1). Esta regla, en realidad, está íntimamente ligada con las propiedades de las
funciones de onda respecto de las rotaciones espaciales y se siguen directamente
de las consideraciones hechas en el capítulo VIII acerca de las propiedades de los
espinores.
Las funciones de onda de dos partículas con momentos cinéticos j 1 y j 2 son espinores simétricos de órdenes 2j1 y 2j2 , y la función de onda del sistema viene dada
por su producto
(106.1)
Simetrizando éste respecto de todos los índices, obtenemos un espinor simétrico
de orden 2(j1 +j2) que corresponde a un estado con momento cinético totalj1 +j2 •
Contraigamos ahora el producto (106.1) respecto de un par de índices, de los que
uno debe pertenecer a vP>, y el otro, a 1P< 2>(de no hacerlo así, el resultado sería
cero); en virtud de la simetría de cada uno de los espinores 1P(l) y 1P< 2>, es indiferente
cuáles sean los índices que se eligen entre los }., µ, ... y entre los e, a, ... Después
de simetrizar, obtenemos un espinor simétrico de orden 2(j1 -l-j2 - 1) que corresponde a un estado con momento cinético j 1 -l-j2 - 1 (2). Siguiendo este proceso,
(I) Rigurosamente hablando, y aunque no se diga explícitamente cada vez, en todo lo que sigue
consideraremos siempre un sistema constituido por partículas cuya interacción mutua es tan débil que,
en primera aproximación, podemos suponer que sus momentos cinéticos se conservan.
Todos los resultados que se exponen a continuación se refieren, claro está, no sólo a la composición
de los momentos cinéticos totales de dos partículas (o de dos sistemas), sino también a la composición
del momento cinético orbital y de spin de un mismo sistema en el supuesto de que el acoplamiento spin~
órbita es suficientemente débil.
( 2)
Para evitar confusiones, conviene hacer la siguiente observación. La función de onda de un sistema
de dos partículas es siempre un espinor de orden 2(j¡ + j2), en general diferente de 2j, dondej es el momento
cinético total del sistema. Este espinor, sin embargo, puede ser equivalente a un espinor de orden inferior.
Así, la función de onda de un sistema de dos partículas con momentos cinéticos i1 = i2 = t es un espinor
de segundo orden; pero si el momento cinético total es j = O, este espinor es antisimétrico y se reduce,
por consiguiente, a un escalar. En general, el momento cinético total j determin¡1 la simetría de la función
de onda de spin del sistema: ésta es simétrica respecto de 2j índices y antisimétrica respecto de los demás.
464
Composición de momentos cinéticos
encontramos que, de acuerdo con la regla ya conocida, j toma los valores comprendidos entrej1 +j2 y fj 1 - j 2 \ y cada uno de ellos una sola vez.
Para resolver del todo el problema de la composición de momentos cinéticos,
hemos de estudiar todavía el problema de cómo construir la función de onda de un
sistema con un valor dado del momento cinético total a partir de las funciones de
onda de las dos partículas que lo constituyen.
Para empezar consideremos el caso más simple, el de la composición de dos
momentos cinéticos cuya resultante es nula. En este caso, evidentemente, debe
ser j 1 = j 2 y las proyecciones de los momentos cinéticos son tales que m1 = - m2 •
Sean 1/)jm las funciones de onda normalizadas de los estados de una partícula con
momento cinético j y proyección m (en la representación no espinorial). La función
'YO que buscamos del sistema es una suma de productos de funciones de onda de
ambas partículas con valores opuestos de m, precisamente de la forma:
1
'Fo =
j
~ (-l)f-m.l.(l)i ,/,(2)1. -m
v(2j+l) ~~ m~ • '
(106.2)
m=-J
{j es el valor común de j 1 y j 2). El coeficiente de la suma resulta de la normalización.
En cuanto a los coeficientes que aparece~ en la misma, todos ellos deben ser iguales
en valor absoluto, ya por el simple hecho de que todos los valores de las proyecciones
m de los momentos de las partículas deben ser igualmente probables. Por otra parte,
es fácil determinar el orden de sucesión de los signos en (106.2) mediante la representación espinorial de las funciones de onda. De acuerdo con este simbolismo, la
suma en (106.2) es un escalar (¡el momento total del sistema es igual a cero!)
¡fa(l)ltµ, ...¡fa<2\¡i ... ,
(106.3)
formado a partir de dos espinores de orden 2j. Teniendo esto en cuenta, a partir
de la fórmula (57.3) encontramos, sin más, los signos que aparecen en (106.2).
Sin embargo, no hay que perder de vista que, en general, solamente están determinados unívocamente los signos relativos de los términos de la suma (106.2), mientras que el signo común puede resultar dependiente del « orden de composición »
de los momentos. En efecto, si bajamos todos los signos espinoriales (entre los que
hay j+m unos y j - m doses) en 1P'1) y los subimos en 1P(2), el escalar (106.3) queda
multiplicado por (- 1)2j, es decir, cambia de signo sij es semientero.
Consideremos ahora un sistema, cuyo momento cinético total es igual a cero,
formado por tres partículas con momentos cinéticos j 1, j 2 , j 3 y proyecciones de los
mismos m1 , m2 , m3 • La condición de que el momento cinético total sea igual a cero
implica que m1 +m2 +m3 =· O y quej1,j2,j3 tengan valores tales que cada uno de ellos
465
Símbolos 3 j
se puede obtener como resultado de la suma vectorial de los otros dos, es decir,
geométricamente j 1 , j 2 , j 3 deben ser los lados de un triángulo; con otras palabras,
cada uno de ellos no es menor que la diferencia ni mayor que la suma de los otros dos:
li1-hl
~ h ~ ji +h, etc.
Es evidente que la suma algebraicaj1 +j2 +j3 es en este caso un número entero.
La función de onda del sistema considerado tiene la forma de una suma
'l"o =
(106.4)
que se extiende a todos los valores de cada uno de las mi entre los límites -- Ji y .ÍiLos coeficientes en esta fórmula se llaman símbolos-3j de Wigner. Por definición,
son diferentes de cero tan sólo si se cumple la condición
Al permutar los índices 1, 2, 3, la función de onda (106.4) puede variar solamente
en un factor de fase que carece de importancia. De hecho los símbolos-3j se pueden
definir como cantidades reales puras (véase más adelante), en cuyo caso la falta
de univocidad de 'Y0 puede solamente consistir en la indeterminación de su signo
(como ocurría también en el caso de la función (106.2)). Esto significa que la permutación de las columnas de un símbolo-3j o lo deja invariante, o cambia su signo.
La manera más simétrica de determinar los coeficientes en la suma (106.4), que
es la que se suele seguir para definir los símbolos-3j, consiste en lo siguiente. En el
formalismo espinorial, 'f'0 es un escalar formado multiplicando tres espinores
"P(I)}.p ... , 'tp< 2 )}p ... , 1P( 3)}p ... , y contrayendo a continuación respecto de todos los pares
de índices, de forma que los índices de cada par se refieren a dos espinores distintos.
Convengamos en que, para cada par relativo a las partículas 1 y 2, el índice de spin
se escribirá como superíndice en 1P<1> y como subíndice en tp< 2); para un par correspondiente a las partículas 2 y 3, utilizamos un superíndice en tp< 2 ) y un subíndice
en tp< 3); para un par correspondiente a las partículas 3 y 1, el superíndice se referirá
a tp< 3) y el subíndice a tp(l) (es fácil ver que en total se tienen j 1 +j2 - j3 , .i2 +j3 - j 1
y J3 +j1 - j 2 pares de cada una de estas «clases», respectivamente). Con esta regla
el signo de 'F0 queda fijado unívocamente.
Es evidente que, de acuerdo con esta definición, una permutación cíclica de los
índices 1, 2, 3 deja 't'0 invariable. Esto significa que un símbolo ~¡ no cambia en una
permutación cíclica de sus columnas. En cambio, la permutación de dos índices
(cualesquiera) obliga, como se ve fácilmente, a subir los subíndices y bajar los superíndices en todos los j 1 +j2 +J3 pares. Esto significa que 't'0 queda multiplicada por
(- 1)ii+i +i,; con otras palabras, los símbolos-3} tienen la propiedad:
2
466
Composición de momentos cinéticos
(106.5)
es decir, cambian de signo al permutar dos columnas si j 1 +j2 +}3 es un número
impar.
Finalmente, es fácil ver que
(106.6)
En efecto, el cambio de signo de la componente z de todos los momentos cinéticos
se puede considerar como el resultado de la rotación de ángulo nen torno del eje y.
Pero esta transformación equivale a subir todos los subíndices y bajar todos los superíndices espinoriales (véase (58.11)).
De la expresión (106.4) se puede pasar a una fórmula importante que determina
la función de onda o/;m de un sistema formado por dos partículas y que posee valores
dados de j y m. Consideremos para ello el conjunto de las partículas 1 y 2 como un
solo sistema. En tanto que el momento cinético j de este sistema junto con el momento
cinético j 3 de la partícula 3 se componen dando lugar a un momento resultante nulo,
debe ser j = j 3 , m = - m 3 • Según (106.2) se puede entonces escribir
'f"o =
1
"" (- l)j-m'f".
V(2j+ 1) L
,/,(3). _
•
J, m
}m'/'
(106.7)
m
Hay que comparar esta fórmula con la expresión (106.4) (en la que escribimos},
- m en vez de } 3 , m3 ). Sin embargo, es necesario tener antes en cuenta que la regla
de formación de la suma (106.7) de acuerdo con (106.3) no coincide con la regla
de formación de la suma (106.4): para reducir (106.7) a (106.4) es necesario, como
se ve fácilmente, agrupar los superíndices y los subíndices formando pares que corresponden a las partículas 1 y 3; esto conduce a la aparición de un factor adicional
( - 1)id2+is. En definitiva obtenemos:
(106.8)
donde la suma respecto de m 1 y m2 se efectúa teniendo en cuenta la condición
m 1 +m 2 = m.
La fórmula (l 06.8) da la expresión buscada de la función de onda del sistema
a partir de las funciones de onda de ambas partículas para momentos cinéticos
467
Símbolos 3 j
determinados } 1 y }2 de éstas. Dicha función se puede escribir en la forma:
(106.9)
Los coeficientes (1)
(106.10)
constituyen la matriz de transformación del sistema completo ortonormal de las
(2j1 + 1) (2j2 + 1) funciones de onda de los estados con valores determinados m1,
m2 al mismo sistema de funciones con valores determinados}, m (para valores dados
j 1, j 2). Conforme sabemos (véase § 12), esta matriz es unitaria. Por consiguiente,
podemos escribir sin más la transformación inversa
11+12
'P(l)j1m1'P( 2 li2m2
=
2
j=Jj2-icl
Ci, mi+mz':f1'j,m1+m2,
(106.11)
m1m2
(se tiene aquí en cuenta también el hecho de que los coeficientes C son reales). De
acuerdo con las reglas generales de la mecánica cuántica, los cuadrados de los coeficientes del desarrollo (106.11) determinan la probabilidad de que el sistema tenga
un cierto valor j (para los valores dados j 1, m1 y j 2 , m2 ).
El carácter unitario de Ja transformación (106.9) significa que estos coeficientes
satisfacen determinadas condiciones de ortogonalidad. Según las fórmulas (I 2.5),
(12.6) tenemos:
¿
c1m crm'
m1m2 m1m2
m1,m2
¿
= (2j+l)
m1,m2
=
el jw
)2
m1 m2 -m
)2
m1 m2
-~')
ój5'ómm',
(106.12)
j,m
- ~ (2j+l)(!n: :, _;,)(:, :2 -~)
=ó
se
ó
m1mi'
1n2m2'
(106.13)
1
( )
Llamados coeficientes de composición vectorial o coeficientes de Klehsch-Gordan. En la literatura
utilizan para ellos también las notacionesc/1mm 1J 2m 2 , (Jii, i111 ¡ 1 j 0111,Í11J.
468
Composición de momentos cinéticos
La forma general explícita de los símbolos-3j es bastante complicada. Cabe
darla en la forma (1):
js)
jl h
( m1 m2 m3
=
[(j1 +;°2-ja)!(ji-h+ja)!(-ji +J°2+ja)!Jl/ 2X
(j1+h+h+l)!
x [(ji +m1)!(ji-m1)!(i2+m2)!(h-m2)!(h+m3)!(ja-m3)!]112 x
( -1 )z+ii-irms
~
x
7 z!(ji +h-js-z)!(ji-m1 -z)!(h+m2-z)!(ja-h+m1 +z)!(j3-ji-m2+z)°!
(106.14)
La suma se extiende a todos los valores enteros z; sin embargo, dado que la factorial de un número negativo es igual a oo, el número de términos en la suma es,
de hecho, finito. El coeficiente de la suma es evidentemente simétrico respecto de
los índices 1, 2, 3; la simetría de la suma, en cambio, se pone de manifiesto después
de cambiar la variable z respecto de la que se suma.
Además de las propiedades de simetría (106,5-6) que se siguen de manera fácil
a partir de la definición de los símbolos-3j, éstos poseen todavía otras cuya deducción es, sin embargo, más complicada, y que no justificaremos aquí (2). Estas propiedades se formulan de manera cómoda introduciendo una tabla cuadrada (3 x 3)
de números ligados con los parámetros de un símbolo-3} de la siguiente manera:
.
ji )2 )3
(
m1 m2 ms
)
=
[}2+ja-j¡ js+j1-h j1+h-h]
.
.
.
JI -m1
J2-m2
J3-m3
;
ji +m1
h+m2
(106.15)
h+m3
(la suma de los números en cada fila y en cada columna de esta tabla es igual a
J1 +J2 +J3 ). Entonces: 1) la permutación de dos columnas cualesquiera de la tabla
multiplica el símbolo-3j por ( - 1)ii+is+ía (esta propiedad coincide con (106.5));
2) lo mismo vale para la permutación de dos filas cualesquiera (aplicada a las dos
últimas filas, esta propiedad coincide con (106.6)); 3) un símbolo-3j no cambia
cambiando filas por columnas.
He aquí algunas de las fórmulas más simples para unos cuantos casos particulares. El valor
1
( )
Los coeficientes '3el desarrollo (106.9) fueron calculados por primera vez por E. WJGNER (1931).
En cuanto a las propiedades de simetría de estos coeficientes y a la expresión simétrica (106.14) de los
mismos, el primero en hallarlas fue G. RACAH (1942). El método de cálculo más directo consiste, probablemente, en el paso de la representación espinorial \Fo (normalizada del modo indicado) a la representación en forma de suma ( 106.4) mediante las fórmulas de correspondencia (58.1) (obsérvese que el carácter
real del coeficiente en esta fórmula conduce automáticamente al carácter real de los símbolos-3j). Otra
manera de llegar a este resultado se encuentra en el libro: A. R. EDMONDS, Angular momentum in quantum
mechanics, Princeton, 1957. De este mismo libro se ha tomado la tabla adjunta de símbolos-3j.
O Véase T. RFGGF, N1101·0 Cimento, 10, 544, 1958.
469
Símbolos 3 j
.
}
. O
(m
J
)
1
1'"
(
(106.16)
-m O = - p-m,/(2j+ 1)
corresponde a la fórmula ( 106.2). Las fórmulas
(2j1)!(2h)!(ji +jz+m1 +m2)!(j1 +h-m1 -m2)! ] 1/2
x [ (2J°1 +2h+ l)!(ji +m1)!(ji-m1)!(j2+m2)!(h-m2)! '
.}2
j3) = ( -1 )-J1+J2+m3
. .
X
J1 -11-m3 m3
J._1
(
(106.17)
(2j1)!(-ji +iz+ja)!(j1 +jz+m3)!(ja-m3)!
]1/2
[
x (ji +h+h+ l)!(ji-jz+ja)!(j1 +iz-ja)!(-ji +iz-m3)!(ja+m3)!
TABLA 9
Fórmulas para los símbolos-Jj
j+m!
(
j
1)
2
-m-! !
= (- l)i-m-1/2
[
j-m+1.2
]112
(2j+ 1)(2j+2)
.
.
1
(- l)i-m(Jl
J
)
m -m-m3 m3
~ma
o
}l " '
2m
j
[2j(2j+ 1)(2j+2)]1!2
j+1
-[2(j+m+ l)(j-m+ 1)]1/2
(2j+ 1)(2j+2)(2j+3)
1
"'-ma
ii""'-
2(j-m)(j+m+ 1)]1/2
[ 2j(2j+ 1)(2j+2)
j
j+l
- [ (j-m)(J-m+ 1)
(2j+ 1)(2j+2)(2j+3)
( - l)i-m+l/2(ji
j
} )
m -m-m3 m3
]1/2
Composición de momentos cinéticos
470
.l
~
2
-
j+t
j-m+.12
·+3m+-º [
(]
z) 2j(2j+1)(2j+2)(2j+3)
]112
3(j-m+f)(j-m+ i)(j+m+ i)]l/2
[ (2j+ 1)(2j+2)(2j+3)(2j+4)
j+i
3
~
2
j+t
-[3(j-m-f)(j- m+f )(j+ m+ J)]l/2
2j(2j + 1)(2j + 2)(2j + 3)
j+f
(j-m-f)(j-m+f)(j-m+i)]lí2
[ (2j + 1)(2j + 2)(2j + 3)(2j + 4)
.
.
2
(-l)i-m(Jl
J
)
m -m-m3 m3
o
~
2[3m2-j(j+ 1)]
J
[(2j-1 )2j(2j + 1)(2j + 2)(2j + 3) ]1/2
-2m [
j+l
j+2
6(j+m+ l)(j-m+ 1)
]112
2j(2j + 1)(2j + 2)(2j + 3)(2j + 4)
6(j+m+2)(j+m+ l)(j-m+2)(j-m+ 1)
[
]1/2
(2j + 1)(2j + 2)(2j + 3)(2j + 4)(2j + 5)
1
(1 +2m) [
j+l
6(j+m+ l)(j-m)
]1;2
(2}-1 )2j(2j + 1)(2j + 2)(2j + 3)
.
[
-2(J+2m+2)
(j-m+l)(j-m)
]1;2
2j(2j+ 1)(2j+2)(2j+3)(2j+4)
z[(j+m+2)(j-m+2)(j-m+ l)(j-m)]l/2
j+2
(2j+ 1)(2j+2)(2j+3)(2j+4)(2j+5)
2
6(j-m- l)(j-m)(j+m+ l)(j+m+2)11/2
[
(2j-1)2j(2j+ 1)(2j+2)(2j+3)
J
471
Símbolos 3 j
-z[(j-m- l)(j-m)(j-m+ l)(j+m+Z)]l/2
j+l
2j(2j + 1)(2j + 2)(2j + 3)(2:J° + 4)
(j-m- l)(j-m)(j-m+ l)(j-m+Z)]l/2
[ (2j+ 1)(2j + 2)(2j + 3)(2j+4)(2j+ 5)
j+2
se obtienen directamente de (106.14). En cambio, deducir la fórmula
jl jz ja) = -1 p[(ji +jz-ja)!(j¡-jz+ja)!(-ji +jz+js)!ll/2 X
(O O O ( )
(2p+ 1)!
J
p!
X
(p-j1)!(p-h)!(p-ja)!
,(106.18)
en la que 2p = j 1 +j2 +_j3 es un número par, requiere una serie de cálculos adicionales (1) (para 2p impar, este símbolo-3j es igual a cero en virtud de la propiedad
de simetría (106.6)).
En la tabla 9 se dan los valores de los símbolos-3j correspondientes a / 3
=--=
!,
1, 312 , 2. Para cada/ 3 se indica el número mínimo de símbolos-~¡ a partir de los cuales
se pueden obtener los demás mediante las relaciones ( 106.5), ( 106.6).
PROBLEMA
Determinar la dependencia angular de las funciones de onda de una partícula de spin ~ en
estados con valores dados del momento cinético orbital /, del momento total j, y de su proyección m.
Solución. El problema se resuelve con la fórmula general (!06.8) en la que por i¡,(11 hay que
entender las funciones propias del momento cinético orbital (es decir, los armónicos esféricos Y1111 1),
y por "P( 2 J, la función de onda de spin 7.(a) (donde a = ± t):
l
'Y1m = (-l)l+m-1/2y1(2j+l)"" (
L.,
O"
1
.
J )Yi.m-a-x(cr).
m-cr u -m
2
Substituyendo los valores de los símbolos-3j, obtenemos:
'Y1+112,m =
j+m
J
'Yz-112,m = -
(')
~x(i)Yi,m-112+
j-m+l
J
Jj-m
Zj+Z x(t)Yt,m-112+
Véase el libro antes citado de
EDMONns.
.
~x(-t)Y1,m+1¡2,
Jj+m+l
Zj+Z x(-t)Yi,m+1¡2.
472
§ 107.
Composición de momentos cinéticos
Elementos de matriz de los tensores
En el§ 29 se obtuvieron fórmulas que determinan la dependencia de los elementos de matriz de una magnitud física vectorial respecto del valor de la proyección
del momento cinético. Estas fórmulas son, en realidad, un caso particular de fórmulas generales que resuelven el mismo problema para un tensor irreducible (véase
página 231 ) de orden cualquiera (1).
El conjunto de las 2k+ 1 componentes de un tensor irreducible de orden k (k es
un número entero) equivale, por sus propiedades de transformación, al conjunto
de los 2k+ 1 armónicos esféricos Ykq, q = - k, ... , k (véase la nota en la pág. 233).
Esto significa que formando combinaciones lineales adecuadas de las componentes
del tensor es posible obtener un sistema de cantidades que, en las rotaciones, se
transforman de igual manera que los armónicos esféricos Ykq· El conjunto de tales
cantidadés, que designaremos aquí por fkq, lo llamaremos tensor esférico de orden k.
Así, a un vector corresponde el valor k = 1, y las cantidades /iq están ligadas
con las componentes del mismo por las siguientes fórmulas:
!10 =
t
iaz,
/i,±1
= ::¡: ;¡¡{ªx±iay);
(107.1)
(cf. (58.2a)). Las fórmulas análogas para un tensor de segundo orden se escriben:
Í2,±1 =
(siendo au+ayy +azz
=
±(ªxz ±iayz),
(107.2)
O).
La formación de productos tensoriales de dos (o más) tensores esféricos Ík,q,,
se efectúa de acuerdo con las reglas de composición de los momentos cinéticos,
en las que representan formalmente el papel de « momentos cinéticos» los parámetros k 1 y k 2 correspondientes a estos tensores. De esta manera, a partir de.los tensores esféricos de órdenes k 1 y k 2 se pueden formar tensores esféricos de orden
K = k 1 +k 2 , ••• , \k 1 - - k 2 l según las fórmulas:
/k q
2 2
(107.3)
(1) La manera de tratar los problemas considerados en los §§ 107-109, y la mayor parte de los resultados que en ellos se presentan se deben a G. RACAH (1942-1943).
Elementos de matriz de lo.~ tensores
473
(cf. (106.9)). El producto escalar de dos tensores esféricos de igual orden k se suele
definir, sin embargo, por la igualdad
(Íkgk)oo =
f (-1 )k-qfkqgk,-q,
(107.4)
que difiere de la definición según la fórmula (107.3), con K = Q = O, en el factor
l/2k+l (cf. (106.2)) (1). Esta definición se puede presentar también en la forma
si se observa que gkq* = ( - 1)k-qgk,-q (cf. (28.8)) (2).
La representación de las magnitudes físicas en la forma de tensores esféricos
es particularmente cómoda para el cálculo de sus elementos de matriz, ya que ello
permite utilizar, sin más, los resultados de la teoría de composición de momentos
cinéticos.
Por la definición de los elementos de matriz tenemos:
""
L.,
(f¡kq )n'f'm'.1.
njm 'f'n'J'm',
(107.5)
n'j'm'
donde tpnim son las funciones de onda de los estados estacionarios del sistema caracterizados por el valor de su momento cinético j, de su proyección m y por el conjunto
de los demás números cuánticos n. En virtud de sus propiedades de transformación,
las funciones que aparecen en uno y otro miembro de la igualdad (107.5) corresponden a las funciones en uno y otro miembro de la igualdad (106.11). De aquí se siguen
desde luego las siguientes reglas de selección: paraj, m dados, los elementos de matriz
son diferentes de cero tan sólo para los valores j', m' que satisfacen la « regla de
composición de los momentos» j' = j+k; en todo esto es m' = m+q (3).
Además, del mismo hecho de que las transformaciones son análogas se sigue
que los coeficientes en la suma (107.5) deben ser proporcionales a los coeficientes
en (106.11 ). De acuerdo con esto escribiremos los elementos de matriz en la forma
-( )n~j'm'
( Jkq
n1m
=
., k .
J Jk )n'i'
,
nj ,
q m
.-m'( -mJ
t'k(-l)i max
)c-r
(107.6)
(1) Si A y B son dos vectores, que corresponden según las fórmulas (107.1) a los tensores esféricos
f,q y K,q, se tiene (f;g,)oo = A· B.
(2) Se supone que los tensores irreducibles de partida son cantidades físicas reales, de modo que el
carácter complejo de las cantidades f1.q resulta solamente del paso a componentes esféricas.
(ª) En particular, partiendo de aquí se obtienen directamente las reglas de selección de que se habló
en el § 29 para los elementos de matriz de un vector.
474
Composición de momentos cinéticos
es el mayor de los números j y j'), donde ( /k):t son cantidades que no dependen de m, m', q; estas cantidades rec·ben el nombre de elementos de matriz « reducidos » (1). Esta fórmula resuelve la cuestión planteada. En particular, para k = I
se obtienen a partir de ella las fórmulas (29.7). (29.9) para los elementos de matriz
de una magnitud vectorial.
Umáx
Los operadores
Jkq están ligados entre sí por las relaciones
fkq
= (- l)q-k!,:,-q+,
(107.7)
En consecuencia, para sus elementos de matriz vale la igualdad
.f. )n'j'm'
( Jkq
njm
_ (-J)q-k(I'.
)n.im*
Jk,-q n'j'm'
(107.8)
Substituyendo aquí (107.6) y utilizando las propiedades (106.5) y (106.6) de los
símbolos-3j, obtenemos para los elementos de matriz reducidos la relación de « hermiticidad »
( I'.
)n'i' _ ( -r. )nj*
Jk nf
-
JJC n'J''
(107.9)
Los elementos de matriz del escalar (107.4) son diagonales respecto de j y de m.
Según la regla de multiplicación de matrices, tenemos:
-1"
)
1n'jm _
[( ;kgk
OOJnjm -
""
L, ( - l)k-q
q
""
¡ )n 1 jm (
)n"j"m"
L, (Jkq
n"j"m" g,:,-q njm
nnj"m"
Substituyendo aquí las expresione.s (107.6) y efectuando la suma respecto de q y mu
mediante la relación de ortogonalidad de los símbolos-3j (106.12), se obtiene la
fórmula siguiente:
(107.10)
De manera análoga es fácil obtener las siguientes fórmulas de sumación de los
cuadrados de los elementos de matriz:
(107.11)
(107.12)
(1) El símbolo de los elementos de matriz reducidos difiere del símbolo de los elementos de matriz
de partida en que en aquéllos no aparecen los índices correspondientes a las proyecciones de los momentos.
475
Símbolo.~ 6 j
En la primera de ellas la suma se efectúa respecto de q y. m' para m dado, y en la
segunda, respecto de m y m' para q dado (siendo siempre m' = m+q).
Como aplicación interesante, consideremos el caso en que las cantidades fkq son
los propios armónicos esféricos Ykq y calculemos sus elementos de matriz para
transiciones entre estados de una misma partícula con momentos cinéticos orbitales
11 y 12 (números enteros). Con otras palabras, hay que calcular las integrales
(107.13)
Junto con las reglas de selección correspondientes a la regla de composición de
momentos (1 + 12 = 11), para estos elementos de matriz vale también la regla según
la cual la suma 1+11 +12 debe ser un número par. Esta regla resulta de la conservación de la paridad, en virtud de la cual el producto ( - 1)Z1+Z2 de las paridades de
ambos estados debe coincidir con la paridad (-1) 1 de la magnitud física considerada
(véase § 30).
De acuerdo con (107.6) tenemos:
(107.14)
Yz)!:
Para determinar las cantidades (
basta calcular el elemento de matriz para
= O. La integral ( 107.13) se reduce en este caso a la integral del producto de tres polinomios de Legendre, igual a (1):
m1 = m 2 = m
l
/
/
/
2
JPt(µ)P1 (µ,)Pzh1,) dµ = 2 (; O ~) .
(107.15)
1
-1
Finalmente obtenemos:
( Yiz)
l
.
1
l2
= ( + z)Z1+l2
-
(li l l2) [(2/ + 1)(2/i + 1)(2/2 + 1)]
ooo
47T
1/2
'
(107.16)
donde los signos superior e inferior de i se refieren, respectivamente, a los casos
/1 2 12 y /1 :s:; 12,
§ 108.
Símbolos-6j
En el § 106 hemos definido los símbolos-3j como coeficientes en la suma (106.4)
( ') Véase E.
página 87.
HoBSON,
The theory of spherica/ al1(/ ellipsoidal lwr111011ics, Cambridge Univ. Press, 1931,
476
Composición de momentos cinético.~
que representa la función de onda de un sistema de tres partículas con momento
cinético total igual a cero. Desde el punto de vista de las propiedades de transformación respecto de las rotaciones, esta suma es un escalar. De aquí se sigue que el
sistema de símbolos-3j con valores dad.os j 1 , / 2 , j 3 (y todos los m1, m 2 , m3 , posibles)
se puede considerar como un conjunto de cantidades que se transforman en las
rotaciones según una ley contragrediente respecto de la ley de transformación
2
de los productos 1/Pj 1 1it,' j 2 2
de forma que queda garantizada la invariancia de toda la suma.
m ml\ama,
En relación con este punto de vista cabe plantearse el problema de cómo construir un escalar a partir tan sólo de símbolos-~¡. Un tal escalar debe depender únicamente de los números j, pero no de los números m, que cambian en las rotaciones.
Con otras palabras, debe expresarse como suma respecto de todos los valores m.
Cada una de estas sumas se forma por la « contracción » del producto de dos símbolos-3j de acuerdo con la regla
2(-l)i-m(j ·
m
·)(_j1n ·. .·);
(108.1)
m..
(cf. la manera de construir el escalar (106.2)).
Dado que en cada « contracción » figura un par de números m, para construir
el escalar total hay que considerar productos de un número par de símbolos-3j.
La contracción del producto de dos símbolos-3j conduce, en virtud de la propiedad
de ortogonalidad, al resultado trivial:
m1,m2,ma
ji
( m1
fa h
m2
)2 = 1;
ma
(se han utilizado aquí la igualdad m1 +m2 +m3 = O y las fórmulas (106.6) y (106.12)).
Por ello el número de factores mínimo necesario para obtener un escalar no trivial
es igual a 4.
En cada símbolo-3j los tres números j forman, geométricamente, un triángulo.
Dado que cada número j debe figurar para la « contracción » en dos símbolos-3j,
es claro que al formar un escalar mediante el producto de 4 símbolos-3j se tienen
6 números j, que deben representarse geométricamente por las longitudes de las
aristas de un tetraedro no regular (fig. 45); a cada uno de los símbolos-3j corresponde una de sus caras. Para definir el escalar buscado se suele adoptar en la contrae-
477
.~ímbolos 6 j
ción un convenio que se expresa por la siguiente fórmula:
(~1 ~2 J:3¡ = ¿(_l
)E;(j¡-m,) (
]4 )5 )6
todotn
ji
)2
)3 )
X
-m1 -m2 -m3
(108.2)
FIG. 45
La suma se efectúa aquí respecto de todos los valores posibles de los números m;
sin embargo, dado que la suma de tres valores m en cada símbolo-3j debe ser igual
a cero, de hecho solamente dos de los seis valores m son independientes. Las cantidades definidas por la fórmula (108.2) se llaman símbolos-~¡ o coeficientes de Racah.
Partiendo de la definición (108.2) y teniendo en cuenta las propiedades de simetría de los símbolos-3j, es fácil comprobar que un símbolo-6j no cambia en una
permutación cualquiera de tres de sus columnas y que en cada par de columnas
se pueden permutar los números superior e inferior. En virtud de estas propiedades
de simetría, la sucesión de números j 1 ... j 6 en un símbolo-6j se puede presentar
en 24 formas equivalentes (1). Además, los símbolos-6j poseen otra propiedad de
simetría, menos evidente, que establece la igualdad entre símbolos con sistemas
distintos de números j (2):
ji jz
(
h) = (j1 t(h+h+h-j6) t(js+j6+h-h))·
i4 j5 i6
h Mh+h+j5-h) His+j6+h-h)
(108.3)
(1) Si imaginamos el te.raedro de la fig. 45 como tetraedro regular, las 24 permutaciones equivalentes
de los números j se pueden obtener como resultado de la aplicación de las 24 transformaciones de simetría
(rotaciones y reflexiones) del tetraedro.
0 Véase T. REGGE, Nuovo Cimento, 11, 116, 1959.
478
Composición de momentos cinéticos
He aquí una relación útil entre símbolos-6j y 3j que se puede obtener a partir
de la definición (108.2):
( ji
h
ja) (~1 ~2 ~3)·
m1 m2 m3
(108.4)
)4 )5 )6
La expresión que aparece en el primer miembro de la igualdad difiere de la suma
en (108.2) en que falta uno de los factores (un símbolo-3j). Cabe decir, por consiguiente, que la suma en (108.4) se representa por un tetraedro (fig. 45) sin una de
sus caras; en esto difiere de un escalar la suma considerada. Con otras palabras,
por sus propiedades de transformación, dicha suma corresponde al símbolo-3j
que aparece en el segundo miembro de la igualdad (108.4), símbolo al que debe
ser proporcional. Pero el coeficiente de proporcionalidad (símbolo-6j del segundo
miembro) se obtiene fácilmente multiplicando ambos miembros por
(j¡ h h)
m1m2m3
y sumando respecto de los números que quedan, m1, m2 , m3 •
Los símbolos-6j aparecen de manera natural al estudiar el siguiente problema
ligado con la composición de tres momentos cinéticos.
Supongamos que los tres momentosj1,j2,)3 se componen dando lugar al momento
cinético resultante J. Si sólo se da el momento cinético J (y su proyección M), el
estado del sistema no queda aún determinado de manera unívoca; dicho estado
depende también de cómo se hayan compuesto los momentos cinéticos (o, como
suele decirse, del esquema de su acoplamiento).
Consideremos, por ejemplo, estos dos esquemas de acoplamiento: 1) los momentos j 1 y j 2 se componen primero, dando lugar a la resultante Ji2, y luego se componenj12 y j 3 para formar el momento cinético final J; 2) se componen los momentos
j 2 y j 3, formando j 23, y luego j 23 y j 1 para formar J. Al primer esquema corresponden
estados en los que (junto conj1,j2,j3, J, M) la cantidadj12 tiene un valor determinado;
sus funciones de onda ]as representaremos por 'Y¡ 12JM (prescindiendo, para simplificar, de los índices que se repiten j 1,j2,f3). Análogamente~ las funciones de onda del
segundo esquema de acoplamiento las designaremos por 'Y¡ 23JM· En ambos casos,
los valores del momento cinético « intermedio » (i12 o j 23) no están, en general, fijados unívocamente, de modo que se tienen (para valores dados J, M) dos sistemas
distintos de funciones de onda que se diferencian en los valores j 12 o j 23 . De acuerdo
con las reglas generales, las funciones de estos dos sistemas están ligadas entre
479
.Símbolos 6 j
sí por una determinada transformación unitaria:
(108.5)
Es evidente por ·consideraciones físicas que los coeficientes de esta transformación
no dependen del número M - no pueden depender de la orientación de todo el sistema en el espacio. Así, pues, dependen sólo de los valores de los seis momentos
j 1 , j 2 , j 3 , A2 , j 23 , J, pero no de sus proyecciones, es decir, son magnitudes escalares
(en el sentido antes indicado). El cálculo efectivo de estos coeficientes se efectúa
fácilmente de la siguiente manera.
Aplicando dos veces la fórmula (106.9), encontramos:
'P'112JM
=
L
m1,m2,ma
12
c~~c~·":,
12 1 2 1Pi1m1tpf2m21Piams•
3
mu
Según las reglas generales, los coeficientes de la transformación (108.5) son iguales
a las integrales:
I
mi,m 2,ma
C!_M cJM Cium12Cf23m2a•
m3 m12 m1m2a m1m2
m 2m 3
'
m12,m23
(utilizamos aquí la ortogonalidad de las funciones '1./J;m). La suma que aparece en el
segundo miembro de la igualdad se forma para el valor dado de M, pero el resultado
de la misma no depende en realidad de dicho valor (por lo antes dicho). Por consiguiente, la suma se puede extender también a todos los valores de M, introduciendo
delante de ella el factor 1/(21+1). Expresando luego los coeficientes C en función
de símbolos-3j de acuerdo con (106.10), obtenemos en definitiva la siguiente expresión:
11 2
S112iu = (-l)ii+Mia+J v'[(2j12+ 1)(2iza+ 1)](~
)3
.
1
12
~ ).
}23
(108.6)
La relación entre los símbolos-6j y los coeficientes de la transformación (108.5)
permite obtener fácilmente algunas fórmulas útiles para sumar productos de símbolos-6j.
480
Composición de momentos cinéticos
Ante todo observemos que, en virtud del carácter unitario de la transformación
(108.5) (y del hecho de que sus coeficientes son reales), vale la relación
1
i'}(h. h. .,,}= a, .
""cz·+
L,
1 1)c2·"
1 + 1)(i. h. .
J
}3 )4
j
J
)1 )4
i i
J
(108.7)
Consideremos ahora tres esquemas de acoplamiento de tres momentos cinéticos,
con sumas intermedias j¡2, j'};J y j 31, respectivamente. Los coeficientes de las correspondientes transformaciones (108.6) están ligados entre sí, de acuerdo con la regla
de multiplicación de matrices, por la relación
L, S1uiuSiuia1 =
Si12J31•
iu
Substituyendo aquí (108.6) y cambiando la notación de los índices, obtenemos:
2~4~6}(~4 ~1 ~ } (~1 ~2 ~3}·
¿(
-1 )i+Ja+ie(2j + 1)(~
J
=
)1 )5 )
)2 )5 )3
(108.8)
)4 )5 )6
Finalmente, considerando los diferentes esquemas de acoplamiento de cuatro
momentos cinéticos se puede obtener (1) la siguiente fórmula de composición para
los productos de tres símbolos-6j:
¿(
-1 )i+f i1(2j + l)
(~4 ~2 ~6 \(~2
~1 ~3}(~4 ~3 J~5}
j
)9 )B. )
j
)7 )
)9
=
)7 )8
(~1 ~2 ~3}(~6 ~1 ~5}
}4 }5 }6
(l. C. BIEDENHARN, J. P.
ELLIOIT,
}7 }B }9
(108.9)
1953).
He aquí algunas expresiones explícitas de símbolos-6j.
Un símbolo-6j se puede representar en el caso general como una suma de la
siguiente forma:
2
( j~ ~
~ª}
=
,6(j1hia)l::.(j1j5j6)6(j4hj6)l::.(Msia) x
)4 )5 }6
1
(1)
Véase el libro de
EDMONDS
citado en la pág. 468.
481
Símbolos 6 j
donde
L.(abc) = [
(a+b-c)!(a-b+c)!(-a+b+c)!
.
(a+b+c+ 1)!
]1;2,
y la suma se extiende a todos los valores enteros positivos z para los que ninguna
de las factoriales en el denominador tiene argumento negativo.
En la tabla 10 se dan las fórmulas de los símbolos-6j para los casos en que uno
de los parámetros es igual a O, t ó 1.
Para terminar, haremos algunas observaciones acerca de los escalares de orden
más elevado formados a partir de símbolos-3j.
Después de un símbolo-6j, el escalar siguiente en complejidad es el obtenido
por contracción de productos de seis símbolos-3j. Estos símbolos-3j contienen 18 números j que coinciden a pares, de forma que el escalar que resulta depende en definitiva de 9 parámetros j. Se le suele llamar símbolo-9j y definir de la siguiente manera
(E. WIGNER, 1951) (1):
TABLA
10
Fórmulas para símbolos-6j
(-l)s
a b e}
(O e b = v[(2b+ 1)(2c+ 1)]'
s = a+b+c
e }
[
(s-2b)(s-2c+ 1)
a b
(! e-! b+! = (-l)s (2b+ 1)(2b+2)2c(2c+ 1)
]1/2
]1/2
a b
e }
[
(s+ l)(s-2a)
(! e-! b-! = ( - l)s 2b(2b+ 1)2c(2c+ 1)
1
( )
Según la regla general de contracción (108.1), habría que escribir los argumentos m e~ los tr~s
últimos símbolos-3j con signo menos e introducir tras el símbolo de suma el factor ( _ 1 ) ~ (1 - m). Sm
embargo, valiéndonos de la propiedad (106.6) de los símbolos-3J, y teniendo en cuenta que en el pre- •
sente caso, como se ve fácilmente, la suma ~m de los nuevos números m es igual a cero, llegamos a
la definición (108.11).
482
Composición de momentos cinéticos
e )
[
s(s+ l)(s-2a- l)(s-2a)
]1;2
a b
( 1 c-1 b- l - (-l)S (2b-l)2b(2b+ 1)(2c-1)2c(2c+ 1)
[ª
e )
b
ll c-1
b
= (- l)S
[ 2(s+ l)(s-2a)(s-2b)(s-2c+ 1) ]1;2
2b(2b+ 1)(2b+2)(2c-1)2c(2c+ 1)
e )
[ (s-2b- l)(s-2b)(s-2c+ l)(s-2c+2) ]1/2
b+ 1 = ( - l)s (2b + 1)(2b+2)(2b+ 3)(2c-l)2c(2c+ 1)
e )
2[b(b+ l)+c(c+ l)-a(a+ 1)]
b = (-l)s+1[2b(2b+1)(2b+2)2c(2c+1)(2c+2)]1/2
Esta magnitud se puede representar también como suma de productos de tres símbolos-6j:
11
{
2
.i~a} =
)21 ) .. 2 )23
~
~:
ia1 ia2 ha
¿ (,
1
l)2i(Z. + l)(jn h1 ia1)(fo h2 ia2)(j13 ha iaa l. (l08..1Z)
J
• ·
· •
• •
• · · f
)32 )33 )
)21 ) )23 J )11 )12
Cabe cerciorarse de la equivalencia de (108.1 I) y (108.12) substituyendo en esta
última igualdad la definición (108.2) y utilizando las propiedades de ortogonalidad
de los símbolos-3j.
Un símbolo-9j posee una elevada simetría, que se deduce inmediatamente de la
definición (108.11) y de las propiedades de simetría de los símbolos-3j. Es fácil comprobar que si se permutan dos cualesquiera de sus filas o columnas, el símbolo-9j
queda multiplicado por (- 1)1.'i_ Además, un símbolo-9j no cambia en una transposición, es decir, al substituir entre sí filas por columnas.
Los escalares de órdenes aún mayores dependen de un número mayor todavía
de parámetros j. Es evidente que este número debe ser siempre múltiplo de tres
(símbolos-3~j). No nos detendremos aquí a considerar las propiedades de estas
magnitudes. Indicaremos solamente que para cada n > 3 se tiene más de un tipo
de símbolos-3nj diferentes, tipos que no se pueden reducir unos a otros. Así, se
Elementos de matriz en la compo.<Jición de momentos cinéticos
483
tienen dos tipos distintos de símbolos-12j (1).
§ 109.
Los elementos de matriz en la composición de momentos cinéticos
Consideremos nuevamente un sistema constituido por dos partes (a las que llamaremos subsistemas 1 y 2), y sea fkl) un tensor esférico característico de la primera. Sus elementos ·de matriz respecto de las funciones de onda de este mismo
subsistema se determinan, según (107.6), por la fórmula
Se plantea la cuestión de cómo calcular los elementos de matriz de esta magnitud
respecto de las funciones de onda del sistema en conjunto; demostraremos que es
posible expresarlos en función de los mismos elementos de matriz reducidos que
figuran en la expresión (109 .1 ).
Los estados del sistema total se determinan por los números cuánticos j 1, j 2, J,
M, n1, n2 (J, M son el valor absoluto y la proyección del momento cinético de todo
el sistema). Dado que fkg< 1> se refiere al subsistema 1, su operador conmuta con el
operador del momento cinético del subsistema 2. Por ello su matriz es diagonal
respecto de j 2 ; es también diagonal con relación a los demás números cuánticos n2
de este subsistema. Prescindiremos de estos índices (j2, n2) para abreviar, y escribiremos los elementos de matriz buscados en la forma
(n1'ii' J' M'lfkiUln1j1JM).
Según (107.6), la dependencia de estos elementos con relación al número M está
determinada por la fórmula
Para establecer la relación entre los elementos de matriz reducidos que aparecen
en los segundos miembros de (109.1) y (109.2) escribiremos, por la propia definición
de los elementos de matriz:
(1) Una exposición más detallada de la teoría de los símbolos-9j, y también de las propiedades de los
símbolos-3nj, se puede ver en el libro de EDMONDS citado en la pág. 46 8 y en el libro de A. P. Iurs1s, I. B.
LEVINSON y V. V. VANAGAS, Matematicheskil apparat teorii momenta R:olichestva dvizhenia, Vil'nius, 1960.
Existe traducción inglesa: Mathematical apparatus of the theory of angular momentum, Oldbourne Press,
Londres, 1963.
484
Composición de momentos cinJticos
.'
~
.')
]'
( -1)Ji'-ii+M'-M,,/[(2J' + 1)(2]+ l)](Jl 1 J_
,)
~
m1 m2 -M
X
m1,m1'
X
(
ji
m1
J) (n1'j1'm1' l/kqmlníjim1).
h
-M
m2
Substituyendo aquí (109.1) y (109.2) y comparando la relación obtenida con la fórmula (108.4), se ve que la razón de los elementos de matriz reducidos (en (109.1)
y (109.2)) debe ser proporcional a un determinado símbolo-6j. La comparación
cuidadosa de las dos relaciones indicadas conduce a la siguiente fórmula final:
(nú1'J'IJ,P>lnij1J) = (-l)lr,mn+J2+Jm1n+kyl[(2J+ 1)(2]' + 1)] X
e
. ']'.
1
X
~}(n1)1'INllln1j1),
ji
(109.3)
(aquí j 1máx es el mayor de los números j 1,j'1 ; lmín, es el menor de los números J, J').
La fórmula análoga para los elementos de matriz reducidos de un tensor esférico
correspondiente al segundo subsistema es:
(n2'Hl'lfic<2lln2j2l) = (-l)ii+h,m1n+Jmax+kyi[(2J+ 1)(21' + 1)] X
e
•
X
I
]'
j,
•
1
~)(n2'.h'IN"ln2j,).
(109.4)
El hecho de que las expresiones (109.3) y (109.4) no sean del todo simétricas (cf. el
exponente de la potencia de - 1) resulta de la dependencia de la fase de las funciones
de onda respecto del orden de composición de los momento cinéticos. Hay que
tener en cuenta esta diferencia si se trata de calcular elementos de matriz para ambos
subsistemas a la vez.
Hallaremos ahora una fórmula útil para el cálculo de los elementos de matriz,
relativos a las funciones de onda de todo el sistema, que corresponden al producto
escalar (véase la definición (107.4)) de dos tensores esféricos del mismo orden k
asociados a los diferentes subsistemas (y que, por consiguiente, conmutan entre sí).
Según (107.10), estos elementos de matriz se expresan en función de los elementos
de matriz reducidos de cada uno de los tensores (correspondientes a las funciones
de onda del sistema en conjunto) de la siguiente manera:
Elementos de matriz en la compo.'iición de momentos cinéticos
485
(se utiliza aquí el hecho de que la matriz de una magnitud asociada a un subsistema
es diagonal respecto de los números cuánticos del otro). Substituyendo (109.3-4)
y teniendo en cuenta la fórmula de sumación (108.8), encontramos la fórmula buscada que expresa los elementos de matriz del producto escalar en función de los
elementos de matriz reducidos de cada uno de los tensores respecto de las funciones
de onda del correspondiente subsistema:
(n1'nú1'h' lAfl(N 1>Ji< 2l)ooln1n2j1j2lM)
= ( -1 )ii,m1n+i2,max+J(
J.'.,
2 1
1 1
. .
k 11 12
)<n1 '.fi'l.fiP>in1ji)(nú2'IN2)¡112h).
(109.s)
CAPÍTULO
XV
MOVIMIENTO EN UN CAMPO MAGNÉTICO
§ 11 O.
La ecuación de Schrodinger en un campo magnético
En la teoría no relativista, el campo magnético se puede considerar solamente
como campo exterior. La interacción magnética de las partículas entre sí es un
efecto relativista y para tenerlo en cuenta es necesario aplicar una teoría relativista
adecuada.
El hamiltoniano de un sistema de partículas que se encuentran en un campo
magnético se puede obtener a partir de la expresión clásica para la correspondiente
función de Hamilton. Como es sabido por la electrodinámica, esta expresión tiene
la forma:
H =
~
~
a
(pa-eaAa/c) 2
2ma
+ U(x,y, z),
donde Pa es el impulso generalizado de la partícula a-ésima, Aa es el potencial vector del campo magnético en el punto en que se encuentra ésta, U(x, y, z) es la energía
potencial de interacción de las partículas ( o su energía en un campo eléctrico exterior) (1). Para abreviar, a continuación todas las fórmulas las escribiremos para
una sola partícula.
·si la partícula carece de spin, el paso a la mecánica cuántica se puede efectuar
de la manera habitual: hay que substituir el impulso p por el operador f, =
v,
con lo que obtenemos el hamiltoniano
-in
(f,-eA/c) 2
fJ = --+U(x,y,z).
(110.1)
2m
Pero si la partícula posee spin, esta operación resulta insuficiente. Ello se debe
a que el spin interactúa directamente con el campo magnético. En la función de
Hamilton clásica, esta interacción no aparece en absoluto, dado que el propio spin,
(')
Véase el tomo 11, Teoría clásica de los campos,§ 16. Designamos aquí el impulso generalizado por
p, y no por P.
La ecuación de Schrodinger en un campo magnético
487
que es un efecto puramente cuántico, desaparece al pasar a la mecánica clásica. A
una partícula con spin se le puede atribuir también un momento magnético propio;
por consideraciones de simetría, es evidente que este momento es paralelo o antiparalelo al spin. Lo escribiremos en la forma
p. = µ.s/s,
(110.2)
donde s es el operador spin~ y µ es una constante característica de la partícula (esta
forma de escribir corresponde a la terminología generalmente adoptada según la
cual se entiende por valor, µ, del momento magnético de una partícula el valor
máximo de su proyección, es decir, el valor µz = µa/s para a= s).
La expresión correcta para el hamiltoniano de la partícula se obtiene introduciendo en (110.1) el término complementario - ¡l. :Ye, que corresponde a la energía
del momento magnéticoµ en el campo :Ye. De esta manera, el hamiltoniano de una
partícula que posee spin y se encuentra en un campo magnético tiene la forma:
1J = (p-eA/c)2/2m-(µ/s)s, :Ye+ U(x,y, z).
(110.3)
Al desarrollar el cuadrado (p-eA/c) hay que tener en cuenta que p no conmuta,
en general, con el vector A, que es función de las coordenadas. Por ello es necesario
escribir:
2,
fJ
= f,2/2m-(e/2mc)(A .f,+f, .A)+e2A2/2mc2-(µ/s)s
,.1l'+ U.
(110.4)
Según la regla de conmutación (16.4) del operador impulso con una función
cualquiera de las coordenadas, tenemos:
p.A-A.p = -iñ divA.
(110.5)
Así, pues, p y A conmutan si div A == O. Esto ocurre, en particular, para un campo
homogéneo si se elige su potencial en la forma
A = i.7t'Xr.
(110.6)
La ecuación flif, = Eif, que da los valores propios del operador (110.3) constituye la generaJización de la ecuación de SCHRODINGER al caso en que existe un
campo magnético. Las propiedades del operador ·s se examinaron detalladamente
en el capítulo VIII. Las funciones de ·onda a las que se aplica el operador (110.3)
son espinores simétricos de orden 2s.
Las funciones de onda de los estados estacionarios de una partícula en un campo
magnético adolecen de una falta de unicidad característica vinculada a la no unicidad
en la elección del potencial vector. Como es sabido, este último se define sólo salvo
el gradiente de una función arbitraria/; el cambio
A~ A+ Vf(x,y,z),
(110.7)
no se refleja en el valor de la intensidad del campo. Es claro, por esto, que la trans-
488
Movimiento de un campo magnético
formación (110.7) no debe modificar esencialmente las funciones propias del operador (110.3); en partic-cilar, el cuadrado del módulo !1PJ2 debe permanecer invariable.
En efecto, es fácil convencerse de que, si a la vez que se efectúa el cambio (11 O. 7),
se aplica la substitución
if, ~ if, exp[i(e/ñc)f(x,y, z)],
(110.8)
se vuelve a la ecuación de partida (1). Así,· pues, ias fases de las funciones de onda
de los estados estacionarios están determinadas salvo una función arbitraria de las
coordenadas. Esta falta de unicidad, sin embargo, no se manifiesta en ninguna
magnitud que posea sentido físico (en su definición no aparece nunca de manera
explícita el potencial vector).
En la mecánica clásica, el impulso generalizado de una partícula está ligado con
su velocidad por la relación
mv = p-eA/c.
Para hallar el operador v en la mecánica cuántica, hay que conmutar el vector r
con el hamiltoniano. Un cálculo fácil conduce al resultado
mv
= ~-eA/c,
(110.9)
exactamente análogo a la expresión clásica. Para los operadores componentes de la
velocidad valen las reglas de conmutación:
{vx, v11} = i(eli/m2c).Jt'z,
{v 11 , vz} = i(eli/m2c).Jt'x,
)
(110.10)
{vz, vx} = i(eli/m2c).Jt'11 ,
que se verifican fácilmente mediante un cálculo directo. Vemos así que en un campo
magnético los operadores de las tres componentes de la velocidad de una partícula
(cargada) no conmutan entre sí. Esto significa que una partícula no· puede poseer
simultáneamente valores determínados de la velocidad en todas las tres direcciones.
La constante µ/sli determina la razón del momento magnético propio de la
partícula a su momento mecánico lis. Como es sabido (2), para el momento cinético
ordinario (el orbital) esta razón es igual a e/2mc. En cambio, el coeficiente de proporcionalidad entre el momento magnético propio y el spin de la partícula resulta
(1)
Si se trata de un sistema de varias partículas, la transformación de la función de onda tiene la
forma:
if, ~ if, exp{(i/ñc) ~ ea/ (xa,Ya, za)},
(la suma se extiende a todas las partículas del sistema).
2
( )
'/édsc el tomo U, Teoría clásica de los campos, § 44.
Movimiento en un campo magnético homogéneo
489
ser otro. Para el electrón, es igual a - \el/me, es decir, dos veces mayor que el valor
ordinario (1). El momento magnético propio del electrón (spin i) es igual, por consiguiente, a:
µ.o
= lelliJ2mc = 0·927X 10-20 erg/Gauss
(110.11)
Esta cantidad se llama magnetón de Bohr.
El momento magnético de las partículas pesadas se suele medir en magnetones
nucleares, definido éste por el valor elij2mc con m igual a la masa del protón. Los
experimentos dan para el momento magnético propio del protón el valor 2,793 magnetones nucleares, estando dirigido el momento magnético en el mismo sentido
que el spin. El momento magnético del neutrón es de sentido opuesto al del spin,
e igual a 1,913 magnetones nucleares.
En el movimiento en un campo magnético la simetría respecto de la inversión
del tiempo tiene lugar solamente si a la vez se cambia el signo del campo :Ye (y del
potencial vector A). Esto significa (véanse los§§ 18 y 60) que la ecuación de SCHRODINGER 11,f, = E,f, debe conservar su forma al pasar a magnitudes conjugadas complejas, cambiando a la vez el signo del/e. Para todos los términos del hamiltoniano
(110.4), con excepción del término - s .l/e, esto es evidente, sin más. En cambio,
el término - s .l/t ,f, de la ecuación de SCHRODINGER se convierte, en la transformación indicada, en el término ¡• .;/f',j,•, lo que a primera vista viola la invariancia
exigida, ya que el operador s• no coincide con -s. Sin embargo, hay que tener en
cuenta que la función de onda es, en realidad, un espinor tpJ..µ ... y que, en la inversión del tiempo, un espinor contravariante debe substituirse por otro covariante
(véase § 60), de modo que en la ecuación de SCHRODINGER el término - s . ;/t'if,Aµ ...
viene substituido por s•. #eif,;._µ .... Pero es fácil _ver (con ayuda de las definiciones
(57.4-5)), que el resultado de aplicar el operador s• a las componentes de un espinor
covariante es de signo opuesto al de la aplicación del operador Aa las componentes
de un espinor contravariante. La inversión del tiempo conduce, pues, a una ecuación
de ScHRODINGER para las componentes tp J.µ ... que tiene la misma forma que la ecuación de partida para las componentes 1plµ ...•
§ 111.
Movimiento en un campo magnético homogéneo
Determinemos los niveles de energía de una partícula en un campo magnético
homogéneo constante (L. D. LANDAU, 1930). Conviene elegir aquí el- potencial
vector del campo homogéneo no en la forma (110.6), sino en la forma siguiente:
Ax = -J?y,
Ay = Az = O
(111.1)
(el eje z se ha elegido en la dirección del campo).
(1)
Este valor de µ 0 se obtiene teóricamente a partir de la ecuación de onda relativista de
D1 RAC.
490
Movimiento de un campo magnético
El hamiltoniano (110.3) toma la forma:
11 =
py2 p 2
1
(Px+eYf'y/c) 2 +-+-z -(µ/s)szYf'.
2m
2m 2m
-
(111.2)
Observemos ante todo que el operador Sz conmuta con h, y que el coeficiente
de Sz en (111.2) es una constante que no depende de las coordenadas. Del primer
hecho se sigue que Sz se conserva, y del segundo, que en la ecuación de SCHRODINGER
se pueden separar las variables de spin y las coordenadas. Con otras palabras, las
funciones propias se pueden representar como producto de funciones de coordenadas por funciones de spin correspondientes a valores determinados de la proyección a
de este último. Para la función de coordenadas tenemos la ecuación ,
py2 Pz2
]
1 ,.
2 +-+--(µ/s)crYf' r/; = Erf;.
[ -(Px+e.Yt'y/c)
2m
2m 2m
(111.3)
El operador (111.2) no contiene explícitamente las coordenadas x, z. Por ello
los operadores Px y Pz conmutan con h, es decir, las componentes x y z del impulso
generalizado se conservan. De acuerdo con esto buscaremos 1P en la forma:
(111.4)
Los valores propios Px y Pz toman todos los valores entre - oc y + oc. El impulso Pz
está ligado con la velocidad por la relación Pz = mvz (véase (110.9)). Así, pues,
la velocidad de la partícula en la dirección del campo puede tomar un valor arbitrario; cabe decir que el movimiento a lo largo del eje z « no se cuantifica ». El sentido físico de Px se explica más adelante.
Substituyendo (111.4) en (111.3), obtenemos la siguiente ecuación para la función x(y):
2m{E+(µ/s)cr:Y't'---im
Pz2
( e.Y/') 2
x"+(y-yo) 2) x =
/i2
2m
me
O,
donde se ha introducido la notación
yo
= -cp:,:/e:Y't'.
Esta ecuación coincide formalmente con la ecuación de ScHRODINGER (23.6) de un
oscilador lineal que vibra con la frecuencia w = lel.;t"/mc en torno del punto y= y 0 •
Podemos, por lo tanto, concluir, sin más, que la constante E+ µa.71'/s- Pz2 12m,
que representa el papel de energía del oscilador, puede tomar los valores (n+i)liw,
donde n es un número entero.
Obtenemos así la siguiente expresión para ]os niveles de energía de una partícula
Movimiento en un campo magnético homogéneo
491
en un campo magnético homogéneo:
E
=
(n+!)lelnJt'/mc+pz 2 /2m-(µ,/s)a.1'e.
(111.5)
Las correspondientes funciones de onda son (salvo un factor de normalización
constante):
tp
= e<t!A)(p~+PzZ)e-lel.1'e<11-110) /2cliHn[ v(lel.Te/cn)(y-yo)],
(111.6)
(Hn son polinomios de Hermite).
La energía representada por el primer término de (111.5) corresponde al movimiento en el plano x, y. En la mecánica clásica, éste es el movimiento sobre una
circunferencia de centro fijo. La magnitud conservativa Yo corresponde a la coordenada clásica y del centro de la circunferencia. Junto con ella se conserva también
la cantidad x 0 = (cp 11 /e.1'e)+x (es fácil ver que su operador conmuta con el hamiltoniano (111.2)). Esta cantidad corresponde a la coordenada x del centro de la circunferencia (1). Sin embargo, los operadores .x0 y .Yo no conmutan entre sí, de modo
que las coordenadas x0 y y 0 no pueden poseer simultáneamente valores determinados.
Dado que (111.5) no contiene la cantidad Px, cuyos valores forman una sucesión
continua, los niveles de energía son degenerados y su multiplicidad es la del continuo. Con todo, la multiplicidad de la degeneración se convierte en finita si el movimiento en el plano x, y queda limitado a un área grande, pero finita, S = LxLu.
El número de valores diferentes (ahora discretos) Px en el intervalo ~Px es igual
a (L 11)21Tn)tl.px. Son admisibles todos los valores Px, para los que el centro de la
órbita se encuentra dentro de S (prescindimos del radio de la órbita frente al valor
Ly, que es grande). De la condición 0 < Yo < Ly se sigue tl.px = eYl-7L 11 /c.Por lo
tanto, el número de estados (para n y Pz dados) es
eYl-7S/21rlic.
Si el dominio en que se efectúa el movimiento está también limitado en el sentido
del eje z (longitud Lz), el número de valores posibles Pz en el intervalo ~Pz es
(L,/2'"ñ)tl.p,
y el número de estados en este intervalo es igual a:
e.Ye S Lz
eYl-7 V ll.pz
21rlic 21rlPz =
(111.7)
4,r2/i2c
(1) En efecto, en el movimiento clásico a lo largo de una circunferencia de radio cmvtfe.Te (donde Vt
es la proyección de la velocidad sobre el plano x, y; véa~e tomo II, Teoría clásica de los campos, § 21)
tenemos:
Yo = -cpx/dt' = -cmvx/dt'+y.
De esta expresión resulta, evidentemente, que Yo es una coordenada del centro de la circunferencia. La
otra coordenada será:
xo = cmv11idt' +x = cp11 /d +x.
492
Movimiento de un campo magnético~
Para el electrón se da todavía una degeneración adicional: haciendo en (111.5)
µo= - lelli/2mc, obtenemos:
_donde <1 =
±
E = (n+!+a) lelli.Jll'/mc+pz2 /2m,
i; es evidente que los niveles con n, <1 =!y n+l,
(111.8)
<1 =
-
! coinciden.
PROBLEMA
Hallar las funciones de onda de una partícula en un campo magnético homogéneo en los estados en los que la partícula posee valores determinados del impulso y del momento cinético en
la dirección del campo.
Solución. En coordenadas cilíndricas e, cf,, z, con el eje z dirigido en el sentido del campo,
el potencial vector tiene las componentesAcf> = !-*'p, Az = Ap- = Oy la ecuación de SCHRODINGER
se escribe (1):
[1
1
h2
ó ( óif,) ó2if,
ó2,fa] ieñ.l/e oif, e2Je2
- - P-::- + -+ - - - - - - +--p2if,
2M p op óp
éJz2
p2 oq,2
2Mc oc/> 8Mc2
- -
= Et/i.
Busquemos una solución de la forma:
con lo que para la función radial se obtiene la ecuación
(eJ'e)2p2+-m-e.Ye
m2] R
1
[ 1
R"+-R'+
-;:(2ME-Pz2)- p
1i2
Zen
Introduciendo una nueva variable independiente
la forma
g=
[R'+R'+(-iE+/3/3
cli
p2
=
O.
(e.Jt'/2cñ)p2, escribiremos esta ecuación en
:;)R = O,
(2ME-pz2)c
=
21ie~
+lm.
Para;-+ oo, la función buscada se comporta como e·-;/2, y para;-+ O, como ;lmJ/ 2.De acuerdo
con esto, adoptaremos para la solución la forma:
R = e-t12gtmi/2w(f);
y para w(;) se obtiene la ecuación de la función hipergeométrica confluente
(1) Designamos aquí por M la masa de la partícula para distinguirla del momento cinético m y, para
concretar, suponemos que su carga es negativa y la representamos por - e. Prescindimos del término que
contiene el spin de la partícula, término no esencial para este problema.
493
Efecto Zeeman
w
= F{-(fi-tlml-!), lmJ + 1, f}.
Para que la función de onda sea finita en todo el espacio, la cantidad P- (Jm¡ + 1)/2 debe ser un
número entero no negativo ne. En estas condiciones, los. niveles de energía vienen dados por la
fórmula
e.Y/'
Pz2
E= -ñ(np+}lml-!m+!)+ - ,
Me
2M
equivalente a la fórmula (111.5).
§ 112.
Efecto Zeeman
Consideremos un átomo que se encuentra en un campo magnético homogéneo.
Su hamiltoniano es
fl
1
2m
= -
¿(Pa+e.Aa/e)2+ U(x,y, z)+-.1!'.
eli
~ sa,
me
a
a
donde la suma se extiende a todos los electrones, y U(x, y, z) es la energía de interac~
ción de los electrones entre sí y con el núcl~o (1). La suma ~ sa es el operador S
del spin total del átomo. Designando por fi O el hamiltoniano del átomo cuando
no existe campo, podemos escribir R en la forma:
f1
¿ Aa•Pa+- ¿ Aa +-.1l'.S;
eli
_
e
me
=Ho+-
e2
a
2me2
2
me
a
(recordemos que en un campo homogéneo, con el potencial vector (110.6), p y A
conmutan entre sí). Substjtuyendo aquí el valor A dado por (110.6), obtenemos:
e
H = Ho+-.1!'.
2me
¿ raXPa+-- ¿ (.1l'Xra)2+-.1l'
eli
_
.S.
e2
a
8me2
me
a
Pero el producto vectorial ra X Pa es el operador momento orbital del electrón
y la suma extendida a todos los electrones nos da el operador /iL del momento
cinético orbital total del átomo. Así, pues,
fl
=
Ho+µo{L+2S) • .1/'+(e2/8me2) ~ (.1l'Xra)2,
a
(112.1)
(µ 0 es el magnetón de Bohr). El operador
P.at = -µo(L+2S)
(112.2)
se puede considerar como el operador del momento magnético «propio» que el
átomo posee cuando no existe campo.
(1)
En este párrafo designamos la carga del electrón por - e.
494
Movimiento de un campo magnético
Supongamos que el campo magnético es tan débil que µ, 0.Tt' es pequeño comparado con las distancias entre los niveles energéticos del átomo, en particular
comparado con los intervalos de los niveles de estructura fina. Los términos segundo
y tercero de (112.1) se pueden entonces considerar como una perturbación, siendo
los niveles no perturbados las componentes individuales de los multipletes. En primera aproximación se puede prescindir del tercer término, que es cuadrático respecto del campo, frente al segundo término, que es lineal.
El campo magnético, que distingue entre todas una determinada dirección en
el espacio, rompe la degeneración de los niveles ligada a las direcciones posibles
del momento cinético total J del átomo. En virtud de la simetría axil del campo,
se conserva la proyección del momento cinético total sobre la dirección de aquél
y las diferentes componentes del término desdoblado se caracterizan por los valores
MJ de esta proyección. La energía de desdoblamiento !!,.E viene determinada por
los valores medios de la perturbación en los estados con valores dados de los números cuánticos J, L, S (1) y diferentes valores MJ:
!iE
=
µ.o(L+2S). 3t' = µ.o (J+ S). ,t'.
Si se elige la dirección del campo magnético como eje z, se tiene
(112.3)
Para el vector J, que se conserva (en el estado no perturbado), tenemos simplemente Jz = M. El valor medio Sz se puede encontrar fácilme!!te de la siguiente
manera. Por razones de simetría, es evidente que el valor medio S es un vector dirigido a lo largo del único vector que se conserva, el J. Por ello se puede escribir
S = const. J. Multiplicando ambos miembros de esta igualdad por J, obtenemos
J. S =J. S = const. J2, lo que permite determinar la constante. Así, pues,
(112.4)
(hemos prescindido del signo de valor medio sobre el producto J · S, ya que este
producto posee un valor determinado en la aproximación de Russell-Saunders).
J 2 es igual aquí a su valor propio J(J + 1) y el valor propio de J. Ses igual a (véase
(31.3)):
J. S
= !{](] + 1)-L(L+ l)+S(S+ 1)}.
Reuniendo las expresiones obtenidas y substituyendo en (112.3), encontramos
la siguiente expresión final para la energía de desdoblamiento:
MJ = -],-]+1, ... ,j,
(112.5)
g = l+[](J+l)-L(L+l)+S(S+l)]/2](]+1)
(112.6)
donde
(1)
Suponemos que para los términos atómicos vale el acoplamiento Rusell-Saunders.
Efecto Zeeman
495
es el llamado factor de Landé o factor giromagnético. El desdoblamiento de los niveles en un campo magnético se llama efecto Zeeman. Vemos así que el campo magnético rompe la degeneración por completo (con tal que g =/= O) y que la magnitud
del desdoblamiento es proporcional al campo.
El factor de Landé para las diferentes componentes de un multiplete toma valores comprendidos entre los que corresponden a J = L ± S(si L > S):
> g > (L-2S+l)/(L-S+l),
valores correspondientes a J = S ± L (si L < S):
(L+2S)/(L+S) > g > (28+2-L)/(S-L+ 1).
(L+2S)/(L+S)
o entre los
Si el spin es nulo (S = O, J = L), g se reduce simplemente a la unidad (1); pero
si L = O, se tiene g = 2. Para J = O (lo que es posible solamente cuando S = L)
la expresión (112.6) resulta indeterminada, pero el efecto, claro está, no se produce,
dado que para J = O tenemos también MJ = O. Indicaremos asimismo que el
desdoblamiento lineal respecto del campo puede también no existir para términos
con J =I= O debido a que se anule g; por ejemplo, g = O para los términos con
L = 2S- l, J = S-1 (S> 1).
La derivada -o~E/o.JF es el valor medio del momento magnético del átomo (2).
Vemos así que un átomo que se encuentra en un estado con valor determinado MJ
de la proyección del momento cinético total sobre una cierta direcc10n posee 1u1
momento magnético medio -µ 0gMJ en esta dirección.
Si el spin y el momento orbital del átomo son nulos (S = L = O), el segundo
término de (112.1) no desplaza los niveles ni en la primera aproximación ni en las
de orden superior (ya que se anulan todos los elementos de matriz de L y S). Por
ello, todo el efecto está ligado en este caso al tercer término de ( 112.1 ), y en la primera aproximación de la teoría de perturbaciones el desplazamiento de un nivel
es igual al valor medio
e2
!iE = ~(~Xra) 2 •
8mc2 ~
(112.7)
a
Haciendo (~Xra) 2 = 22rª 2 &:,n20, donde () es el ángulo formado por fa y~'
y promediando respecto de las direcciones de fa, obtenemos sen 2 0 = 1-cos20 = 2/3
(teniendo en cuenta que la función de onda de un estado con L = S == O presenta
simetría esférica). De esta manera,
(1) El desdoblamiento dado por la fórmula general (112.5-6) se llama a veces efecto Zeeman anómalo.
Esta poco afortunada terminología surgió históricamente en relación con el hecho de que, antes de descubrirse el spin del electrón, se consideraba como efecto normal el descrito por la fórmula (112.5) con g = l.
( 2)
Véase el problema del § 11.
496
Movimiento de un campo magnético
e2
1
D..E = --.Jfe2
12mc2
_
ra 2
•
( 112.8)
a
La derivada - odE/ oJII" es el momento magnético que adquiere el átomo en el
campo magnético. Escribiéndolo en la forma xJf', podemos considerar la cantidad
e2
X= - - -
6mc2
¿-
Ta2
(112.9)
a
como susceptibilidad magnética del átomo (P. LANGEVIN, 1905). Esta es negativa,
es decir, el átomo con L = S = O es diamagnético (1).
En cambio, si J = O, pero S = L -=f= O, el desplazamiento del nivel, lineal respecto del campo, es también nulo, pero el efecto cuadrático de la segunda aproximación en la perturbación - IJ,at • .Y{' predomina sobre el efecto (I I 2. 7) (2). Esto se
debe a que, de acuerdo con la fórmula general (38.9), la corrección al valor propio de la energía viene determinada en segunda aproximación por una suma de
expresiones en cuyos denominadores aparecen las diferencias entre los niveles
no perturbados de la energía - en el presente caso, los intervalos de estructura
fina del nivel, que son cantidades pequeñas. En el§ 38 se hizo notar que la corrección de segund.J orden relativa al nivel normal es siempre negativa. Por consiguiente,
el momento magnético en el estado normal será una cantidad positiva, es decir,
un átomo que se encuentra en el estado normal con J = O y L = S -=f= O, es paramagnético.
En campos magnéticos intensos, cuando µ 0 Jf' es comparable con los intervalos
de estructura fina o los supera, el desdoblamiento de los niveles difiere del predicho
por la fórmula (I 12.5-6); este fenómeno se llama efecto Paschen-Back.
El cálculo de la energía de desdoblamiento es muy simple cuando el desdoblamiento Zeeman es grande comparado con los intervalos de estructura fina, pero,
claro está, es como antes pequeño respecto de las distancias entre los distintos
multipletes (de modo que en el hamiltoniano (112.1) es posible prescindir del tercer
término frente al segundo) (3J. Cea otras palabras, la energía en un campo magnético
es considerablemente mayor que la interacción spin-órbita. Por ello es posible
(1) Indicaremos que para el cálculo del valor medio del cuadrado de la distancia de los electrones
al núcleo es imposible utilizar el modelo de Thomas-Fermi. Aunque la integral Jnr 2 dr con la densidad
de Thomas-Fermi n(r) también converge, su convergencia es demasiado lenta, debido a lo cual los valores
que se obtienen difieren considerablemente de los valores experimentales.
{2) Para S = L '4= O, los elementos de matriz no diagonales de Lz, Sz para las transiciones S, L, J-+ S,
L, J :!: 1, son, en general, diferentes de cero.
( 3)
En los casos intermedios, cuando el efecto del campo magnético es comparable con la interacción
spin-órbita, no es posible calcular el desdoblamiento en forma general (para el caso S = ! , el cálculo se
efectúa en el problema 1).
Efecto Zeeman
497
prescindir, en primera aproximación, de esta última. Se conserva entonces no solamente la proyección del momento cinético total sobre el eje z, sino también las
proyecciones ML y Ms del momento cinético orbital y del spin, de modo que el
desdoblamiento viene determinado por la fórmula
(112.10)
El desdoblamiento de multiplete se superpone al desdoblamiento en el campo
magnético, y viene determinado por el valor medio del operador AL . S (72.4)
respecto del estado con los valores dados ML, Ms (consideramos aquí el desdoblamiento de multiplete vinculado a la interacción spin-órbita). Para un valor dado
de una de las componentes del momento cinético, los valores medios de las otras
dos son iguales a cero. Por lo tanto, L . S = M L M 8 , de modo que en la aproximación siguiente la energía de los niveles viene dada por la fórmula
(112.11)
El cálculo del desdoblamiento Zeeman en el caso general de un tipo cualquiera
de acoplamiento (no ya del tipo Russell-Saunders) no es posible. Cabe solamente
afirmar que el desdoblamiento (en un campo débil) es lineal respecto del campo
y proporcional a la proyección M J del momento cinético total, es decir, que tiene
la forma:
(112.12)
donde gnJ son ciertos coeficientes característicos del término dado (designamos
por n el conjunto de los números cuánticos que caracterizan el término, aparte J).
Aunque tampoco estos coeficientes se pueden calcular cada uno por separado,
sí resulta factible obtener una fórmula, útil en las aplicaciones, que determina la
suma ~ g,,,J extendida a todos los estados posibles del átomo con una configuración
electró';iica dada y un momento cinético total dado.
Las cantidades gnJMJ son los elementos de matriz diagonales de la magnitud
Lz+2Sz calculados mediante las funciones de onda "PnJMJ· En cambio, las cantidades
gsbJM.1 (donde gsLJ es el factor de Landé (112.6) en el acoplamiento Rusell-Saunders) son los elementos de matriz diagonales del mismo operador calculado mediante
las funciones 1PSLJMJ· Las funciones "PnJMJ con valores dados J, M.J se pueden
representar como combinaciones lineales, ortogonales entre sí, de las funciones
'1/'SLJMJ con los mismos valores J, MJ. La transformación lineal de un sistema
ortogonal de funciones en otro sistema asimismo ortogonal es unitaria y deja invariante la suma de los elementos diagonales de una matriz (véase § 12). De aquí
deducimos que
o bien, suprimiendo MJ (teniendo en cuenta que gnJ y gs,,J no dependen de MJ):
498
Movimiento de un campo magnético
""I:. gnJ
n
=
(112.13)
""I:. gsLJ.
S,L
La suma se extiende a todos los estados, con el valor dado J, que son posibles para
la configuración electrónica dada. Esta es precisamente la relación buscada.
PROBLEMAS
l.
Determinar el desdoblamiento de un término con S
=
1/2 en el efecto Paschen-Back.
Solución. El campo magnético y la interacción spin-órbita deben tenerse en cuenta simultáneamente al aplicar la teoría de perturbaciones, es decir, el operador de perturbación es de la
forma (1):
P-
= A
L.s +µo(Lz+2Sz)~.
Como funciones de onda de partida para la aproximación de orden cero eligiremos las funciones
correspondientes a los estados con valores determinados L, S = t, ML, Ms (Les un valor dado,
M1, = - L, ... , L; M s = ± t). En los estados excitados se conserva solamente la suma
MJ = ML+Ms (V conmuta con lz), de modo que a las componentes del término desdoblado
se pueden atribuir valores determinados de MJ.
Los valores M J = L + ! y M J = - (L + ! ) se pueden obtener de una manera solamente, con
ML = L, Ms = ! y ML = -L, Ms = - !, respectivamente. Por lo tanto, las correcciones a la
energía de los estados con estos valores de MJ son iguales, simplemente, a los elementos de matriz
diagon'ales (MLMs: V:lvhMs) con los valores indicados de ML y Ms. Los demás valores MJ se
pueden obtener de do~ maneras: ML = MJ -!, Ms = ! y ML = MJ + !. Ms =-!.A cada MJ
corresponden ahora dos valores diferentes de la energía, que se determinan a partir de la ecuación
secular formada con los elementos de matriz para las transiciones entre estos dos estados. Los
elementos de matriz L·S se calculan multiplicando directamente las matrices (ML!L[M'L) y
(Ms!S'.M's) y son iguales a:
Cuando no existe campo magnético, el término es un doblete, con una distancia entre componentes e= A(L+!) (véase (72.6)). Eligiremos el más bajo de estos niveles como origen de energía. Las fórmulas finales para los niveles EJtJ en un campo magnético tienen entonces la forma:
EL+i =
MJ
E+µo~(L+ 1),
= L-l, ... , -L+l.
(1) En V no se incluye el tér~ino proporcional a (L ,_$) 2 (interacción spin-spin). Sin eTl).bargo, hay
que tener presente que para el spin S = ~ la expresión (L. S) 2 se reduce a la expresión L. S, en virtud
de las propi~dades específicas de las matrices de Pauli (véase § 55) y queda así incluida en la fórmula escrita para V.
499
Efecto Zeeman
Para valores µ, 0 :Yt'/€ pequeños se obtiene
EMJ+
=
E+µ.o:Y/'MJ. 2(L+ 1)/(2L+ 1),
EMJ -
=
µ.o:Y/'MJ. 2L/(2L+ 1),
de acuerdo con las fórmulas (112.5-6) (en las que hay que hacer S
grandes de µ,o.tf /E se obtiene
=
!, J = L ± i). Para valores
de acuerdo con (112.11).
2. Determinar el desdoblamiento Zeemann de los términos de una molécula diatómica en
el caso a.
Solución. El momento magnético debido al movimiento de los núcleos es muy pequeño comparado con el momento magnético de los electrones. Por consiguiente, la perturbación del campo
magnético debe escribirse para una molécula de la misma manera que para un sistema de electrones, es decir, como antes, en la forma P' = µ, 0.Jft'. (L+2S), donde L, S son los momentos
cinéticos orbital y de spin de los electrones.
Promediando la perturbación respecto del estado electrónico, obtenemos en el caso a:
El valor medio de nz respecto de la rotación de la molécula es el elemento de matriz diagonal
(JMJ!nz!JMJ) = 0.MJ/J(J+ 1) (según (87.1) con J, O. en vez de K, A). De esta manera el desdoblamiento buscado es igual a:
0(2Q-A)
ó.E = µo
3.
J(J+l)
MJ:Yt'.
El mismo problema en el caso b.
V1~J
Solución. Los elementos de matriz diagonales
que determinan el desdoblamiento que
se busca se podrían calcular de acuerdo con las reglas generales expuestas en el§ 87. Sin embargo,
es más fácil efectuar el cálculo de una manera más intuitiva. Promediando el operador de perturbación respecto de los estados orbital y electrónico, obtenemos
(el operador de spin no queda afectado por este promedio). Promediemos luego respecto de la
rotación de la molécula (el valor medio de nz se determina por la fórmula (87.1)):
Finalmente, promediemos respecto de la función de onda de spin; después de todo este proceso,
los valores medios de los vectores pueden estar dirigidos tan sólo en el sentido del único vector
que se conserva, en el del momento cinético total J. Obtenemos, por consiguiente (cf. (] 12.4))
J
µo:Y/' [ A2
](]+ 1) K(K+ 1f .J+zs .J MJ,
500
Movimiento de un campo magnético
o, finalmente:
t,.E
=
µ,o
{ A2
](]+1) 2K(K+1FU+l)+K(K+l)-S(S+l)]+
+[](] + 1)-K(K+ l)+S(S+ 1)]
)~MJ.
4. Un átomo diamagnético se encuentra en un campo magnético exterior .Jf'. Determinar
la intensidad del campo magnético inducido en el centro del átomo.
Solución. Para S = L = O la perturbación lineal respecto del campo no aparece en el hamiltoniano y, por lo tanto, en la función de onda del átomo no se presenta la corrección de primer
orden de dicho campo magnético. La variación de la corriente electrónica j' inducida por el campo
magnético exterior en el átomo se traduce (en la misma primera aproximación respecto de .Jf')
tan sólo en la adición del término (e/me) A al operador velocidad de los electrones. Tenemos,
por lo tanto (1):
j' = -p(e2/mc)A= -p(e2/2mc)3t'xr,
(1)
donde (! es la densidad electrónica en el átomo. La intensidad del campo magnético, debido a esta
corriente adicional, en el centro del átomo es (2)
J't'ind
f
r
= - -1 j'x
--dV.
e
r3
Substituyendo aquí (1) y promediando bajo el signo de integración respecto de las direccciones
de r, obtenemos:
.Yeind
e2
3mc2
= - --~
f
p
-dV
T
(2)
donde <f,6 <0> es el potencial del campo creado por la capa electromca del átomo er, el centro del
mismo.
En el modelo de Thomas-Fermi c/>e(O)
.'Yetnd
-1 ·80Z4/3meªJñ2 (véase (70.8)) de modo que
= -0·60(e2/Jic)2Z4/3;Ye
=
§ 113.
=
-3·2 X 10-5Z4/3;Ye.
El spin en un campo magnético variable
Consideremos una partícula eléctricamente neutra que posee momento magné(') Esta expresión corresponde a la precesión de Larmor de las capas electrónicas del átomo en torno
de la dirección del campo magnético exterior (véase tomo IT, Teoría clásica de los campos, § 45).
( 2)
Véase la nota en la pág. 140.
El spin en un campo magnético variable
501
tico y que se encuentra en un campo magnético homogéneo, pero variable (en el
tiempo). Puede tratarse bien sea de una partícula elemental (por ejempio, un neutrón), o de una partícula compuesta (un átomo). El campo magnético se supone
tan débil que la energía magnética de la partícula en el campo es pequeña comparada
con los intervalos entre sus niveles energéticos. Cabe entonces considerar el movimiento de la partícula como un todo para un estado interno dado de la misma.
Sea s el operador del momento cinético « propio » de la partícula - el operador
de spin para una partícu]a elemental o el momento cinético total J en el caso de un
átomo. El operador momento magnético lo representaremos en la forma (110.2).
El hamiltoniano para el movimiento de una partícula neutra considerada en conjunto se escribirá en la forma (1):
fJ = -(µ/s)s .l/e.
(113.1)
En un campo homogéneo este operador no contiene las coordenadas explícitamente (2). Por ello la función de onda de la partícula se descompone en el producto
de una función de las coordenadas por una función de spin. De ellas la primera es
simplemente la función de onda del movimiento libre; en lo que sigue tan sólo nos
interesa así la parte que depende del spin. Demostraremos que el problema correspondiente a una partícula con momento cinético arbitrario s se puede reducir al
problema más simple que plantea el movimiento de una partícula con spin l (E. MAJORANA). Para ello basta seguir el método que aplicamos en el § 57. Esto es, en vez
de una partícula con spin s, se puede introducir formalmente, en efecto, un sistema
de 2s « partículas » de spin 1. El operador § se representa entonces como suma
:I: s0 de los operadores de spin de estas «partículas», y la función de onda, en forma
de producto de 2s espinores de primer orden. En estas condiciones, el hamiltoniano
(113.1) se descompone en la suma de 2s hamiltonianos independientes:
fJ
= Lfla,
a
fla = -(µ/s).Ye. Sa,
(113.2)
de modo que el movimiento de cada una de las 2s « partículas » se determina independientemente del de las demás. Una vez hecho esto, basta introducir de nuevo
las componentes de un espinor simétrico arbitrario de orden 2s en vez de los productos de las componentes de 2s espinores de primer orden.
PROBLEMAS
1. Determinar la función de onda de spin de una partícula neutra de spin l que se encuentra
en un campo magnético homogéneo cuya dirección es constante, pero cuyo valor absoluto varía de
acuerdo con ~~ ley arbitraria :Yt' = :Yt'(t).
( 1)
Escribimos solamente aquella parte del hamiltoniano que depende del spin.
Estos razonamientos se pueden aplicar también al caso en que una partícula (incluso cargada)
se mueve en un campo magnético no homogéneo, con tal que quepa considerar su movimiento como cuasiclásico. El campo magnético, que cambia al moverse la partícula a lo largo de su trayectoria, se puede
considerar entonces simplemente como una función del tiempo y aplicar a la variación de la función de onda
de spin las mismas ecuaciones.
( 2)
502
Movimiento de un campo magnético
La función de onda será un espinor "Pv que satisface la ecuación de onda
Solución.
(1)
Eligiendo la dirección del campo como eje z, escribiremos esta ecuación en términos de componentes espinoriales:
De aquí se sigue
Las constantes c1, c2 deben determinarse a partir de las condiciones iniciales y de la condición de
normalización ivi[ 2+ ¡1p2¡ 2 = 1.
2. El mismo problema en el caso de un campo magnético homogéneo cuyo valor absoluto
es constante, pero cuya dirección gira uniformemente (con velocidad angular w) en torno del
eje z formando con él el ángulo O.
El campo magnético tiene las componentes
Solución.
.Yl7x
=
.Yl7 y = .Yl7 sen Bsen wt,
.Yl7 sen B cos wt,
.Yl7z
=
.Yl7 cos B,
y a partir de ( 1) obtenemos el sistema de ecuaciones
J1 =
iwH(¡/11 cos B+¡/¡2e-iwt senB),
¡/1 2 = iwH(ip1etwt senB-¡/12 cos B),
donde
wH=
µJ('/ñ. La substitución
if,l
= e-H<»tef,l, y,2 = eiiwtef,2
reduce estas ecuaciones a un sistema de ecuaciones lineales con coeficientes constantes, resolviendo el cual obtenemos:
¡/12 = 2wHeiwt/2 senB [
C¡
eiO.t/2
n+w+2wH cos B
+ - - - -C2- - - -
iUt/2 ] ,
n-w-2wH cos B
donde
§ 114.
La densidad de corriente en un campo magnético
Deduzcamos ahora la expresión cuántica de la densidad de corriente que corresponde al movimiento de partículas cargadas en un campo magnético.
Partiremos de la fórmula
SH = -(1/c)
f j .oA dV,
(114.1)
Densidad de corriente en un campo magnético
503
(j es la densidad de corriente) que determina el cambio de la función de HAMILTON
de un sistema de cargas distribuidas en el espacio debido a una variación del potencial
vector (1). En mecánica cuántica esta expresión debe aplicarse al valor medio del
hamiltoniano de la partícula cargada:
H=
f 'Y*[(f,-eA/c)2/2m-(µ./s)~. s]'Y dV.
Efectuando la variación y teniendo en cuenta que S.71'
que:
S0 = f
=
(114.2)
rot bA, encontramos
'Y*[-__!_(f, .8A+8A.f,)+_::_A.oAJ'Y dV-(µ,/s)f rot oA.'Y*s'YdV.
2mc
mc2
(114.3)
El término
p . SA lo
transformaremos integrando por partes:
J'Y*f> .sA 'Y dV =
=
-
in
f
in 'Y*v(oA. 'Y) dV
JsA.'Yv'Y* dV
(como de ordinario, la integral extendida a una superficie situada en el infinito es
nula). La integración por partes la aplicaremos también al último término de (114.3),
utilizando la conocida fórmula del análisis vectorial:
a. rot b
= -div(axb)+b.
rot a.
La integral del término en div se anula, de modo que queda:
f 'Y*s'Y. rot oA dV f oA. rot ('F*s'Y) dV.
=
Finalmente obtenemos el resultado:
8H_ =
f
ien oA.('Yv'Y*-'F*v'Y) dV+e2
2mc
mc2
--
-(µ./ s)
f
A.oA'Y'Y* dV-
f oA • rot ('F*s'Y) d V.
l 1 ) La función cte LAGRANGE para una carga en un campo magnético contiene el término e/e v·A o
bien, representando la carga como repartida en el espacio, 1/cJj· Ad V. El cambio de la función de LAGRANGE en una variación de A es igual, por consiguiente, a:
oL = (1/c) f j .oA dV.
Pero la variación infinitesimal de la función de HAMIL TON es igual a la variación de la función de LAGRANGE
cambiada de signo (véase tomo 1, Mecánica, § 40).
504
Movimiento de un campo magnético
Comparando esta expresión con (114.1) se encuentra la siguiente expresión para
la densidad de corriente:
(114.4)
Hay que subrayar que aunque esta expresión contiene en forma explícita el potencial vector, es con todo completamente unívoca, como era de esperar. Es fácil convencerse de ello mediante un cálculo directo, recordando que a la vez que se aplica
la transformación (110.7) al potencial vector, hay que aplicar también la transformación (110.8) a la función de onda.
La expresión (114.4) es el valor medio de la corriente. Cabe considerarla como
elemento de matriz diagonal de un cierto operador - el operador densidad de corriente. Es entonces posible determinar también los elementos de matriz no diagonales del mismo. Dichos elementos son iguales, evidentemente, a:
ieli
e2
jnm = -::-('Ym'v'Yn*-'Yn"''v'Ym)--A'Ym'Yn*+
2m
me
+(µ./s)c curl('Yn "'s'Ym),
(114.5)
CAPÍTULO
XVI
ESTRUCTURA DEL NÚCLEO ATÓMICO
§ I 15.
lnvariancia isotópica
No existe todavía una teoría acabada de las llamadas fuerzas nucleares, es decir,
de las fuerzas que actúan entre las partículas del núcleo (los nucleones) y los mantienen juntos formando el núcleo atómico. Debido a ello, al describir las fuerzas nuclares será necesario acudir a la experiencia en mayor medida de lo que hubiera sido
necesario si existiera una teoría coherente.
Los dos tipos de partículas a que pertenecen los nucleones difieren, ante todo,
por sus propiedades eléctricas, ya que los protones (p) tienen carg~ positiva y los
neutrones (n) son eléctricamente neutros. A la vez, unos y otros, tienen el mismo
spin, t, y sus masas son casi iguales (la masa del protón es igual a 1836, 1 veces la
masa del electrón, y la del neutrón es 1838,6 veces dicha masa). Esta coincidencia
no es puramente casual. A pesar de la diferencia en sus propiedades eléctricas, el
protón y el neutrón son partículas muy parecidas entre sí y esta coincidencia posee
una importancia fundamental.
El hecho es que, prescindiendo de las fuerzas eléctricas relativamente débiles,
las füerzas de interacción entre dos protones son muy parecidas a las fuerzas que
actúan entre dos neutrones. Esta propiedad se llama simetría de carga de las fuerzas
nucleares (1).
En tanto se mantenga esta simetría, cabe afirmar, en particular, que los sistemas
de dos protones (pp) y de dos neutrones (nn) poseen estados iguales en sus propiedades.
Para ello es esencial, claro está, el que tanto los protones como los neutrones obedecen a la misma estadística (la estadística de Fermi) y que, en consecuencia, para
los sistemas pp y nn son admisibles solamente los estados con igual simetría de las
funciones de onda "P(r1, a 1 ; r 2, a 2) - funciones antisimétricas respecto de la permutación simultánea de las coordenadas y de los spins de las partícalas.
(1) Dicha propiedad se manifiesta, en particular, en las propiedades muy parecidas (energías de enlace,
espectro energético, etc.) de los llamados núcleos espejo, es decir, de los núcleos que difieren uno de otro
en la substitución de todos los protones por neutrones y recíprocamente.
506
Estructura del núcleo atómico
La simetría con relación a la carga resulta ser, sin embargo, tan sólo una de las
manifestaciones de una semejanza física más profunda entre protones y neutrones
que ha recibido el nombre de invariancia isotópica. Esta ley más profunda traduce
la existencia de una analogía no sólo entre los sistemas pp y nn (que se obtienen
uno de otro substituyendo todos los protones por neutrones y recíprocamente),
sino también con el sistema pn, formado por partículas diferentes. Claro está que
no puede aquí darse una semejanza completa, ya que los estados posibles del sistema
pn, en tanto que constituido por partículas no idénticas, en ningún caso deben
quedar limitados a los estados con funciones de onda antisimétricas. Sin embargo,
el hecho es que entre los estados posibles del sistema pn existen estados que casi
exactamente coinciden en sus propiedades con los estados de los sistemas de dos
nucleones idénticos (1); estos estados se describen, naturalmente, por funciones de
onda antisimétricas (los demás estados del sistema pn, en cambio, se describen
mediante funciones de onda simétricas y no existen para los sistemas pp y nn).
La invariancia isotópica, como la simetría de carga, es válida solamente si se
prescinde de la interacción electromagnética. Otra razón de su carácter aproximado
es la diferencia entre las masas del neutrón y del protón, si bien sea pequeña; que se
diese la simetría exacta entre neutrones y protones supondría, claro está, la exacta
coincidencia de sus masas ("l La invariancia isotópica se cumple de hecho con
buena aproximación en los núcleos no demasiado pesados, pero a medida que
aumenta su peso, disminuye la precisión debido a que crece en importancia el papel
relativo de la interacción coulombiana de los protones en el núcleo (interacción
que crece con el cuadrado del número atómico).
Para describir la invariancia isotópica es posible introducir un formalismo que
resulta cómodo. Se llega a él de manera natural observando que la invariancia
isotópica se limita a establecer la posibilidad de clasificar los estados de un sistema
de nucleones según la simetría de sus funciones de onda 1J) dependientes de las coordenadas y de los spins, con independencia de cuál sea el tipo de nucleón, de los dos
posibles, a los que aquéllos pertenecen. Por consiguiente, el formalismo que buscamos debe proporcionar la posibilidad de introducir un nuevo número cuántico
para caracterizar los estados del sistema de tal manera que con él quedaría determinada de manera unívoca la simetría de las funciones 1J). Pero con una situación
análoga nos encontramos ya al considerar las propiedades de un sistema de partículas de spin l. Vimos, en efecto (véase§ 63), que dar el spin total S de un tal sistema
determina unívocamente la simetría de su función de onda de las coordenadas, cf,,
con independencia de cual sea el valor de las proyecciones a de los spins de cada una
(1) Este necno fue puesto de manifiesto por primera vez por G. BREIT, E. U. CoNDON y R. D. PRESENT
en 1936, basándose en un análisis de los datos experimentales relativos a la dispersión de neutrones y
protones por protones.
(2) Hay que pensar que, en realidad, también esta diferencia entre las masas del neutrón y del protón
es de origen electromagnético.
lnvariancia isotópica
507
de las partículas de entre los dos valores posibles (± !).
Es natur~l, por lo tanto, que para describir formalmente la invariancia isotópica
sea necesario considerar el neutrón y el protón como dos estados de carga diferentes
de una misma partícula (el nucleón), estados que difieren en el valor de la proyección
de un nuevo vector, r, que por sus propiedades formales es análogo al vector de
spin t. Esta nueva magnitud, que se suele llamar spin isotópico (1), es un vector de
un cierto espacio auxiliar llamado espacio isotópico t r¡, C (que nada tiene que ver,
claro está, con el espacio real). Su significado físico sigue siendo, sin embargo, poco
claro y solamente se podrá poner de manifiesto como resultado de la construcción
de una teoría consecuente.
La proyección del spin isotópico del nucleón sobre el eje Cpuede tener tan sólo
dos valores re= ±!. El valor +~ se suele ~tribuir al protón, y el valor - ! , al
neutrón. Los spins isotópicos de los nucleones se componen, para formar el spin
isotópico total del sistema, de acuerdo con las reglas de composición de los spins
ordinarios. En estas condiciones, la componente C del spin isotópico total del sistema es igual a la suma de los valores re de todas las partículas que lo constituyen.
Para un núcleo con un número Z de protones (es decir, de número atómico Z),
un número N de neutrones y un peso A = Z +N, tenemos:
T¡;
=
~T¡;
= i(Z-N) = Z-!A,
(115.1)
es decir, Te determina, para un número dado de nucleones, la carga total del sistema.
Es claro, por consiguiente, que la cantidad Te se conserve rigurosamente, ya que
esta conservación expresa simplemente la conservación de la carga.
El valor absoluto T del spin isotópico total del sistema determina, en cambio,
la simetría de la « componente de carga » w de la función de onda del sistema, de
manera análoga a como el spin total S determina la simetría de la función de onda
de spin. Por la misma razón, dicha magnitud determina también la simetría de la
función de onda '1./J de las coordenadas y del spin (es decir, de la función de onda
ordinaria), ya que la función de onda total del sistema de nucleones (es decir, el
producto 'I.JJW) debe poseer una determinada simetría: en efecto, como para toda
asamblea de fermiones, dicha función debe ser antisimétrica con relación a la permutación simultánea de las coordenadas, de los spins y de las « variables de carga »
Tt de las partículas. Por lo tanto, la existencia de una determinada simetría para
las funciones de onda '1./J de un sistema cualquiera de nucleones se expresa precisamente, en el esquema expuesto, por la conservación de la cantidad T.
Podemos también decir, con otras palabras, que la invariancia isotópica traduce
la invariancia de las propiedades del sistema respecto de rotaciones cualesquiera
(l)
por B.
Fue introducida por W. HEISENBERG (1932) y aplicada a la descripción de la invariancia isotópica
y E. u. CONDON (1936).
CASSEN
Estructura del núcleo atómico
508
en el espacio isotópico. Los estados que difieren solamente en el valor de Tt (para
valores dados de T y de los demás números cuánticos) coinciden en todas sus propiedades. En particular, la simetría de carga - la invariancia de las propiedades
del sistema con relación al cambio de todos los neutrones por protones y recíprocamente -, que es un caso particular de la invariancia isotópica, se describe en este
modelo como invariancia respecto del cambio de signo simultáneo de todos los rt,
es decir, respecto de una rotación, en el espacio isotópico, de ángulo 180º en torno
de un eje situado en el plano~' r¡.
Observemos también que la violación evidente de la invariancia isotópica por
la interacción coulombiana es clara en el esquema considerado, incluso desde un
punto de vista formal: la interacción de Coulomb depende de la carga, es decir,
de las componentes C del spin isotópico, componentes que no son invariantes respecto de las rotaciones en el espacio~' r¡, (.
Consideremos. por ejemplo, un sistema de dos nucleones. Su spin isotópico
total puede tomar los valores T = 1 y T = O. Para T = 1 son posibles los valores
Tt = 1,0, - 1 de la proyección Tt;. A estos valores corresponden, según (115.1),
los valores de la carga 2, 1, O, es decir, el sistema con T = 1 se puede realizar como
sistema pp, pn y nn. La parte de carga w de la función de onda con T = 1 es simétrica
(de manera análoga a como al valor del spin S = 1 corresponde una función de
spin simétrica, cf. § 62). Por ello al valor T = 1 corresponden estados con funciones
de onda ordinarias, 'l/J, antisimétricas. Para T = Oes posible solamente el valor Tt = O
y la correspondiente función de onda w es anti simétrica; a este caso corresponden,
por consiguiente, los estados del sistema pn con funciones de onda 'l/J simétricas.
Al spin isotópico corresponde el operador r que actúa sobre la variable de carga
en la función de onda de manera análoga a como el operador de spin s actúa
sobre la variable de spin a. Vista la analogía formal completa entre uno y otro,
los operadores T6 11
se expresan por las mismas matrices de Pauli (55.6) que los
operadores sx, sy, Sz.
rt
,r ,-r,
He aquí algunas combinaciones de estos operadores que poseen un simple sentido intuitivo. La suma
es un operador que al ser aplicado a una función de onda característica de un neutrón la transforma en una función de onda de protón, y que al aplicarlo a una función de onda de protón, da como resultado el valor cero. Análogamente, el operador
lnviiriancia isotópica
509
transforma un protón en neutrón y « destruye » al neutrón. Finalmente, el operador
conserva una función de protón y destruye un neutrón: multiplicado por e, cabe
llamarlo operador de carga del nucleón.
Veamos aun cómo .es posible expresar, en función de los operadores 'TI, 'T2
del spin isotópico de dos partículas, el operador -¡,· que representa la permutación
de una por otra. Por definición, el resultado de aplicarlo a la función de onda del
sistema de dos partículas 1P(r1, a1 ; r2 , a2 ) consiste en la permutación de las coordenadas y de los spins de dichas partículas, es decir, en la permutación de las variables
r1, a 1 y r2 , a2 entre sí. Los valores propios de este operador son iguales a ± 1 y resultan de la aplicación a una función 1P simétrica o anti simétrica:
P,J,sim = if,&,m; P,J,ant = -,J,ant•
Vimos antes que a las funciones
V'sim
(115.2)
y V'ant corresponden funciones de carga
wr con valores del spin isotópico total T = O y T = 1. Por ello, si queremos representar el operador P en una forma en la cual actúa sobre las variables de carga,
dicho operador debe poseer las propiedades:
Pwo = wo,Pw1 =
-w1,
(115.3)
A estas condiciones satisface el operador
1-'Í\ como es fácil ver observando que
,A
wr es la función propia del opendor T2 que corresponde al valor propio T(T + 1).
Finalmente, haciendo T = r 1 +r2 y teniendo en cuenta que r¡2 y rl poseen los mismos
valores determinados r(r+ 1) = !, encontramos la expresión 1P final buscada (1)
p = 1-T2 =
-t-2't"1.'t"2.
(115.4)
Para los elementos de matriz de las diferentes magnitudes físicas de un sistema
de nucleones valen determinadas reglas de selección relativas al spin isotópico
(L. A. RADICATI, 1952). Sea F una magnitud (de cualquier carácter tensorial) que
posea la propiedad aditiva, en el sentido de que ..su valor para un sistema es igual
a la suma de los valores correspondientes a cada uno de los nucleones por separado.
Representemos el operador de una tal magnitud en la forma
donde la suma se extiende a todos los protones y neutrones del sistema. Esta expresión se puede escribir de otra forma, que equivale idénticamente a la primera:
1
( )
Un operador de este tipo, pero formado con los spins ordinarios de las partículas, lo encontramos
ya en los problemas del § 62.
Estructura del núcleo atómico
510
F = ~(!++,)fp+ ~(f-f,)Ín
= p:. (/p+fn)+¿¡(/p-fn)+,,
(115.5)
donde la suma en cada término se extiende a todos los nucleones (tanto los protones
como los neutrones). El primer término en (115.5) es un escalar, el segundo es la
componente ( de un vector en el espacio isotópico. A ellos se aplican, por consiguiente, las mismas reglas de selección relativas al spin isotópíco que las que valen
para los escalares y los vectores en el espacio ordinario respecto del momento cinético orbital. Por ejemplo (véase el § 29), un escalar isotópico admite solamente
transiciones sin cambio de T; la componente ( de un vector isotópico posee elementos de matriz únicamente para las transiciones en las que liT = O, ± 1, resultando
además prohibidas las transiciones con liT = O entre estados con Tr; = O, es decir,
para sistemas con números iguales de neutrones y protones (la última regla se sigue
de que el elemento de matriz de una transición con liT = O es proporcional a Tt
- véase (29.7)).
Así, para el momento di polar del núcleo, el papel de las magnitudes /p lo representan los productos er y fn = O. El primer término en (115.5) es entonces
fe¿¡r = (e/2m) ¿¡mr,
es decir, resulta proporcional al vector posición del centro de masas y se puede
reducir a cero mediante una elección adecuada del origen de coordenadas; con
otras palabras, el momento dipoJar del núcleo se reduce a la componente ( del
vector isotópico.
§ 116.
Fuerzas nucleares
Las fuerzas nucleares específicas que actúan entre los nucleones se caracterizan,
ante todo, por su pequeño radio de acción; dichas fuerzas disminuyen exponencialmente a distancias que son del orden de 1,5 · 10-13 cm.
En el límite no relativista, cabe afirmar que las fuerzas nucleares no dependen
de las velocidades de los nucleones y que derivan de un potencial. Sin embargo,
no hay que perder de vista que para los núcleos reales la exactitud de la aproximación no relativista no es muy grande, ya que las velocidades de los nucleones en
el núcleo son de] orden de t de la velocidad de la luz (véase más adelante).
La energía potencial U de interacción de dos nucleones depende no solamente
de su distancia mutua r, sino también de sus spins, y esta dependencia con relación
a los spins no es en modo alguno pequeña (1). La dependencia exacta respecto de r
(') En relación con esto, la interacción de los nucleones difiere esencialmente de la interacción de los
electrones, para los que la interacción spin-spin es exclusivamente de origen relativista y resulta ser pequeña
(en los átomos).
Fuerzas nucleare.~
511
se podría establecer, claro está, tan sólo mediante una teoría coherente de fas fuerzas
nucleares. En cambio, el carácter de la dependencia respecto de los spins puede
determinarse ya mediante simples consideraciones vinculadas con las propiedades
de los operadores de spin.
A nuestra disposición existen en total tres vectores de los que puede depender
la energía de interacción U: el vector unitario n, correspondiente al vector posición
definido por dos nucleones, y sus spins s1 y s2 • En virtud de las propiedades generales
del operador de spin ! , toda función del mismo se reduce a una función lineal (§ 55).
Además, hay que tener en cuenta que el producto n · s no es un escalar en sentido
estricto, sino un pseudoescalas (ya que n es un vector polar y s un vector axil).
Dadas estas circunstancias, es evidente que a partir de los tres vectores n, s1 , s2 se
pueden formar en total dos cantidades escalares independientes: s1 • s2 y (n · s1) (n · s2),
lineales respecto de cada uno de los spins.
Por consiguiente, en relación con su dependencia de los spins, el operador de
interacción de dos nucleones puede representarse como suma de tres términos
independientes:
(116.1)
de los cuales uno no depende de los spins, pero sí los otros dos. El tercer término
se ha escrito aquí de forma tal que se reduzca a cero al promediar respecto de las
direcciones n; las fuerzas caracterizadas por este término se suelen calificar de
tensoriales.
Hemos afectado a la interacción (116.1) del índice «ordinaria» para subrayar
el hecho de que este operador no cambia el estado de carga de los nucleones. Junto
a esta interacción, cabe admitir otra, como consecuencia de la cual el protón se
transforma en neutrón y recíprocamente. El operador de esta interacción « de intercambio» difiere formalmente del operador (116.1) en la existencia en él del operador
(115.4) de permutación de las partículas:
Ü camb= {U4(r)+ U5(r)(s1.s2)+ U6(r)[3(s1.n)(s2.n)-s1.S2]}P.
(116.2)
El operador total de interacción viene dado por la suma
Ú = Úord + Úcamb•
(116.3)
De esta manera la interacción entre dos nucleones viene caracterizada por seis
funciones distintas de la distancia entre uno y otro. Todos estos términos son, en
general, del mismo orden de magnitud.
Los operadores de spin que aparecen en (116.1) y en (116.2) se pueden expresar
en función del operador de spin total S. En efecto, elevando al cuadrado las igualdades = s1 + s2 y S.n =s1.n+ s2.n y teniendo en cuenta que s: = s! = !, (s1.n) 2 =
(s 2.n)2 = l (véase (55.10-11)), encontramos:
s
512
Estructura del núcleo atómico
(116.4)
El operador S2 conmuta con el operador S, por lo que las interacciones definidas
por los dos primeros términos de (116.1) y (116.2) conservan el vector spin total
del sistema. En cambio, la interacción tensorial conserva, conforme vemos, el operador (S.n)2, que conmuta con el cuadrado S2, pero no con el propio vector S.
Resulta así que sólo se conserva el valor absoluto del spin total, pero no su dirección.
El spin total S del sistema de dos nucleones puede tomar los valores O y 1. Estos
mismos valores puede tener su spin isotópico total T. Por lo tanto, todos los estados
posibles de este sistema se clasifican en cuatro grupos, que difieren en los valores
de los pares de números S, T. Para los estados de cada uno de estos grupos se tiene
su correspondiente operador de interacción, de la forma A(r) (para S = O) o
A(r) + B(r) [(S.n)2-i]
(para S = 1), al que se reduce, en estos casos, el operador general (116.3) (véase el
problema 1) (1).
Para valores dados de S y T, los estados del sistema se clasifican de acuerdo
con los valores del momento cinético total J y de la paridad. Conforme sabemos,
al valor T = O corresponden estados con funciones de onda '1/J simétricas, y al valor
T = 1, funciones antisimétricas. Dado que, por otra parte, el valor S determina
la simetría de la función de onda respecto de la variable de spin (simetría para
S = 1 y antisimetría para S = O), es claro que con dar el par de números S, T
se determina también el carácter de simetría de la función de onda respecto de las
variables espaciales, es decir, la paridad del estado. Es evidente que los estados del
sistema con spin isotópico T = O pueden ser tan sólo tripletes pares (S = 1) o singletes impares (S = O); en cambio, los estados del sistema con spin isotópico T = 1
son tripletes impares o singletes pares.
Dado que el spin, en tanto que vector, no se conserva, tampoco tiene porqué
conservarse, en general, el momento cinético orbital (solamente se conserva la suma
J = L+S). De todas maneras, puede ocurrir que se conserve el valor absoluto L,
simplemente debido a que los valores dados de J, S y de la paridad (o bien, J, S
y T) pueden ser compatibles tan sólo con un determinado valor de L (recordemos
que la paridad del sistema de dos partículas es (- 1)1·). Así, un estado impar con
S = 1, J = 1 puede tener solamente el valor L = l. es decir, es un estado 3 P 1 • En
1
( )
Los datos experimentales acerca de las propiedades del deuterón prueban que, para T = O y
S = l, la interacción de los nucleones contiene una fuerte atracción asociada con un profundo « pozo de
potencial » (la existencia de fuerzas tensoriales complica la expresión de este hecho en forma de propiedades
de las funciones A(r), B(r)); además, cabe afirmar (partiendo del signo observado del momento cuadripolar
del deuterón) que en este estado el coeficiente B(r) de las fuerzas tensoriales es negativo. De datos relativos
a la dispersión de nucleones se deduce que también para T = 1 y S = O se tiene una atracción, pero más
débil y que en particular, no conduce a un sistema estable formado por las dos partículas.
Fuerzas nucleares
513
otros casos, en cambio, a los valores dados de J, S y de la paridad pueden corresponder dos valores diferentes de L, con lo cual L no se conserva. Por ejemplo, en un
estado impar, con S = 1 y J = 2, puede ser L = 1 y L = 3, es decir, este estado
es una superposición 3P 2 + 3 F2•
Así, pues, llegamos a los siguientes estados posibles de] sistema de dos nucleones
(el índice + indica la paridad):
para T = 1: 3Po-, 3Pc,(3P2+ 8F2)-, 8F3-, ... ;
para T =
lS0+,1D2+,1G4+, ... ;
O: (3S1+3D1)+, 3D2+, (3D3+ 8 G3)+, ... ;
1Pc, 1F3-,
....
Las fuerzas nuc1eares son, en general, no aditivas. Esto significa que la interacción
en un sistema formado por más de dos nuc1eones no se reduce a la suma de las interacciones de todos los pares de partículas entre sí. Sin embargo, parece ser que las
interacciones ternarias, cuaternarias, etc., representan un papel relativamente sin
importanciá comparadas con las binarias por lo que al estudiar las propiedades
de los núc1eos compuestos cabe basarse, en buena medida, en las propiedades de las
interacciones binarias.
Los datos experimentales relativos a los núcleos indican que a medida que
aumenta el número de partículas, A, e] sistema de nuc1eones comienza a comportarse como una « materia nuc1ear » macroscópica cuyo volumen y energía crecen
proporcionalmente a A (salvo efectos vinculados con la interacción coulombiana
de los protones y a la existencia de una superficie libre del núc1eo). La propiedad
de las fuerzas nuc1eares con la que está ligado este fenómeno se llama propiedad
de saturación.
La existencia de esta propiedad impone ciertas limitaciones a las funciones U1, ... ,
U6 que determinan las interacciones binarias de los nucleones. Imaginemos que todas
las partículas se concentran en un volumen cuyas dimensiones son del orden del
radio de acción de las fuerzas nucleares; en tal caso todos los pares de partículas
interactuarán entre sí. Si existiera entonces una configuración tal de nucleones
(y una orientación tal de sus spins) en la que actuaran fuerzas atractivas entre todos
los pares, la energía potencial de este sistema sería una cantidad negativa proporcional a A 2 • La energía cinética del mismo, en cambio, es una cantidad positiva
proporcional a A 5 13 , es decir, de grado inferior respecto de A (1). Es claro que, en
estas condiciones, el conjunto de un número suficientemente grande de nucleones
se concentraría de hecho en un pequeño volumen independiente de A, es decir,
(1) La densidad n a la que están concentradas las partículas en el volumen dado es proporcional a su
número A, y la energía cinética de cada una de ellas es proporcional, a su vez, a n2 13 (cf. (70.1)). Por ello
la energía cinética total es ,..._,A· A 2 3 •
514
Estructura del núcleo atómico
no se formaría la materia nuclear. Por consiguiente, la condición de saturación
de las fuerzas nucleares debe traducirse en condiciones que prohiben las configuraciones que llevan a una energía de interacción negativa proporcional a A2 (véase
problema 2).
La proporcionalidad del volumen de la materia nuclear al número de partículas
se expresa por una relación de la forma
(116.5)
R = roA11a,
que liga el radio del núcleo, R, con.el número de partículas en él, A. Los datos
experimentales (1) conducen al valor r 0 = l,2· I0-13 cm.
Determinemos el impulso límite de los nucleones en la materia nuclear (cf. § 70).
El volumen del espacio de las fases correspondiente a las partículas que se encuentran
en una unidad de volumen del espacio físico y que poseen impulsos p < p 0 , es igual
a +rrp~/3. Dividiendo este volumen por (2TTñ)ª, obtenemos el número de «celdas»
en cada una de las cuales se pueden encontrar, a la vez, dos protones y dos neutrones.
Igualando el número de protones al número de neutrones, se obtiene:
4(+rr/3)(po/2Trñ)ª
=
A/V,
(donde V es el volumen del núcleo). Substituyendo aquí (116.5), obtenemos:
Po =(Jn-2A/2V)11ªñ
=
1·3 x 10-14 g.cm/s.
La energía correspondiente, pg/2mp, (mp es la masa de un nucleón), vale ,_, 30 Me V,
y la velocidad p0 /mp ';;' c/4.
PROBLEMAS
1. Hallar los operadores de interacción de dos nucleones en estados con valores determinados de S y T.
Solución. Estos operadores, 6 sT, se obtienen a partir de la expresión general (116.1-3) teniendo
en cuenta las relaciones (115.3) y (116.4):
Üoo = U1-!U2+ U4-}U5,
Úo1 = U1-!U2- U4+fU5,
Ú10 = U1 +!U2+ U4+!U5+
+t(Ua+ U5)[3(S.n)2-2],
Ún = U1 +iU2- U4-iU5+
+t(Ua- U5)[3(S.n)2-2].
(1)
Nos referimos a datos acerca de la dispersión de electrones por núcleos.
515
El modelo de capa.~
2. Hallar las condiciones de saturación de las fuerzas nucleares admitiendo que no existen
fuerzas tensoriales; los radios de acción de los restantes tipos de fuerzas se suponen iguales.
Solución. Consideremos ciertos casos límite (entre los que se encuentran todos los demás
casos posibles) para el estado de un sistema de A nucleones y escribamos la condición de que la
energía de interacción de un par « medio » de nucleones en este sistema sea positiva.
Supongamos que el spin total y el spin isotópico del núcleo toman sus valores máximos posibles: Snuc = Tnuc = A/2 (todas las partículas del sistema son protones con spins paralelos). Para
cada par de nucleones tenemos entonces S = T = 1 y obtenemos la condición:
(1)
Un > O.
Supongamos ahora que Tnuc = A/2,
O. Para cada par de nucleones es entonces T = 1,
Sz. Esto último significa que un nucleón
puede tener con igual probabilidad los valores Sz = ! y Sz = - ! ; en estas condiciones, las probabilidades de que un par de nucleones se encuentre en un estado con S = O o S = 1 son iguales,
respectivamente, a i y ! (son proporcionales al número 2S + 1 de valores posibles de Sz). Por consiguiente, la condición de que la energía media del par sea positiva da:
Snuc =
y para cada nucleón es igual a cero el valor medio de
¡Uo1 + !Un>O.
Análogamente, la consideración'de un estado con Tnuc
=
(2)
O,
Snuc =
¡U10+!Un>O.
A/2, conduce a la condición:
(3)
En un estado con Tnuc = Snuc = O, la probabilidad de que un par de nucleones tenga S = T = l
es igual a i · l, la probabilidad de que sea T = 1, S = O, es igual aj_· :i, etc. De aquí se deduce
la condición:
9
3
1
-Un +-(U10+ Uo1)+-Uoo > O.
16
16
16
(4)
Finalmente, supongamos que el sistema consta de A/2 protones y A/2 neutrones, siendo los
spins de todos los protones paralelos entre sí y antiparalelos a los spins de todos los neutrones.
Un nucleón puede resultar ser, con igual probabilidad, o un p o un n, es decir, puede tener TC = ¡\o r; = - J; la probabilidad de que un par de nucleones posea el valor T = O es igual a .t. En
este caso, uno de los nucleones del par es un p, y el otro, un n; por lo tanto, se tendrá Sz = O.
Este valor Sz puede obtenerse con igual probabilidad a partir de estados con S = O o S = l. Por
consiguiente, las probabilidades de que un par de nucleones se encuentre en un estado con T = O
y S = O, o T = O y S = 1 son iguales a A • 1 = A. Esta misma es la probabilidad de un estado con
T = l, S = O, y los restantes -i corresponden al estado con T = S = l. Teniendo en cuenta todo
esto, obtenemos la condición:
i(Uoo+ Uo1 + U10)+!Un > O.
(5)
Las desigualdades (1) - ( 5) constituyen el sistema de condiciones buscado para la saturación
de las fuerzas nucleares.
§ 117.
El modelo de capas
Muchas propiedades de los núcleos se pueden describir bien mediante el « modelo
516
Estructura del núcleo atómico
de capas» que, en sus características fundamentales, es análogo a la descripción
de la estructura del átomo formando capas electrónicas. En este modelo se considera que cada nucleón en el núcleo se mueve en un campo autoconsistente creado
por el conjunto de todos los demás nucleones (dado el pequeño radio de acción
de las fuerzas nucleares, este campo disminuye rápidamente fuera del volumen limitado por la « superficie » del núcleo). De acuerdo con esto, el estado del núcleo
como un todo se describe dando los estados de los diferentes nucleones por separado.
El campo autoconsistente es un campo central y el centro de simetría es, naturalmente, el centro de masas del núcleo. Sin embargo, en relación con esto surge la
siguiente dificultad. En el método del campo autoconsistente, la función de onda
del sistema se construye como producto de funciones de onda de las partículas
individuales (o bien, cuando así deba ser, por una suma simetrizada de productos).
Pero una tal función no garantiza la inmovilidad del centro de masas: aunque el
valor medio de la velocidad de éste, calculado mediante aquella función, sea igual
a cero, esta misma función de onda conduce a probabilidades no nulas para valores
de dicha velocidad distintos de cero (1).
Se puede soslayar esta dificultad eliminando previamente el mov1m1ento del
centro de masas al calcular cualquier magnitud física mediante las funciones de
onda 'l/J(r1, ... , rA) del método del campo autoconsistente. Sea/(r¡, p¡) una cualquiera
de estas magnitudes físicas, función de las coordenadas y de los impulsos de los nucleones. Al calcular sus elementos de matriz mediante las funciones 'l/J, hay que
efectuar en los argumentos de la función f, sin modificar 1p(r¡), la substitución:
(117.1)
donde R es el vector posición del centro de masas del núcleo, A es el número de
partículas que contiene y P es el impulso de su movimiento como un todo (la segunda
de las substituciones (117.1), de acuerdo con v¡ ~ v¡ - V, equivale a restar de la
velocidad de los nucleones la velocidad del centro de masas V, con la que está ligado
el impulso P por la relación P = Am1)V) (2).
Así, el operador momento di polar del núcleo es d = e l:rp, donde la suma se
extiende a todos los protones del mismo. Para calcular los elementos de matriz
en el método del campo autoconsistente, este operador debe substituirse, en cambio,
por el operador el:(r,) - R). Las coordenadas del centro de masas del núcleo son
R
1
= -(~rp+ 1:rn),
A
P
n
1
•• ( )
En el caso de los electrones de un átomo no se plantea en general esta dificultad. ya que la inmovilidad del centro de masas queda garantizada automáticamente por su coincidencia con la posición del
núcleo pesado inmóvil.
2
( )
Una justificación rigurosa de este método se da en el artículo de
Plry. Rer., 108, 482, 1957.
S. GAR IENHAUS,
C.
ScHWAR
rz,
El modelo de capas
517
(la suma se extiende a todos los protones y neutrones). Dado que el número de protones en el núcleo es Z, el operador del momento dipolar debe substituirse, en definitiva, de acuerdo con:
(117.2)
Los protones intervienen aquí con una « carga efectiva» e(l -- Z/ A) y los neutrones,
con una «carga» - eZ/A. Obsérvese que el orden de magnitud relativo de los
términos correctivos que resultan en el cáiculo del momento dipolar es del orden
de ,...., 1, conforme se ve en (117.2). En cambio, las correcciones en el cálculo de los
momentos magnéticos y de los siguientes momentos multipolares eléctricos resultan
ser, como se ve fácilmente, de un orden relativo ,_, 1/A.
En la aproximación no relativista la interacción de un nucleón con el campo
autoconsistente no depende del spin del nucleón: esta dependencia podría expresarse
solamente mediante un término proporcional a s. n, donde n es el vector unitario
correspondiente al vector posición r del nucleón; pero este producto no es un escalar,
sino un pseudoescalar.
La dependencia de la energía de un nucleón respecto de su spin se manifiesta,
sin embargo, al tener en cuenta los términos relativistas que dependen de la velocidad
de la partícula. El mayor de ellos es un término proporcional a la primera potencia
de la velocidad. A partir de los tres vectores s, n y v se puede construir un escalar
en sentido estricto: (n x v) · s. Por ello, el operador del acoplamiento spin-órbita
del nucleón en un núcleo tiene la forma:
Vsz =
-c/>(r)nxv.s,
(117.3)
donde cp(r) es una cierta función de r. Dado que mir x v) es el momento cinético
orbital ñl2 de Ja partícula, la expresión (117.3) se puede escribir también en la forma:
Vsz = - J(r)i.s,
(117.4)
donde f = ltcp/rmp. Hay que subrayar que esta interacción es de primer orden respecto de v/c, mientras que el acoplamiento spin-órbita del electrón en un átomo
es un efecto de segundo orden (§ 72); esta diferencia procede de que las fuerzas
nucleares dependen del spin ya en la aproximación no relativista, mientras que la
interacción no relativista de los electrones (las fuerzas coulombianas) no depende
de los spins.
La energía de la interacción spin-órbita está concentrada esencialmente en la
vecindad inmediata de la superficie del núcleo, es decir, la función f(r) decrece a
medida que se penetra en el mismo. En efecto, en la materia nuclear ilimitada una
interacción de ese tipo no podría existir, como es claro sin más que tener en cuenta
518
Estructura del núcleo atómico
que, en virtud del carácter homogéneo de un tal sistema, no existe en él ninguna
dirección privilegiada a la que se pudiera asociar el vector n.
La interacción (117.4) conduce al desdoblamiento del nivel de un nucleón con
momento cinético orbital l en dos niveles con momentos cinéticos j = l ± ! . Dado
que
1.s = }l paraj = Z+t,
= -!(l+l) paraj =
(117.5)
l-l
(según la fórmula (31.2))., el valor de este desdoblamiento será
b.E = Ez-1 -Ez+¡
=
f(r)(l+!).
(117.6)
La experiencia prueba que el nivel con j = l+! (vectores I y s paralelos) resulta
ser más bajo que el nivel con j = l - i; esto significa que la función f(r) > O.
El promedio de la función/(r) en (117.6) se efectúa con relación a la parte radial
de la función de onda del nucleón. Dado que f(r) disminuye rápidamente al penetrar
en el núcleo, la contribución principal ajviene dada por la región cerca de la superficie de aquél. La cantidad f(R) es inversamente proporcional al radio del núcleo R
(el factor 1/R, que aparece al pasar de (117.3) a (117.4)) y otro factor 1/R en/resulta
como contribución del volumen del núcleo que se encuentra en una capa cerca de su
superficie. Al mismo tiempo, el valor del desdoblamiento (117.6) crece al aumentar/,
y ello no solamente debido al factor l +}, sino también debido a que aumenta la
probabilidad de encontrar el nucleón cerca de la superficie del núcleo.
El acoplamiento spin-órbita de un nucleón en el núcleo es relativamente débil
comparado con su interacción con el campo autoconsistente. Al mismo tiempo
resulta ser, en general, grande comparado con la energía de la interacción directa
de dos nucleones en el núcleo, debido a que esta última decrece más rápidamente al
aumentar el peso atómico.
Esa relación entre las energías de las diferentes interacciones conduce a que la
clasificación de los niveles nucleares debe efectuarse según el tipo de acoplamiento-jj (1): los momentos cinéticos orbitales y de spin de cada nucleón se componen
para formar los momentos cinéticos totales j = l +s, que resultan ser magnitudes
determinadas dado que el acoplamiento entre I y s no se' rompe por la interacción
directa de las partículas entre sí. los vectores j de los nucleones individuales se
combinan luego para formar el momento cinético total del núcleo J (que con fre(1)
Este hecho fue establecido, basándose en el análisis de datos experimentales, por M.
1949) y O. HAXFL, J. J~:-.;srn y H. St:rss ( 1949).
MAYFR (
Gi'>PPFR
r-
El modelo de capas
519
cuencia se llama, simplemente, spin nuclear, como si el núcleo fuera una partícula
elemental).
Debido a esto la clasificación de los niveles nucleares difiere esencialmente de la
clasificación de ]os niveles atómicos: en una capa electrónica de un átomo e] acoplamiento relativista spin-órbita es, en general, pequeño comparado con las interacciones eléctricas directas y las interacciones de intercambio, por lo cual la clasificación
de los niveles se efectúa, de ordinario, de acuerdo con un acoplamiento del tipo LS.
El estado de cada nucleón en un núcleo se caracteriza por su momento cinético j
y su paridad. Aunque cada uno de sus vectores l y s. no se conserva por separado,
el valor absoluto del momento cinético orbital del nucleón resulta, con todo, estar
determinado. En efecto, el momento cinético j puede proceder bien de un estado
con l = j - ! , bien de un estado con l = j+ . Para un valor dado j (semientero)
estos dos estados tienen diferente paridad, (- 1)1, y, por consiguiente, al dar j y la
paridad queda determinado también el número cuántico l.
Los estados de los nucleones con iguales valores de l y j se suelen numerar (en
orden creciente de la energía) por un« número cuántico principal» n que toma valores enteros a partir del valor 1 (1). Los diferentes estados se designan por los símbolos Is , Ip , lp 312 , etc., donde el número delante de una letra es el número cuántico
principal, las letras s, p, d, ... indican, como de ordinario, el valor del, y el subíndice
en cada letra, el valor de j. En un estado con valores dados de n, l y j pueden encontrarse simultáneamente no más de ~¡ + 1 neutrones y otros tantos protones.
Las características del estado de un núcleo en conjunto (para una configuración
dada) se suelen representar en forma de un número, que da el valor de J, con un
índice + o - que indica la paridad del estado (esta úftima se determina, en el modelo
de capas, por el carácter par o impar de la suma algebraica de los valores l de todos
los nucleones).
Como resultado del análisis de datos experimentales acerca de las propiedades
de los núcleos, es posible establecer toda una serie de leyes relativas a la distribución
de los niveles nucleares.
Se observa, ante todo, que la energía de los niveles de un nucleón crece al aumentar el momento cinético orbital l. Esta regla está ligada con el hecho de que, al aumentar /, crece la energía centrífuga de la partícula, con lo que disminuye su energía
de enlace.
(1) Lo que ct1tiere del convenio que se adopta para los niveles electrónicos en un átomo, convenio
según el cual el número n toma sus valores a partir de I + 1.
520
Estructura del núcleo atómico
Además, para un valor dado/, el nivel conj = l+! (es decir, el que corresponde
a vectores I y s paralelos) es más bajo que el nivel conj = l - !. Esta regla se señaló
ya antes al tratar de las propiedades del acoplamiento spin-órbita del nucleón en
el núcleo.
La siguiente regla se refiere al spin isotópico de los núcleos. Recordemos que la
proyección Tt del spin isotópico queda ya determinada por el peso y el número
atómicos del núcleo (véase (115.1)). Para un valor dado Tt,, el valor absoluto del
spin isotópico puede tomar valores cualesquiera que satisfagan la desigualdad
T > 1Tt,I· Al estado fundamental de un núcleo resulta corresponder precisamente
el menor de estos valores admisibles del spin isotópico, es decir,
Trun=
1
T,I
=t(N-Z).
(117.7)
Esta regla se aplica, naturalmente, a núcleos no demasiado pesados, en !os que el
papel de la interacción coulombiana no es todavía muy importante, con lo que no
se viola la conservación del spin isotópico, y está ligada con la propiedad de la
interacción neutrón-protón en virtud de la cual en el sistema np el estado con spin
isotópico T = O (estado de deuterón) tiene una energía de enlace mayor que el estado
con T = 1 (véase la nota en la pág.512).
Cabe también formular algunas reglas relativas a los spins de los estados fundamentales de los núcleos. Estas reglas determinan cómo se componen los momentos
cinéticos j de los nucleones individuales para formar el spin total del núc1eo. En ellas
se traduce la aparición de una tendencia de los protones y de los neutrones, que se
encuentran en el núcleo en estados iguales, a «aparearse» (pares pp y nn) con
momentos cinéticos opuestos entre sí (la energía de enlace de estos pares es del orden
de 1-2 MeV).
Este fenómeno conduce, por ejemplo, a que si el núcleo contiene un número
par de protones y de neutrones (núcleos « par-pares »), los momentos cinéticos
de todos los nucleones se compensan dos a dos, de modo que el momento cinético
total del núcleo se anula.
Si, en cambio, el núcleo contiene un número impar de neutrones o de protones,
encontrándose todos los nucleones, por encima de las capas completas, en los mismos
estados, el momento cinético total del núcleo coincide de ordinario con el momento
cinético de un nucleón; todo ocurre como si después del « apareamiento » de todos
los pares posibles de neutrones y protones, quedara tan sólo un nucleón con momento
cinético no compensado (los momentos cinéticos totales de las capas completas
son, por el contrario, iguales a cero automáticamente.
Finalmente, si tanto Z como N son impares, encontrándose como antes todos los
nucleones exteriores a las capas completas en un mismo estado, de ordinario J
521
El modelo de capas
es igual al doble del momento cinético de un nucleón; todo ocurre como si, después
de todos los apareamientos, quedaran un protón y un neutrón cuyos momentos
cinéticos fueran paralelos entre sí, de tal manera que, en virtud de las propiedades
de las fuerzas nucleares (véase la nota de la pág. 512), se aumente la energía de
enlace respecto del caso en que sus momentos cinéticos son antiparalelos.
El estudio de la marcha concreta del proceso de formación de las capas en los
núcleos exigiría un análisis detallado de los datos experimentales que se poseen,
y escapa a los limites de este libro. Nos limitaremos aquí solamente a algunas indicaciones de carácter general.
Al estudiar las propiedades de los átomos vimos que, en elJos, los estados electrónicos se pueden descomponer en grupos tales que cuando se llena uno de estos
grupos y se pasa al siguiente, la energía de enlace del electrón disminuye. Una situación análoga se da en los núcleos, distribuyéndose los estados nucleónicos formando
los siguientes grupos (1):
nucleones
\
ls1¡2
2
lp3¡2, lPi;2
6
lds,2, ld3¡2, 2s1;2, lj7¡2
20
2p3¡2, lfs12, 2Pi;2, lg9¡2
22
2d5¡2, lg7¡2, lh11¡2, 2d3¡2, 3s1¡2
32
2h12, lh9¡2, 2i13¡2, 2/5¡2, 3p3¡2, 3Pi;2
44
l
I
(117.8)
1
j
Para cada grupo se da el número total de puestos de protones o de neutrones. De
acuerdo con este número, uno cualquiera de los grupos queda completo cuando el
número total de protones Z o de neutrones N en el núcleo es igual a uno de los
siguientes números:
2. 8, 28, 50, 82,126.
Estos números se suelen calificar de mágicos (2~.
Los diferentes estados en cada uno de los grupos (117.8) se han ordenado siguiendo más o menos el orden en que sucesivamente se ocupan en la serie de los
núcleos. En realidad, sin embargo, en la marcha de este proceso se observan grandes
(1)
2
( )
Los estadoslf7 12 , con sus 8 puestos, se separan a veces formando con ellos un grupo aparte.
Los llamados núcleos doblemente mágicos, en los cuales tanto Z como N son números mágicos,
poseen una particular estabilidad (por ejemplo,(1He:, aO!ª, 82 Pb:~!)Comparados con los núcleos vecinos,
su afinidad para añadir un nucleón (el núcleo He 4 es completamente incapaz de capturar ni tan sólo uno)
es de una pequeñez anómala, y sus primeros estados excitados se encuentran muy por encima de lo normal.
S22
E.~tructura del núcleo atómico
irregularidades. Además, hay que tener en cuenta que en los núcleos pesados las
distancias entre los diferentes niveles pueden resultar ser comparables con la « energía de apareamiento »; en estas condiciones, el propio concepto de estados individuales de los componentes de un par pierde buena parte de su sentido.
He aquí algunas observaciones acerca del cálculo del momento magnético del
núcleo en el modelo de capas. Al hablar de momento magnético de un núcleo nos
referimos, naturalmente, al momento magnético promediado respecto del movimiento dt! las partículas en el mismo. Este momento magnético medio µ está dirigido, evidentemente, a lo largo del spin J del núcleo, cuya dirección es la única
dirección privilegiada en él; por ello su operador es
~ = µogJ,
(117.9)
donde µ 0 es el magnetón nuclear y g el factor giromagnético. El valor propio de
la proyección de este momento p,z = µ 0 gMJ. De ordinario (cf. (110.2)) se entiende
por momento magnético µ del núcleo simplemente el valor máximo de su proyección, es decir, µ = µ&J; con esta notación:
~ = µ,j/J.
(117.10)
El momento magnético del núcleo es el resultante de los momentos magnéticos
de los nucleones que se encuentran fuera de las capas completas, ya que los momentos de los nucleones en estas últimas se compensan entre sí. Cada nucleón crea en
el núcleo un momento magnético que se compone de dos partes: la de spin y (en el
caso del protón) la orbital, es decir, se presenta como suma
gsi+ gzi.
(Aquí y en lo que sigue prescindimos del factor µ 0 , suponiendo, como se hace de
ordinario, que los momentos magnéticos se miden tomando como unidad el magnetón nuclear.) Los factores giromagnéticos de spin y orbital son: g 1 = 1, gs = 5,586
para el protón y g 1 = O, gs = - 3,826 para el neutrón.
Después de promediar respecto del movimiento del nucleón en el núcleo, su
momento magnético resulta ser proporcional a j; escribiéndolo en la forma g;j,
tenemos:
gJj = gsi+gzl
=
!(gz+gs)J +t(gz-gs)(i-i).
Multiplicando los dos miembros de esta igualdad por j
medios, se obtiene:
=
i+ § y pasando a
gJi(j+ 1) =i(gz+gs)j(j+ l)+!(gz-gs)[l(l+ l)-s(s+ 1)],
valores
523
El modelo de capas
y haciendo aquí s = t, j
=
l
± t, encontramos:
(117.11)
Con los valores antes indicados de los factores giromagnéticos, esta fórmula da
para el momento magnético del protón µp = g¡j:
µp
JLp
2·29) j paraj = l-i,
= ( 1- -.,+1
(117.12)
paraj =
l+i,
paraj =
1-i,
paraj =
Z+t.
= j+2·29
y para el momento magnético del neutrón:
1·91
/Ln =-.-j
J+l
JLn =
-1·91
(117.13)
Si fuera de las capas completas se tiene tan sólo un nucleón, las fórmulas (117.12)
o (117.13) dan directamente el momento magnético del núcleo. Para dos nucleones,
la composición de sus momentos magnéticos también se efectúa de manera elemental
(véase problema 1). En el caso de un número mayor de nucleones, el promedio del
momento magnético debe efectuarse mediante la función de onda del sistema, construida de acuerdo con las reglas a partir de las funciones de onda individuaJes de los
nucleones. El dar la configuración nucleónica y el estado del núcleo como un todo,
permite efectuar dicho promedio de manera unívoca en aquellos casos en los que a la
configuración dada puede corresponder únicamente un estado del sistema con los
valores dados de J y T (véase, por ejemplo, el problema 3); en caso contrario, el
estado del núcleo es una « mezcla » de varios estados independientes (con valores
iguales de J, T), y, en general, se desconocen los coeficientes de la combinación
lineal que da la función de onda del núcleo.
Indicaremos, finalmente, que la existencia del acoplamiento spin-órbita de los
nucleones en el núcleo determina la aparición de un momento magnético adicional
(respecto al (117.9)) en los protones que se encuentran en él (M. GOPPERT-MAYER,
J. .TENSEN, 1952). En efecto, cuando el operador de interacción depende explícitamente de la velocidad de la partícula, la transición al caso en que existe un campo
exterior se realiza substituyendo el operador de impulso por otro operador, de
acuerdo con p p- ~ A. Efectuando esta substitución en (117.3) y utilizando la
expresión (110.6) para el potencial vector, encontramos que en el hamiltoniano
del protón aparece un término adicional
524
Estructura del núcleo atómico
e
e
cf,(r)-n XA.s = f(r)-r X(.Ye Xr).s
Zen
cmp
=
e
f(r)-r X (s X r) ..Jfl'.
Zen
Este término equivale a la aparición de un momento magnético adicional cuyo
operador es
e
ílad = - -f(r)r X (s X r)
Zen
e
= - -r2f(r){s-(i.n)n}.
2eli
(117.14)
PROBLEMAS
l. Determinar el momento magnético de un sistema de dos nucleones (con momento cinético
total J = j 1 +j 2), expresándolo en función de los momentos magnéticos µ 1 y µ 2 de cada uno de los
nucleones.
Solución.
Análogamente a como se dedujo la fórmula (117.11), obtenemos:
!:_ = 1.(µ1 + µ2) +1.(µ1 _ µ2)(ji-h)(j1 +h+ 1).
2
2
1
ji h
j¡ h
1( 1 + 1)
2. Hallar los estados posibles del sistem:i de tres nucleones con momento cinético j
(e iguales números cuánticos principales).
=
3/2
Solución. Procederemos de manera análoga a como se hizo en el § 67 para hallar los estados
posibles de un sistema de electrones equivalentes. Cada nucleón puede encontrarse en uno de ocho
estados con los siguientes pares de valores de los números (mi, Te):
(3/2, 1/2), (1/2, 1/2), (-1/2, 1/2), (-3/2, 1/2),
(3/2, -1/2), (1/2, -1/2), ( -1/2, -1/2), (-3/2, -1/2).
Combinando estos estados en ternas distintas, encontramos los siguientes pares de valores
(MJ, TrJ del sistema de tres nucleones:
(7/2, 1/2), 2(5/2, 1/2), (3/2, 3/2), 4(3/2, 1/2), (1/2, 3/2), 5(1/2, 1/2).
(el número delante de los paréntesis indica el número de estados correspondientes; no es necesario escribir los estados con valores negativos de MJ, Te). A ellos corresponden estados del sistema con los siguientes valores de los números (J, T):
(7/2, 1/2), (5/2, 1/2), (3/2, 3/2), (3/2, 1/2), (1/2, 1/2).
3. Determinar el momento magnético del estado fundamental de una configuración de dos
neutrones y un protón en los estados p3, 2 (con iguales valores n) teniendo en cuenta la invariancia
isotópica (1).
Solución. El estado fundamental de esta configuración tiene el valor J = 3/2, y en virtud
de la regla indicada en el texto su spin isotópico toma el menor de los valores posibles, T = Te = ! .
(')
Una tal configuración la presenta (por encima de la capa completa ( 1s,n) 4 ) el núcleo Li7.
525
El modelo de capas
Determinemos la función de onda del sistema que corresponde al mayor valor posible MJ = 3/2.
Este valor MJ se puede obtener (teniendo en cuenta las condiciones que impone el principio de
PAuu para dos nucleones idénticos) mediante las siguientes ternas de valores m1 para los nucleones
p, n, n, respectivamente:
(3/2, 3/2, -3/2), (3/2, 1/2, -1/2), (1/2, 3/2, -1/2), (-1/2, 3/2, 1/2).
Por ello la función de onda buscada ,¡;!¡."i_,J¡; es una combinación lineal de la forma
'!"3/2,3/2 = a[ip3/2ifi3/2 ¡fi-3/2] + b[if;,312ifi1!2 .t.-1/2] +
1/2,1/2
112 -1/2 -1/2
1/2 _112'r-1/2
+ c[if;3/2 if;112¡f;_-1/2] + d[,l,3/2 .1.1¡2 .t.-1/2]
-1/2 1/2 -1/2
'r_112'r-112..,, 1/2'
(1)
donde [ ... ] significa el producto antisimétrico normalizado (es decir, un determinante de la forma
(61.2)) de las funciones de onda individuales y,7:'~ de los nucleones.
La función (1) debe anularse al aplicarle los operadores
3
y
1+= Ii+<il;
i=l
(cf. el problema del § 67). Los operadores 'T<O transforman la función de protón del i-ésimo nucleón
en una función de neutrón (y reducen a cero una función de neutrón). Es fácil ver, por ello, que
el operador T- reduce el primer término de (1) a un determinante con dos filas iguales, es decir,
a cero, y los determinantes de los tres términos restantes pasan a ser iguales; obtenemos, por lo
tanto, la condición
b+c+d = O.
Además, para el nucleón individual con momento cinético j
(según (27 .12)):
J+ifi312
= o,
}+if;l/2 = y3ifi3!2,
J+if;-1/2
=
3/2 y diferentes valores m1, tenemos
= 2¡/il/2,
J+¡fi-3/2
=
y3¡fi-1/2.
A partir de aquí se encuentra fácilmente que al aplicar el operador 1+ a la función (1) se obtiene:
]
A
'Y3/2,3/2 = y3(a+b-c)[tf,.3!2ifi3/2 ¡f;_-1/2]+
+ 1/2,1/2
1/2 -1/2 -1¡2
+ 2(c- d)[·l.3/2
.1.1¡2.1.112 ] •
'r_112'r112'r -1/2 '
(el cambio de signo de algunos términos se debe a la permutación de filas del determinante). La
condición de que esta expresión sea igual a cero nos da
a+b-c = O,
c-d = O.
Junto con la condición de normalización de la función (1 ), las relaciones obtenidas conducen a
a= 3/ylS,
b = -2/ylS,
e= d = 1/ylS.
Teniendo en cuenta que el valor medio de la proyección del momento magnético del protón
(o del neutrón) en un estado con valor dado de m1 es µpm1/j (o µnm¡/j), encontramos que el valor
medio del momento del sistema, calculado mediante la función de onda ( 1), es igual a
526
Estructura del núcleo atómico
P.= flz
9
4
1
15
15
15
= -µp+-µp+-(tµp+iµn)+
1
4
1
+:-:{-iµp+-µn) = -(13¡Lp+2µn)15
3
15
Según las fórmulas (117.12), (117.13), vemos que para el nucleón en un estado P:i, 2 es µn
= 3,79. En definitiva, pues, µ = 3,03.
=
-
1,91,
l'P
4. Determinar el momento magnético de un núcleo en el que todos los nucleones situados
fuera de las capas completas se encuentran en estados idénticos, siendo iguales los números de
protones y de neutrones.
Solución. Dado que para N = Z la proyección del spin isotópico es T~
parte escalar isotópica del operador
n
=
O, solamente la
P
posee elementos de matriz diagonales (véase el final del § 115). Separando esta parte de acuerdo
con la fórmula (115.6), encontramos que es igual a
¿J
!(gn +gp)
= !(gn +gp)j ·
n,p
Por consiguiente, el momento magnético medio total del núcleo es igual a
l
(gn+gv)l.
Calcular el momento magnético adicional de un nucleón con momento cinético j expresando aquél en función del valor del desdoblamiento spin-órbita (117.6) (M. GoPPERT-MAYER,
5.
J. JENSEN,
1952).
Solución. El promedio de la parte angular del operador (117.14) (la expresión entre corchetes
en (117 .14); la designaremos por a) se efectúa mediante la fórmula obtenida en el problema 2,
§ 29, y da:
a= s-(s.n)n
2
=
,.
38
-
(s.i)i+i(s.i)-il(l+ l)s
(21-1)(21+3)
•
(2)
Por otra parte, después del promedio total respecto del niovim~nto del nucleón, el valor medio
dea puede estar dirigido únicamente a lo largo de j, es decir, a = aJ; de aquí se sigue Q =
•J /j2.
Proyectando el vector (2) sobre j (teniendo en cuenta al hacerlo que el operador 1 conmuta con
i), y pasando a los valores propios de las magnitudes 1 · s, 12, etc., obtenemos, después de un
cálculo fácil, la siguiente expresión para el momento magnético adicional del nucleón (tomando
como unidad el magnéton nuclear):
a
t.
2j+l
+J(r)----¡¡- 2(j+ 1)
_ _ mpR2
paraj = l±i,
(3)
Núcleos no esféricos
527
(mp es la masa del nucleón, R es el radio del núcleo; al promediar r 2f, el factor r 2 lo substituimos
por R 2, teniendo en cuenta la rápida disminución de f(r) cuando disminuye r). El valor medio
J
en (3) se puede expresar en función del desdoblamiento spin-órbita de acuerdo con (117.6).
§ 118.
Núcleos no esféricos
Un sistema de partículas que se mueven en un campo central no puede tener un
espectro energético de rotación; en mecánica cuántica, el concepto de rotación
carece en absoluto de sentido para un tal sistema. Esto vale también para el modelo
de capas del núcleo con un campo central autoconsistente que hemos estudiado
en el párrafo anterior.
La descomposición de la energía del sistema en una parte « interna » y otra de
« rotación » no tiene, en general, un sentido riguroso en mecánica cuántica. Tan
sólo es posible y puede tener un carácter aproximado en aquellos casos en que, por
unas u otras causas físicass constituye una buena aproximación el considerar el
sistema como un conjunto de partículas que se mueven en un campo dado que no
posee simetría esférica. La estructura de rotación de los niveles aparece entonces
como resultado de tener en cuenta la posibilidad de rotación de dicho campo respecto de un sistema de coordenadas fijo. Un caso de este tipo se consideró, por
ejemplo, en las moléculas, cuyos términos electrónicos se pueden determinar como
niveles de energía de un sistema de electrones que se mueven en el campo dado
de los núcleos en reposo.
Indica la experiencia que la mayor parte de los núcleos no poseen, de hecho,
una estructura de rotación. Esto significa que una buena aproximación para ellos
es el campo central autoconsistente, es decir, los núcleos presentan (salvo fluctuaciones cuánticas) una forma esférica.
Sin embargo, existe también una categoría de núcleos que poseen un espectro
energético del tipo de rotación (a ella corresponden núcleos cuyos pesos atómicos
se encuentran en los intervalos 150 < A < 190 y A > 220). Esta propiedad suya
significa que la aproximación del campo autoconsistente central es del todo inadecuada para ellos. El campo autoconsistente para estos núcleos debe buscarse, en
principio, sin hacer ninguna hipótesis previa acerca del carácter de su simetría,
a fin de que la forma del núcleo quede también determinada por la propia condición
de autoconsistencia. La experiencia muestra que el modelo correcto para los núcleos
de esta categoría resulta ser un campo autoconsistente que posee un eje de simetría
y un plano de simetría perpendicular a este eje (es decir, un campo cuya simetría
es la de un elipsoide de revolución) (1). El modelo de núcleos no esféricos ha sido
l' J Al parecer, actualmente es todavía imposible llegar a conclusiones del todo seguras acerca de la
existencia de núcleos no axiles, cuya simetría es la de un elipsoide de tres ejes (un modelo de tales núcleos
ha sido desarrollado por A. S. DAvvoovl.
528
Estructura del núcleo atómico
particularmente desarrollado en los trabajos de O.
1953).
BoHR
y B.
MoTTELSON
(1952,
Hay que subrayar que se trata aquí de dos categorías de núcleos cualitativamente
distintas. Esto se advierte, en particular, en que los núcleos o son esféricos, o son
no esféricos, pero con un grado de « no esfericidad » en modo alguno pequeño.
Entre estas dos categorías no existe una transición gradual.
La aparición de la no esfericidad se ve favorecida por la existencia en el núcleo
de capas no completas;. según parece, también el apareamiento de los nucleones
representa un papel fundamental en dicho fenómeno. Por el contrario, el que las
capas estén completas favorece el carácter esférico del núcleo. Es característico en
este sentido el núcleo doblemente mágico 82 Pb 2º8 ; debido a que su configuración
nucleónica se manifiesta fuertemente como cerrada, este núcleo (como también
los núcleos vecinos del mismo) es esférico, lo que se traduce en una anomalía
en la serie de núcleos pesados no esféricos.
Los niveles de energía de un núcleo no esférico son suma de dos partes: de los
niveles del núcleo « inmóvil » y de la energía de su rotación como un todo. En
estas sumas los intervalos de la estructura de rotación de los niveles son pequeños
comparados con las distancias entre los niveles del núcleo «inmóvil».
La clasificación de los niveles de un núcleo no esférico es análoga, en muchos
aspectos, a la clasificación de los niveles de una molécula diatómica (compuesta
de átomos idénticos), dado que la simetría del campo en el que se mueven las partículas (nucleones o electrones) es la misma en ambos casos. Podemos por ello utilizar,
sin más, los resultados obtenidos en el capítulo XI.
Consideremos primero la clasificación de los estados del « núcleo inmóvil».
En un campo con simetría axil, se conserva solamente la proyección del momento
cinético sobre el eje de simetría. Por lo tanto, cada estado del núcleo se caracteriza,
ante todo, por el valor n de la proyección de su momento cinético total (1), proyección que puede tener tanto valores enteros, como semienteros. Según sea el comportamiento de la función de onda respecto del cambio de signo de todas las coordenadas de los nucleones (referidas al centro del núcleo), los niveles se dividen
en pares (g) e impares (u).
Además, para n = O se distingue también entre estados positivos y negativos,
según sea el comportamiento de la función de onda en las reflexiones en un plano
1
( )
Por definición es Ü ;;i, O (de manera análoga al carácter positivo del número cuántico A en las
moléculas diatómicas). Obsérvese que los valores negativos del número !) en el caso de las moléculas
diatómicas podían aparecer tan sólo debido a que
se definía como igual a la suma A+~. donde ~
podía ser tanto positivo como negativo (según sean los sentidos relativos del momento orbital y del spin).
n
Núcleo.-. no esféricos
529
que pase por el eje del núcleo (véase § 78).
Los estados fundamentales de los núcleos no esféricos par-pares son estados
número indica el valor de n), que corresponden a momento cinético nulo
y a la más elevada simetría de la función de onda; esta circunstancia resulta del
apareamiento de todos los neutrones y de todos los protones dos a dos. Si, en cambio,
un núcleo contiene un número impar de _protones o de neutrones, se puede considerar en él el estado del nucleón « impar » en el campo autoconsistente del núcleo
« residual » par-par. El valor n se determina en tal caso por la proyección w del
momento cinético de dicho nudeón. Análogamente, en un núcleo impar-impar,
el valor n se forma a partir de las proyecciones de los momentos cinéticos del neutrón impar y del protón impar (O= jwp - wnJ).
ot (el
Hay que subrayar, al mismo tiempo, que es imposible hablar de valores determinados de las proyecciones del momento cinético orbital y del spin del nucleón.
Ello se debe a que, aunque el acoplamiento spin-órbita del nucleón es débil comparado con la energía de su interacción con el campo autoconsistente del núcleo
residual, dicho acoplamiento, en general, no es pequeño respecto de las distancias
entre los niveles energéticos vecinos del nucleón en dicho campo. Pero es precisamente esta última condición la que debería cumplirse para que fuera aplicable la
teoría de perturbaciones que permitiría considerar, a su vez, con buena aproximación el momento cinético orbital y el spin del nucleón, por separado (1).
Pasemos ahora a la estructura de rotación de un núcleo no esférico. Los intervalos
de esta estructura son pequeños comparados con la interacción spin-órbita de los
nucleones en el núcleo; esta situación corresponde al caso a de la teoría de las moléculas diatómicas (§ 83).
Claro está, el momento cinético total del núcleo en rotación, J, se conserva.
Para n, dado, su valor absoluto J toma valores a partir de n:
J=
o, 0+1,0+2, ... ;
(118.1)
(véase (83.2)). Una limitación adicional a los valores posibles de J se presenta para
los núcleos con n = O: en los estados
y o; el número J toma solamente valores
valores impares (véase § 86). En particular, en los
pares, y en los estados o; y
niveles de rotación del término fundamental de los núcleos par-pares (Ot) e] número J
toma los valores O, 2, 4, ...
ot,
ot
La energía de rotación de un núcleo viene determinada por la fórmula
/i2
Erot = -1(1+ 1),
21
(118.2)
(1) En los núcleos esféricos esto resultaba posible, a pesar de todo, como consecuencia de la apli, cabilidad simultánea de la conservación de la paridad y del momento cinético.
530
Estructura del núcleo atómico
donde I es el momento de inercia del núcleo (respecto de un eje perpendicular a su
eje de simetría); esta fórmula corresponde a la expresión análoga en la teoría de las
moléculas diatómicas (el término que depende de J en (83.6)). El nivel más bajo
corresponde al más pequeño valor posible de J, es decir, a J = n.
En virtud de (118.2), la estructura de rotación de los niveles se caracteriza por
determinadas reglas de intervalos, reglas que no dependen (para n dado) de las
demás características del nivel. Así, las componentes de la estructura de rotación
del término fundamental de un núcleo par-par (con J = 2, 4, 6, 8, ... ) se encuentran
a distancias del nivel más profundo (J = O) que están en las razones 1 : 3, 3 : 7 : 12 ...
La fórmula (118.2), sin embargo, es insuficiente para los estados con n = t.
que pueden presentarse en el caso de núcleos con un número impar de nucleones.
En este caso aparece una contribución a la energía comparable con (118.2) debida
a la interacción del nucleón impar con el campo centrífugo del núcleo en rotación.
Su dependencia respecto de J se puede hallar de la siguiente manera.
Como es sabido por la mecánica (1), la energía de una partícula en un sistema
de coordenadas en rotación contiene un término adicional que es igual al producto
de la velocidad angular de rotación por el momento del impulso de la partícula.
El término correspondiente en el hamiltoniano de un núcleo se puede representar
en la forma 2b:R.a, donde b es una constante, K es el momento de rotación del
núcleo «residual» (el núcleo sin el último nucleón), y a es el momento cinético del
nucleón. Hay que considerar aquí este último en un sentido puramente formal
(en realidad, el vector momento cinético del nucleón no existe en el campo axil
del núcleo), como un operador análogo al operador de spin l que permite las transiciones entre estados con valores de la proyección del momento ± l - en correspondencia con el valor n = l (2). Dado que únicamente nos interesa la dependencia
de la energía del núcleo con relación a J, en vez de 2b:R.a podemos considerar el
operador 2bj.o, - su diferencia es, simplemente, una constante aditiva que no
depende de J (dado que J = K +a). Los valores propios de este operador son:
2bJ.a
= b[J(J+ 1)-K(K+ l)+i].
Restando de aquí, por comodidad, la constante b/2, encontramos que esta cantidad
es igual a ± b(J+O para J = K ± !.
(1)
Véase tomo I, Mecánica, § 39.
(") La propiedad específica del caso O = ! radica precisamente en la existencia de elementos de ma·
triz de la energía de perturbación para transiciones entre estados que difieren tan sólo en el signo de la
proyección del momento cinético y que corresponden, por consiguiente, a un mismo valor de la energía.
Esto conduce a un corrimiento de la energía que se manifiesta ya en el primer orden de aproximación de
la teoría de perturbaciones.
El fenómeno considerado es análogo a la duplicación.\ de los niveles de una molécula diatómica con
= ~ (§ 88).
n
Núcleos no esféricos
531
Esta expresión se puede escribir en la forma ( -1 )J-i b(l +!)si se tiene en cuenta
que el momento cinético K del «residuo» (que es un núcleo par-par) es un número
par. De esta manera obtenemos finalmente la siguiente expresión para la energía
de rotación de un núcleo con n = ! :
/í2
Erot = -1(1+ 1)+(- l)J-1/2b(l+!)
21
(118.3)
(A. BOHR, B. MoTTELSON, 1953). Obsérvese que si la constante b es positiva y suficientemente grande, el nivel con J = -i- puede resultar más bajo que el nivel con J = 1,
es decir, puede quedar violado el orden normal de los niveles de rotación, orden
en el que el nivel más bajo corresponde al menor valor posible de J.
El momento de inercia de un núcleo no esférico no se puede calcular como
momento de inercia de un sólido de forma dada. Un cálculo de este tipo sólo sería
posible si se pudiera considerar que los nucleones, que se mueven en el campo
autoconsistente del núcleo, no interactúan entre sí directamente. En realidad, sin
embargo, el fenómeno del apareamiento conduce a que el momento de inercia
disminuya (unas cuantas veces) respecto del valor que le correspondería si se tratara de un cuerpo sólido.
El momento magnético p de un núcleo no esférico es la resultante del momento
magnético del núcleo « inmóvil » y del momento vinculado a la rotación del núcleo.
El primero (después de promediar respecto del movimiento de los nucleones en el
núcleo) está dirigido a lo largo del eje del núcleo; designando el valor de este momento
por µ' y el vector unitario correspondiente al eje del núcleo por n, escribiremos
dicho momento en la forma 1t'n. En cambio, el momento magnético debido a la
rotación está dirigido (después de efectuar el mismo promedio) a lo largo del vector
J -- nn, es decir, del momento cinético total del núcleo después de restarle el momento de los nucleones en el « núcleo inmóvil» (1 ). De esta manera,
µ.
=
µ'n+g,(J-Qn).
(118.4)
Aquí gr es el factor giromagnético de rotación del núcleo. Dado que, en la rotación,
sólo contribuyen al momento magnético los protones, se tiene
(118.5)
donde / 11 e /p rnn las partes del mcmer.to de inercia del núcleo debidas a los neutrones
y a ]os protones (para un sistema constituido únicamente por protones, debería
ser, simplemente, gr = 1). La razón (118.5) no coincide, en general, con la razón
Z / A del número de protones al peso total del núcleo.
(1)
Esta notación se puede aplicar solamente para O =I= 1 (véase el problema 2).
532
Estructura del núcleo atómico
Después de promediar respecto de la rotación del núcleo, el momento magnético
está dirigido en el sentido del vector J, que se conserva:
~ = µJ/1 = (µ' -Og,)ñ+grJ,
Como de ordinario, multiplicaremos ambos miembros de esta igualdad por J y
pasaremos a valores propios. En el estado fundamental del núcleo es n = J y obtenemos el resultado:
(118.6)
µ =(µ' +g,)1/(1+ 1).
PROBLEMAS
1. Expresar el momento cuadripolar Q de un núcleo en rotación en función del momento
cuadripolar Q0 respecto de ejes ligados al núcleo (A. BOHR, 1951 ).
Solución. El operador del tensor momento cuadripolar del núcleo en rotación se expresa en
función de Q0 mediante la fórmula
es este un tensor simétrico de traza nula formado a partir de las componentes del vector unitario n
asociado al eje del núcleo, siendo además Qzz = Q 0 • El promedio respecto del estado de rotación
del núcleo se efectúa de manera análoga a como se procedió al resolver el problema (2) del § 29
(con la sola diferencia de que nd, = n, y no igual a cero) y conduce a una expresión de la forma
(75.2) con
Q=
ºº
302-l(l+l)
(21+3)(1+ 1)°
Para el estado fundamental del núcleo con
Q=
ºº
n
J obtenemos:
=
(21-1)1
(21+3)(1+ 1).
Cuando crece J, la razón Q/Q0 tiende a 1, pero de manera bastante lenta.
2.
Determinar el momento magnético en el estado fundamental de un núcleo con
n = !.
Solución. En este caso, el operador del momento magnético se puede escribir en función del
operador a introducido en el texto en la forma:
A
[A
A
A
fJ. = 2µ a+g,K, K =
J-a.
-
A
El cálculo que sigue es análogo al efectuado en el texto. Si al nivel fundamental del núcleo corresponde el valor J = ! (siendo K = J - ! = O), se obtiene ,, = p'. Si, en cambio, en el estado
fundamental es J = 3/2 (con lo que K = J +} = 2) será ,, = t g, -iit'.
3. Determinar las energías de los primeros niveles de la estructura de rotación del estado
fundamental de un núcleo par-par cuya simetría es la de un elipsQide de tres ejes.
533
El corrimiento isotópico
Solución. Al estado f undamenta1 de un núcleo par-par corresponde la función de onda más
simétrica del núcleo «inmóvil», es decir, una función cuya simetría corresponde a la representación A del grupo D 2• Se tienen por ello en total J/2 + 1 (para J par) o (J - 1)/2 (para J impar)
niveles diferentes para un valor dado de J. Para J = 2 dichos niveles vienen dados por la fórmula (7)
obtenida en los problemas del § 103, y para J = 3, por la fórmula (8).
§ 119.
El corrimiento isotópico
Las propiedades específicas de un núcleo (masa finita, dimensiones, spin), que
lo distinguen del centro puntual inmóvil de un campo coulombiano, son causa
de una cierta influencia sobre los niveles de energía electrónicos de un átomo.
Uno de estos efectos es el llamado corrimiento isotópico de los niveles - el
cambio de la energía de un nivel al pasar de un isótopo de un elemento dado a otro.
De hecho, claro está, interesa no el corrimiento de la energía de un nivel tan sólo,
sino la variación de la diferencia entre dos niveles, diferencia que se observa en
forma de raya espectral. Por esta razón, hay que considerar de hecho no la energía
de toda la envoltura electrónica del átomo en conjunto, sino solamente aquella
porción de la misma que está ligada con el electrón que toma parte en la transición
espectral de que se trate.
En los átomos ligeros, la fuente principal del corrimiento isotópico es el efecto
debido al valor finito de la masa del núcleo. El tener en cuenta el movimiento de
éste conduce a la aparición en el hamiltoniano del término
2~(¿),)'
i
donde Mes la masa del núcleo y Pi.los impulsos de los electrones (1). Por consiguiente,
el corrimiento isotópico ligado con este efecto se encuentra como valor medio
(119.1)
calculado respecto de la función de onda del estado dado del átomo (M1, M 2 son
las masas de los núcleos de los isótopos).
1
( )
En el sistema del centro de masas del átomo, la suma de los impulsos del núcleo y de los electrones
es igual a cero: Pnuc + ~Pi = O. Por lo tanto, su energía cinética total será
2
¿Pi
2m
-Pnuc
- - + -12M
i
(IPt) +-1
Pi
2M
2m 2
2
12 =-
i
2
•
534
Estructura del núcleo atómico
En los átomos pesados, la contribución principal al corrimiento isotópico resulta de la extensión del núcleo. Este efecto se observa prácticamente tan sólo para
el nivel de un electrón exterior que se encuentre en un estado s, ya que la función
de onda de un estado de este tipo (en contraposición a las funciones de onda de los
estados con l =f=- O) no se anula parar~ O y, por ello, la probabilidad de encontrar
un electrón en el « volumen del núcleo» es relativamente grande. Calculemos el
corrimiento isotópico para este caso (1).
Sea cp(r) eJ potencial electrostático verdadero del campo del núcleo, potencial
que difiere del potencial coulombiano Ze/r del campo de una carga puntual Ze.
El cambio de la energía del electrón respecto de su valor en el campo puramente
coulombiano Ze/r viene dado por
f
ó.E = -e (cf>-Ze/r)¡f;2(r)dV,
(119.2)
donde 1P(r) es la función de onda del electrón (en un estados esta función presenta
simetría esférica y es real). Aunque la integración se extiende aquí formalmente
a todo el espacio, la diferencia </>- Ze/r que aparece en el integrando es de hecho
no nula tan sólo dentro del volumen del núcleo. Por otra parte, la función de onda
de un estado s tiende a un límite constante para r-+ O (véase § 32), alcanzándose
este valor prácticamente ya en el límite del núcleo. Por consiguiente, podemos
sacar 1P2 fuera del signo de integración, substituyendo 1P(r) por su valor para r = O
calculado para el campo coulombiano de una carga puntual.
Para seguir reduciendo la integra) utilizaremos la identidad !J.r 2
mos (119 .2) en la forma
= 6 y escribire-
f
ó.E = -iei/;2 (0) (<f>-Ze/r)L':,r 2 .dV
=
-!eif;2(0) fr21':,(cp-Ze/r)dV;
(al transformar la integra) de volumen se ha tenido en cuenta que la integra), extendida a una superficie situada en el infinito, que entonces aparece es igual a cero).
Pero l':,(1/r) = - 4nó(r) y r 2ó(r) = O para todo r. Por otra parte, según la ecuación
de Poisson, L</> = - 4ne, donde, en el presente caso, e es la densidad de distribución de carga eléctrica en el núcleo. Obtenemos así en definitiva:
(119.3)
!1) El cálculo que se presenta a continuación, y en el que no se tienen en cuenta los efectos relativistas
sobre el movimiento del electrón cerca del núcleo, es correcto, como se puede demostrar, si se cumple la
condición Ze2/Tíc ~ 1
535
Estructura hiper/ina de los niveles atómicos
donde
~ = (1/Ze)
f
pr2dV
es el radio cuadrático medio del núcleo con relación a los protones (para una distribución homogénea de protones en el núcleo, sería ~ = 3R2/S, donde R es el
radio geométrico del mismo). El corrimiento isotópico de un nivel viene determinado
por la diferencia de las expresiones (119.3) para los dos isótopos.
En el § 71 se estimó el valor de la cantidad 1P(O) y se probó que depende del
número atómico como
(supuesto Z grande). Por ello, la magnitud del desdoblamiento (119.3) resulta proporcional a Z2.
VZ
§ 120.
Estructura hiperfina de los niveles atómicos
Otro efecto atómico debido a las propiedades específicas del núcleo es el desdoblamiento de ]os niveles atómicos de energía que resulta de Ja interacción de los
electrones con el spin del núcleo - la llamada estructura hiperfina de los niveles.
Dado que dicha interacción es débil, los intervalos de esta estructura son muy
pequeños, en particular respecto de los intervalos de estructura fina. Por ello, la
estructura hiperfina debe considerarse para cada una de las componentes de estructura fina por separado.
Designaremos en este párrafo el spin del núcleo (de acuerdo con Jo que se suele
hacer en Ja espectroscopia atómica) por i, conservando el símbolo J para e] momento cinético total de las capas electrónicas del átomo. El momento cinético
total del átomo (incluido el nuclear) lo representaremos por F = J +i. Cada componente de estructura hiperfina se caracteriza por un valor determinado del módulo
de este momento. De acuerdo con ]as reglas generales de composición de momentos, el número cuántico F toma los valores
F
= J+i, J+i-1, ... , 1 J-il,
(120.1)
de modo que cada nivel, con un valor dado de J, se desdobla en total en 2i + 1
(si i < J) o 21 + 1 (si i > J) componentes.
Dado que las distancias medias r de los electrones en el átomo son grandes
comparadas con el radio R del núcleo, el papel principal en el desdoblamiento
hiperfino lo representa la interacción de los electrones con los momentos multipolares del núcleo de órdenes más bajos. Estos son el momento dipolar magnético
y el momento cuadripolar eléctrico (el momento dipolar medio es igual a cero,
véase § 75).
El orden de magnitud del momento magnético del núcleo
µnuc
r-..1
e Rvnuc/ e,
536
Estructura del núcleo atómico
donde Vnuc son las velocidades de los nucleones en el mismo. Su energía de interacción con el momento magnético de un electrón(µe1 ,...._, eh/mc)es del orden de magnitud de
(120.2)
El momento cuadripolar del núcleo es Q ,._, e R 2 ; la energía de interacción del
campo creado por él con la carga del electrón es del orden de
eQ /r3"' e2R2 Jr3.
(120.3)
Comparando (120.2) y (120.3), vemos que la interacción magnética (y, por ello,
también el desdoblamiento de los niveles provocado por la misma) es (vnuc/c)
(h/mcR) ,._, 15 veces mayor que la interacción cuadripolar; aunque la razón Vnuc/c
es relativamente pequeña, en cambio la razón ñ/mcR es grande.
El operador de interacción magnética de los electrones con el núcleo tiene la
forma
viJ =ai.J
(120.4)
(análogamente a la interacción spin-órbita de los electrones (72.4)). La dependencia,
respecto de F, del desdoblamiento de los niveles determinado por la misma viene
dada, por consiguiente, por la expresión
!aF(F+l);
(120.5)
(cf. (72.5)).
El operador de interacción cuadripolar de los electrones con el núcleo se forma
a partir del operador Qik del tensor momento cuadripolar del núcleo y de las componentes del vector J del momento cinético de los electrones. Dicho operador es
proporcional al escalar QikJ,,,Jk formado con estos operadores, es decir, tiene la
forma
(120.6)
se ha tenido en cuenta aquí que Qik se expresa en función del operador de spin
del núcleo por una fórmula del tipo (75.2). Calculando los valores propios del
operador (102.6) (de manera por completo análoga a como se efectuaron los cálculos
del problema 1, § 84), encontramos que el desdoblamiento hiperfino cuadripolar
de los niveles depende del número cuántico F de acuerdo con la expresión:
}bF2(F+ 1)2+ibF(F+ 1)(1-21(1+ 1)-2Í(i+ 1)].
(120.7)
El efecto del desdoblamiento hiperfino magnético se observa sobre todo para
los niveles ligadcs a un electrón exterior que se encuentra en un estado s, ya que
entonces es relativamente grande la probabilidad de encontrar el electrón cerca del
Estructura hiper[ina de los nivele~ atómicos
537
núcleo.
Calculemos el desdoblamiento hiperfino para un átomo que contiene un electrón s exterior (E. FERMI, 1930). Este electrón se representa por una función de onda
1JJ(r) que posee simetría esférica y corresponde a su movimiento en el campo autoconsistente de los restantes electrones y del núcleo (1).
El operador de interacción del electrón con el núcleo lo identificaremos con el
operador en~rgía, - ~•.Jf , del momento magnético del núcleo ~ = µi/i en el campo
magnético ~ creado por el electrón (en el origen de coordenadas) (2). Según una
conocida fórmula de la electrodinámica (3), este campo es
f
A 1 ~
rxjV = 1 JA
1
:Ye=jxV-dV,
e
e
r3
r
(120.8)
donde j = -2µ 0 e rot (if,2s) es el operador espinorial de la densidad de corriente
creada por el spin electrónico en movimiento (véase (114.4); µ, 0 es el magnetón de
Bohr). Por el momento, excluyamos del dominio de integración en (120.8) una pequeña esfera de radio r 0 y centro en el origen de coordenadas y, mediante fórmulas
conocidas del análisis vectorial, transformemos la integral de la siguiente manera
(introduciremos provisionalmente la notación f = - 2µ 0if,2(r)i):
A
~
=
=
f
f
. rot
1
fx V-;--dV
f
(f.v')v'~V+ v': x(nxf)dS.
La integral extendida a una superficie cerrada situada en el infinito es igual a cero,
de modo que la segunda integral en el segundo miembro de la igualdad se extiende
solamente a la superficie de la pequeña esfera (n es el vector unitario de la normal
exterior a la misma). En cambio, la primera integral, como se comprueba fácilmente,
se reduce a cero al integrar respecto de las direcciones der. En definitiva obtenemos
(haciendo dS = r02 do y pasando al límite para r 0 -* O):
:Ye= - Jnx(nxf(O))do
=
81rf(0)/3,
(1) El cálculo que se expone a continuación supone que se cumple la condición Ze9/1ic ~ 1 (cf. la nota
de la pág. 534,).
(2) Un camino más directo consistiría en calcular la energía de desdoblamiento como valor medio
de la energía de interacción de los momentos magnéticos del electrón y del núcleo. Sin embargo, en el
caso de un electrón s no conviene aplicar este método porque conduce a una suma de integrales cada una
de las cuales, tomada por separado, diverge (cf. problema ]).
(ª) Véase tomo II, Teoría clásica de los campos, fórmula (43.7). Hay que observar que, en esta última,
el vector R tiene por origen el elemento d Vy por extremo el punto de observación, mientras que en (120.8)
el vector r está orientado en el sentido opuesto (del centro al elemento d V).
Estructura del núcleo atómico
538
o, finalmente, para el operador de interacción
P-is =
.Ye
-µ. •
(120.9)
= (l61r/3i)µ,µ,ot/i 2(0)i.s.
Si el momento cinético total del átomo es J = S = t, el desdoblamiento hiperfino conduce a la formación de un d oblete (F = i ± i); de acuerdo con (120.5)
y (120.9) encontramos para la distancia entre los dos niveles del mismo:
(120.10)
Ei+t - Et-i = (87T/3i)µ,µ,o(2i+ l)tfi2(0).
Dado que el valor 1/'(0) es proporcional a VZ (véase§ 71), la magnitud de este desdoblamiento crece proporcionalmente al número atómico.
PROBLEMAS
l. Calcular el desdoblamiento hiperfino (debido a la interacción magnética) para un átomo
que, fuera de las capas completas, contiene un electrón con momento cinético orbital l (E. FERMI,
1930).
Solución. El potencial vector y la intensidad del campo magnético creado por el momento
magnético del núcleo µ son iguales a:
µ. x n
3n(µ..n)- µ.
A = ~ , Je=
r3
(div A
=
O). Mediante estas expresiones, escribiremos el operador de interacción en la forma
e
eli
me
me
A
-A.p+-Je.s =
2µ,o
-µ..~+3(s.n)n-s].
r3
A
Después de promediar respecto de un estado con un valor dado de j, la expresión entre paréntesis
rectos tendrá la dirección de j. Por ello podemos escribir:
p-ij
= 2µ,oP,.J[i.¡ + 3(s.n)(n..f)- s.j]r-3.
El valor medio nink se calcuió en. el problema 2, § 29. Substituyéndolo en la fórmula anterior y
pasando a valores propios, obtenemos:
i.·[i.. +21(1+ l)s.j-6(s.l)(j.l)Jr-a
2µ, 0 µ,
i
J
J
(2/-1)(21+3)
de donde, después de un cálculo simple, se encuentra en definitiva:
µ,oµ, l(l+l)
_
---F(F+l)r-3
i j(j+ 1)
'
'
Estructura hiper/ina de los niveles moleculares
donde F = j +i, y j
del electrón.
=
l
± ! . El promedio de
539
,-a se refiere a la parte radial de la función de onda
2. Determinar el desdoblamiento Zeemann de las componentes de estructura hiperfina de
un nivel atómico (S. GouosMIT, R. BACHER, 1930).
Solución. En la fórmula (112.3) (suponemos que el campo es tan débil que el desdoblamiento
que provoca es pequeño comparado con los intervalos de estructura hiperfina) el promedio debe
efectuarse ahora no solamente respecto del estado electrónico, sino también respecto de las direcciones del spin nuclear. Como resultado del primer promedio se obtiene ll.E = µ.ogJJ11;(1, con el
valor anterior de gJ (112.6). El segundo promedio da, análogamente a (112.4),
De esta manera obtenemos, en definitiva, ll.E
= µ.ogp ;eMF,
donde
F(F + l)+J(J+ 1)-i(i+ 1)
gp - g J - - - - - - - - - - 2F(F + 1)
§ 121.
Estructura hiperfina de los niveles moleculares
La naturaleza de la estructura hiperfina de los niveles energéticos de una molécula
es análoga a la de la estructura hiperfina de los niveles atómicos.
En la inmensa mayoría de las moléculas el spin total electrónico es igual a cero.
El principal origen del desdoblamiento hiperfino de los niveles es para ellas la interacción cuadripolar de los núcleos con los electrones; desde este punto de vista, ciaro
está, toman parte en la interacción solamente aquellos núcleos cuyos spins i son diferentes de cero o de f, ya que en el caso contrario su momento cuadripolar es igual
a cero.
Teniendo en cuenta que el movimiento de los núcleos en una molécula es relativamente lento, el promedio del operador de interacción cuadripolar respecto del
estado de la misma se efectúa en dos etapas: primero hay que promediar respecto
del estado electrónico para núcleos fijos, y, luego, debe promediarse respecto de la
rotación de la molécula.
Consideremos, en primer lugar, una molécula diatómica. Como resultado de la
primera etapa del promedio, la interacción de cada uno de los núcleos con los electrones se expresa mediante un operador que es proporcional al escalar Qiknink
formado a partir del operador del tensor momento cuadripolar del núcleo y del
vector unitario n correspondiente al eje de la molécula - que es la única magnitud
que determina la orientación de la misma respecto de la dirección del spin del núcleo. Teniendo en cuenta que Qu = O, este operador se puede representar en la
forma
(121.1)
S40
Estructura del núcleo atómico
para un valor dado de la proyección i( del spin nuclear sobre el eje de la molécula,
esta cantidad es igual a b [i 2; - ti(i+I)J.
El resultado del promedio del operador (121.1) respecto de la rotación de la
molécula, en cambio, viene dado en función del operador K del momento de rotación, momento que se conserva. El promedio del producto nink se efectúa según
la fórmula obtenida en el problema 2, § 29 (con el vector K en vez de 1) y conduce a
b
(ZK- l )(ZK + )ídk[í<./(_k + f?d<-i-iDtkK(K + 1) ].
3
(121.2)
Los valores propios de este operador se encuentran de la misma manera que para el
operador (120.6).
En el caso de una molécula poliatómica, en vez de (121.1) se obtiene, en general, un operador de la forma
(121.3)
donde bik es un tensor de traza nula característico del estado electrónico de la molécula. Después de promediar respecto de la rotación de ésta, dicho operador se
expresa en función del momento total de rotación J por una fórmula del tipo
(121.4)
El coeficiente b puede darse, en principio, en función de las componentes del
tensor b;k respecto de los ejes principales de inercia de la molécula ~' r¡, C; dado
que estos ejes están rígidamente ligados -a la misma, las componentes b~~' ... constituyen una característica de la molécula no afectada por el promedio. Consideremos
para ello el escalar bikldk. Un cálculo que se apoya en (121.4) nos da:
btkli]k = bl(J+ l)[t](J+ 1)+ 1];
(121.5)
(el cálculo es análogo al efectuado en el problema 2, § 29). De otra parte, expresando
el producto tensorial con relación a los ejes t r¡, C, tenemos:
(121.6)
donde se ha tenido en cuenta que los valores medios de los productos J~Jc, ... son
iguales a cero (1). Los valores medios de los cuadrados J~ 2 , ••• se calculan, en principio, a partir de las funciones de onda de los correspondientes estados de rotación
del trompo. En particular, para el trompo asimétrico tenemos simplemente:
11 = k2; 1¡, 1; = Hl(J+ t)-k2].
(1) En efecto, en una representación en la que la matriz de una de las componentes de J (digamos
la Je) es diagonal, las matrices de los productos J~ Je. Jr1l!:; tienen solamente elementos que conrresponden
a una variación del número cuántico k igual a la unidad; pero las funciones de onda de los estados estacionarios del trompo asimétrico contienen funciones '1/-'Jk con valores de k que difieren en un número
par (véase § 103).
Estructura hiperfina de los niveles moleculares
541
Si los spins nucleares son iguales a i, la interacción cuadripolar no existe. En
este caso, una de las causas principales del desdoblamiento hiperfino es la interacción magnética directa de los momentos magnéticos nucleares entre sL El operador
de interacción de dos momentos magnéticos fLi = µ 1iJi1, µ 2 = µ 2i 2/i2 viene dado por
la fórmula:
Para calcular la energía de desdoblamiento, este operador debe promediarse respecto
del estado de la molécula de manera análoga a la antes descrita.
Cuando en la molécula existen átomos pesados, una contribución al desdoblamiento hiperfino comparable a la debida a la interacción directa, procede de la
interacción indirecta de los momentos nucleares por mediación de la nube electrónica.
Desde un punto de vista formal, esta interacción es un efecto de segundo orden
de la teoría de perturbaciones respecto de la interacción del spin nuclear con los
electrones. Los resultados del § 120 permiten hallar fácilmente que la razón de la
magnitud de este efecto al efecto de interacción directa de los momentos nucleares
es del orden de (Ze 2/lic) 2 ; para grandes valores de Z, esta razón es comparable con
la unidad.
Finalmente, una cierta contribución al desdoblamiento hiperfino de los niveles
moleculares se debe al efecto de interacción del momento nuclear con la rotación
de la molécula. Una molécula en rotación, en tanto que sistema de cargas en movimiento, crea un determinado campo magnético; este campo se puede calcular
mediante conocidas fórmulas de electrodinámica cuando se da la densidad de corriente j = en x r, donde e es la densidad de carga (de los electrones y de los núcleos) en la molécula en reposo y n es su velocidad angular de rotación. La magnitud del desdoblamiento de los niveles se obtiene como energía del momento
magnético del núcleo en este campo, debiéndose expresar las componentes de la
velocidad angular de la molécula en función de las componentes de su momento
cinético (cf. § 103).
CAPÍTULO
XVII
TEORÍA DE LAS COLISIONES ELÁSTICAS
§ 122.
Teoría general de la dispersión
En la mecánica clásica, la colisión de dos partículas está del todo determinada
por sus velocidades y por el « parámetro de impacto» (es decir, la distancia a que
pasarían una de otra si no existiera interacción). En la mecánica cuántica, cambia
el propio planteo del problema, ya que en el movimiento con velocidades determinadas deja de tener sentido el concepto de trayectoria, y con él también el de « parámetro de impacto ». El objeto de la teoría es ahora tan sólo calcular la probabilidad
de que, como resultado de la colisión, las partículas se separen (o, como suele decirse, se dispersen) formando tal o cual ángulo. Se trata aquí de las llamadas colisiones elásticas, en las que ni se produce transmutación ninguna de las partículas, ni
(si se trata de partículas complejas) varía su estado interno.
El problema que plantea el choque elástico, como cualquier problema de dos
cuerpos, se reduce al problema de la dispersión de una partícula, con la masa reducida, en el campo U(r) de un centro de fuerzas fijo (1). La reducción se efectúa pasando a un sistema de coordenadas en el que el centro de masas de ambas partículas
se encuentra en reposo. El ángulo de dispersión en este sistema lo designaremos
por O. Este ángulo está ligado por fórmulas sencillas con los ángulos ~1 y ~2 de desviación de ambas partículas en el sistema de coordenadas en el que una de ellas (la
segunda) se encontraba en reposo antes de la colisión (2):
(122.1)
donde m1, m 2 son las masas de las partículas. En particular, si las masas de ambas
son iguales (m1 = m 2 ), se obtiene simplemente:
-&1=
la suma ~1
+~2 =
n/2,
¡O,
(122.2)
es decir, las partículas se separan formando un ángulo recto.
(1) Prescindimos aquí de la interacción spin-órbita de las partículas (si es que poseen spin). Al suponer
que el campo es central, excluimos del análisis también aquellos procesos tales como, por ejemplo, la dispersión de los electrones por las moléculas.
(2)
Véase tomo I, Mecánica, § 17.
Teoría general de la dispersión
543
En lo que sigue utilizamos constantemente (salvo indicación explícita en contra)
un sistema de coordenadas ligado con el centro de masas.
Representaremos una partícula libre que se mueve en el sentido pos1t1vo del
eje z por una onda plana que escribiremos en la forma '1/J = eikz, es decir, elegimos
la normalización en la que la densidad de corriente en la onda es igual a la velocidad
de la partícula, v. Las partículas dispersadas han de representarse, lejos del centro
del campo, por una onda esférica divergente de la forma f(O)eikr/r, donde f(O) es
una cierta función del ángulo de dispersión() (ángulo formado por el eje z y la dirección de la partícula dispersada); esta función se llama amplitud de dispersión. De
esta manera la función de onda exacta, que es solución de la ecuación de ScHRODINGER con la energía potencial U(r ), debe tener a grandes distancias la forma
asintótica
if,
~ etkz
+¡ (8)etkr/r.
(122.3)
La probabilidad de que la partícula dispersada atraviese en la unidad de tiempo
el elemento de superficie dS = r2do (do es el elemento de ángulo sólido) es igual
a vr-2 /J( 2dS = v!f j 2 do (1). La razón de esta probabilidad a la densidad de corriente
en la onda incidente es igual a:
dcr = 1/(8)1 2 do.
(122 4)
Esta magnitud tiene las dimensiones de una área y se llama sección eficaz de dispersión dentro del ángulo sólido do. Si se hace do = 2n sen OdO, obtenemos la sección eficaz
(122.5)
dcr = 21r sen 8 lf(8)12 d8
para la dispersión en el intervalo angular (8, O+dO).
Toda solución de la ecuación de ScHRODINGER en un campo central se puede
escribir como suma de productos de armónicos esféricos por funciones radiales
R1(r) que satisfacen las ecuaciones
J
l(l+l) 2m
- 1 -d ( r2 -dRz) + [ k2-----U(r)
Rz = O.
r2 dr
dr
,2
ñ2
(122.6)
La forma asintótica de la función R1 es la onda estacionaria
Rz
~
azsen(kr-}l1T+8z)
,
(122.7)
r
(1) En este razonamiento se supone, implícitamente, que el haz de partículas incidente está limitado
por un diafragma que es grande (para evitar efectos de difracción), pero de dimensiones finitas, como de
hecho ocurre en los experimentos reales de dispersión. Por esta causa no existe 'interferencia entre ambos
términos de la expresión (122.3); el cuadrado :1p' 2 se toma en puntos en los que no existe la onda incidente.
544
Teoría de las colisiones elásticas
(véase (33.18)). Veamos cómo es posible expresar la amplitud de dispersión en función de las fases ó1 de estas funciones.
La forma general de una solución de la ecuación de ScHRODINGER que presente
simetría axil (respecto del eje z), cual debe ser la solución que describe la dispersión,
es una suma de productos R 1(r )P1( cos O). De acuerdo con esto, escribiremos la forma
asintótica general de una tal solución en la forma
00
t/J
¿ (2l+l)AzPz(cos8)-----
~
sen(kr-ilrr+Sz)
kr
l=O
00
=
•
""(21 + l)AzPz(cosO)-'-{exp[ -i(kr-ihr+8z)]-exp[i(kr-fl1r+8z)]}.
L
2kr
l=O
Los coeficientes A 1 deben elegirse de manera que esta función tenga la forma (122.3).
Para ello utilicemos el desarrollo de la onda plana en ondas esféricas obtenido en
el § 34. La forma asintótica de este desarrollo es la (34.2):
<X)
eikz
•
~ ""il(2l+ l)Pz(cos8)-'-{exp[-i(kr-il1r)]-exp[i(kr-fl1r)]}.
L
2kr
l=O
La diferencia 1P - eikz debe representar una onda divergente, es decir, de ella deben
desaparecer todos los términos que contienen e-ikr. Para ello es necesario hacer
De esta manera la función de onda se escribe
•
00
tp ~ _,._ "" (21 + 1)Pz(cos 8)[( -1 )le-ikr - Szeikr],
2krL
(122.8)
l=O
donde hemos introducido la notación
Si =
Para el coeficiente de eikr/r en la diferencia 1P de dispersión, obtenemos, en cambio:
1
f(O) =
ik
2
(122.9)
e2ia1.
eikz,
es decir, para la amplitud
¿ (2l+l)[Sz-l]Pz(cos8).
00
(122.10)
l=O
Esta fórmula resuelve el problema de expresar la amplitud de dispersión en función
Teoría general de la dispersión
de las fases b¡
(H. FAXÉN,
J.
HOLTSMARK,
545
1927) (1).
Integrando da respecto del ángulo sólido, obtenemos la secc10n eficaz total
de dispersión a, que es la razón de la probabilidad total de dispersión de la partícula (por unidad de tiempo) a la densidad de flujo de probabilidad de la onda
incidente. Substituyendo (122.10) en la integral
7T
cr = 27T
Jlf(B)l
2 sene
dB,
o
y recordando que los polinomios de Legendre con valores diferentes de l son ortogonales entre sí y que
7T
JPl2(cos B)senB dB = 2/(21+1),
o
obtenemos la siguiente expresión para la sección eficaz total:
477
00
""(2l+l)sen2 Sz.
k2 ~
cr = -
(122.11)
z-o
Cada uno de los términos de esta suma es una sección eficaz « parcial » a1 correspondiente a la dispersión de las partículas con momento orbital dado l. Obsérvese
que el máximo valor posible de esta sección eficaz es
crz,max = (4'1T/k 2 )(2Z+ 1).
(122.12)
Comparándolo con la fórmula (34.4), vemos que el número de partículas dispersadas
con momento cinético l puede resultar cuatro veces mayor que el número de dichas
partículas en el flujo incidente. Esta circunstancia es un efecto puramente cuántico
debido a la interferencia entre las partículas dispersadas y las no dispersadas.
En lo que sigue convendrá utilizar también las « amplitudes parciales de dispersión » Ji, que definiremos como coeficientes del desarrollo
f (8)
=
I: (2/ + 1)fzPz( cos 8).
l
(122.13)
(1) El problema de reconstruir la forma del potencial, causa de la dispersión, a partir de 1 las fases Oz,
supuestas conocidas, tiene un interés fundamental. Esta cuestión ha sido resuelta por l. M. GEL'FAND,
B. M. LEVITAN, V. A. MARCHENKO. De este análisis resulta que para determinar U(r) basta, en principio,
conocer ,5o(k) como función del número de onda en todo el intervalo desde k = O a k = oo y también
los coeficientes a 11 en las expresiones asintóticas (para r-¿,- oo) de las funciones de onda de los estados
que corresponden a los niveles discretos (negativos) Eu de la energía: Rno ~ (an/r)e-Knr (Kn = v(2mlEnl)/li)
cuando estos existen. La determinación de U(r) a partir de estos datos se reduce a la resolución de una
ecuación integral lineal (véase V. A. MARCHENKO, DAN SSSR 104, 695, 1955).
546
Teoría de las colisiones elá.o;ticas
De acuerdo con ( 122.1 O), dichas amplitudes están ligadas con las fases ~, por la re)ación
1
1
fz = --'Sz-1) = -(e2iBi-1)
(122.14)
7Jii
2ik
'
y las secciones eficaces parciales vienen dadas por
az
§ 123.
= 47r(2l+ 1)11z¡2.
(122.15)
Estudio de la fórmula general
Las fórmulas obtenidas son aplicables, en principio, a la dispersión en un campo
cualquiera U(r) que tiende a cero en el infinito. El estudio de estas fórmulas se reduce al estudio de las propiedades de las fases IJ 1 que aparecen en ellas.
Para estimar el orden de magnitud de las fases /J 1 con grandes valores de !, nos
apoyaremos en el hecho de que para valores l grandes el movimiento es cuasiclásico (véase § 49). Por ello, la fase de la función de onda viene determinada por la
integral
r
f J[
(l+t)2 2mU(r)J
k2- - - - - - dr+Lrr
fi2
,2
"'" '
r,
donde r0 es una raíz del radicando (r > r0 es la región clásicamente accesible del
movimiento). Restando de aquí la fase
J[
J
k2-+
f
([+.l.)2
r
dr+b
de la función de onda del movimiento libre y haciendo que r-+ oo, obtenemos,
por definición, el valor de IJL. Para grandes valores de !, el valor rO es también grande;
por ello U(r) es pequeño en todo el dominio de integración y obtenemos aproximadamente
CX)
S¡ = -
fmU(r) dr/li" J[k•-(l~!)]
(123.1)
r.
Esta integral (si converge) es del orden de magnitud de
Sz ,..., mU(ro)ro/kli.2.
El orden de magnitud de r0 es r0
{"-..,
(123.2)
1/k.
Si U(r) tiende a cero en el infinito como
,-n, con n > 1, la integral (123.1) con-
Estudio de la /órmula general
547
verge y las fases b1 son finitas. Por el contrario para n .;;;; 1 la integral diverge, de
modo que las fases ó1 resultan ser iguales a infinito. Esto vale cualquiera que sea /,
ya que la convergencia o la divergencia de la integral (123.1) depende del comportamiento de U(r) para grandes valores de r, y a grandes distancias (donde el campo
U(r) es ya débil) el movimiento radial es cuasiclásico para cualquier l. Cómo hay
que entender las fórmulas (122.10-11) cuando las fases b1 son infinitas,_ se indicará
más adelante.
Consideremos primero la convergencia de la serie (122.11 ), que representa la
sección eficaz total. Para valores grandes de l, las fases b1 ~ 1, conforme se ve a
partir de (123.1) si se tiene en cuenta que U(r) disminuye más rápidamente que 1/r.
Por ello podemos hacer sen2b1 ';;; bz2, y así la suma de los términos residuales de la
serie (122.11) será del orden de ~ Mz2. De acuerdo con un conocido criterio integral
l~ 1
de convergencia de las series, de aquí se deduce que la serie considerada converge
si converge la integral
f
Mz2 di. Substituyendo en ella ( 123.2) y cambiando l por
kr 0 , obtenemos la integral
00
J U (ro)ro
2
3
dro.
,-n
Si U(r) disminuye en el infinito como
con n > 2, esta integral converge y la
sección eficaz total es finita. Por el contrario, si el campo U(r) disminuye como I/r 2
o aun más lentamente, la sección eficaz total resulta infinita. Físicamente, esto se
debe al hecho de que cuando el campo disminuye lentamente con la distancia, la
probabilidad de la dispersión en ángulos pequeños es muy grande. Obsérvese, en
relación con esto, que en la mecánica clásica y para todo campo que se anula sólo
para r -+ =, una partícula cuyo parámetro de impacto es tan grande cuanto se
quiera, pero finito, experimenta siempre una desviación, ciertamente de ángulo
pequeño, pero no nulo; como consecuencia, la sección eficaz total de dispersión
resulta ser infinita cualquiera que sea la ley de disminución de U(r) (1). Este razonamiento no es aplicable en la mecánica cuántica, puesto que hablar de dispersión
en un cierto ángulo sólido es sólo posible si se cumple la condición de que éste
sea grande comparado con la indeterminación en la dirección del movimiento de la
partícula. Pero si se conoce el « parámetro de impacto» con una precisión ~(!,
por ello mismo se produce una indeterminación h/ ~(! en la componente transversal
del impulso, es decir, una indeterminación ""'ñ/mv~e en el ángulo.
Visto el importante papel que la dispersión representa en el caso de ángulos
pequeños y cuando la ley de disminución de U(r) es lenta, surge naturalmente la
cuestión de si no divergirá la amplitud de dispersión/(6) para 6 = O incluso cuando
U(r) disminuye más rápidamente que 1/r 2 • Haciendo en (122. 10) 6 = O obtenemos
1
( )
Este hecho se manifiesta en la divergencia de la integral J2JT(2 de, que determina la sección eficaz
total en la mecánica clásica.
548
Teoría de las colisiones elásticas
t/º
para los términos residuales de la suma una expresión que es proporcional a I
z·
Razonando como en el caso anterior, al determinar el criterio de convergencia
de la suma llegamos a una integral
a:,
JU(ro)ro
2
dro,
que diverge ya para U(r) ,_, ,-n, n < 3. Así, pues, la amplitud de dispersión tiende
a infinito para fJ = O en los campos que disminuyen como 1/r3 o más lentamente.
Examinemos finalmente el caso en que la propia fase c)z es infinita, lo que ocurre
para U(r) ,_, ,-n, n < J. En virtud de los resultados antes obtenidos, es desde Juego
evidente que para una disminución tan lenta del campo serán iguales a infinito
tanto la sección eficaz total como la amplitud de dispersión para fJ = O. Sin embargo,
queda todavía por resolver la cuestión de cómo calcular f(fJ) para fJ =/= O. Observemos
ante todo que vale la fórmula (1)
a:,
¿
(2l+l)Pz(cos8) = 4ó(l-cos8)
(123.3)
l=O
Con otras palabras, para todos los fJ =/= O esta suma es igual a cero. Por lo tanto, en
la expresión (122~10) para la amplitud de dispersión se puede prescindir de la unidad
en los paréntesis S 1 -- 1 de cada término de la suma para fJ =/= O, con lo que queda
1
f(8) = Zik
a:,
¿
(2l+l)Pz(cos8)e2i8z.
(123.4)
l-0
Si se multiplica el segundo miembro de esta igualdad por el factor constante
e- 2 i 0o, esto no se refleja en la sección eficaz, determinada por el cuadrado del módulo [f(fJ)f 2, y la fase de la función compleja/(fJ) cambia solamente en una constante
que carece de importancia. Por otra parte, al formar la diferencia ~z - ~o de las
expresiones (123.1) la integral de U(r), que diverge, se reduce y queda una cantidad
finita. De esta manera, para el cálculo de la amplitud de dispersión se puede utilizar,
en el caso considerado, la fórmula
f(8) =
1
ik
2
¿
co
(2l+l)Pz(cosO)e2iC8i-8o>.
(123.5)
l-0
(1) Esta fórmula es el desarrollo de la función ,5 en polinomios de Legendre y su validez se verifica
directamente multiplicando ambos miembros por sen0P1(cos0) e integrando respecto de O. Al hacerlo,
la integral
a:,
JS(x) dx
o
de la función par r)(x) se toma igual a t.
Condición de unitariedad en la dispersión
§ 124.
549
La condición de unitariedad en la dispersión
La amplitud de dispersión en un campo arbitrario (no necesariamente central)
satisface determinadas relaciones que son consecuencia de condiciones físicas muy
generales.
La forma asintótica de la función de onda, a grandes distancias, para la dispersión elástica en un campo arbitrario es
'P
~ eikrn.n'
1
+ _¡ (n,n')etkr.
r
(124.1)
Esta expresión difiere de (122.3) en que la amplitud de dispersión depende de las
direcciones de dos vectores unitarios - uno, en la dirección de la partícula incidente (n), y el otro, en la dirección de dispersión (n') - y no solamente del ángulo
que forman.
Una combinación lineal cualquiera de funciones de la forma (124.1) con diferentes direcciones de incidencia n representa también un posible proceso de dispersión.
Multiplicando las funciones (124.1) por coeficientes arbitrarios F(n) e integrando
respecto de todas las direcciones n (elemento de ángulo sólido do), escribiremos
dicha combinación lineal en forma de integral:
eikrf F(n)f(n,n') do.
f F(n)eikm,n' do+-;-
(124.2)
Dado que la distancia r es tan grande cuanto se quiera, el factor eikrn.n' en la primera integral es una función rápidamente oscilante de la dirección del vector variable n. Por lo tanto, el valor de la integral viene determinado fundamentalmente
por las regiones próximas a aquellos valores n para los que el exponente posee un
extremo (n = ± n'). En cada una de ellas el factor F(n) ~ F(± n') se puede sacar
fuera del signo de integral, con lo que la integración da (1):
e-ikr
eikr
etkr
2mF( - n ' ) - -2mF(n')- + kr
kr
r
f
/(n,n')F(n) do.
Escribamos esta expresión en la forma compacta de un operador, prescindiendo
del factor común 2nilk:
e-ikr
eikr
- F ( - n')- -SF(n'),
r
r
(124.3)
(1) Para el cálculo de la integral, desplazaremos el camino de integración respecto de la variable
µ = cos () (0 es el ángulo entre n y n') en el plano complejo ¡t de modo que se «incurve» hacia el semiplano superior, dejando fijos los extremos ¡t = ± 1. Entonces, al alejarse de cada uno de estos puntos, la
función eikr¡1 disminuye rápidamente.
550
Teoría de las colisiones elásticas
donde
S = 1+2ikj
y
(124.4)
J es el operador integral:
/ F( n') =
~
f
f( n,n')F( n) do,
(124.5)
El operador & se llama operador (o matriz) de dispersión, o simplemente, matriz S;
fue introducido por primera vez por W. HEISENBERG (1943).
El primer término (124.3) representa una onda que converge hacia el centro
del campo, y el segundo, una onda que diverge del mismo. La conservación del
número de partículas en la dispersión elástica se expresa igualando los flujos totales
de partículas en las ondas convergente y divergente. Con otras palabras, estas dos
ondas deben tener la misma normalización. Para ello el operador de dispersión S
ha de ser unitario (§ 12), es decir, debe tenerse
Ss+
=
1,
(124.6)
o bien, substituyendo (124.4) y efectuando el producto:
/-/+ = 2ikjj+.
(124.7)
Finalmente, teniendo en cuenta la definición (124.5), escribiremos la condición
de unitariedad para la dispersión en la forma
ºk
/(n,n') - /*(n',n) = ;
77
f
/(n,n")/*(n',n") do".
(124.8)
Para n = n', la integral en el segundo miembro de la igualdad no es sino la
sección eficaz de dispersión total a = flf(n, n")l 2 do". La diferencia que aparece
en el primer miembro de la misma se reduce, en este caso, a la parte imaginaria
de la amplitud f(n, n). De esta manera obtenemos la siguiente relación general
entre la sección eficaz total de dispersión elástica y la parte imaginaria de la amplitud de la dispersión para ángulo cero:
im/(n,n) = kcr/417.
(124.9)
(éste es el llamado teorema óptico de la dispersión).
Otra propiedad general de la amplitud de dispersión se puede obtener todavía
partiendo de la condición de simetría respecto de la inversión del tiempo. En la
mecánica cuántica, esta simetría se expresa en el hecho de que si la función 1P representa un estado posible cualquiera, también la función conjugada compleja 't/J*
corresponde a un cierto estado posible (§ 18). Por ello, la función de onda
Condición de unitariedad en la dispersión
eikr
551
eikr
-F*( - n')- -S*F*(n'),
r
r
conjugada compleja de la función (124.3), describe también un posible proceso de dispersión. Introduzcamos una nueva función arbitraria, haciendo
- S* F*(n') = <D(- n').
Teniendo en cuenta el carácter unitario del operador S, resulta entonces
F*(n') = -(S*)-1<1>(-n') = -S<l>(-n');
introduciendo el operador Í de inversión de las coordenadas, que cambia el signo
de los vectores n y n', escribiremos:
F*(-n') = ÍF*(n') = -!Sl<l>(n').
Obtenemos de esta manera la función de onda, invertida respecto del tiempo, en
la forma
e-ikr
eikr
_
-<I>( - n')- -1S1<l>(n').
r
r
Esta función debe coincidir en esencia con la función de onda de partida (124.3).
La comparación prueba que para ello debe cumplirse la condición
!Si=
s;
(124.10)
ambas funciones difieren entonces tan sólo en la manera de representar la función
arbitraria.
La relación correspondiente para la amplitud de dispersión se obtiene pasando
de la igualdad entre operadores (124.10) a la forma matricial. La transposición
cambia entre sí las posiciones de los vectores inicial y final, n y n', y la inversión
cambia sus signos. Tenemos por ello:
S(n,n') = S(-n', -n),
(124.11)
/(n,n') = /(-n', -n).
(124.12)
o bien, lo que es lo mismo:
Esta relación (llamada teorema de reciprocidad) expresa un resultado natural: la
coincidencia de las amplitudes de dos procesos de dispersión que resultan ser inver..,
sos en el tiempo el uno del otro. La inversión del tiempo permuta los estados inicial
y final y cambia los sentidos del movimiento de las partículas en sus opuestos.
Para la dispersión de un campo central, se simplifican las relaciones generales
que hemos obtenido. En este caso, la amplitud f(n, n') depende solamente del ángulo () entre n y n'. La igualdad (124.12) se transforma entonces en una identidad.
552
Teoría de las colisiones elásticas
La condición de unitariedad (124.8), en cambio, toma la forma
Imf(U) =
~
ff
(y)/•(y') do;
(124.13)
y, y' son los ángulos entre n, n' y una dirección cualquiera fija en el espacio. Si se
representaf(O) en la forma (122.13), mediante el teorema de adición de los armónicos
esféricos (c. 8) se deduce de (124.13) la siguiente relación para las amplitudes parciales:
(124.14)
Esta fórmula se puede obtener también directamente a partir de la expresión (122.14),
según la cual l2ik.fi+ 112 = l. El teorema óptico (124.9), en el caso de dispersión
por. un campo central, se obtiene también de manera fácil directamente de las fórmulas (122.10) y (122.11).
Escribiendo (124.14) en la forma Im(l/.fi) = - k, vemos que la amplitud
debe tener la forma
fz
= 1/(gz-ik),
Ji
(124.15)
donde g 1 = g¡(k) es una cantidad real (1). En lo que sigue utilizaremos más de una
vez esta representación de la amplitud.
Para la dispersión en un campo central, veamos qué relación existe entre el
concepto de operador de dispersión, que acabamos de introducir, y las magnitudes
que aparecen en la teoría desarrollada en el § 122.
Dado que el momento cinético orbital se conserva en un campo central, el operador de dispersión S conmuta con el operador l. Con otras palabras, la matriz S
es diagonal en la representación /. En virtud del carácter unitario del operador S,
sus valores propios deben ser iguales a la unidad en módulo, es decir, deben tener
la forma e2ici, con las cantidades b1 reales. Es fácil ver que éstas coinciden con los
corrimientos de fase de las funciones de onda, de modo que los valores propios
de la matriz S coinciden con las. magnitudes S 1 (122.9) introducidas en el § 122;
los valores propios del operador / = (S-1)/2ik coinciden, según esto, con las
amplitudes parciales (122.14). En efecto, si como función F(n) se elige P 1(cos O)
(con lo que F(- n) = Pi(- cos O) = (- 1)1P1(cos O)), la función de onda (124.3)
debe coincidir con la solución de la ecuación de SCHRODINGER representada por un
término de la suma en (122.8) ~ pero esto significa que SPz( cos 8) = SzPz( cos 8).
<1)
Esta cantidad está ligada con la fase Oz por la relación
g, = k cot8z.
(124.15a)
Fórmula de Born
553
Para una onda plana que incide en la dirección del eje z, la función F(n) en (124.2)
es la función F =,= 415( 1 - cos 8), donde 8 es el ángulo que forma n con el eje z, la
función ó se define aquí conforme se indica en la nota de la pág. 548, y el coeficiente
de la misma se elige de manera que al substituir en el segundo miembro de la definición (124.5) se obtenga simplemente f(O) (donde ahora 8 es el ángulo entre n'
y el eje z). Representando la función ó en la forma (123.3)
00
F = 4S(l - cos O) =
¿ (2l + 1)P1( cos O),
(124.16)
l=O
y aplicándole el operador
en la forma (122.13).
J,
obtenemos, cual debe ser, la amplitud de dispersión
Finalmente, hagamos todavía la siguiente observación. Desde el punto de vista
matemático, la condición de unitariedad (124.8) indica que no toda función dada
a priori f(n, n') puede ser la amplitud de dispersión en un cierto campo. En particular, no toda función f(O) puede ser la amplitud en un ca~po central. En virtud de
(124.13), su parte real y su parte imaginaria deben cumplir una determinada condición. Si se escribe f(O) = lf leirx, dar el módulo lfl para todos los ángulos reduce la
relación (124.13) a una ecuación integral mediante la que es posible, en principio,
determinar la fase incógnita :x(O). Con otras palabras, si se conoce la sección eficaz
de dispersión para todos los ángulos (el cuadrado !fl 2), es posible, en principio, reconstruir también la amplitud. Esta reconstrucción, sin embargo, no es del todo
unívoca y la amplitud queda determinada tan sólo salvo el cambio
f (O)
-+ -
f *(O),
{124.17)
que deja invariante la ecuación (124.13) (y que, claro está, no modifica la sección
eficaz l/12) (1). Esta falta de unicidad, sin embargo, desaparece si la amplitud de dispersión se considera no sólo como función del ángulo, sino también como función
de la energía. Veremos más adelante (§§ 128-129), que las propiedades analíticas de
la amplitud como función de la energía no son invariantes respecto de la transformación (124.17).
§ 125.
Fórmula de Born
La sección eficaz de dispersión se puede calcular de forma general en un caso muy
importante - cuando el campo dispersor puede considerarse como una perturbación (2). En el § 45 se demostró que ello es posible con sólo que se cumpla una
de las dos condiciones:
(125.1)
IU/ ~ ft2/ma2
(1) La transformación ( 124.17) equivale a cambiar simultáneamente los signos de todas las fases <5i
en (122.10).
(2) En la teoría general desarrollada en el§ 122, esta aproximación corresponde al caso en que las fases
1)1 son pequeñas; además, es necesario que estas fases se puedan calcular a partir de una ecuación de ScHR6DJNGER en la que la energía potencial se considera como una perturbación (véase el problema 4).
554
Teoría de las colisiones elásticas
o bien
1
u¡
~
liv/a = (tz2/ma2)ka,
(125.2)
donde a es el radio de acción del campo U(r) y U es su orden de magnitud en el dominio fundamental de existencia del mismo. Si se cumple la primera condición,
la aproximación considerada es aplicable cualquiera que sea la velocidad. En cambio,
la segunda condición pone de manifiesto que es siempre aplicable para velocidades
suficientemente grandes.
De acuerdo con el§ 45, busquemos la función de onda en la forma ifi = ifi<0 >+efi<1 >,
donde rp<0 > = eik.r corresponde a la partícula incidente con vector de onda k = p/li.
La fórmula (45.3) nos da:
m
if,Cll(x,y,z) = - 7Tñ
2 2
I
dV'
U(x',y',z')ei<k,r'+kR> --¡¡_·
(125.3)
Eligiendo el centro dispersor como origen de coordenadas, introduzcamos el vector
posición R0 del punto de observación de 'f/J(I) y designemos por n' el versor del vector R 0 . Sea r' el vector posición del elemento de volumen dV', con lo que R = R 0 - r'.
A grandes distancias del centro se tiene R 0 ~ r', de modo que
R = IRo-r'j,...., Ro-r' .n'.
Substituyendo en (125.3), obtenemos 1~ siguiente expresión asintótica para
if,m
~
- -m- -eikRo
-2TTñ 2
I
Ro
tp< 1):
U(r')ei(k-k').r' d V'
(donde k' = kn' es el vector de onda de la partícula después de la dispersión). Comparando con la definición (122.3) de la amplitud de dispersión, obtenemos para
ésta la expresión
f
= _
_!!:_
27rn,2
f
Ue-iq.r d V
,
(125.4)
en la que hemos cambiado la notación correspondiente a las variables de integración y se ha introducido el vector
= k'-k,
(125.5)
= 2k sinfO,
(125.6)
q
cuyo módulo es
q
donde O es el ángulo formado por k y k', es decir, el ángulo de dispersión.
Fórmula de Born
555
Finalmente, elevando al cuadrado el módulo de la amplitud de dispersión, obtenemos la siguiente fórmula para la sección eficaz de dispersión en el elemento
de ángulo sólido do:
dcr
f
= -m2- 1 Ue-iq.r¿ V 12 do.
41r2/l4
(125.7)
Vemos así que la dispersión acompañada de una variación del impulso igual
a ñq viene determinada por el cuadrado del módulo de la correspondiente componente de Fourier del campo U. La fórmula (125.7) fue obtenida por primera vez
por M. BORN (1926); la correspondiente aproximación en la teoría de colisiones
se llama, frecuentemente, aproximación de Born.
Obsérvese que, en esta aproximación, se cumple la relación
f(k,k') =f*(k',k)
(125.8)
entre las amplitudes de los procesos de dispersión directo e inverso (en el sentido
literal de la palabra), es decir, de los procesos que difieren uno del otro en la permutación de los impulsos inicial y final, sin cambiar sus signos como ocurría en la inversión del tiempo. Se manifiesta así en la dispersión una propiedad de simetría adicional (que se añade al teorema de reciprocidad (124.12)). Esta propiedad está íntimamente vinculada con el hecho de que el valor de la amplitud de dispersión es
pequeño en la teoría de perturbaciones, y se sigue directamente de la condición
de unitariedad (124.8) si se prescinde en ella del término integral cuadrático respecto
de f (1).
La fórmula (125.7) puede obtenerse también de otra manera (que, sin embargo,
deja indeterminada la fase de la amplitud de dispersión). En efecto, podemos partir
de la fórmula (43.1) de la teoría de perturbaciones, según la cual la probabilidad
de la transición entre estados del espectro continuo viene dada por la fórmula
En el presente caso hemos- de aplicar esta fórmula a la transición desde el estado
de la partícula incidente, con impulso inicial dado p, al estado de la partícula con
impulso p', dispersada en el eJemento de ángulo sólido do'. Como « intervalo »
de estados dv se puede tomar el elemento de volumen dpx' dp' y dpz' del espacio de
impulsos. Substituyendo en vez de E0 - Evo la diferencia (p' 2 - p 2)/2m de las energías de dos partículas libres con impulsos p' y p, tenemos:
dwpp' = (41rm/ñ)I Upp·l 28(p' 2-p 2) dp'x dp' y dp'z.
(125.9)
(1) Es claro, por ello, que esta propiedad desaparezca ya al pasar a la segunda aproximación. A primera vi;;ta puede parecer que la fórmula de segunda aproximación (véase problema 6) es también simétrica
respecto de la permutación de los estados inícial y final. En realidad, una tal simetría no existe, debido a
que al pasar a la fórmula conjugada varía el camino de integración (es decir, el sentido en que se evita el
punto singular).
556
Teoría de las colisiones elásticas
Las funciones de onda de las partículas incidente y dispersada son funciones de
onda del movimiento libre, es decir, ondas planas:
VJp = constantex eip.rf1t, IPp' = constante x eip'.rf1t.
Dado que se ha elegido como « intervalo » dv' el elemento del espacio de impulsos,
la función de onda %' debe normalizarse según la función o en dicho espacio:
IPp'
=
e<i/ll.)p'.r/(217fi)3/2.
(125.10)
La función '1/'p, en cambio, la normalizaremos de modo que corresponda a una
densidad de flujo igual a la unidad:
'Pp =
y'(m/p)e<i/11.)p.r.
(125.11)
Entonces la probabilidad (125.9) tendrá las dimensiones de un área y representará
la sección eficaz diferencial de dispersión.
La presencia de la función oen la fórmula (125.9) significa que p' = p, es decir,
el valor absoluto del impulso no cambia, conforme debe ocurrir en una dispersión
elástica. Cabe eliminar la función opasando a « coordenadas esféricas» en el espacio
de impulsos (es decir, substituyendo dp'x dp'u dp'z por p' 2 dp' do'= l p'd(p' 2 ) do')
e integrando respecto de p' 2• La integración se reduce a cambiar el valor absoluto p'
por p en el integrando. y obtenemos:
Substituyendo aquí las funciones (125.10) y (125.11), volvemos de nuevo a la fórmula (125.7).
En la forma (125.7), esta fórmula es aplicable a la dispersión en un campo
U(x, y, z) que es función de las coordenadas en cualquiera de sus combinaciones,
y no sólo der. Pero en el caso U= U(r) puede ser sometida a ulterior transformación.
En la integral
J U(r)e-iq.r dV
utilicemos coordenadas espaciales esféricas r, &, <f, con el eje polar elegido en la
dirección del vector q (representamos por & el ángulo polar, para distinguirlo del
ángulo de dispersión O). La integración respecto de & y <f, puede efectuarse fácilmente,
y obtenemos en definitiva:
ooh~
fff
ooo
oo
U(r)e1•• = llr2 sen~ d&d</>dr = 4,,
f
o
U(r,8°:qr r dr.
557
Fórmztla de Born
Substituyendo esta expres10n en (125.4), se obtiene la siguiente fórmula para la
amplitud de dispersión en un campo central:
f
00
2m
f = - -
ñ2
o
senqr
U(r)--r dr.
q
(125.12)
Para O = O (es decir, q = O) la integral que aquí aparece es divergente si U(r) tiende
a cero en el infinito como I/r 3 o más lentamente (de acuerdo con los resultados generales del § I 23).
Conviene llamar la atención acerca de la siguiente circunstancia interesante. El
impulso p de la partícula y el ángulo de dispersión () intervienen en ( I 25. I 2) únicamente a través de q. De esta manera, en la aproximación de Born la sección eficaz
depende de p y() tan sólo en la combinación p sen (0/2).
Volviendo al caso general de campos arbitrarios U(x, y, z), consideremos los
casos límite correspondientes a velocidades pequeñas (ka ~ I) y grandes (ka ~ 1).
Para velocidades pequeñas, en la integral (125.4) se puede hacer
modo que la amplitud de dispersión será
f =_
_!!:_f
UdV
21Tn2
'
e-iq.r ~
I, de
(125.13)
y si U= U(r),
f
2m
= -
h2
foo
U(r)r2 dr.
(125.14)
o
La dispersión resulta aquí isótropa e independiente de la velocidad, lo que está
de acuerdo con los resultados generales del § 130.
En el caso límite opuesto de grandes velocidades, la dispersión es fuertemente
anisótropa y dirigida hacia adelante en un cono estrecho de ángulo !).() '""'"' I / ka.
En efecto, fuera de este cono la cantidad q es grande, el factor e-iq.r es una función
rápidamente oscilante y la integral de su producto por la función lentamente variabJe U es prácticamente cero.
La ley de decrecimiento de la sección eficaz para grandes valores de q no es universal y depende de la forma concreta del campo. Si el campo U = U(r) posee una
singularidad en r = O o para cualquier otro valor real de r, el papel determinante
en la integral de (125.12) lo representa la vecindad de este punto, y la disminución
de la sección eficaz sigue una ley potencial. Lo mismo vale también para el caso
558
Teoría de la.~ colisiones elásticas
en que la función U(r) carece de singularidades, pero no es una función par - el
papel fundamental en la integral lo representa entonces la vecindad del origen
r = O. Si, en cambio, U(r) es una función par de r, la integración se puede extender
formalmente también a valores negativos de r, es decir, la integración puede efectuarse a lo largo de todo el eje real de la variable r, con lo que (si U(r) no tiene
puntos singulares sobre dicho eje) es posible desplazar el camino de integración
al campo complejo hasta « tropezar » con el punto singular más próximo. En estas
condiciones, para grandes valores de q, la integral resulta ser una función que decrece exponencialme!lte. Sin embargo, hay que tener en cuenta que para el cálculo
de esta cantidad exponencialmente pequeña, la aproximación de Born, es, en general, inadecuada (véase también § 127).
Aunque el valor de la sección eficaz de dispersión diferencial dentro del cono
A() ~ I/ka no depende, esencialmente, de la velocidad, sin embargo, gracias a la
disminución del ángulo de apertura del cono, la sección eficaz total (si es que la
integral f da converge) disminuye para grandes valores de la energía. En efecto,
la sección eficaz total disminuye junto con la amplitud del ángulo sólido, subtendido por el cono, proporcionalmente a ( A()) 2 ~ I/k 2a2 , es decir, en razón inversa
de la energía.
En muchas aplicaciones físicas de la teoría de colisiones, se adopta como magnitud característica de la dispersión la integral
crtr =
J(1- cos B) dcr,
(125.15)
llamada frecuentemente sección eficaz de transporte. Consideraciones análogas a las
hechas anteriormente prueban que, para grandes velocidades, esta cantidad es inversamente proporcional al cuadrado de la energía.
PROBLEMAS
1. Determinar, en la aproximación de Born, la sección eficaz de dispersión de un pozo esférico
de potencial: U= - U0 para r < a, U= O para r > a.
Solución.
El cálculo de la integral en (125.12) conduce al resultado
da
mUoa2)2 (senqa-qa cosqa)2
= 4a2 ( - - -
(qa)6
/i2
do.
La integración respecto de todos los ángulos (que conviene efectuar pasando a la variable q
·sen (0/2) y substituyendo do por 2'7q dq/k 2) da la sección eficaz total de dispersión:
a= 27T(mUoa
k2
h2
2
2
)
[i- _1_ + sen4ka _sen22ka]·
(2ka)2
(2ka)3
(2ka)4
=
2k.
559
Fórmula de Born
En los casos límite esta fórmula da:
2.
cr = 16rra2(mU0a2)2
9
/¡,2
para
ka~ 1,
cr = 21r(mUoa2)2
k2
li2
para
ka~ 1.
El mismo problema en el campo U= U0 e-r"la".
Solución. El cálculo conviene efectuarlo mediante la fórmula (125.7), eligiendo la dirección
de q como uno de los ejes de coordenadas. En definitiva se obtiene
mUoa2)2
dcr = 1.1ra2 ( - - - e-q 2 a 2 /2 do
4
h2
'
y la sección eficaz total
Las condiciones de aplicabilidad de estas fórmulas vienen dadas por las desigualdades (125.1-2),
con U0 en vez de U. Además, la fórmula para da no es aplicable si el exponente es grande en valor
absoluto (1).
3.
El mismo problema en el campo U= (rx./r)e-rfa.
Solución.
El cálculo de la integral (125.12) da:
dcr = 4a2(_c,,.m_a)2__d_º__
1i2
(q2a2 + 1)2
La sección eficaz total es:
cr = l61ra2(_r:t.m_._ª)2_ _1__
h2 4k 2a2+ 1 ·
La condición de aplicabilidad de estas fórmulas se obtiene a partir de (125.1-2) con r.x./a en vez
de U: a.ma/ñ2 ~ 1 o a./ñv ~ 1.
4. Determinar las fases ,5z para la dispersión en un campo central en el caso correspondiente
a la aproximación de Born.
Solución. Para la función de onda radial x = rR del movimiento en el campo U(r) y para
la función x( 0 l del movimiento libre, tenemos las ecuaciones (véase (32.10)):
(1) Es fácil comprobar que, en este caso, no es aplicable la teoría de perturbaciones calculando la
amplitud de la dispersión en segunda aproximación (véase problema 5): aunque el coeficiente de la exponencial es pequeño comparado con el del término de primera aproximación, el exponente de la exponencial
negativa resulta ser dos veces menor.
560
Teoría de las colisiones elásticas
l(l+l)
x" + [ k2- -r2- -
2m
J
-¡¡;-U
X= O,
/(l+l)J
r2
x<º>" + [ k2- - - - x<º> =
o.
Multiplicando la primera ecuación por x( 0l, la segunda por X, restando miembro a miembro una
de otra e integrando luego respecto de r (teniendo en cuenta la condición de contorno x = O
para r = O), obtenemos:
2m
x'(r)x<º'(r)-x(r)x< 0>'(r) = n,2
Ir Uxx< >dr.
0
o
Considerando U como una perturbación, podemos hacer en el segundo miembro de la igualdad
x ,....., x(O). Para r----* =, utilizaremos en el primer miembro de la misma las expresiones asintóticas
(33.10), (33.18); en la integral, en cambio, substituiremos la expresión exacta (33.9 a). Obtenemos así:
00
sen81 ~ 81 =
- ::
.
J U(r)[Jz+1;2(kr)] 2r dr.
o
Esta fórmula se podría obtener también desarrollando directamente la amplitud de dispersión
de Bom (125.4) en polinomios de Legendre, de acuerdo con (122.10) (para valores '5z pequeños).
5. Determinar la amplitud de dispersión en la segunda aproximación de la teoría de perturbaciones.
Solución. Comparando las fórmulas (43.1) y (43.5), concluimos que el paso de las fórmulas
de primera aproximación a las fórmulas de segundo orden se efectúa substituyendo la integral
Uk'--k
=
JUe-i<k'-k>.r dV
por
2m
(2n)ª li2
uk'-k+ - -
f
Uk,-k"Uk"-k
k2 - k"2 + iS
d3k"
(1)
(después de la integración se hace que <5----* +O). Obsérvese que, debido a este procedimiento de
integración, e] segundo término no posee ya ]a propiedad (125.8).
6. Determinar, en segunda aproximación, ]a amplitud de dispersión en el caso límite de pequeñas energías (l. IA. POMERANCHUK, 1948).
Solución.
Para k----* O la integral que aparece en el segundo término de la fórmula (I) toma
la forma
-
f
U-k"Uk"
---d3k"
k"2
El caso cua.'iiclá.<iico
-
JJJ
JJ lr-r'I
561
d3k"
U(r)U(r')eik'.(r-r'>-- dV dV'
k"2
U(r)U(r')
-21r2
dV dV';
hemos aplicado aquí la fórmula (1)
eik,(r-r'> d3k
J
= __1__
lr-r'I
27T2k2
La amplitud de dispersión es así
f
= -
_!!:_
21rli2
J
U dV+
(_!!:_)
JJU(r)U(r')
dV dV'.
21rli2
lr-r'I
2
(2)
En el caso de un campo central, esta fórmula nos da:
f = - -2m
ñ2
J
8m2J
JU(r)U(r')r2 dr. r' dr'.
ñ4
Ur2 dr+-
r'>r
El segundo término de la fórmula (2) es siempre positivo (como es claro teniendo en cuenta
la expresión de partida de la integral en el espacio-k). De aquí se sigue que, para pequeñas energías, la primera aproximación de Born da siempre valores de la sección eficaz que son por exceso
en un campo repulsivo ( U > O) y por defecto en un campo atractivo ( U < O).
§ 126.
El caso cuasiclásico
Es interesante investigar cómo se efectúa el paso al límite que lleva de la teoría
cuántica de la dispersión a la clásica.
Dejando de lado el ángulo de dispersión e igual a cero, podemos escribir la amplitud de dispersión a que conduce la teoría cuántica exacta en la forma (123.4):
CX)
f(O) = (1/2ik)}; (21+1)Pz(cos8)e2i8i.
l=<l
{126.1)
Sabemos que las funciones de onda cuasiclásicas se caracterizan por el gran valor
de su fase. Es natural, por lo tanto, suponer desde un buen principio que al paso
al límite en la teoría de la dispersión corresponden fases '51 que son grandes. El valor
de Ja suma (126.1) viene determinado esencialmente por los términos con valores
grandes de l. Por ello podemos substituir Pz(cos O) por la expresión asintótica (49.7),
(1)
Véase tomo II, Teoría clásica de los campos, § 51.
Teorfo de lqs colisiones elásticqs
562
que escribiremos en la forma:
Pz(cos8)
t
~
-----[efü+l/2)0+fo/4_e-fü+l/2)8-t11/4].
v(2TilSen8)
Substituyendo esta expresión en (126.1), obtenemos:
J(O) =
~~
k~
J
z
l (et[26z-<i+l!2)8-1T/41_et[261+Cl+l/2)8+1T/41}.
211senO
(126.2)
Los factores exponenciales, considerados como funciones de l, son funciones
rápidamente oscilantes (dado que sus fases son grandes). Debido a ello, la mayor
parte de los términos de la suma (126.2) se reducen entre sí. La suma vendrá determinada, en esencia, por el intervalo de valores de l próximos al valor para el que
uno de los exponentes presenta un extremo, es decir, próximos a una raíz de la
ecuación
2 doz/dl±O = O.
(126.3)
En este intervalo se encuentran un gran número de términos de la serie para los que
los factores exponenciales conservan valores casi constantes (los exponentes varían
lentamente cerca del punto en que se alcanza el valor extremo) y que, por ello, no
se reducirán entre sí.
Las fases ~1 en el caso cuasiclásico se pueden escribir (véase § 123) como límite
al que tiende, para r-+ oo, la diferencia entre la fase
r
V'+~
f
y'{Zm[E-U(r)]-li'(l+i)'Jr'} dr
de la función de onda cuasiclásica en el campo U(r) y la fase de la función de onda
del movimiento libre, igual a
(véase § 33). De esta manera
00
S, =
f ¡~v'[2m(E-U)-li (1H) /r ]-k} drH,r(IH)-kro.
2
2
2
(126.4)
Esta expresión debe substituirse en la ecuación (126.3). Al determinar la derivada
de la integral, hay que recordar que el límite de integración r O depende también de l;
pero el término que así se obtiene, k dr 0/dl, se reduce con la derivada del término
kr 0 en ~1• El producto h(l+!) es el momento cinético de la partícula. En la mecánica
clásica podemos escribirlo en Ja forma mpv, donde e es el « parámetro de impacto »,
y v la velocidad de la partícula en el infinito.
563
El caso cuasiclásico
Efectuando esta substitución, la ecuación (126.3) toma en definitiva la forma:
00
f
mvpdr
------- =
r2y1[2m(E- U)-(mvp/r)2]
!(11::¡:B).
(126.5)
ro
En un campo repulsivo esta ecuación tiene una raíz (para e) solamente para el
signo menos delante de () en el segundo miembro, y en un campo atractivo, para
el signo más.
La ecuación (126.5) coincide exactamente con la ecuación clásica que determina
el ángulo de dispersión en función del parámetro de impacto (1). Es fácil cerciorarse también de que para la sección eficaz se obtiene asimismo la expresión clásica (2).
El razonamiento que hemos desarrollado prueba que la condición característica
de la dispersión clásica para un ángulo dado () se reduce a que sea grande el valor
de l para el que se cumple (126.3), y que también sea grande ~1 para este valor de /.
Esta condición admite una interpretación física sencilla. Para que sea posible hablar
de dispersión clásica en el ángulo () para una partícula incidente con parámetro
de impacto e, es necesario que las indeterminaciones mecánico-cuánticas en los
valores de uno y de otro sean relativamente pequeñas: Ap ~ p, A8 ~ 8. La indeterminación en el ángulo de dispersión es del orden de A(J "' Ap/p , donde p es el
impulso de la partícula y tl.p la indeterminación en el valor de su componente transversal. Dado que Ap "' li/ Ap ~ li/ p, será A8 ~ li/pp, y por ello, en cualquier caso,
también
B ~ li/pmv.
(126.6)
Substituyendo el momento cinético mpv por lit, obtenemos ()[ ~ 1, que coincide
con la condición ~L ~ 1 (ya que b1 ,_, UJ, conforme se ve teniendo en cuenta (126.3)).
El ángulo clásico de desviación de una partícula se puede estimar como razón
del incremento transversal del impulso, tl.p, durante el « tiempo de colisión »,
T ,_, e/v, al valor inicial del impulso mv. La fuerza que actúa sobre la partícula
a la distancia e es U' (e); por lo tanto
Ap "' lU'(p)/p/v,
de modo que
8 ,..., lU'(p)/p/mv 2 •
1
( )
2
( )
Véase tomo I, Mecánica, § 18.
El cálculo se efectúa substituyendo la suma respecto del en (126.2) por una integral en un entorno
del punto en que el exponente alcanza el extremo.
564
Teoría de las colisiones elásticas
Esta estimación es rigurosamente válida tan sólo si el ángulo () ~ 1, pero en orden
de magnitud se puede aplicar también hasta () ,-.,.; 1. Substituyendo esta expresión
en (126.6), obtenemos la condición para la dispersión clásica en la forma:
1U'(p )Jp 2 ~ ñv.
(126.7)
Esta desigualdad debe quedar satisfecha para todos los valores
además, es IU(e)/ ~ E.
e para
los que,
De la condición obtenida se pueden deducir una serie de consecuencias. Si el
campo U(r) disminuye más rápidamente que 1/r, la condición (126.7) deja de cumplirse en cualquier caso para valores e suficientemente grandes. Pero a un valor e
grande corresponden· pequeños valores de (); así, pu~s, la dispersión en ángulos
suficientemente pequeños no será nunca clásica. Pero si el campo disminuye más
lentamente que 1/r, la dispersión en ángulos pequeños será clásica; si en este caso
la dispersión es o no clásica para ángulos grandes, depende del carácter de la marcha
del campo a distancias pequeñas.
Para el campo de Coulomb U= a./r se cumple la condición (126.7) si oc ~ ltv.
Esta es la condición contraria a la que permite considerar el campo de Coulomb
como una perturbación. Veremos, de todas formas, que por razones puramente
casuales la teoría cuántica de la dispersión en un campo coulombiano conduce
a un resultado que coincide con el clásico en todos los casos.
PROBLEMA
Hallar la sección eficaz total de dispersión cuasiclásica en un campo que, a distancias suficientemente grandes, tiene la forma U= a./rn (donde n > 2).
Solución. Teniendo en cuenta que el papel principal lo representan las fases '5z correspondientes a grandes valores de /, calculémoslas según la fórmula (123.1):
f
00
moc
Sz = - /t2
dr
~ny(k2-l2/r2)°
(1)
l/k
Efectuando la substitución 12/k2r 2
obtenemos:
81
= ~.
la integral se reduce a la conocida integral de EuLER y
mock,n-2 I'(l)r(in-i)
=--2/t2Zn-I
r(tn)
.
Substituyendo la suma en (122.11) por una integral, escribiremos:
f
Q)
a
= k2
417'
o
2lsen281 dl.
(2)
565
Dispersión para grandes energías
Para efectuar la integración hagamos <5i = u, integremos una vez respecto de u por partes, con
lo que la integral se reduce a la función r. Obtenemos así:
n-3]
a= 21rn/cn-Usen [ f1T.-n-1
r (n-3)
-- [r(tn-!)]2/(n-l>(oc
---- )2/(n-u
r(tn)
n-1
hv
(3)
La condición de aplicabilidad de esta fórmula es, ante todo, la de que para <5i ,-...., 1 sea / ;$> 1 ;
de aquí resulta la desigualdad
El campo U(r) debe presentar la forma considerada ya a distancias
r ,.._, 1/k ,..., (oc/liv)l/(n-1)
(donde les tal que se cumple la condición <5i ,-...., 1), que representan el papel principal en la integral (1).
§ 127.
Dispersión para grandes energías
Si Iu¡ no es pequeño comparado con ñ.2jma 2 , es posible una situación en la que la
energía de las partículas dispersadas es tan grande que
1U/ ~
E ,. _, (h2/ma2)(ka)2,
(127.1)
a la vez que, sin embargo, se tiene todavía
1U{ ~
(Ji2/ma2)ka = liv/a
Se trata en este caso de un tipo de dispersión de partículas rápidas a la que, con todo,
no es aplicable la aproximación de Born (no se cumple ninguna de las condiciones (125.1-2)).
Para estudiar este caso cabe utilizar la expresión de la función de onda que
encontramos en el § 45 en la forma
• z
.¡. =
elkz exp( -
:J
U
dz)
(127.2)
-00
(véase (45.9)). Conforme se hizo observar en el § 45, esta expresión es aplicable
sólo si z ~ ka 2 ; por lo tanto, no es posible extender, sin más, su validez hasta distancias del centro de dispersión tales que sea ya lícito aplicar la expresión asintótica (122.3). Sin embargo, no hay necesidad de ello: para el cálculo de la sección
eficaz de dispersión basta conocer la función de onda a distancias z tales que a ~
~ z ~ ka 2 ; la integral en el exponente de (127.2) se puede entonces extender hasta oo.
Consideremos la dispersión para ángulos pequeños, con una pequeña variación
/iq del impulso; debido a que el módulo del vector q(q ~ k) es pequeño, cabe supo-
Teoría de las colisione., elásticas
566
nerlo perpendicular al vector de onda de la partícula incidente k, es decir, situado en
el plano x, y. La onda dispersada cuyo vector de onda es k' = k+q se obtiene formando la correspondiente componente de Fourier de la función de onda 'lfJ, y la
amplitud de dispersión es proporcional a la amplitud de esta componente (1)~
f
f,...,
ipe-tk'.r dV.
En el presente caso, la integración respecto de V se reduce a la integración en el
plano x, y:
f exp(-:J
•
f
=
e
00
(127.3)
Udz-iq.p) dxdy,
-00
(p es el vector posición en dicho plano). El coeficiente de proporcionalidad se puede
obtener pasando al límite para energías tan grandes que se tenga
f
00
-1
ñv -oo
Ua
Udz,..., ~1,
ñv
de modo que sea aplicable la aproximación de Boro. Efectuando el correspondiente
desarrollo del integrando en (127.3), obtenemos
f
=
-C_!_
ñv
f
e-'Q·PU dV.
Comparando con la expresión (125.4), encontramos que (2):
e=
(127.4)
-ik/21r.
(1) Esta manera de determinar la amplitud de dispersión es análoga al método aplicado al estudiar
la difracción de Fraunhofer, véase tomo 11, Teoría clásica de los campos, § 61.
(2) La fórmula (127.3-4) se puede obtener también directamente a partir de la fórmula general (122.10)
si se tiene en cuenta que, en el caso considerado, es
--f
1
28i =
00
liv
Udz
-00
(conforme se ve, por ejemplo, partiendo de la expresión (123.1) en la que hacemos r 0
""'
l/k, r""' Vz~+(Jik) 2),
y utilizando para grandes valores l y ángulos Opequeños la fórmula (49.6) para los polinomios de Legendre.
Mediante la conocida expresión de la función de Bessel, dicha fórmula se escribirá
f
2,r
Pl( cos 8) =
2_
21r
eHt+lf2>0cos<b
o
y en (122.10) se pasará de la suma respecto de l a la integración.
d</>
Dispersión para grandes energías
567
En et§ 125 se indicó ya que la aproximación de Born no es aplicable a la dispersión de partículas rápidas para grandes ángulos si la sección eficaz resulta entonces
exponencialmente pequeña. En estas condiciones es inadecuado también el método
que hemos expuesro aquí. En realidad, se trata en tales casos oe una situación cuasiclásica a la que no cabe aplicar la teoría de perturbaciones.
De acuerdo con las reglas generales de la aproximación cuasiclásica (cf. §§ 52, 53),
el exponente en la ley exponencial de decrecimiento de las secciones eficaces de dispersión se puede determinar mediante el estudio de « trayectorias complejas» en
el dominio clásicamente inaccesible del movimiento (1).
En el problema clásico de la dispersión, la dependencia entre el ángulo de desviación O de la partícula en el campo U(r) y el parámetro de impacto e se determina
por la fórmula
c:o
!(7T+O)
=
f
p
dr
'
r2,v(l-p2/r2- U/E)
(127.5)
f"o
donde r O es la mínima distancia al centro, raíz de la ecuación
1-p2/r2- U/E= O;
(127.6)
(véase (126.5)). El caso que nos interesa corresponde al intervalo angular hacia el
. que ·una partícula clásica no podría ser desviada (.2). A estos ángulos corresponden,
por ello, soluciones complejas e(O) de la ecuación (127.5) (con valores complejos
de r 0). Partiendo de la función e((}) obtenida de esta manera y del momento cinético
orbital clásico de la partícula, mve, se calcula la acción de acuerdo con
S(O) = mv
Jp(O) dO,
(127.7)
(donde v es la velocidad de la partícula en el infinito). La amplitud de dispersión es
(127.8)
La ecuación (127.6) posee, en general, mas de una raíz compleja. Como valor de r 0
en (127.5) debe tomarse la raíz que conduce al menor valor absoluto de la parte
Im S. Además, si la función U(r) presenta singularidades complejas, también éstas
deben tenerse en cuenta como posibles valores de rO (3).
(1) Para un estudio del coeficiente de la exponencial en esta ley, véase A. Z. PATASHINSKII, V. L. PoKRovsKII, l. M. JALATNIKOV, ZhETF, 45, n.º 10, 1963.
(2) El método expuesto es aplicable no sólo para grandes valores de E, sino en general en todos los
casos de dispersión exponencialmente pequeña.
(") Obsérvese (véase § 125) que si U(r) presenta una singularidad para r real, la disminución de la
sección eficaz no se produce, en general, siguiendo una ley exponencial.
Teoría de las colisiones elásticas
568
El papel principal en la integral (127.5) lo representa el dominio r ,_, r0 • En estas
condiciones, para energías E grandes se puede prescindir del término U/ E del radicando; efectuando la integración, obtenemos entonces:
p
= To C0St8.
(127.9)
Si r O es un punto singular de la función U(r ), dicho valor depende solamente de
las propiedades del campo, pero no depende ni de e ni de E_. Calculando S de acuerdo
con (127.7), encontramos en este caso que la amplitud de la dispersión es
2mv
)
f"' exp ( - -li-sen!Ol'mTo
.
(127.10)
En cambio, si para r0 hay que tomar una raíz de la ecuación (127.6), la forma
del exponente depende de las propiedades concretas del campo. Así, para la función
U = Uoe-(r/a)t
(que carece de puntos singulares a distancia finita), de la ecuación
U/E= l-p2/T2
~
sen2!8
se deduce
To
= iav log([E/Uo]sen2 l8).
(127.11)
Teniendo en cuenta la débil dependencia con relación a O, r 0 se puede considerar
constante en la integral (127.7) y para la amplitud de dispersión obtenemos la fórmula (127.10), con r0 dado por (127.11).
§ 128.
Propiedades analíticas de la amplitud de dispersión
Toda una serie de importantes propiedades de la amplitud de dispersión se pueden establecer estudiándola como función de la energía E de la partícula dispersada,
considerando formalmente dicha energía como una variable compleja.
Consideremos el movimiento de una partícula ~n un campo U(r) que tiende
a cero con rapidez suficiente en el infinito -+ el grado exigido de rapidez en la disminución se indicará más adelante. Para simplificar los razonamientos que siguen
supondremos primero que el momento cinético orbital de la partícula es l = O.
Escribamos la forma asintótica de la función de onda - solución de la ecuación
de ScHRODINGER con l = O para un valor E arbitrariamente dado - en la forma
x =np =
A(E) exp ( -
y'(-2mE))
(v'(-2mE))
li
r +B(E) exp
li
r ,
y consideremos E como una variable compleja; definiremos
V- E
(128.1)
en este caso
Propiedades analíticas de la amplitud de dispersión
569
como cantidad positiva para valores reales negativos de E. La función de onda
se supone normalizada mediante una determinada condición, cualquiera, por ejemplo por la condición v-i(O) = 1.
En el semieje real negativo (E < O), íos factores exponenciales en los dos términos de (128.1) son reales; uno de ellos disminuye parar-+ =, el otro, crece. De la
condición de que x sea real se sigue que las funciones A(E) y B(E) son reales para
E < O; a su vez, de aquí se sigue que estas funciones toman valores conjugados
complejos en dos puntos cualesquiera simétricos respecto del eje real:
A(E*)
= A*(E),
(128.2)
B(E*) = B*(E).
Pasando del semieje real negativo al semieje real positivo por un camino situado
en el semiplano superior, obtenemos una expresión asintótica para la función de
onda con E> O en la forma
X= A(E)eikr+B(E)e-ikr,
k
=
(128.3)
y'(2mE)/li.
Si, en cambio, el paso se efectúa en el semiplano inferior, obtendríamos
x
Dado que
x debe
A*(E)e--ikr + B*(E)etkr.
ser función uniforme de E, esto significa que
A(E) = B*(E)
para
(128.4)
E> O;
(esta relación se deduce también directamente de la condición de que x sea real
para E> O). Sin embargo, debido a la no uniformidad de la raíz
E en (128.1),
los propios coeficientes A(E) y B(E) son no uniformes. Para evitar esta no uniformidad, cortaremos el plano complejo a lo largo del semieje real positivo. La exisE una función uniforme y garantiza así la uniformidad
tencia del corte hace de
de la definición de las funciones A(E) y B(E). En estas condiciones, en los bordes
superior e inferior del corte estas funciones toman valores que son conjugados
complejos (en la expresión (128.3), A(E) y B(E) se toman en el borde superior del
corte).
V-
V
Llamaremos hoja física de la superficie de Riemann al plano complejo cortado
de la manera indicada. De acuerdo con la definición adoptada, sobre esta hoja
tenemos
Re y' -E > O.
En particular, en el borde superior del corte la función
con
i VE(1).
(128.5)
V
E así definida coincide
(1) A continuación, en todo este párrafo estudiamos las propiedades de la amplitud de dispersión
sobre la hoja física. Más adelante, sin embargo, tendremos que considerar en algunos casos también la
segunda hoja, « no física », de la superficie de Riemann (véase § 132). Sobre esta hoja
Rev'-E < O..
(128.Sa)
El paso a la hoja no física a partir del semieje real positivo tiene lugar directamente hacia abajo, « a través
del corte».
570
Teoría de las colisiones elásticas
En (128.3) los factores eikr y e-ikr, y con ellos también los dos términos en X,
son del mismo orden de magnitud; la expresión asintótica de la forma (128.3) es,
por lo tanto, siempre válida. En todo el resto de la hoja física, en cambio, el primer
término en ( 128.1) disminuye exponencialmente, y el segundo crece, para r -+ oo
(en virtud de (128.5)). Por consiguiente, los dos términos de (128.1) resultan ser
de diferente orden de magnitud y esta expresión, como forma asintótica de la función de onda, puede resultar no válida - el pequeño término en ella, sobre el fondo
del término mayor, puede representar una exageración no justificada de la precisión.
Para que la expresión (128.1) sea válida, la razón del término menor al mayor no
debe ser menor que el orden de magnitud relativo de la energía potencial (U/E),
de la que se prescinde en la ecuación de ScHRODINGER al pasar a la región asintótica.
Con otras palabras, el campo U(r) debe satisfacer la condición:
U(r) disminuye para r _,,.. oo más rápidamente que
(-
2y'(2m)
)
li rRey'-E
(128.6)
Si se cumple esta condición, la expresión asintótica de la forma (128.1) es válida
sobre toda la hoja física. Dado que es solución de una ecuación con coeficientes
finitos, dicha expresión no presenta singularidades respecto de E. Esto significa
que las funciones A(E) y B(E) son regulares sobre toda la hoja física, con excepción del punto E = O; este último, que es el origen del corte, es un punto de ramificación de dichas funciones.
A los estados ligados de la partícula en el campo U(r) corresponden funciones
de onda que tienden a cero para r-+ oo. Esto significa que debe faltar el segundo
término en (128.1); es decir, a los niveles discretos de energía corresponden ceros
de la función B(E). Dado que la ecuación de ScHRODINGER posee solamente valores
propios reales, todos los ceros de B(E) sobre la hoja física son reales (y situados
sobre el semieje real negativo).
Las funciones A(E) y B(E) para E> O están ligadas directamente con la amplitud
de dispersión en el campo U(r). En efecto, comparando (128.3) con la expresión
asintótica de X, escrita en la forma (122. 7),
X
=
constante x [ei(kr+oo> -
e-i(kr+oo>],
(128.7)
vemos que
-A(E)/B(E) =
La amplitud de dispersión con momento l
1
fo= -.-(e2ioo-l)
2ik
=
=
e2ioo(E>.
(128.8)
Oes, en cambio, de acuerdo con (122.14),
(A + 1 );
li
_
2y'(-2mE) B
(128.9)
571
Propiedades analíticas de la amplitud de dispersión
A y B se toman aquí sobre el borde superior del corte.
Considerando ahora la amplitud de dispersión como función de E en toda la
hoja física, vemos que los niveles discretos de la energía no son sino polos simples
de esta función. Si el campo U(r) satisface la condición (128.6), la amplitud de dispersión no poseerá entonces, por lo antes dicho, ningún otro punto singular (1).
Calculemos el residuo de la amplitud de dispersión en el polo que presenta en
un nivel discreto cualquiera E= E 0 < O. Para ello escribamos las ecuaciones a que
satisfacen la función x y su derivada respecto de la energía:
2m
x"+-(E-V)x=O,
óx " 2m
óx
) +-(E-U)(cE
t,,2
óE
t,,2
2m
= - -x.
n2
Multiplicando la primera por ox/oE, la segunda por X, restando miembro a miembro
una de otra e integrando respecto de r, obtenemos:
x' :~
-x(:1)
'
2
fx
r
n7
2
dr.
o
Apliquemos esta relación para E = E 0 y r -+ oo. La integral del segundo miembro
de la igualdad tiende a la unidad para r _,... oo, si la función de onda del estado ligado
está normalizada por la condición ordinaria f x2 dr = 1. En el primer miembro,
en cambio, substituimos en vez de x la expresión (128.1), teniendo en cuenta al hacerlo que cerca del punto E = E 0 se tiene:
A(E)
~
A(Eo)
= Ao,
=
B(E) ~ (E+IEol)[dB/dEJE=Eo
= ,B(E+IEol).
Obtenemos así:
1
,B
= -
J2IEol·
m
Aoli
Mediante estas expresiones encontramos que, cerca del punto E= E 0 , el término
principal de la amplitud de dispersión (que coincide con la amplitud para l = O)
toma la forma siguiente:
!=
fi2Ao2
1
(128.10)
2m E+IEol
(1) Exluido el punto E= O, que es singular en virtud de la singularidad antes indicada de las funciones
A(E) y B(E). La amplitud de dispersión, sin embargo, se conserva finita para E-+ O (véase§ 130).
En lo que sigue, y para abreviar, no haremos cada vez esta salvedad.
572
Teoría de las colisiones elásticas
De esta manera el residuo de la amplitud de dispersión en un nivel discreto viene
determinado por el coeficiente A0 en la expresión asintótica
(128.11)
de la función de onda normalizada del correspondiente estado estacionario.
Volviendo al estudio de las propiedades analíticas de ia amplitud de dispersión,
consideremos casos en los que la condición ( 128.6) no se cumple. En tales campos,
en la expresión ( 128.1) tan sólo el término creciente es la parte correcta de la forma
asintótica de la solución de la ecuación de ScHRODINGER sobre toda la hoja física.
De acuerdo con esto, se puede afirmar, como antes, que la función B(E) carece de
singularidades.
En cambio, la función A(E) puede, en estas condiciones, determinarse en el plano
complejo solamente como prolongación analítica de la función definida por el
coeficiente, en la expresión asintótica de X, sobre el semieje real positivo, donde
ambos términos de x son válidos. Dicha prolongación, sin embargo, da ahora, en
general, resultados diversos según se efectúe a partir del borde superior o del borde
inferior del corte. Para conseguir la uniformidad convendremos en definir A(E)
en los semiplanos superior e inferior como prolongación analítica a partir del lado
superior y del lado inferior del semieje real positivo, respectivamente; el corte,
en estas condiciones, debe prolongarse, en general, a todo el eje real. La función
así definida posee, como antes, la propiedad A(E*) = A*(E), pero, en general,
no es real ni sobre el semieje real positivo ni sobre el negativo. En principio, dicha
función puede también poseer singularidades.
Veamos, sin embargo, que, a pesar de todo, existe una categoría de campos
para los que la función A(E) carece de singularidades en la hoja física, a pesar de
no cumplirse la condición (128.6).
Consideraremos para ello x como función de la variable compleja r para un
valor dado (complejo) de E. Basta limitarse a valores E en el semiplano superior,
ya que los valores de la función A(E) en ambos semiplanos son conjugados complejos entre sí. Para aquellos valores de r para los que Er 2 es un número real positivo,
los dos términos de la función de onda (128.1) son del mismo orden, es decir, volvemos a la situación que encontramos para E> O y valores reales de r y en la que
ambos términos de la expresión asintótica x son válidos para cualquier campo U(r)
que tiende a cero en el infinito. Podemos por ello afirmar que A(E) no puede tener
puntos singulares para aquellos valores E para los que U(r) ---+ O, cuando r tiende
a oo a lo largo de un rayo sobre el que es Er 2 > O. Cuando E toma todos los valores
en el semiplano superior, la condición Er 2 > O aisla el cuadrante inferior derecho
Propiedades analíticas de la amplitud de dispersión
573
del plano complejo r. Llegamos así a la conclusión de que A(E) carece también
de singularidades en la hoja física cuando U(r) satisface la condición (1):
U(r)
~
O, cuando r
~ oo
en el semiplano a la derecha.
(128.12)
Las condiciones (128.6), (128.12) abarcan una categoría muy amplia de campos.
Cabe por ello decir que la amplitud de dispersión, por regla general, carece de
singularidades en el interior de ambos semiplanos. Con todo, sobre el propio semieje
real negativo (que pertenece a la hoja física cuando el corte no pasa por él) la amplitud de dispersión tiene polos que corresponden a las energías de los estados ligados;
cuando existe el corte, pueden presentarse. aquí también otras singularidades.
Esto último ocurre, en particular, para campos de la forma
U
=
constante X rne-r/a
(128.13)
(con n cualquiera). En el segmento O < -E < ñ2/8ma2 del semteJe negativo se
cumple la condición (128.6), de modo que por él no puede pasar el corte y la amplitud
de dispersión tiene aquí únicamente polos, que corresponden a los estados de enlace.
Sobre el resto del semieje negativo pueden presentarse también polos « redundantes» y otras singularidades {2). Su aparición está ligada con el hecho de que la función (128.13) deja de tender a cero, cuando r ~ oo a lo largo de un rayo sobre el
que Er 2 > O, no bien E cae por debajo del semieje negativo (es decir, dicho rayo
pasa a la izquierda de] eje imaginario del plano complejo r).
Consideremos ahora las propiedades analíticas de ]a amplitud de dispersión
para IEI ~ oo. Cuando E~+ oo a lo largo del eje real, es válida la aproximación
de Born y la amplitud de dispersión tiende a cero. De acuerdo con lo antes dicho,
esta misma situación se presenta cuando E tiende a infinito en el plano complejo
a lo largo de una recta cualquiera arg E= const., si se consideran aquellos valores
complejos de r para los que Er 2 > O. Si U----+ O cuando r ~ oo a lo largo de la recta
arg r = - t arg E y si U(r) carece de singularidades sobre esta recta, se cumple
la condición de aplicabilidad de la aproximación de Born y la amplitud de dispersión tiende a cero, como antes. Cuando arg E toma todos los valores entre cero
y n, arg r varía entre O y - tn.
Llegamos asi a ]a conclusión de que la amplitud de dispersión tiende a cero en
el infinito en todas las direcciones del plano E si la función U(r) carece de singularidades en el semiplano r a la derecha y tiende a cero en el infinito.
(1) Dado el carácter real de U(r) sobre el eje real, se tiene U(r*) = U*(r): por ello, el que se cumpla
la condición (128. l O) en el cuadrante inferior derecho significa automáticamente que dicha condición
se cumple en todo el semiplano a la derecha del eje imaginario.
(2) La posibilidad de que existan tales polos « redundantes » para E < O fue puesta de manifiesto
por primera vez por S. T. MA (1946).
574
Teoría de las colisiones elásticas
Aunque en todo lo que precede hemos hablado siempre de dispersión con momento cinético l = O, en realidad todos los resultados expuestos son válidos también para las amplitudes parciales de dispersión con momento cinético éualquiera
no nulo. La diferencia en las conclusiones consiste solamente en que en vez de los
factores e± ikr en las expresiones asintóticas de x deberían escribirse las funciones
de onda radiales exactas del movimiento libre (33.14) (1).
Para l =f= O, hay que introducir algunas modificaciones en las fórmulas (128.9)
y (128.10). En vez de(128.7) tenemos ahora:
xi= rRi
= constante x {exp[i(kr-!l1r+8i)]-exp[-i(kr-!l1r+Sz)]},
y para la amplitud parcial
.fi (determinada de acuerdo con (122.14)) obtenemos:
f¡, =
li
((-l)ZA +
2y'(-2mE)
B
1).
El término principal en la amplitud de dispersión cerca del nivel E
cinético l viene dado, en cambio, por la fórmula
f
~
(128.14)
(128.15)
= E 0 con momento
(2l + 1)fiP1(cos 8)
= ( -1 )Z+l
1
li 2Ao2
2m E+IEol
(2/ + 1)Pz(cos 8)
(128.16)
en vez de la (128. 10).
§ 129.
Relaciones de dispersión
En el párrafo que precede hemos estudiado las propiedades analíticas de las
amplitudes parciales de dispersión con valores dados de l. Vimos que estas propiedades se complican por la posibilidad de la aparición de singularidades redundantes
y de una irregularidad en el infinito. Las mismas propiedades posee también, evidentemente, la amplitud total considerada como función de la energía para valores
dados del ángulo de dispersión. Sin embargo, constituye excepción la amplitud
de dispersión correspondiente a ángulo nulo. Conforme demostraremos inmediatamente, sus propiedades analíticas son considerablemente más simples.
Escribiendo la ecuación de
dispersada en la forma:
ScHRODINGER
6t/;+k2tf;
=
para la función de onda de la partícula
(2mU/ft2)tf;,
(129.1)
(1) Utilizar la forma límite (33.15) de estas funciones es admisible solamente para E> O; en el resto
del plano E, donde los dos términos de x son de órdenes de magnitud diferentes, la utilización de estas
formas límite introduciría en X un error que, en general, es mayor que el error correspondiente a prescindir
de U en la ecuación de ScHRODINGER.
575
Relaciones de dispersión
consideraremos dicha ecuación, de manera formal, como una ecuac10n de onda
con segundo miembro, es decir, como si se tratase de la ecuación de los« potenciales
retardados » conocida por la electrodinámica.
La solución de esta ecuación que representa la « radiación » en cierta dirección k'
a gran distancia R 0 del centro emisor, tiene, como es sabido, la siguiente forma (1):
1 eikRo
tfdisp= - - - -
f
47r Ro
2mU
---:;:-t/ie-ik .r dV.
lt2
En el presente caso esta expresión representa la función de onda de la partícula
dispersada, y el coeficiente de eikR 0 /R 0 es la amplitud de dispersión/(&, E). En particular, haciendo k' = k (k es el vector de onda de la partícula incidente), obtenemos
la amplitud de dispersión para el ángulo O:
f(O,E) = - _!!:_
27Th2
f
(129.2)
Utfie-ikz d V
(el eje z está dirigido en el sentido de k). Esta expresión posee, claro está, tan sólo
un sentido formal, ya que en el integrando aparece de nuevo la función de onda
incógnita. Sin embargo, dicha expresión permite llegar a determinadas conclusiones
acerca de las propiedades analíticas de la magnitudf(O, E) como función de la energía E (2).
La función 1P que aparece en el integrando se compone, para grandes valores de
r, de dos partes: una onda incidente y otra divergente. Esta última es proporcional
a eikr, de modo que la parte correspondiente de la integral contiene en el integrando
la expresión eik(r-z). Por otro lado, al pasar al plano complejo (a partir del borde
superior del corte a lo largo del semieje positivo) ik se substituye por (-2mE)/ñ,
siendo en toda la hoja física Re
E> O. Dado que r > z, se tendrá Re(ik(r - z))
< O y la integral converge para E complejo cualquiera. En lo que concierne a la
onda incidente contenida en '1/J, que es proporcional a eikz, en la parte correspondiente de la integral los factores exponenciales se reducen entre sí de modo que
también esta parte converge.
V-
V
La función 1P en la integral (129.2) está determinada unívocamente para E complejo cualquiera como solución de la ecuación de SCHRODINGER que contiene, junto
a una onda plana, solamente una parte que se amortigua (para r ~ oo). Por ello,
está también determinada unívocamente la integral convergente (129.2), de modo
(1)
Véase tomo II, Teoría clásica de los campos, § 66.
Se supone, claro está, que el campo U(r) tiende a cero parar~ oo con rapidez suficiente para que
(cuando E > O) exista f(O, E) (véase § 123).
(2)
Teoría de las colisiones elásticas
576
que sus singularidades pueden resultar tan sólo como consecuencia de que 1P tienda
a infinito. Esto último ocurre en los niveles discretos de energía (1).
Es fácil ver también que /(O, E) se conserva finita para !El-+=. Para valores
grandes, en la ecuación de ScHRODINGER (129.1) se puede prescindir del término
en U, de modo que en 1P queda únicamente la onda plana: 'I.JJ ,..._, eikz. En consecuencia, la integral ( 129 .2) pasa a ser
JEJ
+,(O oo) = - _!!:_
1
J
2TTn2
,
f
U dV
'
que coincide, cual debe ser, con la amplitud de dispersión de Born (125.4) para el
ángulo O (q = O); designémosla por f n(O).
Llegamos así a la conclusión de que la amplitud de dispersión correspondiente
al ángulo O es regular en toda la hoja física (incluido el infinito), con la única excepción de los polos forzosos situados sobre el semieje real negativo en los niveles discretos de energía (2),
Consideremos la integral
1
2TTi
f
e
f(O,E')-}B
dE'
E'-E
'
(129.3)
a lo largo del contorno representado en la fig. 46 y que está formado por una circunferencia de radio infinito, siguiendo luego los bordes del corte a lo largo del
semieje positivo. La integral sobre la circunferencia tiende a cero, ya que /(O, =) - f 8 = O; la integración, en cambio, a lo largo de ambos bordes del corte nos da
f
00
1
7T
o
Imf(O,E')
----dE';
E'-E
(1) Para evitar posibles confusiones, subrayaremos que se trata aquí de la función de onda total del
sistema tp normalizada por la condición de que el coeficiente de la onda plana en su expresión asintótica
(cf. 122.3) sea igual a la unidad. En el párrafo anterior, en cambio, se consideraron las partes (tpz) de la
función de onda que corresponden a determinados valores de /, suponiendo que las tpz están normalizadas
de acuerdo con una condición arbitraria. Si se desarrolla la función total tp en funciones tpl, éstas intervienen en tp con coeficientes que son proporcionales a 1/Bz; así, la función (128.3) con l = O debe aparecer
en tp en la forma
constante
1
- - - . -[(A+B)etkr_2iBsenkr].
r
B
Por ello
2
( )
tp
tiende a infinito en los ceros de las funciones Bi(E), es decir, en los niveles discretos de energía.
La idea de la demostración expuesta se debe a L. D.
FADDEEV
(1958).
577
Relaciones de dispersión
se ha tenido aquí en cuenta que, en virtud de la definición adoptada en el § 128,
la amplitud física de dispersión para valores reales positivos de E se da para el borde
superior del corte, mientras que sobre el borde inferior toma el valor conjugado
complejo.
Por otra parte, según el teorema de CAUCHY, la integral (129.3) es igual a la suma
FIG. 46
de f(O, E) - f B y los residuos Rn del integrando en todos los polos E' = En de la
función f(O, E'), donde En son los niveles discretos de energía. Estos residuos se
determinan mediante la fórmula (128.16) y son iguales a:
dn
E,.,-R
li 2Aon 2
dn = -(-1)ln(2ln+ 1)--,
Rn=--,
On
?m
(129.4)
es el momento cinético del estado con energía E 11 ).
Obtenemos así
1 foo Im -fi(O E')
/(0,E)
~~~E
=/B+-;,
O
"""
dE'+
~
dn
E-En.
(129.5)
n
Esta es la llamada relación de dispersión y determina f(O, E) en un punto cualquiera
de la hoja física en función de los valores de su parte imaginaria para E> O (O.
WONG. 1957; N. KHURI, 1957).
Cuando el punto E tiende al borde superior del corte, la integral a lo largo del
eje real en (129.5) debe tomarse evitando el polo E' = E por debajo; si esto se hace
mediante una semicircunferencia infinitamente pequeña (fig. 47), la correspondiente
parte de la integral da, en el segundo miembro de la ecuación (129.5), el valor ilmf(O, E), y la integral que queda desde cero hasta oo debe entenderse en el sentido de
valor principal. En definitiva se obtiene la fórmula:
f
=/B+-P
00
Re/(0,E)
1
7T
o
lm f(O,E')
dE'+
E'-E
¿ --,
n
dn
E-En
(129.6)
578
Teoría de las colisiones elásticas
que determina para E> O la parte real de la amplitud de dispersión correspondiente
al ángulo O en función de su parte imaginaria. Recuérdese que esta última, de acuerdo
con ( 124.9), está directamente ligada con la sección eficaz total de dispersión.
E
-·~~••--~-\.!)--~••--~-
º
FIG. 47
.§ 130.
Dispersión de partículas lentas
Consideremos las propiedades de la sección eficaz de dispersión en el caso límite en que las velocidades de las partículas dispersadas son pequeñas. La velocidad
se supone tan pequeña, que la longitud de onda de la partícula es grande comparada
con el radio de acción a del campo U(r) (es decir, ka ~ 1) y, además, su energía
es pequeña respecto de la magnitud del campo dentro de este radio. La resolución
de este problema exige determinar la ley límite de dependencia de las fases <5 1 respecto del número de onda k para valores pequeños de este último.
Para r :S a, en la ecuación exacta de
solamente del término en k 2 :
ScHRODINGER ( 122.6)
Ri" +2Ri' /r-l(l+ l)Rz/r2
En cambio, en la región en que a ~ r
mino en U(r), de modo que queda
~
= 2mU(r)Rz/1i2.
se puede prescindir
(130.1)
1/k se puede prescindir también del tér-
Ri"+2Rz'/r-l(l+l)Rz!r2 = O.
(130.2)
La solución general de esta ecuación es:
(130.3)
Los valores de las constantes c1 y c2 se pueden determinar, en principio, tan sólo
resolviendo la ecuación (130.1) para la función U(r) de que se trate; dichas constantes, claro está, son diferentes para valores de l distintos.
A distancias todavía mayores, r ,._, I/k, en la ecuación de ScHRODINGER se puede
prescindir del término en U(r), pero es imposible dejar de tener en cuenta k2, de
forma que
2
[
l(l+l)]
Rz"+-Ri'+ k2 - - - - Rz = O,
r
r2
(130.4)
es decir, se tiene la ecuación del movimiento libre. La solución de esta ecuación
es (véase § 33):
579
Dispersión de partículas lentas
Rz
(2l+l)!! ( d )lsenkr
c1(-l)Z
rl --+
k2 l+1
rdr
r
=
+c2(-l)Z
( d )z coskr
rl
--.
(2!-1) !! r dr
r
(130.5)
Los coeficientes constantes se han elegido aquí de tal manera que para kr ~ I
esta solución pase a ser la (130.3); con ello se consigue el «empalme» de la solución
(130.3) en el dominio kr ~ l con la solución (130.5) en el dominio kr ~ l.
Finalmente, para kr
Rz
~
~
l la solución (130.5) toma la forma asintótica (§ 33):
sen(kr-!l1r)
c1(2l+l)!!
+
rkl+l
c2kl
(2!-1)!! r
cos(kr-!l1r).
Esta suma se puede representar en la forma
Rz
donde la fase
<5 1 se
~ constante x
sen(kr-}l1r+81)
,
(130.6)
r
determina por la igualdad
tan8z
l"'-J
81
= c2k2Z+l/c1(2l-1)!! (2l+ 1)!!
(debido a que k es pequeño, todas las fases
<5 1
(130.7)
resultan pequeñas).
Según (122.14), las amplitudes de dispersión parciales son
1
fz = 2ik (e2i81- l) ~ Sz/k,
y 1legamos a la conclusión de que, en el caso límite de energías pequeñas, se tiene
(130.8)
Así, pues, todas las amplitudes parciales con l =/= O resultan ser pequeñas comparadas con la amplitud de dispersión con l = O (o, como suele decirse, de la dispersión s). Prescindiendo de ellas, tenemos para la amplitud total
f(O) ~ fo
=
So/k
=
c2/c1
= -oc,
(130.9)
de modo que da = ~2 do, y la sección eficaz total vale
a
= 4rroc2.
(130.10)
Para velocidades pequeñas la dispersión es isótropa y su sección eficaz no depende
580
Teoría de las colisiones elásticas
de la energía de las partículas (1). La amplitud de dispersión puede ser tanto positiva
como negativa (2 ).
En los razonamientos que preceden se ha supuesto implícitamente que el campo
V(r) tiende a cero a grandes distancias (r ~ a) con rapidez suficiente como para
que sea lícito prescindir de los términos de que de hecho se ha prescindido. Es fácil
determinar cuál debe ser precisamente la rapidez con que ha de disminuir V(r).
Para grandes valores de r, el segundo término en la función R1 (130.3) es pequeño
comparado con el primero. Para que, a pesar de ello, sea lícito conservarlo, los
términos pequeños conservados en la ecuación (130.2) ,..._, c2/r 1+1r 2 deben ser, no
obstante, grandes respecto del término UR 1 ,..._, Vc 1r1, del que se ha prescindido al
pasar de ( 130.1) a ( 130.2). De aquí se sigue que V(r) debe disminuir más rápidamente
que I/r 2l+a para que sea válida la ley (130.8) relativa a la amplitud parcial f1, En
parÜcular, el cálculo de f 0 , y, por consiguiente, también el resultado (130.9) acerca
de la dispersión isótropa independiente de la energía, valen tan sólo para una disminución de U(r) a grandes distancias más rápida que la de 1/r3 •
Si a distancias grandes el campo U(r) disminuye exponencialmente, es posible
llegar a determinadas conclusiones acerca del carácter de los demás términos del
desarrollo de la amplitud Ji, en potencias de k. Vimos en el § 128 que, en este caso,
la amplitud Ji, considerada como función de la variable compleja E, es real para
valores negativos reales de E (3). Lo mismo vale, por lo tanto, para la función g 1(E)
en la expresión (124.15):
fz = 1/(gz-ik)
(para E < O, ik es real). Por otro lado, la función gt(E) es real (por definición)
para E> O. De esta manera, la función g1(E) resulta real para todos los valores
reales de E y, por consiguiente, debe poderse desarrollar en potencias enteras de E,
es decir, en potencias pares de k. En cuanto a la propia amplitud .li(k), cabe decir,
por lo tanto, que se desarrolla en potencias enteras de ik; todos los términos con
potencias pares de k son reales, y los términos con potencias impares de k son imaginarios. De acuerdo con (I 30.8) el desarrollo de fi(k) comienza con un término
,....., <3,/k ,....., k 21 ; por consiguiente, el desarrollo de g 1(k) comienza con un término
que es proporcional a k-21 •
(l) En la dispersión de electrones por átomos, el papel de la longitud a,.con la que debe compararse
1/k (la condición ka ~ 1), lo representa el radio atómico, que para los átomos complejos alcanza un valor
igual a varias veces el radio de Bohr (varias veces el valor n2 /me 2 ). Debido al valor grande de este radio,
la sección eficaz es de hecho constante, en este caso, únicamente hasta energías que son del orden de una
fracción de electrón-voltio. Para mayores energías de los electrones, en cambio, se manifiesta una fuerte
dependencia de la sección eficaz con relación a la energía (el llamado efecto Ramsauer).
(2) La cantidad r:,. se suele llamar longitud de dispersión. En la dispersión provocada por una esfera
impenetrable (véase problema 1) r:,. coincide con el radio de la esfera.
(ª) Para valores E pequeños, la condición (128.6) se cumple ya cuando U disminuye según la ley e-r :a.
581
Dispersión de partículas lentas
Si el campo disminuye a grandes distancias según una ley potencial U ~ ¡3,-n
con n < 3, el resultado (130.9), que hace de la amplitud una constante, no es válido,
conforme ya se indicó.
Consideremos la situación que se plantea para diferentes valores de n. Para
n < I y velocidades suficientemente pequeñas, para prácticamente todos los valores
del parámetro de impacto e se cumple la condición
PI U(p)I ~ liv
(130.11)
y, en consecuencia, la dispersión viene dada por las fórmulas clásicas (cf. la condición (126. 7)).
Para 1 < n < 2, la desigualdad ( 130.11) se cumple para valores de e no demasiado grandes; de acuerdo con esto, la dispersión es clásica para ángulos no demasiado
pequeños. A la vez existe un intervalo de valores de g para los que
PI U(p)I ~ liv,
(130.12)
es decir, se cumple la condición de aplicabilidad de la teoría de perturbaciones
(cf. (125.2)).
Para n
> 2,
a grandes distancias se satisface la desigualdad
u¡
1
~ fi2/mr2
(130.13)
por lo que la contribución a la dispersión resultante de la interacción a estas distancias se puede calcular mediante la teoría de perturbaciones (mientras que a distancias más próximas la condición de aplicabilidad de dicha teoría puede muy bien
no quedar satisfecha) (1). Sea r0 un valor de r tal que parar ~ r0 se cumpla la desigualdad (130.13) a la vez que es rO ~ 1/ k. La contribución a la amplitud de dispersión debida al dominio de distancias r ~ r0 viene dada, según (125.12), por la integral:
f
ñ,2
ro
f
~
00
_ 2mf3
~ senqr r2 dr = _
rn
qr
~ n -3
n2
sent dg.
gn-1
(130.14)
qro
Para 2 < n < 3 esta integral converge en el límite inferior y para velocidades
pequeñas (kr 0 ~ I) se puede substituir este límite por cero, con lo que la integral
resulta proporcional a q-< 3-·n), es decir, a una potenciá negativa de la velocidad.
Esta contribución a la amplitud, por consiguiente, es en este caso la contribución
principal, de modo que
J ,. ., q-(3-n>, 2 < n < 3.
(130.15)
(1) En este caso, la dispersión para pequeñas velocidades no es nunca cuasiclásica, ya que la desigualdad (I 30.11) es entonces incompatible con la condición l U(g)¡ ~ E que se exige a la vez.
582
Teoría de las colisiones elásticas
Con esto se determina al mismo tiempo la dependencia de la sección eficaz de dispersión respecto de la velocidad de las partículas y del ángulo de dispersión.
Paran= 3 la integral (130.14) diverge logarítmicamente en el límite inferior.
Con todo, sigue siendo la parte principal de la amplitud de dispersión, de modo que
f "'
(130.16)
n = 3.
log(constante/q),
Para n > 3 la contribución del dominio r ~ r O disminuye para k -+ O y la dispersión viene determinada por la amplitud constante_· (130.9). Sin embargo, la contribución (130.14) a la amplitud de dispersión, a pesar de su relativa pequeñez, también en este caso presenta un cierto interés en virtud de su carácter «anómalo».
La situación «normal», para una disminución suficientemente rápida de U(r),
es la posibilidad de desarrollar f(k) en potencias enteras de k. siendo todos los términos reales del desarrollo proporcionales a potencias pares de k. En cambio,
integrando (130.14) por partes (disminuyendo así el grado de~ en el denominador)
separamos de la integral una parte que contiene potencias pares de k, quedando luego
una integral que converge para qr O -+ O, integral que es proporcional a la potencia
kn-3 que, en general, no es par (1).
PROBLEMAS
1. Determinar la sección eficaz de dispersión de partículas lentas por un pozo de potencial
esférico de profundidad U0 y radio a
U(r) = - Uopara r< a, U(r) = Opara r
Solución.
>
a.
Se supone que el número de onda de la partícula satisface las condiciones ka ~ l
= O en la
y k ~ x, donde x = V<2mU0 )/ñ. Nos interesa solamente la fase 00 • Haremos por ello l
ecuación (130.1) y para la función = rR0 (r) se obtendrá la ecuación
x
x"+K2x =
O parar = a.
La solución de esta ecuación que se anula oara r
=
O (x/r debe ser finito en r
X= A senKr
Parar> a la función
x satisface la ecuación x" +k x =
x = B-sen(kr+8o)
La condición de continuidad de
x' /x en r
=
O), es:
< a).
(r
2
=
O (la ecuación (130.4) con/= O), de donde
(r
> a).
a nos da:
K cot Ka = k cot(ka+8o)
~
k/(ka+8o),
(1) Si n es un número impar (n = 2p+ 1), n - 3 = 2p - 2 será un número par. Sin embargo, la integral (130.14) también en este caso contiene una parte« anómala» que da una contribución a la amplitud
de dispersión proporcional a q 2P-2 /n q.
Dispersión de partículas lentas
583
lo que permite determinar c5 0 • Finalmente, para la amplitud de dispersión obtenemos (1):
tan Ka-Ka
!=--K
Para xa ~ 1 (es decir, U0 ~ h /ma
2
2
esta fórmula nos da
)
<1 =
;na2 • (xa)4, de acuerdo con el re-
sultado de la aproximación de Born (véase el problema 1, § 125).
Si se cambia el signo de U0 (con lo cual hay que cambiar x por ix), obtenemos la amplitud de
díspersión por una « colina de potencial »:
tanhKa-Ka
!=--K
En el caso límite xa
~
1 se tiene:
f = -
a, cr = 47Ta2 ~
este resultado corresponde a la dispersión por una esfera impenetrable de radio a; obsérvese que
la mecánica clásica daría un valor cuatro veces menor (<1 = na2).
2.
U
=
Determinar la sección eficaz de dispersión de las partículas de pequeña energía en el campo
> O, n > 3.
fY..jrn, fY..
Solución.
La ecuación (130.1) con l
=
O se escribe:
x" -y2x/rn = o,
y = v(2mC1-)/ñ.
Mediante las substituciones
X=
r = [2y/(n-2)x]2/(n-2>
</>vr,
dicha ecuación se reduce a la forma
d2<f> +~ d</>-(1+
dx 2
xdx
l
)<1>
(n-2)2x2
= o,
es decir, a la ecuación de Jas funciones de Bessel de orden 1/(n - 2) y argumento imaginario ix.
La solución que se anula en r = O (es decir, para x = oo), es, salvo un factor constante:
X
= yrH1¡(n-2)<1l(2iyr-Cn-2l/2/(n-2)).
Mediante las conocidas fórmulas
Hpm(z)
=
i[e-iPTTj p(z)-]-p(z)]/sinp7T,
Jp(z) "'zP/2PI'(p+ 1)
(z
~
1),
(1) Esta fórmula deja de ser aplicable si la amplitud y la profundidad del pozo son tales que xa es
próximo a un múltiplo impar de n/2. Para tales valores de xa, en el espectro discreto de niveles negativos
de la energía se tiene un nivel próximo a cero (véase problema J, § 33), y la dispersión viene descrita por
fórmulas que se obtendrán en el párrafo siguiente.
584
Teoría de las colisiones elá.~ticas
obtenemos para la función x a grandes distancias (y ~ r ~ 1/k) una expresión de la forma
x = const.(c1r+c2), y de la razón c2/c1 deducimos para la amplitud de dispersión:
f
-(_2'.__)2/(n-2lr((n-3)/(n-2)]_
n-2
I'[(n-1)/(n-2)]
=
3. Determinar la amplitud de dispersión de las partículas lentas en un campo que disminuye
a grandes distancias según la ley U~ f],-n, 2 < n < 3.
Solución. El término principal en la amplitud de dispersión viene dado por la expresión (130.14),
en la que el límite inferior de la integral se puede substituir por el valor cero. El cálculo de la misma
conduce ai resultado:
TTm/3
!=
t,,2
qn-3
I'(n-1) cos }TTn'
2 < n < 3,
(1)
yparan=3
f=
2mf3
constante
--log--.
t,,2
q
(2)
Desarrollando (1) en polinomios de Legendre se pueden obtener las amplitudes parciales de
dispersión (definidas por (122.12)):
fz
= -
yTTm/3 I'(!n-l)I'(l-!n+l)
2/i2
I'(!n)I'(!n+i+l) kn-3.
(3)
Paran> 3 la misma fórmula (1) determina la parte «anómala» de la amplitud de dispersión.
En las amplitudes parciales, en cambio, la cantidad (3) es siempre la parte principal para aquellos
valores de l para los que 2/ > n - 3; en vez de (130.8) tenemos entonces !, (X kn-a.
§ 131.
Dispersión de resonancia para pequeñas energías
La dispersión de partículas lentas (ka ~ 1) en un campo atractivo requiere
consideración aparte cuando en el espectro discreto de niveles negativos de energía
se tiene un estados cuya energía es pequeña comparada con la magnitud del campo
dentro de los límites de su radio de acción a. Designaremos este nivel por e(s < O).
Dado que la energía E de la partícula dispersada es una cantidad pequeña, su energía
es próxima al nivel e, es decir, se encuentra, como suele decirse, casi en resonancia
con el mismo. Esto conduce, como veremos, a un considerable aumento de la sección eficaz de dispersión.
La existencia de un nivel poco profundo se puede tener en cuenta en la teoría
de la dispersión mediante un método formal que se basa en las siguientes consi-
Dispersión de resonancia para pequeñas energías
585
derac10nes.
En la ecuación de
SCHRODINGER
x" +(2m/h2 )[E-U(r)]x = O
(x = rR 0) se puede prescindir de E (en virtud de la condición ka ~ 1) en la región
r ,.._,a:
r,..., a.
x"-(2m/h2 )U(r)x = O,
Por el contrario, en el dominio «exterior» (r
de U:
~ a)
x" +(2m/h2)Ex = O,
r
(131.1)
se puede prescindir, en cambio,
~
a.
(131.2)
La solución de la ecuación (131.2) debería «empalmarse» para un cierto valor r1
(tal que 1/k ~ r 1 ~ a) con la solución de la ecuación (131.1) que satisfa~e la condición de contorno x(O) = O; la condición de empalme se traduce en la continuidad
de la razón x' /X, que no depende del factor de normalización general de la función
de onda.
Sin embargo, en vez de estudiar el movimiento en el dominio r ,.._, a, imponemos
a la solución en el dominio exterior una condición de contorno, elegida de manera
adecuada, relativa a x' /x y para valores de r pequeños; dado que la solución exterior varía lentamente para r -+ O, esta condición puede referirse formalmente al
punto r = O. La ecuación (131.1) en el dominio r ,_, a no contiene E; por consiguiente, la condición de contorno que la substituye tampoco debe depender de la
energía de la partícula. Con otras palabras, debe ser de la forma
[x' /x]r""'a = -
K,
(131.3)
donde x es una cierta constante. Pero ya que x no depende de E, esta misma condición (131.3) debe valer para la solución de la ecuación de ScHRODINGER correspondiente a una pequeña energía negativa E= - ls!,.es decir, a la función de onda
del correspondiente estado estacionario de la partícula. Para E= - Is! se deduce
de (131.2):
X
=
constante x e-rv(2mlell/1í,
y la substitución de esta función en (131.3) prueba que " es una cantidad positiva,
igual a
(131.4)
Apliquemos ahora la condición de contorno (131.3) a la función de onda del
movimient_o libre:
x=
constante xsen(kr+8o),
586
Teoría de las colisiones elásticas
que es la solución general exacta de la ecuación ( 131.2) para E> O. Como resultado obtenemos para la fase buscada, '50 ,
cotSo = -K/k
(131.5)
Dado que la energía E está limitada aquí exclusivamente por la condición ka ~ 1,
pero no tiene por qué ser pequeña comparada con s, la fase '50 puede resultar ser una
cantidad no pequeña.
En cambio, las fases <5 1 con l-=/=- 1 siguen siendo pequeñas, como antes. Por
consiguiente, en la amplitud de dispersión se puede prescindir, como se hizo anteriormente, de todos los términos con l-=/=- O, de modo que la dispersión resulta isótropa.
Substituyendo (131.5) en la fórmula
1
-(e2i8o-l)
f ~
- 2ik
=
1/k(cotSo-t),
obtenemos para la amplitud de dispersión la expresión
f
=
(131.6)
-1/(K+ik)
y para la sección eficaz total:
(J
4-rr
27Tlí2
1
K2+k2
m
E+IEI
= --- = -----.
(131.7)
Así, pues, la sección eficaz de dispersión elástica depende de la energía, y en el dominio de una resonancia (E ,...., !.si) es grande comparada con el cuadrado del radio
de acción del campo, a2 , (ya que ka ~ 1). La fórmula (131. 7) fue obtenida por E. WIGNER (1933); la idea del razonamiento expuesto aquí se debe a H. BETHE y R. PEIERLS
(1935).
La fórmula obtenida posee un carácter algo más general que el correspondiente
a la hipótesis hecha para deducirla. Sometamos la función U(r) a una variación
pequeña; con ello varía también el valor de la constante x en la condición de contorno (131.3). Mediante un cambio adecuado de U(r) puede lograrse anular x,
transformándola luego en una pequeña cantidad negativa. En estas condiciones,
obtenemos la misma fórmula (131.6) para la amplitud de dispersión y la misma
fórmula (131. 7) para la sección eficaz. Sin embargo, en esta última la cantidad
1€1 = n2K2/2m es ahora simplemente una constante característica del campo U(r),
Dispersión de resonancia para pequeñas energías
587
pero en modo alguno un nivel de energía en dicho campo. En tales casos se dice que
en el campo se tiene un nivel virtual, considerando que aunque en realidad no existe·
ningún nivel próximo a cero, con todo, una pequeña variación del campo sería
suficiente para que apareciera un tal nivel.
Mediante la prolongación analítica de la función (131.6) en el plano complejo E,
sobre el semieje real negativo ik se transforma en 2mEYh (véase § 128), y
vemos así que la amplitud de dispersión tiene un polo en E= - \si, de acuerdo con
los· resultados generales del § 128. Por el contrario, cual debe ser, a un nivel virtual
no corresponde sobre la hoja física ninguna singularidad de la amplitud de dispersión (sin embargo, la amplitud de disper~ión tiene un polo E = - !si en la hoja
no física: véase la nota de la pág. 569).
ve-
Desde un punto de vista formal, la fórmula (131.6) corresponde al caso en que
en la expresión (124.15)
/o=
1
go(k)-ik'
el primer término del desarrollo de la función g 0(k) es negativo y excepcionalmente
pequeño. Para hacer la fórmula más precisa puede tenerse en cuenta el término
siguiente del desarrollo, escribiendo:
1
/o=----Ko+!rok2-ik
(131.8)
(L. LANDAU, IA. SMORODINSKII, 1944); recordemos que para una disminución del
campo suficientemente rápida, las funciones gi(k) se desarrollan en serie de potencias
pares de k - véase § 130. Designamos aquí por - K 0 la cantidad g0(0) a fin de conservar la notación K para la cantidad (131.4), ligada con el nivel de energía s. De acuerdo
con lo antes dicho, K se define como el valor - ik = K que anula el denominador
de (131.8), es decir, como igual a la raíz de la ecuación
(131.9)
El término correctivo ro/(2/2 en el denominador de (131.8) es pequeño comparado
con K 0 en virtud de la hipótesis de que k es pequeño, pero posee de suyo un orden
de magnitud « normal »: el coeficiente r O ,...._, a (este coeficiente es siempre positivo
- véase problema 1). Hay que subrayar que tener en cuenta este término constituye
una mejora válida de la fórmula para la amplitud de dispersión cuando se prescinde de las contribuciones debidas a los momentos l =/= O: da en f una corrección
cuyo orden relativo es ak, mientras que la contribución de la dispersión con l = 1
588
Teoría de las colisiones elásticas
es del orden relativo de (ak) 3 ( 1).
Para la sección eficaz de dispersión tenemos, en virtud de (131.8):
a=
~~~-~~-
o- ! ro k 2) 2 + k 2 •
Si se prescinde en el denominador del término ,._, k 4 (aunque puede conservarse),
cabe escribir esta fórmula (teniendo en cuenta (131.9)) en la forma
(K
O'
47r(l +roK)
41rli 2 1+roK
= -k-2+-K2-- = -;;;- E+ 1€1 ·
(131.10)
Consideremos brevemente la resonancia en la dispersión con momentos cinéticos
orbitales diferentes de cero.
El desarrollo de la función g 1(k) empieza con un término ,_, k-21 ; conservando
los dos primeros términos del desarrollo, escribiremos la amplitud parcial de dispersión en la forma
1
(131.11)
fz = - bE-E(-E+E)+ik'
donde by s son dos constantes y b > O (véase más adelante). Al caso de resonancia
corresponde un valor anómalamente pequeño del coeficiente de E- 1 es decir, un
valor s excepcionalmente pequeño. Sin embargo, debido a que E es pequeño, el
término bsE-1 puede, de todas maneras, resultar a la vez grande comparado con k.
Si E < O, el denominador de la expresión (131.11) posee una raíz real E,;;;;; - \si,
de modo que s es un nivel discreto de energía (con momento cinético l) (2). Sin em(1) Para k-+ O la amplitud fo-+ - 1/Ko, es decir, 1/,co coincide con la longitud de dispersión ex introducida en ~l párrafo anterior. El coeficiente de r 0 en la fórmula
go(k)
=k cotoo
= -1/ex+!rok2
(131.8a)
se llama radio efectivo de la interacción.
Daremos los valores de las constantes ex y r,, para el caso importante de la interacción de dos nucleones.
Para un neutrón y un protón con spins paralelos (estado isotópico T = O) es ex = 5,39-10-13 cm, r0 = 1,70·
10-13 cm; a estos valores corresponde un nivel real con energía lcl = 2,23 Me V - el estado fundamental
del deuterón. En cambio, para un neutrón y un protón, con spins antiparalelos (estado isotópico T = 1)
es ix = - 23,7· 10-13 , r0 = 2,67· 10-11 cm; a este valor corresponde un nivel virtual /e/ = 0,067 Me V.
En virtud de la invariancia isotópica, estos últimos valores deben corresponder también al sistema de dos
neutrones con spins antiparalelos (el sistema nn en un estado s no puede, en modo alguno, poseer spins
paralelos, en virtud del principio de PAULI).
(2)
Para e< O y E próximo a e:
La comparación con (128.16) prueba que b > O.
Dispersión de resonancia para pequeñas energías
bargo, en contraposición a la resonancia
no es nunca grande comparado con a; la
con momento cinético l + 1 resulta ser tan
la amplitud de la dispersión sin resonancia
589
en la dispersión-s, la amplitud (131.11)
amplitud de la dispersión de resonancia
sólo del mismo orden de magnitud que
y con momento cinético /.
En cambio, si e > O, la amplitud ( 131.11) alcanza en el dominio E ""' e el orden
de magnitud de 1/k, es decir, llega a ser grande comparada con a. La anchura relativa de este dominio es pequeña: b..E/e ""'(ak) 21- 1 . Se presenta en este caso, por
consiguiente, una resonancia muy acentuada. Este comportamiento de la dispersión
de resonancia está ligado con el hecho de que un nivel positivo con 1-=/=- O, si bien
no es un nivel discreto real, representa sin embargo un nivel « cuasi discreto »:
gracias a la existencia de la barrera de potencial centrífuga, la probabilidad de que
una partícula con energía pequeña escape de este estado al infinito es pequeña,
de modo que la «vida» del mismo es grande (véase § 132) (1 ). Es ésta precisamente la causa de la diferencia entre el carácter de la dispersión de resonancia para
! -=/=- O y el de la dispersión de resonancia en un estado-s, en el que no existe barrera
centrífuga.
Finalmente, he aquí una interesante propiedad de las fases IJ 1 que se puede establecer fácilmente a partir de los resultados antes expuestos.
Consideremos las fases IJ 1(E) como funciones continuas de la energía, sin limitarlas al intervalo entre O y n (cf. la nota de la pág. 127). Demostraremos que entonces se cumple la igualdad
oz(O)-Sz(oo) =
(131.12)
n1r,
donde n es el número de niveles discretos con momento cinético len el campo de
atracción U(r ).
Observemos para ello que en un campo que satisface la condición Iu¡ ~ li 2/ma 2,
la aproximación de Born es aplicable para todas las energías, de modo que IJ 1(E) ~ 1
cualquiera que sea E. En estas condiciones, /J¡( =) = O, ya que, para E-+ = la
amplitud de disp:;!rsión tiende a cero; por otra parte, se tiene /Ji(O) = O, de acuerdo
con los resultados generales del § 130. A la vez, en un campo de estas características no existen niveles discretos (véase § 45), de modo que n = O. Veamos ahora
cómo varía la diferencia /J 1(b..) -IJ¡( =) (donde b.. es una cantidad pequeña dada)
al «ahondarse» gradualmente el pozo de potencial U(r). A medida que aumenta
la profundidad, aparecen sucesivamente en el límite superior del mismo los niveles l.º,
(1)
Si
E
> O, el denominador en (131.1 l) se anula para E = E 0
r
= 2y(2m) el+l/2.
bñ
-
iff/3), donde
(131.lla)
Este polo de la amplitud de dispersión se encuentra, sin embargo, sobre la hoja « no física ». La pequeña
cantidad r es la anchura del nivel cuasidiscreto (véase§ l 32).
590
Teoría de las colisiones elásticas
2.º, etc. La fase <51(~) experimenta entonces cada vez un aumento den (1). Una vez
alcanzado el U(r) dado, y haciendo luego que ~-+ O, obtenemos la fórmula (131.12).
PROBLEMAS
l. Expresar el coeficiente , 0 en la fórmula (131.8) mediante la función de onda del estado
estacionario E = e en la región en que r ,..._, a (IA. A. SMORODINSKII, 1948).
Solución. Determinando el residuo de la función (131.8) en el polo E= e y comparando con
la fórmula (138.10), encontramos que:
1
-
Ao 2
=
1
--lro,
2K
donde A 0 es el coeficiente en la función x = A 0e-Kr en el dominio r ~ a. Sea Xo la función de onda
en la región r ,..._, a, normalizada por la condición xo-+ 1 para r-+ oo. El cuadrado de la función
de onda se puede entonces escribir, en todo el espacio, en la forma
X2
= Ao2(e-2Kr +
A02e-2Kr
(esta expresión se reduce a
para
normalizar mediante la condición:
f x•
KT
~ 1
y a A02xu2 para
f
00
xo2-1)
Kr
~ 1).
Este cuadrado se debe
00
dr = Ao•(z~ -
o
(1-xo•) dr)
1,
o
y la comparación con la expresión antes escrita para A0 2 nos da:
f
00
ro = 2
(1-x02) dr.
o
De la ecuación (131.1) con U(r) < O, cuya solución es la función Xo, se sigue que xo(r)<xo(oo)= l.
Por ello, siempre es r0 > O.
2. Determinar el cambio de las fases <5z en una variación del campo U(r).
Solución.
Variando U(r) en la ecuación de
2m[
SCHRODINGER
J
l(l+l)
xz"+-¡¡;: E- _r_2_ -U
obtenemos
2m[
l(l+l)
J
Xl =
o,
2m
8xz"+- E----U 8xz = -xzSU.
fi2
y2
fi2
(1) En la fórmula (l 31.5) corresponde a ello la variación de ó0 desde O a n, cuando, para un valor
dado de k pequeño, la cantidad K pasa del valor negativo - K ~ k al valor positivo K ~ k. En el caso
I =l= O, lo mismo se sigue de la fórmula k ctg ói = - bE-l(E- E), cuando, para un valor dado E= ~.
e varía de e ~ ~ a - e ~ ~-
Resonancia en un nivel cuasidiscreto
591
Multiplicando la primera ecuación por ox1., la segunda por Xi, restando los resultados miembro
a miembro e integrando respecto de r, se encuentra:
[xi8xz'-xz'8xi]r-+00
-J
2m
=
00
l;,2
xi28U dr.
o
Substituyendo en el primer miembro de la igualdad las expresiones asintóticas
xz = sen(kr-!i7T-8z),
8xz
=
8(8z)cos(kr-!Z1r+8z)
(eligiendo igual a 1 el coeficiente en esta expresión se consigue la normalización que hemos adoptado aquí para xz), obtenemos
8(8z) = -
2
f
00
m
kñ2
xi28U dr.
o
Basándose en esta fórmula es posible llegar a determinadas conclusiones acerca del signo de
las fases <5i consideradas como funciones continuas de 13: energía. Para evitar la indeterminación
en la definición de estas funciones (una constante aditiva múltiplo de n) las normalizaremos mediante la condición '5z(=) = O.
Partiendo de U= O, cuando todas las Oz = O, y aumentando progresivamente IU!, encontramos
que en un campo repulsivo ( U > O) todas las Oz < O, y que en un campo atractivo ( U < O) es
<5, > O. En un campo repulsivo <5z (O)= O, por lo que, para pequeñas energías, las o, son pequeñas;
por consiguiente, la amplitud de dispersión es negativa: f ~ 00 /k < O. En un campo de atracción,
cabe llegar a la misma consecuencia acerca del carácter negativo de f únicamente en el caso en
que no existen niveles; en el caso contrario, para valores E pequeños las fases o, no son próximas
a cero, sino a nn (véase (131.12)) y nada puede deducirse acerca del signo de f.
§ 132.
Resonancia en un nivel cuasidiscreto
Un sistema que es suceptible de desintegrarse no posee, estrictamente hablando,
un espectro discreto de energías. La partícula que escapa del mismo en la desintegración escapa al infinito; en este sentido, el movimiento del sistema es infinito, por
lo que el espectro energético es continuo.
Sin embargo, puede ocurrir que la probabilidad de desintegración del sistema
sea muy pequeña. El ejemplo más simple de ese tipo de movimiento lo ofrece una
partícula rodeada de una barrera de potencial suficientemente alta y ancha. Otra
causa de metaestabilidad de los estados puede serlo la necesidad de que el spin
del sistema cambie en la desintegración, cambio que resulta de una débil interacción
spin-órbita.
Para estos sistemas, cuya probabilidad de desintegración es pequeña, se puede
592
Teoría de las colisiones elásticas
introducir el concepto de estados cuasiestacionarios en los que las partículas se mueven durante largo tiempo « dentro del sistema », abandonándolo tan sólo después
de transcurrido un considerable intervalo r, que se puede llamar «vida» del estado
dado casi estacionario (r ,.._, I/w, donde w es la probabilidad de desintegración
por unidad de tiempo). El espectro energético de estos estados será « cuasidiscreto »;
está constituido por una serie de niveles difuminados, cuya « anchura » r está
Jigada con la vida por la relación r ,.._,/i/r (véase (44.7)). Las anchuras de los niveles
cuasidiscretos son pequeñas comparadas con las distancias que los separan.
Al estudiar los estados cuasiestacionarios se puede aplicar el siguiente método
formal. Hasta aquí hemos considerado siempre soluciones de la ecuación de SCHRODINGER con la condición de contorno de que la función de onda sea finita en el infinito. En vez de esto buscaremos ahora soluciones que representan en el infinito
una onda esférica divergente; ésta corresponde a una partícula que escapa finalmente del sistema en la desintegración del mismo. Dado que una tal condición de
contorno es compleja, no es posible ya afirmar que los valores propios de la energía
deben ser reales. Por el contrario, como resultado de la resolución de la ecuación
de SCHRODINGER obtenemos un conjunto de valores complejos que escribiremos
en la forma:
E= Eo-!ir,
(132.1)
donde E 0 y r son dos cantidades positivas (véase más abajo).
Es fácil ver en qué consiste el sentido físico de los valores complejos de la energía.
El factor temporal de la función de onda de un estado cuasiestacionario tiene Ja
forma:
e-<i!li)Et
=
e-<iflilEate-(I' /li)t/2,
Por ello, todas las probabilidades, que vienen determinadas por los cuadrados del
módulo de la función de onda, disminuyen con el tiempo según la ley e-<rr11,)t (1).
En particular, de acuerdo con esta ley disminuye también la probabilidad de encontrar la partícula « dentro del sistema».
Así, pues, r determina la duración de la vida del estado; la probabilidad de
desintegración por unidad de tiempo es igual a
w =
r;n.
(132.2)
A grandes distancias, la función de onda de un estado cuasiestacionario (onda
divergente) contiene el factor
exp [iry {2m( Eo -iir) }/li],
(1) Observemos que de aquí resulta patente la necesidad física de que I' sea positiva. Por lo demás,
positiva resulta ser automáticamente (como es posible demostrar a partir de la ecuación de onda) en virtud de la condición impuesta en el infinito.
593
Resonanda en un nivel cua.~idiscreto
que crece exponencialmente para r-+
1
.'-E
( O - 2/·1') < O\I·
= (la
parte imaginaria de la raíz es lm
l
Por ello la integral de normalización Ji tpj 2 d V para estas funciones es divergente.
Observemos, sin embargo, que esta circunstancia resuelve la aparente contradicción
entre la disminución del cuadrado \1pj 2 con el tiempo y el hecho de que la integral
de normalización debe ser una cantidad constante, conforme se sigue de la ecuación
de onda.
Veamos cuál es la forma de la función de onda que describe el movimiento de
una partícula cuya energía es próxima a uno de los niveles cuasidiscretos del sistema.
Como en el § 128, escribiremos la forma asintótica (a grandes distancias) de la
parte radial de la función de onda en la forma ( 128.1)
Rz
1[
= ;
(
Az(E)exp -
v(-2mE) )
(v(-2mE) )]
li
r +Bz(E)exp
li
r ,
(132.3)
y consideraremos E como una variable compleja. Para valores reales positivos
de E, es:
1
Rz = -[ Az(E)efkr + Bz(E)e-ikr],
r
k = y(2mE)/li,
(132.4)
donde A 1(E) = B1*(E) (véase ( 128.3-4)); la función Bi(E) se toma aquí en el borde
superior del corte, practicado a lo largo del semieje real positivo.
La condición que determina los valores propios complejos de la energía se traduce
en que en la expresión asintótica (132.3) no exista la onda convergente. Esto significa que para E = E 0 - VI' debe anularse el coeficiente B¡(E):
Bz(Eo-lif)
=
O.
(132.5)
De esta manera los niveles cuasidiscretos de energía, como los niveles realmente
discretos, son ceros de la función B1(E). Sin embargo, a diferencia de los ceros que
correspondan a niveles reales, dichos ceros no se encuentran sobre la hoja física.
En efecto, al escribir la condición ( 132.5) hemos supuesto que la función de onda
buscada del estado cuasiestacionario procede del mismo término de ( 132.3) que
representa la onda divergente ( ,...,_, eikr) también para E> O ( 132.4). Pero el punto
E = E 0 - vr está situado por·debajo del semieje real positivo. Llegar a este punto
a partir del borde superior del corte (sobre el que están definidos los coeficientes
en I 32.4)), sin salir por ello de la hoja física, es sólo posible rodeando el punto
E = O. Sin embargo, entonces V- E cambia de signo, de modo que la onda divergente se transforma en la convergente. Por consiguiente, para que se conserve el
carácter divergente de la onda el paso debe efectuarse directamente hacia abajo,
594
Teoría de las colisiones elásticas
atravesando el corte, de forma que vamos a parar a la otra hoja, la « no física ».
Consideremos ahora los valores positivos reales de la energía próximos a un
nivel cuasidiscreto (con ello, claro está, se supone que r es pequeña; en el caso contrario, esta proximidad sería totalmente imposible). Desarrollando la función Bi(E)
en potencias de la diferencia E - (E0 - HI') y limitándonos al término de primer
orden, haremos
(132.6)
Bz(E) = (E-Eo+tir)bz,
donde b1 es una constante. Substituyendo este resultado en (132.4), obtenemos la
siguiente expresión para la función de onda de un estado próximo a un estado
cuasiestacionario (1):
La fase
<'5 1
1
-[(E-Eo-tir)bi*eikr + (E-Eo+iir)bze-ikr].
r
de esta función viene dada por la fórmula
Rz
=
(132.7)
E-Eo-iir
e2io, = e2io,< 0 J_
_ __
E-Eo+iir
r
(1- E-Eo+izT
'
= e2io/ 0 >
i
(132.8)
)
donde
(132.9)
(cf. (132.7) con (122.8~9)). Para jE - E 0 f ~ r la fase <51 coincide con
que <5/0 > es el valor de la fase « lejos de la resonancia».
<5/0),
de modo
En el dominio de la resonancia <51 depende fuertemente de la energía. Si se escribe
la fórmula (132.8) en la forma (2):
Sz = Sz<0> + arctg
(1)
Para E= Eo -
Hr
r
2(E-Eo)
,
(132.10)
la función (132.7) se reduce a
lbzl 2 = 1/ñvr.
Si se normaliza la función de onda por la condición de que sea igual a la unidad la integral de /tp/ 2 extendida
al dominio « interior al sistema», la corriente total en esta onda divergente, igual a vlirh*i/2, debe coincidir con la probabilidad de desintegración ( 132.2). De aquí se sigue:
2
( )
Utilizamos la fórmula
e2ítan- 1 A
eitan- 1 A
1 + i'A
ritan-1 A
1-iA
= ___ = - - .
Resonancia en un nivel cuasidiscreto
595
se ve desde luego que al atravesar el dominio de la resonancia (de E~ E 0 a E~ E 0)
la fase varía en n.
Los resultados obtenidos permiten determinar la amplitud de la dispersión
elástica de una partícula cuya energía E es próxima a un nivel cuasidiscreto E 0
del sistema compuesto formado por el sistema dispersor y la partícula dispersada.
En la fórmula general (122.10), hay que substituir la expresión (132.8) en el término
con el valor de l al que corresponde el nivel E 0 • Obtenemos entonces:
21+ 1
tr
. e2io1< lPz(cosB),
E-Eo+tzr
0
f(B) = J<O>(B)- - - •
k
(132.11)
donde ¡<0 >(()) es la amplitud de dispersión lejos de la resonancia, amplitud que no
depende de las propiedades del estado cuasiestacionario (viene determinada por la
fórmula (122.10) con /J 1 = /JzC0 > en todos los términos de la suma) (1). La amplitud
¡<0>(()) se suele llamar amplitud de la dispersión potencial, y el seguhdo término en
la fórmula (132.11), amplitud de la dispersión resonante. Esta última posee un polo
para E= E 0 - ! iI' que, de acuerdo con lo dicho antes, no se encuentra sobre la
hoja física (2).
La fórmula (132.11) determina la dispersión elástica en el dominio de la resonancia correspondiente a un nivel cuasidiscreto del « sistema compuesto». El intervalo en que es aplicable viene determinado por la condición -de que la diferencia
jE - E 0 \ sea pequeña respecto de la distancia D entre niveles cuasidiscretos vecinos:
IE-Eol ~ D.
(132.12)
Esta fórmula se simplifica algo si se trata de la dispersión de partículas lentas,
es decir, si la longitud de onda de las partículas en el dominio de la resonancia es
grande comparada con las dimensiones del sistema dispersor. Desde este punto de
vista, importa tan sólo la dispersión s; supondremos que el nivel E 0 corresponde
precisamente a un movimiento con l = O. La amplitud de la dispersión potencial
se reduce ahora a una constante real ex. (véase § 130) (3). En cambio, en la amplitud
de la dispersión resonante supondremos l = O y substituiremos e2i 0/ 0 ' por la unidad,
ya que 80 <o> = - ock ~ 1. Obtenemos así:
tr
f(B) = -oc- k(E-Eo+iir)
(132.13)
Si se trata de la dispersión de una partícula cargada por un sistema que posee carga, para.las fases
hay que utilizar la expresión (133.11 ).
·
(2) Obsérvese que la fórmula (131.11) para la dispersión resonante de partículas lenta_s en un nivel
O, cuando E es próximo a E, corresponde exactamente al término de resonancia en ( 132.1_1 ).
positivo con l
Los valores E 0 y I' vienen entonces dados por las fórmulas ( 131.11 a), y teniendo en cuenta que E es pequena,
la fase S1<0J es pequeña, de modo que e2íB¡(O) ~ 1.
1
( )
Ó¡(º)
*
(ª) Se supone que el campo dispersor disminuye con rapidez suficiente con la distancia. Los resultados
expuestos se aplicarán en el § 142 a la dispersión de los neutrones lentos por núcleos.
596
Teoría de las colisiones elásticas
En un estrecho intervalo \E - E 0 \ ,..._, r, el segundo término es grande comparado
con la amplitud x y debe prescindirse de ésta. Sin embargo, al alejarse del punto
de resonancia, ambos términos pueden llegar a ser comparables.
Al deducir estas conclusiones se supuso implícitamente que el propio valor del
nivel E 0 no es demasiado pequeño y que la región de resonancia no se encuentra
en la vecindad del punto E = O. Pero si se trata de la resonancia en el primer nivel
cuasidiscreto del sistema compuesto, nivel que se encuentra a una distancia del
punto E= O que es pequeña comparada con la distancia al nivel siguiente (E0 ~ D),
el desarrollo ( 132.6) puede no ser válido; esto se manifiesta ya en que la amplitud
(132.13) no tiende a un límite constante para E-+ O, como exige la teoría general
en el caso de la dispersión-s.
Consideremos el caso de un nivel cuasidiscreto próximo a cero, suponiendo de
nuevo que en el dominio de resonancia las partículas dispersadas son tan lentas
que únicamente importa la dispersión-s.
El desarrollo de los coeficientes B1(E) de la función de onda debe efectuarse
ahora en serie de potencias de la propia energía E. El punto E = O es un punto
de ramificación de las funciones Bl(E), y al rodearlo, pasando del borde superior
al inferior del corte, B1(E) se transforma en B 1*(E). Esto significa que el desarrollo
se efectúa t;n serie de potencias de V- E, que cambia de signo al rodear dicho
punto. Representemos los primeros términos del desarrollo de la función Bo(E)
para valores reales positivos de E en la forma:
Bo(E) = (E-Eo+in!E)bo(E),
(132.14)
donde E0 y y son constantes reales y bo(E) es una función de la energía que se puede
también desarrollar en serie de potencias de V E, pero que carece de ceros en qn
entorno del punto E= O (1). Al nivel cuasidiscreto E= E 0 - ! iI' corresponde la
anulación del factor E - E0 +iy V E prolongado al semiplano inferior de la hoja
no física; por consiguiente, para determinar E 0 y r tenemos la ecuación
(132.15)
(las constantes E0 y y deben ser positivas para que resulten positivas E 0 y r). Así,
a un nivel de anchura r ~ E 0 corresponde la relación E0 ~ y 2 entre las constantes
E0 y y'. De (132.15) se sigue entonces que E O = E0 , r = 2y VE •
0
La expresión (132.14) substituye en el caso considerado a la fórmula (132.6);
de acuerdo con ello deben modificarse las demás fórmulas (hay que substituir en
todas ellas E0 por E0 y r por 2y VE). Por consiguiente, para la amplitud de dispersión
obtenemos, en vez de ( 132.13), la expresión siguiente:
(1) La función bo(E) determina, según ( 132.9), la fase de la dispersión potencial. Para la dispersión
de partículas lentas, los primeros términos de su desarrollo son bo(E) = const· i(l +hk).
Fórmula de Ruther/ord
!=
liy
-CJ.-
597
(132.16)
v'(2m)(E-Eo+iyy'E)
(hemos substituido aquí k = V<2mE//üdonde m es la masa reducida de la partícula
del sistema dispersor). Para E..- O esta amplitud tiende, como debe ser, a un límite
constante (se justifica así la forma del desarrollo (132.14)).
Obsérvese que una expresión de la forma (132.16) incluye también el caso de un
nivel realmente discreto, próximo a cero, del sistema compuesto, expresión que se
obtiene de acuerdo con la correspondiente relación entre las constantes c0 y y. Si
!Eol ~ y 2 , para las energías E ~ y 2 se puede prescindir del primer término (E) en el
denominador del término de resonancia.
Prescindiendo también de la amplitud de dispersión potencial oc, obtenemos la
fórmula
1
f = - -ik---V-(-2m-)-Eo-/fi-y'
que coincide con la fórmula (131.6) (con K = -V(2mc0 /liy). Esta fórmula corresponde
a la resonancia en el nivel E= cl/y2 , que es un nivel discreto real o virtual según
sea positiva o negativa la constante K.
§ 133.
Fórmula de Rutherford
La dispersión en un campo coulombiano posee particular interés desde el punto
de vista de las aplicaciones físicas. Es también interesante debido al hecho de que, para
este caso, el problema de las colisiones se puede resolver en la mecánica cuántica
hasta el final exactamente.
Cuando existe una dirección privilegiada (en el presente caso, la dirección de
la partícula incidente), la ecuación de SCHRODINGER para un campo coulombiano
conviene resolverla en coordenadas parabólicas t t¡, cf, (§ 37). El problema de la
dispersión de una partícula en un campo central presenta simetría axil. Por ello
la función de onda 1P no depende del ángulo cf,. Una solución particular de la ecuación de ScHRODINGER (37.6) puede ser de la forma:
(133.1)
{(37.7) con m = O), y de acuerdo con esto, después de separar las variables, obtenemos las ecuaciones (37.8) con m = O (1):
(1)
En este párrafo utilizamos unidades coulombianas (véase pág. 135).
598
Teoría de las colisiones elásticas
(133.2)
La energía de la partícula dispersada es, claro está, positiva; hemos hecho E= k 2 /2.
Los signos en las ecuaciones ( 133.2) corresponden al caso de un campo repulsivo;
para la sección eficaz de dispersión en un campo atractivo se obtiene exactamente
el mismo resultado final.
Hemos de hallar una solución de la ecuación de SCHRODINGER que para valores z negativos y grandes valores de r tenga la forma de una onda plana:
if, ,...,
eflcz
para - oo
< z < O,
r
-+ oo,
lo que corresponde a una partícula que incide en el sentido positivo del eje z. Veremos
en lo que sigue que la condición impuesta se puede satisfacer por una sola integral
particular de la forma ( 133.1) (y no por una suma de integrales con valores diferentes /J1, /32).
En coordenadas parabólicas esta condición tiene la forma:
if, ,...,
eik<E-r¡l/2
para 'TJ-+ oo y todo g.
Esta condición puede cumplirse tan sólo si
Ji(t) =
eikE/2
(133.3)
paraTJ-+ oo.
(133.4)
y f 2 (1¡) se somete a la condición
h('YJ) ,...,
e-ikr¡/2
Substituyendo (133.3) en la primera de las ecuaciones (133.2), vemos que esta función satisface efectivamente la ecuación si /31 = ik/2. La segunda de las ecuaciones
( 133.2) con /32 =--= 1 - /J1 toma entonces la forma:
Busquemos una solución de la forma:
h(TJ) = e-ikr¡/2w(TJ),
donde la función w(YJ) tiende a un límite constante cuando r¡
nemos la ecuación
(133.5)
--+
=. Para w(17) obte-
599
F Órmula de Rutherford
r¡w" +(1-ikr¡)w' -w = O,
(133.6)
que, mediante la introducdón de una nueva variable ,11 = ik 1¡, se reduce a la ecuación de la función hipergeométrica confluente con parámetros oc = - i/k, y = l.
Entre las soluciones de la ecuación ( 133.6) debemos elegir la que multiplicada por
j~(~) contiene solamente una onda esférica divergente (es decir, dispersa), pero no
una onda convergente. Una tal solución viene dada por la función
w = constante x F( -i/k, 1, ikr¡).
Así, pues, reuniendo las expresiones obtenidas, encontramos la siguiente solución exacta de la ecuación de ScHRODINGER, solución que describe la dispersión:
y¡ = e-1r /2kf(l +i/k)eik(E-1J)l2F(-i/k, 1, ikr¡).
(133.7)
La constante de normalización se ha elegido en 1P de manera que la onda plana
incidente sea de amplitud unidad (véase más adelante).
Para separar en esta función las ondas 'incidente y dispersada, hay que estudiar
la forma que adopta a grandes distancias del centro de dispersión. Utilizando los
dos primeros términos del desarrollo asintótico ((d. 14) del apéndice matemático)
de la función hipergeométrica confluente, obtenemos para grandes valores ,7:
.
.
1
F(-i/k, ' ikr¡)
=
1 )
(-ikr¡)ifk(
~ r(l +i/k) 1 + ikªr¡
e1r /2k
f(l+i/k)
(
1
(ikr¡)-ifk eik1J
+ r(-i/k) ikr¡
1 )
+-e<ifk) log(k'T])
3
ik r¡
(i/k)e1r /2k eik1J
--e-<i!k) log(k'IJ),
f(l-i/k) ikr¡
Substituyendo esta expresión en (133. 7) y pasando a coordenadas esféricas (~ -17 =
= 2z, 1J = r - z = r( l -- cos O)), obtenemos la siguiente expresión asintótica final
de la función de onda:
Y1 = [1 +
l
]eikz+(i/k) log(kr-kr
ikªr(l-cosO)
cos8)+ f(O)
eikr-(i/k> log{2kr)
r
(133.8)
'
donde (1)
f(O)
1
r(l+i/k)
2k2sen2!8
f(l-i/k) ·
- - - - e - < 2 i /k) log seno /2 - - - -
(133.9)
(1) Los signos en la amplitud de dispersión (133.9) corresponden a un campo deCoulomb repulsivo.
Para un campo de atracción, la expresión (133.9) se debe substituir por la conjugada compleja. En este
último caso, ((0) tiende a infinito en los polos de la función I'(I - i/k), es decir, en los puntos en los que
el argumento de la función I' es un número entero negativo o cero (en todo esto es Im k > O y la función
np tiende a cero en el infinito). Los correspondientes valores de la energía son
!k2 = -1/2n2 (n = 1, 2, 3, ... ),
y coinciden con los niveles discretos en un campo de Coulomb atractivo (cf. § 128).
600
Teoría de las colisiones elásticas
El primer término en (133.8) representa la onda incidente. Vemos así que, debido
a la lenta disminución del campo coulombiano, la onda plana incidente se deforma
incluso a grandes distancias del centro, como demuestra la existencia del término
logarítmico en la fase y también de un término del orden de 1/ r en la amplitud de
onda (1). Un término logarítmico de deformación en 1a fase se encuentra también
en la onda esférica dispersa, que viene representada por el segundo término en (133.8).
Estas diferencias con relación a la forma asintótica ordinaria de la función de onda
(122.3), no son esenciales, sin embargo, ya que dan para la densidad de corriente
una corrección que tiende a cero para r ~ oo.
Obtenemos asi para la sección eficaz de dispersión da
dcr
Jf(0)\ 2 do
la fórmula
= do/4k4 sen4!9,
.o bien, en unidades ordinarias,
da = (r1./2mv2)2 do/sen4}9,
(133.10)
(hemos introducido la velocidad de la partícula v = kli/m . Esta fórmula coincide
con la conocida fórmula de Rutherford a la que lleva la mecánica clásica. Así, pues,
para la dispersión en un campo de Coulomb la mecánica cuántica y la clásica dan
el mismo resultado (N. MOTT, W. GORDON, 1928). Es natural que también la fórmula
de Born (125.12) conduzca a la misma expresión (133.10).
Finalmente, para completar, daremos la expresión de la amplitud de dispersión
(133. 9) escrita en forma de suma de armónicos esféricos. Esta expresión se obtiene
substituyendo en (123.5) las fases (51 dadas por (36.28), es decir (2),
e2ia,
Obtenemos de esta manera:
= rc1+1+i/k}/r(1+t-i/k).
1
r(Z+l+i/k)
f(8) = - "'(21+1)
Pi(cos8).
Zik L,
r(1+ t-i/k)
(133.11)
(133.12)
l
§ 134.
El sistema de las funciones de onda del espectro continuo
Vimos en el § 122 que una función de la forma
1
( )
El origen de esta deformación se puede explicar ya en el modelo clásico. Si consideramos una
familia de trayectorias hiperbólicas clásicas en un campo de Coulomb, trayectorias cuya dirección inicial
es la misma (paralelas al eje z), la ecuación de la superficie normal a aquéllas a grandes distancias del centro
dispersor (z~ oo) tiende, como es fácil demostrar, no a z = const, sino a z+k-2In k(r - z) = const.
Esta superficie coincide precisamente con la superficie de fase constante de la onda incidente en (133.8).
2
( )
La cantidad ói en esta fórmula difiere de la verdadera fase coulombiana (divergente) en un valor
que es el mismo para todos los /.
Sistema de las funciones de onda del espectro continuo
601
00
if,
=
Ck
¿i (21+1)e' iPz(cosB)Rkz(r),
1
8
(134.1)
l=O
(ck es una constante) describe el estado estacionario de una partícula en un campo
central en el que, en el infinito, se tiene una onda plana que se propaga en el sen..
tido positivo del eje z y una onda esférica divergente. En esta fórmula, (} es el ángulo
formado por el vector posición r y el eje z, que coincide con el vector de onda de la
onda incidente. Si se substituye(}= k·r/kr, la expresión (134.1) será por completo
independiente de la elección de los ejes de coordenadas. Atribuyendo al vector k
todos los valores posibles, obtenemos, conforme se demostrará inmediatamente,
un conjunto completo de funciones de onda del espectro continuo ortogonales dos
a dos. Estas funciones las designaremos por 'f/J-i-k:
1
00
if,+k = 'il(2l+l)eMiRkz(r)Pi(k.r/kr).
4-n-k~
(134.2)
l=O
Hemos elegido la constante ck de (134.1) de modo que las funciones resulten normalizadas, como suele hacerse en el caso de espectro continuo, respecto de la función-b en el espacio-k (1 ):
(134.3)
(esto se verá confirmado por el cálculo que sigue). De esta manera, junto con el sistema ordinario de funciones de onda rf, = Rk 1(r) Y 1m (8, cf,) (que corresponden a los
estados estacionarios con valores determinados de la energía ñ2k2/2µ, del momento
cinético l y de su proyección m) tenemos también, para el espectro continuo, otro
sistema de funciones que describen estados con valor determinado de la energía
(pero no del momento cinético ni de su proyección) en los que en el infinito, junto
con la onda divergente, se tiene una onda incidente plana caracterizada por el vector
k. Este sistema de funciones es muy conveniente para resolver toda una serie de
problemas que plantean las colisiones.
Pasando a la demostración de (134.3), designemos por(} y(}' los ángulos formados
por el vector posición y los vectores k y k', respectivamente, y por oc el ángulo entre
k y k'. El producto .fa+k' •if,+k se expresa como suma doble respecto de l y l' de términos que contienen los productos Pt(cos 8')P,(cos 8). Observando que
cos (J'
(1)
= cos (J cos oc+sen(Jsenoc cose/,,
En esta normalización, la onda plana incidente tiene (en el infinito) la forma
(21r)-3/2eik. r.
Teoría de las colisiones elásticas
602
(ef, es el ángulo formado por los planos (r, k) y (k, k')) y utilizando el teorema de
adición de los armónicos esféricos (fórmula (c. 8) del apéndice matemático), tenemos:
Pz,(cos 8')Pz(cos 8) = Pz(cos 8)Pz ,(cos 8)Pz,(cos oc)+
00
+2Pz(cos8)""
(l'-m')!
(134.4)
pm'(cos(J)pm'(cosoc)cosm'<f,.
~ (l'+m' f
m'=l
Z'
Z'
Multipliquemos primero rf,+Jt•rf,+ k por do = sen OdO def, e integremos respecto de
todos los ángulos. La integración respecto de ef, anula todos los términos en (134.4),
salvo el primero. Este último da, al integrar respecto de O, el valor cero si l -=fo= l'
(en virtud de la ortogonalidad de los polinomios de Legendre), y para l = l'
1T
f Pz (cosO)sen8d(J
2
=
2/(21+1).
o
Obtenemos así:
f if,+~•.¡,+k d V
=
1
+rrkk'
2 (21+ )e'rct,Ckl-ct,<k'llpz( f Rk,z(r)Rkz(r)r2
CX)
CX)
1
cos oc)
l=O
dr.
O
Pero las funciones radiales Rk1 son ortogonales entre sí y están normalizadas de
acuerdo con
CX)
f Rk,zRkz r dr = 8(k'-k).
2
o
Por ello, en los coeficientes de las integrales se puede hacer k = k' ;utilizando también
la relación (123.3), tenemos:
1
== -8(k'-k)S(1-cos oc).
'1rk2
La expresión que aparece en el segundo miembro, una vez multiplicada por
2nk 2 sen oc dk doc e integrada en todo el espacio k, da el valor 1; con otras palabras,
coincide con la función-6 en el espacio-k, lo que demuestra la fórmula (134.3).
Además del sistema de funciones 1P-t-k, se puede introducir también un sistema
que corresponde a los estados en los que se tiene, en el infinito, una onda plana
Sistema de las /unciones de onda del espectro continuo
603
y, junto con ella, una onda esférica convergente. Estas funciones, que designaremos
por 1P-k, se obtienen inmeciatamente a partir de las tp+k. Ante todo, pasemos a la
expresión conjugada compleja; con ello, a partir de una onda divergente obtenemos una onda convergente ( ,-....; e-ikrjr), y la onda plana toma la forma: ,-....; eik.r.
Para que se conserve la primitiva definición de k ( onda plana ,-....; eik.r) es necesario
cambiar todavía el sentido de k por el sentido opuesto, es decir, cambiar k por - k.
Observando que P¡(- cos O) = (- I)l P 1(cos O), de (134.2) deducimos:
¿il(2l+
CX)
ef,-k = - .1
+n-k
(las funciones
Rkt
1)e-18iR1ci(r)Pz(k. r/kr);
(134.5)
1=0
se suponen reales).
El caso de un campo coulombiano es muy importante. Las funciones tp+ k (y "P-k)
pueden escribirse entonces en forma finita directamente a partir de la fórmula (133.7),
que hay que multiplicar por (2n)-3 ' 2 (véase la nota en la pág. 601). Expresaremos
las coordenadas parabólicas mediante las relaciones
k71
!k(f-71) = kz = k • r,
= k(r-z) = kr-k .r.
De esta manera obtenemos para un campo de Coulomb repulsivo (1):
1
.t.+k = - - e-1r 121cr(t+i/k)e'k.rF(-i/k 1 ikr-ik .r)
'f'
(211)3/2
' '
'
1
if,-k = (Z1r)
312
e-1r121cr(I-i/k)e'k.rF(i/k, 1, -ikr.-ik .r).
(134.6)
(134.9)
Las funciones de onda para un campo de Coulomb atractivo se obtienen a
partir de éstas cambiando a la vez el signo de k y de r:
if,+k
1
= --
(21r)3/2
1
.¡,-k = - -
(21r)3/2
e1r121cr(l-i/k)e'k.rF(i/k, 1, ikr-ik .r),
(134.8)
e1r121cr(l+i/k)e'k.rF(-i/k, 1, -ikr-ik .r).
(134.9)
Como característica de la acción del campo coulombiano sobre el movimiento
de una partícula cerca del origen de coordenadas se puede utilizar la razón del cuadrado del módulo de 1/-'+k o 1/-'-k en el punto r = O al cuadrado del módulo de la
función de onda 1/-'k = (2n)-3 ' 2eik.r del movimiento libre. Mediante la fórmula
r(l
+ i/k) r(l
- i/k) = (i/k) r(i/k) r(l - i/k)
=
(1)
Utilizamos unidades coulombianas.
1r/k senh(1r/k),
604
Teoría de las colisione.~ elásticas
obtenemos fácilmente para un campo repulsivo:
lt/J+k(O)l 2
lt/Jk\2
jtf,-k(O)l 2
lt/Jkl2
k(e21rfk-l)'
\tf,-k(O)l 2
21r
21r
(134.10)
y para un campo atractivo:
lt/J+k(O)l 2
lt/Jkl 2
lt/Jkl
2
(134.11)
k(l-e-2" fk)°
Las funciones "P-k representan un importante papel en toda una serie de problemas vinculados con la aplicación de la teoría de perturbaciones en el espectro
continuo. Supongamos que, como resultado de una perturbación, una partícula
pasa a un estado del espectro continuo (pudiendo pertenecer el estado inicial tanto
al espectro discreto como al espectro continuo) (1). Se plantea entonces la cuestión
de cómo calcular la probabilidad de que la partícula en movimiento libre que se
obtiene como resultado de la transición posea una determinada dirección del movimiento en el espacio. Se puede demostrar que para ello hay que adoptar como función de onda del estado final de la partícula la función "P-k, donde k es el vector
de onda de la partícula en el infinito (A. SoMMERFELD).
En efecto, consideremos la función
Esta función es la (43.3) en la que como funciones "P<º\ se han tomado las "P-k
y en vez de dv se ha escrito k 2 dk do = (V2m 3 3) VE dE do. Dicha función describe el estado de una partícula que se produce como resultado de una perturbación
que actúa de manera constante, siendo las funciones de onda no perturbadas las
funciones "P-k- La integración respecto de E se efectúa a lo largo de un camino
que contornea (en el plano de la variable compleja E) el punto E = E 0 por debajo.
Veamos cómo para grandes valores de r los términos en "P-k que contienen la onda
convergente se anulan al integrar respecto de E. Para ello basta desplazar ligeramente el contorno de integración hacia el semiplano inferior. Sobre él tenemos
entonces E< O y, por consiguiente, también k < O (la raíz k = V2mE/h se define
de tal manera que sobre el semieje real positivo E sea positiva). La onda convergente
contiene el factor e-ikr, que para Im k < O y grandes valores de r se puede hacer
tan pequeño cuanto se quiera, lo que demuestra la afirmación anterior. De esta
manera, como resultado de la integración, respecto de E, de las funciones "P-k
ih
1
( )
Por ejemplo, un electrón, chocando con un átomo, provoca la emisión de un fotón X a la vez
que con ello cambia su energía y la dirección del movimiento.
Colisiones entre partículas idénticas
605
queda (en el infinito) tan sólo una onda plana que corresponde a una partícula
que se mueve en determinada dirección.
§ 135.
Colisiones entre partículas idénticas
El caso de la colisión de dos partículas idénticas exige un estudio aparte. La
identidad de las partículas, conforme sabemos, conduce en mecánica cuántica a la
aparición de una peculiar interacción de intercambio entre ellas. Dicha interacción
se manifiesta notablemente también en la dispersión (N. MoTT, 1930) (1).
La función de onda orbital del sistema de dos partículas debe ser simétrica o
antisimétrica respecto de las mismas según sea par o impar el spin total de éstas
(véase § 62). Por ello, la función de onda que describe la dispersión, obtenida resolviendo la ecuación ordinaria de SCHRODINGER, debe ser simetrizada o antisimetrizada respecto de las partículas. Una permutación de éstas equivale a invertir el
sentido del radio vector que determinan. En el sistema de coordenadas en el que el
centro de masas se encuentra en reposo, esto significa que r no varía y que el ángulo()
se substituye por n-0 (debido a lo cual z = r cos () se transforma en - z). Por
lo tanto, en vez de la expresión asintótica (122.3) de la función de onda debemos
escribir:
(135.1)
En virtud de la identidad de las partículas, es imposible, claro está, señalar
cuál de ellas es la partícula dispersada y cuál la partícula dispersante. En el sistema
del centro de masas tenemos dos ondas planas incidentes iguales entre sí y que se
propagan en sentidos opuestos (eikz y e-ikz en (135.1 )). En cambio, la onda esférica
divergente en (135.1) tiene en cuenta la dispersión de ambas partículas, y la corriente
de probabilidad calculada mediante ella determina la probabilidad de que una cualquiera de las dos partículas sea dispersada en un elemento dado do de ángulo sólido.
La sección eficaz es la razón de esta corriente a la densidad de corriente en cada una
de las ondas incidentes planas, es decir, viene determinada, como antes, por el cuadrado del módulo del coeficiente de eikr/r en la función de onda (135.1).
Así, pues, si el spin total de las partículas que chocan es par, la sección eficaz
de dispersión tiene la forma:
dcrs = lf(B)+ f(1r-O)l 2 do,
(135.2)
dcra = 1/(8)- f(1r-B)l 2 do.
(135.3)
y si es impar, se tendrá:
(Obsérvese que daª
(1)
=
O si f
=
const.). Es característico de la interacción de ínter-
Como antes, no consideramos aquí la interacción spin-órbita directa.
606
Teoría de las colisiones elásticas
cambio la aparición del término de « interferencia »
f(8)f*(n - 8)+ f*(8)f(n - 8).
Si las partículas fueran distintas, como en la mecánica clásica, la probabilidad de
dispersión de una cualquiera de ellas en el elemento dado de ángulo sólido do sería
igual, simplemente, a la suma de las probabilidades de la desviación de una de las
partículas en un ángulo 8, y de la que se mueve a su encuentro, en un ángulo n - 8;
con otras palabras, la sección eficaz sería igual a
{l/(8)j2+j/(1r-8)12} do.
En las fórmulas (135.2-3) se supone que el spin total de las partículas que chocan
posee un valor determinado. Sin embargo, por lo general hay que considerar el
choque de partículas que no se encuentran en determinados estados de spin. Para
definir la sección eficaz en este caso hay que promediar respecto de todos los estados
de spin posibles, considerándolos todos equiprobables. En el§ 62 se demostró que del
nú_mero total (2s + 1)2 de estados de spin diferentes de un sistema de dos partículas
con spin s, s(2s + 1) estados corresponden a valores pares del spin total, y (s + 1)
(2s+l), a valores impares (sises semientero), o bien recíprocamente (sises entero).
Supongamos primero que ·el spin s de las partículas es semientero. Entonces la probabilidad de que el sistema de dos partículas que chocan posea un valor S par es
. 1a s(2s+I)
.
.
s+I
1gua
- - - = -s- Y Ia pro ba b'l'd
1 1 ad de que S sea impar, es igual a _ _ .
(2s+ 1)2
2s+ 1
2s+ 1
Por consiguiente, la sección eficaz es igual a:
s
s+l
da= - - d a8 +--daa,
2s+1
2s+1
Substituyendo aquí (135.2-3), obtenemos:
(135.4)
1
da= {l/(8)1 2+1/(.,,,-8)1 2- 2s+l [!(8)f*(1r-8)+ f*(8)f(1r-8)]} do.
(135.5)
De manera análoga se obtiene para s entero:
1
da = {l/(8)l 2+1/(1r-8)1 2+-[!(8)/*(1r-8)+ f*(8)f(1r-8)]} do.
2s+l
(135.6)
Como ejemplo escribamos las fórmulas para la colisi_ón de dos electrones que
interactúan según la ley de Coulomb (U= e2/r). La substitución de la expresión
(133.9) en la fórmula (135.5) con s = ! da (en unidades ordinarias) después de un
cálculo simple:
2
2
1
1
da= ( ~ ) r__l_ +
cos(e log tan2!8)] do (135.7)
mov2 l;en418 cos4l8 sen2¡0 cos2!8
ñv
'
(hemos introducido la masa m0 del electrón en vez de la masa reducida m
=
m0 /2).
Colisiones entre partículas idénticas
607
Esta fórmula se simplifica considerablemente. si la velocidad es tan grande que
e2 ~ vli ;( observemos que ésta es precisamente la condición de aplicabilidad de la
teoría de perturbaciones al campo coulombiano). El coseno en el tercer término
se puede entonces substituir por la unidad y se obtiene:
2e2 )2 4-3 sen28
da= ( - mov2
sen48
do.
(135.8)
El caso límite opuesto, e2 }>vli, corresponde al paso a la mecánica clásica (véase el
final del § 126). En la fórmula (135.7) esta transición se efectúa de manera muy
particular. Para e2 }> vli, el coseno en el tercer término dentro del paréntesis recto
es una función rápidamente oscilante. Para cada(} dado, la fórmula (135. 7) conduce
a un valor de la sección eficaz que, en general, difiere notablemente del que nos da
la fórmula de Rutherford. Sin embargo, ya al promediar en un pequeño intervalo
de valores de O, el término oscilante en (135.7) desaparece y llegamos a la fórmula
clásica.
Todas las fórmulas escritas se refieren al sistema de coordenadas en el que el
centro de masas se encuentra en reposo. El paso a un sistema respecto del cual
una de las partículas estaba en reposo antes del choque, se efectúa (de acuerdo
con (122.2)) simplemente cambiando (} por 2&. Así para la colisión de electrones
obtenemos, a partir de (135. 7):
2 2
2
1
1
1
dcr = ( Ze )
__
os(e log tan2&)] cos & do (135.9)
m 0v2 ~en4& cos4& sen2& cos2&
liv
'
r.__+_
donde do es el elemento de ángulo sólido en el nuevo sistema de coordenadas (al
cambiar (} por 2.S-, el elemento de ángulo sólido do debe substituirse por 4 cos S-do,
ya que sen(} d(} d</> = 4 cos S-, sen S- d.S-dcp ).
PROBLEMA
Determinar la sección eficaz de dispersión de dos partículas idénticas, de spin t, que poseen
valores determinados a = i de la proyección del spin sobre ejes que forman entre sí un ángulo a..
Solución. Sean "// y ;µ los espinores que constituyen las funciones de onda espinoriales de
las partículas. La función de onda del sistema formado por las partículas que chocan será el producto xµ;v. Escribámoslo en la forma:
El primer término es un espínor simétrico de segundo orden y corresponde a un estado del sistema con spin total S = 1 ; el segundo término, en cambio, es un espinor antisimétrico, que se
reduce a un escalar, y corresponde al estado con S = O. Por ello, las probabilidades de que el
608
Teoría de las colisiones elásticas
sistema tenga spin igual a 1 o a O son, respectivamente,
tlXPf"+X 11f Pl 2
t(l+lx 11*f 11 2),
wo = ilx"f "-x"f"1 2 = !(l- lx 11*f 11l 2);
W1 =
=
1
(1)
(cuando un índice de spin se repite dos veces, esto significa que se suma respecto de él; hay que
recordar que /xµ/ 2 = /~µ¡ 2 = 1). La sección eficaz buscada es igual a:
(2)
Elijamos el sistema de coordenadas de forma que el eje z sea aquél respecto del cual la proyección del spin de la primera partícula posee el valor dado (a = + i); entonces será x1 = 1, x2 = O.
Las componentes del espinor ~µ. en cambio, son iguales a ~1 = cos r:x./2, ~2 = i sen r:x./2 (véanse las
fórmulas de transformación (58.10); en un sistema de coordenadas tal que la proyección del spin
de la segunda partícula sobre el eje z tuviera un valor determinado, se tendría ~1 = l, ~2 = O).
Substituyendo estos valores en (1), encontramos la sección eficaz (2) en la forma
(3)
§ 136.
Dispersión de resonancia de partículas cargadas
En la dispersión de partículas nucleares cargadas (por ejemplo, de protones
por protones), además de las fuerzas nucleares de corto alcance se tiene también
la interacción de Coulomb, que decrece lentamente. La teoría de la dispersión de
resonancia se construye en este caso siguiendo el mismo método que se expuso en
el § 131. La diferencia consiste solamente en que como funciones de onda en el
dominio exterior al radio de acción de las fuerzas nucleares (r ~ a) hay que utilizar,
en vez de la solución de la ecuación del movimiento libre (131.2), la solución general
exacta de la ecuación de SCHRODINGER en un· campo coulombiano. Como antes,
la velocidad de las partículas se considera pequeña tan sólo en el sentido de que sea
ka ~ I ; en cambio, la razón de I / k a la unidad coulombiana de longitud
ac
=
li 2/mZ1Z2e2
(m es la masa reducida de las partículas que chocan) puede ser arbitraria (1).
de
Para el movimiento con l = O en un campo coulombiano repulsivo, Ja ecuación
para la función radial x = r R 0 es:
ScHRODINGER
x"+
(k"- ;)x
= O;
(136.1)
(utilizamos aquí unidades coulombianas). En el § 36 se halló la solución de esta
ecuación que satisface la condición de que x!r sea finita en r = O. Esta solución,
que designaremos aquí por K, tiene la forma (véase (36.27-28)):
(1)
La teoría que se expone a continuación fue desarrollada por R. LANDA U y IA. SMORODINSKII (1944).
609
Dispersión. de re... onan.cia de partículas cargadas
K = AeikrkrF,(i/k+ 1, 2, -2ikr),
A2=
21r/k
e211'fk-l
(136.2)
.
La expresión asintótica de esta función a grandes distancias es
K kr-i
"'sen(
log2kr+&,couI ),
(136.3)
80,coul
= arg r(l +i/k),
y los primeros términos del desarrollo para valores pequeños de r(kr
son:
K = Akr(l +r+ ... ).
~
1, r
~
1)
(1 ~fí.+)
Sin embargo, al haber cambiado ahora una condición de contorno, el comportamiento de la función en el origen deja de ser esencial y necesitamos la solución
general de la ecuación ( 136. l ), solución que es combinación lineal de dos integrales
independientes de la misma.
Los parámetros de la función hipergeométrica confluente en (136.2) son tales
(valor entero del parámetro y : y = 2) que nos encontramos precisamente en el
caso mencionado al final del § d de los apéndices matemáticos. De acuerdo con lo
demostrado allí, se obtiene una segunda integral de la ecuación ( 136.1) substituyendo
la función F de ( 136.2) por otra combinación lineal de dos términos cuya suma da,
según (d, 14), la función hipergeométrica confluente. Eligiendo como a tal combinación la diferencia de estos términos, obtenemos una segunda solución independiente de la ecuación ( 136.1) (la designaremos por L) en la forma:
Ae-ikrkr
L = 2 lm
r(l+i/k)
(-2ikr)-l+i/kG(l-i/k -i/k -2ikr)·
'
'
'
(136.5)
(la función K, en cambio, es la parte real de la expresión que aquí aparece). Su forma
asintótica a grandes distancias es:
L"' cos(
kr-i
log2kr+óo,cou1),
(136.6)
y los primeros términos del desarrollo para valores pequeños de r se escriben:
1
L = -{l+2r[log2r+2y-1+h(k)]+ ...},
A
(136.7)
Teoría de las colisiones elástica.~
donde y
=
0,577 ... es la constante de Euler y h(k) representa la función
(136.8)
h(k) =Retp(-i/k)+logk,
('1p(z)
=
I''(z)/I'(z) es la derivada logarítmica de la función I') (1).
Escribiremos la integral general de la ecuación (136.1) en forma de suma
(136.9)
X= constante X (K cot8o+L),
donde ctg <50 es una constante. La definición de la constante se ha elegido de manera
·que la forma asintótica de aquella solución sea
(136.10)
es así el corrimiento de fase adicional de la función de onda determinado por las
fuerzas de corto alcance. Hay que ligarlo con la constante que figura en la condición
de contorno (x' / x)/r-+o = const, condición que substituye al análisis de la función
de onda dentro del radio de acción de las fuerzas nucleares. Sin embargo, teniendo
en cuenta la divergencia (como In r) de la derivada logarítmica x' / x para r -- O,
esta condición debe referirse ahora, no al valor cero, sino a un valor tan pequeño
cuanto se quiera, pero en cualquier caso no nulo de r, r = (!. Calculando (mediante
las fórmulas (136.4) y (136.7)) la derivada x'(e)/x(e) e igualándola a una constante,
obtenemos una condición de contorno de la forma:
<50
kA2 cot So
+
2[1og 2p
+ 2y + h(k)]
= constante.
La expresión que aparece en el primer miembro de la igualdad contiene la constante
2 ln 2e+4e, que no depende de k; incluyámosla en la expresión const, designando
luego ésta por - K. Como resultado se obtiene finalmente una expresión para <50
que escribimos aquí en unidades ordinarias:
1
cot8o = --(e217 /kac-l)[h(kac)+}1<ac];
(136.11)
7T
(en el límite 1/ac-+ O, es decir, al pasar a partículas sin carga, la fórmula (136.11)
se transforma en la relación ctg 00 = - 1</k, que coincide con (131.5)).
(1) El desarrollo (136.7) se obtiene a partir de (136.5) mediante el desarrollo (d, 17) de la función G.
Se ha utilizado además la conocida relación:
tp{l +z)
(que es fácil obtener a partir de
I'(z+ I) = zI'(z))
=
tp(z)+ 1/z
y del valor tp(l) =
-y,
tp(2) =
-y+ I.
Dispersión de resonancia de partículas cargadas
611
En la fig. 48 se presenta el gráfico de la función h(k) (1).
1,1
/
1,0
Ir
0,9
o.a
I
/
0,7
:5
0,5
/
0,4
0,1
o
V
'{
0,3
0,2
V
I
0,6
,e:
I
I
/
I
V
1
3
2
4
5
X
FIG. 48
(1)
Para calcular la función h(k) puede utilizarse la fórmula
co
1
h(k) = k-2""
¿ n(n2+k-2)
-y+ log k,
n=l
que se obtiene fáciimente mediante la fórmula
00
1
,/¡(z) =
1
-y-; +z ¿
n(n+z);
n=l
(véase WHITTAKER-WATSON, Course of modern analysis, Cambridge, 1944, § 12.16). Las expresiones límite
de la función h(k) son:
h(k)
~
k2/12
for
k
~
h(k) = -y+ Iogk+ 1·2/k2
1,
para
k ~ 1;
(la última fórmula da valores correctos de h(k), con un error < 4 /~, ya para k > 2,5).
612
Teoría de las colisiones elásticas
Así, pues, cuando existe interacción coulombiana resulta « constante » la siguiente
cantidad:
27T
cotSo
2
- - - - + -h(kac)
ac(e21Tkac - 1)
ac
= -
(136.12)
K,
Hemos escrito la palabra «constante» entre comillas porque K es, en realidad, el
primer término del desarrollo, en serie de potencias de la pequeña cantidad ka,
de una cierta función que depende de las propiedades de las fuerzas de corto alcance.
A la resonancia para valores pequeños de la energía corresponde, como se demostró
en el§ 131, el caso de un valor anómalamente pequeño de la constante K. Debido
a esto, para mejorar la precisión hay que tener en cuenta también el término siguiente
(,...., k 2) del desarrollo en el que figura un coeficiente cuyo orden de magnitud es
«normal», es decir, hay que substituir en (136.12)- K por (1)
-
1<0
+ }rok2•
La existencia de una resonancia puede deberse, conforme se señaló en el § 131,
a la existencia de un estado ligado discreto del sistema, tanto real como virtual.
Se puede demostrar (2), que el criterio de realidad o de virtualidad de un nivel viene
dado, como antes, por el signo de la constante 1e.
Los corrimientos de fase totales de las funciones de onda son iguales, según
(136.10), a las sumas <51,coui+<51 de las fases puramente coulombianas y de las fases <51
vinculadas a las fuerzas de corto alcance. Las primeras contribuyen a la amplitud
de dispersión con valores que son del mismo orden de magnitud, cualquiera que
sea el valor de /. Las segundas, en cambio, son pequeñas (para energías pequeñas)
cuando l -=/=- O y por ello se puede prescindir de todas las <5 1 con excepción de <50 ( 3).
La amplitud de dispersión es entonces:
(1) Indicaremos los valores de las constantes IX = 1/xo y r0 para la dispersión de un protón por un
protón: IX= - 7,77 x 10-13 cm, r 0 = 2,77· I0-13 cm (la unidad coulombiana de longitud es 2ñ•/mpeª =
= 57· 6 X t0-18 cm). Estos valores se refieren a un par de protones con spins anti paralelos (para spins
paralelos, un sistema de dos protones no puede encontrarse nunca en un estado s, en virtud del principio
de PAULI).
(2)
(")
Véase R. LANDA U, IA. SMORODINSKII, ZhETF, 14, 269, 1944.
Para completar, he aquí la expresión de (5z para l =t= O:
l
z
z
cotSz = - -(e2 17 /kac-l)(h(kac) +""
7T
s
+ rxzfl [l+p2(kac)2J-1),
Lt s2 + (kac)-2
s=l
donde las IXz son constantes.
p=l
Colisiones elásticas de electrones rápidos con átomos
f(B)
=
1
Zik
613
<X)
_'¿ (21+ l)[e2iCct,,cou1H,>_ l]Pt(cos8)
l=O
1
¿ (21+ l)(e2ict1,cau1 - l)Pz(cosU)+
00
,....., Zik
l=O
1
+ -e2i80,cou1(e2i8o_ l).
2ik
(136.13)
El primer término es la amplitud de dispersión en un campo puramente coulombiano y viene dada por la fórmula (133.9):
2i
1
/cou1(8) = -
exp (- - log sen!B+2i8o,coul)·
2k2sen2tB
kac
El segundo término de ( 136.13), en cambio, se puede llamar amplitud de dispersión
determinada por las fuerzas de corto alcance. Sin embargo, hay que subrayar que
esta distinción es un puro convenio; la existencia de la interacción coulombiana se
manifiesta también de modo esencial en el primer término, que resulta ser completamente distinto del que sería en el caso de las mismas fuerzas de corto alcance para
partículas no cargadas.
En la sección eficaz de dispersión, ambas componentes de ]a amplitud interfieren entre sí :
dcr =
do
-
lf(8)l 2
=
2)2C
(Z1Z.)e
_-_
2mv2
1 +
en4i8
--
(kac)2
( 2
)
]
+ --sen80 cos - logsen!B+80 +4(kac)2sen280 • (136.14)
sen2t8
kac
(se supone aquí que las partículas que chocan son distintas; en la dispersión de partículas idénticas, la amplitud de dispersión debe ser simetrizada previamente, antes
de elevar el cuadrado - véase § 135).
§ 137.
Colisiones elásticas de electrones rápidos con átomos
Las colisiones elásticas de los electrones rápidos con los átomos se pueden estudiar mediante la aproximación de Born si la velocidad del electrón incidente es
grande comparada con la velocidad de los electrones atómicos.
614
Teoría de las colisiones elásticas
Teniendo en cuenta la gran diferencia de masas entre un electrón y un átomo,
se puede considerar que éste se encuentra en reposo antes del choque y que el sistema
de coordenadas ligado al centro de masas coincide con el sistema en el que el átomo
está inmóvil. En la fórmula (125.7) p y p' designan entonces los impulsos del electrón antes y después del choque, m es la masa del electrón y el ángulo (} coincide
con el ángulo -& de desviación de este último. En cambio. la energía potencial U(r)
en la fórmula (125.7) exige la debida definición.
En el§ 125 hemos calculado los elementos de matriz Up'p de la energía de interacción respecto de las funciones de onda de una partícula libre antes y después
del choque. En la colisión con un átomo hay que tener en cuenta también las funciones de onda que describen el estado interno del mismo. En una colisión elástica
el estado del átomo no cambia. Por ello Up'p debe definirse como elemento de matriz
respecto de las funciones de onda % y 1/-',' del electrón, elemento que es diagonal
respecto de la función de onda del átomo. Con otras palabras, en la fórmula (125. 7)
hay que entender por U la energía potencial de interacción del electrón con el átomo
promediada respecto de la función de onda de este último. Dicha función es igual
a ecf,(r), donde cf,(r) es el potencial del campo creado en el punto r por la distribución
media de cargas en el átomo.
Designando por e(r) la densidad de distribución de las cargas en el átomo, tenemos para el potencial cf, la ecuación de Poisson:
t:i<f,
= -+rrp(r).
El elemento de matriz buscado Up'p es, en esencia, la componente de Fourier de
U (es decir, de cf,) que corresponde· al vector de onda q = k' - k. Aplicando la ecuación de Poisson a cada una de las componentes de Fourier por separado, tenemos:
D (<pqeiq. r) = -q2<f,qeiq. r = -hpqeiq. r,
de donde
es decir,
J<f,e-tq.r dV = (4rr/q2) Jpe-iq.r dV.
(137.1)
La densidad de carga e(r) se compone de las cargas electrónicas y de la carga
del núcleo:
p = -en(r)+ Ze8(r),
donde en(r) es la densidad de carga electrónica en el átomo. Multiplicando por
e integrando, tenemos:
e-iq.r
Colisiones elásticas de electrones rápidos con átomos
615
Jpe-iq.rdV = -e Jne-iq.rdV+Ze.
De esta manera se obtiene para la integral que nos interesa la expresión
J
41re2
Ue-tq.r dV = - -[Z-F(q)],
q2
(137.2)
donde la cantidad F(q) viene determinada por la fórmula
F(q) =
Jne-iq.rdV
(137.3)
y se llama factor de forma atómico. Este factor es una función del ángulo de dispersión y también de la velocidad del electrón incidente.
Finalmente, substituyendo (137.2) en (125.7), obtenemos la siguiente expresión
para la sección eficaz de dispersión elástica de electrones rápidos por un átomo (1):
4m2e4
dcr = --[Z-F(q)]2 do
h4q4
2
2
= ( ~ ) [z-F(Zmvsent&)J
2mv2
}¡
~
sen4.¡& ·
(137.4)
Consideremos el caso límite de valores q pequeños; se trata, esto es, de valores q
que son pequeños comparados con « el inverso del radio atómico », es decir, comparados con 1/a0, donde a 0 es el orden de magnitud de las dimensiones del átomo
(qa 0 ~ ]). A un valor de q pequeño corresponden ángulos de dispersión pequeños;
en efecto, .& ~ v 0 /v, donde v 0 ,-...,}ijma0 es el orden de magnitud de las velocidades
de los electrones atómicos.
Desarrollemos F(q) en serie de potencias de q. El término de orden cero es igual
a Jn d V, es decir, al número total Z de electrones en el átomo. El término de primer
orden es proporcional a f rn(r) d V, es decir, al valor medio del momento dipolar
del mismo; este valor se anula idénticamente (véase § 75).
Por lo tanto, es necesario llevar el desarrollo hasta el término de segundo orden,
y tenemos así:
Z-F(q) =
1
-¡l
J
nr2
dV;
( 1)
Prescindimos de los efectos de intercambio entre el electrón rápido dispersado y los electrones atómicos, es decir, no se simetriza la función de onda del sistema. Es desde luego evidente que esta aproximación está justificada: la interferencia entre la función de onda rápidamente oscilante de la partícula libre
Y la función de onda de los electrones atómicos en la « integral de intercambio » conduce a que la contribución ligada con ella a la amplitud de dispersión sea pequeña.
616.
Teoría de las colisiones elásticas
substituyendo en (13 7.4), se obtiene:
dcr
me2
= li2
3
f
nr2
12
(137.5)
d V do.
Así, pues, en el dominio de los ángulos pequeños la sección eficaz resulta ser independiente del ángulo de dispersión' y viene determinada por el valor medio del
cuadrado de la distancia del núcleo a los electrones atómicos.
En el caso límite opuesto de grandes valores q(qa0 ~ 1, es decir, & ~ v 0 /v) el
factor e-i<1.r en el integrando de la expresión (137.3) es una función rápidamente
oscilante y, por consiguiente, toda la integral es casi cero. Podemos, por lo tanto,
prescindir de F(q) frente a Z, de modo que
)2
Ze2
do
d cr = ( 2mv2 sen4!&.
(137.6)
Con otras palabras, obtenemos la dispersión de Rutherford por el núcleo del átomo.
Calculemos también la sección eficaz de transporte
crtr
En la región angular &
da
v0/v
~
=
=
f (1-cos
&) dcr.
tenemos, según (137.5),
const
X
sen &d.&
=
const
x & d&.
donde const no depende de.&. Por ello, el integrando de la integral considerada es
proporcional en esta región a &3 d&, de modo que en el límite inferior la integral
converge rápidamente. En cambio, en la región 1 ~ .& ~ v0/v tenernos
da~ const x d&/&3 ;
el integrando es proporcional a d.&/.&, es decir, la integral diverge logarítmicamente.
Vernos así que el papel principal en la integral lo representa precisamente esta
región angular y que, por lo tanto, cabe limitarse tan sólo a la integración en la
misma. El límite inferior de integración debe tomarse tal que sea del orden de v0 /v;
escribárnoslo en la forma e2/yñv, donde y es una constante sin dimensiones.
Corno resultado se obtiene la siguiente fórrnula:
crtr
= 41T(Ze2/mv2)2 log(yñv/e2).
(137. 7)
El cálculo exacto de la constante y exige estudiar la dispersión para ángulos & > v0/v
y no se puede efectuar de manera general; O'tr depende poco del valor de la misma,
Colisiones elásticas de electrones rápidos con átomos
617
ya que ésta aparece después del signo de logaritmo multiplicada por la cantidad
ñv/e2 , que es grande.
Para la determinación numenca del factor de forma de los átomos pesados
podemos utilizar la distribución de Thomas-Fermi de la densidad n(r). Vimos que
en el modelo de Thomas-Fermi n(r) tiene la forma:
n(r)
= Z2f(rZI!3/b);
(todas las cantidades en esta fórmula y en las que siguen se miden en unidades atómicas). Es fácil ver que la integral (137.3), calculada precisamente con esta función
n(r), contendrá q tan sólo en una determinada combinación con Z:
F(q) = Z<f,(bqZ-113).
(137.8)
En la tabla 11 se dan los valores de la función universal cp(x), válida para todos los
átomos (1).
TABLA
11
Factor atómico en el modelo Thomas-Fermi
1
X
<f,(x)
o
1,000
1,08
0,422
2,17
0,224
0,15
0,922
1,24
0,378
2,32
0,205
0,31
0,796
1,39
0,342
2,48
0,189
0,46
0,684
1,55
0,309
2,64
0,175
0,62
0,589
1,70
0,284
2,79
0,167
0,77
0,522
1,86
0,264
2,94
0,156
0,93
0,469
2,02
0,240
X
<f,(x)
X
<f,(x)
Con el factor atómico ( 137.8) la sección eficaz ( 137.4) tendrá la forma:
dcr
= (4Z2/q4)[1-cp(bqZ-l/3)]2 do = Z2/3<f>(Z-1/3vsen}&) do,
(137.9)
donde <t>(x) es una nueva función universal. Por integración se puede obtener la
sección eficaz total. El papel principal en la integración lo representa la región de
( 1)
No hay que perder de vista que para valores q pequeños esta fórmula es inaplicable debido a que la
integral de nrt no se puede de hecho calcular siguiendo el método de Thomas-Fermi (véase la nota en la
pág. 496).
Hay que recordar también que el modelo de Thomas-Fermi no refleja aquellas propiedades individuales
de los átomos que perturban su variación sistemática con el número atómico.
618
Teoría de las colisiones elásticas
pequeños valores de.&. Por ello se puede escribir:
dcr
~
Z2/3<I>(Z-1/3v,&/2)21r-& d-&,
y extender la integración respecto de .& hasta el infinito:
f
f
cr = 21rZ2/3 <l>(Z-I/3i:-&/2)-& d-& = (81r/v2)Z4/3 <l>(x) dx.
o
o
De esta manera, a tiene la forma:
cr = constante x Z4/3/v2.
(137.10)
De modo análogo es fácil comprobar que la constante y de la fórmula (137. 7)
será proporcional a z-113•
PROBLEMA
Calcular la sección eficaz de dispersión elástica de los electrones rápidos por un átomo de
hidrógeno en el estado fundamental.
Solución. La función de onda del estado normal del átomo de hidrógeno es VJ = e-r¡V n de
modo que n = (l/n)e-2r (utilizamos unidades atómicas). La integración en (137.3) respecto de los
ángulos se efectúa de la misma manera que al deducir la fórmula (125.12); tenemos:
f n(r)senqr.rdr=
00
41r
F=-
1
.
(l+!q2)2
q O
Substituyendo en (137.4) se obtiene:
dcr =
4(8+q2)2
(4+q2)4
do
'
donde q = 2vsen &/2. La sección eficaz total se calcula con facilidad haciendo do= 2n sen &d& =
(2n/v2)qdq e integrando respecto de q; claro está, hay que conservar solamente el término que
contiene la menor potencia de 1/v; Como resultado obtenemos:
cr = 71r/3v2.
§ 138.
La dispersión con interacción spin-órbita
Hasta aquí hemos considerado sólo los choques de p-artículas cuya interacción
no depende de sus spins. En ..estas condiciones, los spins o bien no influyen en absoluto en el proceso de dispersión, o bien determinan una influencia indirecta ligada
con los efectos de intercambio (§ 135).
Pasemos ahora a la generalización de la teoría de la dispersión desarrollada en
el § 122 al caso en que la interacción de las partículas depende esencialmente de sus
619
Dispersión con interacción spin-órbita
spins, cual ocurre en las colisiones de las partículas nucleares.
Consideremos con detenimiento el caso más simple, en el que una de las partículas que chocan (para concretar, supondremos que ésta es una partícula del haz
incidente) tiene spin i y que la otra (la partícula blanco) spin O.
Para un valor dado (semientero) del momento cinético total j del sistema, el
momento cinético orbital puede tener solamente dos valores l = j± i a los que corresponden estados de diferente paridad. Por ello, de la conservación de j y de la paridad
se sigue, en este caso, que también se conserva el valor absoluto del momento cinético orbital.
El operador / (§ 124) actúa ahora no sólo sobre las variables orbitales de la
función de onda del sistema, sino también sobre las variables de spin. Dicho operador debe conmutar con el operador de la magnitud conservativa 12. La forma
más general de un tal operador es:
j
donde á,
b son
=
á +hi.
s,
(138.1)
operadores orbitales que dependen únicamente de 12•
La matriz S, y con ella también la matriz del operador J, es diagonal respecto
de las funciones de onda de los estadós con valores determinados de las cantidades l
y j, que se conservan (y de la proyección m del momento cinético total), expresándose los elementos diagonales en función de las fases <5 de las funciones de onda
mediante la fórmula (122.14). Para valores dados de l y del momento total, j = I + !
y j = /-!,los valores propios de l-s son iguales, respectivamente, a //2 y - (l+ 1)/2
(véase (117.5)). Por consiguiente, para determinar los elementos de matriz diagonales
de los operadores á y b (los designaremos por a1 y b1) tenemos las relaciones:
az+Mbz
~
1
= -(e2ta,+ -1)
2ik
'
(138.2)
az-·Hl+ l)bz =
donde fas fases
<5 1+
1
2ik (e2i8,- -1),
y <5 1- corresponden a los estados con j
= l+k y j = 1- t.
Sin embargo, no nos interesan propiamente los elementos diagonales del operador /respecto de estados con valores del y j dados, sino la amplitud de dispersión
como función de las direcciones de las ondas incidente y dispersada. Esta amplitud
será todavía un operador, pero solamente respecto de las variables de spin - un
operador que es no diagonal respecto de la proyección del spin a. En este párrafo,
en lo que sigue designaremos por precisamente este operador.
J
Teoría J.e las colisione.s elásticas
620
Para hallarlo hay que aplicar el operador (138.1) a ]a función (124.16), que
corresponde a la onda plana incidente (a lo largo del eje z). De esta manera:
00
J = ¿ (21+ l)(az+hzi. s)Pz(cos8).
(138.3)
l=O
Hay que calcular aún el resultado de aplicar el operador J. s a la función P 1 ( cos O).
Esto puede hacerse escribiendo
i . s = !(l+L + Ls+) + lzsz
(véase (29.11)) y utilizando las fórmulas (27.12) para los elementos de matriz de
los operadores /±; más fácil todavía es utilizar directamente las expresiones entre
operadores (26.14-15). Un cálculo sencillo da:
i . sPz(cos 8) = iv . sPzl( cos 8),
donde P 11 es un polinomio asociado de Legendre y v el vector unitario correspondiente al vector n x n' perpendicular al plano de dispersión (n es el versor de incidencia,
correspondiente al eje z; n' es el versor de dispersión, definido por los ángulos esféricos O, </>).
Determinando a1, b1 a partir de (138.2) y substituyendo en (138.3), obtenemos
ahora finalmente:
f
1
A= Zik
L
=
(138.4)
A+2Bv.s,
00
[(l+l)(e2i 0 ,+-l)+l(e2io1--l)]Pz(cos8),
Z=O
(138.5)
1
B
00
= _""'
2kL
(e2io/ -e2io,-)Pzl(cos8).
l=l
Los elementos de matriz de este operador dan la amplitud de dispersión con valores determinados de la proyección del spin en el estado inicial (a) y en el estado final
(a'). Sin embargo, con frecuencia interesa, desde el punto de vista físico, la sección
eficaz sumada respecto de todos los valores posibles a' y promediada de acuerdo
con las probabilidades de los diferentes valores a en el estado inicial (en el haz de
partículas incidente). Esta sección eficaz se calcula de acuerdo con
(138.6)
da = (J+J)uu do;
J
formando los elementos de matriz diagonales del producto +/ se obtiene la suma
extendida a los estados finales y el trazo significa el promedio respecto del estado
Dispersión con interacción spin-órbita
621
inicial (1). Si en éste todas las direcciones del spin son equiprobables, este promedio
se reduce a calcular la traza de la matriz (dividida por el número de valores posibles
de la proyección del spin a):
dO' =
! tr (!+!) do.
Al substituir (138.4) en (138.6), el valor medio del cuadrado (v.s)2 se calcula
mediante la fórmula v 2 ·s 2/3 = s(s+I)/3 = t. Como resultado obtenemos:
dG/do = IAl2+jB[2+2Re(AB*)v. P,
(138.7)
donde P = 2§ es la polarización inicial del haz, definida como razón del valor medio
del spin en el estado inicial a su valor máximo posible ( fl. Recuérdese que, en el
caso de spin t, el vector s caracteriza por completo el estado espinorial (§ 59).
Hay que llamar la atención sobre el hecho de que la polarización del haz incidente conduce a la asimetría acimutal de la dispersión: debido al factor v. P en el
último término, la sección eficaz (138. 7) depende no solamente del ángulo polar O,
sino también del acimut cf, del vector n' respecto del n ( con tal que la polarización
no sea perpendicular a v~ de forma que se tenga v.P =/=- O).
La polarización de las partículas dispersadas se puede calcular mediante la
fórmula
(138.8)
Así, si el estado inicial no está polarizado (P = O), un cálculo simple da
P' =
2Re(AB*)
v.
IAl 2+IBl 2
(138.9)
De esta manera la dispersión conduce, en general, a la aparición de una polarización
perpendicular al plano de dispersión. Obsérvese, sin embargo, que este efecto no
aparece en la aproximadón de Born: si todas las fases e) son pequeñas, en primera
aproximación respecto de ellas el coeficiente A es real y B es imaginario puro, de
modo que Re(AB*) = O.
(') Si el cuadrado del módulo lfonl 2 del elemento de matriz de un operador para la transición 0-+ n
se suma respecto de los estados finales n, se obtiene:
L
n
l/onl 2 =
Lfon(/on)* = "1:./on(!+)no
n
n
=
(!/+)oo,
Para evitar confusiones, subrayaremos que el signo de conjugación + en <1~~.6) Y en to?o lo que sigue
se refiere a f como operador de spin y, en particular, no supone la transpos1c10n den Y n ·
622
Teoría de las colisiones elásticas
El hecho de que la polarización P' (138. 9) esté dirigida a lo largo de v era de prever: P' es un vector axil y v es el único vector axil unitario que se puede formar a
partir de los vectores polares n y n' de que disponemos. Es evidente, por ello, que
también tendrá esta propiedad la polarización que se produce en la dispersión de
un haz no polarizado de partículas de spin l al incidir sobre un blanco no polarizado
de núcleos de spin cualquiera (y no solamente de spin nulo) (1).
En la formulación del teorema de reciprocidad en la dispersión cuando los spins
no son nulos, hay que tener en cuenta que la inversión del tiempo cambia los signos
no sólo de los impulsos, sino también de los momentos cinéticos. Por ello, la simetría de la dispersión respecto de la inversión del tiempo debe expresarse en este caso
por la igualdad de las amplitudes de los procesos que difieren uno de otro no solamente en la permutación de los estados inicial y final y en el cambio de los sentidos
del movimiento en los sentidos opuestos, sino también en el cambio de los signos
de las proyecciones de los spins de las partículas en ambos estados. Sin embargo,
los signos de estas amplitudes pueden resultar entonces diferentes debido a que la
inversión del tiempo conduce, según (60.2), a introducir en la función de onda
de spin un factor (- I)s-a. Esta circunstancia conduce a que el teorema de reciprocidad deba formularse de la siguiente manera (2):
.f(cr1, cr2, n; cr1', cr2', n') = (-1):E(s-crj(-cri', -cr2', -n'; -cr1, -cr2,-n). (138.10)
f(a1, a 2, n; a' 1, a' 2, n') es aquí la amplitud de dispersión con cambio de las proyecciones de los spins de las partículas que chocan, pasando de los valores a 1, a 2 a los
valores a'1 ~ a' 2 ; la suma en el exponente se refiere a ambas partículas antes y después
de la dispersión.
En la aproximación de Born, la dispersión posee una simetría adicional que se
traduce en la igual probabilidad de los procesos que difieren entre sí en la permutación de los estados inicial y final, sin cambio ni de los signos de los impulsos ni
, de las proyecciones de los spins de las partículas, como ocurría en la inversión del
tiempo (véase § 125). Combinando esta propiedad con el teorema de reciprocidad,
llegamos a la conclusión de que la dispersión es simétrica respecto del cambio de
signo de todos los impulsos y proyecciones de los spins, sin su permutación. De
aquí se deduce fácilmente que en la aproximación de Born es imposible que surja
la polarización como consecuencia de la dispersión de un haz cualquiera no polarizado por un blanco asimismo no polarizado. En efecto, al aplicar la transformación
t 1) Imaginamos aquí un blanco constituido por núcleos cuyos spins están dirigidos por completo al
azar. Obsérvese que paras > t el valor medio del vector de spin no determina por completo el estado
espinorial y que, por consiguiente, el hecho de que sea igual a cero no significa, sin más, la ausencia completa de ordenación de los spins.
(2) Esta relación se deduce de manera análoga a como se dedujo la fórmula (124.12). En el presente
caso, deben introducirse los factores de spin en las amplitudes de las ondas convergentes y divergentes en
la función de onda, y en vez de (124.10) se obtiene la condición k- 1 §K = S, donde K es un operador que
no sólo determina la inversión, sino que también transforma el estado de spin de acuerdo con (60.2).
Disper.~ión con interacción spin-órbita
623
indicada, el vector de polarización P cambia de signo y el vector unitario k x k',
a lo largo del cual puede estar dirigido P, se conserva invariable. De esta manera,
la propiedad que hemos hecho notar más arriba acerca de la dispersión de las partículas con spin J por partículas de spin O, posee en realidad un carácter general.
En el caso de spins arbitrarios de las partículas que chocan, las fórmulas generales
que dan las distribuciones angulares son muy engorrosas y no nos detendremos
aquí en deducirlas. Calculemos solamente el número de parámetros por los que
deben venir determinadas estas distribuciones.
El caso antes considerado de la colisión de partículas con spin J y cero se caracteriza, en particular, por el hecho de que a valores dados de i y de la paridad corresponde solamente un estado del sistema formado por las dos partículas (prescindiendo
de la orientación del momento cinético total en el espacio, que carece de importancia).
Asociado con cada uno de tales estados aparece en la amplitud de dispersión un
parámetro real (la fase r>). En cambio, en el caso de otros spins, existe, en general,
más de un estado diferente con iguales valores del momento cinético total J y de la
paridad; estos estados se distinguen por los valores del spin total de las partículas,
S, y del momento cinético orbital I en el movimiento relativo. Sea n el número de
tales estados. Es fácil ver que cada uno de estos grupos de estados interviene en la
amplitud de dispersión mediante n(n~ I) 2 parámetros reales independiente5.
En efecto, respecto de estos estados, la matriz Ses una matriz unitaria simétrica
(en virtud del teorema de reciprocidad) con n · n elementos complejos. Es cómodo
efectuar el cálculo del número de cantidades independientes de esta matriz observando que, si representamos el operador S en la forma:
s = l+i~'
1-iR
(138.11)
la condición de que S sea unitario queda satisfecha automáticamente cuando R.
en un operador hermítico cualquiera. Si la matriz S es simétrica, también es simétrica la matriz R. y, siendo hermítica, es real. Pero una matriz simétrica real
tiene n(n _¡_ 1) 2 componentes independientes.
Como ejemplo veamos que para dos partículas de spin J el número n = 2. En
efecto, dado J, se tienen en total cuatro estados: dos estados con I = J y spin total
S = O ó 1, y dos estados con / == J ~: ~ 1, S = l. Es evidente que dos de estos estados
son pares (/ par), y dos impares (/ impar).
La forma general de la amplitud de dispersión de las partículas de spin ~. en
Linto que operador relativo a las variables de spin de ambas partículas, se puede
escribir fácilmente partiendo de las condiciones necesarias de invariancia: debe ser
Teoría de lm, coU..,ione.<t elá.<ttira.<t
624
un escalar, invariante respecto de la inversión del tiempo. Para construir esta expresión disponemos de los dos vectores axiles de spin de las partículas, s 1 y s 2 , y de
dos vectores ordinarios (polares), n y n'. Cada uno de los operadores 1 y 2 debe
aparecer en la amplitud linealmente, puesto que cualquier función del operador
de spin 1 se reduce a una función lineal. La forma más general de un operador que
satisfaga a estas condiciones se puede escribir como sigue:
s s
j =A
+ B(s1 . A)(s2 . A)+ C(s1 . µ)(s2. µ) +
(138.12)
+D(s1 .v)(s2 .v)+E(s1 +s2) .v+F(s1-s2 ) .v.
Los coeficientes A, B, ... son cantidades escalares que pueden depender solamente
del escalar n · n', es decir, del ángulo de dispersión O (y de la energía); A, µ, v son tres
vectores unitarios, perpendiculares dos a dos, dirigidos, respectivamente, a lo largo
de n~n', n - n' y n x n'. A la operación de inversión del tiempo corresponde la
substitución
n
~
-n',
n ' ~-n,
En estas condiciones,
A-~ -A,
µ -~ µ,
V-~ -V
y la invariancia del operador ( 138.12) es evidente.
En el caso de la dispersión mútua de nucleones (protones y neutrones), no aparece el último término en (I 38.12). Esto se sigue ya del hecho de que las fuerzas
nucleares que actúan entre los nucleones conservan el valor absoluto del spin total S
del sistema; en cambio, el operador s1 - s2 , no conmuta con el operador § 2 (los
demás términos en (138.12) se expresan, de acuerdo con (116.4), en función del
operador de spin total S y conmutan, por ello, con S2 ). En la dispersión de nucleones
idénticos (pp o nn), los coeficientes A, B .... , como funciones del ángulo de dispersión,
satisfacen también determinadas condiciones de simetría que son consecuencia de
la identidad de ambas partículas (véase problema 2).
PROBLEMAS
1. Para la dispersión de partículas de spin ~ por partículas de spin cero, determinar la polarización después de la dispersión si antes de ésta también la polarización era diferente de cero.
Solución. Es cómodo efectuar el cálculo de acuerdo con las fórmulas (138.8), (138.4) pasando
a componentes y eligiendo el eje z en la dirección de v. Se obtiene así el resultado:
P' = (IAl2-IBl 2)P+2JBl 2v(v.P)+2 1n(AB*)v x P+2vRe(AB*)
IAl2+¡s¡2+2 re(AB*)v. p
.
2. Hallar las condiciones de simetría a las que satisfacen, como funciones del ángulo O, los
coeficientes en la amplitud de dispersión de dos nucleones idénticos (R. ÜEHME, J 955).
Dit,persión con interacción spin-órbita
625
Solución. Agrupemos los términos de (138.12) de tal manera que cada uno de ellos sea diferente de cero tan sólo para los estados singletes (S = O) o tripletes (S = 1) del sistema de dos
nucleones:
/ = a(s1. s2-l)+b(s1. s2+!)+c(±+(s1 .v)(s2 .v)]+
+ d[(s1 • n)(s2 . n') + (s1 . n')(s2 • n)] + e(s1 + s2) . v.
(1)
Mediante las fórmulas ( I 16.4) es fácil comprobar que el primer término es diferente de cero tan
sólo para S = O, y los restantes, para S = 1. En virtud de la identidad de las partículas, la amplitud
de dispersión debe ser simétrica respecto de la permutación de las coordenadas de las partículas
cuando S = O, y antisimétrica para S = 1; esta transformación equivale a substituir O~ :r -0,
o lo que es lo mismo, a cambiar el signo de uno de los vectores n y n' (cf. ~ 135). De estas condiciones se deducen las relaciones siguientes:
a(1r-fJ) = a(B),
b(1r-fJ) = -b(fJ),
d(1r-fJ) = d(B),
c(1r-6) = -c(fJ),
(2)
e(1r- fJ) = e(6).
En virtud de la invariancia isotópica, la amplitud de dispersión es la misma para las dbpersiones nn y pp y también para la dispersión np en el estado isotópico con T = 1. Para el sistema np
es también posible, sin embargo, el estado con T = O; la amplitud de dispersión np se caracteriza
entonces por otros coeficientes a, b, ... en ( 1) que no poseen las propiedades de simetría (2).
CAPÍTULO
XVIII
TEORíA DE LAS COLISIONES INELÁSTICAS
§ 139.
La colisión elástica cuando son posibles los procesos inelásticos
Una colisión se llama ine/ástica cuando va acompañada de un cambio del estado
interno de las partículas que chocan. Estos cambios los entendemos aquí en el sentido más amplio, en particular puede cambiar incluso la propia especie de las partículas. Así, puede tratarse de la excitación o ionización de los átomos, de la excitación
o desintegración de los núcleos, etc. En estos casos, cuando la colisión (por ejemplo,
una reacción nuclear) puede verse acompañada de diferentes procesos físicos, se
habla de diferentes canales de .reacción.
La existencia de canales inelásticos influye también en las propiedades de la
dispersión elástica.
En el caso general en que existen diferentes canales de reacc10n, la expresión
asintótica de la función de onda del sistema formado por las partículas que chocan
es una suma en la que a cada canal posible corresponde un término. Entre ellos
figura también, en particular, un término que describe las partículas en el estado
inicial no modificado (como suele decirse, en el canal de entrada). Dicho término
es el producto de las funciones de onda del estado interno de las partículas y de la
función que corresponde a su movimiento relativo (en el sistema de coordenadas
en el que se encuentra en reposo el centro de masas). Es precisamente esta última
función la que aquí nos interesa; designémosla por 1P y veamos cuál es su forma
asintótica.
La función de onda 1P en el canal de entrada se compone de la onda plana incidente y de una onda esférica divergente que corresponde a la dispersión elástica.
Es posible representarla también como suma de ondas convergentes y divergentes,
conforme se hizo en el § 122. La diferencia consiste en que la expresión asintótica
de las funciones radiales R1(r) no se puede tomar en la forma de una onda estacionaria del tipo (122. 7). Una onda estacionaria es suma de una onda convergente
y otra divergente con iguales amplitudes. En una colisión puramente elástica, esto
corresponde al sentido físico del problema; pero cuando existen canales inelásticos,
la amplitud de la onda divergente debe ser menor que la amplitud de la onda con-
626
Colisión elástica cuando son posibles los procesos inelásticoJ
627
vergente. Por ello la expresión asintótica de 'f/J vendrá dada por la fórmula (122.8):
•
if; =
2
e.o
:r °¿(2l + 1)Pl(cos 8)[( -1 )le-fkr - Szeikr],
(139.l)
l=O
con la diferencia de que las S1 no vienen ahora determinadas por la expresión (122.9),
sino que son ciertas cantidades (en general, conplejas) cuyos módulos son menores
que la unidad. La amplitud de la dispersión elástica se expresa en función de estas
cantidades por la fórmula (122. 10):
f(B) =
1 e.o
ik °¿(2l+ l)(Sz- l)Pz{cos8).
2
(139.2)
l=O
Para la sección eficaz total de dispersión elástica obtenemos, en vez de (122.11),
la fórmula
00
cre =
!!._""(21 + 1)11- Szj2.
k2~
(139.3)
l=O
También la sección eficaz total de dispersión inelástica, llamada asimismo sección eficaz de reacción ar para todos los canales posibles, se puede expresar en fun-
ción de las cantidades S 1• Basta para ello observar que para cada valor l la intensidad
de la onda divergente queda disminuida respecto de la intensidad de la onda convergente en la razón \S1j2• Esta disminución debe quedar compensada enteramente
por la dispersión inelástica. Es claro, por lo tanto, que
00
ar= ~""(2l+ 1)(1-!Szl 2),
k2k
(139.4)
l=O
y la sección eficaz total será
21T ¿00
crt = cre+ ar= - -
k2
(2l+ 1)(1-ReSz).
(139.5)
l=O
La amplitud parcial de dispersión elástica con momento cínético l, definida
de acuerdo con (122.13), es:
fi = (Sz- l)/2ik,
(139.6)
y cada uno de los términos de la suma en (139.3) y (139.4) representa una sección
eficaz parcial de dispersión elástica e inelástica de las partículas con momento cinético /:
628
Teoría de las colisiones inelásticas
G~l)
=
(1r/k2)(2l+ l)ll -S1l2,
G~l)
=
(1r/k2)(2l+ l)(l-lS1l2),
a~zl =
) (139.7)
(21r/k2)(2l+ 1)(1-ReSz).
El valor S1 = 1 corresponde a la ausencia total de dispersión (con el valor dado
de/). En cambio, el caso S 1 = O corresponde a la «absorción» total de las partículas con el valor dado de l; se tiene entonces
G~l)
=
G~l)
= (Tr/k 2 )(2I+ 1),
{139.8)
es decir, las secciones eficaces se dispersión elástica e inelástica son iguales entre sí.
Para un valor dado de a/l) la sección eficaz parcial de dispersión elástica puede
tomar valores comprendidos en el intervalo
yao-y(ao-a~>) ~ya~>::::;; yao+_v'(ao-a~l>),
(139.9)
donde a0 = (21+ l)n/k2 • Es interesante que cuando a/O es diferente de cero, debe
ser también diferente de cero a/ 1), es decir, que la existencia de canales inelásticos
de reacción conduce necesariamente a la existencia simultánea de la dispersión
elástica.
Tomando en (139.2) el valor de /(O) para (} = O y comparando con la expresión
(139.5), obtenemos la relación
lm/(0) = kae/4Tr,
(139.10)
que generaliza el teorema óptico (124.9) obtenido anteriormente. Como antes, /(O)
es aquí la amplitud de dispersión elástica para ángulo cero, pero la sección eficaz
total a1 incluye también la parte inelástica.
A su vez, las partes imaginarias de las amplitudes parciales Ji. están ligadas con
las secciones eficaces parciales a/O por la relación
k G(l)
Imfz=--t4-rr 21+1'
(139.11)
que se sigue sin más de (139.6) y (139.7).
El hecho de que los coeficientes S 1 en la expresión asintótica de la función de
onda no sean iguales en módulo a la unidad, en modo alguno repercute en las conclusiones a que se llegó en el § 128 acerca de los puntos singulares de la amplitud
de dispersión elástica, considerada como función de la variable compleja E; estas
conclusiones conservan su validez aun cuando existen procesos ine]ásticos. Sin
embargo, las propiedades analíticas de la amplitud cambian, en el sentido de que
Colisión elástica cuando son posibles los procesos inelástiCQf
629
ahora no es ya real sobre el semieje real negativo (E < O) y de que sus valores en
los bordes superior e inferior del corte para E> O no son ya valores conjugados
complejos (con lo que tampoco son conjugados complejos sus valores en puntos
de los semiplanos superior e inferior simétricos respecto del eje real).
Al pasar del borde superior del corte al inferior rodeando el punto E = O, la
raíz VE cambia de signo, es decir, como resultado de esta operación cambia el
signo de la cantidad real k (para E > O). Las ondas convergente y divergente en
(139 .1) cambian entre sí sus papeles y, por lo tanto, el papel de nuevo coeficiente S1
lo representará la cantidad I/S1, inversa de su valor anterior (que en modo alguno
coincide con S 1*). Es natural designar los valores de las amplitudes Ji. en los bordes
superior e inferior del corte por fi(k) y Ji.(- k) (¡amplitud física lo es, claro está,
solamente fi.(k)!). De acuerdo con (139.6) tenemos:
fz(k) =
Si- l
-;¡;¡;-,
fz( - k) = -
l/Si- l
-;¡;¡;- .
Eliminando S 1 entre estas dos igualdades, obtenemos la siguiente relación
fi(k)-!1(-k) = 2ikfi(k)fi(-k);
(139.12)
(si no existen procesos inelásticos, se tendría!(- k) = f*(k) y las relaciones (139. 12)
y ( 139.11) coincidirían).
Escribiendo (I 39.12) en Ja forma
1
1
fz(k)
Ji( -k)
- - - - - - = -2ik,
vemos que la suma 1/fi(k)+ik debe ser función par de k. Designando esta función
por g1(k 2), se tiene:
1
fz(k) =g-z(-k2-)--ik.
(139.13)
La función par g1(k 2), sin embargo, no es ahora real, como ocurría en (124.15) (1).
Cuando un haz de partículas atraviesa un medio dispersor constituido por un
gran número de centros de dispersión, se debilita gradualmente debido a que desaparecen de él las partículas que experimentan los diferentes procesos de colisión
(1) Los razonamientos expuestos, y con ellos también la conclusión a que conducen acerca de la paridad de la función g 1, suponen una disminución suficientemente rápida de la interacción para r--+ =,
disminución que garantice la ausencia de cortes en el semiplano izquierdo de E y haga con ello posible
rodear por completo el punto E = O.
630
Teoría de las colisiones inelásticas
elástica e inelástica. Esta atenuación viene determinada completamente por la amplitud de dispersión elástica para ángulo cero, y si se cumplen determinadas condiciones (véase más adelante) es posible describirla acudiendo al siguiente método
formal (1).
Seaf{O, E) la amplitud de dispersión para ángulo cero correspondiente a cada una
de las partículas del medio. Supondremos que fes pequeña comparada con la distancia media d ,...., ( V/ N)1 13 entre partículas; se puede entonces considerar la dispersión por cada una de ellas separadamente. Introduzcamos como cantidad auxiliar un cierto « campo efectivo » Uet de un centro inmóvil, determinándolo de tal
manera que la amplitud de dispersión de Born para ángulo cero calculada mediante
el mismo sea precisamente igual a la amplitud verdadera f(O, E) (¡en modo alguno
se supone con esto que la aproximación de Born sea aplicable al cálculo de f(O, E)
de acuerdo con la interacción real de las partículas!). Tenemos así, por definición
(véase (125.4)):
f
2TTn2
Ver d V= - --;;¡-f(O,E),
(139.14)
donde m es la masa de la partícula dispersada. Al igual que la amplitud f, el campo
así determinado es complejo. La relación entre su radio de acción a y la cantidad Ue/
se obtiene estimando ambos miembros de la igualdad (139.14):
a3 Uef "' li2:f/m.
(139.15)
La definición (139.14) no es, claro está, unívoca. lmpongámosle todavía la condición suplementaria de que el campo Uet satisfaga la condición de aplicabilidad
de la teoría de perturbaciones:
(139.16)
(con lfl ~ a). Es fácil ver que, en este caso, la atenuación del haz disperso se puede
representar como propagación de una onda plana en un medio homogéneo en el
que la partícula posee una energía potencial constante, igual a
- Nf UerdV
Uet = V
N2TTh2
= - V-;;¡- f(O,E),
(139.17)
(1) Las ideas que se exponen a continuación se aplican, en particular, para describir la dispersión
nuclear de neutrones rápidos (con energías del orden de centenares de Me V) cuyas longitudes de onda son
tan pequeñas que, comparadas con ellas, un núcleo se puede considerar como un medio macroscópico
heterogéneo.
Colisión elástica cuando son posibles los procesos inelástico¡
631
es decir, igual a la que se obtiene promediando los campos efectivos de todas las N
partículas del medio respecto de su volumen V. Esto resulta evidente si se considera
primero la dispersión en una porción del medio tal que, si bien se encuentran en
ella todavía muchos centros de dispersión, el efecto de ésta es aún pequeño (la posibilidad de considerar tales regiones parciales viene garantizada por la condición
( 139.16)). La atenuación del haz al atravesar dicha porción viene determinada por
la amplitud de dispersión para ángulo nulo, que, a su vez, se determina en la aproximación de Born mediante la integral del campo dispersor en todo el volumen de la
porción considerada. Esto significa también que las propiedades dispersoras del
medio que nos interesan quedan por completo determinadas por el campo promediado en volumen (139.17).
De esta manera el haz de partículas que atraviesa el medio se puede describir
mediante una onda plana ~ eikz con número de onda
1
k = -y'[2m(E- Uer)].
li
ln'troduciendo el número de onda k 0 =
biremos k en la forma nk0 ; la cantidad
V2mE/li de las partículas incidentes, escri-
Uer
n=y'(l--)
E
N2Trh2
= y'(l + V mE f(O,E))
(139.18)
representa el papel de « índice de refracción» del medio para el haz de partículas
que lo atraviesa. Este índice, en general, es complejo {¡la amplitud f es compleja!)
y su parte imaginaria determina la disminución de intensidad del haz. Si E ~ 1Uet 1,
(139.18) nos da, como debe ser:
NTrh2
Im n = --Imf(O,E)
V mE
donde a1 es la sección eficaz total de dispersión (hemos utilizado aquí el teorema
óptico (139.10)); esta expresión corresponde a un resultado evidente: la intensiC'ad
de la onda disminuye según la ley
leikz¡2 ,..., e-NU',z/V,
A la vez que la absorción, el índice de refracción complejo (139.18) determina
632
Teoría de las colisione.¡ inelásticas
también (mediante su parte real) la ley de refracción del haz a la entrada y a la salida
del medio dispersor.
PROBLEMA
Un haz de neutrones es dispersado por un núcleo pesado, siendo la longitud de onda de los
neutrones pequeña comparada con el radio a del núcleo (ka~ 1). Se supone que todos los neutrones que inciden con momento cinético orbital l < ka== 10 (es decir, con un « parámetro de impacto» ,i = hl/mv = 1/k < a) son absorbidos por el núcleo y que para l > 10 dichos neutrones no
interactúan en absoluto con él. Determinar la sección eficaz de dispersión elástica para ángulos
pequeños.
Solución. En las condiciones indicadas, el movimiento de los neutrones se comporta en esencia como cuasiclásico y la dispersión elástica es el resultado de una débil desviación, por completo
análoga a la difracción de Fraunhofer de la luz por una esfera negra. Por ello la sección eficaz buscada se puede escribir directamente ¡lplicando la conocida solución del problema de difracción (1):
dae = '1Ta 2
J~(ka8)
'17'(}2
do.
Este mismo resultado se puede obtener también a partir de la fórmula general (139.3). De acuerdo
con la condición del problema, tenemos Si = O para l < 10 y Si = 1 para l > 10 • La amplitud de Ja
dispersión elástica es, por ello,
l
/(8) = -
Zik
lo
2
(21+ l)Pz(cos8).
l=O
El principal papel en la suma lo representan los términos con grandes valores de l. De acuerdo con
esto, escribiremos 21 en vez de 21 + 1 y para valores pequeños de O utilizaremos para Pi(cos O) la
expresión aproximada (49.6), pasando de la suma a una integración:
lo
f(O) = :
JUo(Ol)dl
o
i
= -loli(Blo)
k(J
= (ia/8)l1(ka8),
como se quería demostrar (2).
(1) Véase tomo Il, Teoría clásica de los campos, problema 3 del§ 61 (el problema que plantea la difracción por una esfera negra es equivalente al problema de la difracción por una abertura circular practicada en una pantalla opaca). La sección eficaz se obtiene dividiendo la intensidad de las ondas difractadas
por el flujo incidente.
(2) De manera análoga se puede considerar el problema de la difracción, por un núcleo «negro»,
de partículas rápidas cargadas (A. l. AJIEZER, l. IA. POMERANCHUK, 1945). En este caso, el valor límite /0
debe determinarse a partir de la condición de que la distancia mínima entre el núcleo y la partícula, que se
mueve a lo largo de la trayectoria clásica en el campo coulombiano, sea nrecisamente igual al rarlio del
núcleo. Para l < lo hay que hacer, como antes Si = O, y para l > /0 , S, = é2«15i, donde Oz son las fases
coulombianas dadas por (133.11). Véase A. AJIEZER, l. POMERANCHUK, Nekotorye voprosy teorii aidra
( Algunos problemas de la teoría del núcleo), Gostejizdat, 1950, § 22.
Dispersión inelástica de partículas lentas
633
La sección eficaz total de dispersión elástica es
co
lf(ka8)
<:ie
f
= TTa 2 ---2TT8 d8
7rfl2
o
= TTa2;
(dada la rápida convergencia, la integración puede extenderse hasta =): como debía ser en las
condiciones dadas (cf. (139.8)), esta sección eficaz coincide con la sección eficaz de absorción, que
es igual simplemente al área de la sección geométrica de la esfera. La sección eficaz total escrt = 2na2•
&140.
Dispersión inelástica de partículas lentas
El razonamiento que condujo en el § 130 a la ley límite de dispersión elástica
en el caso de pequeñas energías, se generaliza fácilmente al caso en que existen
procesos inelásticos.
Como antes, el papel principal, para pequeñas energías, lo representa la dispersión con l = O. Recordemos que, de acuerdo con los resultados obtenidos en el § 130,
el elemento correspondiente de la matriz S era igual a:
S0
= e2ioo ~ 1 + 2i8o = 1 - 2ika.
Las propiedades de la función de onda utilizadas en el § 130 cambian tan sólo en
el sentido de que la condición que se le impone en el infinito (forma asintótica (139.1))
es ahora compleja, en vez de la condición de onda estacionaria real impuesta en el
caso de la dispersión puramente elástica. Debido a ello resulta también compleja
la constante °' = - c2 /c1 • El módulo ¡s0 no es ya igual a la unidad; la condición
¡s0 \ < 1 significa que la parte imaginaria °' = ot' +iot" debe ser negativa (rx." < O).
J
Substituyendo S 0 en (139.7), encontramos las secciones eficaces de dispersión
elástica e inelástica:
cre
= 4TTIIXl 2,
crr =
4-TT)!X")/k.
(140.1)
(140.2)
Así, pues, la sección eficaz de dispersión elástica es, como antes, independiente
de la velocidad. En cambio, la sección eficaz de los procesos inelásticos resulta ser
inversamente proporcional a la velocidad de las partículas, es decir, obedece a la
llamada « ley 1/v » (H. A. BETHE, 1935). Por consiguiente, al disminuir la velocidad
crece en importancia el papel de los procesos inelásticos frente a la dispersión elástica (1).
(1) De manera análoga se puede determinar la dependencia, respecto de la velocidad, de las secciones
eficaces parciales de reacción para momentos cinéticos orbitales diferentes de cero. Dichas secciones
resultan proporcionales a k 2i- 1 :
u,m,...,
k2&-l.
Las secciones eficaces de dispersión elástica O'e(l), en cambio, son como antes proporcionales a k 41 , es decir,
disminuyen para k-+ O más rápidamente que las O',(Z) con iguales valores de /.
634
Teoría de las colisiones inelásticas
Las leyes límite (140.1) y (140.2) son, claro está, tan sólo los primeros términos
del desarrollo de las secciones eficaces en potencias de k. Es interesante que el término siguiente del desarrollo de ambas secciones eficaces no contiene ninguna
nueva constante aparte de las que figuran en (140.1-2) (F. L. SHAPIRO, 1958). Esta
circunstancia es consecuencia de que la función g 0 (k 2) en la expresión (139.13)
fo(k)
go(k 2)-ik
de la amplitud parcial de dispersión (/=O) es par. Para valores pequeños de k,
esta función se desarrolla, por consiguiente, en potencias pares de k, de forma que
k 2 • Prescindiendo de este
el término que sigue a g 0 ~ - 1/a será un término
término, podemos escribir aún en fo(k) dos términos del desarrollo:
t'J
f 0(k) ~
-a(l -ika).
De manera análoga se pueden conservar también los términos que siguen en el
desarrollo de las secciones eficaces, para los que e-s fácil obtener las siguientes expresiones:
4n-lal 2(1-2kla"I),
(140.3)
= 4n-la"l(l -2kla"l)/k.
(140.4)
Ge=
<Jr
Los resultados obtenidos presuponen una disminución suficientemente rápida
de la interacción a grandes distancias. Vimos en el § 130 que la amplitud de dispersión elástica tiende a un límite constante para k ~ O si el campo U(r) disminuye
más rápidamente que ,-a. Esta condición se exige también para que valga la fórmula
análoga a (140.1) cuando existen canales inelásticos (1).
La ley 1/v para la sección eficaz de reacción supone, en cambio, que se cumpla
una condición más débil: el campo debe disminuir más rápidamente que ,-2, lo
que es claro en virtud de la siguiente justificación intuitiva de esta ley.
La probabilidad de que ocurra una reacción como consecuencia del choque,
es proporcional al cuadrado del módulo de la función de onda de la partícula incidente en la« zona de reacción» (en el dominio r
a). Físicamente, esta proposición
traduce el hecho ·de que, por ejemplo, un neutrón lento que choca con un núcleo
puede provocar una reacción tan sólo « penetrando » en el mismo. Si la interacción
a
disminuye más rápidamente que r-2, al pasar de grandes valores de r a valores r
dicha interacción no cambia el orden de magnitud de la función de onda; con otras
palabras, la razón l11-,(a)/1P( =)¡ 2 tiende a un límite finito para k ~ O (es fácil verlo
observando que en la ecuación de SCHRODINGER el término U1JJ resulta pequeño
t'J
t'J
1
( )
La fórmula (140.3), en cambio, que tiene en cuenta el término siguiente en el desarrollo en potencias de k, exige que U disminuya más rápidamente que r- 4 •
635
Dispersión inelástica de partículas lentas
comparado con L 'lj)). La sección eficaz se obtiene dividiendo 11Pl 2 por la densidad
de corriente. Tomando 1P en la forma de onda plana, normalizada a la unidad de
densidad de corriente, tenemos l1Pl 2 ,..., I/v, es decir, el resultado buscado.
En la colisión de partículas cargadas, junto a las fuerzas nucleares de corto
alcance encontramos también el campo coulombiano, que disminuye lentamente.
Este campo puede modificar de modo fundamental la magnitud de la onda incidente
en la zona de reacción. La sección eficaz de reacción se obtiene multiplicando I/v
por la razón de los cuadrados de los módulos de las funciones de onda coulombiana
y libre (parar~ O); esta razón viene dada por las fórmulas (134.10-11). Obtenemos
así (en unidades coulombianas):
21rA
crr
el signo
+
= ------;
k2je±21rfk- lj
(140.5)
en el exponente corresponde a repulsión, y el signo -, a atracción.
Si la velocidad es grande comparada con la unidad coulombiana (k ~ 1), la
interacción de Coulomb no representa papel ninguno y volvemos de nuevo a la
ley ar = A/k.
Si, en cambio, la velocidad es pequeña respecto de la unidad coulombiana (k ~ 1,
es decir, en unidades ordinarias, Z 1Z 2e2 /nv ~ 1, donde Z1e, Z 2e son las cargas de
las parficufos que chocan), la interacción de Coulomb representa el papel dominante
en la determinación de la magnitud de la función de onda en la zona de resonancia.
Con esto obtenemos:
(140.6)
para la colisión de partículas que se repelen, y
21rAliZ1Z2e2
crr=------
(140.7)
v2
en el caso de partículas que se atraen (1). El factor exponencial en que difiere (140.6)
(1) Obsérvese que las leyes límite (140.6-7) para la dependencia respecto de la velocidad se refieren
no solamente a las secciones eficaces totales, sino también a las secciones eficaces parciales para todos los
momentos cinéticos /. Esto resulta ya del hecho de que en el desarrollo (l,34.2) de las funciones 1P{ (que
aparecen en las fórmulas que hemos utilizado, (134.10-11)), en todos los términos de la suma las funciones Rkz tienen la misma dependencia límite respecto de k; así, en el caso de atracción, según (36.25), li;i.s
funciones coulombianas son tales que Rkl ,_, Vk/r J 2 1+lY8r), y parar..-.+ O: Rkz ,_, Vkrl:Las contribuciones,
de cada uno de los momentos al cuadrado 11J'{(a)l2 son (en unidades ordinarias) del orden de (a/ac) 2Zk-1
es decir, dependen de k de la misma manera, si bien se ven reducidos por el pequeño factor (a/ac) 2Z (ac
= lt 2 /mZ1 Z 2 e2 es la unidad coulombiana de longitud).
=
636
Teoría de las colisiones inelásticas
de (140.7) representa la pequeña probabilidad de que la partícula atraviese la barrera
potencial de Coulomb.
§ 141.
La matriz de dispersión en las reacciones
La sección eficaz ar estudiada en los §§ 139,140 era la sección eficaz suma de
todos los posibles canales inelásticos de dispersión. Veamos ahora cómo es posible
construir una teoría general de las colisiones inelásticas en la que cada canal puede
considerarse por separado.
Supondremos que como resultado de la colisión de dos partículas aparecen de
nuevo dos partículas (las originales u otras) (1). Numeremos todos los canales de
reacción posibles (para la energía dada) y designemos las cantidades que les corresponden mediante los correspondientes índices.
Sea· a el canal de entrada. La función de onda del movimiento relativo de las
partículas que chocan (en el sistema del centro de masas) viene representada en este
canal por la suma, que hemos escrito ya más de una vez, de una onda plana incidente
y una onda divergente dispersada elásticamente:
eik,,r
lfa =
eikaz
+/aa( 8)--.
r
(141.1)
El cuadrado de la amplitudfaa da la sección eficaz de dispersión elástica en el canal a:
dcraa
= //aa) 2do.
(141.2)
En otros canales (índice b), las funciones de onda del movimiento relativo de
las partículas que se forman en ellos se representan por ondas divergentes. Por
una razón que se expondrá más adelante, conviene escribir estas ondas en la forma:
(141.3)
donde kb es el vector de onda del movimiento relativo de los productos de reacción
(en el canal b), () su ángulo con el eje z, y ma y mb las masas reducidas de las dos partículas iniciales y de las dos partículas finales. El flujo dispersado en el ángulo sólido do
se obtiene multiplicando el cuadrado IV'bj 2 por vbr 2dr, y la sección eficaz de la correspondiente reacción se obtiene dividiendo este flujo por la densidad de la corriente
incidente, igual a va- De esta manera:
(1) No habrá necesidad de considerar en este libro de manera explícita las reacciones que conducen
a la formación de más de dos partículas (con excepción de las colisiones en las que se produce la ionización
de los átomos(§ 145)). Por ello, no vamos a determinar aquí la matriz de dispersión para el caso general
de las reacciones en las que toman parte un número arbitrario de partículas.
La matriz de dispersión en las reacciones
637
(141.4)
En el § 124 se introdujo el operador de dispersión S que transforma la onda
convergente en una divergente. Cuando existen varios canales, este operador tiene
elementos de matriz para las transiciones entre canales diferentes. Los elementos
de matriz « diagonales » respecto de los canales corresponden a la dispersión elástica, y los no diagonales, a los diferente procesos inelásticos; claro está, todos estos
elementos siguen siendo operadores respecto de las demás variables. Su determinación se efectúa como sigue.
De manera semejante a como se procedió en el § 124, introduzcamos los operadores laa, lab ligados a las amplitudes fam Íab· Definiremos los elementos diagonales
de la matriz S por la fórmula
Saa = 1 + 2ika/aa,
análoga a la ( 124.4). Los elementos no diagonales, en cambio, los definiremos por
Sab = 2iy(kakb)/ab, a =f:. b.
Estas dos expresiones se pueden reunir en una fórmula única
(141.5)
Es fácil ver que precisamente esta definición conduce a una matriz S que deberá
satisfacer la condición de ser unitaria. En efecto, escribamos la función de onda
en el canal de entrada como sistema de ondas convergentes y divergentes, conforme
se hizo en el ~ 124:
e-ikar
eikar
fa= F(-n')--- (1 + 2ika/aa)F(n')ryva
ryva
e-ikar
= F(-n') -
ryva
eikar
- SaaF(n') - .
ryva
(141.6)
(por conveniencia, hemos introducido aquí en la expresión (124.3) el factor adicional
vu-~). En estas condiciones, de acuerdo con las definiciones que hemos adoptado
para las amplitudes, la función de onda en el canal b se escribirá en la forma
(141.7)
Teoría de las colisiones inelásticas
638
El flujo en las ondas convergentes debe igualarse a la suma de los flujos en las
ondas divergentes para todos los canales; esta condición no hace sino expresar la
condición evidente de que la suma de las probabilidades de todos los procesos posibles (elásticos e inelásticos) que pueden resultar de la colisión, debe ser igual a la unidad. Gracias a haber introducido en el denominador de las ondas esféricas el factor
Vv, la velocidad desaparece en la expresión de las densidades de corriente en dichas
ondas. Por ello, la condición impuesta significa simplemente que deben coincidir
las normalizaciones de la onda convergente y del conjunto de ondas divergentes.
Esta condición se expresa, por consiguiente, al igual que antes, por la condición de
que el operador de dispersión sea unitario, entendido como matriz, en particular
con relación a los números de los diferentes canales. Para los operadores
esta
condición se expresa por la igualdad
iab
fab-//a = 2i¿
Aclacltc,
(141.8)
e
análoga a (124.7); el íno1ce + significa aquí el paso al complejo conjugado y la
transposición respecto de todos los demás índices matriciales (aparte el número del
canal).
La matriz Ses diagonal con relación a los estados en los que el momento cinético
orbital l tiene valores determinados; distinguiremos los correspondientes elementos
de matriz por el índice (/). Aplicando los operadores
y fab a la función ( 124.16),
obtenemos las amplitudes de los procesos elásticos e inelásticos de dispersión en
la forma:
laa
1
00
/aa = ik ¿ {2/ + 1)( Saa<i> -1 )Pl(cos 8),
2
ªz=o
(141.9)
1
/ab
=
00
2iv'(kakb)¿(2l+ l)Sab<l>P¡(cosB).
l=O
Las correspondientes secciones eficaces integrales son:
00
Gaa
= ;
¿{2/+ l)jl-Saa<llj2,
a l=O
(141.10)
00
Gab =
;
¿{2/+ l)ISab<t>¡ 2•
a l=O
La matriz de dispersión en las reacciones
639
La primera de estas fórmulas coincide con (I 39.3). La sección eficaz total de reacción ar (partiendo de] canal de entrada a) es, en cambio, igual a la suma
crr =
.L'Gab
b
extendida a todos los b =p a. En virtud del carácter unitario de la matriz S tenemos:
¿',sabl 2 = 1-ISaa\ 2,
b
con lo que se vuelve a la fórmula (139.4) para ªr·
La simt:tría del proceso de dispersión respecto a la inversión del tiempo (teorema
de reciprocidad) se expresa por la igualdad
(141.11)
o, lo que es lo mismo:
/ab = fb*a*•
(141.12)
a* y b* representan aquí los estados que difieren de los estados a y b en el cambio
de los signos de las velocidades y de las proyecciones de los momentos cinéticos
de las partículas. Estas relaciones generalizan las fórmulas ( 124.11-12) relativas a la
dispersión elástica (1).
Para un proceso con direcciones determinadas (inicial y final) del movimiento,
( 141.12) conduce a la misma igualdad para las amplitudes de dispersión que aparecen en la fórmula (141.4). Por ello, las secciones eficaces del proceso directo y del
proceso inverso respecto del tiempo están ligadas entre sí por la igualdad (2):
(141.13)
Como se demostró en el § 125, cuando la teoría de perturbaciones es aplicable
en primera aproximación, además del teorema de reciprocidad vale también. otra
relación entre las amplitudes de los procesos directo e inverso (en el sentido literal
de la palabra): a-+ b y b-+ a. Esta propiedad, que se expresa por la igualdad
lab =Iba*, se tiene también (y en el mismo orden de aproximación) en el caso de
procesos inelásticos. Las correspondientes secciones eficaces están ligadas entonces
por la igualdad
(1) Prescindimos aquí del factor - l, que puede resultar en la colisión de partículas que poseen spin
(cf. (138.10)). Esta circunstancia no se refleja, claro está, en la relación (141.13) para las secciones eficaces.
(2)
Esta igualdad traduce el llamado principio del equilibrio detallado.
640
Teoría de las colisiones inelásticas
(141.14)
Pb2 dob
Pa 2doa
La diferencia entre las transiciones a --+ b y a* --+ b* desaparece si se considera
la sección eficaz integral (es decir, la sección eficaz integrada respecto de todas las
direcciones Pb), sumada, además, respecto de todas las direcciones de los momentos j¡b, j 2 b de las partículas que se forman y promediada respecto de las direcciones
de los impulsos Pa y de los momentos ita, j 2a de las partículas incidentes. Designemos esta sección eficaz por <1ab:
1
(Jab = 4rr(2jia + 1)(2ha + 1)
2
m1a,m2a
Escribiendo (141.14) en la forma
y efectuando la integración y la suma, obtenemos la relación
(2ha + 1)(2jza + 1)Pa 2 aab = (2jib + 1)(2jzb + 1)Pb 2 aba•
(141.15)
Finalmente, observemos la siguiente propiedad de la amplitud f~b· Vimos en el
párrafo anterior que, cuando Pa--+ O, la sección eficaz de reacción varía de acuerdo
con la ley <1ab ,__, 11Pa (para una disminución suficientemente rápida de la interacción
a grandes distancias). De acuerdo con la fórmula (141.4), esto significa que !ab--+
--+ const cuando Pa --+ O. En virtud de la simetría (141.12), de aquí se sigue que fa 6
tiende a un límite constante también cuando p 1, ·-+ O. Consideraremos de nuevo
esta propiedad en el § 144.
§ 142.
Fórmulas de Breit y Wigner
En el § 132 se introdujo el concepto de estados cuasiestacionarios como estados
que poseen una vida de duración finita, pero relativamente larga. Una amplia categoría de tales estados la encontramos en el dominio de las reacciones nucleares para
energías no demasiado grandes, reacciones que pasan por el estado de formación
del núcleo compuesto (1).
La imagen física intuitiva de los procesos que ocurren de esta manera consiste
en suponer que la partícula que incide sobre el núcleo, al interactuar con los nucleones del mismo, se « fusiona » con él formando un sistema compuesto en el que la
energía aportada por la partícula se distribuye entre varios nucleones. Las energías
de resonancia corresponden a niveles cuasidiscretos de este sistema compuesto.
La larga duración de la vida de los estados cuasiestacionarios (comparada con los
(1)
El concepto de « núcleo compuesto » fue introducido por N. BoHR (1936).
Fórmulas de Breit y Wigner
641
« períodos » de movimiento de los nucleones en el núcleo) está ligada con el hecho
de que, durante la mayor parte del tiempo, la energía está distribuida entre muchas
partículas, de modo que cada una de ellas posee una energía que es insuficiente
para que escape del núcleo venciendo la atracción de las restantes partículas. Tan
sólo rara vez, relativamente, se concentra sobre una partícula una energía suficientemente grande para que así ocurra. En estas condiciones, la desintegración del núcleo
compuesto puede tener lugar de diferentes maneras, que corresponden a los diferentes canales de reacción posibles (1).
El carácter de tales colisiones permite afirmar que la posibilidad de que se produzcan en ellas procesos inelásticos no se hace notar en la parte potencial de la amplitud de la dispersión elástica, que no está ligada con las propiedades del núcleo
compuesto (véase § 132); dichos procesos modifican tan sólo la magnitud de la
parte resonante de la amplitud de dispersión elástica. Por la misma razón, las amplitudes de los procesos de dispersión inelástica, que ocurren pasando por el estadio
de formación del núcleo compuesto, poseen un carácter de resonancia puro. Los
denominadores de resonancia de todas las amplitudes, que están vinculados con la
anulación del coeficiente de la onda convergente para E= E 0 - }ff, conservan
entonces su forma primitiva (E- E 0 +!ff), donde r determina, como antes, la
probabilidad total de desintegración (cualquiera) del estado cuasiestacionario dado
del núcleo compuesto.
Estas razones, junto con la condición de unitariedad, a la que deben satisfacer
las amplitudes de dispersión, bastan para establecer su forma.
El cálculo conviene efectuarlo de forma simétrica, numerando todos los posibles
canales de desintegración del núcleo compuesto y sin fijar de antemano cuál de ellos
será el canal de entrada para la reacción dada (los índices que indican el número
del canal los representaremos por las letras a, b, e, ... ). Además, consideraremos
también las amplitudes parciales de dispersión que corresponden al valor de l asociado con el estado cuasiestacionario dado (2). De acuerdo con lo dicho antes buscaremos para estas amplitudes expresiones de la forma:
(142.1)
(Para simplificar la escritura, prescindimos del índice l en las constantes <5a y Mab).
El primer término existe sólo para a = b y representa la amplitud de la dispersión
(1) Entre los procesos que entran en competencia figura también la captura radiativa de la partícula
incidente, proceso en el que el núcleo compuesto excitado pasa a su estado fundamental emitiendo un
fotón y. Este proceso es también« lento» debido a la relativamente pequeña probabilidad de la transición
acompañada de radiación.
( 2)
Prescindiremos por el momento de la influencia de los spins de las partículas que toman parte
en el proceso, influencia que complica el problema.
Teoría de las colisiones inelásticas
642
elástica potencial en el canal a (las constantes Óa coinciden con las que figuran en la
fórmula (132.11) para las fases b/0)). El segundo término en (142.1) corresponde,
en cambio, a procesos resonantes. La forma de escribir el coeficiente del factor de
resonancia en este término se ha elegido de manera que se simplifique el resultado
de aplicar las condiciones de unitariedad (véase más adelante).
Dado que consideramos la dispersión para un valor dado del módulo del momento
cinético orbital, es decir, de una cantidad que no cambia de signo en una inversión
del tiempo, el teorema de reciprocidad (simetría respecto de dicha inversión) se
expresa simplemente por el carácter simétricos de las amplitudes !ab(l) respecto de
los índices a, b. De aquí se sigue que deben ser también simétricos los coeficientes
Mab(Mab
=
M ba)•
Las condiciones de unitariedad para las amplitudes !ab< 1> son:
lm /ab<ll = Lkc/a/l>Jbc<l>«<;
(142.2)
e
(cf. (141.8)). Substituyendo aquí las expresiones (142.1), obtenemos, después de un
cálculo sencillo:
E-Eo-!ir
Mab
irfMacMbc*
E-Eo+!ir
(E-Eo)2+!r 2
Para que esta igualdad se cumpla idénticamente cualquiera que sea ei valor de la
energía E, ante todo debe ser Mab = Mab*, es decir, las cantidades Mab son reales.
Obtenemos luego la siguiente relación:
(142.3)
es decir, la matriz de los coeficientes Mab debe coincidir con su cuadrado.
La matriz real simétrica M ab se puede reducir a la forma diagonal mediante una
transformación lineal ortogonal adecuada Ú. Designando los elementos diagonales
(valores propios) de la matriz por M(r:t.), escribiremos esta transformación en la
forma
L UaaUpbMab = Af(a>Sap,
a,b
donde los coeficientes de la misma satisfacen las relaciones de ortogonalidad
(142.4)
Recíprocamente
(142.5)
Mab = LUaaUabM(a>.
a
Las relaciones ( I 42.3) conducen a las condiciones
M(r:t.)
= (M(r:t.)) 2 para los val o-
643
Fórmulas de Breit y Wigner
res propios Ml!Y..), de donde se sigue que estos valores sólo pueden ser iguales a cero
o a l. Si todos los M(!Y..) son distintos de cero salvo uno (sea éste el MÜ) = 1), en
virtud de (142.5) tenemos:
(142.6)
es decir, todos los elementos de matriz Mab se expresan en función del conjunto
de cantidades U1a, a = 1, 2, ... En cambio, si son diferentes de cero algunos valores
M<(J.), los elementos Mab son sumas de términos que se expresan en función de diferentes sistemas de cantidades U1a, U2a, .•• ligadas entre sí tan sólo por las relaciones
de ortogonalidad, siendo por lo demás independientes. Este caso correspondería
a una degeneración accidental debida a que a un mismo nivel cuasidiscreto de la
energía corresponden varios estados cuasiestacionarios del núcleo compuesto (1).
Por lo tanto, prescindiendo de estos casos, que carecen de interés, es decir, considerando los niveles como no degenerados, llegamos a la conclusión de que los elementos de matriz lvfab son productos de cantidades cada una de las cuales depende
del número de uno sólo de los canales.
Introduciendo la notación
escribiremos la fórmula (142.6) en la forma:
Mab
= ± ,v(rarb)/r;
(142.7)
(el signo de Mab depende de los signos de U1a y U1 b y queda indeterminado). En virtud de la igualdad LiU1cU1c = 1, las cantidades rª introducidas de esta manera
satisfacen la condición
~ra
= r.
a
(142.8)
Estas cantidades reciben el nombre de anchuras parciales de los diferentes canales.
Las fórmulas (142.1), (142.7-8), proporcionan la forma general buscada de las
amplitudes de resonancia.
Escribamos ahora las fórmulas finales fijando uno de los canales como canal de
entrada (2). Designaremos la anchura parcial de este canal por re (anchura elástica),
y las anchuras correspondientes a las diferentes reacciones, por rri, rr2 , •••
La amplitud total de dispersión elástica es
(1) Esto resulta particularmente claro en el caso en que todos los M(r:t.) = l. De (142.4-5) se si~ue
que entonces también Mab = ,5ab, es decir, las transiciones entre canales diferentes son por completo imposibles. Con otras palabras, este caso correspondería a un cierto número de estados cuasidiscretos independientes, cada uno de los cuales resultaría de la dispersión elástica en uno de los canales.
(é)
Estas fórmulas fueron obtenidas por primera vez por H.
BREIT
y E. WIGNER (1936).
644
Teoría de las colisiones inelásticas
fe( O) = j(O>( 0)-
re
21+ 1
- - - - e2i 81 <O> Pz( cos O)
E-Eo+iiI'
'
2k
(142.9)
donde k es el número de onda de la partícula incidente, y ¡<o) es la amplitud de la
dispersión potencial. Esta fórmula difiere de la expresión (132.11) en la substitución
de r por la cantidad más pequeña re en el numerador del término de resonancia.
Las amplitudes de los procesos inelásticos poseen, conforme se indicó ya, un
carácter puramente de resonancia. Las secciones eficaces diferenciales son:
dO'ra
=
(21+ 1) 2
I'eI'ra
4k2
(E-E0)2+!-I'2
[Pz(cos 0)] 2
'
(142.10)
y las secciones eficaces integrales valen:
1T
O'ra = (21+ 1)
k2 (E-Eo)2+!r2
(142.11)
La sección eficaz total de todos los procesos inelásticos posibles es:
I'eI'r
1T
O'r = (21 + 1) -
k2 (E-Eo)2+fr2
donde
r r = r - re es la
,
(142.12)
anchura inelástica total del nivel.
Interesa también el valor de la sección eficaz de reacción integrada en un dominio energético en torno del valor de resonancia E= E 0 • Dado que ar disminuye
rápidamente al apartarnos de la resonancia, la integración respecto de E- E 0 se
puede extender desde -- oo a e:o, con lo que obtenemos:
f
21r 2 I'eI'r
O'rdE= ( 2 l + l ) - - .
k2 r
(142.13)
En la dispersión de neutrones lentos (longitud de onda grande comparada con
las dimensiones del núcleo) cuenta esencialmente tan sólo la dispersión s, y la amplitud de dispersión potencial se reduce a la constante real - ce. En vez de (132.13)
tenemos ahora:
fe=
I'e
-rt-
•
2k(E-Eo+iiI')
(142.14)
La sección eficaz total de dispersión elástica es igual a
(142.15)
F Órmulas de Breit y JP igner
645
El término 4noc2 puede llamarse sección eficaz de dispersión potencial. Vemos
así que en el dominio de resonancia se produce interferencia entre las dispersiones
potencial y de resonancia. Tan sólo en la inmediata vecindad del nivel (E - E 0 ,._ I')
puede resultar posible prescindir de la amplitud oc (recordemos que Jockj ~ I) en
cuyo caso la fórmula para la sección eficaz de dispersión elástica de los neutrones
lentos toma la forma:
71"
<Je.=
re 2
k2 (E-E0)2+fr2
(142.16)
La sección eficaz total de dispersión, tanto elástica como inelástica, es entonces
igual a
(142.17)
En aquellas condiciones en que es posible prescindir de la dispersión potencial,
las secciones eficaces ªª' ara se pueden escribir en la forma
<Je
= crtre/r'
<Jra
= crtrra/r.
La cantidad a1 - suma de las secciones eficaces de todos los procesos de resonancia
posibles - se puede considerar en tal caso como sección eficaz de formación del
núcleo compuesto. En cambio, las secciones eficaces de los diferentes procesos
elástico e inelásticos se obtienen multiplicando a1 por las probabilidades relativas
de la correspondiente desintegración del núcleo compuesto, probabilidades que
vienen dadas por las razones de las correspondientes anchuras parciales a la anchura
total del nivel. La posibilidad de representar las secciones eficaces de esta manera
resulta como consecuencia de la factorización (descomposición en factores) de los
coeficientes Mab en los numeradores de las amplitudes de dispersión. Ello corresponde
a la imagen física que ve en el proceso de colisión un proceso en dos estadios: formación del núcleo compuesto en un determinado estado estacionario y ulterior
desintegración en uno u otro canal (1).
Conforme se indicó ya en el § 132, el dominio de aplicabilidad de las fórmulas
consideradas viene limitado solamente por la condición de que la diferencia IE - E 0
sea pequeña comparada con la distancia D entre niveles vecinos cuasidiscretos del
núcleo compuesto (con iguales valores del momento cinético). Sin embargo, también
allí se indicó que, en esta forma, dichas fórmulas no admiten el paso al límite E ~ O,
J
l'J
En lo que precede hemos efectuado todos los cálculos pensando en reacciones de la forma a+X =
+ partícula incidente) se forman de
nuevo dos partículas. Esta hipótesis, sin embargo, no tiene un carácter fundamental, como es claro en virtud
del carácter físico de los resultados obtenidos. Las fórmulas de la forma (142.11) para las secciones eficaces
integrales son válidas también para las reacciones en las que escapan del núcleo más de una partícula.
= b+ Y, en las que a partir de las dos partículas iniciales (núcleo
646
Teoría de las colisiones inelásticas
cuestión ésta que se plantea si el valor E = Ose encuentra en el dominio de resonancia.
En este caso hay que cambiar la estructura de las mismas mediante la substitución
de la energía E 0 por una cierta constante e0 ligada con ella, y la de la anchura elástica re, por Ye VE; la anchura inelástica, I'r, en cambio, debe considerarse, como
antes, constante (1). Como resultado de esta substitución, la sección eficaz inelástica
(142.12) crecerá, cuando E-+ O, como 1/V E, de acuerdo con la teoría general de
la dispersión inelástica de partículas lentas (§ 140).
El tener en cuenta los spins de las partículas que chocan conduce, en el caso
general, a fórmulas bastante complicadas. Nos limitaremos al caso más simple,
si bien importante, de la dispersión de neutrones lentos, cuando en la dispersión
intervienen solamente momentos cinéticos orbitales l = O. El spin del núcleo compuesto se obtiene en tal caso por composición del spin i del núcleo blanco con el
spin s = t del neutrón, es decir, puede tener los valores j = i ± i (suponemos
que i-=/=- O; en el caso contrario, no tiene lugar modificación ninguna en las fórmulas).
Cada nivel cuasidiscreto del núcleo compuesto corresponde a un valor determinado
de j. La sección eficaz de reacción se obtiene, por lo tanto, multiplicando la expresión
(142.12) (con l = O) por la probabilidad g(j) de que el sistema núcleo + neutrón
tenga el valor de j necesario - aquél para el que se tiene un nivel de resonancia.
Supondremos que los spins de los neutrones y de los núcleos blanco están orientados por completo al azar. En total se tienen (2i + 1) (2s + 1) = 2(2i + 1) orientaciones posibles del par de spins i y s. De éstas, al valor dado j del momento total
corresponden (2j+ 1) orientaciones. Teniendo cuenta que en todas las orientadones
son igual.mente probables,se encuentra que la probabilidad del valor dadoj es igual a
.
Zj+l
g(J) = 2(2i+ 1)
(142.18)
De manera análoga debe modificarse la fórmula que da la sección eficaz de dispersión elástica. En este caso hay que tener en cuenta que en la dispersión potencial
intervienen ambos valores de j. Por ello el factor g(j) (conj correspondiente al nivel
de resonancia) debe introducirse en el segundo término de (142.15) y el término
4mx2 debe substituirse por la suma
fg(j), 4rr[(X(i>]2.
El hecho de que las reacciones de resonancia se producen pasando por el estadio
de formación de un núcleo compuesto, núcleo que se encuentra en un determinado
(1) Es importante el que, para los procesos inelásticos que son posibles para pequeñas energías (por
ejemplo, la captura radiativa), el valor E = O no sea un valor umbral. Para las anchuras parciales I' ra
se requeriría una substitución, análoga a la indicada para I'e, cuando las energías son próximas al umbral
de la reacción dada, umbral por debajo del cual dicha reacción es totalmente imposible.
La necesidad de cambiar de la manera indicada la estructura de las fórmulas para pequeñas energías,
fue puesta de manifiesto por H. BETHE y H. PLACZEK (1937}.
Fórmulas de Breit y Wigner
647
estado cuasiestacionario, permite formular algunas consideraciones generales acerca
de las distribuciones angulares de los productos de estas reacciones. Cada estado
cuasiestacionario posee, aparte de sus demás características, una determinada paridad.
La misma paridad poseerá, por consiguiente, el sistema (b+ Y) de las partículas
que se forman al descomponerse el núcleo compuesto. Esto significa que la función
de onda de este sistema, y por ello también las amplitudes de reacción, tan sólo
puede quedar multiplicada por ± 1 en una inversión del sistema de coordenadas;
por consiguiente, los cuadrados de las amplitudes, es decir, las secciones eficaces,
no experimentan, en cambio, variación alguna. La inversión de las coordenadas
equivale (en el sistema del centro de masas de las partículas) a la substitución()~ n - (), </>-+ n+</> para el ángulo polar y el acimut que determinan la dirección de
dispersión. La distribución angular de los productos de la reacción debe ser, por lo
tanto, invariante con relación a este cambio. En particular, después de promediar
respecto de las direcciones de los spins de todas las partículas que intervienen en la
reacción, la sección eficaz depende solamente del ángulo de dispersión O. La distribución respecto de este ángulo debe ser simétrica respecto de la substitución ()-+
-+ n - (), es decir, la distribución angular (en el sistema del centro de masas) es simétrica con relación a un plano perpendicular a la dirección de colisión de las partículas (1).
Como consecuencia del gran número de niveles densamente distribuidos del núcleo compuesto, el comportamiento detallado de las secciones eficaces de los diferentes procesos de dispersión respecto de la energía es muy complicado. Esta complicación hace difícil, en particular, el poner de manifiesto cambios sistemáticos en
las propiedades de las secciones eficaces al pasar de unos núcleos a otros. Tiene
sentido, por consiguiente, estudiar la marcha de las secciones eficaces sin tener en
cuenta los detalles de la estructura de resonancia, sino promediadas en intervalos
energéticos grandes en comparación con las distancias entre niveles. En un análisis
de esta naturaleza renunciamos también a considerar la diferencia entre los distintos tipos de procesos inelásticos, y dividimos la dispersión - en el sentido que se
indicará - únicamente en « elástica » e « inelástica » (2).
Para aclarar el sentido de los promedios que efectuaremos, se prescindirá de
nuevo de las complicaciones ligadas con los spins y consideraremos las secciones
eficaces parciales de dispersión con l = O.
Según las fórmulas (139.7):
( 1)
Para partículas sin spin, la sección eficaz diferencial de reacción sería, simplemente, proporcional
a (Pz(cos 0))2, en cuyo caso la simetría indicada es evidente.
(2) El método de promedio que exponemos a continuación (para pasar al llamado modelo óptico
de la dispersión nuclear) ha sido propuesto por V. F.W EISSKOPF, C. E. PoRTER y H. FESHBACH (1954).
648
Teoría de las colisiones inelásticas
11'
ª e = -1s-1¡2
k2
,
11'
ae = - . 2(1-ReS),
k2
(142.19)
las secciones eficaces de dispersión elástica e inelástica, y con ellas también la sección eficaz total, se expresan en función de una sola cantidad S (prescindimos del
índice (O) para abreviar). Al promediar en un intervalo energético, la sección eficaz
total, que depende linealmente de S, se expresa en función del valor medio de S
de acuerdo con
(142.20)
áe = (i/k2). 2(1-ReS);
(suponemos que el factor lentamente variable k-2 no se ve alterado por el promedio).
En cambio, como sección eficaz «elástica» introducimos en este modelo la cantidad
(142.21)
que no coincide, en general, con el valor medio ªe· Con otras palabras, determinamos
la dispersión elástica efectuando previamente el promedio de la amplitud en la onda
divergente Seikr/r. De acuerdo con esta definición, la dispersión elástica de un paquete de ondas conserva invariable su forma; cabe decir que la sección eficaz (142-21)
se refiere a la parte « coherente » de la dispersión. Esto significa que de la dispersión
elástica se excluye la parte que resulta del paso por el estadio de formación del
núcleo compuesto: cuando se produce un núcleo compuesto que existe durante un
cierto tiempo para desintegrarse después, se pierden, claro está, las características
específicas del paquete de onda incidente. La sección eficaz « inelástica », en cambio,
la definiremos ahora en el modelo de promedios, naturalmente, como igual a la
diferencia aaopt = <1t - cre0 Pt, es decir,
(142.22)
De esta manera, corresponden a ella no sólo los diferentes procesos inelásticos, sino
también aquella parte de la dispersión elástica que ocurre con formación del núcleo
compuesto intermedio.
Es fácil ver que esta interpretación refleja correctamente la situación que se produce en los casos límite y posee por ello el carácter de una interpolación razonable.
En el dominio de bajas energías, en el que nos encontramos con resonancias bien
separadas (r ~ D), S viene dada, cerca de cada nivel, por la fórmula
S=
e2i8(ºl
r
(1- E-Eo+!iI'
t e
)•
Interacción en el estado final en el caso de reacciones
649
Promediando esta expresión, obtenemos:
S = e2iS<º>(1-1rI'e/D),
(142.23)
re
donde
y D son los valores medios (respecto de los niveles contenidos en el intervalo de energías dado) de la anchura elástica y de la distancia entre niveles; la función lentamente variable (5<º)(E) se puede considerar constante al efectuar el promedio.
De aquí resulta:
1r 21rl\
(142.24)
Üaopt=---
k2 D'
donde se ha prescindido de términos pequeños
(I'/D) (1). Esta expresión coincide, en efecto, con el valor medio de la sección eficaz (142.17), que corresponde,
conforme se indicó, a la formación del núcleo compuesto.
r--..1
A medida que aumenta la energía de excitación del núcleo compuesto, las distancias entre sus niveles disminuyen y las probabilidades de desintegración ( y con
ellas las anchuras totales de los niveles) crecen, de modo que los niveles comienzan
a «solaparse» (el propio concepto de niveles cuasidiscretos pierde entonces su sentido en buena medida). Como resultado de ello, las irregularidades en la marcha
de la función S(E) se alisan, de modo que la diferencia entre las funciones exacta
y promedia pasa a ser pequeña y la sección eficaz (142.2) coincide con la ar dada
por (142.19). Esto está de acuerdo con el hecho de que, para grandes energías, la
desintegración del núcleo compuesto por el canal de entrada no representa ningún
papel comparada con todos los otros posibles modos de desintegración para tales
energías; por ello, en este dominio todos los procesos en que interviene la formación
del núcleo compuesto se pueden considerar inelásticos.
Así, pues en el modelo de promedios la dispersión viene de nuevo determinada
por una sola cantidad (S), que es ahora una función lisa de la energía. En el llamado
modelo óptico, para el cálculo de esta función, las propiedades dispersoras del núcleo
se aproximan mediante un campo de fuerzas que deriva de un potencial complejo.
La existencia en el potencial de una parte imaginaria conduce a que, junto a la dispersión elástica, se tenga también una absorción de las partículas. Esta absorción,
cuya sección eficaz viene dada por la e.xpresión (142.22), se identifica también con la
dispersión « inelástica » en el modelo de promedios.
§ 143.
Interacción en el estado final en el caso de reacciones
La interacción entre las partículas que resultan de una reacción cualquiera puede
ejercer una gran influencia sobre sus distribuciones energética y angular. Es natural
( 1)
De este mismo orden serían también los términos que aparecerían al tener en cuenta, en el dominio
próximo a un nivel, la influencia de los demás niveles.
650
Teoría de las colisiones inelásticas
que esta influencia sea particularmente notable en aquellos casos en los que la
velocidad de las partículas que interactúan es relativamente pequeña. Nos encontramos con un fenómeno de este tipo, por ejemplo, en las reacciones nucleares que
van acompañadas de la emisión de dos o más nucleones, estando ligado entonces
este efecto con las fuerzas nucleares que actúan entre nucleones libres (1).
Sea p0 el impulso del centro de masas del par de nucleones emitidos y p el impulso
de su movimiento relativo. Supondremos que p ~ p0 , y por ello también la energía
relativa E= p 2/m (m es la masa del nucleón) es pequeña comparada con la energía
del movimiento del centro de masas E 0 = p 02/4m. Admitiremos también que la
energía E 0 es grande respecto de la energía s del nivel (real o virtual) en que se encuentra el sistema de los dos nucleones. Con otras palabras, « lento » se supone
tan sólo el movimiento relativo de los nucleones, siendo éstos, en cambio, «rápidos».
La probabilidad de la reacción es proporcional al cuadrado del módulo de la
función de onda de las partículas que se forman cuando se encuentran en la « zona
de reacción », es decir, a una distancia una de otra que es del orden de magnitud
del radio de acción a de las fuerzas nucleares (cf. las consideraciones análogas hechas
en el§ 140 al tratar de las partículas primarias). En el presente caso, nuestro objeto
consiste en determinar cómo depende la probabilidad de reacción en relación tan
sólo con las características del movimiento relativo de un par de nucleones. Basta
por ello considerar únicamente la función de onda 'IJ'p(r) de este movimiento, de modo
que la probabilidad de la formación del par de nucleones con un impulso relativo
en el intervalo d 3p es:
dwp = constante x li/,p(a)l2d3p.
(143.1)
Como se demostró en el § I 34, para hallar la probabilidad de transición del sistema, en la dispersión, a un estado con dirección determinada del movimiento,
hay que utilizar como funciones de onda del estado final las funciones %- que
contienen (en el infinito) junto con una onda plana tan sólo una onda convergente;
estas funciones deben estar normalizadas respecto de la función - ¿j del impulso.
Por otra parte, las funciones ' PP + se obtienen directamente (pasando a la expresión
conjugada compleja y cambiando el signo de p) a partir de las funciones '!J'p-\ que
contienen en el infinito ondas esféricas divergentes, es decir, correspondientes al
problema de la dispersión mutua de dos partículas. Al substituir en ( 143. l ), esta
diferencia carece de importancia, de modo que podemos suponer que las funciones
'!J'p en (143.1) son las funciones % + y, de esta manera, el problema se reduce al
problema que hemos estudiado ya de la dispersión de resonancia de partículas lentas.
Aunque se desconoce la verdadera forma de las funciones % en el dominio
r ,_,, a, sin embargo, para determinar la dependencia de la probabilidad con relación
(1) Los resultados que se exponen a continuación fueron obtenidos por primera vez por A. B.
(1950) y luego, independientemente, por K. M. WATSON (1952).
M1GDAL
Interacción en el estado final en el caso de reacciones
651
·>
a la energía E basta considerar esta función a distancias r 1/k ~ /a (donde k = p//i
se supone que ak ~ 1), extendiéndola luego, en orden de magnitud, a distancias;
r "" a (1). En este caso, la contribución principal a tpp se debe a la onda esférica
(que contiene el factor 1/r). Esta onda representa el conjunto de las ondas parciales
con diferentes valores de l, ondas cuyas amplitudes son las correspondientes amplitudes de dispersión. Para determinar el cuadrado l"Pp(a)l 2 basta, sin embargo,
limitarse tan sólo a la ondas, ya que para energías pequeñas las amplitudes de dispersión con l -=/=- O son a su vez relativamente pequeñas. De acuerdo con la fórmula
( 131.6), tenemos. por lo tanto:
1
eikr
ipp---x+ik r '
(143.2)
donde x = t(2mlil)//i y e es la energía del estado ligado (o virtual) del sistema constituido por los dos nucleones (2). Substituyendo esta expresión en ( 143.1 ), obtenemos:
d3p
dwp = constante x - - - .
E+l€1
(143.3)
Por consiguiente, la distribución del impulso en las diferentes direcciones (en el
sistema del centro de masas de los dos nucleones) es isótropa. En cambio, la distribución del movimiento relativo en energías viene dada por la fórmula
y'EdE
<lWE
= constante X - - - .
E+l€1
(143.4)
Vemos así que la interacción de los nucleones conduce a que aparezca un máximo
de la distribución en el dominio de pequeños valores de E (para E"" kl) (3).
A los valores pequeños del impulso relativo (p ~ p 0 ) corresponden en el sistema
del laboratorio ángulos 8 pequeños entre los impulsos de ambos nucleones. Por
consiguiente, a la existencia de un máximo en la distribución respecto de E corresponde en el sistema del laboratorio una correlación angular entre las direcciones
(1) El que este procedimiento sea admisible está ligado con el hecho de que, en la región r ~ l/k,
se puede prescindir de la energía E en la ecuación de ScHRODINGER que determina a la función 11'1>: Por
ello la dependencia de la función 1PP respecto de E en dicha región viene determinada completamente
por su «empalme» con la función en el dominio r ,_, 1/k.
(2) Nos referimos aquí al par np con spins paralelos o antiparalelos o al par nn con spins antiparalelos.
En el caso del par pp, la situación se complica debido a la repulsión coulombiana; este caso debe considerarse basándose en la teoría expuesta en el § 136.
3
( )
Rigurosamente hablando, de E pueden depender también (a través de las restantes partes de la
función de onda de todo el sistema de productos de reacción) los coeficientes constantes en las fórmulas
(143.3-4). Esta dependencia, sin embargo, es débil - como función de E, este coeficiente cambia de manera apreciable tan sólo en el intervalo de energías (,_, E0) del que puede disponer, en la reacción dada,
el par de nucleones. Por ello, para la distribución en la región E~ E 11 , se puede prescindir de esta dependencia frente a la fuerte dependencia caracterizada por la fórmula (143.4).
652
Teoría de las colisiones inelásticas
de emisión de los nucleones que se traduce en un aumento de la probabilidad de los
valores pequeños de O.
Sean p 1 y p2 los impulsos de los nucleones en el sistema del laboratorio. Entonces
Po= P1 +p2, P = i(p2-p1)
(recordemos que la masa reducida de dos partículas idénticas es m/2). Multiplicando
vectorial mente estas dos igualdades, obtenemos Po X p = p 1 X p2 ; para p ~ Po se
sigue de aquí:
PoPJ_ =
PiP2sen8 ~ !Po28,
o () = 4p_!p0 , donde p_._ es la componente transversal (respecto de la dirección de
p0) del vector p, y () es el pequeño ángulo formado por las direcciones de p 1 y p 2 •
Escribiendo la fórmula (143.3) en la forma
e integrando respecto de dp¡¡, hallamos la distribución de probabilidades para el
ángulo O. Teniendo en cuenta la rápida convergencia de la integral, la integración
se puede extender desde a cx:i y se encuentra así finalmente:
=
dwo = constante x
8d8
.
v'(8 2 + 41€1/Eo)
(143.5)
Referida al elemento de ángulo sólido do';" 2n0 dO, la distribución angular presenta
un máximo para () ,_ l'\i/ E 0 •
§ 144.
Comportamiento de las secciones eficaces cerca del umbral de reacción
Si la suma de las energías internas de los productos de reacción es mayor que la
de las partículas iniciales, la reacción posee un umbral: sólo es posible cuando la
energía cinética E de las partículas que chocan (en el sistema del centro de masas)
supera un determinado valor «umbral» E11 • Examinemos el c~rácter de la dependencia energética de la sección eficaz de reacción cerca de su umbral. Al hacerlo,
supondremos de nuevo que como resultado de la reacción se forman en total dos partículas (reacción del tipo A +B = A' +B').
Cerca del umbral, la velocidad relativa v' de las partículas que se forman es pequeña. Una tal reacción es inversa de la reacción en la que es pequeña la velocidad
de las partículas que chocan. La dependencia de su sección eficaz respecto de v'
se puede, por ello, encontrar fácilmente mediante el principio de equilibrio detallado
(141.13) y de acuerdo con la dependencia energética conocida de la reacción en la
Comportamiento de las secciones eficaces cerca del umbral de reacción
653
que v' sería la velocidad en el canal de entrada (§ 140). Encontramos así en una
amplia categoría de reacciones, para las que entre las partículas A' y B' no existe
interacción coulombiana (por ejemplo, las reacciones nucleares con formación de un
neutrón lento), que la sección eficaz de reacción es proporcional av' 2(1/v'), es decir (1)
<:Jr "'
v'.
(144.1)
De la misma manera hallamos también la dependencia de la sección eficaz respecto
de la energía de las partículas que chocan: la velocidad v', y con ella la sección
eficaz de dispersión, son proporcionales a la raíz cuadrada de la diferencia E - Eu:
crr
= Ay'(E-Eu).
(144.2)
Las amplitudes de dispersión para los diferentes canales están ligadas entre si
por las condiciones de unitariedad. Debido a esto, el hecho de que se abra un nuevo
canal conduce a la aparición de determinadas singularidades en las dependencias
energéticas de las secciones eficaces de otros procesos, entre ellos la dispersión
elástica (E. WIGNER, 1948; A. l. BAz', 1957). Para poner en claro el origen y el carácter de este fenómeno, consideremos el caso más simple, aquél en que por debajo
del umbral de reacción es sólo posible la reacción elástica.
Cerca del umbral, las partículas A' y B' se forman en estados con momentos
cinéticos orbitales l = O (a esta situación precisamente corresponde la ley (144.2)).
Si las partículas que toman parte en la reacción carecen de spin, el momento orbital
se conserva, y por ello el sistema de partículas A+ B se encuentra también en un
estado s. Según (139.7), la sección eficaz parcial de reacción para l = O está ligada
con el elemento de matriz S correspondiente a la dispersión elástica por la fórmula
7T
cr,(O> = -(1!Sol 2),
k2
(144.3)
donde k es el número de onda de las partículas que chocan. Igualando (144.2) y
(144.3), encontramos que por encima del umbral de reacción, pero cerca de él, el
módulo JS0 \ es igual, salvo cantidades del orden de l(E - Eu) a:
kt2
!Sol= 1 ---Ay'(E-Eu)
2TT
(E> Eu),
(144.4)
donde k u =v(2mEu)/li (m es la masa reducida de las partículas A y B). En la región
por debajo del umbral se tiene tan sólo la dispersión elástica, de modo que
!Sol = 1
(E< Eu)·
(144.5)
1
( )
La constancia del límite a que tiende la amplitud !ab para Pb~ O, constancia que se hizo notar
al final del§ 141, corresponde precisamente a este resultado - la sección eficaz .(141.4) es proporcional
a Pb·
654
Teoría de las colisiones inelásticas
Pero la amplitud de dispersión, y con ella también S0 , deben ser funciones analíticas en todo el dominio de variación de la energía. Una tal función, que toma
los valores (144.4) y (144.5) por encima y por debajo del umbral, viene dada con la
misma precisión por la fórmula:
k~Ay'(E-Eu)] ,
So= e2i8o [ 1- Z1r
(144.6)
donde ó0 es una constante (para E < Eu, la raíz J/ti' - EU) pasa a ser imaginaria
y el módulo de la expresión entre paréntesis difiere de la unidad tan sólo en una
pequeña cantidad de orden superior).
En cambio, para todos los valores /
que
*
O, no existe dispersión inelástica, de forma
(144.7)
donde, en el dominio próximo al umbral, las fases dz deben tomarse iguales a su
valor para E = Eu (1).
Substituyendo los valores obtenidos S 1 en la fórmula (139.2), se encuentra la
siguiente expresión para la amplitud de dispersión cerca del umbral de reacción:
kt
/(8,E) = fu(8)- 4-TTi Ay(E-E,¡)e2ito,
(144.8)
donde fu(O) es la amplitud de dispersión para E= Eu, Representando esta última
en la forma fu = l!uleioc(6>, obtenemos finalmente la sección eficaz de dispersión
diferencial :
doku
sen(2So-:x.) (E > Eu)
2
-d = lfi,(8)l - -A/fe(8)lv(IE-E~,I)
(Z(;'
) (''' E'
2
o
1r
cos oo-lJ.
r., <
uJ
(144.9)
Según que el ángulo 2<50 - oc se encuentre en el 1º, 2º, 3º ó 4º cuadrante, la dependencia energética de la sección eficaz dada por esta fórmula tiene la forma representada en la fig. 49 a, h, e o d. En todos los casos tenemos dos ramas situadas a uno
y otro lado de una tangente vertical común.
La existencia de un umbral de reacción conduce así a la aparición de una singularidad característica en la dependencia energética de la sección eficaz de dispersión elástica. El hecho de que las partículas posean spin modifica, naturalmente, las
1
( )
Dado que las funciones '5i(E) son reales tanto para E > Eu como para E < Eu, dichas funciones
se desarrollan en potencias enteras de la diferencia E - Eu.
Comportamiento de las secciones eficaces cerca del umbral de reacción
655
fórmulas cuantitativas, pero el carácter general del fenómeno sigue siendo el mismo.
Si por debajo del umbral son también posibles, junto a la dispersión elástica, otras
reacciones, singularidades análogas se manifiestan en sus correspondientes secciones
eficaces. Todas elJas presentan una singularidad para E= Eu, cerca de la cual son
funciones lineales de la raíz l('IE - EuD con diferentes pendientes por encima y por
debajo del umbral.
Las reacciones nucleares de las que resulta una partícula cargada positivamente
plantean el caso en que entre los productos de reacción (las partículas A' y B')
actúan fuerzas de repulsión coulombiana. La sección eficaz de reacción, para v' ~ O
(es decir, para E--+ Eu), tiende entonces exponencialmente a cero a la vez que todas
sus derivadas respecto de la energía y no aparece singularidad alguna en las secciones
eficaces de los demás procesos.
dcrlt
dcrlL
~1
To""
1
Á\
1
E
(a)
E
(b)
(d)
FIG. 49
Finalménte, consideremos las reacciones con formación de dos partículas lentas
de cargas distintas, entre las que actúan fuerzas de atracción coulombiana. La sec-
656
Teoría de las colisiones inelásticas
ción eficaz de una tal reacción está ligada por el principio de equilibrio detallado
con la sección eficaz (140.7) de la reacción inversa entre dos partículas lentas que
se atraen. De esta manera encontramos que, cuando v' ~ O, la sección eficaz tiende
a un límite constante
ar= constante para v' -+0,
(144.10)
es decir, al atravesar el umbral, la reacción se produce súbitamente con sección
eficaz no nula.
Veamos cuál es el carácter de la singularidad que presenta cerca del umbral de
dicha reacción la sección efiéaz de dispersión elástica (A. l. BAz', 1959). Para ello
no cabe, sin embargo, acudir a la ley ya conocida (144.10) que vale por debajo
del umbral y aplicar el procedimiento simple que utilizamos antes en el caso de
partículas no cargadas. Comparada con este último caso, la situación se complica
ahora debido a que el sistema de partículas A' +B' posee, en el dominio del umbra]
(para E < Eu), estados ligados que corresponden a niveles discretos de la energía
en el campo de Coulomb atractivo. Estos estados pueden formarse, desde el punto
de vista energético, en la colisión de las partículas A y B, pero teniendo en cuenta
la posibilidad de dispersión elástica, serán tan sólo cuasiestacionarios. Sin embargo,
su existencia debe conducir a la aparición de efectos de resonancia en la dispersión
elástica (por debajo del umbral) análogos a las resonancias del tipo Breit-Wigner.
Para resolver el problema planteado, consideremos la estructura de las funciones
de onda que describen el proceso de colisión. Debido a la existencia de dos canales,
la ecuación de ScHRODINGER del sistema de partículas en interacción posee dos
soluciones independientes, finitas en todo el espacio de configuraciones; designemos por 'f/Ji y 1J)2 dos de tales soluciones arbitrariamente elegidas (y arbitrariamente
normalizadas). A partir de estas funciones se pueden formar combinaciones lineales
que describen la dispersión cuando uno u otro de los canales es el de entrada. Designemos los canales que corresponden a los pares de partículas A, B y A', B' por
a y by supongamos que la suma 1P = rx1 1jJ1 +oc 2 'f/J2 corresponde al canal de entrada a;
dicha suma describe la dispersión elástica de las partículas A y B y la reacción
A+B ~ A' +B'. Cerca del umbral de reacción, los coeficientes exi, rx 2 dependen esencialmente del pequeño impulso kb mientras que las funciones arbitrariamente elegidas 'f/Ji, 1J)2 no poseen ninguna singularidad para k b = O.
A grandes distancias, la función 1P debe representar la suma de dos términos
que corresponden al movimiento de los pares de partículas en los canales a y b.
Cada uno de ellos es el producto de funciones « internas » de las partículas por la
función de onda de su movimiento relativo (1). En el canal a, esta última tiene la
(1) La ley (144.10) se cumple no solamente para la sección eficaz total, sino también para las secciones
eficaces parciales con diferentes valores del momento cinético l (cf. la nota de la pág. 633). Por ello, también
la singularidad que se considera más adelante se presenta en todas las secciones eficaces parciales de dispersión. Su carácter queda por completo de manifiesto ya en el caso l = O, que es precisamente el que
consideramos a continuación. Para simplificar la notación prescindimos del índice O en las correspondientes amplitudes parciales.
Comportamiento de las secciones eficaces cerca del umbral de reacción
657
forma Ra- - SaaRa +, y en el canal b, - SabRb +, donde. R+, R- son ondas divergentes y convergentes en los respectivos canales. A distancias rO grandes comparadas
con el radio de las fuerzas de corto alcance y pequeñas respecto de 1/kb, estas funciones (y sus derivadas) deben «empalmarse» con los valores calculados mediante
la función de onda 1fJ en la « zona de reacción». Estas condiciones se expresan por
igualdades de la forma:
+ ix2a2 =
[Ra- - SaaRa+]r0 ,
ix1b1
+ ix2a2' =
[Ra-- - SaaRa+]'r0 ,
ix1b1'
ix1a1
ix1ai'
+ ix2b2 =
[-Sao-Rb+]r0 ,
+ ix2b2' = [ -
Sao-Rb+]'r0 ,
donde a 1, a¡', b1, b1 ', .. • son cantidades caiculadas a partir de las funciones '!/Ji y 1fJ2 ;
de acuerdo con lo antes dicho, cerca del umbral se pueden considerar constantes
independientes de k b· Dividiendo miembro a miembro el primero y el segundo
par dé igualdades, obtenemos un sistema de dos ecuaciones lineales -para las dos
incógnitas (a.1/r:1. 2 y Saa), figurando en los coeficientes de estas ecuaciones tan sólo una
cantidad que depende «críticamente» de kb - la derivada logarítmica de la onda
divergente en el canal b; definamos esta cantidad por
No hay necesidad de resolver efectivamente estas ecuaciones. Basta observar que
la cantidad que nos interesa, Saa (que determina la amplitud de dispersión elástica),
resulta con ello ser función racional lineal de}•. Por debajo del umbral, la cantidad Á.
es real, puesto que la función de onda Rb + es real, en tanto que solución de una
ecuación real de ScHRODINGER con condición de contorno real en el infinito (la
de disminución como e-,<br, donde ub =l/L2mb(Eu - E)] ñ). Al mismo tiempo, por
debajo del umbral debe ser !Saal = l. De áquí se sigue que la función lineal racional
SaaCA) debe tener la forma:
(144.11)
donde
r/0 )
es una constante real y f3 una constante compleja.
Determinemos la cantidad Á. como función del impulso kh. Dado que entre las
partículas A y B actúan fuerzas de atracción coulombiana,. rRb + · coincide con la
función de onda de Coulomb que en el infinito es asintóticamente proporcional a
eikbr. En un campo coulombiano repulsivo, esta función viene dada por la suma
L + iK, con K y L definidas por (136.4) y (136.7). El paso a un campo de atracción
se efectúa cambiando simultáneamente los signos de k y r (1). Realizando este carne) En lo que sigue utilizamos unidades coulombianas. El cambio de los signos de k y r se lleva a cabo
formalmente cambiando de signo la unidad coulombiana de longitud.
658
Teorí~ de las colisiones inelásticas
bio y calculando la derivada logarítmica (véase § 136), obtenemos:
(144.12)
Aquí kb se supone real, ya que esta fórmula se refiere al dominio por encima def
umbral. Para kb -+O, el primer término de (144.12) se reduce a i y el segundo tiende
a cero (véase la nota de la pág. 608). De esta manera, por encima del umbral tenemos:
(144.13)
El paso a la región por debajo del umbral se efectúa substituyendo k por be. Con
esto obtenemos, a partir de (144.12) y para x ~ O (1):
A= - ctg(1r/Kb) (E< Eu)•
(144.14)
Las fórmulas obtenidas resuelven la cuestión planteada. La sección eficaz de
dispersión elástica es
<:Je= 1rka-2 ISaa-11 2•
Por encima del umbral tenemos:
1 +i,8
Saa =
e2i11<0)
(144.15)
(E> Eu);
l+i~
al igual que la sección eficaz de reacción, la sección eficaz de dispersión resulta constante en este dominio. Obsérvese que la condición ISaal < 1 significa que debe
tenerse fJ" > O, donde fJ" es la parte imaginaria de fJ(fJ = fJ' +ifJ").
Por debajo del umbral encontramos:
- 2i«J(O) ,8- tg (1r/Kb)
S aa- e
~- tg (1r/Kb)
0
>[1
2i,8"
J
(144.16)
tg .(1r/Kb)-,8' +i,8"
.Esta expresión posee un número infinito de resonancias que se acumulan hacia el
punto E = Eu. Las energías de resonancia son los ceros de la expresión tg(n/x6) - fJ';
estos ceros se encuentran ligeramente desplazados respecto de los niveles puramente
coulombianos (ceros de tg(n/xb)) debido a la existencia de las fuerzas de corto al= e2i8<
(1) El primer término en (144.12) da -!ctg(n/xb)+il y la expresión que aparece entre corc-hetes
.1l
:rr.
se reduce a
2 ctg(.1t/Xb) + i 2 . Hemos utilizado la fórmula tp(x)-tp(-x) = -nctgnx- 1/x (que ~e
puede obtener, derivando lo.garítmicamente la conocida relación I'(x)I'(- x) = - n/x sen nx) y la
expresión límite tp(x) ~.In x - l/2x para x~ CX).
Colisiones inelásticas de electrones rápidos con átomos
659
canee. Cerca de cada resonancia el desarrollo del denominador de (144.16) conduce
a una expresión que corresponde exactamente a la fórmula de BREIT-WIGNER (132.11).
La anchura de la región subumbral en la que se manifiesta la estructura de resonancia
se determina por el valór de la energía del primer nivel coulombiano.
Mencionaremos todavía, para terminar, un caso interesante de reacciones en
torno de un umbral - la ionización de un átomo por un electrón cuya energía
supera tan sólo ligeramente la energía del primer nivel de ionización del átomo.
En estas condiciones, el proceso de colisión puede considerarse como cuasiclásico,
pero el problema se complica considerablemente debido a la existencia de tres partículas cargadas en el estado final. La solución general de este difícil problema ha
sido dado por G. WANNIER (1). La probabilidad de ionización del átomo neutro
resulta proporcional a
(E-1)''-,
1(J3-1
91 )= 1·125,
(X=¡
donde E - I es el exceso de energía del electrón por encima del umbral de ionización.
§ 145.
Colisiones inelásticas de electrones rápidos con átomos
Las colisiones inelásticas de electrones rápidos con átomos se pueden estudiar
mediante la aproximación de Born de manera análoga a como se hizo en el § 137
para las colisiones elásticas (2). La condición de aplicabilidad de dicha aproximación
exige, como antes, que la velocidad del electrón incidente· sea grande comparada
con las velocidades de los electrones atómicos. En lo que concierne a la pérdida de
energía en la colisión, esta pérdida puede ser cualquiera. Si el electrón pierde una
parte considerable de su energía, ello conduce a la ionización del átomo, cediéndose
Ja energía a uno de sus electrones. Pero podemos siempre considerar que, de los dos,
el electrón dispersado es el que tiene mayor velocidad después del choque, con lo
cual, cuando la velocidad del electrón incidente es grande, será ~ambién grande
la velocidad del electrón dispersado.
En las colisiones de un electrón con un átomo, el sistema de coordenadas en el
que se encuentra en reposo el centro de masas se puede considerar que coincide,
conforme se indicó ya (véase pág. 613), con el sistema en el que el átomo se encuentra
en reposo; en lo que sigue nos referimos precisamente a este último sistema.
1
( )
(2)
BETHF
Véase G. H.
WANNIER,
Phys. Rev., 90, 817, 1953.
La mayor parte de los resultados que se exponen en los§§ 145-147 fueron obtenidos por H. A.
(1930).
Teoría de las colisiones inelásticas
660
Una colisión inelástica va acompañada de una variación del estado interno del
átomo. El átomo puede pasar del estado normal a un estado excitado del espectro
discreto o del espectro continuo; en este último caso, ello significa la ionización del
átomo.
Al deducir las fórmulas generales, estos dos casos se pueden considerar a la vez.
Partamos (como en el § 125) de la fórmula general que da la probabilidad de
transición entre estados del espectro continuo, aplicándola al sistema constituido
por el electrón incidente y el átomo. Sean p, p' los impulsos del electrón incidente
y E 0, En las energías del átomo, respectivamente, antes y después del choque. Para
la probabilidad de transición, en vez de (125.9) tenemos la expresión
dwn =
21T
li
¡UEoP
12 0
EnP' 1
(p'2-p2
)
- - .-+En-Eo dp':edp'ydp'z,
2m
(145.1)
donde uf;~:, es el elemento de matriz de la energía de interacción del electrón incidente con el átomo
z
U = Ze 2 /r- ~ e2/lr-ral;
a=l
(r es el vector posición del electrón incidente, ra los vectores posición de los electrones
atómicos, habiendo elegido como origen de coordenadas el núcleo del átomo, y m
es la masa del electrón).
Las funciones de onda 1JJ1., 1/Jp' del electrón vienen determinadas por las fórmulas
anteriores (125.10-1 I); dw es entonces la sección eficaz de colisión da. Designaremos
las funciones de onda del átomo en los estados inicial y final por "Po, %· Si eJ estado
final del átomo corresponde al espectro discreto, 1Pn (como también "Po) está normalizada a la unidad como de ordinario. Pero si el átomo pasa a un estado del espectro
continuo, la función de onda se normaliza respecto de la función - ó de los parámetros,, que determinan estos estados (estos parámetros pueden ser, por ejemplo, la energía de) átomo o las componentes del impulso del electrón que escapa del átomo en la
ionización). Las secciones eficaces que en definitiva se obtienen determinan la probabilidad de la colisión acompañada de la transición del átomo a un estado del
espectro continuo que pertenece al intervalo de valores de los parámetros comprendidos entre v y v+dv.
La integración de {145.1) respecto del módulo p' nos da:
21Tfflp'
dan= --IUOp l2 do',
li
np'
Colisiones inelásticas de electrones rápidos con átomos
661
donde p' se determina a partir de la ley de conservación de la energía:
(P 2 -P'2 )/2m = En-Eo.
(145.2)
Substituyendo en el elemento de matriz U~, las funciones de onda del electrón
dadas por (125.10-1 I ), obtenemos:
dan = -m2
- -p' 1
47T2/i4 p
ff Ue-tq.rtpn*tpo drdVI2do,
(145.3)
( dr = d V1 d V2 ••• d V z es el elemento del espacio de configuraciones de los Z electrones del átomo, y se ha prescindido del apóstrofo er1 do).
En esta forma, es ésta una fórmula general de la teoría de perturbaciones, aplicable no solamente a la colisión de los electrones con un átomo, sino a colisiones
inelásticas cualesquiera de dos partículas, que determina la sección eficaz de dispersión en el sistema de coordenadas en el que se encuentra en reposo el centro de masas
de aquéllas (m es entonces la masa reducida de ambas partículas).
Para n = O y p = p', ( 145.3) se convierte en la fórmula que da la sección eficaz
de dispersión elástica.
En virtud de la ortogonalidad de las funciones 1Pn y ip0 , el término en V que contiene la interacción Ze 21 r con el núcleo desaparece al integrar respecto de dr, y
tenemos así para las colisiones inelásticas:
dan = -m2- p'
- ~1
477"2/i4 p ~
a
f f ---e-tq
e2
· rtfan*tpo drd V 12 do.
lr-ral
(145.4)
La integración respecto de V se efectúa de manera análoga a como se procedió
en el 137. La integral
*
coincide formalmente con la componente de Fourier del potencial creado en el
punto r por las cargas distribuidas en el espacio con densidad
p = S(r-ra).
Por ello, según la fórmula (137.1), se encuentra:
cpq(ra) = {47T/q2)e-tq.ra.
(145.5)
Substituyendo esta expresión en (145.4), llegamos finalmente a la siguiente expresión
general para la sección eficaz de colisión inelástica:
662
Teoría de las colisiones inelásticas
(145.6)
(en vez de los impulsos p, p' hemos introducido los vectores de onda k = p/1;,,
k' = p' /li). Esta fórmula determina la probabilidad de la colisión en la que el electrón es dispersado en el elemento de ángulo sólido do y el átomo pasa al n-ésimo
estado excitado. El vector /iq representa el impulso cedido por el electrón al átomo
en la colisión.
En los cálculos suele resultar más cómodo referir la sección eficaz no al elemento
de ángulo sólido, sino al elemento dq de valores absolutos del vector q. El vector q
se define por q = k' - k; para su valor absoluto tenemos:
q2 = k2+k'2-2kk' cos.&.
(145.7)
De aquí se sigue, para valores dados k, k', es decir, para una pérdida dada de energía
del electrón, que:
qdq = kk' sen ,& d.& = ( kk' /2TT) do.
(145.8)
La fórmula (145.6) puede, por consiguiente, escribirse en la forma:
(145.9)
El vector q representa un importante papel en todos los cálculos que siguen.
Examinemos con mayor detenimiento la relación que lo liga al ángulo de dispersión & y a la energía En - E 0 cedida en el choque. Veremos más adelante que las
colisiones que determinan la dispersión para ángulos pequeños {& ~ 1) con una
cesión de energía que es pequeña comparada con la energía E= mv 2/2 del electrón
incidente, En - E 0 ~ E, son las que representan el papel principal. La diferencia
k - k' es entonces también pequeña (k - k' ~ k) y, por lo tanto,
En-Eo = Ji2(k2-k'2)/2m
Dado que
&
~
ñ,2k(k-k')/m = liv(k-k').
es pequeño, en virtud de (145.7) tenemos:
q2
rv
(k-k'}2+(k,&)2,
y, finalmente,
q = V[{(En-Eo)/liv}2+(k.&)2].
(145.10)
qmin = (En-Eo)/liv.
(145.11)
El valor mínimo de q es
Para ángulos pequeños, cabe todavía distinguir diferentes casos según sea el
valor de la razón entre las pequeñas cantidades & y v0 /v (v 0 es del orden de magnitud
663
Colisiones inclásticas de electrones rápidos con átomos
de la velocidad de los electrones atómicos). Si se consideran cesiones de energía
del orden de la energía éo de los electrones atómicos (En- Eo
EO
mv~), para
(vo/v)2 <( & <( 1 se tiene:
l'tJ
q = k& = (mv/ñ)&;
l'tJ
(145.12)
(el primer término del radicando en (145.10) se puede suprimir frente aJ segundo);
por consiguiente, en este dominio angular, q no depende del valor de la energía
cedida. Para -& ~ 1, el valor de q puede ser lo mismo grande que pequeño comparado con 1/a0 (donde a 0 es el orden de magnitud de las dimensiones atómicas),
Manteniendo la misma hipótesis acerca de la magnitud de la energía cedida, tenemos:
qao
l'tJ
1para& -
v0 /v.
(145.13)
Volvamos ahora al estudio de la fórmula general (145.9) y consideremos el caso
en que los valores de q son pequeños (qa 0 ~ 1, es decir, -& ~ v0/v).
En este caso se pueden desarrollar los factores exponenciales en series de potencias de q:
(hemos elegido el eje x en el sentido del vector q). Substituyendo este desarrollo
en (145.9), los términos que contienen el término 1 dan el valor cero en virtud de la
ortogonalidad de las funciones de onda "Po y 1/-'m con lo que obtenemos
2e)
(
2
2 do
e ) 2 dq
dcrn = 81r ( --l(dx)onl 2 = l(dx)onl -,
ñv q
ñv
.s,2
(145.14)
donde dx = e~xª es la componente-X del momento dipolar del átomo. Vemos así
que la sección eficaz (para valores q pequeños) viene determinada por el cuadrado
del módulo del elemento de matriz del momento dipolar para la transición que
corresponde al cambio del estado del átomo (1).
Sin embargo, puede ocurrir que el elemento de matriz del momento dipolar
para la transición dada se anule idénticamente en virtud de las reglas de selección
(transición prohibida). Entonces hay que prolongar el desarrollo de e-i•i.ra hasta
el término siguiente, y obtenemos así:
e2)2
dcrn = 21r ( -
ñv
I(~ Xa2)onl2q dq.
a
(145.15)
(') Con frecuencia interesa, desde el punto de vista físico, la sección eficaz dan sumada para. tod~s las
direcciones del momento cinético del átomo en el estado fl-nal y promediada respecto de las d1recc1ones
del momento cinético en el estado inicial. Una vez efectuados la suma y el promedio, el cuadrado l(dx)onl 2
no depende ya de la dirección del eie x.
664
Teoría de las colisiones inelásticas
Consideremos ahora el caso límite opuesto, el de grandes valores de q(qa 0 ~ 1).
Que los valores de q sean grandes significa que al átomo se le cede un impulso grande
comparado con el impulso propio inicial de los electrones atómicos. Es físicamente
evidente que, en este caso, se pueden considerar los electrones atómicos como electrones libres, y el choque con el átomo, como choque elástico del electrón incidente
con los electrones atómicos inicialmente en reposo. Esto resulta también claramente
de la fórmula general (145.9). Para grandes valores q, el integrando contiene el
factor rápidamente oscilante e-i•t·ra y la integral no es prácticamente cero tan sólo
si 1Pn contiene este mismo factor. Una tal función 1Pn corresponde al átomo ionizado
con un electrón que escapa de él con un impulso - ltq = p - p', es decir, con
un impulso que viene determinado simplemente por la ley de conservación del
impulso, como ocurriría en la colisión de dos electrones libres.
Cuando el impulso cedido en la colisión es grande, ambos electrones (el incidente
y el atómico) pueden adquirir, como resultado de ella, velocidades que son compara-
bles en magnitud. Cobran entonces importancia los efectos de intercambio que no
se han tenido en cuenta en la fórmula general (145.9), efectos debidos a la identidad
de las partículas que chocan. La sección eficaz de dispersión de electrones rápidos,
teniendo en cuenta el intercambio, viene determinada por la fórmula ( 135.9); esta
fórmula está referida al sistema de coordenadas en el que uno de los electrones se
encontraba en reposo antes del choque. Para electrones rápidos, el coseno que aparece
en el último término de (135.9) se puede substituir por la unidad. Multiplicando
también por el número Z de electrones del átomo, obtenemos la sección eficaz de
colisión del electrón con el átomo en la forma:
1
1
( e2 )2,~--+
da = 4Z -
mv2
en4&
1
]
cos4& sen2& cos2&
cos & do.
(145.16)
En esta fórmula conviene expresar el ángulo de dispersión en función de la energía cedida a los electrones después del choque. Como es sabido, en la colisión de
una partícula de energía E= mv2/2 con una partícula en reposo de igual masa,
la energía de las partículas después del choque es igual a:
E:=
Esen2&,
E-E: = E cos2&.
Para obtener la secc10n eficaz correspondiente al intervalo ds, expresaremos do
en función de ds de acuerdo con la relación cos .& do = 2n cos .& sen &d& = (n/ E) ds.
La substitución en (145.16) conduce a la fórmula final
(145.17)
Si una de las energías e o E - e es pequeña comparada con la otra, de los tres términos que aparecen en esta fórmula cuenta sólo uno (el primero o el segundo).
665
Colisiones inelásticas de electrones -rápidos con átomos
Esto concuerda con el hecho de que, para una gran diferencia en las energías de los
dos electrones, el efecto de intercambio deja de tener importancia y hemos de volver a la fórmula ordinaria de Rutherford (1).
La integración de la sección eficaz diferencial respecto del ángulo (o lo que es
lo mismo, respecto de q) da la sección eficaz total <1n de colisión acompañada de
excitación del estado dado del átomo. La manera cómo <Jn depende de la velocidad
del electrón incidente está íntimamente ligada con el hecho de que sea o no diferente
de cero el elemento de matriz del momento dipolar del átomo para la correspondiente transición. Supongamos primero que este elemento de matriz es diferente
de cero. Entonces, para valores q pequeños, d<111 viene determinada por la fórmula
(145.14) y vemos así que, al disminuir q, la integral respecto-de q diverge logaritmicamente. En cambio, en la región de grandes valores oe q, la sección eficaz (para
una cesión de energía dada En - E 0 ) disminuye exponencialmente al aumentar
q debido a la existencia, ya señalada, de un factor rápidamente oscilante en el integrando de la expresión (145.9). De esta manera, el papel fundamental en la integral
respecto de q lo representa el dominio de valores q pequeños y cabe limitarnos a la
integración desde el valor mínimo qmín (145.11) hasta un cierto valor,..._, 1/a0• Como
resultado obtenemos
O'n = 81r(e/ñv)2 l(dx)on\ 2 Iog(finvli/e2 ),
(145.18)
donde fln es una constante sin dimensiones que no se puede calcular en su forma
general (2).
En cambio, si el elemento de matriz del momento dipolar se anula para la transición dada, la integral respecto de q converge rápidamente, tanto para valores
pequeños de q (como se ve teniendo en c:uenta (145.15)), como para valores grandes.
En este caso, el intervalo que más cuenta para la integral es aquél en que q ,..._, 1/a0 •
No se puede obtener aquí una fórmula cuantitativa general y tan sólo cabe concluir
que <1n será inversamente proporcional al cuadrado de la velocidad:
(145.19)
O'-n = constante/v2.
Esto se sigue directamente de la fórmula general (145.9), según la cual
porcional a v-2 para q ,..._, 1/a0 •
d<1n
es pro-
( 1)
Para la colisión de un positón con un átomo, no existe el efecto de intercambio y la fórmula de
Rutherford
vale para todo q ~ 1/ap.
(2) Suponemos que En - E 0 es del mismo orden ~ue la energía de los electrones atómicos Eo._CuaI_1do
la energía cedida es grande (En - E 0 ,__,E~ eo), las formulas (145.l~), (145.l~ son e~ todo. caso_ m_aphcables, ya que el elemento de matriz del elemento dipolar pasa a ser muy pequeno Y es 1mpos1ble hm1tarnos
al primer término del desarrollo respecto de q.
Teoría de las colisiones inelásticas
Determinemos la sección eficaz da¡ 11 de dispersión inelástica en un elemento dado
de ángulo sólido prescindiendo de cual sea el estado a que pasa el átomo. Para ello
hay que sumar la expresión (145.9) respecto de todos los n =f= O, es decir, respecto
de todos los estados (tanto del espectro discreto, como del espectro continuo) excepto el normal. No se considerará ni la región en que los ángulos son grandes ni
aquélla en la que son muy pequeños y supondremos l ~ .ft ~ (v0/v) 2 • Entonces, de
acuerdo con ( 145.12), q no depende del valor de la energía transferida (1).
Esta última circunstancia permite calcular fácilmente la sección eficaz total
de colisión inelástica, es decir, la suma
do-1n =
e2 )2
= 811 (-
L dan
n:;tO
2e2
= (mv2
liv
)2
dq
L !(Le-'q.ra)on\2.....:
n:¡t:O
tf
a
do
'
L.,
1( I:a e-íq.ra)onj2-.
,&4
(145.20)
n:¡i!:O
Observemos para ello que, cualquiera que sea la magnitud f y de acuerdo con la
regla de multiplicación de matrices, se tiene:
l:: l/onl 2
n
=
Lfon/on*
n
= Lfon(J+)no
n
(Jf+)oo,
La suma se extiende aquí a todos los valores n, incluido n
L
n:;t=O
l/0nl 2
= L
Aplicando esta relación a f
n
l/0nl2 -l/ool 2
:Ee-ic1,ra,
=
=
O. Por lo tanto
(//+)oo-!/001 2•
(145.21)
obtenemos
(145.22)
donde el trazo designa el promedio respecto del estado normal del átomo (es decir,
significa que se toma el elemento de matriz diagonal 00). El valor medio ( :Ee-iq.r")
es, por definición, el factor de forma atómico F(q) en el estado normal. En el primer
término entre paréntesis, en cambio-, podernos escribir:
Encontramos así la fórmula general
.(1) La suma en (145.9) se extiende también a los estados con En - Eo ~ e0 , para los cuales no vale
(145.12). Sin embargo, para las transiciones con gran transferencia de energla, la sección eficaz es relativamente pequeña y estos términos representan en la suma un papel del todo secundario. La condición O
l
permite no tener en cuenta los efectos de intercambio.
<
Coli.<,iones inelá.dica.,; ,le electrones rápitlos con átomos
667
(145.23)
Esta fórmula se simplifica mucho en el caso en que los valores de q son pequeños,
de modo que es posible desarrollar en serie de potencias de q (v0 /v ~ qa 0 ~ 1, lo
que corresponde a ángulos (v0 1v)2 ~ & ~ v 0,1v). En vez de efectuar el desarrollo en la
fórmula ( 145.23), conviene más calcular de nuevo la suma respecto de 11 utilizando
para da 11 la expresión (145.14). Sumando mediante la relación (145.21) con f = d.r
y recordando que dx = O, obtenemos:
(145.24)
Es interesante comparar esta expresión con la sección eficaz ( 137.5) de dispersión
elástica para ángulos pequeños; mientras que esta última no depende de n-, la sección eficaz de dispersión inelástica en el elemento de ángulo sólido do crece al disminuir & como I n-2 •
Para ángulos I ~ f)- ~ v 0 v (de modo que qa 0 ~ I ), los términos segundo y tercero entre corchetes en ( 145.23) son pequeños, y se tiene simplemente
(145.25)
Como debía ser, hemos obtenido así la dispersión de Rutherford por Z electrones
atómicos (sin tener en cuenta el intercambio). Recordemos que la sección eficaz
diferencial de dispersión elástica ( 137.6) es proporcional a Z 2 , y no a Z.
Finalmente, integrando respecto del ángulo sólido obtenemos la sección eficaz
total <r; 11 de dispersión inelástica para cualquier ángulo de dispersión y para todos
los estados excitados del átomo. De manera exactamente igual a como se calculó
<r 11 (145.18), obtenemos:
Gin
=
81T(e/nv)%:2 Iog(f3vli/e2).
(145.26)
PROBLEMAS ( 1)
1. Determinar la distribución angular (cuando 1 ~ f)- ~ v-~) de la dispersión inelástica de
electrones rápidos por un átomo de hidrógeno (en el estado normal).
S0/11ci1í11. Para un átomo de hidrógeno no existe el tercer término entre corchetes de (145.23)
y el factor de forma F(q) se calculó en el problema del I 37. Substituyéndolo, obtenemos:
*
') Determinar la sección eficaz diferencial para las colisiones de electrones con un átomo de
hidrógeno en el estado normal acompañadas de la excitación del 11-ésimo ni\'el del espectro discreto
(')
En todos los rroblernas u1ili7arnos unidadi:s a!ómicas.
668
Teoría de las colisiones inelásticas
(n es el número cuántico principal).
Solución. El cálculo de los elementos de matriz se efectúa con facilidad en coordenadas parabólicas. Elijamos el eje z en la dirección del vector q, con lo que
e-iq.r
= e-tqz = e-Hq<E-11>.
La función de onda del estado normal tiene la forma
Los elementos de matriz son diferentes de cero tan sólo para las transiciones a estados con m
Las funciones de onda de estos estados son
(n
=
O.
= n1 +n2 + 1). Los elementos de matriz que interesan vienen dados por las integrales
ff
CX)CX)
(e-iq,r)OOO
nln.o
=
eHq<E-11lif,ooot1'n n
1
a
/+'YJ
2
4
17
d[d'Y).
oo
La integración se efectúa mediante las fórmulas dadas en el § f del apéndice matemático. Como
resultado del cálculo se obtiene:
Todos los estados con valores iguales de n1 +n2 = n -1 poseen la misma energía. Sumando respecto de todos los valores posibles de n1 - n2 para un n dado y substituyendo el resultado en (145.9),
obtenemos la sección eficaz buscada:
3. Determinar la sección eficaz total de excitación del primer estado excitado del átomo de
hidrógeno (1).
Solución.
Hay que integrar
(1) También es posible calcularla para n arbitrario. Mediante el cálculo numérico cabe también obtener la sección eficaz total de dispersión inelástica del átomo de hidrógeno:
cr¡n = 41r log(v2/0,160).
A las colisiones acompañadas de excitación de estados del espectro discreto y a las acompañadas de ionización corresponden, respectivamente,
crex = hX0,715 log(v2/0,45),
crio = 41rX0,285 log(v2/Q,012).
669
l:oli.,;ione.,; inelástica.,; <le electrones rápfrlos con átomos
respecto de todos los valores de q desde qmin = (E 2 - E 1)/v = 3/8v a qmax = 2v, conservando solamente aquellos términos que contienen la máxima ootencia de v. La integración es elemental v da:
25
z!Rrr
0-2
= -(log(4v)--].
31ov2
24
4. Determinar la sección eficaz de ionización del átomo de hidrógeno (en el estado normal)
cuando el electrón secundario se emite en determinada dirección; la energía del electrón secundario
es pequeña comparada con la energía del electrón primario, por lo que no existen efectos de intercambio (MASSEY y MOHR, 1933).
Solución. La función de onda del átomo en el estadio inicial es 1/'o = :i-· 112e-r. En el estado
final el átomo está ionizado, y el electrón secundario que ha escapado de él posee un vector de onda
que designaremos por >< (y una energía ;.//2). Este estado viene representado por la función 1/1><(134.9), en la que la parte de «salida» contiene (en el infinito) solamente una onda plana que se
propaga en la dirección de x. La función de '/J"'- está normalizada según la función ,5 del espacio-x;
en consecuencia, la sección eficaz calculada a partir de ella se referirá al elemento dxx dx 11 <lxz o al
x~ w. do%, donde do" es el elemento de ángulo sólido para la dirección del electrón secundario.
De esta manera
4k'K2
dcr
= --l(e-iq.r)
0 ¡2 <lodo dK
kq4
K
K
1
(do es el elemento de ángulo sólido para el electrón dispersado), donde
=
(e-iq.r)o
K
1
8
= [--
J
J
.t.- *e-iq.r.t.o dV =
't'
K
't'
e7T/ 2Kf(l-i/K)
23 /27r2
I
,
dV
e-iq.r-i'-<.r-ArF(i/K,1,i(Kr+x.r))-]
8,\
r
.
A=l
Efectuaremos la integración en coordenadas parabólicas con el eje z en la dirección de
ángulo </> contado a partir del plano (q, x):
;sf
%
y con el
0000211'
-1
I=[
Jexp( -Yq{f-,¡)cosy+iqV{f,¡)scnycos,f>-!A(f+,¡)-!i<(f-n)} x
ooo
(:· es el ángulo que forman x y q). La integración respecto de </> y 11 se efectúa fácilmente mediante
la substitución ¡ ,, cos </> = u,
sen</> = r, hecho lo cual se obtiene:
V,,
I
F(i/K, 1,iKfldt]
2rr
i(K + q cosy)-,\
La integral que aquí aparece se calcula aplicando la fórmula
.
;1._-1
Teoría de las colisiones inelásticas
670
f
e->ttF((X, 1, kt) dt
= ;\cx-1(,\-k)-cx;
ti
(véase § f del apéndice matemático). Los cálculos subsiguientes son largos, pero elementales, y dan
como resultado la siguiente expresión para la sección eficaz:
dcr
=
2Bk' K[q2+ 2qK cosy+(K2+ 1) cos2y]
1rkq2[q2+ 2qK cosy+ 1+ K2]4[(q+ K)2+ 1][(q-K)2+ l](l-e-2 11 /K)
X e-{2 / K) arctg [2K /(q2 -K 2+1)1 do do K <lK,
X
La integración respecto del ángulo de emisión del electrón secundario es elemental y da la distribución angular de dispersión para un valor dado de la energía ;/·/2 del electrón emitido:
Para q
~
l esta expresión presenta un máximo pronunciado para
dcr
25
= --
dKdo
31rK4 [l+(q-K)2]3
;e~ q;
cerca del máximo
.
Integrando respecto del ángulo sólido do = 2:1q dq/k 2 ,....._, (2"lx/k 2 )d(q - ;e), obtenemos la expresión
8n d%/k 2;,é\ que coincide, como debía ser, con el primer término de la fórmula (145.17).
§ 146.
Frenado eficaz
En las aplicaciones de la teoría de colisiones tiene gran importancia el cálclllo
de la pérdida media de energía de las partículas que chocan. Resulta conveniente
caracterizar esta pérdida por la cantidad
(146.1)
que llamaremos frenado eficaz (diferencial); la suma se extiende, naturalmente,
a todos los estados, tanto del espectro discreto como del continuo. d% corresponde
a la dispersión en un elemento dado de ángulo sólido (1).
La fórmula general para el frenado eficaz de electrones rápidos tiene la forma:
e2
<lK = 81r ( -
ñv
)2
~
n
dq
(En-Eo)I(~ e-tq.ra)onl2a
q3'
(146.2)
(1) Si el electrón atraviesa un gas, la dispersión por los diferentes átomos ocurre de manera independiente y la cantidad Ndx (N es el número de átomos por unidad de volumen del gas) es la energía perdida
por el electrón, por unidad de camino recorrido, en las colisiones que lo desvían hacia el elemento dado
de ángulo sólido.
671
f'renado eficaz
(d<r 11 viene dada por ( 145.9)). Excluiremos del análisis, como al deducir (145.23),
el dominio de ángulos muy pequeños y supondremos de nuevo que 1 ~ ,9- ~ (v0 /v)2;
q no depende entonces del valor de la energía transferida y la suma respecto de 11
se puede calcular en su forma general.
El cálculo se efectúa mediante un teorema de sumación que se deduce de la
siguiente manera. Los elementos de matriz de una magnitud f (función de las coordenadas) y de su derivada respecto del tiempo j están ligados entre sí por la fórmula
(146.3)
(Í)on = -(i/li)(En-Eo)fon,
Tenemos, por consiguiente,
~ (En-Eo)l/onl 2
n
=
~ (En-Eo)fonfon*
n
= ~ (En-Eo)fon(í+)no = ili L (Í)on(J+)no = iñ(/J+)oo,
n
n
Las funciones de onda de los estados estacionarios del átomo se pueden elegir
reales. Los elementos de matriz de la función de las coordenadas f están ligados
entonces por las relaciones _/;111 = f, 10 y para los elementos de matriz (146.3) tenemos,
~egún esto, (Í)on = - (Í) 11 o. Por ello la suma considerada se puede escribir también
en la forma
-ili 1: (J+)on(/)no = -ifi(f+/)oo,
n
La semisuma de ambas expresiones nos conduce al teorema en cuestión:
~ (En-Eo)lfonl 2 = Yli(/¡+-¡+/)oo.
(146.4)
Apliquémoslo a la magnitud
f
=
~
a
e-iq,ra.
Según ( 19.2), la derivada de ésta respecto del tiempo viene representada por el operador
(li/2m) ~ [e-iq.ra(q. va)+(q. va)e-iq.ra].
j =-
a
Es füciJ calcular directamente el resultado de la conmutación de
j
y /
j/+-f+j = -(i!t/m)q 2 Z.
Substituyendo en ( 146.4), obtenemos la fórmula
2m
2 h2q2
-_-(En-Eo)J(:E e-iq.ra)onJ 2
n
a
= Z,
(146.5)
672
Teoría de las colisiones inelásticas
que nos proporciona la fórmula de sumación que necesitábamos (1).
Para el frenado eficaz diferencia] encontramos así la fórmula
Ze4 dq 2Ze4 do
dK = 4-rr-- = - - - .
mv2 q
(146.6)
mv2 ,3-2
El dominio de aplicabilidad de la misma viene dado por la desigualdad
{flo/fl)2 ~ & ~ 1, es decir,,fJo/fJ ~ aoq ~ fl/flo.
Determinemos ahora el frenado eficaz total x(q1) para todas las colisiones acompañadas de una transferencia de impulso que no supera un cierto valor q1 tal que
v0/v ~ a0 q1 ~ v/v0 :
ql
K(q1)
=f
J(En-Eo) dan;
(146. 7)
El valor qmín viene dado por la fórmula (145.11). El símbolo de integración no se
puede permutar con el de suma, ya que qmín depende de n.
Dividamos el intervalo de integración en dos partes, de qmín a q 0 y de % a q1,
donde % es un cierto valor de q tal que v0 /v ~ %ªo ~ 1. En todo e] dominio de integración desde qmín a % es posible entonces utilizar para dna la expresión (145.14):
e
K(qo)
= 81r ( liv
)2 ~ l(dx)onl (En-Eo) fq.
dq
q'
2
qmin
de donde
e
K(qo) = 81r ( liv
)2"' l(dx)onl 2
~
n
qo/iv
(En-Eo) log--.
En-Eo
(146.8)
En el intervalo desde % a q1 podemos, en cambio, efectuar primero la suma respecto
den, lo que conduce para dx a la expresión (146.6), que una vez integrada respecto
de q da:
K(q1)- K(qo)
= 4-rr( Ze4/mv2 ) log(q1/qo).
(146.9)
(1) Al deducir esta relación, en ningún momento hemos utilizado el hecho de que el estado caracterizado por el índice cero sea el estado normal del átomo. Por consiguiente, vale para cualquier estado
inicial.
673
Frenado eficaz
Para transformar las expresiones obtenidas utilizaremos el teorema de sumación
que se deduce de la fórmula (146.4), haciendo en ella
J = (1/m) ~a Pxa,
/ = dx/e = ~a Xa,
La conmutación de /+ y
J (/+coincide en este caso con/) nos da
}/+-/+/ =
-inZ/m,
de modo que (1):
~Non=
L (2m/e 2n2 )(En-Eo)l(dx)onl 2 = Z.
n
n
(146.10)
Hemos introducido la notación especial N 0 n para las cantidades a las que afecta
el signo de suma; las llamaremos intensidades de los osciladores para las correspondientes transiciones.
Introduzcamos un valor medio de la energía I del átomo, valor definido por
la fórmula
log/ = ~ Non log(En-Eo)/L Non
n
n
= (1/ Z)
L Non log(En-Eo).
n
(146.11)
Utilizando entonces el teorema de sumación (146.10), la fórmula (146.8) se puede
escribir en la forma:
K(qo) = (477 Ze4/mv2) log(qoh-v/1).
Sumándola con (146.9), obtenemos finalmente:
K(q1) = (hZe4/mv 2) log(q1h-v/J).
(146.12)
En esta fórmula interviene tan sólo una constante característica del átomo en cuestión (2).
Expresando q1 en función del ángulo de dispersión &1 de acuerdo con q1 = mv&1/n,
obtenemos el frenado eficaz en la dispersión para todos los ángulos & < &1 :
(146.13)
Si q1a0 ~ 1 (es decir, &1 ~ v0/v), se puede expresar x en función de la máxima energía cedida al átomo por el electrón incidente. En el párrafo anterior se demostró que
para qa0 ~ 1 se produce la ionización del átomo, en la que prácticamente todo el
impulso, nq, y la energía se ceden a un sólo electrón atómico. Por ello ·Aq y s están
ligados entre sí como el impulso y la energía de un electrón, es decir, s = h 2q2/2m.
(1)
Para esta relación vale la misma observación que se hizo acerca de (146.5).
(2)
Para el hidrógeno es I
=
0,55 me 4 /h 2
=
14,9 eV.
674
Teoría de las colisiones inelásticas
Substituyendo en (146.12) q¡2 = 2ms1/lt2 , obtenemos el frenado eficaz en las colisiones acompañadas de una cesión de energía E < s1 :
(146.14)
Para los átomos pesados cabe esperar que la precisión será buena si se calcula
la constante I mediante el método de Thomas-Fermi. Es fácil establecer cómo
dependerán respecto de Z los valores I calculados de esta manera. En el caso cuasiclásico, a las diferencias entre niveles de energía corresponden las frecuencias propias del sistema de partículas. La frecuencia propia media del átomo es del orden
de v0/a0 ; de aquí podemos deducir que I ,._,lzv0/a 0 • Las velocidades de los electrones
atómicos en el modelo de Thomas-Fermi dependen de Z como z 2 13 , y las dimensiones
del átomo, como z-1 13 , Encontramos así que I debe ser proporcional a Z (1):
I = constante x Z.
Para terminar haremos la siguiente observación. Los niveles de energía del espectro discreto de un átomo están ligados fundamentalmente con las posibles excitaciones de un sólo electrón (exterior); ya la excitación de dos electrones implica
de ordinario una energía que es suficiente para la ionización del átomo. Por ello,
en la suma de las intensidades de los osciladores, las transiciones a estados del
espectro discreto representan solamente una fracción del orden de la unidad; en
cambio, las transiciones acompañadas de ionización, contribuyen con términos
del orden de Z. De aquí se sigue que el papel fundamental en el frenado (por átomos
pesados) lo representan las colisiones acompañadas de ionización.
PROBLEMA
Determinar el frenado eficaz total de un electrón por un átomo de hidrógeno(/= 0,55 unidades
atómicas); para grandes transferencias de energía, se considera como electrón primario el más
rápido de los dos electrones que chocan.
Solución. Cuando los electrones primario y secundario tienen después del choque energías
comparables, hay que tener en cuenta el efecto de intercambio. Por ello, en el frenado con cesión
de energía desde un valor e1(1 ~ c1 ~ v 2) al valor máximo Emax = E/2 = v 2/4 (¡de acuerdo con la
definición adoptada de electrón primario!) hay que utilizar la sección eficaz (145.17):
7T
= - [log(E/8E1)+ 1].
E
1
( )
De los datos experimentales se deduce que la constante es del orden de 10 eV.
Choques inelásticos de partículas pesadas con átomos
675
Sumando con (146.14), obtenemos (1):
41r
K
[v2
= - log -v'(!e)
v2
2/
] = -41r logv2
v2
1·3
(en unidades atómicas).
§ 14 7.
Choques inelásticos de partículas pesadas con átomos
La condición de aplicabilidad de la aproximación de Born a las colisiones de
partículas pesadas con átomos, expresada en función de la velocidad de la partícula,
sigue siendo la misma que en el caso de los electrones: v ~ i• 0 • Esto se sigue desde
luego de la condición general (125.2) de aplicabilidad de la teoría de perturbaciones,
Ua 0 /ñv ~ 1, si se observa que la masa de la partícula no aparece en ella en absoluto
y que Ua 0 /li es una magnitud del orden de la velocidad de los electrones atómicos.
En el sistema de coordenadas en el que el centro de masas del átomo y de la
partícula se encuentra en reposo, la sección eficaz viene determinada por la fórmula
general (145.3) (en la que por m hay que entender ahora la masa reducida de la
partícula y del átomo). Es más conveniente, sin embargo, considerar la colisión en
el sistema de coordenadas en el que se encuentra en reposo (antes del choque) el
átomo dispersor. Para esto partiremos de la fórmula (145.1); en el sistema de coordenadas en el que, antes del choque, el átomo se encuentra en reposo, el argumento
de la función - ó que expresa la ley de conservación de la energía tiene la forma:
!P'2/M-}p2/M+i(p' -p) 2/Ma+En-Eo,
(147.1)
donde M es la masa de la partícula incidente y Ma es la masa del átomo; el tercer
término representa la energía cinética de « retroceso » del átomo (energía de la
que se pudo prescindir por completo en el choque con un electrón).
En la colisión de una partícula pesada rápida con un átomo, la variación del
impulso de la partícula es casi siempre pequeña comparada con su impulso inicial.
Si se cumple esta condición, en el argumento de la función - ó cabe prescindir de la
energía cedida al átomo, con lo cual volvemos exactamente a la fórmula (145.3),
en la que sólo hay que substituir m por la masa M de la partícula incidente (¡no
por la masa reducida de la partícula y del átomo!). Teniendo en cuenta que la transferencia de impulso se supone pequeña frente al impulso inicial, haremos p ':;;; p';
de esta manera, para la sección eficaz referida al sistema de coordenadas en el que,
antes del choque, el átomo se encuentra en reposo, obtenemos la fórmula
do-n = (M2/h2fí4)1
ff Ue-íq.rtf;n*t/;o dTd v¡2 do.
(147.2)
(1) En las colisiones de un positón con un átomo de hidrógeno no existe efecto de intercambio y el
frenado total se obtiene, simplemente, substituyendo en ( 146.14) Emáx = E = -i v 2 en vez de 1: 1 :
K
= (47T/v2) log(v2/0·55).
676
Teoría de las colisiones inelásticas
Teniendo en cuenta que la carga de la partícula puede ser diferente de la carga
del electrón, escribiremos ze 2 en vez de e2 , donde ze es la carga de la partícula incidente. La fórmula general para la dispersión inelástica, escrita en la forma (145.9):
dcrn =
s1T(ze2 )21( ~ e-lq.ra)onl2dq,
liv
a
q3
(147.3)
no contiene la masa de la partícula. De aquí se sigue que también todas las fórmulas
que se obtienen a partir de ella serán aplicables al choque de partículas pesadas,
con tal que estas fórmulas se expresen en función de v y q.
Es fácil ver cómo deben modificarse las fórmulas cuando se dan en función del
ángulo de dispersión -& (ángulo de desviación de la partícula pesada que choca con
el átomo). Para ello observemos, ante todo, que el ángulo -& es siempre pequeño
en la colisión inelástica de una partícula pesada. En efecto, cuando el impulso cedido
es grande (comparado con los impulsos de los electrones atómicos), se puede considerar la colisión inelástica con el átomo como una colisión elástica con los electrones
libres; pero en el choque de una partícula pesada con una partícula ligera (un electrón) la partícula pesada casi no se desvía. Con otras palabras, la transferencia de
impulso de la partícula pesada al átomo es pequeña comparada con el impulso inicial de la partícula (constituye excepción la dispersión elástica para grandes ángulos,
dispersión que, sin embargo, es extremadamente poco probable).
De esta manera, en todo el intervalo angular se puede hacer:
q
= v'{[(En-Eo)/v]2+(Mv&)2}/li,
(147.4)
(relación que de hecho se reduce a
qli,....., Mv&
(147.5)
en todo aquel intervalo, con la única excepción de los ángulos más pequeños). Por
otra parte, al considerar el choque de electrones con un átomo, escribíamos (para
ángulos pequeños):
q = v'{[(En-Eo)/v]2+(mv&)2}/h.
La comparación de ambas expresiones permite concluir que las fórmulas que hemos
obtenido para las colisiones de electrones con átomos, fórmulas expresadas en función de la velocidad y de los ángulos de desviación, se traducen en las fórmulas para
la colisión de partículas pesadas substituyendo en todas partes (en particular, en el
elemento de ángulo sólido do = 2n sen -& d.& = 2n-& d:
&-+M&/m
(147.6)
con precisamente la misma velocidad v de la partícula que incide. Esto significa,
cualitativamente, que toda la gráfica de dispersión para ángulos pequeños resulta
677
Choques inelásticos de partículas pesadas con átomos
contraida lpara una velocidad dada) en la razón m/M.
Las reglas obtenidas se aplican también a la dispersión elástica para ángulos
pequeños. Efectuando la transformación (147.6) en la fórmula (137.4) con .& ~ 1,
obtenemos la sección eficaz
dcre = 81r(ze2/Mv2)2[Z-F(Mv-3·/h)]2 d&/&ª.
En cuanto a la dispersión elástica de partículas pesadas para ángulos .&
se reduce a la dispersión de Rutherford por el núcleo del átomo.
(147.7)
l"-.J
1, ésta
La dispersión inelástica con ionización del átomo requiere un estudio aparte
cuando el impulso cedido es grande. En contraposición al caso de la ionización por
un electrón, no existen ahora, claro está, efectos de intercambio. Para las partículas
pesadas es característico que una gran transferencia de impulso (qa 0 ~ 1) no significa en modo alguno una fuerte desviación; el ángulo.& sigue siendo siempre pequeño. La sección eficaz de ionización acompañada de emisión de un electrón
con energía entre s y s+ds se obtiene directamente de la fórmula (145.25), que
escribiremos en la forma:
dcr1n
= 81r(ze2Jhv)2Z dq/qª,
haciendo ñ q /2m = s (todo el impulso ñq se cede a un sólo electrón atómico). Esto
nos dará:
2 2
(147.8)
En las colisiones de partículas pesadas con átomos, presentan particular interés
las secciones eficaces y los coeficientes de frenado integrales. La sección eficaz total
de dispersión inelástica viene determinada por la fórmula anterior (145.26). El
frenado eficaz total se obtiene substituyendo en (146.12), en vez de q1, el máximo
valor posible de transferencia de impulso, qmáx· Este último se expresa fácilmente
en función de la velocidad de la partícula de la siguiente manera. Dado que hqmáx
es en todo caso pequeño comparado con el impulso inicial Mv de la partícula, la
variación de su energía está ligada con la variación del impulso por la relación
AE = v ·ñq. Por otra parte, cuando el impulso transferido es grande, toda esta
energía se cede esencialmente a un solo electrón atómico, de modo que podemos
escribir:
€
De aquí se deduce ñq
~
= lz2q2/2m
=
ñv. q
< ñvq.
2mv, es decir,
nqmax = 2mv,
€max
= 2mv2.
(147.9)
Observemos que el ángulo de desviación máximo de la partícula en la dispersión
inelástica es igual a
&max
= liqmax/Mv
= 2m/M.
678
Teoría de las colisiones inelásticas
Substituyendo (147.9) en (146.12), obtenemos el frenado eficaz total de una
partícula cargada:
K
=
(4TTZz2e4/mv2) Iog(2mv2/J).
(147.10)
§ 148. Dispersión por moléculas
La teoría general de la dispersión de partículas cargadas rápidas por moléculas
viene dada, en esencia, por las mismas fórmulas que la dispersión por átomos.
En algunos casos, este problema se puede reducir a un problema de dispersión
por los átomos individuales que constituyen la molécula.
Consideremos las colisiones de electrones rápidos con una molécula acompañadas de la excitación de los niveles de rotación y de vibración, sin que varíe el estado
electrónico de la misma. Debido a que la energía de excitación de estos niveles es
pequeña, se puede suponer que no varía el valor absoluto del impulso.
Sea U la energía de interacción del electrón incidente con la molécula, promediada respecto de la función de onda electrónica de esta última; U es función de
las coordenadas de la partícula incidente y de los núcleos de la molécula. Sean, además, "Po y "Pn las funciones de onda inicial y final del movimiento nuclear (vibratorio y de rotación). Tenemos entonces, de manera por completo análoga a la fórmula (145.3):
(148.1)
d-r es aquí el elemento del espacio de configuraciones de los núcleos y mes la masa
del electrón. Esta fórmula se aplica tanto a la dispersión inelástica como a la elástica (n = O).
Si todos los átomos de la molécula son suficientemente pesados, la mayor parte
de los electrones dispersados pertenecen a las capas internas de los átomos. Por
otro lado, el movimiento de los electrones interiores varía poco al unirse los átomos
en la molécula (no cabe decir lo mismo, en general, acerca de los electrones exteriores). Por ello el « campo dispersor» U se puede escribir, con precisión suficiente,
en forma de suma, U= 'J:..Ua, donde Ua es la energía de interacción de la partícula
incidente con el a-ésimo átomo (promediada respecto de su estado electrónico);
Ua es función de las coordenadas relativas de la partícula y del a-ésimo núcleo.
Substituyendo en (148.1)
u=
~
a
Ua
=
~
a
Uae-'q.Raeiq.Ra,
(Ra son los vectores posición de los núcleos), podemos representar la sección eficaz
en la forma:
Dispersión por moléculas
dcrn =
1
~fa( q)(e-iq.Ra)onl 2 do,
a
679
(148.2)
donde el elemento de matriz de la expresión entre paréntesis se forma mediante las
funciones de onda nucleares "Po, 1Pn y las cantidades/a{q)vienen determinadas por la
fórmula
fa( q) = ( - m/2nlz2)
J Uae-iq · Cr-Ra> d V.
(148.3)
Estas últimas poseen un sentido físico sencillo: representan las amplitudes de dispersión por los átomos individuales, ya que
<lera.e = lfa{q)l 2 do
(148.4)
es la sección eficaz de dispersión elástica de un átomo individual (libre). La fórmula
obtenida resuelve en principio la cuestión planteada.
Consideremos ahora la dispersión de los neutrones por moléculas que no poseen
momento magnético (1). Los electrones prácticamente no dispersan a los neutrones,
de modo que toda la dispersión se debe, de hecho, a los núcleos. Supondremos
que la dispersión es débil, en el sentido de que la amplitud de la onda dispersada
por uno de los núcleos de la molécula es ya pequeña en los puntos en que se encuentran
los demás núcleos; esta condición equivale a exigir que las amplitudes de dispersión
por los núcleos individuales sean pequeñas comparadas con las distancias interatómicas. Cuando se cumple esta condición, la amplitud de dispersión por la molécula viene determinada por la suma de las amplitudes de dispersión por los diferentes
núcleos.
Al choque de un neutrón con un núcleo no es aplicable, en general, la teoría
de perturbaciones; aunque el radio de acción de las fuerzas nucleares es pequeño,
dentro de los límites de este radio las fuerzas son muy grandes. Por consiguiente,
la teoría de perturbaciones es también inaplicable en general a la dispersión de los
neutrones por moléculas. Sin embargo, en el caso de neutrones lentos, se puede
aplicar al problema de la dispersión por un sistema de núcleos (por la molécula)
una particular teoría formal de perturbaciones que reduce este problema al de
determinar la amplitud de dispersión del neutrón por núcleos libres (E. FERMI, 1936).
El fundamento físico de este método consiste en que la amplitud de dispersión
de un neutrón lento (longitud de onda del neutrón grande comparada con las dimensiones del núcleo) por un núcleo libre es una cierta cantidad constante que no depende de la velocidad. Sea fa la amplitud de dispersión por el a-ésimo núcleo;
lfa] 2 do es la sección eficaz diferencial de dispersión elástica del neutrón por un
núcleo libre (en el sistema del centro de masas de ambos).
(1) En el caso contrario se tiene, además, un efecto de dispersión específico que se debe a la interacción
de los ·momentos magnéticos del neutrón y de la molécula.
680
Teoría de las colisione.i inelásticas
La amplitud constante se puede obtener de manera formal a partir de la teoría
de perturbaciones si se representa la interacción del neutrón con el núcleo por una
energía potencial « puntual »
2TTh2
U(r) = - -/S(r),
µ,
(148.5)
donde fl = A/(A + 1) es la masa reducida del neutrón y el núcleo de peso atómico A;
al substituir esta expresión en la fórmula de Born (125.4), la función - t5 reduce la
integral a una cantidad constante, independiente de q (1). Subrayemos que la posibilidad de introducir el « cuasipotencial » (148.5) está ligada precisamente con el
carácter constante de f En el caso genera) de una energía arbitraria del neutrón, la
amplitud de dispersión depende de cada uno de los impulsos p y p' por separado,
y no tan sólo de su diferencia q; en cambio, la amplitud calculada en la aproximación de Born puede depender tan sólo de q.
Si el núcleo dispersor efectúa un movimiento dado {por ejemplo, vibraciones
en una molécula), al promediar respecto de este movimiento la interacción (148.5)
« se difumina» en un dominio cuyas dimensiones, en general, son grandes comparadas con la amplitud de dispersión f Para esta interacción «difuminada» se cumple
la condición (125.1) de aplicabilidad de la aproximación de Born.
Así, pues, describiremos la interacción del neutrón con la molécula por una
energía potencial
(148.6)
donde la suma se extiende a todos los núcleos que la constituyen; Ra son sus vectores posición; r es el vector posición del neutrón. Substituyendo esta expresión
en la fórmula (143.3) (con µM en vez de m, donde µM es la masa reducida de la
molécula y del neutrón). obtenemos la siguiente fórmula para la sección eficaz de
dispersión del neutrón por la molécula en el sistema del centro de masas:
dcrn
1
= µ, 2P'l¿
-¡ -fa(e-iQ.Ra)on,2do;
M
p
a
/J,a
1
(148.7)
1
los elementos de matriz se toman con relación a las funciones de onda del movimiento
(1) Aunque el potencial (148.5) da el valor correcto de la amplitud de dispersión en la aplicación
formal de la teoría de perturbaciones, esto no significa, en absoluto, que la teoría de perturbaciones sea
efectivamente aplicable a este campo. Por el contrario, para un pozo de potencial de profundidad U0
que tiende a infinito de tal manera que Uoa3 = const (a es el radio del pozo, que tiende a cero), las condiciones (l 25.1-2) no se cumplen, evidentemente.
Dispersión por moléculas
681
de los núcleos, y los impulsos p y p' están ligados entre sí por la ley de conservación
de la energía
(p2 -p' 2)/2µ,M = En - Eo.
La fórmula (148.7) determina la dispersión de los neutrones por la molécula teniendo
en cuenta la influencia del movimiento propio de los núcleos en aquélla y los efectos
de interferencia entre las dispersiones por los diferentes núcleos en función de las
amplitudes de dispersión (supuestas conocidas) de los neutrones por los núcleos
libres (1).
Si los núcleos poseen un spin diferente de cero, en las fórmulas obtenidas debe
tenerse todavía en cuenta la circunstancia de que las amplitudes de dispersión fa
dependen del spin total del núcleo dispersor y del neutrón. Esta corrección se puede
efectuar de la siguiente manera.
El spin total del núcleo y del neutrón puede tomar dos valores: Ía = Ía ± ! ;
los valores correspondientes de la amplitud de dispersión los designaremos por
fa+ y fa-· Construyamos el operador de spin cuyos valores propios, para valores
determinados del spin total Ía = Ía ± !, sean iguales a fa+ y fa-, respectivamente.
Este operador es
la= aa+bas.ia,
(148.8)
donde ia y s son los operadores de spin de los núcleos y del neutrón y los coeficientes
ªª y ba vienen dados por las fórmulas:
(148.9)
Es fácil comprobarlo observando que, para un valor dado de j, el valor propio del
operador s. i es
s.i = ![j(j + 1) - i(i + 1) - !].
Los operadores (148.8) deben substituirse en la fórmula (148.7) en vez de fa,
formando los elementos de matriz que se deducen de ellos y correspondientes a la
transición considerada. Si, como suele ocurrir, el haz incidente de neutrones no
está polarizado (o si, en el blanco irradiado, los núcleos poseen spins con diferentes
orientaciones), la sección eficaz de dispersión debe promediarse de acuerdo con ello
(véanse los problemas).
(1) Hay que subrayar que sería inadmisible, claro está, utilizar la interacción (148.6) para hallar las
aproximaciones siguientes de la teoría de perturbaciones.
Teoría de las colisiones inelásticas
682
PROBLEMAS
1. Promediar la fórmula (148.7) suponiendo que la dirección de los spins de los neutrones
y de los núcleos están distribuidas por completo al azar. Todos los núcleos en la molécula son diferentes.
Solución. Los promedios respecto de las direcciones de los spins de los neutrones y de los núcleos
son independientes y cada uno de ellos da el valor cero como resultado del promedio; por ello
s · i 11 = O. Si la molécula no contiene átomos iguales, no existe interacción de intercambio entre los
spins nucleares y, en virtud de la anulación de su interacción directa, las direcciones de los spins
de los diferentes núcleos de la molécula pueden considerarse independientes; por consiguiente, al
efectuar el promedio se anulan también los productos de la forma (s· i 1) (s· i 2). En cambio, para los
cuadrados (s· i) 2 tenemos:
(s.i)2 = }s2i2 = ls(s+ l)i(i+ 1) = ¡i(i+ 1).
Como resultado se obtiene la siguiente expresión para la sección eficaz promedia:
+ 1~ ia(ia+ 1) ba2l(e-iq.Ra)onl2]
a
2.
(J.
do.
/La2
Aplicar la fórmula (148.7) a la dispersión de neutrones lentos por el para- y el ortohidrógeno
E. TELLER, ]937).
SCHWINGER,
Solución. Antes de formar los elementos de matriz de los operadores de spin, la expresión
(148.7) para la dispersión por la molécula H2 tiene la forma:
l6p'
.
dcrn = --la[(e-iq.r /2)on + (eiq.r /2)on] +
9 p
+bs .[ii(e-iq.r /2)on + i2(eiq.r /2)on]l2do,
a= !(3f++J-),
b = f+-J-,
(1)
( ± r/2 son los vectores posición de los dos núcleos de la molécula respecto de su centro de masas).
Los estados de rotación y vibración de la molécula se determinan por los números cuánticos K,
M K, z· (que hay que incluir en el significado den en Ú)). En el estado electrónico fundamental de
la molécula H 2 , los valores K pares son sólo posibles para un spin nuclear I = O (parahidrógeno),
y los valores K impares, para I = J (ortohidrógeno) (véase § 86). Por ello hay que distinguir dos
casos: 1) transiciones entre estados de rotación con valores de K de igual paridad, sólo posibles sin
variación de I (transiciones orto-orto y para-para), 2) transiciones entre estados con valores de K
de distinta paridad, sólo posibles con variación de I (transiciones orto-para y para-orto).
En el primer caso tenemos:
(e-iq.r /2)on = ( eiq.r /2)on
= (cos¡q.r)on;
(hay que recordar que la función de onda de rotación queda multiplicada por (- J)K al cambiar
Dispersión por moléculas
683
de signo r). El operador de spin en (1) se transforma entonces en 2a+bs.i,donde i = ii+is. Este
operador es diagonal respecto de I por lo dicho antes. El cuadrado (2a+bs· 1)2 se promedia como
en el problema 1 y da:
4a2 + }b2J(I + 1).
El resultado que se obtiene es
dan =
4 p'
--1( cos}p.r)onl 2 [(3f+ +J-)2 + I(I + 1)(j+ - J-)2]do.
9 p
(2)
En el segundo caso
( eiq.r /2)on = _ ( e-iq.r )2)on
=
i(sen!q.r)on,
y el oper::i.dor de spin en (1) se reduce a é.(i1 --i2); este operador posee únicamente elementos de
matriz no diagonales respecto de J. El cuadrado del módulo de estos elementos, sumado respecto
de todos los valore~ posibles de la proyección del spin total /' en el estado final, se calcula como valor
medio (elemento diagonal) del cuadrado [s· (i1 - i 2)]2 (véase la nota de la pá~. 620 y es igual a
[s.(h-i2)] 2 =i,!(h-i2) 2
=
!(2h2 + 2i22-i2)
=
![3-I(I + 1)].
Como resultado obtenemos:
4 p'
dan= (1 )(3)--j(sentq.r)onl 2(J+-/-)do,
9 p
(3)
donde el coeficiente (1) se refiere a las transiciones orto-para, y el coeficiente (3), a las transiciones
para-orto.
Si los neutrones son tan lentos que su longitud de onda es también grande comparada con las
dimensiones de la molécula, en los elementos de matriz que aparecen en (2) y en (3) se puede hacer
cos (q·r/2) = 1, sen tq,r/2) = O, como resultado de lo cual todos ellos se anulan salvo el elemento
diagonal 00 en (2); es natural que, en estas condiciones, sea posible sólo la dispersión elástica. La
sección eficaz de dispersión elástica es en este caso:
dae
4
= -[(3f++J-)2+1(1 + l)(f+-J-)2]do.
9
3. Determinar la sección eficaz de dispersión de los neutrones por un protón ligado que se
considera como un oscilador espacial isótropo de frecuencia w (E. FERMI, 1936).
Solución. Considerando el protón como un punto que vibra en torno de un punto fijo del espacio,
debemos hacer en la fórmula (148.7), en virtud del razonamiento que condujo a ella, µM = M
y µª = M/2 (M es la masa del protón). Entonces
Teoría de las colisiones inelásticas
684
donde a 0 4n:f 12 es la sección eficaz de dispersión por un protón libre y tpn,n 2 n 3 las funciones propias
del oscilador espacial que corresponden a los niveles de energía En = hw(n+3/2); la suma se extiende
a todos los valores de n1, n 2, n3 con valor dado de la suma n1 +n2 +n3 = n. Las funciones ipn,11 211 3
representan productos de funciones de onda de tres osciladores Jineales (véase problema 4, § 33).
La integral que necesitamos se descompone, por consiguiente, en producto de tres integrales de la
forma:
VMm/h), que se calculan substituyendo Hn 1(x) por la expresión (a, 4) e integrando por partes
n 1 veces. Como resultado se obtiene:
(~ =
La suma se calcula mediante la fórmula del binomio y se encuentra finalmente:
dcrn = -ero-
7T1l!
JE'(
q2 )ne-q
E
-
--
2a.2
En particular, la sección eficaz de dispersión elástica (n
dae
ªº
= -e-q
2
/
2a: 2do,
'1T
Cuando E/hm-'i>- O, se tiene ae-,,,. 4a0 •
=
2
/2a: 2do.
O, E= E') es:
APÉNDICES MATEMÁTICOS
§ a.
Polinomios de Hermite
La ecuación
y"-2xy'+2ny
=O
(a.1)
pertenece a un tipo de ecuaciones que se pueden resolver mediante el llamado método de Laplace.
El método de Laplace (1) es aplicable en general a las ecuaciones lineales de la
forma
cuyos coeficientes son de grado no superior al primero en x y consiste en lo que
sigue. Construyamos los polinomios
n
P(t) =
~ amtm,
m-0
Q(t) =
n
~
m-0
bmtm,
y, a partir de ellos, la función
Z(t)
= (1/Q)efCP/Q)dt,
definida salvo un factor constante. La solución de la ecuación considerada puede
entonces expresarse en la forma de una integral compleja
y
= J Z(t)ext dt,
e
en la que el camino de integración C se elige de manera que la integral sea finita
y distinta de cero y que la función
(') Véase, por ejemplo, E. GouRSAT, Cours d'Analyse Mathématique, vol. 11; V. l.
of Higher Mathematics, vol. 111, part. 2., Pergamon, Oxford, 1964.
SMIRNOV,
Course
686
Apénclice." matemático.'!
vuelva a su valor inicial cuando t describe C por completo (el contorno C puede
ser cerrado o abierto). En el caso de la ecuación (a, I) tenemos:
P
= t2+2n,
z=
Q = -2t,
-
1
--e-t2 /4
2tn+l
'
V=
1
-ext-tz/4
tn
'
de modo que su solución es de la forma:
y =
f
e:vt-t2¡4 dt/tn+I.
(a.2)
Para las aplicaciones físicas basta limitarse a considerar los valores n > - L
Para tales valores de n cabe elegir como camino de integración los contornos C 1
o C 2 (fig. 50), que satisfacen las condiciones necesarias, ya que en sus extremos
(t =
oo o t = - oo) la función V se anula (1).
+
4
e,
C2
$
FIG. 50
Veamos para qué valores del parámetro n la ecuac1on (a, 1) tiene soluciones
que son finitas para todos los valores finitos de x y que para x---+
= tienden a
infinito no más rápidamente que una potencia finita de x. Consideremos primero
valores enteros de n. Las integrales (a, 2) a lo largo de C 1 y C.2 proporcionan dos
soluciones independientes de la ecuación (a, 1). Transformemos la integral a lo
largo de C 1 introduciendo la variable u mediante t = 2(x ~~ u). Prescindiendo de
un factor constante, encontramos:
y
=
ex' fe-u' du/(u-x)n+l,
(a.3)
C/
donde la integración se efectúa a lo largo del contorno Ci' en el plano de la variable
compleja u y representado en la fig. 51.
<') Estos caminos no valen para valores enteros negativos de
idénticamente la integral (a, 2) a lo largo de los mismos.
11,
dado que para tales valores se anula
Polinomio." de Hermite
687
e;
u
e
e·
1
X
FIG. 51
+
Cuando x ->oo todo el camino de integración se desplaza hacia el infinito
y la integral de la fórmula (a, 3) tiende a cero como e- r'. Pero para x--+ dicho
camino se extiende a lo largo de todo el eje real y la integral (a, 3) no tiende a cero
exponencialmente, de modo que la función _r(x) tiende a infinito esencialmente
como ex". Análogamente es fácil comprobar que la integral (a. 2) a lo largo de C/
diverge exponencialmente cuando x-+
=.
=
+
Para valores enteros positivos de 11, en cambio (incluido el valor cero). las integrales a lo largo de las secciones rectilíneas del camino de integración se reducen
entre sí y ambas integrales (a, 3) - a lo largo de C¡' y de Cz.' - se reducen a una
integral a lo largo de un camino cerrado en torno del punto u ---= x. Obtenemos
así la solución
0
y(x) = ex '1j e-u 1 du/(u-x)n+I,
que satisface las condiciones impuestas. Según la conocida fórmula de Cauchy que
da las derivadas de una función analítica
11!
pn)(x) = -2r.i
f.
f (t)
(t-x)n+I
.
dt,
aquella solución coincide, salvo un factor constante, con uno de los llamados polinomios de Hermite
(a.4)
En forma explícita, el polinomio Hn, ordenado según las potencias decrecientes
de x, se escribe:
Hn(x)
= (2x)n
n(n-1)
11(n-l)(n-2)(n-3)
---(Zx)n-2+
(2x)n-4_ ....
1
1.2
(a.5)
Contiene sólo potencias de x de la misma paridad que n. He aquí los primeros
688
Apéndices matemático.<;
polinomios de Hermite:
Ho = 1,
H 1 = 2x,
4x2 -2,
H2
Hs
= 8x3-12x,
ll4 = lfo4 -48x2+ 12. (a.6)
2
Para calcular la integral de normalización, substituyamos e-x Hn por la expresión que resulta de (a, 4) e, integrando n veces por partes, obtendremos:
f
s
(f.)
Iro (-l)nHn(x)-e-x
¿n dx
s
e-x Hn2(x) dx =
dxn
--co
-«>
oo
=
dn
f e-x=-Hn
dx.
dxn
-00
d 11 H 11
Pero es una constante, igual a 2n,n!; por consiguiente,
d./l
f
ro
= znn,y1T.
e-:,lHn2 (x) dx
(a.7)
-0:,
§ b.
La función de Airy
También 1a ecuación
y"-xy
(b.l)
O
=
pertenece al tipo de Laplace. Siguiendo el método general, introduzcamos las funciones
p
t2
'
Q = -1,
de modo que la solución puede representarse en la forma
y(x) = constante x
f ext-t /3 dt.
3
(b.2)
e
donde el camino de integración C debe elegirse de manera que en sus dos extremos
se anule la función V. Para ello estos extremos tienen que ir al infinito en dominios
del plano complejo t en los que Re(t 3) > O (estos dominios aparecen rayados en
Ja fig. 52).
Obtenemos una. solución finita para todo x eligiendo el camino C conforme
se representa en la figura. Este camino puede desplazarse de manera arbitraria
con la única condición que sus extremos vayan a infinito en los dos mismos sectores
La función de Air;r
689
FIG. 52
rayados (1 y 111 en la fig. 52). Obsérvese que si se elige un camino que se encuentre,
por ejemplo, en los sectore? 11 I y 11, obtendríamos una solución que tiende a infinito cuando x _.,.. =.
Desplazando el camino C de modo que coincida con el eje imaginario, obtenemos
la función (b, 2) en la forma (hacemos la substitución t = iu):
f
00
<t>(x) = ;;;
cos(ux+}uª) du.
(b.3)
o
La constante const en (b, 2) la hemos igualado a - i 2r';i y la función así definida
se ha representado por <l>(x); se llama función de Airy (1 ).
La expresión asintótica de <t>(x) para grandes valores de x puede obtenerse
calculando la integral (b, 2) por el « método del puerto». Para x > O el exponente
1
del integrando presenta un extremo en t = -: 1 x y la dirección de « máxima pendiente» es paralela al eje imaginario. De acuerdo con esto, para obtener la expresión
asintótica correspondiente a grandes valores positivos de x, desarrollemos el exponente en potencias de t ~ 1 x e integremos a lo largo de la recta C 1 (fig. 52), paralela
al eje imaginario (distancia OA =--= 1'x). Haciendo la substitución t = - i'x+iu,
obtenemos:
Hemos adoptado la dellnición propuesta por Y. A. FoK: véase el apéndice a su libro Difrakt.1ia
1·ok.r11i: ::e111noi 1w1·erino.,ri 1 /)ifi·acciún de las ondas de radio en torno de la .rnper(icie terrestre),
1,d-vo AN sss·R. 1946. que con1iene una colección de fórmulas y tablas numéricas (la función<!>(.\·) es una
de las dos funcione~ introducidas por FoK, que la llama 1·(x).
( 1)
,-111 /ioroln
690
Apéndices matemáticos
z:,, f
et)
4>(x) :::, -
,,-(2/3)•"'--«'V• du,
-00
de donde
(b.4)
Así, pues, para grandes valores positivos de x la función <I>(x) decrece exponencialmente.
Para hallar la expresión asintótica que corresponde a grandes valores negativos
de x. observemos que cuando es x < O el exponente presenta un extremo en
t = ivlxl
t= -ivlxl,
y la dirección de « máxima pendiente » en estos puntos coincide con la de rectas
que forman ángulos - !!_ y ~ con el eje real, respectivamente. Eligiendo como ca-
4
4
mino de integración la quebrada C3 (distancia OB =
de sencillas transformaciones
Jllx!),
obtenemos después
<I>(x) = lxl-114 sen(ilxl 3 12+!77").
(b.5)
Resulta así que en la región donde x es negativa y grande en valor absoluto, la función <I>(x) tiene carácter oscilante. Señalaremos que el primer (y mayor) máximo
de la función 4>(x) es 4>(- 1,02) = 0,95.
La función de Airy puede expresarse mediante funciones de Bessel de orden i.
Es fácil comprobar que la ecuación (b, 1) tiene la solución
donde Z1 1aCx) es una solución cualquiera de la ecuación de Bessel de orden t. La
solución que coincide con (b, 3) es:
<!>(x)
= tV(77"x){/-1¡a(fx3 12)-fi;a(-fx312)}
<I>(x) =
t
para
X>
vHxl){J-1¡a(ilxl 312)+li;a(ilxl 3 12)} para
Ü,
X
< O,
(b.6)
donde ln(x) = ¡-n¡n(ix). La manera más fácil de obtener el coeficiente que aqui
aparece consiste en comparar la expresión asintótica (b, 5) con la conocida expresión
asintótica de las funciones de Bessel
691
Polinomios de Legendre
§ c.
Polinomios de Legendre
Los polinomios de Legendre Pn ( cos O) se definen por la fórmula
dn
1
Pn(cos8) = - (cos28-1)",
znn! (d cos O)n
(c.1)
o en forma explícita:
n(n-l)
n(n-l)(n-2)(n-3)
]
(2n)! [
cosn-48- .... (c.2)
Pn(cos8) = - - cosn(J - - - cosn-20+
2n(n!)2
. 2(2n-1)
2. 4. (2n-l)(2n-3)
Dichos polinomios satisfacen la ecuación diferencial lineal
dPn)
-1- -d ( sen O- +n(n+ l)Pn = O.
sen8 d8
d8
(c.3)
Los polinomios asociados de Legendre se definen mediante la fórmula
dmPn(cosO)
Pnm(cos8) =senmO - - - (d cosO)m
1
dm+n
= -senmB
(cos28-1)"
znn!
(d cos (J)m+n
'
(c.4)
(m = 0,1, ... , n). A esta definición equivale la expresión
(n+m)!
dn-m
sen-m(J
(cos28-1)",
Pnm(cos8) = (-l)m
(n-m)!2nn!
(d cosO)n-m
(c.5)
o en forma explícita
Pnm( cos 8) =
(2n)!
(
(n-m)(n-m-1)
senm(J cosn-m(J
.
cosn-m-20+
znn! (n-m)!
2(2n-1)
+
(n-m)(n-m-l)(n-m-2)(n-m-3)
2. 4. (2n-1)(2n-3)
}
cosn-m-4(J- ....
(c.6)
Los polinomios asociados de Legendre satisfacen la ecuación
m2]
d ( sen8-dPnm) + [ n(n+l)--- Pnm = O.
-1- seno dO
dO
sen20
(c.7)
Apéndices matematicos
692
Para los polinomios de Legendre vale el siguiente << teorema de adición » (1).
Sea y el ángulo entre dos direcciones definidas por los ángulos esféricos (), <f, y()', <f, '.
cos y = cos 8 cos 8' +sen8 sen8' cos(</,-</,').
Entonces
Pn(cosy) = Pn(cos8)Pn(cos8')+
n
+
2
m=l
2
(n-m)!
,
(c.8)
Pnm(cos8)Pnm(cos8')cosm(</,-cf, ).
(n+m)!
Para calcular la integral de normalización de los polinomios de Legendre
n
f
1
f
[Pn(cos8)]2 senO dO =
O
[Pn(¡,)J" d¡, , (µ = cos 8)
-1
substituyamos la expresión (e, 1) e integremos por partes n veces:
-f
1
I
1
[Pn(µ)]2 dµ = _ l
22n(n!)2
-1
~(µ2-l)n ~(µ2-l)n dµ
dµn
dµn
-1
I
1
(-l)n
= __
22ncn!)2
¿2n
(µ2-1 )n -(µ2-1 )n dµ
dµ2n
-1
I
1
(2n)l
= --
(l-µ2)n dµ
z2n(n!)2
-1
I
1
(2n)l
= 2-(n!)2
un(l-u)n du
o
(u= (1 - µ)/2), de donde
1
J[Pn(µ)]2 dµ = 2/(2n+ 1).
(c.9)
-1
1
( )
En la literatura matemática existen muchas exposiciones buenas de la teoría de las funciones
esféricas. Como referencia, presentamos aquí sólo algunas relaciones fundamentales, sin ocuparnos, en
absoluto, de exponer sistemáticamente la teoría de estas funciones.
Polinomios de Legendre
693
De manera análoga es fácil comprobar que las funciones Pn(µ) con valores de n
diferentes son ortogonales entre sí:·
1
JPn(µ)Pm(µ) dµ = O
(n i=- m).
(c.10)
-1
El cálculo de la integral de normalización para los polinomios asociados de
Legendre se efectúa fácilmente de manera análoga escribiendo [Pn m(µ)] 2 en forma
de producto de las expresiones (c, 4) y (c, 5) e integrando n - m veces por partes;
como resultado se obtiene:
1
2 (n+m)!
[Pnm(µ)]2 dµ = 2n+ 1 (n-m)!.
J
(c.11)
-1
Es fácil también ver que las funciones
de m) son ortogonales entre sí:
pnm
con valores den diferentes (e igual valor
1
JPnm(µ)Pkm(µ,) dµ
(n i=- k).
= O
(c.12)
-1
El cálculo de integrales de productos de tres polinomios de Legendre se discute
en el§ 107.
Finalmente, como referencia, damos a continuación las expresiones de los primeros armónicos esféricos Y1m:
Yoo = 1/y(+n-);
Y10 = iy(3/+n-)cos 8,
Y20
Y1,±1
=
:¡: iy(3/81r)sen8. e±iq¡;
=
y(S/l61r)(l-3 cos28),
Y2,±1
=
±v(lS/81r) cosfJsen8. e±iq¡,
Y2,±2
=
-y(15/321r)sen2fJ.
Y30
=
-iy(7/167r) cosO(S cos28-3),
Y3,±1
=
± iy(21/64n-)sen8(5 cos28- l)e±i~\
e±2iif>;
Ya,±2 = -iy(l05/321r) cosfJsen2fJ. e±21~\
Ya,±3 = ± iy(35/64n-)senª8. e±3iq¡.
694
.Apéndices matemáticos
§ d.
La función hipergeométrica confluente
La función hipergeométrica confluente se define por la serie
(X z
F((X,y,z)
= 1+--+
yl!
(X((X+ 1) z2
- + ... ,
(d.1)
y(y+l) 2!
que converge para cualquier valor finito de z; el parámetro a es arbitrario, y se
supone que el parámetro y no es ni cero ni un número entero negativo. Si a es un
número entero negativo (o nulo), la función F(rx, y, z) se reduce a un polinomio
de grado lrxl,
La función F(rx, y, z) satisface la ecuación diferencial
zu" +(y-z)u' -(XU = O,
(d.2)
como es fácil ver por comprobación directa (1). La substitución u = z -Yu1 transforma esta ecuación en una ecuación del mismo tipo:
1
(d.3)
De aquí resulta que para y no entero la ecuación (d, 2) tiene también la integral
particular z1-y F(rx -y+l, 2-y, z), linealmente independiente de (d, I) de modo
que la solución general de la ecuación (d, 2) tiene la forma:
(d.4)
El segundo término, a diferencia del primero, presenta una singularidad en z = O.
La ecuación (d, 2) pertenece al tipo de Laplace y sus soluciones pueden escribirse
en forma de integrales de contorno. Siguiendo el método general, introduzcamos
las funciones
P(t) = yt-(X,
Q(t) = t(t-1),
Z(t) = tet.-l(t-l)r-et.-1,
de modo que
u =
J etztet.-l(t-I)r-et.-1 dt.
(d.5)
El camino de integración debe elegirse de manera que, después de recorrerlo, la
función V(t) = e 1z1rx(t - l)Y-rx vuelva a su valor inicial. Aplicando el mismo método a la ecuación (d, 3), se puede obtener para u una integral de contorno de otra
forma:
u= zl-y
J etztet.-r(t-1)-et.dt.
(1) La ecuación (d, 2) con valor entero y negativo de y no merece consideración particular, ya que
puede reducirse (mediante el paso a la ecuación (d, 3)) al caso de valores de y enteros positivos.
La /unción hipergeométrica confluente
695
En esta integral conviene hacer la substitución tz -+ t que la lleva a la forma
u(z) =
f et(t-z)-a1a-r dt,
(d.6)
con
V(t) = etta-r+I(t-1)1-a.
El integrando en (d, 6) tiene, en general, dos puntos singulares - para t = z
y para t = O. Eligiremos el contorno de integración C que viene del infinito (Re
t -+-(X)), rodea a ambos puntos singulares en sentido positivo y vuelve luego al
infinito (fig. 53). Este contorno satisface las condiciones exigidas, ya que en sus
extremos se anula la función V(t). La integral (d, 6), tomada a lo largo del contorno C,
no es singular en el punto z = O; por ello debe coincidir, salvo un factor constante,
..'
..
FIG. 53
con la función F(r:1., y, z), que carece también de singularidades. Para z = O los dos
puntos singulares del integrando coinciden; en virtud de la conocida fórmula de la
teoría de la función r (1)
~
2m
Dado que F( r:1., y, O)
=
f
ett-r dt = 11r(y).
(d.7)
e
l, es evidente que
r(y)
F(~, y, z) = - - .
2m
I.
et(t-z)-ata-r dt.
(d.8)
e
En (d, 5) el integrando tiene puntos singulares en t = O y t = l. Si Re(y- a)> O,
y y no es un entero positivo, como camino de integración se puede elegir el contorno
C' que parte del punto t = 1, rodea en sentido positivo el punto t = O y vuelve
a t = 1 (fig. 54); para Re(y - r:1.) > O, como resultado de recorrer este contorno
la función V(t) vuelve al valor de partida (2). Tampoco la integral así definida es
(1)
Véase, por ejemplo,
WHITTAKER y WATSON,
Course o/ Modern Analysis, Cambridge, 1944, § 12.22.
Si y es un entero positivo, como contorno C' puede elegirse cualquier contorno que rodee a los dos
puntos t = O y t = l.
(2)
696
Apéndices matemáticos
singular en z = O y está ligada con F(oc, y, z) por la relación
1 r(l-oc)r(y)
F(oc,y,z) = - - .
2m r(y-oc)
f
etz(-t)ª-l(l-t)'r-a-1 dt.
(d.9)
C'
Acerca de las integrales (d, 8-9) hay que hacer la siguiente observación. Para
valores no enteros de oc y de y los integrandos son funciones multiformes. Suponemos
que sus valores en cada punto se eligen de manera que la cantidad compleja que se
eleva a una potencia se toma con el argumento de menor valor absoluto.
Haremos notar la útil relación
F(oc,y,z)
= eZF(y-oc,y, -z),
(d.10)
que se obtiene sin más que efectuar en la integral (d, 8) la substitución
t---+ t+z.
Hicimos ya observar que si oc = - n, donde n es un entero positivo, la función
F(oc, y, z) se reduce a un polinomio. Para estos polinomios se puede obtener una
fórmula breve. Efectuando en la integral (d, 9) la substitución t---+ 1 - (t/z) y aplicando a la integral que así se obtiene la fórmula de Cauchy, se encuentra la fórmula
siguiente:
F(-n,y,z) =
Si además es y
=
1
dn
zl-r&-(e-zzr+n-1).
r(r+ 1) ... (y+n-1)
dzn
(d.11)
m, con m entero positivo, vale también la fórmula
(-l)m-1
F(-n,m,z) =
m(m+ 1) ... (m+n-1)
dm+n-1
eZ
dzm+n-1
(e-zzn).
(d.12)
Esta fórmula se obtiene aplicando la fórmula de Cauchy a la integral que resulta
de (d.8) mediante la substitución t---+ z - t.
Los polinomios F(- n, m, z), O ~ m ~ n coinciden, salvo un factor constante,
con los llamados polinomios de Laguerre generalizados, definidos por
La función hipergeométrica confluente
697
(n!)2
Lnm(z) = (-t)m
F(-[n-m],m+l,z)
m!(n-m)I
=
ni
dn
eZ-(e-Zzn-m)
(n-m)! dzn
= (-l}ffl
n!
¿n-m
eZz-m --(e-zzn).
(n-m)!
dzn-m
Los po]inomios Lnm se representan por Ln(z) cuando m
mente, polinomios de Laguerre; según (d, 13) tenemos
(d.13)
= O y se llaman, simple-
La representación integral (d, 8) es cómoda para obtener un desarrollo asintótico de la función hipergeométrica confluente para grandes valores de z. Deformemos el contorno de manera que se convierta en los dos contornos C1 y C2 (fig. 53)
que rodean, respectivamente, los puntos t = O y t = z; hay que imaginar que ]a
rama inferior C2 y la rama superior C1 del camino empalman en el infinito. Dado
que se pretende hallar un desarrollo en potencias negativas de z, saquemos fuera
del paréntesis en e] integrando la expresión (- z)-o:. En la integral a lo largo del
contorno C2 efectuemos la substitución t-+ t+z; con esto transformamos el contorno C2 en el contorno C1• La fórmula (d, 8) se representa así en la forma:
F(1X,y,z) =
r(r)
r(r-lX)
(-z)-ªG(1X,1X-y+l, -z)+
r(r)
1-o: z)
+--eZza-rG(y-lX
r(1X)
,
, ,
donde hemos introducido la notación
G(1X,/3,z) = r(l-/3)
.
2m
f (1+-t)-ª
z
tP-Ietdt.
(d.14)
(d.15)
C1
Al elevarlas a una potencia en Ja fórmula (d, 14), las cantidades - z y z deben
tomarse con el argumento de menor valor absoluto. Finalmente, desarrollando
en el integrando la expresión (1 +t/z)-o: en potencias de t/z y aplicando la fórmula
(d, 7), obtenemos en definitiva para G(rx, (J, z) la serie asintótica
G(1X,/3,z) =
IX/3
1X(1X+ l)/3(,8+ 1)
l!z
2!z2
1+-+
+ ....
(d.16)
698
Apéndices matemáticos
Mediante las fórmulas (d, 14) y (d, 16) se determina el desarrollo asintótico de la
función F(rx., y, z).
Cuando y es entero y positivo, el segundo término en la solución general (d, 4)
de la ecuación (d, 2) o coincide con el primero (si y = 1) o pierde todo sentido
(si y> 1). En este caso, cabe elegir como sistema de soluciones linealmente independientes los dos términos de la fórmula (d, 14), es decir, las integrales (d, 8) tomadas a lo largo de los contornos C1 y C2 (estos contornos, como el contorno C,
satisfacen las condiciones impuestas, de modo que las integraJes a lo largo de los
mismos son también soluciones de la ecuación (d, 2)). La forma asintótica de estas
soluciones viene dada por las fórmulas ya obtenidas; falta hallar su desarrollo en
potencias crecientes de z. Para ello partiremos de la igualdad (d, 14) y de la igualdad
análoga relativa a la función z 1-YF(rx.-y+I, 2-y, z). De estas dos igualdades
se deduce la expresión de G(rx., rx. -y+I, -z) en función de F(rx., y, z) y F(rx.-y+l,
2-y, z); se hace luego y= p+s (p es un número entero positivo) y se pasa al
límite para E-')- O resolviendo la indeterminación mediante la regla de L' HóPITAL.
Como resultado de un cálculo bastante largo se obtiene el desarrollo siguiente:
G(rx, oc-p+ 1, -z)
sen'TT'rx. r(p-rx)
=
'TT'r(p)
00
X
(
Iogz.F(rx,p,z)+
2
r(p)r(rx+s)[ip(cx+s)-ip(p+s)-ip(s+ 1)]
r(rx)r(s+p)r(s+ 1)
s=O
p-1
+
2
s=l
zªX
zs+
r(s)r(rx-s)r(p) )
z-s ,
r(cx)r(p-s)
(-1)&+1
(d.17)
en el que 'Y designa la derivada logarítmica de la función r : 'Y(rx.)
§ e.
La función hipergeométrica
La función hipergeométrica se define dentro del circulo \z\
F(oc,{3,y,z)
= r'(rx.)/r(rx.).
=
<
1 por la serie
rx/3 z rx(rx+ 1)/3(/3+ 1) z2
1+--+
+ ... ,
y 1!
y(y+ 1)
2!
(e.l)
y para izl > 1 se obtiene por prolongación analítica de esta serie. La función hipergeométrica es una integral particular de la ecuación diferencial
z(l-z)u" +[y-(cx+f3+ 1)z]u' -r:,.f3u
=
O.
(e.2)
699
La función hipergeométrica
Los parámetros y f3 son arbitrarios y y=/=- O, - 1, - 2, ... La función F(IX,
es simétrica, evidentemente, respecto de los parámetros IX y f3 (1).
(X
fJ,
y, z)
Una segunda solución de la ecuación (e, 2), independiente de la primera, es:
zl-1F(fJ-y+l, (t.-y+l, 2-y, z);
esta solución tiene un punto singular en z = O.
Como referencia, presentaremos aquí algunas relaciones a las que satisface la
función hipergeométrica.
La función F(IX, fJ, y, z) puede representarse para todo z, si Re(y - IX)> O (2),
en forma de integral
1 r(l-cx)r(y)
F(cx,{3,y,z) = - - .
2m
r(y-cx)
f
(-t)cx-I(l-t)r-a-1(1-tz)-Pdt,
(e.3)
C'
extendida a lo largo del contorno C', representado en Ja fig. 54. Es fácil comprobar
por substitución directa que esta integral satisface, en efecto, la ecuación (e, 2); el
factor constante se elige de manera que la función se reduzca a la unidad para z = O.
La substitución
u = (l -z)Y-rx-/Ju1
aplicada a la-ecuación (e, 2) conduce a una ecuación del mismo tipo con parámetros
y - IX, y -/3 y y en vez de IX, f3 y y, respectivamente. De aquí se sigue la igualdad
F(cx,{3, y, z) = (1-z)r-a-PF(y-cx, y-fJ, y, z);
(e.4)
(ambos miembros de Ja igualdad satisfacen precisamente la misma ecuación y sus
valores coinciden para z = O).
La substitución
t
~
t/(1-z+zt)
en la integral (e, 3) conduce a la siguiente relación entre las funciones hipergeométricas de las variables z y z/(1 - z):
F(cx,{3,y,z) = (l-z)-ªF(cx,y-fJ,y,z/(z-1)).
(1)
La función hipergeométrica confluente se obtiene a partir de F(oc, fJ, y, z) mediante el paso al límite:
F(cx,y,z)
( 2)
(e.5)
= IimF(cx,fJ,y,z/fJ).
p---+00
Esta desigualdad se cumple en todos los casos que se encuentran en las aplicaciones físicas.
Apéndices matemáticos
700
El valor de la expresión multiforme (1 - z)-oc en esta fórmula (y en las expresiones
análogas que se encuentran en las fórmulas que siguen a continuación) se define
por la condición de que la cantidad compleja que se eleva a um, potencia se toma
con un argumento igual al menor en valor absoluto.
Sin deducirla, daremos también la importante fórmula que liga las funciones
hipergeométricas de las variables z y 1/z:
F{cx,,8,y,z)
=
r(y)r(,8-cx)
r(,8)r(y-cx)
(-z)-a:F(cx,cx+l-y,cx+l-,8, 1/z)+
+ r(y)r(cc-,8) (-z)-flF(,8,,8+ l-r,,8+ 1-cx, 1/z).
r(cc)f(y-,8)
Esta fórmula expresa F(oc, /3, y, z) en forma de serie convergente para
decir, representa la prolongación analítica de la serie de partida. (e, 1).
(e.6)
lzl >
1, es
La fórmula
F(cx,,B,y,z)
r(y)r(y-cx-,8)
=
r(y-cx)r(y-,8)
F(cc,,8,cx+,B+l-y, 1-z)+
r(y)r(cc+,8-y)
r(cc)r(,8)
(l-z)1-a:-PF(y-cx,y-,8,y+l-cx-/3, 1-z) (e.7)
+
liga las funciones hipergeométricas de z y de 1 - z (se deduce de manera análoga
a como se deduce (e, 6)). Combinando (e, 7) y (e, 5) con (e, 6), obtenemos las relaciones
F(cc,,B,y,z) =
r(y)r(,B-cx)
r(,8)r(y-cx)
(1-z)-a:F(cx,y-,B,cx+l-,B, 1/(1-z))+
r(y)r(cx-,8)
+ r(cx)r(y-,8) (l-z)-PF(,8, y-cx,,8+ 1-cc, 1/(1-z) ),
F(cc,,8,y,z) =
(e.8)
r(y)r(y-cc-,8)
(
z-1)
z-a:F cx,cx+l-y,cc+,8+1-y,- +
r~-mrfy-~
z
(
z-1)
+ r(y)r(cx+,8-y)
(l-z)r-a:-/lza-rF 1-,B y-,B r+1-oc-,B r(cc)r(,8)
'
,
, z
.
(e.9)
Cada uno de los términos de la suma en los segundos miembros de las igualdades
(e, 6-9) representa por sí solo una solución de la ecuación hipergeométrica.
Si
oc
(o {1) es un número entero negativo (o nulo),
oc = -
n, la función hiper-
Integrales que contienen funciones hipergeométricas confluentes
701
geométrica se reduce a un polinomio de grado n y puede representarse en la forma
F(-n,{1,y,z) =
zl-Y(l-z)'r+n-P
dn
-[z1+n-l(l-z)P-1].
y(y+ 1) ... (y+n-1) dzn
(e.10)
F(r:1., {3, y, z) se reduce a un polinomio también cuando oc = y+n y cuando oc= n,
y = m + 1 (n, m son enteros positivos y n < m). Expresiones explícitas para estos
polinomios se pueden obtener, en el primer caso, combinando (e, 10) con (e, 5),
y en el segundo, con (e, 9).
§ f.
Cálculo de integrales que contienen funciones
Consideremos una integral de la forma
f
00
la./ =
e-AZzvF(a., y, kz) dz.
(f.1)
o
Supongamos que esta integral converge. Para ello debe ser Re v > - 1 y Re;.>
jRejk; si ex es un entero negativo, en vez de la segunda condición basta exigir
que sea Re ). > O.
>
Es fácil calcular la integral (f, 1) utilizando para F(rx, y, kz) la representación
integral (d, 9) y efectuando la integración respecto de z antes que la integración
de contorno:
ff
00
la.yv
=
1 r(l-oc)r(y)
--.
2m r(y-a.)
e--<A-kt)zzv(-t)a.-l(l-t}r-a-1 dtdz
C' O
1 r(l-oc)r(y)
= --
21ri
X
f
r(y-oc)
,\-v-1 r(v+ l)x
(-t)a.-1 (1-t)r-a.-1(1-kt/,\)-v-1 dt.
C'
Teniendo en cuenta (e, 3), encontramos finalmente:
la./= r(v+l),\-v-IF(oc,v+l,y,k/.\).
(f.2)
En los casos en que la función F(oc, v+l, y, k/A) se reduce a un polinomio, para la
integral J r:1.l se obtienen expresiones en términos de funciones elementales:
dn
la.../y+n-1
= (-1 )nr(y) d,\n [,\ª-'Y(,\-k)-ª],
(f.3)
702
Apéndices matemáticos
r(v+ 1)(.\-k)r+n-v-1 dn
]-n,,,V = (-t)n r(r+ 1) ... (y+n-1) d,\n [,\-v-1(.\-k)v-y+l],
+ni (m-n-1) ... (m- l).\«-n-1(.\-k)-l+m-n-«
dm-n-2
d,\m-n-2
(m, n son números enteros, O < n
<
m-
(f.4)
}
[,\m-«-1(.\-k)«-1] ;
(f.S)
2).
Calculemos ahora la integral
f
00
],, =
e-kzzv-l[F(-n,y,kz)]2 dz,
(f.6)
o
i, > O). Para ello partiremos de una integral más general
que contiene en el integrando e-J.z en vez de e-kz.
(n, entero positivo, Re
Escribamos una de las funciones F(- n, y, kz) en forma de integral de contorno
y efectuemos luego la integración respecto de z mediante la fórmula (f, 3):
00
f
o
1 r(l+n)r(y)
e-Azzv-l[F(-n,y,kz)]2 dz = - - .
X
2m
r(y+n)
ff
00
X
(-t)-n-l(l-t)r+n-le-U.-kt>zzv-lF(-n,y,kz) dtdz
OC'
1
r(l+n)r2(y)r(v)
=-27Ti(-t)n
r2(y+n)
X
X
f
dn
(.\-kt-k)r+n-v(-t)-n-1(1-t)r+n-l_[(.\-kt)-v(.\-kt-k)v-r] dt.
d,\n
C'
Es evidente que la derivada n-ésima respecto de). se puede substituir por una derivada
de igual orden respecto de t; una vez hecho esto, hagamos ). = k, volviendo con ello
a la integral lv:
1 r(n+ l)r(v)r2(y)
]v = - X
2Tri
r2(y+n)kv
f
C'
dn
(-t)r-v-l(l-t)r+n-1-[(l-t)-v(-t)v-r] dt.
dtn
703
Integrales que contienen /unciones hipergeométricas confluentes
11
Integrando n veces por partes, transferimos el operador d 11 a Ja expresión (- t)y-v-1
dt
(1 - t)Y+ 11- 1 ; desarrollemos luego la derivada según la fórmula de LEIBNITZ. Como
resultado se obtiene una suma de integrales cada una de las cuales se reduce a la
conocida integral de EuLER. Se llega así finalmente a la siguiente expresión para
la integral buscada:
]v=
r(v)nl
(
kvy(r+ 1) ... (r+n-1)
1+
n(y-v-l)(y-v)
+
12y
n(n- l)(y-v-Z)(y-v-l)(y-v)(r-v+ 1)
+
t2z2r(r+ 1)
+ ... +
n(n-1) ... l(y-v-n) ... (r-v+n-1))
+
1222 ... n2,,(y+ 1) ... (r+n-1)
·
(f.7)
Es fácil ver que entre las integrales lv existe la siguiente relación:
(y-p-l)(y-p) ... (y+p-1)
k2P+l
l,y-1-p,
]-y+P =
(f.8)
(p es un número entero).
De manera análoga se calcula la integral
J
=
J
e-Azz1-lF(r.1.,y,kz)F(r.1.',y,k'z) dz.
(f.9)
o
Representemos la función F(rx.', y, k'z) como integral de contorno e integremos
respecto de z mediante la fórmula (f, 3) (con n = O):
!J
C()
J=
1 rct-r.x')r(y)
-Z1ri r(y-r.x') j
(-t)a'-l(l-t)1-a'-lzr-le-zU-k'tlF(cx, y, kz) dzdt
C' O
1 r(l-cx')r2(y)
= --.
2m
,
f
r(y-r.,.)
(-t)a'-1(1-t)r-a'-l(,\-k't)ª-1(.\-k't-k)-a dt.
C'
La substitución t--+
conduce al resultado
At
k't+1. -
k'
lleva esta integral a la forma (e, 3), lo que
704
Apéndices matemáticos
J =
kk'
r(y);\a+a'-y(>..-k)-ª(>..-k')-<1.'F ( a rx' y
) .
, ' , (>..-k)(>..-k')
Si IX (o IX') es un entero negativo,
expresión en la forma:
J
=
ix
= -
(f.10)
n, la relación (e, 7) permite escribir esta
r2(y)r(y+n-a') ),._-n+a'-'Y(;\-k)n(;\-k')-a'x
r(y+n)r(y-rx')
~;\-k-k1)
xF ( -n,rx',-n+rx'+1-y,(;\-k)(;\-k') .
(f.11)
Finalmente, consideremos las integrales del tipo
f
00
=
]y8P(rx,rx')
e-<k+k,z/2zy-l+sF(rx,y,kz)F(rx',y-p,k'z) dz.
(f.12)
o
Se supone que los valores de los parámetros son tales que la integral es absolutamente convergente; s, p son enteros positivos. La más simple de estas integrales
J y°º( IX, ex') es, según (f, 1O), igual a
],'"'(oc, o.') = 2rr(r)(k+k')"+•' -Y(k' -k)-•(k-k')-•'F(... o.', r,
4kk' )
(k' -k)"
; (f, 13)
y si IX (o IX') es un número entero negativo, ex= - n, de acuerdo con (f, 11) se puede
escribir también
J/º(-n, a.')
r(y)(y-rx')(y-cx' + 1) ... (y-rx' +n-1)
= 2'Y
y(y+ 1) ... (y+n-1)
X
X(-1)n(k+k')-n+<1.'-Y(k-k')n-a'F [ -n, a', cx' + 1-n-y, ( k+k')2]
k-k'
. (f.14)
Se puede deducir una fórmula general para Jy5P(a., a.'), pero es tan complicada, que
resulta incómodo utilizarla. Es más conveniente emplear fórmulas de recurrencia
que permiten reducir las integrales Jy5P(oc, a.') a la integral con s = p = O. Las reproducimos aquí sin demostrarlas (1). La fórmula
(f.15)
1
( )
1929.
La demostración puede encontrarse. en un trabajo de W.
GoRDON,
Annalen der Physik, 2, I03J,
Integrales que contienen /unciones hipergeométricas confluentes
hace posible la reducción de Jy8P(r:x., tX') a la integral con p
] ./+1,0(rJ.., il.
4
1
)
705
= O. La fórmula
= k2-k'2 fü·y(k-k')-ki!.+ k'il. -k'S]j ./º(il., i!.')+
1
1
+s(y-l+s-2rJ..')J'>'s-1.0(rJ.., rJ..')+2e1. s]r3-LO(rJ.., il.
permite luego efectuar la reducción definitiva a la integral con s
1
+ 1)}
= p = O.
(f.16)
INDICE ALFABtTICO
Acoplamiento es, 290
jj, 290
- Russell-Saunders, 494
- spin-órbita, 517
Airy (Función), 87, 688, 383
Alternación, 251
Amplitud de dispersión, 543
- - (Propiedades analiticas), 568
- de onda, 24
- de probabilidad, 7
- parcial de dispersión, 545
Anchura elástica, 643
- inelástica, 644
Anchuras parciales, 643
Anticonmutación, 113
Antihermítico (Operadores), 18
Aparato, 3
- (Carácter clásico), 27
- (Indicacion~). 26
Aproximación de Bdm, 555
- de Russell-Saunders, 290
Área de impacto, 132, 382
Armónicos esféric06, 232
Atómicas (Unidades), 136
Átomo residual, 273
Átomos, 267
- (Capacidad de combinarse), 333
- (Estado de los electrones), 269
- (Términos espectrales), 268
Auger (Efecto), 301
Autoconjugados (Operadores), 14
-
Barrera de potencial, 198
Bessel (Funciones), 124
Bohr (Magnetón), 489
- (Teoría del sistema periódico), 291
- -Somrnerfeld (Regla de cuantificación),
188
Bom (Aproximación), 555
- (Fórmula), 553
Bose (Estadística), 256
- -Einstein (Estadística) 243
Bosones, 243
Breit y Wigner (Fórmulas), 640
«Caída» de una partícula hacia un centro
de fuerzas, 132
Caja de potencial, 76
Cálculo de integrales que contienen funciones hipergeométricas confluentes, 701
Caminos de transición, 216
Campo autoconsistente, 269, 274
- central (Movimiento), 118
- - (Movimiento cuasiclásico), 193
- coulombiano (Movimiento), 135, 146
- de Coulomb repulsivo, 143
- homogéneo (Movimiento), 87
- magnético, 486
- - (Densidad de corriente), 502
- - (Ecuación de Schrodinger), 486
- - hornogéneo, 489
- - - (Movimiento), 489
Canal de entrada, 626
Canales de reacción, 626
Capa cerrada, 270
Carácter de la matriz, 402
Caso cuasiclásico, 183, 561
- - (Condiciones en los límites), 186
- - (Función de onda), 183
- - (P:robabilidad de transici0n), 209
Oayley-Klein (Parámetros), 224
Celda, 190
Centro de simetría, 386
Coeficiente de reflexión, 89
- de transmisión, 88
- - de la barrera de potencial, 200
Coeficientes de composición vectorial, 467
- de Klebsch-Gordan, 467
- de Racah, 477
Colisión de· segunda especie, 373
- elástica cuando son posibles los procesos
- inelástioos, 626
Colisiones elásticas, 542
- - de electrones rápidos con átomos, 613
- entre partículas idénticas, 605
- inelásticas de electrones rápidos con átomos, 659
Composición de momentos cinéticos (Element06 de matriz), 483
708
Indice alfabético
Composición de paridades, 116
Compuestos complejos, 337
Condición de normalización, 8
- de unitariedad en la dispersión, 549
Conexión brusca, 165
Configuración electrónica, 269
Configuraciones (Espacio), 7
- simétricas de una molécula (Estabilidad),
439
Conjugado (Operador), 14
Conmutabilidad (Operadores), 17
Conmutador de dos operadores, 19
Conservativas (Funciones), 33
Constante de Planck, 25
- de rotación, 342
Contravariante de un es-pinor, 224
Coordenada múltiple, 429
Coordenadas parabólicas, 146
- vibracionales (Representación total), 430
- - normales, 429
Coriolis (Interacción), 452
Corrección de Rydberg, 274
Corrimiento de fase, 127
- isotópico, 533
Coulombianas (Unidades), 136
Covariantes, 224
Cuantificación (Grado), 25
- (Segunda), 256, 263
- de la rotación de un sólido, 441
Cuasiclásico (Caso), 561
O.oques inelásticos de partículas pesadas
con átomos, 67 5
De Broglie (Longitud de onda), 61
Degeneración accidental, 101, 138, 273
Densidad de corriente, 66
- - de probabilidad, 67
- - en un campo magnético, 502
Derivada (Concepto respecto del tiempo), 31
Desarrollo de uµa onda plana, 130
Desdoblamiento multiplete, 268
- en multipletes, 350
Desintegración prohibida, 117
Diagonales (Elementos de matriz), 38
Diagrama de Y oung, 252
Difracción de electrones, 1
Dispersión (Amplitud), 543
- (Amplitud parcial) 545
- (Condición de unitariedad), 549
- (Longitud), 580
- (Operador), 550
Dispersión (Relaciones), 574
- (Sección eficaz), 543
- (Teorema óptico), 550
- (Teoría general), 542
- con interacción spin-órbita, 618
- de partículas lentas, 578
- de resonancia de partículas cargadas, 608
- - para pequeñas energías, 584
- inelástica de partículas lentas, 633
- nuclear (Modelo óptico), 647
- para grandes energías, 565
- por moléculas, 678
- potencial, 595
- - (Sección eficaz), 645
- resonante, 595
Dobletes apantallados, 300
- irregulares, 300
- regulares, 300
- .relativistas, 300
Duplicación A, 366
Ecuación de onda, 31
- - relativista de Dirac, 489
- de Schrodinger, 59, 246
- - (Propiedades fundamentales), 62
- - en un campo magnético, 486
- de Thomas-Fermi, 279
- secular, 154
Efecto Auger, 301
- Paschen-Back, 496
- Ramsauer, 580
- Stark, 306
- - en el hidrógeno, 311
- - lineal, 311
- Zeeman, 493
- - anómalo, 495
Eje bilateral, 392
- de giro reflejado, 385
- de simetría n-aria, 384
Ejes equivalentes, 392
Electrón (Grado de polarización), 238
- (Medición de las coordenadas), 4
- completamente polarizado, 236
- parcialmente polarizado, 236
Electrones (Difracción), 1
- en un. átomo (Estados), 269
Elemento del grupo, 388
- de matriz, 37
- inverso del grupo, 388
- unidad del grupo, 388
Elementos (Potenciales de ionización), 292
Indice al/abé&ico
Elementos conjugados, 390
-- de los grupos de transición, 294
- - principales, 294
- - - (Configuraciones electrónicas), 295
- de matriz (Reglas de selección), 108, 415
- - cuasiclásicos (Cálculo), 204
- - de los tensores, 472
- - de vectores, 107
-- - diagonales, 637
- - para una molécula diatómica, 361
- - reducidos, 109, 474
- diagonales, 38
Energía, 33
- (Niveles atómicos), 267
- centrífuga, 120
- de rotación, 342
- de vibración (Niveles), 436
- potencial como perturbación, 178
- rotatoria, 342
Enlace del tipo ;;, 290
- - LS. 290.
- heteropolar, 335
- homopolar, 335
- tipo a, 347
Escala de energía, 123
Escalares en sentido estricto, 11?.
Espacio de configuraciones, 7
- isotópico, 507
Espectro continuo, 10, 19
- - (Sistema de las funciones de onda),
600
- de valores propios, 1O
- discreto, 10
Espinor unidad, 227
Espinores, 221
- antisimétricos, 228
- de orden superior, 227
- simétricos, 227
Estadística de Bose, 256
- de Hose-Einstein, 243
- de Fermi-Dirac, 243
Estado (Paridad), 111
- cuasiestacionario, 177
- fundamental, 34
- ligado, 36
- normal, 34
Estados cuasiestaéionarios, 592
- de carga, 507
- de ortohelio, 275
- de parahelio, 275
- equivalentes (Electrones), 270
- estacionarios, 33
709
Estados intermedios, 174
- mezclados, 47
- puros, 47
Estructura fina, 348
- - del nivel, 268
- - de niveles atómicos, 286
- hiperfina de los niveles atómicos, 535
- - - moleculares, 539
- - de los térmicos, 360
Estructuras de vibración y rotación en una
molécula diatómica, 339
Fase (Corrimiento), 127
- (Factor constante), 8
- de onda, 24
Factor atómico en el modelo Thomas-Fermi,
617
- de fase, 8
- de forma atómico, 615
- de Landé, 495
- giromagnético, 495
Fermat (P.rincipio), 25
Fermi-Dirac (Estadistica), 243
Fcrmiones, 243
Fórmula de Bohr, 273
- de Boro, ~53
- de Rutherford, 597
Fórmulas de Breit y Wigner, 640
Fok (Método), 275
Franke-Condon (Principio), 375
Frecuencia de transición, 37
Frenado eficaz, 670
Fuerzas de van der Waals, 370
- nucleares, 505, 510
- - (Propiedad de saturación), 513
- - (Simetría de carga), 505
- tensoriales, 511
Función de Airy, 87, 383, 688
- de Hankel, 126
- delta, 21
- de onda, 7, 26
- - antisimétrica, 243
- - casi clásica, 25
- - cuasiclásica, 25
- - de coordenadas, 245
- - de spin, 246
- - en el caso cuasiclásico, 183
- - impar, 112
- - par, 112
- - simétrica, 243
- - y medición, 28
- hipergeométrica, 698
- - confluente, 85, 137, 694
710
Indice alfabético
Función propia del operador, 232
- radial, 119
Funciones (Sistema cerrado), 10
- (Sistema completo), 1O
- conservativas, 33
- de Bessel, 124
- de Legendre asociadas, 86
- de onda (Propiedades espinoriales), 223
- - cerca del núcleo, 285
- - de las partículas de spin arbitrario,
228
- propias, 1O
- - del momento cinético, 104
Grado de cuantificación, 25
Grupo (Elemento), 388
- (Elemento inverso), 388
- (Elemento unidad), 388
- (Orden), 389
- abeliano, 389
- del hierro, 295
- - (Configuraciones electrónicas), 296
- del paladio, 295
- - (Configuraciones electrónicas), 296
- de los actínidos (Configuraciones electrónicas), 297
- del ,platino, 295
- - (Configuraciones electrónicas), 2%
- de permutactones, 388
- de rotaciones, 419
- - bidimensional, 419
- de simetrías, 388
Grupos (Representaciones), 400
- (Teoría), 3,88
- ciclkos, 389
- continuos, 419
- de simetría axil, 419
- - esférica, 419
- de transformaciones, 388
- de transición (Elementos), 294
- finitos, 388
- isomorfos, 391
- principales (Elementos), 294
- puntuales, 391
- - (Representaciones irreducibles), 408
- - continuos, 400, 419
- - dobles, 423
- - finitos (Representaciones bivalentes),
422
Hamilton (Operador), 30
- (Principio), 25
Hamiltoniano del sistema, 31
Hankel (Función), 126
Heisenberg (Representación), 44
Hermite (Polinomios), 82, 685
Hermítico (Operador), 14
Hidrógeno (Efecto Stark), 311
Hoja física de la superficie de Riemann, 569
- no física de la superficie de Riemann, 569
Hund (Regla), 270
Iconal, 24
Impacto (Parámetro), 132
Impulso, 49
Indeterminación (Principio),
- (Relaciones), 54
Indicaciones del aparato, 26
índice de spin, 218
índices mudos, 97
Indistinguibilidad (Principio), 242
Instante de transición, 213
Integral de intercambio, 249
Intensidades de. los osciladores, 673
Interacción (Radio efectivo), 588
- de átomos a grandes distancias, 369
- de Coriolis, 452
- de intercambio, 245
- de las vibraciones y de la rotación de
una molécula, 449
- en el estado final en el caso de reacciones, 649
- spin-eje, 347
- - -órbita, 286
- - -spin, 286
Intercambio (Integral), 249
Intersección de términos electrónicos, 323
Invariancia ~otópica, 505
Inversión del tiempo, 238
Inversos (Operadores), 17
Isomorfismo, 391
Isotropía, 95
Klebsch-Gordan (Coeficientes), 467
Kramers (Teorema), 240
Laguerre {Polinomios generalizados), 138
Landé (Factor), 495
- (Regla de intervalos), 28,8
Laplace (Método), 685
Legendre (Polinomios), 105, 691
- (Polinomios asociados), 105
Ley de composición de momentos cinéticos,
114
-
de conservación de la paridad, 112
Indice al/abético
Longitud de dispersión, 580
- de onda de De Broglie, 61, 194
Magnetón de Bohr, 489
Magnetones nucleares, 489
Magnitudes físicas, 6
Masa de la partícula, 59
- reducida, 118
Matriz (Carácter), 402
- (Elementos), 108
- (Elementos reducidos), 109
- de dispersión en las reacciones, 636
- de la transformación, 400
- densidad, 45
- - (Elementos diagonales), 47
- - de spin, 237
- de una magnitud física, 40
- reducida a la forma diagonal, 40
- S, 550
Matrices, 36
- (Regla de multiplicación), 39
- {Transformación), 42
- de Pauli, 222
- hermíticas, 38
Mecánica cuá,ntica, 2
- ondulatoria, 2
Medición, 3
- (Proceso), 4
- de las coordenadas del electrón, 4
Mediciones predecibles, 6
Mendeleev (Sistema periódico), 291
Método de Laplace, 685
Modelo de capas, 515
- óptico, 649
- - de dispersión nuclear, 647
- Thomas-Fermi (Factor atómico), 617
- vectorial, 116
Molécula (Función de onda), 360
- diatómica, 320
- - (Elementos de matriz), 361
- - (Perturbaciones en el espectro), 381
- - (Términos electrónicos), 320
Moléculas poliatómicas, 428
Momento cinético, 95, 121
- - (Funciones propias), 104
- - (Valores propios), 100
- - orbital, 217
- - - total, 220
-- - propio, 217
- - vibratorio, 450
- cuadripolar, 302
- dipolar, 302
711
Momentos (Suma), 114
- cinéticos (Elementos de matriz en la composición), 483
- - (Ley de composición), 114
- multipolares, 302
Movimiento cuasiclásico en un campo central, 193
- cuasiperiódico, 192
- del núcleo, 217
- de un campo coulombiano, 135
- en una dimensión (Propiedades generales), 71
- en un campo central, 118
- - - coulombiano (Coordenadas parabólicas), 146
- -- - homogéneo, 86
- libre, 122
M ultiplete invertido, 289
Multipletes normales, 289
Multiplicación de espinores, 227
Multiplicidad del término, 268, 321
Muro de potencial, 88
Nivel cuasidiscreto, 589
- - (Resonancia), 591
- virtual, 587
Niveles atómicos (Estructura fina), 286
- - (Estructura hiperfina), 535
- - de energía, 267
- de energía degenerados, 34
- - de vibración, 436
- - hidrogenoides, 273
- energéticos, 34
- moleculares (Estructura hiperfina), 539
Nodos, 70
Normalización (Condición), 8
Núcleo compuesto, 640
- del operador, 13
- inmóvil, 528
- residual, 530
Nucleón (Operador de carga), 509
Nucleones, 505
Núcleos doblemente mágicos, 521
- espejos, 505
- no esféricos, 527
Número cuántico acimutal, 121
- - magnético, 121
- - parabólico, 148
- - principal, 138, 148, 269
- - radial, 121
- - vibratorio, 342
- de onda, 122, 190
712
Indice alfabético
Números de ocupación, 257
- mágicos, 521
Onda (Amplitud), 24
- (Ecuación), 31
- (Pase), 24
- (Función), 7, 26
- (Número), 190
- esférica convergente, 126
- - divergente, 125
- - estacionaria, 125
- plana (Desarrollo), 130
Ondas planas estacionarias, 72
Operador (Núcleo), 13
- antihermHico, 18
- conjugado, 14
- de carga del. nucleón, 509
- de creación, 259
- de destrucción, 258
- de dispersión, 550
- de Hamilton, 30
- de wtación, 95
- - infinitesimal, 95
- hamiltoniano, 31
-- hermítico, 14
- impulso, 50
- matemático, 12
- transpuesto, 14
Operadores, 9
- (Derivación respecto del tiempo), 31
- (Potencia), 17 ·
- (Producto}, 16
- (Suma), 15
- autoconjugados, 14
- de spin, 218
- del momerito cinético total, 220
- en la representación de Heisenberg, 44
- inversos, 17
- que conmutan, 17
Orbital, 246
Orden del grupo, 389
Ortogonalidad de las funciones, 12
Ortohelio (Estados), 275
Ortohidrógeno, 361
Ortonormal (Sistema), 12
Oscilación (Teorema), 72
Oscilador lineal, 79
- - (Hamiltoniano), 79
Osciladores ('Intensidades), 673
Paquete de ondas, 25
Parahelio (Estados), 275
Parahidrógeno, 361
Parámetro de impacto, 132, 382, 542
Parámetros (Separación), 147
- de Cayley-Klein, 224
Paréntesis de Poisson, 32
Paridad (Ley de conservación), 112
- de un estado, 111
Partícula cuasiclásica, 185
- de medida, 176
Partículas cargadas (Dispersión de resonancia), 608
- idénticas, 242
- - (Colisiones), 605
- lentas (Dispersión), 578
- - (Dispersión inelástica), 633
Paschen-iBack (Efec:Jo), 496
Paso al límite, 24
- a través de una barrera de potencial, 198
Pauli (Matrices), 222
- (Principio), 243
Permutación impar, 251
- par, 251
Permutaciones (Simetría}, 250
Perturbación periódica (Transiciones provocadas), 170
Perturbaciones, 151
- (Teoría), 150
- adiabáticas, 213
- dependientes del tiempo, 159
- en el espectro de moléculas, 381
- independientes del tiempo, 150
Peso estadístico, 360
- - nuclear, 456
Planck (Constante)_. 25
Plano de simetría, 385
Poisson (Paréntesis}, 32
Polarización parcial de las partículas, 236
Polinomios asociados de Legendre, 105, 691
- de Hermite, 82, 685
- de Legendre, 105, 691
- generalizados de Laguerre, 696
Polos redundantes, 573
Potencia de operadores, 17
Potencial (Pozo), 75
Potenciales retardados, 178
Pozo de potencial, 75
Principio de Fermat, 25
- de Frank-Condon, 375
- de Hamilton, 25
- de indeterminación, 1
- de indistinguibilidad, 242
- de la mínima acción, 25
- del equilibrio detallado, 639
Indice al/abético
Principio de Pauli, 244
- de relatividad de Galileo, 59
- de superposición, 7
- - de los estados, 9
- variacional, 68
Predisociación, 373
Probabilidad de transición en el caso cuasiclásico, 209
Producto antisimétrico, 406
- de operadores, 16
- simétrico, 406
Productos simetrizados, 18
P·ropiedad de saturación de las fuerzas nucleares, 513
Pseudoescalares, 112
Punto de transición, 209
Puntos de retroceso, 185
Racah (Coeficientes), 477
Radio de Bohr, 136
efectivo de la interacción, 588
Ramsauer (Efecto), 580
Reflexión (Coeficiente), 89
- por encima de la barrera, 209
- total, 89
Regiones clásicamente inaccesibles, 185
Regla de cuantificación de Bohr-Sommerfeld,
188
- de intervalos de Landé, 288
- de Hund, 270
Reglas de selección para los elementos de
matriz, 4IS
Relación de indeterminación para la energía, 175
- entre espinores y tensores, 231
- entre términos moleculares y atómicos
327
'
Relaciones de dispersión, 574
- de indeterminación, 54
Representaciones bivalentes de los grupos
puntuales finitos, 422
- de grupos, 400
(Base), 401
- (Dimensión), 401
equivalentes, 402
- irreducibles, 403
- - de los grupos puntuales, 408
- reducibles, 403
- regulares, 405
- unidad, 406
Resonancia en un nivel cuasidiscreto, 591
Rotación (Constante), 342
713
Rotación (Energía), 342
- de un sólido (Cuantificación), 441
Rotador (Sistemas), 342
Russell-Saunders (Aproximación), 290
Rutherf ord (Fórmula), 597
Schrodinger (Ecuación), 246
Sección eficaz de dispersión, 543
- potencial, 645
- - de reacción, 627
- de transporte, 558
- - parcial, 545
Secciones eficaces cerca del umbral de reacción (Comportamiento), 652
Secular (Ecuación), 154
Segunda cuantificación, 256, 263
Simbolismo, 121
Simbolo-9 j, 481
Símboios-3 nj, 482
-3 ;. 463
- -6j, 475
Simetría (Centro , 386
- (Plano), 385
- (Teoría), 3,84
(Transformaciones), 384
- de carga, 505
de los términos moleculares, 358
- respecto de las permutaciones, 250
Simetrías {Grupos), 388
Sistema cerrado de funciones, 1O
- completo de funciones, 1O
- cuasiclásico, 25
de las funciones de onda del espectro
continuo, 600
- físico, 5
- ortonormal, 12
- periódico de los elementos, 291
Sistemas completos, 6
Simetrización, 251
Simetrizados (Productos), 18
Spin, 217
(índice), 218
- (Operadores), 218
- (Variable), 218
- en un campo magnético variable, 500
- isotópico, 507
- nuclear, 519
- -órbita (Acoplamiento), 517
- total, 220
Stark (Efecto), 306
Subgrupo, 389
Subsistemas, 483
714
Indice alfabético
Suma de momentos, 114
- de operadores, 15
Superposición (Principio), 7
Tensor axil unidad, 97
- esférico, 472
- irreducible, 233
- métrico, 224
- unidad anti.simétrico, 97
Tensores (Elementos de matriz), 472
Teorema de Kramers, 240
- de oscilación, 71
- de reciprocidad, 551
óptico de la dispersión, 550
Teoría de grupos, 388
- de la simetria, 384
de perturbaciones, 150
Término antisimétrico, 360
- simétrico, 360
Términos de rayos X, 299
- electrónicos (Intersección), 323
- - de la molécula, 320
- espectrales de átomos, 268
- moleculares (Clasificación), 454
- - (Simetría), 358
- - y átomos (Relación), 327
- multiplete, 347
- - Caso a., 347
- Caso b, 347, 351
- - Casos e y d, 3SS
- negativos, 353
- positivos, 3'58
Thomas-Fermi (Ecuación), 279
Tierras raras, 298
- - (Configuraciones elect'l'ónicas), 297
Tipo jj (Enlace), 290
- LS (Enlace), 290
Transformación (Matriz), 400
- de inversión, 111
de matrices, 42
- idéntica, 384
Transformaciones (Grupos), 388
- binarias, 224
- de simetría, 384
Transición, 37
prohibida, 663
Transiciones debidas a perturbaciones adiabáticas, 213
- debidas a una perturbación, 164
en el es,PeC:tro continuo, 172
- provocadas por una perturbación periódica, 170
Transmisión (Coeficiente). 88
Transpuesto (Operador), 14
Trayectoria de la transición, 209
Trayectorias complejas, 567
Traza de las matrices, 43
Trompo, 442
- asimétrico, 443
- esférico, 442
simétrico, 443
Umbral de reacción, 652
Unidad atómica de carga, 136
- - de energía, 136
- - de longitud, 136
Unidades atómicas, 136
- coulombianas, 136
Valencia, 331
Valor medio, 12
Valores propios, 10
- del momento cinético, 100
Van der Waals (Fuerzas), 370
Variable de spin, 218
Variación adiabática, 165
Vibraciones moleculares (Clasificación), 428
Wigner (Símholos-3 j), 465
Young (Diagrama}, 252
Zeeman (Efecto), 493