Academia.eduAcademia.edu

Fisica Teorica Vol 3 (Teoria Cuantica No Relativista)

FÍSICA TEÓRICA TEORIA CUANTICA (NO-RELATIVISTA) y LANDAU LIFSHITZ VOLÚMEN 3 SEGUNDA EDICIÓN CURSO DE FÍSICA TEÓRICA Volumen 3 MECÁNICA CUÁNTICA NO-RELATIVISTA L. D. LANDAU E. M. LIFSHITZ Academia de Ciencias, U. R. S. S. MECÁNICA CUÁNTICA NO-RELATIVISTA Volumen 3 del CURSO DE FÍSICA TEÓRICA EDITORIAL REVERTÉ, S. A. BARCELONA-BOGOT_i\-BUENOS AIRES-CARACAS-MÉXICO-RIO DE JANEIRO Titulo de la obra original KBAHTOBAR MEXAHHKA HepenHTHBBCTCRaH TeOpHH Editada por MEZHDUNARODNAYA KNIGA, Moscou Versión española directamente del ruso por el Prof. Dr. Ramón Ortiz Fornaguera Jefe de la División de Física Teórica de la Junta de Energía Nuclear - Madrid Propiedad de EDITORIAL REVERTÉ, S. A. Encarnación, 86. Barcelona (24) Reservados todos los derechos. Ninguna parte del material cubierto por este título de propiedad literaria puede ser reproducida, almacenada en un sistema de informática o transmitida de cualquier forma o por cualquier medio electrónico, mecánico, fotocopia, grabación u otros métodos sin el previo y expreso permiso por escrito del editor. Edición en español © EDITORIAL REVERTÉ, S. A., 1983 Impreso en España Printed in Spain ISBN - 84 - 291 - 4079 - 4 obra completa ISBN - 84 - 291 - 4083 - 2 tomo 3 Dep. Leg. B. 44,225 - 1g(j2 LITOCLUB, S.A. - Nilpoles, 300 - Barcelona-25 DEL PRÓLOGO A LA PRIMERA EDICIÓN Junto a los fundamentos de la mecánica cuántica, se exponen también en el libro sus numerosas aplicaciones en grado considerablemente mayor que el normal en los cursos generales de mecánica cuántica. Hemos dejado a un lado tan.sólo aquellas cuestiones cuyo estudio exigiría de modo esencial el realizar a la vez un detallado análisis de los datos experimentales, lo que inevitablemente se saldría de los límites de la obra. Hemos intentado exponer de la manera lo más completa posible los diferentes problemas concretos. En relación con esto hay que decir que se han estimado innecesarias las referencias a los trabajos originales, limitándonos a indicar sus autores. Como en los tomos precedentes, nos esforzamos en presentar las cuestiones generales de tal manera que, en lo posible, resulte claramente evidente la esencia física de Ja teoría y sobre esta base se construye el formalismo matemático. Esto se advierte particularmente en los primeros párrafos del libro, dedicados a elucidar las propiedades generales de los operadores de la mecánica cuántica. En contraste con el esquema de exposición que se adopta de ordinario, esquema que parte de teoremas matemáticos referentes a los operadores lineales, nosotros, al revés, deducimos las condiciones matemáticas que se imponen a los operadores y funciones propias partiendo del planteo físico del problema. Es imposible dejar de hacer notar que en muchos cursos de mecánica cuántica la exposición se ha complicado considerablemente en comparación con los trabajos originales. Aunque esta complicación se suele justificar por razones de generalidad y de rigor, sin embargo, un examen atento permite advertir fácilmente que en realidad, una y otro, son con frecuencia ilusorios, hasta tal punto que una parte considerable de los teoremas « rigurosos » es errónea. Dado que ese complicar la exposición nos parece algo completamente injustificado, hemos tendido a la mayor simplicidad y, en muchos casos, se ha vuelto a los trabajos originales. Algunos conocimientos puramente matemáticos se presentan al final del libro en forma de « Apéndices matemáticos», para, en lo posible, no interrumpir la exposición en el texto con incisos orientados hacia lo que es puramente cálculo. Estos apéndices persiguen también una finalidad informativa general. V PRÓLOGO A LA SEGUNDA EDICIÓN El tercer tomo del Curso de física teórica está dedicado a la exposición de la mecánica cuántica no relativista. La teoría cuántica relativista, en cambio, formará el contenido del volumen siguiente. Entendemos aquí por teoría relativista, en el más amplio sentido, la teoría de todos los fenómenos cuánticos que dependen de la velocidad de. la luz de manera esencial. De acuerdo con esto, en ella se incluirá no sólo la teoría basada en la ecuación relativista de Dirac, sino también y de modo general toda la teoría cuántica de la radiación. Para esta segunda edición, el libro ha sido revisado y ampliado considerablemente, si bien el plan general de la obra, al igual que su carácter, siguen siendo los mismos. La revisión ha afectado a todos los capítulos. En particular, en las secciones que se refieren a la teoría de la composición de momentos y a la teoría de las colisiones se han realizado grandes cambíos. Se ha añadido un nuevo capítulo acerca de la estructura del núcleo; de acuerdo con el plan general del Curso, estas cuestiones se exponen aquí tan sólo en la medida en que es conveniente fiacerlo sin entrar a la vez en un análisis detallado de los datos experimentales. Quisiéramos expresar nuestra sincera gratitud a todos aquellos numerosos compañeros que nos han hecho observaciones referentes a la primera edición del libro, observaciones que se han tenido en cuenta al redactarlo de nuevo. Una gran cantidad de ellas, relativas a la teoría de las colisiones, fueron hechas por la. A. Smorodinskii. Agradecemos en particular a L. P. Pitaevskii la gran ayuda prestaqa en la corrección de fórmulas y problemas y en la lectura de las pruebas de imprenta. L. D. Moscú, enero de 1962. vii LANDAU y E. M. LIFSHITZ NOTACIONES Los operadores se caracterizan por el símbolo " Elemento del espacio de configuraciones dq. rnm = ¡n = (ni f lm) Elementos de matriz de la magnitud f (véase la definición m en la página 14) Frecuencias de las transiciones Wnm = (En - Em)/li Conmutador de dos operadores {/,g} = /g-g/ 1J Hamiltoniano Campo eléctrico y campo magnético lf, Ye Si Corrimientos de fase de las funciones de onda ~' Tensor unidad antisimétrico ÍNDICE DE MATERIAS CAPÍTJJLO l. CONCEPTOS FUNDAMENTALES DE LA MECÁNICA CUÁNTICA t 2 3 4 5 El principio de la indeterminación ................................... . El principio de la superposición ..................................... . Operadores ......................................................... . Suma y producto de operadores ..................................... . El espectro continuo ............................................... . 6 El paso al límite ................................................... . 7 Función de onda y medición ....................................... . CAPÍTULO JI. 1 1 7 9 15 19 24 26 ENERGÍA E IMPULSO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 8 El operador de Hamilton ........................................... . 9 Derivación de los operadores respecto del tiempo ..................... . 1O Estados estacionarios ............................................... . 11 Matrices ........................................................... . 12 Transformación de matrices ......................................... . 13 Los operadores en la representación de Heisenberg ................... . 14 La matriz densidad ................................................. . 15 Impulso ........................................................... . 16 Relaciones de indeterminación ....................................... . 30 31 33 36 42 44 45 49 54 CAPÍTULO 111. LA ECUACIÓN DE SCHRODINGER ...............................•.. 17 La ecuación 18 Propiedades 19 Densidad de 20 El principio de Schrodinger ......................................... . fundamentales de la ecuación de Schrodinger ............. . corriente ............................................... . variacional ............................................. . 21 Propiedades generales del movimiento en una dimensión ............... . 22 El pozo de potencial ............................................... . 23 El oscilador lineal ................................................. . 24 Movimiento en un campo homogéneo ................................. . 25 Coeficiente de transmisión ........................................... . IV. MOMENTO CIÉTICO Momento cinético . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 Valores propios del ntomento cinético . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 Funciones propias del momento cinético . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 Elementos de matriz de vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . CAPÍTULO 26 Xl 59 59 62 66 68 71 75 79 86 88 95 95 100 104 l 07 30 Paridad de un estado ........... , ................................... . 31 Suma de momentos ................................................. . MOVIMIENTO EN UN CAMPO CENTRAL ••....•..•...•••..•.•...•••... 118 Movimiento en un campo central ..................................... . Movimiento libre (coordenadas esféricas) ............................. . Desarrollo de una onda plana ....................................... . «Caída» de una particula hacia un centro de fuerzas ................. . Movimiento de un campo coulombiano (coordenadas esféricas) ......... . Movimiento en un campo coulombiano (coordenadas parabólicas) ....... . 118 VI. TEORÍA DE PERTURBACIONES . . . . • . . . • . . • • . . . . . . . . . . . . . . . . . • . . . . . Perturbaciones independientes del tiempo ............................. . La ecuación secular ................................................. . Perturbaciones dependientes del tiempo ............................... . Transiciones debidas a una perturbación que actúa durante un tiempo finito .. Transiciones provocadas por una perturbación periódica ........... : .... . Transiciones en el espectro continuo ................................. . La relación de indeterminación para Ja energía ....................... . La energia potencial como perturbación ............................. . 150 CAPÍTULO 32 33 34 35 36 37 V. CAPÍTULO 38 39 40 41 42 43 44 45 111 114 VII. EL CASO CUASICLÁSICO ..•..•...•.••....•.... : .•.•....•.....•.. 46 La función de onda en el caso cuasiclásico ........................... . 47 Condiciones en los límites en el caso cuasiclásico ..................... . 48 Regla de cuantificación de Bohr-Sommerfeld ........................... . 49 Movimiento cuasiclásico en un campo central ......................... . 50 Paso a través de una barrera de potencial ........................... . 51 Cálculo de los elementos de matriz cuasic1ásicos ....................... . 52 Probabilidad de transición en el caso cuasiclásico 53 Transiciones debidas a perturbaciones adiabáticas ..................... . CAPÍTULO VIII. SPIN • . . . . . . . . . . . . . . . . . . . . . . . . . . • • . . . . • . . . . . . . . . . . . . . . . . . • . . . 54 Spin ............................................................... . 55 Espinores ........................................................... . 56 Espinores de orden superior ........................................ . 51 Funciones de onda de las partículas de spin arbitrario ................. . 58 La relación entre espinores y tensores ............................... . 59 Polarización parcial de las partículas ................................. . 60 Inversión del tiempo y teorema de Kramers ...•........................ CAPÍTULO IX. PARTÍCULAS IDÉNTICAS ................•.........•..••...••..•..• Principio de indistinguibilidad de las partículas idénticas ............... . Interacción de intercambio ........................................... . Simetría respecto de las perturbaciones ............................... . Segunda cuantificación. Estadística de Bose ........................... . 65 Segunda cuantificación. CaBo de la estadísttca de Fermi ............... . CAPÍTULO 61 62 63 64 xii 122 130 132 135 146 150 154 159 163 170 172 175 178 183 183 186 188 193 198 204 209 213 217 217 221 227 228 231 236 238 242 242 245 250 256 263 X. EL CAPÍTUW 66 67 68 69 70 71 72 73 74 75 76 77 ÁTOMO •••..•..•.•......•••••••.•••••••...•..••••••••••••••• Niveles atómicos de energía ......................................... . Estados de los electrones en un átomo ............................... . Niveles de energía hidrogenoides .................................... . El campo autoconsistente ........................................... . Ecuación de Thomas-Fermi ......................................... . Funciones de onda de los electrones exteriores cerca del núcleo ......... . Estructura fina de ios -niveles atómicos ............................... . El sistema periódico de los elementos de D. l. Mendeleev ............... . Términos de rayos X ............................................... . Momentos multipolares ............................................. . Efecto Stark ....................................................... . El efecto Stark en el hidrógeno ..................................... . 267 267 269 273 274 279 285 286 291 299 302 306 311 LA MOLÉCULA DIATÓMICA .........•............•.•..••...••.••..• 320 78 Términos electrónicos de una molécula diatómica ..................... . 79 La intersección de términos electrónicos ........................... , .. 80 Relación entre los términos moleculares y los atómicos ................. . 81 La valencia ......................................................... . 82 Estructuras de vibración y rotación de los términos singlete de una molécula diatómica .................................................. , .. , . , 83 Términos multiplete. Caso a ........................................ . 84 Términos multiplete. Caso b ........................................ . 85 Términos multiplete. Casos e y d ............................... ·.... . 86 Simetría de los términos moleculares ................................. , . 87 Elementos de matriz para una molécula diatómica ..................... . 88 Duplicación A ............................................... , · .. ·. 89 La interacción de los átomos a grandes distancias ....................... . 90 Predisociación .............................. , .......... , , . · , · · · · · · · · · · 320 CAPÍTUW CAPÍTUW 91 92 93 94 95 96 97 98 99 XI. XII. TEORÍA DE LA SIMETRÍA Transformaciones de simetría ....................................... . Grupos de transformaciones ......................................... . Grupos puntuales ................................................... . Representaciones de los grupos ....................................... . Representaciones irreducibles de los grupos puntuales ................... . Representaciones irreducibles y la clasificación de los términos ........... . Reglas de selección para los elementos matriz ......................... . Grupos continuos ................................................... . Representaciones bivalentes de los grupos puntuales finitos ............... . CAPÍTULO XIII. MOLÉCULAS POLIATÓMICAS ............•..•........•• : ..•..•••. 100 Clasificación de las vibraciones moleculares ............................. . 101 Niveles de energía de vibración ....................................... . 102 Estabilidad de las configuraciones simétricas de una molécula ............. . xiii 323 327 331 339 347 351 355 358 361 366 369 373 384 384 388 391 400 408 413 415 419 422 428 428 436 439 103 Cuantificación de la rotación de un sólido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Interacción de las vibraciones y de la rotación de un molécula . . . . . . . . . . Clasificación de los términos moleculares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104 105 COMPOSICIÓN DE MOMENTOS CINÉTICOS . . . . . . . . . . . . . . . . . . . . . . . . . . 463 106 Símbolos 3j 107 Elementos de matriz de los tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 Símbolos 6i . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 Los elementos de matriz en la composición de momentos cinéticos 463 472 CAPÍTULO XV. 475 483 MOVIMIENTO EN UN CAMPO MAGNÉTICO . . . • . . . . . . . . . . . . . • . . . . . . . . • . 486 La ecuación de Schrodinger en un campo magnético . . . . . . . . . . . . . . . . . . . . Movimiento en un campo magnético homogéneo . . . . . . . . . . . . . . . . . . . . . . . . Efecto Zeeman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . El spin en un campo magnético variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . La densidad de corriente en un campo magnético . . . . . . . . . . . . . . . . . . . . . . . . 486 489 CAPÍTULO 110 111 112 113 114 XIV. 441 449 454 CAPÍTULO XVI. ESTRUCTURA DEL NÚCLEO Al'ÓMICO . . . • . . . • . . . • . . • • . . . . . . . . . . . . . . Invariancia isotópica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Fuerzas nucleares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . E1 modelo de capas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Núcleos no esféricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 El corrimiento isotópico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 Estructura hiperfina de los niveles atómicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 Estructura hiperfina de los niveles moleculares . . . . . . . . . . . . . . . . . . . . . . . . 115 116 117 118 502 505 505 510 515 527 533 535 539 TEORÍA DE LAS COLISIONES ELÁSTICAS • . . • • . • . . • . • . • . . • . . • . . . . . • 542 122 Teoría general de la dispersión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 Estudio ·de la fórmula general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 La condición de unitariedad en la dispersión . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 Fórmula de Born . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126 El caso cuasiclásico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 Dispersión para grandes energías . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 Propiedades analíticas de la amplitud de dispersión . . . . . . . . . . . . . . . . . . . . 129 Relaciones de dispersión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 Dispersión de particulas lentas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 Dispersión de resonancia para pequeñas energías . . . . . . . . . . . . . . . . . . . . . . . . 132 Resonancia en un nivel cuasidiscreto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 Fórmula de Rutherford . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 El sistema de las funciones de onda del espectro continuo . . . . . . . . . . . . . . . 135 Colisiones entre partículas idénticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 Dispersión de resonancia de partículas cargadas . . . . . . . . . . . . . . . . . . . . . . . . 137 Colisiones elásticas de electrones rápidos con átomos . . . . . . . . . . . . . . . . . . . . 138 La dispensión con interacción spin-órbita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 542 546 549 553 CAPÍTULO XVII. 493 500 xiv 561 565 568 574 578 584 591 597 600 605 608 613 618 CAPÍTULO 139 140 141 142 143 144 145 146 147 148 XVIII. TEORÍA DE LAS COLISIONES INELÁSfICAS La colición elástica cuando son posibles los procesos inelásticos . . . . . . . . . . Dispersión ínelástica de partículas lentas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . La matriz de dispersión en las reacciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Fórmulas de Breit. y Wigner . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Interacción en el estado final en el caso de reacciones . . . . . . . . . . . . . . . . . . . . Comportamiento de las reacciones eficaces cerca del umbral de reacción . . . . Colisiones inelásticas de electrones rápidos con átomos . . . . . . . . . . . . . . . . . . Frenado eficaz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Choques inelásticos de partículas pesadas con átomos . . . . . . . . . . . . . . . . . . . . Dispersión por moléculas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 626 626 633 636 640 649 652 659 670 675 678 APÉNDICES MATEMÁTICOS . . . . • . . . . . . • • . . . . • . . . . • • . • . . . . . . . . . . . . . . . . . • . . • • . . . . . • 685 Polinomios de Hermite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Función de Airy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Polinomios de Legendre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . La función hipergeométrica confluente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . La función hipergeométrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Cálculo de integrales que contienen funciones hipergeométricas confluentes. . . 685 688 691 694 698 701 a b e d e f 707 ÍNDICE XV CURSO DE FfSICA TEÓRICA Volumen 3 MECÁNICA CUÁNTICA NO-RELATIVISTA CAPÍTULO I CONCEPTOS FUNDAMENTALES DE LA MECÁNICA CUÁNTICA § 1. El principio de indeterminación Cuando se intenta aplicar la mecánica y la eiectrodinámica clásicas a la explicación de los fenómenos atómicos, ambas conducen a resultados que se encuentran en abierta contradicción con la experiencia. Un ejemplo muy claro de esto lo proporciona ya la contradicción a que se llega al aplicar la electrodinámica ordinaria al modelo de átomo en el que los eiectrones se mueven en torno del núc1eo siguiendo órbitas clásicas. En este movimiento, como en cualquie, movimiento acelerado de las cargas, los electrones deberían radiar continuamente ondas electromagnéticas. Con la radiación, los electrones perderían su energía y esto debería conducir, en último término, a su caída sobre el núcleo. Así, pues, según la electrodinámica clásica el átomo sería inestable, lo que en modo alguno corresponde a la realidad. Esta profunda contradicción entre teoría y experimento nos dice que la construcción de una teoría aplicable a los fenómenos atómicos - esto es, a fenómenos que ocurren con partículas de masa muy pequeña y en muy pequeñas regiones del espacio-, exige un cambio esencial en las leyes y nociones fundamentales de las teorías clásicas. Como punto de partida para descubrir cuáles son estos cambios resulta conveniente adoptar un fenómeno observado experimentalmente, la Jlamada difracción de los electrones (1 ). Cuando un haz homogéneo de electrones atraviesa un cristal, a la salida del mismo se observa una figura constituida por máximos y mínimos de intensidad consecutivos del todo análoga a la figura de difracción que se observa en la difracción de las ondas electromagnéticas. Así, en cie:tas condiciones el comportamiento de las partículas materiales - de los electrones - presenta rasgos típicos de los procesos ondulatorios. El siguiente experimento ideal, que corresponde a una esquematización de la 1 ( ) En realidad, el fenómeno de la difracción de los electrones fue descubierto después de fundada ya la mecánica cuántica. Sin embargo, en nuestra exposición no nos atenemos al desarrollo histórico de la teoría, sino que tratamos de construirla de tal manera que mejor quede de manifiesto cómo los principios fundamentales de la mecánica cuántica están ligados con fenómenos observados. 2 Conceptos fundamentales de la mecánica cuántica difracción electrónica por un cristal, pone claramente de manifiesto hasta qué punto es profunda la contradicción entre este fenómeno y las nociones ordinarias acerca del movimiento. Imaginemos una pantalla que no se deja atravesar por los electrones y en la cual se han practicado dos rendijas. Si se observa el paso del haz de electrones (1) por una de ellas, cuando la otra rendija permanece cerrada, obtenemos sobre una pantalla plana colocada detrás de la rendija una cierta figura de distribución de la intensidad; de la misma manera obtenemos otra figura abriendo la segunda rendija y cerrando la primera. En cambio, observando el paso del haz simultáneamente por las dos rendijas, de acuerdo con las ideas ordinarias, deberíamos esperar hallar una figura consistente en la simple superposición de las dos anteriores, ya que cada electrón, moviéndose en su trayectoria, pasa por una de las· rendijas sin ejercer influencia alguna sobre los electrones que pasan por la otra. El fenómeno de la difracción electrónica muestra, sin embargo, que en realidad se obtiene una figura de difracción que, gracias a la interferencia, de ningún modo se reduce a la suma de las figuras dadas por cada una de las rendijas por separado. Es claro que este resultado en manera alguna se puede conciliar con el concepto de movimiento de los electrones a lo largo de una trayectoria. Resulta así que la mecánica a que obedecen los fenómenos atómicos - la llamada mecánica ondulatoria o cuántica - , debe basarse en nociones acerca del movimiento diferentes en esencia de las ideas de la mecánica clásica. En la mecánica cuántica no existe el concepto de trayectoria de una partícula. Esta circunstancia constituye el contenido del llamado principio de indeterminación - uno de los conceptos fundamentales de la mecánica cuántica descubierto por W. HEISENBERG en 1927 (2). Al rechazar las nociones ordinarias de la mecánica clásica, el principio de indeterminación posee, por ·así decirlo, un contenido negativo. Es natural que de por sí es del todo insuficiente para construir, tomándolo como base, la nueva mecánica de las partículas. En la base de una tal teoría deben encontrarse, claro está, ciertas proposiciones afirmativas que se considerarán más adelante (§ 2). Sin embargo, para formularlas es necesario examinar previamente cómo se plantean los problemas con que se enfrenta la mecánica cuántica. Para ello analicemos ante todo el carácter peculiar de la relación que existe entre la mecánica cuántica y la clásica. De ordinario, la teoría más general se puede formular de manera lógicamente cerrada con independencia de una teoría menos general que constituye un caso límite de la primera. Así, la mecánica relativista se puede construir partiendo de sus principios fundamentales y sin hacer referencia ninguna a la mecánica newto(1) El haz se supone enrarecido hasta tal punto que la interacción mutua de las partículas que lo constituyen no representa papel alguno. ( 2) Es interesante observar que todo el formalismo matemático de la mecánica cuántica fue establecido por W. HEISENBERG y E. ScHRODINGER en 1925-1926, antes del descubrimiento del principio de indeterminación, que pone de manifiesto el contenido físico de dicho formalismo. El principio de indeterminación 3 niana. La formulación de las tesis fundamentales de la mecánica cuántica, en cambio, es en principio imposible sin acudir a la mecánica clásica. El que un electrón (1) carezca de trayectoria determinada le priva también, al mismo tiempo, de cualesquiera otras características dinámicas (2). Es claro por ello que para un sistema constituido solamente por objetos cuánticos sería imposible construir una mecánica lógicamente cerrada. La posibilidad de una descripción cuantitativa del movimiento de un electrón exige la existencia de objetos físicos que, con precisión suficiente, obedecen a la mecánica clásica. Si el electrón entra en interacción con un « objeto clásico», el estado de éste, en general, cambia. El carácter y la magnitud de este cambio dependen del estado del electrón y pueden así servir para caracterizarlo cuantitativamente. En tales circunstancias el « objeto clásico» se suele llamar aparato y del proceso de su interacción con el electrón se suele decir que se trata de una medición. Es necesario subrayar, sin embargo, que en modo alguno se trata aquí de un proceso de medición en el que participa el físico observador. En mecánica cuántica se entiende por medición cualquier proceso de interacción entre objetos clásicos y cuánticos que ocurre aparte y con independencia de un observador cualquiera. Fue N. BoHR quien puso de manifiesto el profundo papel que desempeña el concepto de medición en la mecánica cuántica. Hemos definido un aparato como un objeto físico que obedece con prec1s10n suficiente a la mecánica clásica. Tal es, por ejemplo, un cuerpo de masa suficientemente grande. Con todo, no hay que pensar que el carácter macroscópico constituye una propiedad ineludible de un aparato. En ciertas condiciones puede representar también el papel de aparato un objeto evidentemente microscópico, dado que el concepto de « con precisión suficiente » depende del problema concreto planteado. Así, el movimiento de un electrón en una cámara de Wilson se observa por la traza de niebla que deja, traza cuyo grosor es grande comparado con las dimensiones atómicas; dentro de este grado de precisión en la definición de trayectoria, el electrón es un objeto enteramente clásico. La mecánica cuántica ocupa así una posición muy particular en el conjunto de las teorías físicas: contiene la mecánica clásica como caso límite, y al mismo tiempo tiene necesidad de este caso límite para su propia fundamentación. (1) En este párrafo y en el siguiente hablamos, para abreviar, de un electrón, si bien pensamos en general en un objeto cuántico arbitrario, es decir, en una partícula o un sistema de partículas que obedecen ~ la mecánica cuántica, pero no a la clásica. (2) Se trata de magnitudes que caracterizan el movimiento del electrón, no de magnitudes que caracterizan a éste como partícula (carga, masa), que son parámetros. 4 Conceptos /undamentales de la mecánica cuántica Podemos formular ahora el problema que se plantea la mecánica cuántica. Un problema típico consiste en predecir el resultado de una medición, partiendo del resultado conocido de mediciones anteriores. Además, veremos más adelante que, en general, la mecánica cuántica limita, por comparación con la mecánica clásica, el conjunto de valores que pueden tomar las diferentes magnitudes físicas (por ejemplo, la energía), es decir, los valores que pueden constituir el resultado de la medición de una cantidad dada. El formalismo de la mecánica cuántica debe hacer posible determinar estos valores permitidos. El proceso de medición posee en mecánica cuántica una peculiaridad muy importante: ejerce siempre una acción sobre el electrón a que se aplica, y esta acción no se puede hacer, por principio, tan débil cuanto se quiera para una precisión dada de la medición. Cuanto más precisa ésta, tanto más intensa es la acción que se ejerce, y tan sólo en las mediciones de precisión muy pequeña puede conseguirse que la acción sobre el objeto de la medición sea débil. Esta propiedad de las mediciones está lógicamente ligada con el hecho de que las características dinámicas del electrón se manifiestan tan sólo como resultado de la propia medición; es claro que si la acción del proceso de medición sobre el objeto se pudiera debilitar cuanto se quisiera, ello significaría que la cantidad medida posee de suyo un valor determinado, independiente de la medición. Entre los diferentes tipos de medición representa un papel fundamental la medición de las coordenadas del electrón. Dentro de los límites de aplicabilidad de la mecánica cuántica, es siempre posible realizar (1) la medición de las coordenadas de un electrón con precisión arbitraria. Supongamos que al ·cabo de determinados intervalos de tiempo D..t se efectúan sucesivas mediciones de las coordenadas de un electrón. Los resultados, en general, no se encuentran sobre una curva lisa. Por el contrario, cuanto más exactamente se efectúan las mediciones, tanto más discontinua, más desordenada es la marcha que presentan sus resultados en correspondencia con el hecho de que no existe para un electrón el concepto de trayectoria. Una trayectoria más o menos lisa se obtiene solamente si se determinan las coordenadas de un electrón con un grado de precisión no ~nuy grande, como, por ejemplo, mediante la condensación de gotitas de vapor en la cámara de Wilson. Si, en cambio, manteniendo constante la precisión de las medidas, se disminuyen los intervalos /j.t entre mediciones, las medidas vecinas darán, claro está, valores de las coordenadas próximos entre sí. Sin embargo, si bien los resultados de una serie de mediciones sucesivas se encontrarán en una pequeña región del espacio, (1) Subrayaremos una vez más que al hablar de una « medición realizada», nos referimos a la interacción del electrón con un « aparato » clásico, sin suponer en modo alguno la presencia de un observador exterior. El principio de indeterminación 5 se distribuirán en ella de una manera totalmente desordenada, sin situarse en modo alguno sobre una curva lisa. En particular, cuando D..t tiende a cero, los resultados de mediciones vecinas nunca tienden a colocarse sobre una recta. Este último hecho indica que en mecánica cuántica no existe el concepto de velocidad de una partícula en el sentido clásico de la palabra, es decir, como límiie al que tiende la diferencia de las coordenadas correspondientes a dos instantes dividida por el intervalo D..t entre ellos. Sin embargo, veremos más adelante que en dicha mecánica es posible, con todo, dar una definición razonable de la velocidad de una partícula en un instante dado, definición que, al pasar a la mecánica clásica, se reduce al concepto clásico de velocidad. Pero mientras en mecánica clásica una partícula posee en cada instante unas coordenadas y una velocidad determinadas, en mecánica cuántica las cosas ocurren de una manera completamente distinta. Si como resultado de una medida se atribuyen determinadas coordenadas al electrón, en tales condiciones no posee obsolutamente ninguna velocidad determinada. Recíprocamente, si el electrón posee una velocidad determinada, no puede tener una posición determinada en el espacio. En efecto, la existencia simultánea, en un instante arbitrario, de coordenadas y de velocidad significaría que existe una determinada trayectoria, trayectoria que el electrón no posee. Así, pues, en mecánica cuántica las coordenadas y la velocidad del electrón son cantidades que no se pueden medir simultáneamente con exactitud, es decir, no pueden tener simultáneamente valores determinados. Cabe decir que las coordenadas y la velocidad de un electrón son cantidades que no existen a la vez. Más adelante se deducirá una relación cuantitativa que determina la posibilidad de una medición no exacta de las coordenadas y de la velocidad en un mismo instante. Una descripción completa del estado de un sistema tísico se obtiene en mecánica clásica dando, para un cierto instante, todas sus coordenadas y velocidades; con estos datos iniciales las ecuaciones del movimiento determinan por completo el comportamiento del sistema en cualquier instante ulterior. En mecánica cuántica esta descripción es imposible por principio, dado que las coordenadas y las correspondientes velocidades no, existen simultáneamente. De esta manera la descripción del estado de un sistema cuántico se realiza con un número menor de cantidades que en mecánica clásica, es decir, aquélla resulta menos detallada que la descripción clásica. De aquí se sigue una consecuencia muy importante acerca del carácter de las predicciones que es posible hacer en mecánica cuántica. Mientras que la descripción clásica basta para predecir el movimiento de un sistema mecánico en el futuro de manera completamente exacta, la descripción menos detallada de la mecánica cuántica no puede bastar, evidentemente, para ello. Esto significa que si el electrón se 6 Conceptos fundamentales de la mecánica cuántica encuentra en un estado descrito de la manera más completa posible en mecánica cuántica, su comportamiento en instantes ulteriores es, con todo, incierto por principio. Por ello la mecánica cuántica no puede hacer predicciones rigurosamente determinadas acerca del comportamiento futuro del electrón. Para un estado inicial dado de éste, una medición ulterior puede dar diferentes resultados. El problema de la mecánica cuántica consiste simplemente en determinar la probabilidad de obtener un cierto resultado en dicha medición. En algunos casos, claro está, la probabilidad de un determinado resultado de la medición puede ser igual a la unidad, es decir, la probabilidad puede transformarse en certeza, con lo cual el resultado de la medición en cuestión sólo puede ser uno .. Todos los procesos de medición en mecánica cuántica se pueden clasificar en dos categorías. A una de ellas, que incluye la mayor parte de las mediciones, pertenecen las mediciones que, cualquiera que sea el estado del sistema, no conducen con certeza a un resultado único. A la otra categoría, en cambio, pertenecen las mediciones tales que para cada uno de sus resultados existe un estado en el que la medición conduce con certeza al resultado en cuestión. Precisamente estas últimas mediciones, que se pueden calificar de predecibles, representan en mecánica cuántica un papel fundamental. Las características cuantitativas de un estado definidas por tales mediciones son lo que en mecánica cuántica se llaman magnitudes físicas. Si en un cierto estado la medida da con certeza un resultado único, diremos que en este estado la correspondiente magnitud física posee un determinado valor. En lo que sigue entenderemos siempre la expresión « magnitud física » precisamente en este sentido. Veremos más de una vez en lo que sigue que no todo sistema de magnitudes físicas, ni mucho menos, pueden ser medidas en mecánica cuántica simultáneamente, es decir, no todas pueden tener simultáneamente valores determinados (se presentó ya un ejemplo: las velocidades y coordenadas de un electrón). Representan u~ importante papel en mecánica cuántica los conjuntos de magnitudes físicas que gozan de la siguiente propiedad: las cantidades de uno de ellos se pueden medir simultáneamente, y si éstas poseen simultáneamente determinados valores, ninguna otra cantidad física (que no sea función de ellas) puede poseer en dicho estado un valor determinado. De tales sistemas de magnitudes físicas diremos que constituyen sistemas completos; en ciertos casos particulares, un sistema completo puede quedar reducido a una sola magnitud. Toda descripción del estado de un electrón es consecuencia del resultado de una cierta medida. Veamos ahora qué caracteriza la descripción completa de un estado en mecánica cuántica. Los estados completamente definidos· surgen como resultado de la medición simultánea de un sistema completo de magnitudes físicas. A partir de los resultados de una tal medición es posible, en particular, determinar la pro- El principio de superposición 7 habilidad de los resultados de cualquier medición ulterior con total independencia de lo que ocurrió al electrón antes de la primera medida. En mecánica cuántica hay que considerar prácticamente tan sólo estados descritos de manera completa, y en lo que sigue entenderemos siempre (excluido tan sólo el § 14) por estados de un sistema cuántico precisamente dichos estados. § 2. El principio de superposición Expongamos ahora los fundamentos del formalismo matemático de la mecánica cuántica y convengamos en designar por q el conjunto de las coordenadas del sistema cuántico y por dq el producto de las diferenciales de estas coordenadas. Con frecuencia se llama a dq elemento de volumen del espacio de configuraciones del sistema; para una partícula dq coincide con el elemento de volumen d V del espacio ordinario. El elemento básico del formalismo matemático de la mecánica cuántica consiste en el hecho de que cada estado del sistema se puede describir, en un instante dado, por una determinada función (en general, compleja) de las coordenadas 'Y(q), de forma tal que el cuadrado del módulo de esta función determina la distribución de probabilidades de los valores de las coordenadas: J'Yi 2dq es la probabilidad de que al realizar una medición de las coordenadas del sistema los valores de éstas pertenezcan al elemento dq del espacio de configuraciones. La función 'Y se llama función de onda del sistema (a veces se la llama también amplitud de probabilidad) (1). El conocimiento de la función de onda permite también, en principio, calcular las probabilidades de los diferentes resultados de cualquier otra medición (distinta de la medición de las coordenadas). En todos estos casos las probabilidades se definen por expresiones que son bilineales respecto de 'Y y 'Y*. La forma más general de una expresión de este tipo es JJ'Y(q) 'Y*(q') <f,(q, q') dqdq', (2.1) donde la función ef,(q, q') depende del género y del resultado de la medición y la integración se extiende a todo el espacio de configuraciones. La propia probabilidad 'Y'Y* de los diferentes valores de las coordenadas es también una expresión de este tipo (2). A medida que transcurre el tiempo, el estado de un sistema, y con él también (1) Fue introducida por primera vez en mecánica cuántica por E. ScHRODINQER, en 1926. Se obtiene a partir de (2.1) haciendo cp(q, q') = IJ(q - Qo) IJ(q' -qo), donde <5 representa la llamada función-lJ que se define más adelante, en el § 5; con q0 representamos el valor de la coordenada cuya probabilidad buscamos. ( 1) 8 Conceptos fundamentales de la mecánica cuántica la función de onda, cambian, en general. En este sentido se puede considerar la función de onda como función también del tiempo. Si la función de onda se conoce en un cierto instante inicial, en virtud del propio sentido del concepto de descripción completa de un estado dicha función debe en principio estar determinada también para cualquier instante ulterior. La dependencia efectiva de la función de onda con relación al tiempo se determina mediante ecuaciones que se deducirán más adelante. La suma de las probabilidades de todos los posibles valores de las coordenadas de un sistema debe ser, por definición, igual a la unidad. Es necesario, por lo tanto, que el resultado de la integración de !'Yl 2 en todo el espacio de configuraciones sea igual a la unidad: J l'Yl 2 (2.2) dq = t. Esta igualdad es la llamada condición de normalización de las funciones de onda. Si la integral de j'Yl 2 converge, es siempre posible conseguir normalizar la función 'Y, mediante la elección oportuna de .un coeficiente constante. A veces, sin embargo, se utilizan también funciones de onda no normalizadas; además, veremos más adelante que 'la integral de l'Yl 2 puede diverger, en cuyo caso la función 'F' no se 2 no deterpuede normalizar de acuerdo con la condición (2.2). Én tales casos mina, claro está, los valores absolutos de la probabilidad de las coordenadas, pero la razón de los valores de !'Yl 2 en dos puntos distintos del espacio de configuraciones determina la probabilidad relativa de los correspondientes valores de las coordenadas. l'fl Dado que todas las cantidades con sentido físico inmediato que se calculan con ayuda de la función de onda son de la forma (2.1), en la que 'Y aparece multiplicada por 'Y*, es claro que.. la función de onda normalizada está definida salvo un factor constante de fase de la forma ;« (~ es un número real arbitrario) de módulo igual a la unidad. Esta falta de unicidad es inevitable y de carácter fundamental; sin embargo, de hecho carece de importancia, ya que no se refleja en ningún resultado físico. En la base del contenido positivo de la mecánica cuántica encontramos toda una serie de proposiciones relativas a las propiedades de la función de onda, proposiciones que se pueden enunciar como sigue. Supongamos que en el estado caracterizado por la función de onda 'Y¡(q) se efectúa una medición que conduce con certeza a un determinado resultado (resultado 1) y que el hacerlo en el estado 'flq) conduce al resultado 2. Se admite entonces que toda combinación lineal de '1\ y 'r2, esto es, toda función de la forma c1'Y1 +c2'Y2 (con c1, c 2 constantes), representa un estado en el que la misma medición puede dar o el resultado 1 o el resultado 2. Además, cabe afirmar que si cono- Operadores 9 cernos la dependencia de los estados respecto del tiempo, dependencia que en un caso viene dada por la función 'I\(q, t) y en el otro por la 'Y2(q, t), cualquier combinación lineal da también la dependencia posible de un estado con relación al tiempo. Estas proposiciones se generalizan de manera inmediata a un numero cualquiera de estados distintos. El conjunto de las proposiciones que acabamos de enunciar acerca de las funciones de onda constituye el llamado principio de superposición de los estados - principio fundamental positivo de la mecánica cuántica. De él se sigue inmediatamente, en particular, que todas las ecuaciones a las que satisfacen las funciones de onda deben ser lineales respecto de 'Y. Consideremos un sistema constituido por dos partes y supongamos que su estado se da de forma tal que cada una de las partes viene descrita de manera completa (1). Cabe afirmar entonces que las probabilidades de las coordenadas q1 de la primera parte son independientes de las probabilidades de las coordenadas q2 de la segunda parte, y por ello la distribución de probabilidades para el sistema como un todo debe ser igual al producto de las probabilidades correspondientes a cada una de sus partes. Esto significa que la función de onda 'Y1lq1, q2) del sistema se puede representar como producto de las funciones de onda 'Y1(q1) y 'Y2(q2) de sus partes : (2.3) Si ambas partes no se encuentran en interacción mutua, esta relación entre la función de onda del sistema y las de sus partes se conserva también en cualquier instante futuro, es decir, se puede escribir: (2.4) § 3. Operadores Consideremos una magnitud física f que caracteriza el estado de un sistema cuántico. Hablando estrictamente, en las consideraciones que siguen deberíamos hablar no de una magnitud, sino, ya desde el principio, de un sistema completo de magnitudes. Sin embargo, ninguna de aquéllas cambiaría por ello esencialmente y para abreviar, y por razones de simplicidad, hablaremos siempre en lo que sigue tan sólo de una magnitud física. Los valores que puede tomar una magnitud física dada se llaman en mecánica (1) Con ello, claro está, se da también una descripción completa del estado del sistema como un todo. Hay que subrayar. sin embargo, que la proposición reciproca no es en general cierta: una descripción completa del estado del sistema como un todo es insuficiente, en general, para determinar de manera completa los estados de sus partes por separado (véase también § 14). 10 Conceptos fundamentales de la mecá._nica cuántica cuántica sus valores propios y el conjunto de éstos se denomina espectro de valores propios de la magnitud en cuestión. En mecánica clásica las magnitudes toman, en general, valores que constituyen una sucesión continua. También en mecánica cuántica existen magnitudes físicas (por ejemplo, las coordenadas) cuyos valores propios forman una tal sucesión; en estos casos se habla de un espectro continuo de valores propios. Sin embargo, junto a tales magnitudes encontramos en mecánica cuántica otras cuyos valores propios constituyen una sucesión discreta; en tales casos se habla de un espectro discreto. Para simplificar, supondremos que la magnitud que aquí consideraremos, f, posee espectro discreto; el caso de un espectro continuo se estudia en el § 5. Designaremos los valores propios de la magnitud f por fm donde el índice n toma los valores O, l, 2, 3, ... Representemos además por 'F'n la función de onda del sistema en un estado en que la magnitud f toma el valor Ín· Las funciones de onda 'F'n se llaman funciones propias de la magnitud física dada f. Cada una de estas funciones se supone normalizada, de forma que f l'I'nl 2 dq = 1. (3.1) Si el sistema se encuentra en un estado cualquiera caracterizado por la función de onda 'F', la medición de la magnitud/ efectuada en él dará como resultado uno de los valores propios Ín· En virtud del principio de superposición podemos afirmar que la función de onda 'F' debe ser combinación lineal de aquellas funcjones propias 'F'n que corresponden a los valores fn que es posible obtener. con probabilidad distinta de cero en una medición realizada en el sistema que se encuentra en el estado considerado. Por esto, en el caso general de un estado arbitrario, la función 'F' se puede representar en forma de serie: (3.2) donde la suma se extiende a todos los valores n, y los an son ciertos coeficientes constantes. Llegamos así a la conclusión de que toda función de onda puede desarrollarse en serie de funciones propias de una magnitud física cualquiera. De un sistema de funciones que haga posible efectuar este desarrollo se dice que constituye un sistema completo (o cerrado) de funciones. El desarrollo (3.2) permite determinar la probabilidad de encontrar en el sistema, supuesto en el estado caracterizado por la función de onda 'Y, uno de los valores f n de la magnitud f (es decir, la probabilidad de obtener el correspondiente resultado en una medición). En efecto, de acuerdo con lo dicho en el párrafo anterior, estas probabilidades deben determinarse por ciertas expresiones bilineales respecto de 'Y y 'F'* y, por consiguiente. deben ser bilineales con relación a an y an *. Además, 11 Operadores estas expresiones, claro está, han de ser esencialmente positivas. Finalmente, la probabilidad del valor / 11 debe reducirse a la unidad si el sistema se encuentra en un estado cuya función de onda es 'F = 'Fn y ha de anularse si en el desarrollo (3.2) de la función de onda 'F no existe un término con la 'F11 en cuestión. Esto último significa que la probabilidad buscada debe ser igual a la unidad si son nulos todos los coeficientes a11 salvo uno (con el valor den dado), que es igual a la unidad, y debe ser nula si se tiene para el a11 dadó an = O. La única magnitud esencialmente positiva que satisface esta condición es el cuadrado del módulo del coeficiente a11 • Llegamos así al resultado de que el cuadrado del módulo la 11 ¡2 de cada uno de los coeficientes del desarrollo (3.2) determina la probabilidad del correspondiente valor / 11 de la cantidad/ en el estado caracterizado por la función de onda 'F. La suma de las probabilidades de todos los valores posibles fn debe ser igual a la unidad; con otras palabras, debe cumplirse la relación (3.3) Si la función 'F no estuviese normalizada, tampoco se cumpliría la relación (3.3). 2 La suma 1:/an/ debería entonces determinarse mediante una expresión bilineal 11 respecto de 'F y 'F* y que se reduzca a la unidad cuando 'F está normalizada. La única expresión de este tipo es la integral f 'F'F* dq. Así, pues, debe quedar satisfecha la igualdad f ~ anan* = 'Y'Y* dq De otra parte, multiplicando por 'F el desarrollo 'F* (3.4) = l: ah*q,·u * de la función 'Y*, conjugada compleja de la 'F, e integrando, obtenem¿~: Comparando este resultado con (3.4), se tiene: de donde resulta la fórmula siguiente que determina los coeficientes a11 del desarrollo de la función 'Y en serie de funciones propias 'Y11 : an = f 'Y'Yn* dq. (3.5) Si substituimos aquí la expresión (3.2), se obtiene: de donde se sigue, evidentemente, que las funciones propias deben satisfacer las 12 Conceptos fundamentales de la mecánica cuantíca condiciones f 'Y m 'Y n * dq = (3.6) 3nm, donde bnm = 1 para n = m y bnm = O para n =/:= m. La anulación de las integrales de los productos \Jl'mo/n * con m =/:= n traduce la llamada ortogonalidad de las funciones o/11 • Tenemos así que el conjunto de las funciones propias o/n constituye un sistema completo de funciones normalizadas y ortogonales dos a dos (o, como suele decirse para abreviar, un sistema ortonormal). Introduzcamos ahora el concepto de valor medio f de una magnitud f en un estado dado. De acuerdo con la definición ordinaria de valores medios, definiremos J como suma de todos los valores propios fn de la magnitud dada multiplicados cada uno por la correspondiente probabilidad ja11 !2• Se tiene así (3.7) Escribamos j en la forma de una expresión que contenga, no los coeficientes a11 del desarrollo de la función o/, sino la propia función. Dado que en (3. 7) aparecen los productos a11 a11 *, es claro que la expresión buscada debe ser bilineal respecto de 'F y o/*. Introduzcamos un operador matemático, que designaremos por f(1) y que definiremos de la siguiente manera. Sea (/'Y) el resultado de aplicar el operador/ a la función o/. Definiremos/ de tal manera que la integral del producto de (Í'Y) por la función conjugada compleja o/* sea igual al valor medio j: f = f 'P*(/'f!) (3.8) dq. Es fácil ver que en el caso general el operador J es un operador integral lineal (2). En efecto, teniendo en cuenta la expresión (3.5) para am podemos escribir la definición (3. 7) del valor medio en la forma Comparando con (3.8), vemos que el resultado de aplicar el operador/ a la función o/ es de la forma: (3.9) Si se ,substituye aquí Ja expresión (3.5) para a11 , se encuentra que J es un operador Convenimos en designar siempre los Qperadores mediante letras con circunflejo. (1) 2 A <) f(ao/) = Un/ ~perador s~ caljfica de li~eal si posee l:3s propiedades siguientes: (('t\ + o/2 ) ~ 'f, donde q 1, 't 2 son funciones cualesquiera y a una constante arbitraria. = Í'f 'i +j't\, 13 Operadores - integral de la forma: (fo/) = JK(q, q')o/(q') dq', (3.10) donde la función K(q, q') (el llamado núcleo del operador) es K(q, q') = ~fn'I\*(q')'I!n(q). (3.11) Resulta así que a cada magnitud física corresponde en mecánica cuántica un determinado operador lineal. De (3.9) se sigue que si la función 'Fes una de las funciones propias 'Fn (de forma que todos los a 11 son nulos, salvo uno), al aplicarle el operador esta función queda simplemente multiplicada por el correspondiente valor propio fn: J (3.12) (En lo que sigue, y siempre que ello no pueda conducir a confusión, prescindiremos del paréntesis en la expresión (f'Y), sobreentendiendo que el operador se aplica a la expresión que la sigue inmediatamente.) Podemos así decir que las funciones propias de una magnitud física dada f son soluciones de la ecuación jty =.f'Y, donde fes una constante, y que los valores propios son precisamente aquellos valores de esta constante para los que dicha ecuación posee soluciones que satisfacen las condiciones impuestas. Claro está, dado que por el momento el operador J se ha definido solamente mediante las expresiones (3.10-3.11 ), que contienen las funciones propias 'Fm del resultado obtenido no se pueden deducir consecuencias ulteriores. Sin embargo, conforme veremos más adelante, la forma de los operadores que corresponden a las diferentes magnitudes físicas se puede determinar a partir de consideraciones físicas directas, y entonces aquella propiedad de los operadores hace posible encontrar las funciones propias y los valores propios mediante la resolución de las ecuaciones Í'F = f 'f'. Los valores que pueden tomar las magnitudes físicas reales son, evidentemente, valores reales. Por esta razón también el valor medio de una magnitud física debe ser real, cualquiera que sea el estado. Recíprocamente, si el valor medio de una magnitud física es real cualquiera que sea el estado, reales serán también sus valores propios ; basta observar que los valores medios coinciden con los valores propios en los estados caracterizados por las funciones 'Fn. Del hecho de que los valores medios son reales cabe deducir algunas conclusio- 14 Conceptos fundamentales de la mecánica cuántica nes relativas a las propiedades de los operadores. Igualando la expresión (3.8) con su conjugada compleja, obtenemos la relación f 'Y*(Í'Y) dq = f 'Y(f*'Y*) dq, (3.13) donde /* designa el operador conjugado complejo del /( 1). Un operador lineal arbitrario no cumple esta relación, en general, de forma que ésta constituye una cierta limitación impuesta a la posible forma de los operadores J Dado un operador cualquiera se puede encontrar un operador, llamado operador transpuesto del primero, J, y definido de forma que se tenga J f 'Y(/<t>) dq = f <t> (fi') dq, (3.14) donde 'F, <I> son dos funciones diferentes. Si para la función <I> se elige la función 'F*, conjugada compleja de la 'F, la comparación con (3.13) prueba que debe tenerse l=f*. (3.15) Los operadores que satisfacen esta condición se califican de hermíticos (2). Así, pues, los operadores que en el formalismo matemático de la mecánica cuántica corresponden a las magnitudes físicas reales deben ser hermíticos. Desde un punto de vista formal es también posible considerar magnitudes físicas complejas, es decir, magnitudes cuyos valores propios son complejos. Sea f una de estas magnitudes. Cabe entonces introducir la magnitud compleja conjugada f*, cuyos valores propios son conjugados complejos de los valores propios de f. El operador que corresponde a la magnitud/* lo designaremos por/+. Se le suele llamar operador conjugado del operador /y, en general, es necesario distinguirlo del operador conjugado complejo/*. De la condición .f* = (/)* se obtiene sin más (3.16) de donde resulta, evidentemente, que /+, en general, no coincide con J*. Para una magnitud física real se tiene j = j+, es decir, el operador coincide con su conjugado (los operadores hermíticos se llaman también autoconjugados). Veamos cómo se puede demostrar directamente la ortogonalidad dos a dos de las funciones propias de un operador hermítico asociadas a diferentes valores pro(1) Por definición, si p~ra el., operador J tenemos jtp = cf,, el operador complejo conjugado/• será el operador para el que se tiene f *tp* = f, *. (2) Para un operador integral lineal de la forma (3.10) la condición de hermiticidad significa que el núcleo del operador debe ser tal que K(q, q') = K*(q', q). Suma y producto de operadorés 15 píos. Sean/nJm dos valores propios de la magnitud/ diferentes y 'Ym 'Y m las correspondientes funciones propias: Multipliquemos los dos miembros de la primera de estas igualdades por 'Ym *, y la igualdad conjugada compleja de la segunda multipliquémosla por 'Y n· Restando miembro a miembro estos dos productos, se obtiene: Integremos los dos miembros de esta igualdad respecto de q. Dado que/* = J, la integral del primer miembro de la igualdad se anula en virtud de (3.14), con lo que resulta de donde se sigue, dado que f, 1 =f=. f,m la propiedad de ortogonalidad buscada de las funciones 'l'n Y 'l'm· Hablamos aquí constantemente de una magnitud física f tan sólo, cuando debería hablarse, conforme se indicó al principio de este párrafo, de un sistema completo de magnitudes físicas. Encontraríamos entonces que a cada una de estas magnitudes f, g, ... corresponde su operador/, g, .... Las funciones propias ':F11 corresponden en tal caso a estados en los que todas las magnitudes consideradas toman valores determinados, es decir, corresponden a sistemas determinados de valores propios fm g 11 , ••• y son soluciones del sistema de ecuaciones , A \Tl' f'Y = j'Y, g'Y = g-r ' .... § 4. Suma y producto de operadores Sean f y g dos magnitudes físicas que pueden tomar simultáneamente valores determinados y j y g sus operadores. Los· valores propios de la suma f +g de estas magnitudes son iguales a las sumas de los valores propios de las magnitudes f y g. A esta nueva magnitud corresponderá, evidentemente, un operador igual a la suma de los operadores J y g. En efecto, si 'f'11 son i'as funciones propias comunes a los operadores J y g, de /'J.· 11 = f,/F11 , g'Y11 = g 11'Y 11 se sigue que es decir, los valores propios del operador J+g son iguales a las sumasf,1 +gn- 16 Conceptos fundamentales de la mecánica cuántica En cambio, si las magnitudes f y g no pueden tomar simultáneamente valores determinados, hablar de su suma en el sentido en que acabamos de hacerlo carece, evidentemente, de significado. En mecánica cuántica, se conviene en tales casos en definir la suma de las magnitudes f y g como aquella magnitud cuyo valor medio en un estado arbitrario es igual a la suma de los valores medios J y g: f+g =! +g. (4.1) Es claro que a la magnitud f +g así definida corresponderá el operador /+g. En efecto, según la fórmula (3.8) tenemos: f+g f f = 'Y*(/+g)'Y dq = 1.Y*J'Y dq+ J'Y*g'Y dq = f+g. Sin embargo, en lo que concierne a los valores propios y a las funciones propias del operador J+g, en este caso no tendrán, en general, relación ninguna con los valores propios y las funciones propias de las magnitudes f y g. Evidentemente, si los operadores J y g son autoconjugados, también será autoconjugado el operador J+g de forma que los valores propios de éste serán reales y representarán los valores propios de la nueva magnitud f+g así determinada. Consideremos el siguiente teorema. Sean fo, g 0 los valores propios mínimos de las magnitudes f, g y (f +g)0 el correspondiente valor para la magnitud f +g. Cabe afirmar entonces que (f+g)o > fo+go. (4.2) El signo de igualdad vale si las magnitudes f y g son simultáneamente medibles. La demostración se sigue del hecho evidente de que el valor medio de una magnitud es siempre mayor o igual que su valor propio mínimo. En un estado en el que la magnitud (f +g) toma el valor (f +g) 0 , tendremos (f +g) = (f +g)0 y dado que, por otra parte, f+g = J+g ~ f 0 +g0 , llegamos a la desigualdad (4.2). Consideremos ahora de nuevo dos magnitudes simultáneamente medibles, f y g. Junto a su suma, cabe también introducir el concepto de su producto, entendiendo por tal una magnitud cuyos valores propios son iguales a los productos de los valores propios de las magnitudes f y g. Es fácil ver que a esta magnitud corresponde un operador tal que su aplicación consiste en aplicar sucesivamente a una función primero un operador (el g) y después el otro (elf). Este operador se representa matemáticamente como producto de los operadores/ y g. En efecto, si 'Fn son las funciones propias comunes a los operadores J y g, tendremos: Suma y producto de operadores (el símbolo 17 /g representa el operador cuya aplicación a la función o/ equivale a la aplicación sucesiva de, primero, el operador gala función 'F y, luego, del operador/ a la función g 'F). De la misma manera podríamos formar en vez del operador fg el operador§/, que difiere del primero en el orden de los factores. Es evidente que el resultado de la aplicación de ambos operadores a la función 'Y n será el mismo. Pero dado que cada función de onda 'F se puede representar como combinación lineal de funciones 'Fm se sigue de aquí que también será el mismo el resultado de la aplicación de los operadores /g y g/ a una función cualquiera. Este hecho se puede traducir en forma de una igualdad simbólica /i=§j o bíen /g-g/= o. (4.3) J De dos operadores y g" que poseen esta propiedad se dice que conmutan entre sí. Llegamos de esta manera a un importante resultado: si dos magnitudes f y g pueden tomar simultáneamente valores determinados, sus operadores conmutan entre sí. Se puede también demostrar el teorema recíproco (véase el § 11): si los operadores J y g conmutan, es posible elegir todas sus funciones propias de forma que sean comunes a ambos, lo que físicamente significa la mensurabilidad simultánea de las correspondientes magnitudes físicas. Así, pues, la conmutabilidad de los operadores es condición necesaria y suficiente para la mensurabilidad simultánea de las magnitudes físicas. Un caso particular de producto de operadores es el de un operador elevado a una potencia. Partiendo de lo que acabamos de decir, se llega a la conclusión de que los valores propios del operador/P (donde pes un número e11-tero) son iguales a las potencias de igual grado de los valores propios del operador f De una manera general, es posible definir una función cualquiera del operador rp{f) como el operador cuyos valores propios son iguales a la misma función cp(f) de los valores propios del operador/ Si la función </>(!) se puede desarrollar en serie de Taylor, en virtud de este desarrollo la aplicación del operador rp(/) se reduce a la aplicación de las diferentes potencias JP En particular, el operador ¡-1 se llama inverso del operador f Es evidente que como resultado de la aplicación sucesiva de los operadores f y ¡-1 a una función arbitraria, esta última no varía, es decir, j/-1 = /-1 / = 1 Si las magnitudes f y g no pueden tomar simultáneamente valores determinados, no es posible definir el concepto de producto de la manera antes indicada. Esto se traduce en el hecho de que el operador /g no es autoadjunto en este caso y, por consiguiente, no puede corresponder a ninguna magnitud física. En efecto, de acuerdo con la definición de operador transpuesto podemos escribir 18 Conceptos fundamentales de la mecánica cuántica I 'J!fg<I> dq = I 'J!f(g<'P) dq = I (g<I>)(!'Y) dq. El operador/ se aplica aquí solamente a la función 'F y el operador gala función <I>, de forma que en el integrando aparece simplemente el producto de dos funciones g<I> y Aplicando una vez más la definición de operador transpuesto, escribiremos: /'Y. I 'J!Jg<'P dq = I <fr)(g<'P) dq = I <1>lfr dq. Hemos obtenido así una integral en la que, comparada con la primera, las funx::JI ciones 'F y <I> han permutado sus papeles. Con otras palabras, el operador gf es el operador transpuesto del /g y podemos escribir: (4.4) esto es, el operador transpuesto del producto /i es el producto de los transpuestos de los factores tomados en orden inverso. Formando la expresión conjugada compleja de ambos miembros de la igualdad (4.4), se encuentra que (ig)+ = g+ j+. (4.5) Si cada uno de los operadores Í y g es hermítico, se tendrá (Íi) = gj De aquí se sigue que el operador Ji será hermítico sólo si los factores j y g son conmutables. Obsérvese que a partir de los productos /g y gj de dos operadores hermíticos no conmutables se puede deducir un operador asimismo hermítico formando la combinación simétrica i(/g+gj). (4.6) A veces conviene utilizar expresiones de este tipo; de ellas se dice que son productos simetrizados. Es fácil también comprobar que la diferencia /i- gj es un operador « antihermítico » (es decir, un operador tal que el operador transpuesto es igual al operador conjugado complejo tomado con signo contrario). A partir de él se puede formar un operador hermítico sin más que multiplicarlo por i; de esta forma i(/g-gf) es también un operador hermítico. En lo que sigue utilizaremos a veces, para abreviar, la notación El espectro continuo {/,g} = /g-g/, 19 (4.7) para representar el llamado conmutador de dos operadores. Es fácil ver que se tiene la relación {/g, h} = {/, h}g+/{g, h}. (4.8) Obsérvese que si {/h = O} y {gh = O} de aquí generalmente no se sigue, en modo alguno, la conmutabilidad de J y g. § 5. El espectro continuo Todas las relaciones deducidas en íos §§ 3-4 relativas a las propiedades de las funciones propias del espectro discreto, se pueden generalizar sin dificultad al caso de un espectro continuo de valores propios. Sea f una magnitud física que posee espectro continuo. Designaremos sus valores propios simplemente por la misma letra f, sin subíndice, para expresar el hecho de que f recorre una sucesión continua de valores. La función propia que corresponde al valor propio f la representaremos por 'Y¡. De manera análoga a como una función de onda arbitraria 'Y se puede desarrollar en serie (3.2) de funciones propias de una magnitud con espectro discreto, cabe también desarrollarla - pero esta vez como integral - tomando como base un sistema completo de funciones propias de una magnitud con espectro continuo. Un desarrollo de esta clase es de la forma 'F(q) = Ja 'F (q) dj, 1 1 (5.1) donde la integración se extiende a todo el dominio de valores que puede tomar la magnitud¡: Más complicada que en el caso del espectro discreto se presenta la cuestión de la normalización de las funciones propias de un espectro continuo. La condición de que la integral del cuadrado del módulo de la función sea igual a la unidad no se puede cumplir aquí, conforme veremos. En vez de ella, normalizaremos la función 'Y1 de tal manera que la,¡ 2 df represente la probabilidad de que la magnitud considerada tome valores comprendidos en un intervalo dado, f y f + df, en el estado descrito por la función de onda 'F¡. Esto constituye una inmediata generalización del caso del espectro discreto, en el que el cuadrado fa 11 [2 determina la probabilidad del correspondiente valor f 11 • Dado que la suma de las probabilidades de todos los valores posibles f debe ser igual a la unidad, se tiene: Jla,1 2 df = 1 (5.2) 20 Conceptos fundamentales de la mecánica cuántica (relación análoga a la (3.3) para el espectro discreto). Procediendo exactamente de la misma manera a como se hizo al deducir la fórmula (3.5) y apoyándonos en las mismas consideraciones, escribiremos, de una parte, f 'Y'Y* dq f la,¡2 df = y, de otra parte: f 'Y'Y* dq = ff a,*'Y,*'Y dfdq. Comparando entre sí ambas expresiones encontramos la fórmula que determina los coeficientes del desarrollo a1 = f 'Y(q)'Y *(q) dq, 1 (5.3) exactamente análoga a (3.5). Para deducir la ·condición de normalización, substituyamos ahora (5.1) en (5.3), con lo que se obtendrá: Esta relación debe cumplirse cualesquiera que sean las a¡ y, por consiguiente, debe cumplirse idénticamente. Para que así ocurra es necesario, ante todo, que el coeficiente de a1 en el integrando (es decir, la integral f 'Yf"Y¡* dq) se anule para todo f' =/= f Para f' = f este coeficiente debe hacerse infinito (en caso contrario la integral respecto de f' sería, simplemente, igual a cero). Así, pues, la integral f 'Y /Y¡* dq es una función de la diferencia f - f' que se anula para todos los valores del argumento distintos de cero y se hace infinita cuando el argumento se anula. Representaremos esta función por l)(f' - f): f 'Y,,'Y,• dq = 3(f' -j). (5.4) La manera como la función l)(f' - f) se hace infinita para f' - f = O se determina teniendo en cuenta que debe tenerse f ó(f' -J) a¡,dj' = a¡. Es claro que para ello ha de ser f ó(f'-f) df' = l. 21 El espectro continuo La función así definida se llama función-b (introducida en la mecánica cuántica por P. A. M. D1RAC). Escribamos una vez más las fórmulas que la definen. Tenemos: S(x) = O para x =1- O, S(O) = oo, (5.5) de tal manera que J S(x) dx = l. (5.6) Como límites de integración se pueden elegir cualesquiera otros que comprendan entre ellos el punto x = O. Si f(x) es una función cualquiera continua para x = O, se tendrá J 8(x)f(x) dx = f(O). (5.7) Esta fórmula se puede escribir en la forma más general f S(x-a)f(x) dx = f(a), (5.8) donde el intervalo de integración incluye el punto x = a y f (x) es continua para x = a. Es evidente también que la función-bes par, es decir, S(-x) = S(x), (5.9) Finalmente, escribiendo 1 J"' se~). dx = J"' o(y) dy - = -, -oo -oo ,~, ,~, llegamos a la conclusión de que (5.10) donde c1. es una constante arbitraria. La fórmula (5.4) expresa la regla de normalización de las funciones propias de un espectro continuo y substituye la condición (3.6) del espectro discreto. Vemos, pues, que las funciones 'Y¡ y 'Fr, conf =f=.f', son ortogonales entre sí, como antes. En cambio, las integrales de los cuadrados j'Y1j2 de las funciones del espectro continuo son divergentes. Las funciones 'Y¡(q) satisfacen además una relación análoga a la (5.4). Para deducirla substituyamos (5.3) en (5.1), lo que da: 'Y(q) = J'Y(q')(f 'Y,*(q')'Y¡(q) df) dq', 22 Conceptos Jundamentales de la mecánica cuánticq de donde se deduce sin más que debe ser: J'Y *(q')'Y (q) df = S(q' -q). 1 1 (5.11) Una relación análoga se puede deducir también, claro está, para el espectro discreto, en cuyo caso toma la forma ~ 'Y n*(q')'Yn(q) n = S(q' -q). (5.12) Comparando el par de fórmulas (5.1), (5.4) con el par (5.3), (5.11) vemos que, de una parte, las funciones 'Y¡(q) permiten el desarrollo de la función 'Y(q) con los a¡ como coeficientes del desarrollo y que, de otra parte, se puede considerar la fórm,ula (5.3) como un desarrollo completamente análogo de la función a1 == a(f) en funciones 'Y¡*(q), representando 'F(q) el papel de coeficientes del desarrollo. La función a(fj, como la 'Y(q), determina completamente el estado del sistema; de ella se dice a veces que es la función de onda en la representación-! (y de la función 'Y(q), que es la función de onda en la representación-q). De manera análoga a como l'Y(q)j 2 determina la probabilidad de que el sistema tenga coordenadas pertenecientes a un intervalo dado dq, ja(f)j 2 determina la probabilidad de que los valores de la magnitud f se encuentren en un intervalo df. Las funciones 'f'¡(q), en cambio, son, de una parte, funciones propias de la magnitud f en la representación-q y, de otra, sus conjugadas complejas son las funciones propias de la coordenada q en la representación-/. Sea </>(!) una función de la magnitud f tal que <p y f están ligadas entre sí de manera biunívoca. Cada una de las funciones 'f'¡(q) puede entonces considerarse como función propia de la magnitud <p correspondiente al valor <p de esta última determinado por la relación <p = </,(!). Sin embargo, es necesario en tal caso cambiar la normalización de estas funciones. En efecto, las funciones propias 'Yq;(q) de la magnitud </, deben normalizarse por la condición J'Ycft<.J'>'Ycft(J>* dq = S[<f,(f')-<f,(f)], mientras que las funciones 'Y¡, están normalizadas de acuerdo con la condición (5.4). El argumento de la función-{5 se anula para f' = f. Para f' próximo a/, tenemos: [dcp(f)/d/J . (f' -/). </,(!')-</>(/) = Teniendo en cuenta (5.10), podemos por ello escribir (1): (1) fórmula En general, si </,(x) es una función uniforme (si bien su función inversa puede no serlo) vale la 8[c,b(x)] = 1 ¿-ocx-ix,). WCixt)! i donde r:xt son las raíces de la ecuación <Í>(x) = O. El espectro continuo 1 o[</>U' )-</>(f)J = ld</>(f)/d/! o(f' -f). 23 (5.13) Así, pues, la condición de normalización de la función 'Y 9 se puede escribir en la forma f 'Y ,:qt </>(!) :11: r/>(f) d q- 1 ld</>(f)/dfl o(f'-!): Comparando este resultado con (5.4), vemos que las funciones 'Y9 y 'Y¡ están ligadas entre sí por la relación 1 'Y <1>(!> = vld</>U)/dfl ~-,. (5.14) Existen magnitudes físicas tales que en un cierto dominio de sus valores poseen un espectro discreto, y en otro, uno continuo. Para las funciones propias de una tal magnitud valen, claro está, todas las relaciones que se han deducido en los párrafos precedentes. Sólo hay que observar que el sistema completo de funciones está constituido por el conjunto de las funciones propias de ambos espectros. Por consiguiente, el desarrollo de una función de onda cualquiera respecto de las funciones propias de dicha magnitud tiene la forma: 'Y(q) = ~ an'Yn(q)+ f a,'Y,(q) d/, (5.15) donde la suma se extiende al espectro discreto, y la integral, a todo el espectro continuo. La propia coordenada q constituye un ejemplo de magnitud que posee espectro continuo. Es fácil ver que el operador que le corresponde es la simple multiplicación por q. En efecto, dado que la probabilidad de los diferentes valores de las coordenadas está determinada por el cuadrado j'Y(q)/ 2, el valor medio de la coordenada es igual a ij = f ql'Yl 2 dq. Por otra parte, el valor medio de la coordenada debe definirse en función de su operador por ij = f 'l"*q'Y dq. La comparación de ambas expresiones muestra que el operador q es la mera multiplicación por q; esto se puede escribir simbólicamente en la forma (1): q=q. (5.16) Las funciones propias de este operador deben determinarse, de acuerdo con la regla general, por la ecuación q'Yq = %'f'q donde con% designamos, por el mo0 0 , (1) En lo que sigue, para simplificar el simbolismo, convendremos en escribir siempre los operadores que se reducen a la multiplicación por una cierta cantidad utilizando simplemente el mismo símbolo que para dicha cantidad. 24 Conceptos fundamentales de la mecánica cuántica mento, los valores concretos de la coordenada para distinguirlos de la variable q. Dado que esta igualdad queda satisfecha bien para 'P'Qo = O, bien para q = %, es claro que las funciones propias que satisfacen la condición de normalización son (1): (5.17) § 6. El paso al límite La mecánica cuántica incluye en sí la mecamca clásica como un cierto caso límite. Surge la cuestión de cómo se puede llevar a cabo este paso al límite. En mecánica cuántica el electrón se describe mediante una función de onda que determina los diferentes valores de sus coordenadas; de esta función sólo sabemos hasta ahora que es solución de una ecuación lineal entre derivadas parciales. En mecánica clásica, en cambio, el electrón se considera como una partícula material que se mueve a lo largo de una trayectoria determinada por completo por las ecuaciones del movimiento. Una relación mutua, en cierto sentido análoga a la ·existente entre la mecánica cuántica y la clásica, existe en electrodinámica entre la óptica ondulatoria y la geométrica. En la óptica ondulatoria las ondas electromagnéticas se definen por los vectores de los campos eléctrico y magnético, vectores que satisfacen un determinado sistema de ecuaciones diferenciales lineales (ecuaciones de Maxwell). En la óptica geométrica, en cambio, se considera la propagación de la luz siguiendo determinadas trayectorias: los rayos. Tal analogía permite concluir que el paso al límite que lleva de la mecánica cuántica a la clásica se efectúa de manera análoga al paso de la óptica ondulatoria a la geométrica. Recordemos cómo se lleva a cabo matemáticamente esta última transición. Sea u una cualquiera de las componentes del campo electromagnético. Podemos escribirla en la forma u = aei'P (con a y cf, reales), donde a es la amplitud y cf, la fase de la onda. El caso límite que constituye la óptica geométrica corresponde a pequeñas longitudes de onda, lo que se traduce matemáticamente en el hecho de que la fase cf, (que en óptica geométrica se llama iconal) varía considerablemente entre puntos separados por pequeñas distancias; esto significa, en particular, que podemos suponerla grande en valor absoluto. <1) Los coeficientes del desarrollo de una función arbitraria 'Y respecto de estas funciones propias son iguales a La probabilidad de que los valores de las coordenadas pertenezcan a un intervalo dado dq0 es igual a como debía ser. El paso al límite 25 De acuerdo con esto, partamos de la hipótesis de que al caso límite que representa la mecánica clásica corresponden en mecánica cuántica funciones de onda de la forma 'Y = aei<P, donde a es una función lentamente variable y <p toma valores que son grandes. Como es sabido, las trayectorias de las partículas se pueden determinar en mecánica mediante un principio variacional, según el cual la llamada acción S del sistema mecánico debe ser un mínimo (principio de la mínima acción o principio de Hamilton). En óptica geométrica, en cambio, la marcha de los rayos se determina por el principio de Fermat, según el cual debe ser mínima la longitud óptica del rayo, es decir, la diferencia entre los valores de la fase en el extremo y en el origen del mismo. Partiendo de esta analogía, podemos afirmar que la fase <p de la función de onda en el caso límite clásico debe ser proporcional a la acción mecánica S del sistema físico considerado, es decir, debe tenerse S = const. <p. El coeficiente de proporcionalidad se llama constante de Planck y se designa con la letra h (1 ). Su dimensión es la de una acción (puesto que <p carece de dimensiones) y su valor es igual a ñ = 1·054 x 10-27 erg. s. Así, pues, la función de onda « casi clásica» (o, como suele decirse, cuasiclásica) de un sistema tiene la forma: (6.1) La constante de Planck representa un papel fundamental en todos los fenómenos cuánticos. Su valor relativo (respecto -de otras magnitudes de igual dimensión) determina el « grado de cuantificación » de un sistema físico. El paso de la mecánica cuántica a la clásica, la cual corresponde a grandes valores de la fase, se puede describir formalmente como paso al límite para ñ -+0 (de manera análoga a como el paso de la óptica ondulatoria a la geométrica corresponde al paso al límite cuando la longitud de onda tiende a cero, J. -+0). Hemos establecido la forma límite de la función de onda, pero subsiste todavía la cuestión de cómo está ligada con el movimiento clásico a lo largo de trayectorias. En general, el movimiento descrito por la función de onda no se reduce, en modo alguno, al movimiento siguiendo una determinada trayectoria. El vínculo con el movimiento clásico consiste en que si en un cierto instante inicial se da la función de onda, y con ella también la distribución de probabilidades de las coordenadas, esta distribución se « desplazará » en instantes ulteriores como suponen las leyes de la mecánica clásica (para más detalles, véase el final del § 17). Para obtener el movimiento a lo largo de una. trayectoria determinada, hay que partir de una función de onda de tipo especial (el llamado paquete de ondas), (1) Fue introducida por el físico M. PLANCK en 1900. La constante li, que utilizaremos siempre en este libro, es, en rigor, la constante de Planck h dividida por 2n. 26 Conceptos fundamentales de la mecánica cuántica que es apreciablemente distinta de cero tan sólo en una pequeña región del espacio; las dimensiones de esta región se pueden hacer tender a cero junto con h. Cabe entonces afirmar que, en el caso cuasiclásico, el paquete de ondas se desplazará en el espacio siguiendo la trayectoria clásica de una partícula. Finalmente, en lo que concierne a los operadores de la mecánica cuántica, éstos deben reducirse en el límite a la multiplicación por la correspondiente magnitud física. § 7. Función de onda y medición Volvamos de nuevo al proceso de medición, proceso cuyas propiedades se consideraron cualitativamente en el § 1, y veamos cómo estas propiedades están ligadas con el formalismo matemático de la mecánica cuántica. Consideremos un sistema constituido por dos partes, un aparato clásico y un electrón (considerado como un objeto cuántico). El proceso de medición consiste en que estas dos partes entran en interacción mútua, como resultado de la cual el aparato pasa del estado inicial a otro estado, y gracias a este cambio de estado podemos sacar conclusiones acerca del estado del electrón. Los estados del aparato se distinguen por los valores de una cierta magnitud física (o de unas ciertas magnitudes) que los caracteriza: las indicaciones del aparato. Convengamos en designar esta magnitud por g y sus valores propios por gn; estos últimos recorren, de acuerdo con la naturaleza clásica del aparato, una sucesión continua de valores, en general, pero nosotros supondremos - tan sólo para simplificar la escritura de las fórmulas que siguen - que el espectro es discreto. La descripción de los estados del aparato se realiza mediante funciones de onda cuasiclásicas, las cuales representaremos por «l>n(~), donde el subíndice n corresponde a la « indicación » gn del aparato, y~ representa el conjunto de sus coordenadas. El carácter clásico del mismo se traduce en que, en cada instante dado, es posible afirmar con certeza que se encuentra en uno de los estados conocidos el> n con cierto valor determinado de la magnitud g; para el sistema cuántico, claro está, una tal afirmación no sería legítima. Sea ct>o(~) la función de onda del estado inicial del aparato (antes de la medición) y 'Y(q) una función de onda inicial normalizada artitraria del electrón (q designa sus coordenadas). Estas funciones describen el estado del aparato y del electrón de manera independiente y, por consiguiente, la función de onda inicial de todo el sistema es el producto (7.1) El aparato y el electrón entran luego en interacción mutua. Aplicando las ecuaciones de la mecánica cuántica es posible seguir en principio el cambio de la función de onda del sistema con el tiempo. Terminado el proceso de medición, la función de onda, Función de onda y medición 27 claro está, no será ya un producto de funciones de~ y de q. Desarrollándola en funciones propias <I>n del aparato (que forman un sistema completo de funciones), obtenemos una suma de la forma· (7.2) donde las An(q) son ciertas funciones de q. Entran ahora en escena el carácter «clásico» del aparato y el doble papel de la mecánica cJásica. como caso límite y, al mismo tiempo, como fundamento de la mecánica cuántica. Conforme se indicó ya, gracias al carácter clásico del aparato, en cada instante la magnitud g (la « indicación del aparato ») tiene un valor determinado. Esto permite afirmar que el estado del sistema aparato +electrón después de la medición se describirá, en realidad, no por toda la suma (7.2), sino solamente por un término, el que corresponde a la « indicación » Kn del aparato: (7.3) Se sigue de aquí que An(q) es proporcional a la función de onda del electrón después de la medición. No es aún la propia función de onda, lo que se reconoce ya en el hecho de que la función An(q) no está normalizada. Dicha función encierra en sí tanto información acerca de las propiedades del estado resultante del electrón, como la probabilidad de que se obtenga la n-ésima «indicación» del aparato, probabilidad determinada por el estado inicial del sistema. En virtud del carácter lineal de las ecuaciones de la mecánica cuántica, la relación entre An(q) y la función de onda inicial del electrón 'Y(q) se expresa, en general, mediante un cierto operador integral lineal: An(q) = f Kn(q, q')'Y(q') dq', (7.4) cuyo núcleo Kn(q, q') caracteriza el proceso de medición considerado. Supondremos que la medida en cuestión es tal que como resultado de la misma se consigue una descripción completa del estado del electrón. Con otras palabras (véase§ 1), en el estado resultante las probabilidades de todas las magnitudes deben ser independientes del estado precedente del electrón (el estado antes de la medición). Esto significa matemáticamente que la forma de las funciones An(q) ha de venir determinada por el mismo proceso de medición y no debe depender de la función de onda inicial del electrón 'Y(q). Así, pues, las A 11 deben tener la forma: (7.5) donde <f, 11 son ciertas funciones, que supondremos normalizadas, y sólo las constan- 28 Conceptos fundamentales de la mecánica cuántica tes an dependen del estado inicial 'F'(q). En la relación integral (7.4), a este caso corresponde un núcleo Kn(q, q') que se descompone en el producto de una función de q por una función de q' : Kn(q, q') = </>n(q)'Yn*(q'); (7.6) con lo que la relación lineal de las constantes an con la función 'F'(q) viene dada por fórmulas del tipo: ª" = f 'Y(q)'Y *(q) dq, n (7.7) donde 'Y n(q) son determinadas funciones que dependen del proceso de medición. Las funciones </>n(q) son las funciones de onda normalizadas del electrón después de la medición. Vemos así cómo el formalismo matemático de la teoria refleja la posibilidad de obtener, mediante una medición, el estado de un electrón descrito por una determinada función de onda. Si la medición se efectúa en un electrón con función de onda dada 'F(q), las constantes an tienen un simple significado físico: en virtud de las reglas generales, lanl2 es la probabilidad de que la medición dé el n-ésimo resultado. La suma de las probabilidades de todos los resultados es igual a la unidad: (7.8) La licitud de las fórmulas (7.7) y (7.8) para una función de onda arbitraria (normalizada) 'F'(q) equivale (cf. § 3) a afirmar que una función arbitraria 'F'(q) se puede desarrollar en funciones 'F'n(q). Esto significa que las funciones 'Yn(q) constituyen un sistema completo de funciones normalizadas y ortogonales dos a dos. Si la función de onda inicial del electrón coincide con una de las funciones la correspondiente constante On será, evidentemente, igual a la unidad y todas las demás serán nulas. Con otras palabras, si la medición se efectúa en un electrón que se encuentra en el estado 'Y n(q), ésta da con certeza un resultado determinado (el n-ésimo). 'Yn(q), Todas estas propiedades de las funciones 'Yn(q) muestran que son funciones propias de una cierta magnitud física característica del electrón (representémosla por /), y de la medición considerada podemos decir que es una medición de esta magnitud. Es muy importante el hecho de que las funciones \P' n(q) no coinciden, en general, con las funciones <f,n(q) (estas últimas, en general, incluso ni son ortogonales dos a dos, ni forman un sistema completo de funciones propias de un cierto operador). Función de onda y medición 29 Esta circunstancia expresa, ante todo, la no reproducibilidad de los resultados de las mediciones en mecánica cuántica. Si el electrón se encontraba en el estado 'Fn(q), al efectuar en él una medida de la magnitud f se obtiene con certeza el valor f n. Pero después de la medición el electrón se encuentra en un estado <Í>n(q) distinto de¡ inicial, estado en el cual la magnitud/ no posee en absoluto ningún valor determinado, cualquiera que sea. Por consiguiente, si inmediatamente después de la primera medición del electrón se efectúa una segunda, obtendríamos para f un valor que no coincide con el obtenido como resultado de la primera medida (1). Para predecir (en el sentido de calcular su probabilidad) el resultado de la segunda medición cuando se conoce el resultado de la primera, es necesario deducir de ésta la función de onda </>n(q) del estado originado por ella, y de la segunda medición, la función de onda 'F'n(q) del estado cuya probabilidad nos interesa. Esto significa lo siguiente: partiendo de las ecuaciones de la mecánica cuántica determinamos la función de onda </>n(q, t) que en el momento de la primera medición es igual a </>n(q). La probabilidad del m-ésimo resultado en la segunda medición, realizada en el instante t, viene dada por el cuadrado del módulo de la integral f <Í>n(q, t)'Ym*(q) dq. Vemos así que el proceso de medición en mecánica cuántica presenta« dos caras»: su papel respecto del pasado y del futuro no coinciden. Con relación al pasado, dicho proceso «verifica» las probabilidades de los diferentes resultados posibles predichos por el estado resultante de la medición anterior. En cambio, en relación al futuro, da lugar a un nuevo estado (véase también el § 44). En la propia naturaleza del proceso de medición se encierra así una profunda irreversibilidad. Esta irreversibilidad tiene un importante significado fundamental. Como veremos más adelante (véase el final del § 18), las ecuaciones básicas de la mecánica cuántica poseen de suyo un carácter simétrico con relación al cambio de signo de la variable tiempo; en este respecto la mecánica cuántica no difiere de la clásica. La irreversibilidad del proceso de medición, en cambio, introduce en los fenómenos cuánticos una no equivalencia física de los dos sentidos del tiempo, es decir, conduce a la aparición de una diferencia entre futuro y pasado. ( 1) Es necesario observar, sin embargo, que existe una importante excepción a la no reproducibilidad de las mediciones: la única magnitud cuya medición se puede repetir es una coordenada. Dos mediciones de una coordenada del electrón efectuadas después de transcurrido un intervalo de tiempo suficientemente corto deben dar valores próximos entre sí; lo contrario significaría que el electrón posee una velocidad infinita. Esta circunstancia está relacionada matemáticamente con el hecho de que una coordenada conmuta con el operador de energía de interacción en.re el electrón y el aparato, operador que (en la teoría no relativista) es función sólo de las coordenadas. CAPÍTULO II ENERGÍA E IMPULSO § 8. El operador de Hamilton La función de onda 'Y determina completamente el estado de un sistema físico en mecánica cuántica. Esto significa que dar esta función para un cierto instante no sólo define -todas las propiedades del sistema en el mismo, sino que determina también su comportamiento en los instantes futuros - tan sólo, claro está, hasta el grado de definición que permite en general la mecánica cuántica. Desde el punto de vista matemático esto se traduce en que el valor de la derivada o'Y/ót de la función de onda respecto del tiempo debe quedar determinado en cada instante por el valor de la propia función 'Y correspondiente al mismo, debiéndo ser además esta dependencia, según el principio de superposición, una dependencia lineal. En la forma más general se puede escribir i o'Y/ot = DY, donde l es un operador lineal; el tactor z se introduce aquí por conveniencia. Veamos algunas propiedades del operador l. Dado que la integral es una constante que no depende del tiempo, tenemos: f -d l'Yl 2 dq = & f'Y-o'Y... f'Y•-·o'Y ~ dq+ -dq ~ = f 'Y'Y• dq o. Substituyendo aquí o'Y/ot = -iL'Y, o'Y•/ot = iL•'F'• y aplicando a la primera integral la definición de operador transpuesto, escribiremos: f 'YL•'Y• <lq - f 'Y"" L'Y <lq = f 'Y•l•'Y <lq - f 'Y•L'Y dq = f 'Y•(l•-L)'Y <lq = o. Dado que esta igualdad debe quedar satisfecha ~ualquiera que sea la función 'Y, de ella se sigue que ha de tenerse idénticamente L•-L = O , o bien l=L•. Derivación de los operadores respecto del tiempo 31 El operador 1 es así hermítico. Examinemos a qué magnitud clásica corresponde. Utilicemos para ello la expresión límite (6.1) de la función de onda y escribamos: a'F at i as at -=--:tF; ñ no es necesario derivar la amplitud lentamente variable a. Comparando esta igualdad con la definición o'Y/ot = -iL'Y, vemos que en el caso límite el operador i se reduce a la simple multiplicación por la cantidad -(1/ ñ) oS/ot. Esto significa que esta última es precisamente la magnitud física a la que se reduce el operador hermítico L. Conforme enseña la mecánica, la derivada - oS/ot no es sino la función de Hamilton H del sistema mecánico. Así, pues, el operador hi es el operador que corresponde en mecánica cuántica a la función de HAMILTON; este operador, que representaremos por Íí, se llama operador hamiltoniano o, más brevemente, hamiltoniano del sistema. La relación entre o'Y/ot y 'Y toma la forma: iñ o'F/ot = íl'F. (8.1) Si se conoce la forma del hamiltoniano, la ecuación (8.1) determina las funciones de onda del sistema físico dado. Esta ecuación fundamental de la mecánica cuántica se llama ecuación de onda· § 9. Derivación de los operadores respecto del tiempo El concepto de derivada respecto del tiempo de una magnitud física no se puede definir en mecánica cuántica en el mismo sentido que tiene en la mecánica clásica. En efecto, la definición de derivada está ligada en mecánica clásica con la consideración de los valores de una magnitud en dos instantes próximos, pero distintos. Ahora bien, en mecánica cuántica una magnitud que en cierto instante posee un valor determinado no posee en general ningún determinado valor en los instantes siguientes; de esto se trató con mayor detalle en el § 1. El concepto de derivada respecto del tiempo, por consiguiente, debe definirse en mecánica cuántica de otra manera. Es natural definir la derivada j de una magnitud f como aquella magnitud cuyo valor medio es igual a la derivada respecto del tiempo del valor medio J Tenemos así, por definición: l=f. (9.1) Partiendo de esta definición no es difícil obtener la expresión del operador / que corresponde a la magnitud/en la mecánica cuántica. Dado que f = f 'Y'-'/'Y dq, será 32 Energía e impulso f l= I = !!_ 'Y*/'Y dq = dt f 'Y*0atf'Y dq+ f o'Y*J'Y dq + f 'Y*Jª'Y at at dq. Aquí aJ/ot es el operador que se obtiene al derivar el operador /respecto del tiempo, variable ésta de la que el operador puede depender en forma paramétrica. Substituyendo en vez de las derivadas o'Y/ot, o'Y*/at sus expresiones dadas por (8.1), obtenemos: / = J'Y* ataj'Y dq+~ñ J(H*'Y*)/'Y dq-~ñ J'Y*f(H'Y) dq. Dado que el operador ÍI es hermítico, es f (H*\J!*)(/'Y) dq f 'F*H/'Y dq: = y así tenemos: ¡= \J! dq. at J'Y* (-+-fJJ--JfJ aj i ñ i ñ A ) Por otra parte, dado que por la definición de valores medios ha de tenerse J= f 'Y*/'Ydq, de ahí se sigue que la expr~sión que aparece en el integrando entre paréntesis representa el operador buscado f (1): (1) En mecánica clásica, para la derivada total respecto del tiempo de una magnitud f, que es función de las coordenadas generalizadas Qi y de los impulsos Pi del sistema, se tiene: df =a¡+~(ª! qá a¡-A). dt at ~ aqi ºPi i Substituyendo, de acuerdo con las ecuaciones de Hamilton q¡ = oH/op,, p¡ = -oH/oq,, obtenemos df/dt = a¡¡at+[H,f], donde [H fJ = ~ ( a¡ aH _ a¡ aH) ' - ~ aqi api api aqi 1 es el llamado paréntesis de Poisson para las magnitudes/ y H (véase tomo l. Mecánica,§ 4i). Comparando con la expresión (9.2), vemos que, al pasar al límite clásico, el operador i(H/-ffI) se reduce a cero en primera aproximación, como era de esperar, y que en la siguiente aproximación (respecto de h) se reduce a la magnitud h[H.f[. Este resultado es también válido para dos magnitudes cualesquierafy g: el operador i(fg-gf) se reduce en el límite a la magnitud h[f, g], donde [f, g] es el paréntesis de Poísson. [f,g]= ag a¡ ¿( . aq, ap, ag a¡) ap, aq, -----. l Esto último se sigue inmediatamente de que siempre podemos imaginar formalmente un sistema cuyo hamiltoniano coincide con g. Estados estacionarios 33 J= ataj+¡li f11i-f11). (9.2) J Observemos que si el operador no depende explícitamente del tiempo, el operador Í se reduce, salvo un factor, al resultado de la conmutación del operador j con el hamiltoniano. Una categoría muy importante de magnitudes físicas está constituida por los operadores que no dependen explícit~mente del tiempo y que, además, conmutan con el hamiltoniano, de forma que f = O. Tales funciones se califican de conservativas. J J J Si el operador se anula idénticamente, se tendrá = = O, es decir, J = const. Con otras palabras, el valor medio de esta magnitud se mantiene constante en el curso del tiempo. Cabe también afirmar que si en un estado dado la magnitud f tiene un valor determinado (es decir, la función de onda es una función propia del operador/), también en los instantes ulteriores poseerá un valor determinado - precisamente el mismo. § 1O. Estados estacionarios Si un sistema no se encuentra en un campo exterior variable, su hamiltoniano no puede contener el tiempo explícitamente. Esto se sigue inmediatamente del hecho que cuando no existe un campo exterior (o si el campo exterior es constante) todos los instantes son equivalentes en lo que concierne al sistema físico dado. Por otra parte, puesto que todo operador conmuta, claro está, consigo mismo, llegamos a la conclusión de que ia función de HAMILTON se conserva en los sistemas que no se encuentran en un campo exterior variable. Como es sabido, una función de HAMILTON que se conserva recibe el nombre de energía. Obtenemos así la ley de conservación de la energía en mecánica cuántica. Ella significa en nuestro caso que si en un estado dado la energía tiene un valor determinado, este valor se conserva constante en el tiempo. Los estados en los que la energía tiene valore~ determinados se llaman estados estacionarios del sistema. Estos estados se describen mediante funciones de onda que son funciones propias del operador de HAMILTON, es decir, funciones que satisfacen a la ecuación H'Y n = En'I·n, donde En son los valores propios de la energía. De acuerdo con esto, la ecuación de onda (8.1) para la función 'Y n iñ o'J!'nfot = H'I!'n = En'Yn se puede integrar inmediatamente respecto del tiempo y nos da (10.1) 34 Energí.a e impul.so donde 'f/Jn es función sólo de las coordenadas. Mediante esta fórmula se determina la dependencia temporal de las funciones de onda de los estados estacionarios. La letra 1/J minúscula designará las funciones de onda de los estados estacionarios sin el factor dependiente del tiempo. Estas funciones, y también los valores propios de la energía, se determinan mediante la ecuación Hij; = Eif;. (10.2) Haremos notar que el estado estacionario al que corresponde el_menor de todos los valores posibles de la energía se llama estado normal o fundamental del sistema. El desarrollo de una función de onda arbitraria 'F en funciones de onda de los estados estacionarios es de la forma: (10.3) Los cuadrados Janl 2 de los coeficientes del desarrollo determinan, como siempre, las probabilidades de los diferentes valores de la energía del sistema. La distribución de probabilidades de las coordenadas en un estado estacionario viene determinada por el cuadrado j'Fn\ 2 = 1%\2 ; no depende, pues, del tiempo. Lo mismo vale para los valores medios de cualquier magnitud física{ (cuyo operador no depende del tiempo explícitamente), y, por consiguiente, también para las probabilidades de sus diferentes valores. Conforme se indicó, el operador de una magnitud cualquiera conservativa- conmuta con el hamiltoniano. Esto -significa que toda magnitud física que se conserve puede medirse a la vez que la energía. Entre los diferentes estados estacionarios puede haber también algunos que corresponden a un mismo valor de la energía, difiriendo entre sí por los valores de cualesquiera otras magnitudes físicas. De tales valores propios de la energía (o de los, como se les llama también, diferentes niveles energéticos del sistema), a los que corresponden diferentes estados estacionarios, se dice que son degenerados. La posibilidad de existencia de niveles degenerados está ligada físicamente con el hecho de que la energía no constituye de suyo, en general, un sistema completo de magnitudes físicas. En particular, es fácil ver que si se tienen dos magnitudes físicas conservativas f y g cuyos operadores no conmutan entre sí, los niveles de energía del sistema son, Estados estacionarios 35 en general, degenerados. En efecto, sea 1P la función de onda de un estado estacionario en el que, junto con la energía, posee un valor determinado la magnitud f. Cabe entonces afirmar que la función K1P no coincide (ni aun salvo un factor constante) con 1P; lo contrario significaría que también g tiene un valor determinado, lo que es imposible, ya que f y g no se pueden medir simultáneamente. De otra parte, la función g''f/J es función propia del hamiltoniano correspondiente al mismo valor E de la energía que la función 1P: fl(g¡/1) = gfli/i = E(g,fi). Vemos así que a la energía E corresponde más de una función propia, es decir, que el nivel energético es degenerado. Es evidente que cualquier combinación lineal de funciones de onda correspondientes a un mismo nivel degenerado de la energía es también función propia asociada al mismo valor de la energía. Con otras palabtas, la elección de las funciones propias correspondientes a un valor propio de la energía degenerado no es única. Las funciones propias de un nivel energético elegidas arbitrariamente no son, en general, ortogonales dos a dos. Sin embargo, eligiendo convenientemente sus combinaciones lineales es siempre posible construir un sistema de funciones propias ortogonales dos a dos (y normalizadas). Esta elección se puede efectuar de infinitas maneras; en efecto, el número de coeficientes independientes en una transformación lineal de n funciones es igual a n 2 , y el número de condiciones que traducen la normalización y ortogonalidad de las n funciones es igual a n(n+I)/2, es decir, menor que n2 • Estas consideraciones relativas a las funciones propias de un nivel energético degenerado valen, claro está, no sólo para las funciones propias de la energía, sino también para las funciones propias de cualquier otro operador. Así, tan sólo las funciones que corresponden a valores propios distintos del operador en cuestión son automáticamente ortogonales; en cambio, las funciones que corresponden a un mismo valor propio degenerado no son, en general, ortogonales dos a dos. Si el hamiltoniano del sistema es la suma de dos (o más) términos.B = 0 1 +fJ2 , uno de los cuales contiene solamente las coordenadas q1 y~ el otro las coordenadas q2 , las funciones propias del operador fI se pueden escribir como productos de las funciones propias de los operadores H1 y Í/2, y los valores propios de la energía son iguales a las sumas de los valores propios de dichos operadores. El espectro de valores propios de la energía puede ser tanto discreto como continuo. Un estado estacionario del especto discreto corresponde siempre a un movimiento finito del sistema, es decir, a un movimiento en el que ni el sistema ni una parte cualquiera del mismo escapan al infinito. En efecto, para las funciones propias del espectro discreto la integral f ]'Fl 2 dq extendida a todo el espacio es finita. Esto 36 Energía e impulso significa, en cualquier caso, que el cuadrado ['Y[ 2 disminuye con rapidez suficiente, tendiendo a cero en el infinito. Con otras palabras, la probabilidad de que las coordenadas tomen valores infinitos es igual a cero, es decir, el sistema realiza un movimiento finito o, conforme suele decirse, se encuentra en un estado ligado. Para las funciones de onda del espectro continuo la integral f )'Y] 2 dq diverge. El cuadrado de la función de onda i'Yi 2 no determina ahora de manera inmed:ata la probabilidad de los diferentes valores de las coordenadas y debe considerarse solamente como una cantidad proporcional a dicha probabilidad. La divergencia de la integral f )'Y[ 2 dq está siempre ligada con el hecho de que i'Yl 2 no tiende a cero en el infinito (o tiende a cero, pero no con la suficiente rapidez). Por consiguiente, se puede afirmar que la integral f ['Y\ 2 dq extendida a la región del espacio exterior a una superficie cerrada cualquiera, pero finita y tan grande cuanto se quiera, será siempre divergente. Esto significa que en el estado considerado el sistema (o una cualquiera de sus _partes) se encuentra en el infinito. Para una función de onda que es superposición de diferentes funciones de onda de estados estacionarios del espectro continuo, la integral f \'Y[ 2 dq puede resultar convergente, de forma que el sistema se encuentre en una región finita del espacio. Sin embargo, es posible demostrar que en el curso del tiempo este dominio se extenderá sin límites y en último término el sistema escapará al infinito (1). Los estados estacionarios del espectro continuo corresponden así a un movimiento infinito del sistema. § 11. Matrices Supondremos para simplificar que el sistema considerado posee un espectro discreto (todas las relaciones que se obtienen a continuación se generalizan inmediatamente también al caso del espectro continuo). Sea 'Y = I:an'Y n el desarrollo (1) Es fácil ver que así ocurre de la siguiente manera. Una superposición de funciones de onda del espectro continuo tiene la forma: 'Y = Ja Ee-(i flt)Etip E(q) dE. El cuadrado del módulo de 'Y se puede escribir en forma de integral doble Si se promedia esta expresión en un intervalo de tiempo T y se hace luego que T tienda a infinito, los valores medios del factor oscilante e(if1t)(E 1-E)1, y con ellos toda la integral, tienden a cero en el límite. Por consiguiente, el valor medio respecto del tiempo de la probabilidad de éncontrar el sistema en un lugar dado cualquiera del espacio de configuraciones tiende a cero; pero esto es sólo posible si el movimiento se efectúa en todo el espacio infinito. Observemos que para una función 'Y que es superposición de.funciones del espectro discreto sería l'YJ2 = ~~ nm anam*e(i/1tXEm-En>t¡/Jn'Pm* = ~ lan'Pn(q)J2, n es decir, la probabilidad buscada se conserva finita al promediar respecto del tiempo. Matrices 37 de una función de onda cualquiera en funciones de onda 'Y n de los estados estacionarios. Si se substituye este desarrollo en la definición f = f 'P'*l"/'Y d.q del valor medio de una magnitud f, obtenemos: (11.1) donde las fnm(t) d~signan las integrales Ínm(t) = f *fY m dq. 'Yn (11.2) El conjunto de cantidadesfnm(t), con todos los valores posibles n, m, se llama matriz de la magnitudf(1), y de cada una de lasf,1m(t) se dice que es un element1J de matriz correspondiente a la transición del estado n al estado m (2). La dependencia de los elementos de matriz fnm(t) respecto del tiempo viene determinada (si el operador J no contiene t explícitamente) por la dependencia temporal de las funciones 'Fn, Substituyendo en vez de éstas las expresiones (10.1 ), se encuentra que (11.3) donde (11.4) es la llamada frecuencia de transición entre los estados n y m, y las cantidades (11.5) constituyen la matriz no dependiente del tiempo de la magnitud f, matriz que se utiliza a menudo (3). Observemos que las frecuencias w 11 m satisfacen las relaciones evidentes: (11.6) J Los elementos de matriz de la derivada se obtienen derivando respecto del tiempo los elementos de matriz de la magnitud f; esto se sigue desde luego del hecho (1) La representación matricial de las magnitudes físicas fue introducida por W. HEISENBERG en 1925, antes del descubrimiento por ScHRÓDINGER de la ecuación de onda. La « mecánica matricial » fue luego desarrollada por M. BoRN, W. HEISENBERG y P. JoRDAN. (2) En ciertos casos, cuando es necesario escribir cada uno de los índices n, m, como conjunto de varias letras, utilizaremos la notaciónfmn en vez defnm• Para los mismos elementos de matriz se emplea también la notación (ni f: m). ( 3) Ho hay que perder de vista que, debido a la indeterminación del factor de fase en las funciones de onda normalizadas (véase§ 2), también los elementos de matrizfmn (y fmn(t)) están determinados salvo ,un factor de la forma ei(am - an). También aquí esta indeterminación no se refleja en ninguno de los resultados físicos. 38 Energía e impulso que el valor medio J es igual Í, es decir, J= LL an*amfnm(t). nm En virtud de (11.3) tenemos así para los elementos de matriz de /: fnm(t) = ÍWnmfnm(t) (11.7) o (dividiendo ambos miembros por el factor temporal ei"'nm') para los elementos de matriz no dependientes del tiempo: (/)nm = iwnmfnm = (i//i)(E,,,-Em)fnm• (11.8) Para simplificar la notación en las fórmulas, todas las relaciones que se deducen a continuación se refieren a los elementos de matriz no dependientes del tiempo; las mismas relaciones exactamente valen también para las matrices dependientes de él. Para los elementos de matriz de la magnitud ¡• conjugada compleja de f se obtiene, teniendo en cuenta la definición de operador conjugado: o bien (11.9) Para las magnitudes físicas reales, que son las que habitualmente tan sólo consideramos, tenemos, por consiguiente, (11.10) (f* mn aparece aquí en vez de (fmn)*). Estas matrices, como sus correspondientes operadores, se llaman hermíticas. Los elementos de matriz con n = m se llaman diagonales. Estos elementos no dependen en general del tiempo, y de (11.1 O) se sigue, evidentemente, que son reales. El elemento fnn representa el valor medio de la magnitud f en el estado "Pn· No es difícil obtener la regla de multiplicación de matrices. Observemos para ello, ante todo, que vale la fórmula (11.11) Esto no es sino el desarrollo de la función /ifsn en funciones "Pm con coeficientes determinados siguiendo la regla general (3.5). Teniendo en cuenta esta fórmula, escribamos el resultado de aplicar a la función "Pn el producto de dos operadores: Matrices /gi/;n = /( gipn) = J f gknlPk = 39 f gkn/ipk = k"'frlknÍmklPm· Dado que, de otra parte, debe tenerse llegamos al resultado de que los elementos de matriz del producto fg vienen dados por la fórmula (11.12) Esta regla coincide con la adoptada en matemáticas para el producto de matrices. Dar una matriz es equivalente a dar el propio operador. En particular, dar la matriz proporciona en esencia la posibilidad de determinar los valores propios de la magnitud física en cuestión y las correspondientes funciones propias. Consideremos ahora los valores de todas las magnitudes en- un cierto instante y desarrollemos una función de onda cualquiera 'Y (correspondiente a este instante) en funciones propias del operador de HAMILTON ÍI, es decir, en funciones de onda "Pm, independientes del tiempo, de los estados estacionarios: (11.13) donde hemos representado los coeficientes del desarrollo por Cm· Substituyamos este desarrollo en la ecuación fP" = f'p' que determina los valores propios y las funciones propias de la magnitud f Tenemos: Multipliquemos ambos miembros de esta ecuación por "Pn * e integremos respecto de q. Cada una de las integrales f 'Pn•fil,m dq que aparecen en el primer miembro de la igualdad es el correspondiente elemento de matriz fnm· En cambio, en el se~ gundo miembro todas las integrales f 'Pn.•.¡,m dq con m =I= n desaparecen en virtud de la ortogonalidad de las funciones "Pm dos a dos, y la integral f 'Pn •.¡,. dq = 1 en virtud de su normalización: o bien (11.14) donde ~nm = O para m =/= n, e igual a 1 para m = n. 40 Energí,a e impulso Hemos obtenido así un sistema de ecuaciones algebraicas homogéneas de primer grado (respecto de las incógnitas cm). Como es sabido, un sistema de este tipo tiene soluciones diferentes de cero sólo si se cumple la condición de anulación del determinante formado por los coeficientes de las ecuaciones, es decir, si se cumple la condición Las raíces de esta ecuación (en la que f se considera como incógnita) representan también los valores posibles de la magnitud f El conjunto de las cantidades cm que satisfacen las ecuaciones (11.14) conf igual a uno cualquiera de estos valores, determina la correspondiente función propia. Si en Ja definición (11.5) de los elementos de matriz de la magnitud f se toma para 'f/Jn las funciones propias de esta misma magnitud, en virtud de la ecuación f,pn = f n'Pn tendremos: Dada la ortogonalidad y normalización de las funciones 'f/Jm esta relación conduce afnm = O paran=/= m y fmm = fm. Resultan así diferentes de cero tan sólo los elementos de matriz diagonales y cada uno de ellos es igual al correspondiente valor propio de la magnitud f; de una matriz en la que sólo son diferentes de cero estos elementos se dice que está reducida a la forma diagonal. En particular, en la representación ordinaria, con las funciones de onda de los estados estacionarios utilizadas como funciones 'f/Jm la matriz de la energía es diagonal (como también las matrices de todas las otras magnitudes físicas que poseen valores definidos en los estados estacionarios). En general, de la matriz de una magnitud f determinada mediante las funciones propias de un cierto operador g se dice que es la matriz f en la representación en la que g es diagonal. Salvo indicación explícita, entenderemos en lo que sigue por matriz de una magnitud física la matriz en la representación ordinaria, en la que la energía es diagonal. Todo lo dicho antes acerca de la dependencia de una matriz respecto del tiempo se aplica, claro está, a esta representación ordinaria (1). Con ayuda de la representación matricial de los operadores se puede demostrar el teorema mencionado en el § 4: si dos operadores conmutan entre sí, poseen un sistema completo común de funciones propias. Sean J y g dos de estos operadores. De Jg = g/ y de la regla de multiplicación de matrices (11.12) se sigue que (1) Teniendo en cuenta el carácter diagonal de la matriz energía, es fácil comprobar que la igualdad (I 1.8) no es sino la relación entre operadores (9.2) escrita en forma matricial. 41 Matrices Tomando como sistema de funciones '!fn para el cálculo de los elementos de matriz las funciones propias del operador /, tendremos f mk = O para m =f= k, de forma que la igualdad anterior se reduce a la igualdad f~mgmn = gmnfnm o bien = O. Si todos los valores propios .fn de la magnitud f son diferentes, para todos los m =f= r. g mn(fm-fn) tendremos f m - fn =; O, de forma que debe ser gmn = O. Así, pues, también la matriz gmn resulta diagonal, es decir, las funciones 'f/Jn son también funciones propias de la magnitud física g. En cambio, si entre los valores fn los hay iguales (es decir si existen valores propios tales que a ellos les corresponden varias funciones propias), los elementos de matriz g mn correspondientes a cada uno de estos grupos de funciones 'f/Jn resultan, en general, diferentes de cero. Sin embaro, las combinaciones lineales de funciones "Pn que corresponden a un mismo valor propio de la magnitud/ son también, evidentemente, funciones propias de la misma; es siempre posible elegir estas combinaciones de tal manera que se reduzcan a cero los correspondientes elementos de matriz gmn no diagonales y, por consiguiente, también en este caso obtenemos un sistema de funciones que son funciones propias de los operadores J y g simultáneamente. Observemos que se puede considerar la. matriz /nm como el operador f en la representación energética. En efecto, el conjunto de los coeficientes en del desarrollo (11.13) en funciones propias 'f/Jn del hamiltoniano se puede considerar (cf. § 5) como función de onda en la «representación-E» (donde el índice n es una variable que indica el número del estado estacionario). La fórmula para el valor medio de la magnitud J corresponde entonces a la expresión general del valor medio de una magnitud, en mecánica cuántica, en función de su operador y de la función de onda del sistema dado. PROBLEMA El hamiltoniano de un sistema, y con él las funciones propias de la energía, En, son funciones de un cierto parámetro Á. Demostrar que (oH/oA)nn = oE,,Jo>... Solución. Derivando la ecuación (H-En)iµn = O respecto de izquierda por tpn*, obtenemos: Á y 7"T Oipn = i/;n* (ºEn ipn*(n -En)- - -oft) !pn, o>.. o>.. o>.. multiplicando luego a la 42 Energía e impulso Al integrar respecto de q, el primer miembro de esta igualdad se anula, por lo que dado el carácter hermítico del operador H. Et segundo miembro da precisamente la igualdad buscada. § 12. Transformación de matrices Los elementos de matriz de una misma magnitud física pueden definirse con relación a diferentes sistemas -de funciones de onda. Estas pueden ser, por ejemplo, funciones de onda de estados estacionarios descritos por diferentes conjuntos de magnitudes físicas, o funciones de onda de estados estacionarios de un mismo sistema que se encuentra en diferentes campos exteriores. Ligada con esto se plantea la cuestión de transformar las matrices pasando de una representación a otra. Sean "Pn(q) y 1Pn'(q) (n = l, 2, ... ) dos sistemas completos ortonormales de funciones. Estos sistemas están ligados entre sí por ciertas tn¡nsformaciones lineales Y,n' = !: m SmnY,m, (12.1) que representan simplemente el desarrollo de las funciones 1Pn' en funciones 1Pn de un sistema completo. Esta transformación se puede escribir en forma de operador: (12.2) El operador S debe satisfacer determinada condición a fin de que garantice el carácter ortonormal del sistema de funciones 1Pn' cuando lo es el sistema constituido por las funciones "Pn· En efecto, substituyendo (12.2) en la condición y teniendo en cuenta la definición de operador transpuesto (3.14), obtenemos: f (Sif,n)S*if,m• dq = f Y,m*S*SY,n dq = 3mn• Para que esta igualdad se cumpla para todos los m, n, debe ser S•S = 1, o bien (12.3) es decir, el operador inverso coincide con el conjugado hermitico. Los operadores que gozan de esta propiedad se llaman Únitarios. En virtud de ella la transformación ffn ::;: S-lifin~ inversa de la transformación (12.1), viene dada por la fórmula Trans/ormación de matrices 43 (12.4) Escribiendo la igualdad S+S = 1 o SS+ = 1 en forma matricial, obtenemos la condición que traduce el carácter unitario en la forma: (12.5) o bien (12.6) Consideremos ahora una magnitud física cualquiera/y escribamos sus elementos de matriz en la « nueva » representación, es decir, respecto de las funciones "Pn'. Dichos elementos vienen dados por las integrales: De aquí se sigue, evidentemente, que la matriz del operador/ en la nueva representación es igual a la matriz del operador ¡, = s-1/s (12.7) en la representación antigua. Un importante papel en diferentes cálculos de mecánica cuántica lo representan las sumas de los elementos diagonales de las matrices; tales sumas se llaman traza de las matrices y se designan por tr f (1): trf = Lfnn· n (12.8) Observemos, ante todo, que la traza del producto de dos matrices es independiente del orden de los factores: tr (fg) = tr (gf), (12.9) En efecto, según la regla de multiplicación de matrices tenemos: tr (fg) = Ln Lk Ín~kn = Lk nL gknÍnk = tr (gf). (1) De la palabra traza. Se utiliza también la notación Sp, del alemán Spur = traza. Claro está, sólo es posible considerar la traza cuando converge la suma respecto de n, condición que supondremos se cumple. 44 Energía e impulso De manera análoga es fácil comprobar que la traza del producto de varias matrices no varía cuando se efectúa una permutación circular de los factores; así tr (fgh) = tr (hfg) = tr (ghf). (12.10) La propiedad más importante de la traza consiste en que es independiente de la elección del sistema de funciones respecto del cual se determinan los elementos de matriz. En efecto: (tr f)' § 13. = tr (S-1jS) = tr (SS-1j) = tr f. Los operadores en la representación de Heisenberg En el formalismo matemático de la mecánica cuántica que acabamos de exponer, los operadores que corresponden a las diferentes magnitudes físicas se aplican a funciones de las coordenadas y ellos mismos no dependen por lo general explícitamente del tiempo. Los valores medios de las magnitudes físicas dependen del tiempo tan sólo como consecuencia de la dependencia, con relación al tiempo, <;le la función de onda del estado, y de acuerdo con la fórmula /(t) = J'Y*(q, t)/P(q, t) dq. (13.1) Sin embargo, el formalismo de la mecánica cuántica se puede presentar en otra forma diferente, que equivale a la primera, en la cual la dependencia temporal pasa de las funciones de onda a los operadores. Aunque en este libro no utilizaremos esta representación de los operadores (llamada representación de Heisenberg), la formularemos aquí con vistas a su aplicación ulterior a la teoría relativista. Introduzcamos el operador S = exp[-(i/li)Ht], (13.2) <londe b es el hamiltoniano del sistema. Por definición, sus funciones propias coinciden con las funciones propias del operador H, es decir, con las funciones de onda de los estados estacionarios 1J)n(q), y se tiene (13.3) Se sigue de aquí que el desarrollo (10.3) de una función de onda arbitraria en funciones de onda de los estados estacionarios se puede escribk en forma de operador: 'F(q, t) = S'Y(q, O), (13.4) es decir, la aplicación del operador S conduce al paso de una función de onda del sistema en un cierto instante inicial a la función de onda en un instante cualauiera. 45 La matriz densidad De acuerdo con la definición (3.16) tenemos (dado que el operador bes hermitico): es decir, Ses un operador unitario, conforme debía ser, ya que se puede considerar la fórmula (13.3) (con el tiempo t como parámetro) como caso particular de la transformación (12. l ). Introduciendo, de acuerdo con (12. 7), el operador dependiente del tiempo /et) = s-1¡s, tendremos: /(t) = f 'F*(q, O)f(t)'F(q, O) dq, (13.5) (13.6) es decir, representamos la fórmula que da el valor medio de la magnitud f (y que es la la que define los operadores) en una forma en la que la dependencia respecto del tiempo recae completamente en el operador. Evidentemente, los elementos de matriz del operador (13.5) respecto de las funciones de onda de los estados estacionarios coinciden con los elementos de matriz fnm(t), dependientes del tiempo, determinados por la fórmula (11.3). Finalmente, derivando la expresión (13.5) respecto del tiempo (en el supuesto de que los propios operadores/y H no contienen t), obtenemos la ecuación a -/(t) ot . = ;.n1-Jn), ñ (13.7) que es análoga a la fórmula (9.2), pero que tiene un sentido algo distinto: la expresión (9.2) es la definición del operador/, que corresponde a la magnitud física j, mientras que en el primer miembro de la ecuación (13.7) aparece la derivada respecto del tiempo del operador de la propia magnitud f § 14. La matriz densidad Consideremos un sistema que es parte de un cierto sistema aislado. Supongamos que éste, considerado como un todo, se encuentra en un cierto estado definido por la función de onda 'Y(q, x), donde x representa el conjunto de las coordenadas del sistema parcial considerado y q las restantes coordenadas del sistema aislado. Esta función, por lo general, no se descompone en producto de una función de x 46 Energía e impulso solamente y de una función de sólo q, de forma que el sistema considerado no posee su propia función de onda (1). Sea f una magnitud física relativa a nuestro sistema. Su operador se aplica, por ello, tan sólo a las coordenadas x, pero no a las q. El valor medio de esta magnitud en el estado considerado es: J= ff V•(q, x)fY(q, x) dqdx. (14.1) Introduzcamos la función e(x', x) definida por p(x', x) = J"Y*(q, x')"Y(q, x) dq, (14.2) donde la integración se refiere tan sólo a las coordenadas q; la llamaremos matriz densidad del sistema. Por la definición (14.2) es evidente que dicha función posee la propiedad de hermiticidad. p*(x, x') = p(x', x). (14.3) Los « elementos diagonales » de la matriz densidad p(x, x) = f j"Y(q, x)¡2 dq definen, evidentemente, la distribución de probabilidad de las coordenadas del sistema. Mediante la matriz densidad, ?.\ valor medio / se puede escribir en la forma: I= f [/p(x',x)Jx,=z dx. (14.4) En ella/se aplica a la función e(x', x) tan sólo en tanto depende de las variables x; después de calcular el resultado de la aplicación hay que hacer x' = x. Vemos, pues, que si se conoce la matriz densidad, es posible calcular el valor medio de cualquier magnitud característica del sistema. Se sigue de aquí que mediante e(x', x) es posible determinar también las probabilidades de los diferentes valores de las magnitudes físicas del mismo. Llegamos así a la conclusión de que un estado del sistema que no posea función propia se puede describir mediante la matriz densidad. Esta no contiene las coordenadas q, que no se refieren al sistema dado, si bien, claro está, depende esencialmente del estado del sistema aislado considerado como un todo. (1) Para que 'Y(q, x) se descomponga (en un instante dado) en un producto de este tipo, la medición, como resultado de la cual se produjo el estado en cuestión, debe describir de manera completa y por separado el sistema considerado y el resto del sistema aislado. Pero para que 'l"(q, x) siga conservando esta forma en los instantes ulteriores, es necesario también que estas partes del sistema aislado no se encuentren en interacción mutua (véase § 2). No suponemos ahora ni lo uno ni lo otro. La matriz densidad 47 La descripción mediante la función densidad resulta ser la forma más genera) de describir los sistemas en mecánica cuántica. La descripción que proporciona una función de onda es, en cambio, un caso particular, caso que corresponde a una matriz densidad de la forma e(x', x) = 'Y*(x')'Y(x). Entre este caso particular y el caso general existe la siguiente diferencia importante (1). Para un estado que posee función de onda existe siempre un sistema completo de procesos de medición que conducen con certeza a resultados determinados (esto significa matemáticamente que 'Y es función propia de un cierto operador). En cambio, para los estados que poseen solamente una matriz densidad no existe un sistema completo de mediciones que conduzcan a resultados unívocamente predecibles. Supongamos que el sistema considerado es aislado, o que se convierte en tal a partir de un cierto instante. Es posible entonces deducir una ecuación que determina la variación de la matriz densidad con el tiempo, ecuación que es análoga a la ecuación de onda para la función 'Y. Se puede simplificar el cálculo observando que la ecuación diferencial lineal buscada para e(x', x, t) debe quedar satisfecha también en el caso particular en que el sistema posee función de onda, es decir, cuando se tiene p(x', x, t) = 'l"•(x', t)'l"(x, t). Derivando respecto del tiempo y utilizando la ecuación de onda (8.1 ), tenemos: op o'l"(x t) o'Y•(x' t) ili- = ili'Y•(x', t) ' +ili'Y(x, t) ' ot ot ot = 'Y•(x', t)ll'Y(x, t)-'Y(x, t)ll'•'Y•(x', t), donde 11 es el hamiltoniano del sistema, que se aplica a funciones de x, y ff' el mismo operador aplicado a funciones de x'. Las funciones 'Y*(x', t) y 'Y(x, t) se pueden permutar, evidentemente, con los símbolos de los operadores fi y Íi', respectivamente, y obtenemos así la ecuación buscada ili op( x'' x, t) /ot Sean es decir, respecto 'Y n(x, t) = (ll-ít'•)p( x' ,x, t). (14.5) 'Y n(x, t) las funciones de onda de los estados estacionarios del sistema, las funciones propias del hamiltoniano. Desarrollemos la matriz densidad de estas funciones; el desarrollo constituye una serie doble en las funciones y 'Yn(x', t), desarrollo que escribiremos en la forma: p(x', x, t) = :E:E Omn'Yn"'(x', t)'F m(x, t) mn = :E:E Omn'Pn"'(x')i/,m(x),J.:l/1'XE,.-E,,Jt. mn (14.6) (1) Los estados descritos por una función de onda se llaman a veces estados puros y, en contraposición a ellos, los estados descritos por la matriz densidad se llaman estados mezclados. 48 Energía e impulso Este desarrollo representa para la matriz densidad un papel análogo al del desarrollo (10.3) para las funciones de onda. En vez del conjunto de coeficientes am encontramos aquí un doble sistema de coeficientes ªmn· Estas cantidades poseen, evidentemente, al igual que la propia matriz densidad, el carácter de hermiticidad (14.7) Para el valor medio de una magnitud f tenemos, substituyendo (14.6) en (14.4): f = mn :E:E ªmn f 'Yn*(x, t)/lJ! m(x, t) dx, o bien (14.8) donde /,,m son los elementos de matriz de la magnitud f. Esta expresión es análoga a la fórmula (11.l) (1). Las cantidades amn deben satisfacer determinadas desigualdades. Los « elementos diagonales» g(x, x) de la matriz densidad, que determinan la distribución de probabilidad de las coordenadas, deben ser, evidentemente, cantidades positivas. De la expresión ·(14.6) (con x' = x) se sigue, por lo tanto, que la forma cuadrática construida con los coeficientes anm (donde ;n son cantidades complejas arbitrarias) debe ser definida positiva. Esto impone a las cantidades. aum ciertas condiciones bien conocidas por la teoría de las formas cuadráticas. En particular, deben ser positivas, evidentemente, todas las cantidades « diagonales >> ª1m >O, (14.9) y cada tres cantidades ann, Omm, amn deben satisfacer la desigualdad (14.10) Al caso «puro», en el que la matriz densidad se reduce a un producto de funciones, corresponde, evidentemente, una matriz ªmn de la forma: Vet.4nos un criterio simple que permite decidir fácilmente, a partir de la matriz si se trata de un estado «puro» o «mezclado». En el caso puro tenemos: ªmm 1 ( ) BLOCH, La descripción de un sistema mediante las cantidades amn fue introducida por L. independientemente, en 1927. LANDAU y F. 49 Impulso (a2)mn =; amkakn = l:: ak*aman*ak k =aman* l::k lakl 2 o bien (14.11) es decir, el cuadrado de la matriz densidad coincide consigo misma. § 15. Impulso Consideremos un sistema de partículas que no se encuentra en un campo exterior. Dado que todas las posiciones, en el espacio, de este sistema como un todo son equivalentes, es posible afirmar, en particular, que el hamiltoniano del mismo no varía en una translación arbitraria del sistema. Basta imponer que se cumpla esta condición para un desplazamiento paralelo arbitrariamente pequeño; se cumplirá entonces también para una translación finita. Una translación infinitamente pequeña caracterizada por el vector c5r representa una transformación en la cual los vectores posición rª de todas las partículas (a es el número que indica la partícula) experimentan el incremento c5r : rª ~ rª +c5r. Una función cualquiera 1Plt1, r 2 , ••• ) de las coordenadas de las partículas se convierte, en una transformación de este tipo, en la función tf,(r1 +Sr, r 2+Sr, ... ) = if,(r1, r 2, ... )+Sr • l:: 'V a'P a = (1 +Sr • l:: Va)tf,(r1, r 2, ... ) a (V a designa el «vector» cuyas componentes son los operadores 8/oxa, 8/oya, 8/oza). La expresión entre paréntesis, es decir, l+Sr. l:: Va, a se puede considerar como el operador de una translación infinitesimal que convierte la función 1P(r1, r 2 , •.• ) en la función tf,(r1 +sr, r2+Sr, ... ). Afirmar que una cierta transformación no altera el hamiltoniano significa que si se aplica esta transformación a la función h tp, el resultado será el mismo que el de su aplicación sólo a la función 1P seguida de la aplicación del operador Íí. Podemos escribir esto matemáticamente de la siguiente manera. Sea 6 un operador que «efectúa» la transformación considerada. Tenemos entonces Ó(ílif,) = fl(Óif,), de donde ófl-Bó=O, 50 Energí.a e impulso es decir, el hamiltoniano debe conmutar con el operador 8. En el caso presente el operador O es el operador, introducido más arriba, que corresponde a una translación infinitesimal. Dado que el operador unidad (el operador de la. multiplicación por 1), conmuta, claro está, con cualquier operador, y que el factor constante ór se puede permutar con el símbolo D, la condición ófi -fló = O se reduce aquí a la condición (~ 'Va)lJ-lJ(~ 'Va)= O. a (15.1) a Conforme sabemos, 1a conmutabilidad de un operador (que no contiene el tiempo explícitamente) con B significa que la magnitud física que le corresponde se conserva. La magnitud cuyo carácter conservativo para un sistema aislado se sigue de la homogeneidad del espacio se llama impulso. Así, pues, la relación (15.1) expresa la ley de conservación del impulso en mecánica cuántica; el operador ~ v ª debe corresponder, salvo un factor constante, al impulso total del sistema, y cada uno de los términos ª de la suma, al impulso de cada una de las partículas. v El coeficiente de proporcionalidad entre el operador p del impulso de una partícula y el operador V se puede determinar mediante el paso al límite de la mecánica clásica. Escribiendo p = cV y utilizando la expresión límite (6.1) de la función de onda, tenemos p'Y = (i/li) cae<iflt)S\] S = c(i/li)'YVS, es decir, en la aproximación clásica la aplicación del operador p se reduce a la multiplicación por (i/ li)c V S. Conforme es sabido por la mecánica, el gradiente V S es el impulso p de la partícula; se debe tener, por consiguiente, (i/ li)c = 1, es decir e= -ili. El operador impulso de una partícula es, por consiguiente, p = -ili V, o bien, para las componentes: Í>a: = -ilió/ox, Í>11 = -ilio/oy, Í>z = -iliiJ/oz. (15.2) Es fácil comprobar que estos operadores son hermíticos, cual debía ser. En efecto, para funciones arbitrarias 111(x) y <f,(x) que tienden a cero en el infinito, tenemos: f </,p.,/, dx = -ili f~ dx = ili f f :: f dx = ,f,p.•.¡, dx, que es precisamente la condición de hermiticidad del operador. Dado que el resultado de derivar funciones respecto de dos variables diferentes no depende del orden de derivación, es claro que los operadores de las tres componentes del impulso conmutan entre sí: (15.3) 51 Impulso Esto significa que las tres componentes del impulso de una partícula pueden tener simultáneamente valores definidos. Determinemos las funciones propias y los valores propios de los operadores de impulso. Unas y otros se determinan mediante las ecuaciones -in oif,/ox = p~, -ili o¡/J/oy = Pvif,, -ilioif,/oz = p,if,. (15.4) La solución de la primera de ellas es iJ, = f(y, z)e<i/A)pxx, donde f no depende de x. Esta solución se conserva finita para todos los valores de x, cualquiera que sea el valor real de Px· Así, pues, los valores propios de las componentes Px del impulso forman un espectro continuo que se extiende de - oo a + oo; lo mismo vale, naturalmente, para hs componentes Py, PzLas tres ecuaciones (15.4) poseen también, en particular, soluciones comunes, que corresponden a estados con valores determinados de las tres componentes del impulso que forman el vector p. Estas soluciones son de la forma: if, = C/i/11,)p.r, (15.5) (Ces una constante). Dar a la vez las tres componentes del impulso determina por completo, conforme vemos, la función de onda de una partícula. Con otras palabras, las magnitudes Px, Py, Pz constituyen uno de los posibles sistemas completos de magnitudes físicas. Determinemos el coeficiente de normalización en (15.5). Según la regla (5.4) de normalización de las funciones propias del espectro continuo, debe ser f ¡/,p,¡/,p* dV = 8(p'-p) (15.6) donde la integración ha de extenderse a todo el espacio (dV = dx dy dz) y c5(p' - p) es la función-<5 tridimensional definida de manera análoga a la función unidimensional (función de una sola variable) (1). La integración se efectúa mediante la fórmula (2 ) 1 ( ) La función-ó tridimensional ó(r) se puede representar, en particular, como producto ó(r) = ó(x)ó(y)ó(z) de funciones-ó de las componentes cartesianas del vector r. 2 ( ) El significado convencional de esta fórmula es el de que la función que aparece en el primer miembro de la igualdad posee la propiedad característica de la función-ó expresada por la igualdad QO _[ f (x)8(x) dx = f (0). Este resultado se sigue de la fórmula integral de Fóurier f(x') = (1/27T) ff f(x)ei<x-x''Ja dxdoc, s1 se supone en ella x' = O. Separando la parte real, es también posible escribir la fórmula (15.7) en la forma: f cosrt.X dx QO (1/27T) -ao = S(oc). (15.7a) 52 Energí.a e impulso QC) (l/21r~[ eiax dx = (15.7) 8(0t). Tenemos: f 'Pp,'Pp* dV = C2 f e<i/'/1,XP'-P).r dV = C2(21rli) 38(p' -p). De aquí se sigue, evidentemente, que debe ser C2(2,,,/i)3 zada 1J)p es así igual a: 'Pp = {21r/i)-3/2e(i/'fl,)p.r. = l. La función normali(15.8) El desarrollo de una función de onda arbitraria de una partícula 1P(r) en funciones propias % del operador de impulso no es sino el desarrollo de aquélla en integral de Fourier: tf,(r) = f a(p)tf,p(r) d3p = (21rli)-3/2 f a(p)eCi/J'OP.r d3p (15.9) (d3p = dpx dpy dpz). Los coeficientes del desarrollo a(p) son iguales, de acuerdo con la fórmula (5.3), a a(p) = f tf,(r)tf,p*(r) dV = (21rli)-3/2 f tf,(r)e-Ci/'fl,)p.r dV. (15.10) La función a(p) se puede considerar (véase § 5) como función de onda de una partícula en la « representación-p »: [a(p)J 2 d3p es la probabilidad de que el impulso tome valores en el intervalo d 3p. Las fórmulas (15.9-10) determinan la relación entre las funciones de onda en ambas representaciones. De manera análoga a como el operador p corresponde al impulso, determinando sus funciones propias en la « representación-r » es posible introducir el concepto de operador r del vector posición de la partícula en la « representación-p ». El operador r se debe definir de manera que el valor medio de las coordenadas se pueda representar en la forma: r= f a*(p)i'a(p) d3p. (15.11) Por otra parte, este mismo valor medio se determina a partir de la función de onda 1J)(r) mediante la relación r= f tf,*rtf, dV. Escribiendo 1P(r) en la forma (15.9), tenemos (integrando por partes) (1): ( 1) La derivada respecto del vector p se interpreta como un vector cuyas componentes son las derivadas respecto de Px, py, p z. Impulso rtf,(r) = (2,,,./i)-3/2 53 Jra(p)eCifA)p.r dªp J = (2,,,./i)-3/2 ilie<i/A)P.r[éJa(p)/op] d3p. Mediante esta expresión y teniendo en cuenta (15.10), se encuentra: r = JtJ,•rtJ, dV = = (21rñ)-3 / 2 JJtf,*(r)iñ[oa(p)/op]eCi/A)P,r dªpdV Jilia*(p)[oa(p)/op] dªp. Comparando con (15.11 ), vemos que el operador del vector posición en la « representación-p » es r= iña¡ap. (15.12) El operador de impulso en esta representación, en cambio. se reduce simplemente a la multiplicación por p. PROBLEMAS 1. Expresar el operador operador de impulso. Solución. 1'a de la translación finita caracterizada por el vector a mediante el Por definición del operador Ta, debe ser 1'atf,(r) = tf,(r+a). Desarrollando la función 1P(r+a) en serie de Taylor, tenemos: tf,(r+a) = tf,(r)+a. otf,(r)/or+ ... ' o bien, introduciendo el operador f, = -ili\j: 1 i +-,ri .f>+z(t • f, )2+ ... Jtf,(r). tf,(r+a) = [ 1 La expresión que aparece dentro del paréntesis recto es el operador f'a = e(i/A)a ·P. Este es precisamente el operador buscado de la translación finita. 2. Hallar la ley de transformación de la función de onda en una transformación de Galileo. Apliquemos la transformación a la función de onda del movimiento libre de una partícula (onda plana). Dado que cualquier función 'Y se puede desarrollar en ondas planas, esto nos permite hallar también la ley de transformación para una función de onda arbitraria. Solución. Las funciones de onda del movimiento libre en los sistemas de referencia K y K' (K' se mueve respecto de K con velocidad V) son: 54 Energía e impulso 'Y 'Y' = constante x e(i/11,)(p.r-Et>, = constante x e!i/lt)(p'.r'-E't>, donde r = r' +Vt y los impulsos y las energías en ambos sistemas están ligados entre sí por las fórmulas (1) p = p'+mV, E= E'+V.p'+!mVt Substituyendo estas expresiones de r, p, E en 'Y, obtenemos 'Y= 'Y' exp[imV.(r'+iVt)) = 'Y' exp[~V.!(r+r') l (1) En esta forma la fórmula en cuestión no contiene ya magnitudes que caractericen el movimiento libre de una partícula y constituye la ley general de transformación buscada para la función de onda de un estado arbitrario de una partícula. Para un sistema de partículas, como exponente en (1) deberá aparecer la suma respecto de las diferentes partículas. § 16. Relaciones de indeterminación Deduzcamos ahora las reglas de conmutación entre los operadores del impulso y de las coordenadas. Dado que el resultado de la derivación sucesiva respecto de una de las variables x, y, z y la multiplicación por otra de ellas no depende del orden de estas operaciones, se tendrá P11:Y-YP11: = O, PzZ-ZPz = O, (16.1) Pv, Pz. y análogamente para Para deducir la regla de conmutación de ftx con x, escribamos: ('Pa:X-XPz),f, = -ili. o(xv,)/cx+iñx o,f,/ox = -ili,f,. El resultado de aplicar el operador p:i;X-xp x se reduce, pues, a multiplicar la función por -ili lo mismo vale, naturalmente, para los conmutadores de Pu con y y de Pz con z. Tenemos así (2): .11 A Pa:X-XP11: = •J;;. -ir,,, A A P11Y-YP11 •J:: = -in, Véase tomo I, Mecánica, § 8. Estas relaciones, descubiertas en forma matricial por partida para fundar la actual mecánica cuántica. •f: Pzz-zp, = -m. .11 A (16.2) (1) < 2 ) HEISENBERG en 1925, sirvieron de punto de 55 Relaciones de indeterminación Todas las relaciones (16.1-2) se pueden escribir en la forma: (i, k = x,y, z). (16.3) Antes de pasar al análisis del sentido físico de estas relaciones y sus consecuencias, deduzcamos dos fórmulas que serán útiles más adelante. Sea /(r) una función de las coordenadas; se tendrá entonces p/(r)-/(r)p = -iñvf. (16.4) En efecto: (pf-fp)¡/J = -iñ[v(f¡/J)-f v¡/JJ = -iñ¡/Jvf. Una relación análoga vale también para la conmutación de r con una «función» /(p) del operador impulso: /(p)r-r/(p) = -iliof/op. (16.5) Esta puede deducirse de la misma manera que (16.4) si se efectúa el cálculo en la representación-p, utilizando para los operadores de las coordenadas las expresiones (15.12). Las relaciones (16.1-2) demuestran que la coordenada de una partícula a lo largo de un eje puede tener un valor determinado a la vez que las componentes del impulso respecto de los otros dos ejes; en cambio, una coordenada y la componente del impulso a lo largo del mismo eje no existen simultáneamente. En particular, una partícula no puede encontrarse en un punto determinado del espacio y poseer al mismo tiempo un impulso determinado p. Supongamos que una partícula se encuentra en una cierta región finita del espacio cuyas dimensiones respecto de los tres ejes son del orden de magnitud ~x, dy, ~z. Además, sea p0 el valor medio del impulso de la partícula. Esto significa, desde el punto de vista matemático, que la función de onda tiene la forma 'P = u(r)eiPor/\ donde u(r) es una función que difiere apreciablemente de cero tan sólo en aquella región del espacio. Desarrollemos la función 'P en funciones propias del operador de impulso (es decir, en integral de Fourier). Los coeficientes a(p) de este desarrollo vienen determinados por las integrales (15.10) de funciones de la forma u(r)ei<p ·p)r/h. Para que una tal integral difiera de cero de manera apreciable, los períodos del factor oscilante ei(p ·p)r/\ no deben ser pequeños respecto de las dimensiones dx, ~y, ~z de la región en la que la función u(r) es diferente de cero. Esto significa que a(p) diferirá apreciablemente de cero tan sólo para valores p tales que (Pox - Px)~x/h ,:S 1, ... Dado que [a(p)l 2 determina la probabilidad de los diferentes valores del impulso, los intervalos de valores de Px, Py, Pz en los que a(p) es diferente de cero no son sino aquellos intervalos de valores en los que puedan encontrarse las componentes del impulso de la partícula 0 0 56 Energí.a e impulso en el estado considerado. Designando estos intervalos por ll.px, Ap11 , Apz, tenemos así: (16.6) Estas relaciones (las llamadas relaciones de indeterminación) fueron obtenidas por HEISENBERG. Vemos, pues, que con cuanta mayor precisión se conoce una coordenada de la partícula (es decir, cuanto menor es Ax), tanto mayor es la indeterminación Apx relativa a los valores de la componente del impulso a lo largo del mismo eje, y recíprocamente. En particular, si la partícula se encuentra en un punto rigurosamente determinado del espacio (Ax= Ay= Az = O), se tendrá Apx = Ap11 = Apz = oo, Esto significa que en este caso todos los valores del impulso son igualmente probables. Recíprocamente, si la partícula posee un impulso rigurosamente determinado p, todas las posiciones en el espacio son equiprobables (lo que también se ve inmediatamente observando que la función de onda (15.8) es tal que el cuadrado del módulo no depende en absoluto de las coordenadas). Como ejemplo consideremos una partícula en el estado definido por la función de onda tp = constante x tf..í /'/t)'pºx-a.x• /211, (16.7) (para simplificar consideramos el caso unidimensional, con la función de onda dependiente tan sólo de una coordenada). Las probabilidades de los diferentes valores de las coordenadas son iguales a li/sl 2 = constante X e-a.xª /11,, es decir, se distribuyen en torno del origen (valor medio x = O) de acuerdo con la ley de Gauss, con una fluctuación cuadrática mediay[(Ax}2] = y(li/2a.)(Ax designa la diferencia x - x) (1). El cálculo de los coeficientes a(px) del desarrollo de esta función en integral de Fourier según la fórmula 00 a(Pre) = (21rli)-ll~I tf;(x)e-<íJ'lt>Pxx dx, conduce a una expresión de la forma: a(Pre) = constante x e-<P,-Px>ªJ2'ftrx.. La distribución de probabilidades de los valores del impulso lal 2 = constante X e-(Po-'Px)ª m«, 1 ( ) Como es sabido, la distribución gaussiana para la probabilidad w(x) de los valores de una cierta magnitud x es de la forma: 57 Relaciones de indeterminación tiene, por consiguiente, la misma forma gaussiana, con una fluctuación cuadrática media (donde D..px = Px - p 0 ). El producto de las fluctuaciones cuadráticas medias de la coordenada y del impulso son iguales, por consiguiente, a (16.8) de acuerdo con (16.6) (1). Finalmente, deduzcamos aun otra relación útil. Sean f y g dos magnitudes físicas cuyos operadores satisfacen la relación de conmutación J.A f!} •l:, A (16.9) ¡g-¡;,¡ = -iric, (1) Se puede demostrar que este valor del producto de las fluctuaciones es el menor posible. Para ello consideremos la siguiente deducción formal (H. WEYL). Supongamos que el estado de una partícula viene descrito por la función tp(x) y que los valores medios de las coordenadas y del impulso en este estado son, para simplificar la demostración, iguales a cero. Consideremos la desigualdad evidente f"' 1 dij; -"' c,.xif;+ dx 12 dx > O, donde et: es una constante real arbitraria (el signo de igualdad vale para una función tp de la forma (16.7)). Para calcular esta integral observemos que f f( x21if;l2 dx = (~x)2, dip* dtp) dx x~+xip*dx dx = f dlt/Jl 2 x - dx = dx f l,J,1 2 dx = -1, con lo que se obtiene Para que este trinomio cuadrático (respecto de a) sea positivo cualesquiera que sean los valores de debe quedar satisfecha la condición !X, o bien (16.8a) 58 Energía e impulso donde ees el operador de una magnitud física c. En el segundo miembro de la igualdad hemos introducido el factor h para tener en cuenta que en el límite clásico (es decir, pa~ h--+ O) todos los operadores de las magnitudes físicas se reducen a la multiplicación por estas mismas magnitudes y conmutan entre sí. En el caso « cuasiclásico » es posible, por consiguiente, considerar en primera aproximación igual a cero el segundo miembro de la igualdad (16.9). En la siguiente aproximación, en cambio, cabe substituir el operador t por un operador que consiste simplemente en multiplicar por la magnitud c. Se obtiene entonces: Jg-g/ = -iñc. Esta igualdad es exactamente análoga a la relación PzX-XPx = -ili, con la única diferencia de que en vez de la constante h aparece en ella fa magnitud he (1). De esto podemos concluir, por analogía con la relación AxApx ~ li , que en el caso cuasiclásico vale para las magnitudes f, g la relación de indeterminación !::,.f6.g - ñc (16.10) En particular, si una de las magnitudes es la energía (f == H) y el otro operador (g) no depende explícitamente del tiempo, según (9.2) será e= g y la relación de indeterminación en el caso cuasiclásico es: !::,.E!::,.g - lig. (16.11) ( 1) La magnitud clásica e es el paréntesis de Poisson correspondiente a las magnitudes f y g, véase la nota en la pág. 32). CAPÍTULO III LA ECUACIÓN DE SCHRODINGER § 17. La ecuación de Schrodinger Pasemos ahora a determinar la forma del hamiltoniano-cuestión esta de la mayor importancia, porque es este operador el que determina la forma de la ecuación de onda. Empecemos por considerar una partícula libre, es decir, una partícula que no se encuentra en ningún campo exterior. Dada la completa homogeneidad del espacio para una tal partícula, su hamiltoniano no puede contener en forma explícita las coordenadas y debe expresarse tan sólo en función del operador impulso. Además, para una partícula libre se conservan tanto la energía como el impulso, por lo cual ambas magnitudes pueden existir simultáneamente. Dado que el valor del vector impulso determina por completo el estado de la partícula, los valores propios de la energía E deben ser función del valor del impulso en el mismo estado. Además, E debe ser función solamente del módulo del impulso, no de su dirección; esto último se sigue de la completa isotropía del espacio con relación a una partícula libre, es decir, de la equivalencia en él de todas las direcciones. La propia forma de la función E(p) queda completamente determinada por las condiciones que impone ·el llamado principio de relatividad de Galileo, principio que debe quedar satisfecho en la mecánica cuántica no relativista al igual que en la mecánica clásica (no relativista). Como se demuestra en mecánica (1), esta condición conduce a una dependencia cuadrática de la energía con relación al impulso E = p 2/2m, donde la cons.. tante m se llama masa de la partícula. Para que la relación E= p2/2m se cumpla para todos los valores propios de la energía y del impulso, esta misma relació.n debe ser también válida para sus operadores: tJ = c112m)<Pl+P112+¡.2). (17.1) Substituyendo aquí (15.2), obtenemos el hamiltoniano de una partícula que se mueve libremente en la forma: 1 ( ) Véase tomo l, Mecánica, § 4. 60 La ecuación de Schrodinger 11 = donde L = -(li,2/2m)L, (17.2) o2/ox 2+éJ2/éJy2+o2/oz 2 es ei operador de Laplace. Si tenemos un sistema de partículas que no interactúan entre sí, su hamiltoniano es igual a la suma de los hamiltonianos de cada una de ellas: 11 = -!li2 ~ (1/ma)La (17.3) a (el índice a numera las partículas; La es el operador de Laplace en el que la derivación se efectúa respecto de las coordenadas de la a-ésima partícula). La forma del hamiltoniano para un sistema de partículas en interacción mútua no se puede deducir partiendo únicamente de los principios generales de la mecánica cuántica. Su forma es análoga a la función de HAMILTON de la mecánica clásica, y se obtiene sumando al hamiltoniano de las partículas sin interacción una cierta función U(r1 , r 2 , ••• ) de sus coordenadas: 11 = -lli2 ~ La/ma+U(r1 ,r2 , ... ). a (17.4) El primer término se puede considerar como el operador de la energía cinética y el segundo como el operador de la energía potencial. Este último se reduce a la simple multiplicación por la función U, y del paso al límite de la mecánica clásica se sigue que esta función debe coincidir con la que determina la energía potencial en dicha mecánica. En particular, el hamiltoniano de una sola partícula que se encuentra en un campo exterior es fJ =p2/2m+ U(x,y, z) = -(li2/2m)6. + U(x,y, z), (17.5) donde U(x, y, z) es la energía potencial de la partícula en dicho campo. Observemos que los valores propios del operador de la energía cinética son positivos, lo que se sigue desde luego del hecho que este operador es igual a la suma de los cuadrados de los operadores que corresponden a las componentes del impulso con coeficientes positivos. En consecuencia, también el valor medio de la energía cinética en un estado arbitrario será siempre positivo. La substitución de las expresiones (17.2)-(17.5) en la ecuación general (8.1) nos da la ecuación de onda de los correspondientes sistemas. Escribamos, en particular, la ecuación de onda de una partícula en un campo exterior ili o'Y/ot = -(li2/2m)L'Y+ U(x,y, z)'Y. (17.6) La ecuación (10.2) que determina los estados estacionarios toma, en cambio, la forma: (li 2/2m)Lip +[E-U(x,y,z)]ip = O. (17.7) La ecuación de Schrodinger 61 Las ecuaciones (17.6), (17.7), fueron obtenidas por E. ScHRODINGER en 1926 y se llaman ecuaciones de Schrodinger - temporal y no temporal, respectivamente. Para una partícula libre la ecuación de Schrodinger (17.7) tiene la forma: (li 2/2m)L,f;+E,f; = O. (17.8) Esta ecuación posee soluciones finitas en todo el espacio para cualquier valor positivo de la energía E (incluido el valor O). Como a tales soluciones se pueden tomar las funciones propias (15.5) comunes a los operadores de las tres componentes del impulso. Las funciones de ónda completas de los estados estacionarios tendrán entonces la forma: 'Y= constante xe-<if1i)Et+(i/11,)p.r (E= p2/2m). (17.9) Cada una de estas funciones describe un estado en el que la partícula posee una energía determinada E y un impulso determinado p. Es una onda plana que se propaga en la dirección p y que posee una frecuencia E/ li y una longitud de onda 21rli/p (esta última se llama longitud de onda de De Broglie de la partícula) ü). El espectro energético de una partícula que se mueve libremente resulta así ser continuo, extendiéndose de cero a + =. Cada uno de estos valores propios (con la única excepción del valor E= O) es degenerado y la degeneración es de multiplicidad infinita. En efecto, a cada valor E diferente de cero corresponde una multiplicidad infinita de funciones propias (17.9) que difieren entre sí en la dirección del vector p para un mismo valor absoluto del mismo. Veamos de qué manera tiene lugar en la ecuación de Schrodinger el paso al límite de la mecánica clásica, considerando, para simplificar, una sola partícula en un campo exterior. Substituyendo en la ecuación de Schrodinger ( 17.6) la expresión límite (6.1) de la función de onda \f = aei5 lh, obtenemos, efectuando la derivación, ªª as a ili ili li2 a--ili-+-(vS)2--aLS--vS. va--La+Ua = O. at at 2m 2m m 2m En esta ecuación aparecen términos puramente reales y términos puramente imaginarios (recordemos que S y a son reales); igualando unos y otros a cero por separado, obtenemos dos ecuaciones: as 1 ~ 2 -+-(vS) +U--La = O, at 2m aa at 2ma a 1 2m m -+-Ls+-vs. va= O. El concepto de onda asociada a una partícula fue introducido por vez primera por L. DE BRoen 1924. (1) GLIE 62 La ecuación de Schrodinger Prescindiendo en la primera de estas ecuaciones del término que contiene /t,2, obtenemos: as 1 (17.10) -+-(V S) 2 + U= O, 2m es decir, cual debe ser, la conocida ·ecuación clásica de Hamilton-.lacobi para la acción S de la partícula. Obsérvese, a propósito, que cuando ñ -+ O, la mecánica clásica es válida con una precisión que es del primer orden de magnitud (y no de orden cero) respecto de li. ot La segunda de las ecuaciones precedentes se puede escribir, después de multiplicarla por 2a, en la forma: S) = O. aa2 +div(a2 V ot m (17.11) Esta ecuación posee un significado físico intuitivo: a2 es la densidad de probabilidad de encontrar la partícula en un lugar del espacio (['Yi 2 = a 2); S/m = p/m es la velocidad clásica v de la partícula. La ecuación ( 17 .11) no es, por lo tanto, sino la ecuación de continuidad que nos dice que la densidad de probabilidad « se desplaza » según las leyes de la mecánica clásica con la velocidad clásica v en cada punto. v § 18. Propiedades fundamentales de la ecuación de Schrodinger Las condiciones a que deben satisfacer las soluciones de la ecuación de Schrodinger son de un carácter muy general. Ante todo la función de onda debe ser uniforme y continua en todo el espacio. La condición de continuidad se mantiene también en aquellos casos en que el propio campo U(x, y, z) presenta superficies de discontinuidad. En tales superficies deben conservarse continuas tanto la función de onda como sus derivadas. Acerca de la continuidad de las derivadas hay que hacer, sin embargo, la reserva de que éstas dejan de ser continuas si más allá de una cierta superficie la energía potencial U se hace infinita. Una partícula no puede en absoluto penetrar. evidentemente, en una región del espacio donde U = =, es decir, en dicha región debe ser en todas partes 1JJ =-' O. La continuidad de tp, exige que en la frontera de este dominio 1JJ se anule; en cambio, las derivadas de lJJ experimentan en este caso, por lo general, una discontinuidad finita. Si el campo U(x, y, z) no se hace infinito en ningún punto, también la función de onda debe ser finita en todo el espacio. Esta misma condición debe quedar satisfecha en los casos en que U se hace infinito en algún punto, pero no más rápidamente que 1/r,; con s < 2 (véase también § 35). Sea Umín el valor mínimo de la función U(x, y, z). Dado que el hamiltoniano de una partícula es suma de dos términos - el operador energía cinética t y el Propiedades fundamentales de la ecuación de Schrodinger 63 operador energía potencial-, el valor medio de la energía en un estado arbitrario es igual a la. suma E_= T +O.Pero todos los valores propios del operador t (que coincide con el hamiltoniano de una partícula libre) son positivos; por e11o también el valor medio T ~ O. Teniendo también en cuenta la desigualdad evidente O> Umin' encontramos que E > Umin . Dado que esta desigualdad se cumple para cualquier estado, es evidente que vale también para todos los valores propios de la energía: (18.1) Consideremos una partícula que se mueve ep un campo de fuerzas que se anula en el infinito; la función U(x, y, z), como de costumbre, la definiremos de manera que en el infinito tienda a cero. Es fácil ver que el espectro de valores propios negativos de la energía será entonces discreto, es decir, en un campo que se anula en el infinito todos los estados con E < O son estados ligados. En efecto, en los estados estacionarios del espectro continuo, estados que corresponden a un movimiento infinito, la partícula se encuentra en el infinito (véase § IO). Pero a distancias suficientemente grandes se puede prescindir de la existencia del campo, con lo que es posible considerar el movimiento de la partícula como un movimiento libre; ahora bien, en un movimiento libre la energía sólo puede ser positiva., Por el contrario, los valores propios positivos forman un espectro continuo y corresponden a un movimiento infinito; para E> O la ecuación de ScHRODINGER no tiene, por lo general (en el campo considerado), soluciones para las que la integral Jlv,\ 2 d V converja (1 ). Debemos hacer notar que en la mecánica cuántica y para un movimiento finito la partícula puede encontrarse también en regiones del espacio en las que E < U; aunque la probabilidad lv,\ 2 de encontrar la partícula en ellas tiende rápidamente a cero al penetrar en una región de este tipo, con todo dicha probabilidad es distinta de cero a cualquier distancia finita. Se presenta aquí una diferencia fundamental con la mecánica clásica, en la que una partícula no puede en modo alguno penetrar en una región donde U> E. En la mecánica clásica, la imposibilidad de penetrar en esta región está ligada con el hecho de que para E < U la energía cinética sería negativa, es decir, la velocidad sería imaginaria, lo que es absurdo. En mecánica cuántica los valores propios de la energía cinética son también positivos; sin embargo, no llegamos aquí a una contradicción dado que si en el proceso de medición la partícula se localiza en un determinado punto del espacio, como resultado de este mismo proceso el estado de la partícula se perturba de tal manera que ésta deja de poseer una energía cinética determinada, cualquiera que sea. Si en todo el espacio es U(x, y, z) > O (con U-+ O en el infinito), en virtud de la (1) Desde un punto de vista puramente matemático es necesario advertir, sin embargo, que para ciertas formas determinadas de la función U(x, y, z) (que carecen de significación física) pueden dejar de pertenecer al espectro continuo los puntos de un conjunto discreto de valores. 64 La ecuación de Schrodinger desigualdad (18.1) tenemos En> O. Dado que, por otra parte, cuando E> O el espectro debe ser continuo, llegamos a la conclusión de que en el caso considerado el espectro discreto no existe, es decir, es sólo posible un movimiento infinito de la partícula. Supongamos que U tiende a - oo en un cierto punto (que elegimos como origen de coordenadas) de acuerdo con la ley (ex > O). (18.2) Consideremos una función de onda que es finita en una pequeña región (de radio r0 ) en torno del origen de coordenadas e igual a cero fuera de ella. La indeterminación de los valores de las coordenadas de la partícula en un tal paquete de ondas es del orden de r 0 ; por consiguiente, la indeterminación en el valor del impulso es~ ñ/r 0 • El valor medio de la energía cinética en este estado es del orden de magnitud de ñ2 /mrl,Y el valor medio de la energía potencial es del orden de ,_, - :xjr0s. Supongamos primero que s > 2. Entonces la suma n/mrl-a/ro 2 8 para valores de rO suficientemente pequeños toma valores negativos tan grandes cuanto se quiera en valor absoluto. Pero si la energía media puede tomar tales valores, ello significa en cualquier caso que existen valores propios negativos de la energía que, en valor absoluto, son tan grandes cuanto se quiera. A los niveles de energía con [El grande corresponde un movimiento de la partícula en una región muy pequeña del espacio en torno del origen de coordenadas. El estado « normal » corresponderá a una partícula que se encuentra en el propio origen de coordenadas, es decir, tiene lugar una « caída » de la partícula al punto r = O. Si, en cambio, s < 2, la energía no puede tomar valores negativos tan grandes cuanto se quiera en valor absoluto. El espectro discreto comienza con un cierto valor finito negativo. No tiene lugar en este caso la «caída» de la partícula al centro. Obsérvese que en la mecánica clásica una tal «caída» de la partícula es en principio posible en cualquier campo atractivo (es decir, para cualquier valor positivo des). El casos= 2 se considerará aparte en el§ 35. Examinemos ahora el carácter del espectro energético en su dependencia del comportamiento del campo a grandes distancias. Supongamos que para r -+ oo la energía potencial, que es negativa; tiende a cero de acuerdo con la ley (18.2) (en esta fórmula se supone ahora que res grande). Consideremos un paquete de ondas que «llena» un estrato esférico de gran radio r 0 y de espesor ~r. ~ r 0 • En estas condiciones, el orden de magnitud de la energía cinética será de nuevo ñ2/m(~r) 2, y la energía potencial será del orden de - 1Y..jr 0s. Aumentemos r 0 y a la vez también el valor de ~r (de forma que ~r crezca proporcionalmente a r0 ). Si s < 2, para valores r0 suficientemente grandes la suma ñ2/m(~r)2- cx/r 0 ' pasa a ser negativa. Propie,la,le.,; fundamentale.,; de la ecuación de Schriidinger 65 Se sigue de aquí que existen estados estacionarios con energías negativas en los que la partícula puede encontrarse, con probabilidad apreciable, a grandes distancias del origen de coordenadas. Pero esto significa que existen niveles energéticos negadvos de valor absoluto arbitrariamente pequeño (es necesario recordar que en un dominio del espacio donde U> E las funciones de onda se amortiguan rápidamente). Así, pues, en el caso considerado el espectro discreto contiene una infinidad de niveles que se acumulan hacia el nivel E= O. Si, en cambio, el campo tiende a cero en el infinito como -- 1/r8 con s > 2, no existen niveles negativos con valores absolutos arbitrariamente pequeños. El espectro discreto termina a un nivel con valor absoluto diferente de cero, de forma que el número total de niveles es finito. La ecuación de ScHRODINGER (no temporal), al igual que las condiciones impuestas a sus soluciones, es real. Por lo tanto, sus soluciones 1P se pueden siempre elegir reales (1 ). En lo que concierne a las funciones propias de los valores no degenerados de la energía, éstas resultan automáticamente reales, salvo un factor de fase que carece de importancia. En efecto, "P* satisface la misma ecuación que 1P y, por consiguiente, es también función propia para aquel mismo valor de la energía; por lo tanto, si este valor no es degenerado, 1P y "P* deben ser en esencia idénticas, es decir, tan sólo pueden diferir en un factor constante (de módulo igual a la unidad). En cambio, las funciones de onda que corresponden a un mismo nivel degenerado de la energía, no son necesariamente reales, pero mediante una elección adecuada de combinaciones lineales de las mismas es siempre posible obtener un sistema de funciones reales. Las funciones de onda completas 'F, en cambio~ se determinan por Ul'(l ecuación entre cuyos coeficientes aparece i. Esta ecuación, sin embargo, conserva su forma si en ella se cambia ten - t y a la vez se pasa a la conjugada compleja (2). Por esto es siempre posible elegir las funciones 'F tales que 'F y 'F* difieren tan sólo en el signo del tiempo - resultado éste que ya conocemos en virtud de las fórmulas (10.1), (10.3). Como es sabido, las ecuaciones de la mecánica clásica no cambian en la inversión del tiempo, es decir, al cambiar el signo de éste. En mecánica cuántica la simetría con relación a los dos sentidos del tiempo se expresa, conforme vemos, en la invariancia de la ecuación de onda respecto del cambio de signo de t acompañado simultáneamente de la substitución de 'Y por 'F*. Sin embargo, hay que recordar que esta simetría se refiere aquí tan sólo a las ecuaciones, no al propio concepto <1) Estas proposiciones no son válidas para los sistemas que se encuentran en un campo magnético (véase cap. XV). (:!) Se supone que la energía po·encial U no depende explícitamente del tiempo: o d sistema es aislado. o se encuentra en un campo constante (no magnético). 66 La ecuación de Schrodinger de medición, que representa un papel fundamental en mecánica cuántica (conforme se discutió ya detenidamente en el § 7). § 19. Densidad de corriente En mecánica clásica la velocidad de una partícula es igual al impulso dividido por la masa. Veamos cómo esta misma relación se cumple, como era de esperar, también en la mecánica cuántica. Según la fórmula general (9.2) de derivación de los operadores respecto del tiempo, para el operador velocidad se tiene v t = v= Valiéndonos de la expresión (17 .5) de (i/ñ)(Hr-rH). Hy de la fórmula (16.5), obtenemos: v =p/m. (19.1) Las mismas relaciones existirán también, evidentemente, entre los valores propios de la velocidad y del impulso y entre sus valores medios en un estado cualquiera. La velocidad, como el impulso de una partícula, no puede tener un valor determinado a la vez que sus coordenadas. Pero la velocidad multiplicada por un elemento de tiempo infinitesimal dt, determina el desplazamiento de la partícula en el tienpo dt. Por consiguiente, el hecho de que no exista la velocidad a la vez que las coordenadas significa que si la partícula se encuentra en un determinado punto del espacio en un cierto instante, no podrá tener una posición definida en un instante infinitamente próximo. J He aquí una fórmula útil relativa al operador correspondiente a la derivada respecto del tiempo de una magnitud f(r) que es función del vector posición. Teniendo en cuenta que f conmuta con V(r), encontramos: Í = (i/ñ)(Hf-JH) = (i/2mñ)(f, 2f-f f, 2 ). Mediante (16.4) podemos escribir f,2.f = P . Uf,-iñvf) = f,f. f,-iñf, • vJ, Jp?. = (pf+itzvf).p = pf .p+ilivf .p. Substituyendo en la fórmula para_/, obtenemos ]a expresión buscada Í = (1/2m)(p. vi+ v/. f,). Determinemos ahora el operador aceleración. Tenemos: .¿, = (i/h)(Hv - vil) = (i/mli)(Hp-pH) = (i¡'mn)(Uf,- pU) (19.2) 67 Densidad de corriente (con p conmutan todos los términos de mula (16.4), se encueritra: fI salvo U(r)). Teniendo en cuenta la fór- mv= -vU. (19.3) Esta ecuación entre operadores coincide exactamente en su forma con la ecuación del movimiento de la mecánica clásica (ecuación de NEWTON). La integral f l'Yl 2 dV> extendida a un cierto volumen finito V, representa la probabilidad de encontrar la partícula en dicho volumen. Calculemos la derivada de esta magnitud respecto del tiempo. Tenemos: r -d l'Yj 2 dV= dt • V f ( at * V a'Y o'Y) dV=-i 'Y-+'Y*at ñ f ('Y.H*'Y*-'Y*.H'P')dV. V Substituyendo aquí fl H* = = -(h2/2m)L, + U(x,y,z) y utilizando la identidad 'Y D 'Y*-'Y* t::.'Y= div ('Yv'Y*-'Y*v'Y), obtenemos: d~ f f i'YJ'dV= - V dividV, V donde i designa el vector: i = (in/2m)('fv'f*-'l"*v'f). (19.4) La integral de div i se puede transformar mediante el teorema de GAuss en una integral extendida a la superficie cerrada S que rodea el volumen V (1): :J l'YI' dV = - V f i. df. (19.5) S Vemos así que se puede llamar a i vector densidad de corriente de probabilidad. La integral de este vector extendida a una superficie es la probabilidad de que en la unidad de tiempo la partícula atraviese esta superficie. El vector i y la densidad de probabilidad l'Y) 2 satisfacen la ecuación oj'YJ 2/at+div i = O, (19.6) análoga a la ecuación clásica de continuidad. (') El elemento de superficie df se define como un vector cuyo valor absoluto es igual al área d/ del 1elemento y cuyo versor coincide con el de la normal exterior al dominio. 68 /,a Pcuación dt> Schrodinger Introduciendo el operador de impulso, es posible escribir el vector i en la forma: i (19.7) (1/Zm)('Yp*'Y*+'Y*p'Y). = Es útil demostrar cómo de la ecuación de Schródinger se sigue inmediatamente la ortogonalidad de las funciones de onda de dos estados con valores diferentes de la energía. Sean ~·,,, y ~',, dos de tales funciones; una y otra satisfacen las ecuaciones -(n 2/2m)6if;m+ U¡/;m = Emfm, -(h2 /2m)D.¡/;n*+ Ufn* = Multipliquemos la primera de ellas por a miembro una de otra; esto da: (Em-En)!fm¡pn * = ~J 11 Eni/i,/" *, la segunda por ~111 y restemos miembro (li 2/2m)(¡/;mD.¡/;n*-¡/;n* D-fm) = (li 2 /2m) div (fm V'Pn*-i/¡nfFV'Pm)• Si ahora integramos ambos miembros de la ecuación en todo el espacio, el segundo miembro, transformándolo mediante el teorema de GAuss, se reduce a cero y obtenemos: de donde, en virtud de la hipótesis Em buscada § 20. =/= E 11 , se sigue la relación de ortogonalidad El principio variacional La ecuación de ScHRODINGER en su forma general flif, a partir del principio de variación J o i/¡*(fl-E),fi dq = O. = Eif,, se puede obtener (20.1) Dado el carácter complejo de 1P, la variación de 1P y de "P* se puede efectuar independientemente. Variando "P*, tenemos: f oi/¡*(fl-E)i/¡ dq = O, de donde se sigue, dada la arbitrariedad de blp*, la ecuación buscada flif, = Eif,. La variación de '1/J no da nada nuevo. En efecto, variando 1P y teniendo en cuenta 69 El principio variacional el carácter hermítico del operador H tenemos: Jif;*(Él-E)oif; dq = Joif;(H*-E)if;* dq = o, lo que conduce a la ecuación conjugada compleja H*if,* = Eif,*. El principio variacional (20. J) impone a la integral la condición de extremo incondicionado. Es posible presentarlo en otra forma considerando a E como un multiplicador de Lagrange en el problema de extremo condicionado s Jif;*Élif; dq = o, (20.2) Jif;ifi* dq = l. (20.3) con la condición suplementaria El valor m1mmo de la integral (20.2) (con la condición suplementaria (20.3)) es el primer valor propio de la energía, es decir, la energía E 0 del estado normal. La función V', que conduce a este mínimo es, por consiguiente, la función de onda 1Po del estado normal (1). En cambio, las funciones de onda 'fJ'n(n > O) de los siguientes estados estacionarios corresponden simplemente a extremos, no a un mínimo de la integral en sentido estricto. Para obtener a partir de la condición de mínimo de la integral (20.2) la función de onda 'Pi y la energía E 1 del estado que sigue al normal. hay que admitir como funciones lJJ únicamente aquéllas que no sólo satisfacen la condición de normalización (20.3), sino también la condición de ser ortogonales a la función de onda fo del estado normal J lJJlJJo dq = O. De manera general. si se conocen las funciones de onda 1/'f¡, 'Pi, ... , 1p 11 _ 1 de los n primeros estados (ordenados de acuerdo con los valores crecientes de la energía), la función de onda del estado siguiente hace mínima la integral (20.2) en el supuesto de que se cumplan las condiciones suplementaria-.: (m = O, 1,2, ... ,n-1). (20.4) Presentemos aquí algunos teoremas generales que se pueden demostrar a partir del principio variacional (2). La función de onda lJJo del estado fundamental no se anula (o. como se suele (1) En lo que resta de este párrafo supondremos que las funciones de onda 1/' son reales. lo cual siempre se puede conseguir (si no existe un campo magnético). 2 ( ) La demostración de los teoremas relativos a los ceros de las funciones propias (véase también el párrafo siguiente) se puede encontrar en los libros: M. A. LAVRENT'Ev y L. A. L1usTERNIK, Curso de cálculo de variaciones, 2.ª edición, Cap. IX, GosTEJIZDAT, 1950: R. CouRANT y D. H1LBERT, Methods of Mathematical Physics, Vol. I, Chapter VI, lnterscience Publishers, 1953. 70 La ecuación de Schrodinger decir, no presenta nodos) para ningún valor finito de las coordenadas (1 ). Con otras palabras, posee un signo constante en todo el espacio. De aquí se sigue que las funciones de onda ¡¡, 11 (n > O) de ]os demás estados estacionarios, que son ortogonales a 1/'o, deben presentar necesariamente nodos (si 1p 11 fuera también de signo constante, la integral J 11'o1Pndq no podría reducirse a cero). Además, del hecho de que V'o carezca de nodos se sigue que el nivel energético fundamental no puede ser degenerado. En efecto, supongamos que sí lo fuera y sean %, 1Po dos funciones propias distintas correspondientes al nivel E 0 • Toda combinación lineal C1Po--t-c'v,0' sería también función propia; pero eligiendo de manera conveniente las constantes e, e', es siempre posible conseguir que esta función se anule en un punto dado cualquiera del espacio, es decir, obtendríamos una función propia con nodos. Si el movimiento tiene lugar en un dominio finito del espacio, en su frontera debe ser 'P = O (véase 18). Para determinar los niveles de energía hay que encontrar, mediante el principio variacional, el mínimo de la integral (20.2) para esta condición de contorno. El teorema según el cual Ja función de onda del estado fundamental carece de nodos significa aquí que V'o no se anula en punto ninguno interior el dominio considerado. * Observemos que al aumentar las dimensiones de la reg1on en que tiene lugar el movimiento todos los niveles de energía E11 disminuyen: esto se sigue desde Juego de que el crecimiento del dominio aumenta el sistema de funciones admisibles que pueden conducir al mínimo de la integral y como resultado de ello el valor mínimo de la integral sólo puede disminuir. La expresión f if;Hif; dq = J[- ~ (ñ /2ma)if;~aif;+ Uif;2] dq 2 para los estados del espectro discreto de un sistema de partículas se puede transformar en otra, más cómoda para efectuar de hecho la variación. En el primer término del integrando haremos: La integral de div, 1( V'7 11 1J)) respecto de qª se transforma en una integral extendida a una ~uperticie cerrada "ituada en el infl nito. y dado que en éste las funciones de \)nda de los estados del espectro discreto tienden a cero de manera suficientemente rápida. esta integral se anula. A sí. pues, (1) Este teorema (al igual que sus consecuencias) deja de valer, en general, para las funciones de onda de los sistemas constituidos por partículas idénticas (véase la nota al final del§ 63) . Propiedades generales del movimiento en umi dimensión 71 (20.5) § 21. Propiedades generales del movimiento en una dimensión Si la energía potencial de la partícula depende de una sola coordenada (XL la función de onda se puede buscar en la forma de producto de una función de y. z por una función de x solamente. De ellas, la primera se determina mediante la ecuación de Schrodinger del movimiento libre y la segunda mediante la ecuación unidimensional de Schrodinger d 2if; Zm -+-[E- U(x)]ip dx2 Ji2 = O. (21.1) A la misma ecuac1on unidimensional conduce, evidentemente, el problema que plantea el movimiento en un campo con energía potencial U(x, _r, z) -== l/ 1(x)+ + Uiy) + Uiz), que se descompone en suma de funciones cada una de las cuales depende de una sola coordenada. En los 22-24 se estudiarán toda una serie de ejemplos concretos de este tipo de movimiento « unidimensional ». Pero aquí nos limitaremos a ciertas consideraciones previas relativas a algunas de sus propiedades generales. ** Demostremos ante todo que en el problema unidimensional ningún nivel energético del espectro discreto es degenerado. Para ello supongamos que así no fuera y sean 1Pi y lp2 dos funciones propias distintas correspondientes a un mismo valor de la energía. Dado que ambas satisfacen la misma ecuación (21.1) .tenemos: o bien 1Pi" "h - lp2 " V'i = O (se representa con un apóstrofo la derivación respecto de x). Jntegrando esta relación, éncontramos: (21.2) Dado que en el infinito ip1 = 1.J.'2 = O, la const. debe ser igual a cero, de forma que o bien l.J.'r'.11f'i = v,2 ' /v,2 • Integrando de nuevo, obtenemos en esencia ambas funciones coinciden. 1.j.J 1 =0 const. vi 2 , es decir, Para las funciones de onda 1.J.' 11 (x) del espectro discreto se puede enunciar el siguiente teorema (llamado teorema de oscilación): la función 1.J.' 11 (X) que corresponde al n + 1-ésimo valor propio, ordenados éstos en orden creciente, E11 , se anula 72 La ecuación de Schrodinger (para valores finitos de x) n veces(1). Supondremos que la función U(x) tiende a límites finitos para x -+ ± = (pero no que deba ser función monótona). El límite U(-+-=) lo tomaremos como origen de energí;-is (es decir, suponemos que U(+=) = O). y el límite U(- oo) Jo designaremos por U0 , suponiendo, además, que U0 '> O. El espectro discreto pertenece al intervalo de valores de la energía para los que la partícula no puede escapar al infinito; para ello la energía debe ser menor que ambos límites U( -:t =), es decir, debe ser negativa: (21.3) E<O, donde, claro está, en cualquier caso debe tenerse E> U111 ; 11 • es decir, la función U(x) debe presentar por lo menos un mínimo con U111 í,, < O. Consideremos ahora el intervalo de valores positivos de la energía menores que U0 : O< E< U0 . (21.4) En este intervalo el espectro será continuo y el movimiento de la partícula en los correspondientes estados estacionarios será infinito, escapando la partícula hacia x = + =. Es fácil ver que todos los valores propios de la energía en esta parte del espectro son también no degenerados. Para ello basta observar que en la demostración anterior (correspondiente al espectro discreto) es suficiente que las funciones "Pi, 1J)2 tiendan a cero aunque sólo sea en uno de los dos valores infinitos (en el presente caso tienden a cero para x ~ - oo). Para valores de x positivos suficientemente grandes, se puede prescindir de U(x) en la ecuación de SCHRODINGER (2 l. l): ¡//' +(2m/h2 )Eip = O. Esta ecuación posee soluciones reales cuya forma es la de « ondas planas estaci onarias »: ip = a cos(kx+8), (21.5) donde a, ó son constantes y el « vector de onda» k = p/ñ = v(2mE)/li. Mediante esta fórmula se determina la forma asintótica (para x -++ oo) de las funciones de onda de los niveles energéticos no degenerados en el intervalo (21.4) del espectro continuo. Para grandes valores negativos, la ecuación de -ScHRODlNGER es if/' -(2m/n2 )( U0 -E)¡/J = O. (1) Si la partícula se puede encontrar sólo en un segmento finito del eje x, hay que hablar de ceros de la función '1/'n(x) interiores a este segmento. Propiedades generales del movimiento en una dimensión La solución que no tiende a infinito para x ifi = beKX, donde K = ~ - oo 73 es v[2m(Uo-E)]/li. (21.6) Esta es la forma asintótica de la función de onda para x ~ - oo. Así, pues, la función de onda se amortigua exponencialmente cuando penetramos en la región en la que E < U. Finalmente, para (21.7) el espectro será continuo, y el movimiento infinito en ambos sentidos. En esta parte del espectro todos los niveles son doblemente degenerados. Esto se sigue de que las correspondientes funciones de onda se determinan por la ecuación de segundo orden (21.1) y de que las dos soluciones de esta ecuación independientes satisfacen las condiciones en el infinito (mientras que, por ejemplo, en el caso anterior una de las soluciones tiende a infinito para x ~ - oo y es necesario, por consiguiente, prescindir de ella). La forma asintótica de la función de onda para x ~+ = es (21.8) y análogamente para x ~ - ºº· El término con eikx corresponde a una partícula que se mueve hacia la derecha y el término con e-ikx a una partícula que se mueve hacia la izquierda. Supongamos que la función U(x) es par (U(- x) = U(x)). En tal caso, al cambiar el signo de la coordenada la ecuación de SCHRODINGER (21.1) no varía. Se sigue de aquí que si 1p(x) es una solución de esta ecuación, también lo es ip(- x) y coincide con 1p(x) salvo un factor constante: lp(- x) = cip(x). Cambiando otra vez el signo de x, obtenemos '!{'(x) = c 2 ip(x), de donde e= -- 1. Así, pues, cuando la energía potencial es simétrica (respecto del punto x = 0) las funcione~ de onda de los estados estacionarios pueden ser o pares ( lp(- x) = 1p(x)) o impares ( '!{'(- x) = = - '!{'(X)) (1). En particular, la función de onda de] estado fundamental es par: en efecto, dicha función no puede presentar nodos, y una función impar siempre se anula para x = O( lp(Ü) = - lp(O) = O). Para normalizar las funciones de onda del movimiento unidimensional (en el espectro continuo) existe un método simple que permite determinar el coeficiente de normalización directamente a partir de la expresión asintótica de la función de onda para grandes valores de [x\. (1) En estas consideraciones se supone que el estado estacionario no es degenerado, es decir, que el movimiento no es infinito en ambos sentidos. En caso contrario, al cambiar el signo de x, dos funciones de onda relativas al nivel energético dado pueden transformarse entre sí. Sin embargo, en este caso, las funciones de onda de los estados estacionarios, aunque no son necesariamente pares o impares, siempre se pueden elegir de forma que lo sean (mediante una elección conveniente de combinaciones lineales de las funciones de partida). 74 La ecuación de Schrodinger Consideremos la función de onda del movimiento infinito en un sentido, es decir, de un estado estacionario del intervalo (21.4) del espectro continuo. La integral de normalización diverge para x-+ = (para x-+ - = la función decrece exponencialmente, de forma que la integral converge rápidamente). Por consiguiente, en la determinación de la constante de normalización se puede substituir 1P por s.u valor asintótico (para grandes valores x > O) y efectuar la integración eligiendo como límite inferior un valor finito cualquiera x, por ejemplo el valor cero; esto equivale a prescindir de una cantidad finita frente a otra infinitamente grande. Demostremos que la función de onda normalizada según la función-b de p (el impulso de la partícula en el infinito) debe presentar la forma asintótica (21 .5) con a = y'(2/,,,./i), es decir, lfp ~ = y(l/21rli)[ei(kx+c,)+e-i(kx+B)]. y(2/1rli) cos(kx+o) (21.9) donde k. = p h. Dado que no se trata de comprobar la ortogonalidad dos a dos de las funciones que corresponden a valores distintos de p, al substituir las funciones (21,9) en la integral de normalización J % *1P/ dx consideraremos impulsos p infinitamente próximos; podemos así suponer ó = o'(ó es, en general, una función de p). Además, en el integrando conservaremos solamente aquellos términos que divergen para p = p'; con otras palabras. prescindiremos de términos que contienen los factores e±t<k+k')x. Obtenemos así: J ipp*lfp' dx = (l/21rli) { j é<k'-k)x dx+ Je-iW-k)x dx), o o o bien, de otra manera, J,J,p*,J,p' dx = (1/21Tñj e<<k•-k)x clx. Pero la integral así obtenida coincide con la integral de normalización para la función de onda del movimiento libre lfp = (21rñ)-lf2eikx, (21.10) normalizada según la función-o del impulso (cf. (15.8)). El paso a la normalización según la función-o de la energía se efectúa de acuerdo con (5.14), multiplicando '1/Jp por dp/dE= 1/V~v es la velocidad). Así, para el movimiento libre tenemos: V lf E = (21rñv)-lf2eikx, (21.11) Observemos que la densidad de corriente de probabilidad en esta onda es igual a (21.12) Dividiendo la función (21.9) por Vv y teniendo en cuenta la igualdad (21.12), 75 El pozo de potencial podemos formular la siguiente regla para la normalización de la función de onda del movimiento infinito en un sólo sentido respecto de la función-<5 de la energía: una vez representada la expresión asintótica de la función de onda como suma de dos ondas planas que se mueven en sentidos opuestos, hay que elegir el coeficiente de normalización de tal manera que la densidad de corriente de probabilidad en la onda que se mueve hacia el origen de coordenadas (o que se aparta de este origen) sea igual a Ií2 nli. De manera análoga se puede obtener la regla para la normalización de las funciones de onda del movimiento infinito en ambos sentidos. La función de onda estará normalizada respecto de la función-ó de la energía si la suma de las corrientes de probabilidad en las ondas que se mueven hacia el origen de coordenadas a lo largo de los semirrayos negativo y positivo del eje x es igual a 1/2 nli. § 22. El pozo de potencial Como ejemplo simple de movimiento en una dimensión consideremos el movimiento en un pozo de potencial unidimensional de forma rectangular, es decir, en el campo caracterizado por la función U(x) representada en la fig. 1: U(x) = O para O < x < a, U(x) = U0 para x < O, > a. Es desde luego evidente que para E < U0 el espectro será discreto y que para E> U0 se tiene un espectro continuo cuyos niveles son doblemente degenerados .. x En el dominio O < x < a tenemos la ecuación de Schrodinger 1//' +(2m/li2 )Eif¡ = O (22.1) (el apóstrofo designa la derivación respecto de x), y en la región exterior al pozo se tiene: if¡" +(2m/n2 )(E-U0 )ip = O. (22.2) Para x = O, a, las soluciones de estas ecuaciones deben enlazarse de manera continua al igual que sus derivadas primeras, y para x = ± oo la solución de la ecuación (22.2) debe conservarse finita (para el espectro discreto, cuando E < U0 , debe tender a cero). U{x) o FIG. 1 X 76 La ecuación de Schrodinger Para E< U0 , la.solución de la ecuación (22.2) que tiende a cero en el infinito es 'P =constantexe=fKX, donde K = v[(2m/n2 )(Uo-E)]; (22.3) (los signos - y + en el exponente se refieren, respectivamente, a los dominios x > a y x < O). La probabilidad lv-'12 de encontrar la partícula decrece exponencialmente al penetrar en el dominio en el que E < U(x). En vez de la continuidad de 1P y '1/J' en la frontera del pozo de potencial, es conveniente imponer la continuidad de 1P y de la derivada logarítmica '1/J' / "P· Teniendo en cuenta (22.3), obtenemos la condición de contorno en la forma: (22.4) No nos entretendremos aquí en determinar los niveles de energía en un pozo de profundidad arbitraria U0 (véase el problema 2) y analizaremos tan sólo el caso límite en que las paredes del pozo son de altura infinita ( U0 ~ =). = Para U0 = el movimiento se efectúa solamente en el segmento limitado por los puntos x = O, y x = a y, conforme se indicó en el § 18, la condición de contorno en estos puntos debe ser: 'P = o. (22.5) (Es fácil ver que esta condición se obtiene también a partir de la condición general (22.4). En efecto, para U0 ~ = tenemos asimismo :,,e ~ = y por ello v,,' / 1P ~ =; dado que '1/J' no puede hacerse infinita, de aquí se sigue que 1P = O.) Busquemos la solución de la ecuación (22.1) dentro del pozo en la forma: (22.6) ip = csen(kx+S), donde k = v(2mE/n 2 ). La condición 1P = O para x = O nos da <5 = O, con lo cual la misma condición en x = a da sen ka = O, de donde ka = nn (n es un número entero positivo, mayor o igual que la unidad (1)) o bien (22.7) Mediante esta fórmula se determinan los niveles de la energía de una partícula en el pozo de potencial. Las funciones de onda normalizadas de los estados estacionarios son 'Pn = v(2/a)sen(1rnx/a). (22.8) Basándonos en estos resultados es posible escribir sin más los niveles de energía de una partícula en una « caja de potencial » tridimensional rectangular, es decir, para el movimiento en tres dimensiones en un campo carácterizado por la energía potencial U = O para O < x < a, O < y < b, O < z < e y U = fuera de este dominio. Estos niveles vienen determinados precisamente por las sumas = (1) Para n = O se obtendría la identidad tp == O. 77 El pozo de potencial En n.n 1 " 7r2fi2 (ni2 a = -2m - n22 na2) --+-+(n1, n2, n3 = a2 b2 ,2 1, 2, 3, ... ), (22.9) y las correspondientes funciones de onda por los productos "1n 1 n 2n = ª 8 7Tn¡ 7Tn2 1Tn3 -sen-xsen-ysen-z. J abe a b e (22.10) Observemos que la energía del estado fundamental resulta ser, de acuerdo con (22.7) o (22.9), del orden de E 0':"li 2/m/2, donde l representa las dimensiones lineales del dominio en que se efectúa el movimiento de la partícula. Este resultado concuerda con las relaciones de indeterminación: para una indeterminación de una coordenada ,_, l, la indeterminación del impulso, y con ella el orden de magnitud del pro-· pio impulso, es-li/l.; la energía correspondiente resulta ser -(li/l)2/m. PROBLEMAS 1. Determinar la distribución de probabilidad de los diferentes valores del impulso en el estado normal de una partícula que se encuentra en un pozo de potencial rectangular (unidimensional) de profundidad infinita. Solución. Los coeficientes a(p) del desarrollo de la función lJ'1 (22.8) en funciones propias del impulso (21.10) son iguales a: a(p) = f if, 11*'if,1 dx = 1 v'(1rali) f a sen(~ax)e-<if'll)Px dx. o Calculando la integral y elevando al cuadrado su módulo, obtenemos la distribución de probabilidades buscada: 4-rrli3a pa 2 2 la(p)l -- (p2a2-1r2li2)2 cos -2ñ' 2. Determinar los niveles de energía para el pozo de potencial representado en la fig. 2. Solución. El espectro de energías E < U1 es discreto, y es precisamente éste el que consideraremos. En la región x < O la función de onda es y en la región x > a Dentro del pozo (O < x < a) escribiremos '1./J if, = csen(kx+S), en la forma donde k=v'(2mE/li2 ). La ecuación de Schrodinger 78 La condición de continuidad de 1JJ'111' en las fronteras del pozo da las ecuaciones kctg 8 = K1 = v'[(2m/li2)U1 -k2], k ctg(ka+8) = - K2 = -v'[(2m/li2)U2-k2 ], o bien = sen8 kli/v'(2mU1 ), sen(ka+8) = -kli/v'(2mU2)· Eliminando <5, obtenemos la ecuación transcendente ka= n-rr- arcsen[kli/v'(2mU1) ] - arcsen[kli/v'(2mU2)] (1) (donde n = 1, 2, 3, ... y los valores de arcsen se toman entre O y n/2), cuyas raíces determinan los niveles de energía E= k 1 1i1/2m. Para cada valor den se tiene, en general, una raíz; los valores n numeran los niveles en orden creciente de energías. U(x) - - -... U1 a )( Fm.2 Dado que el argumento del arcsen no puede ser mayor que 1, es claro que los valores de k pueden pertenecer sólo al intervalo entre O y,V(2mU1 /li 2).El primer miembro de la ecuación (1) es función monótona creciente de k, y el segundo, función monótona decreciente. Por consiguiente, para que exista una raíz de la ecuación (1) es necesario que parak = V(2mU1 /li2)el segundo miembro sea menor que el primero. En particular, la desigualdad (2) que se obtiene para n = 1 es la condición para que en el pozo exista por lo menos un nivel energético. Vemos así que para valores dados U1 =:/= U2 existen siempre valores d1! la anchura a del pozo tan pequeños que no existirá ni un solo nivel discreto de la energía. Cuando U1 = U2, la condición (2) se cumplirá siempre, evidentemente. Para U 1 = U2 = U0 (pozo simétrico) la ecuación (1) se reduce a arcsen[lik/y'(2mU0)] = -!(nTr-ka). Introduciendo la variable ~ = kaf 2. cos (3) obtenemos para n impar la ecuación f = ±rf, donde y= (li/a)y'(2/mU0 ), (4) de la que hay que tomar aquellas raíces para las que tg; > O. Para n par, obtenemos la ecuación - senf = ±r,, (5) y hay que elegir las raíces para las que tg ~ < O. De las raíces de estas dos ecuaciones se deducen los niveles energéticos E= 2;2h2/ma2, y el número de niveles (para y =f=. O) es finito. 79 El oscilador lineal En particular, para un pozo no profundo, en el que U0 ~ h2/ma 2, tenemos y ~ 1 y la ecuación (5) no tiene ninguna raíz. La ecuación (4), en cambio, tiene una raíz (para el úgno superior en el segundo miembro), raíz.; r,.; 1/y (1 - 1/2y2). En este pozo de potencial se tiene así únicamente un nivel energético Eo ~ Uo-(ma 2/2ñ 2 )Uo2, situado cerca de su «boca». 3. Determinar la presión que ejercen sobre las paredes de una « caja de potencial» rectangular tridimensional las partículas que se encuentran en ella. Solución. La fuerza que se ejerce sobre la pared perpendicular al eje x es igual al valor medio de la derivada - 8H/8a de la función de Hamilton de la partícula respecto de la longitud del pozo a lo largo del eje x; la presión, por su parte, se obtiene dividiendo esta fuerza por la superficie be de la pared. Según la fórmula obtenida en el problema del§ 11, el valor medio buscado se encuentra derivando el valor propio de la energía (22.9). En consecuencia, para la presión se obtiene § 23. El oscilador lineal Consideremos una partícula que efectúa oscilaciones pequeñas en una dimensión (el llamado oscilador lineal). La energía potencial de esta partícula es igual, conforme es sabido, a mw2x 2/2, donde w es, en mecánica clásica, la frecuencia propia (cíclica) de las oscilaciones. De acuerdo con esto, el hamiltoniano del oscilador será (23.1) Dado que la energía potencial tiende a infinito cuando x = ± oo y que su valor mínimo (para x = O) es nulo, en virtud de las reglas generales es desde luego evidente que el espectro energético del oscilador será discreto con valores positivos de la energía. Determinemos los niveles de la energía del oscilador siguiendo el método matricial (1). Partiremos de las « ecuaciones del movimiento» en la forma (19.3); en el presente caso dan: ~+w2x = O. (23.2) En forma matricial esta ecuación es: (X)mn+w 2 Xmn = 0. Para los elementos de matriz de la aceleración tenemos, según (11.8), (x)mn (1) Éste fue el método seguido por onda por ScHRODINGER. HEISENBERG = (1925) antes del descubrimiento de la ecuación de 80 La ecuación de Schrodinger De aquí se sigue que todos los elementos de matriz Xmn son nulos salvo aquéllos para los que wmn = ± w. Numeremos los estados estacionarios de tal manera que las frecuencias ± w correspondan a las transiciones n -+ n =f 1, es decir, wn,n=rt = = ± w. En tales condiciones, serán diferentes de cero tan sólo los elementos de matriz Xn,n±I· ·supondremos que las funciones de onda 1Pn se han elegido reales. Dado que x es una magnitud real, también serán reales todos los elementos de matriz Xmn· La condición de hermiticidad (11.10) conduce ahora a que la matriz Xmn sea simétrica: Para calcular los elementos de matriz de la coordenada diferentes df' cero utilizaremos la regla de conmutación &x-x& = -ih/m, escribiéndola en forma matricial:· Mediante la regla de multiplicación de matrices (11.12), obtenemos de aquí para m =n i ~ (WnlXnzXzn - XnzwznXzn) = 2i ~ wnzXn1 2 = - ili/m. l l En esta suma los únicos términos no nulos son aquéllos para los que l de forma que se tiene: = n ± 1, (23.3) ,n) 2 De esta igualdad se deduce que las cantidades (x11 +1 forman una progresión aritmética que crece sin límites, pero necesariamente acotada inferiormente, ya que en ella pueden figurar solamente términos positivos. Dado que hasta aquí hemos fijado solamente el orden relativo de los números de los estados n, pero no sus valores absolutos, podemos elegir arbitrariamente el valor n correspondiente al primer estado - el normal - del oscilador. Elijámoslo igual a cero. Según esto, x0,_1 debe considerarse idénticamente nulo, y la aplicación sucesiva de las ecuaciones (23.3) con n = O, 1, ... conduce al resultado (xn,n-1) 2 = nn/2mw. Obtenemos así finalmente la siguiente expresión para los elementos de matriz de la coordenada diferentes de cero (1): (1) Elegimos las fases indeterminadas x,1 (véase la nota de la pág. 37) de tal manera que para todos los elementos de matriz (23.4) se obtenga el signo + delante de la raíz. Esta elección es siempre posible para una matriz en la que son diferentes de cero únicamente los elementos que representan transiciones entre estados consecutivos. 81 El oscilador lineal Xn,n-1 = Xn-1,n = y(nn/2mw). (23.4) La matriz del operador .íi es diagonal y los elementos de ·matriz H nn constituyen los valores propios buscados de la energía En, del oscilador. Para calcularlos escribamos: H,m = En = }m[(x2)nn+w2(x2)nn] = }m[ =im t' Ü»niXn¡iWznXzn+w2 f XnlX¡n] r (w2+wnz2)xzn2· En la suma respecto de l son diferentes de cero sólo los términos con l substituyendo (23.4), obtenemos: En = (n+!)ñw, n = O, 1, 2, .... = n ± 1; (23.5) Los niveles de energía del oscilador aparecen así distribuidos a intervalos íguales hw uno del otro. La energía del estado normal (n = O) es igual a ltw/2; subrayemos que esta energía resulta ser no nula. El resultado (23.5) se puede obtener también resolviendo la ecuación de ScHR~ DINGER. Para un oscilador, esta ecuación tiene la forma d 2if, 2m -+-(E-!mw2x2)ip dx2 2 n = O. (23.6) Conviene aquí introducir en vez de la coordenada x la variable sin dimensiones; definida por la relación g = v(mw/ñ)x. (23.7) ip" + [(2E/ñw)-f 2 ]ip = O; (23.8) Obtenemos entonces (El apóstrofo designa aquí la derivación respecto de t) Para grandes valores de; se puede prescindir de 2E/ ñw frente a ; 2 ; la ecuación 1P" = ;21/J tiene las integrales asintóticas ,¡, = eHt• (la derivación de esta función da, en efecto, prescindiendo de términos de orden inferior respecto de;, 1/J" = ; 21Jl). Dado que la función de onda 1P debe conservarse finita para ~ = ± oo, en el exponente se debe elegir el signo menos. Debido a ello es natural efectuar en la ecuación (23.8) la substitución (23.9) Para la función x(;) obtenemos la ecuación (se ha introducido la notación(2E/ ñw) -1 = 2n; dado que, conforme sabemos ya, E> O, se tiene n > - !) 82 La ecuación de Schrodinger o, x"-2fx'+2nx = (23.10) donde la función x debe conservarse finita para todos los valores finitos de ~ y para ± oo puede tender a infinito, pero no más rápidamente que una potencia finita de ~ (de modo que la función 1P tienda a cero). ~~ Tales soluciones de la ecuación (23.1 O) existen solamente para valores enteros y positivos den (incluido el valor cero, véase el§ a de los apéndices matemáticos); esto da para la ·energía los valores propios ya conocidos (23.5). Las soluciones de la ecuación (23.10) que corresponden a los distintos valores enteros den son: x = const. Hn(~), donde Hn(~) son los llamados polinomios de Hermite, que son los polinomios de grado n respecto de ; definidos por la fórmula (23.11) Determinando la constante de manera que las funciones 'f/J,z satisfagan la condición de normalización co f if,,. (x) dx = 1, 2 -co obtenemos (véase (a, 7)) if,,¡{:Jc) = mw)l/4 1 (-'TT'li 2n/2y'(n!) e-mwxa¡211,Hn(xy'[mw/li]). (23.12) Así, pues, la función de onda del estado normal es if,0(x) = (mw/1rli)114e-mwx:f211,. (23.13) Como debe ser, esta función carece de ceros para valores de x finitos. Calculando las integrales J'Pn'Pmf df, se pueden determinar los elementos de matriz de la coordenada; dicho cálculo conduce, claro está, a los mismos valores (23.4). Para terminar, demostraremos cómo es posible calcular las funciones de onda 'f/Jn siguiendo el método matricial. Observemos que en las matrices de los operadores l ±iwx, son no nulos únicamente los elementos (x-zwx)n-1,n = -(x+iwx)n,n-1 = -iv(2wlin/m). Partiendo de la fórmula general (11.11) y teniendo en cuenta que 'f/J-i a la conclusión de que (1-iwx)if,0 = O. (23.14) = O, llegamos 83 El oscilador lineal Después de substituir la expresión .t = -i(li/m)o/ox, de aquí se obtiene la ecuación oif,a/ox = -(mw/li)xif,a, cuya solución normalizada es (23.13). Además, dado que (.t+iwx)if,n- 1 = (x+iwx)n,n-ilpn obtenemos la fórmula recurrente = iy(2wlin/m)if,n, cuya aplicación reiterada n veces a la función (23.13) conduce a la expresión (23.12) para las funciones normalizadas 1/Jn· PROBLEMAS 1. Determinar la distribución de las probabilidades de los diferentes valores del impulso para un oscilador. Solución. En vez de desarrollar la función de onda de un estado estacionario en funciones propias del impulso, en el caso de un oscilador es más sencillo partir directamente de la ecuación de Schrodinger en la « representación-p ». Substituyendo en (23.1) el operador coordenada (15.12) = ilio/op obtenemos el hamiltoniano en la « representación-p »: * La correspondiente ecuación de Schrodinger lia(p) representación-p es = Ea(p) para la función de onda a(p) en la d2a(p) 2 ( p2) -.-+-E-- a(p) = 2 2 2 dp mw ñ 2m O. Esta ecuación es exactamente de la misma forma que la (23.6); por ello sus soluciones se pueden escribir directamente por analogía con (23.12) (substituyendo en esta fórmula xv (mw/ li) por Plv(mwli)). Encontramos así la distribución de probabilidades buscada: 2. Determinar el límite inferior de los posibles valores de la energía de un oscilador mediante la relación de indeterminación (16.8a). Solución. Para el valor medio de la energía del oscilador tenemos 84 La ecuación de Schrodinger o bien, utilizando la relación (16.8a): E > (!lp) 2/2m+mw 2h2/8(!lp)2. Determinando el valor mínimo de esta expresión (considerada como función de (.:\p)2), encontramos el límite inferior de los valores medios de la energía y, por consiguiente, también de todos los valores posibles de la misma: E >iñw. 3. Determinar los niveles de energía de una partícula que se mueve en un campo caracterizado por la energía potencial (fig. 3; P. M. MORSE). Solución. El espectro de valores propios positivos de la energía es continuo (con niveles no degenerados) y el espectro de valores negativos es discreto. uM -A FIG. 3 La ecuación de SCHRODINGER es: Introduzcamos la nueva variable g= 2y'(2mA) e-ax (1..ñ (que toma valores entre Oe oo) y la notación (consideramos el espectro discreto, de modo que E< O) s = v'(-2mE)/~, n = v'(2mA)/(1..ñ-(s+!). La ecuación de ScHRODINGER (1) adopta entonces la forma 1 ( n+s+} if/'+-:.if/+ -1+-- e s2).¡,=o. g2 ' Para~-+ oo la función tp se comporta asintóticamente como e±;/2, y cuando ~-+O es proporcional a ~±s. Por consideraciones de finitud, hay que elegir la solución que se comporta como e-;/2 para 85 El oscilador lineal ~ ~ oo y como ~s para ~~ O. Efectuemos la substitución con lo que se obtiene para w la ecuación fw"+(2s+l-f)w'+nw = O, (2) que debe resolverse con las condiciones siguientes: w es finita para ~ = O, y cuando ~ ~ oo, w tiende a infinito no más rápidamente que una potencia finita de t La ecuación (2) es la ecuación de una función hipergeométrica confluente (véase § d de los apéndices matemáticos): w = F(-n, 2s+l, f). La solución que satisface la condición impuesta se obtiene para valores enteros no negativos de n (caso en que la función F se reduce a un polinomio). De acuerdo con las definiciones (1), obtenemos, por consiguiente, para los niveles de energía los valores -En = ttn [ A 1 v(ZmA)(n+!) ]2, donde n recorre los valores enteros positivos a partir de cero y hasta el valor máximo para el cual todavía es v'(2mA)/a.ñ > n+ l (de modo que el parámetro s, de acuerdo con su definición, es positivo). El espectro discreto contiene así una sucesión finita de niveles. Si v'(2mA)Ja.ñ < t, no existe espectro discreto. U(x) -Uo FIG. 4 4. El mismo problema que en el caso anterior, pero con U = - U0 /cosh 2 ttx (fig. 4). Solución. El espectro de energías positivas es continuo y el de energías negativas es discreto; consideremos este último. La ecuación de ScHRÓDINGER es d2iµ 2m( U -+E+ 2 dx n cosh2ttX 0 2 ) ip=O. 86 La ecuación de Schrodinger Efectuemos el cambio de variable € = ~ = tgh a:x; introduciendo la notación y'(-2mE)/ñr1., s= 2mU0 /r1.2n2 = s(s+ 1), t(-1+ J[1+ ::~·]). obtenemos: dip] + [ s(s+ 1)- -€2-] ip = O. -d [ (1-g2)- dg dg 1-t2 Esta es la ecuación de las funciones de Legendre asociadas. Llevémosla a la forma hipergeométrica mediante la substitución ,p=(l -~2)Ef 2 w(f)y con el cambio provisional de variable i(J~)=u: u(l-u)w" +(€+ 1)(1-2u)w' -(€-s)(€+s+ l)w = O. La solución finita para ~ = 1 (es decir, para x = =), es Para que 'P se conserve finita también para~ = -1 (es decir, para x = - =), debe ser «-s = -n, donde n = O, 1, 2, ... (Fes entonces un polinomio de grado n, finito para~ = -1). Los niveles de energía se determinan así por la condición s - ~ = n. de donde En= -1t2r1.2 - [ -(1+2n)+ 8m J( 8mUº)]2 1+ -. rJ.21t2 Existe un número finito de niveles determinado por la condición « > O, es decir, n < s. § 24. Movimiento en un campo homogéneo Consideremos el movimiento de una partícula en un campo exterior homogéneo. Elegiremos la dirección del campo como eje x y sea F la fuerza que el campo ejerce sobre la partícula; en un campo eléctrico de intensidad E, esta fuerza es F = eE, donde e es la carga de la partícula. La energía potencial de la partícula en un campo homogéneo es de la forma U= - Fx+const.; eligiendo la constante de forma que sea U= O para x = O, tenemos U = - Fx. La ecuación de ScHRODINGER del problema en cuestión es de la forma d 2¡/J/dxª+(2m/li2)(E+Fx)ip = O. (24.1) Dado que U tiende a + = para x -+ - = y U-+ - oo para x -++ =, es evidente, sin más, que los niveles de energía forman un ,espectro continuo que cubre todo el intervalo de valores de la energía E, desde - oo a + =. Ninguno de estos valores propios es degenerado y corresponden a un movimiento que es finito en el sentido x = - = e infinito en el sentido x = + oo. Movimiento en un campo homogéneo 87 Introduzcamos en vez de la coordenada x la variable sin dimensiones , = (x+EJF)(2mFJ/i2)11a. (24.2) La ecuación (24.1) toma entonces la forma rfl'+,if, = o. (24.3) Esta ecuación no contiene ya el parámetro energía. Por consiguiente, si hallamos la solución que satisface las condiciones necesarias de finitud, habremos con ello obtenido la función propia correspondiente a valores arbitrarios de la energía. La solución de la ecuación (24.3) que es finita para todo valor de x tiene la forma (véase § b de los apéndices matemáticos): if,(f) = A<I>( -,), (24.4) donde es la llamada función de Airy y A es un factor de normalización que determinaremos más adelante. Para ; --+ - oo la función 1J)(;) tiende a cero exponencialmente. U na expresión asintótica, que determina a 1J)(;) para valores negativos de; grandes en valor absoluto, tiene la forma (véase (b, 4)): if,(,) ~ A --exp[-il,lª/2]. 2¡,¡114 (24.5) En cambio, para grandes valores positivos de ;, una expresión asintótica de la función 1J)(fl es la siguiente (véase (b, 5)) (1): ip(,) = Ag-1 14 sen(¡g3 12 +f1T), (24.6) Según la regla general (5.4) de normalización de las funciones propias del espectro continuo, normalizaremos las funciones (24.4) respecto de la función-c5 de la energía, de forma que: _Í'P(f),f,(f) dx = 3(E'-E). (24.7) En el§ 21 se indicó un método sencillo para determinar el coeficiente de normaliza(1) Observemos, adelantando ideas, que las expresiones asintóticas (24.5) y (24.6) corresponden precisamente a las expresiones cuasiclásicas de la función de onda (47.1) y (47.4a). La ecuación de Schrodinger 88 ción mediante la expresión asintótica de las funciones de onda. Siguiendo este mé. todo, representemos la función (24.6) como suma de dos ondas móviles: if,(g) ~ }Ag-1¡4 exp(i(fg3¡2_t,r ])+¡Ag-1¡4 exp(-i[fg3¡2_VT ]). La densidad de corriente de probabilidad estos dos términos, debe ser igual a y[2(E+Fx)/m](A/2g114 ) 2 = (v]1f'\ 2), calculada mediante cada uno de A 2 (2ñF)1 13/4m2 / 3 = 1/2TTñ, de donde se sigue: (2m)l/3 A= 7rl /2FI /6/;,2 /3 . (24.8) PROBLEMA Determinar las funciones de onda en la representación-p para una partícula en un campo homogéneo. Solución. El operador hamiltoniano en la representación-p es H = p2/2m-iñF a¡ap, de modo que la ecuación de Schrodinger para la función de onda a(p) tiene la forma: (p2 ) . da -iñF-+ --E a= O. dp 2m Resolviendo esta ecuación, obtenemos las funciones buscadas Estas funciones se normalizan de acuerdo con la condición J OC) aE*(p)aE·(P) dp § 25. = 8(E' -E). Coeficiente de transmisión Consideremos el movimiento de partículas en un campo del tipo representado en la fig. 5: U(x) crece con monotonía desde un límite constante ( U = O para x -+ - oo) a otro (U= U0 para x -++ oo). Según la mecánica clásica, una partícula con energía E< U0 que se mueva en un campo de estas características de izquierda a derecha, al llegar al muro de potencial « es reflejada » por éste, comenzando a moverse en sentido opuesto; si, en cambio E> U0 , la partícula sigue moviéndose en el sentido inicial con menor velocidad. En mecánica cuántica encontramos un nuevo movimiento: incluso para E> U0 la partícula puede « ser reflejada» por el muro Coeficiente de transmisión 89 de potencial. La probabilidad de reflexión debe calcularse, en principio, de la siguiente manera. Supongamos que la partícula se mueve de izquierda a derecha. Para grandes valores positivos de x, la función de onda debe representar una partícula que ha pasado por « encima del muro » y que se mueve en el sentido positivo del eje x, es decir, debe tener la forma asintótica: parax ~ co, if, ~ Aeik1 x, donde k 2 = (1/li)v[2m(E- U0 )] (25.1) (A es una constante). Para hallar la solución de la ecuación de Schrodinger que FIG. 5 satisface a esta condición en el límite, calculemos la expresión asintótica cuando x ~ - oo; esta es una combinación lineal de las dos soluciones de la ecuación del movimiento libre, es decir, tiene la forma (25.2) El primer término corresponde a una partícula que incide sobre el « muro » (suponemos que 'IJ) está normalizada de tal manera que el coeficiente de este término es igual a la unidad); el segundo término, en cambio, representa una partícula reflejada por el mismo. La densidad de corriente de probabilidad que corresponde a la onda incidente es proporcional a k 1, la que corresponde a la reflejada es k1 \B\ 2 , mientras que a la transmitida corresponde k 2 ]A[ 2 • Definiremos el coeficiente de transmisión D de la partícula como razón de la densidad de corriente de probabilidad en la onda transmitida a la densidad de corriente en la onda incidente: (25.3) Análogamente, se puede definir el coeficiente de reflexión R como razón de la densidad de corriente reflejada a la incidente; es evidente que R = 1 - D: R= IBl 2 = l-(k2/k1)IAl 2 (25.4) (esta relación entre A y B se cumple automáticamente). Si la partícula se mueve de izquierda a derecha con energía E < U0 , el factor k 2 es imaginario puro y la función de onda disminuye exponencialmente para x ~+ oo. La corriente reflejada es igual a la incidente, es decir, tiene lugar una « reflexión total » 90 La ecuación de Schrodingt!r de la partícula en el muro de potencial. Subrayemos, sin embargo, que en este caso la probabilidad de encontrar la partícula en la región donde E < U es con todo diferente de cero, aunque disminuye rápidamente al aumentar x. En el caso general de un estado estacionario arbitrario (de energía E> U0) la forma asintótica de la función de onda, tanto para x -+ - oo como para x -+ + oo, es suma de dos ondas que se propagan en ambos sentidos a lo largo del eje x: if, = A 1eik1x+B1e-tk1x para x ~ -oo, if, = A 2etk2x + B 2e-tk2x para x ~ +oo. (25.5) Dado que estas dos expresiones son las formas asintóticas de una misma solución de una ecuación diferencial lineal, entre los coeficientes A1, B1 y A2 , B 2 existe una relación lineal. Sea A 2 = ~A1 +f3B1 , donde ~, /3 son constantes (en general complejas) que dependen de la forma concreta del campo U(x). Una relación análoga se puede entonces escribir para B 2 basándose en consideraciones ligadas con el carácter real de la ecuación de SCHRODINGER. En virtud de esta última, si 1P es una solución de una ecuación de SCHRODINGER dada, también la función conjugada compleja 1/J* es solución de la misma ecuación. La forma asintótica if,• = Ai•e-tk1x+Bi•etk1x para x if,• = A 2•e-ik2x+B2•etk2x para x ~ ~ _ oo, + oo difiere de (25.5) tan sólo en la notación adoptad3: para los coeficientes constantes; tenemos por ello B 2* = ~B1*+/3Ai* o B 2 = ~*B1 +/3*A 1• Así, pues, los coeficientes que aparecen en (25.5) están ligados entre sí por relaciones de la forma (25.6) La condición de que la corriente de probabilidad sea constante a lo largo del eje x conduce a la relación entre los coeficientes de (25.5) k1(IA11 2-IB11 2) = k2(1A21 2-IB2\ 2). Expresando aquí A 2 , B2 en función de A1, B 1 según (25.6), obtenemos: locl 2-liBl 2 = k1/k2. (25.7) Mediante las relaciones (25.6) es posible, en particular, demostrar que los coeficientes de reflexión son iguales (para una energía dada E> U0 ) en el caso de partículas que se mueven en el sentido positivo o en el sentido negativo del eje x. En efecto, obtenemos el primer caso haciendo en las funciones (25.5) B2 = O, y el segundo, tomando A1 = O. Los correspondientes coeficientes de reflexión son IB1/A1l 2 = li8•/oc•l 2, = !A2/B2\ 2 = 1 ~/oc j2, R1 = R2 91 Coeficiente de transmisión de donde resulta, evidentemente, que R1 = R 2 • PROBLEMAS 1. Determinar el coeficiente de reflexión de una partícula por un muro rectangular de potencial (fig. 6); energía de la partícula, E > U0 • Solución. En toda la región x > O la función de onda tiene la forma (25.1), y en la región y B se determinan a partir de la condición de continuidad x < O, la forma (25.2). Las constantes A de 1P y d1JJ/dx para x = O: de donde El coeficiente de reflexión (25.4) (1) es: Para E= U0, (k2 = O), R se reduce a la unidad, y para E-+ oo, tiende a cero como R = (U0/4E) 2• 2. Determinar el coeficiente de transmisión de una partícula a través de una barrera rectangular de potencial (fig. 7). uCx> uº.,_______ a X FIG. 6 FIG. 7 Solución. Sea E > U0 y supongamos que la partícula incidente se mueve de izquierda a derecha. Tenemos entonces para la función de onda en las· diferentes regiones expresiones de la forma: < O, para O< x < para x > a, para x a, if, = Beik•x+B'e-ik.x, if, = Ceik/i; (1) En el caso límite de la mecánica clásica el coeficiente de reflexión debe anularse. La expresión obtenida, sin embargo, no contiene la constante cuántica. Esta aparente contradicción se explica de la siguiente manera. El límite clásico corresponde al caso en que la longitud de onda de De Broglie de la partícula A"" h/p es pequeña respecto de las dimensiones características que aparecen en el problema, es decir, respecto de las distancias para las que cambia de manera apreciable el campo U(x). Pero en el ejemplo esquemático considerado, esta distancia es igual a cero (se reduce al punto x = O), con lo que no es posible llevar a cabo el paso al límite. La ecuación de Schrodinger 92 ( en la región x > a debe existir tan sólo la onda transmitida, que se propaga en el sentido positivo del eje x). Las constantes A, B, B', C se determinan a partir de las condiciones de continuidad de '1/J y d'I/J/dx en los puntos x = O, a. El coeficiente de transmisión se determina mediante la relación D = k1 IClª/k1 = fCl 2• El cálculo conduce al siguiente resultado: 2 4k¡ kz2 ]) = ~~~~~~~~~~~ (k1 2 -kz2) 2 sen2ak 2 +4k12kz2 Para E < U0 , k 2 es una cantidad imaginaria pura; las correspondientes expresiones para D se obtienen substituyendo k 2 por i-x 2 , donde li1<1 = v[2m( U O-E)]: 3. Determinar el coeficiente de reflexión de una partícula por un muro de potencial definido por la fórmula U(x) = U0 /(1 +e-cxx) (fig. 5); energía de la partícula E> U0 • Solución. La ecuación de ScHRÓDINGER 2 es: 2m( d ¡/J dx2 + 1t2 E Hemos de encontrar la solución que para Jll.,,-+ ip + oo = constante x tiene la forma: eik.x. -Introduzcamos una nueva variable (que toma valores entre - oo y O) y busquemos una solución de la forma: donde w(;) tiende a una constante para;-)> O (es decir, para ecuación de tipo hipergeométrico: X-'? oo). Para w(;) obtenemos una f(1-f)w''+(1-2ik 2 /r¡..)(1-f)w'+(kl-ki2)w/rJ. 2 = O, que tiene por solución la función hipergeométrica (no hemos escrito el factor constante). Cuando la condición impuesta. ;-'? O esta función tiende a 1, es decir, satisface La forma asintótica de la función ip para;-'? - oo (es decir, x----+- oo) es (1): (1) Véase la fórmula (e, 6); en cada uno de los dos sumandos hay que tomar sólo el primer término del desarrollo, es decir, substituir las funciones hipergeométricas de 1/z por la unidad. 93 Coeficiente de transmisión donde f(-i(k1 +k2)/rt.)f(-i(k1 +k2)/rt.+ 1)' C2 f(2ik1/rt.)f(-2ik2/rt.+ 1) = . f(i(k1-k2)/rt.)r(i(k1-k2)/rt.+ 1) El coeficiente de reflexión buscado es R = f(x+ 1) = xf(x), ¡c ;c 2 2 1\ ; el cálculo mediante las conocidas fórmulas f(x)f(l-x) = Trjsen TrX, conduce al resultado Para E = U0 , (k 2 = O), R se reduce a la unidad y para E-+ R = = tiende a cero de acuerdo con la ley 2 7TUo ) -e-47T\f'(2mE)fal't. 2m __ ( rt.ñ E Al pasar al límite de la mecánica clásica, R se reduce a cero, como debe ser. FIG. 8 4. Determinar el coeficiente de transmisión de una partícula a través de una barrera de potencial definida por la fórmula U(x) = U0 /cosh 2ct.x ( fig. 8); energía de la partícula E < U0 • Solución. La ecuación de ScHRODINGER para este problema se obtiene a partir del problema 4, § 23, cambiando el signo de U0 y considerando ahora la energía E como positiva. Siguiendo el mismo método se obtiene la solución ¡fo= (1-t2)-ik/2aF[-ik/rt.-s, -ik/rt.+s+ 1, -ik/<1.+ 1, !(1-t)], donde g= s= tgh el.X, k = y(2mE)/ñ, ( J[ t - 1+ 1- 8mU0 ] ) :.1.2f12 (1) 94 La ecuación de Schrodinger = Esta solución cumple ya la condición de que cuando x-,.. (es decir, para~_,.. 1, (1 -~)::::: 2e-z) la función de onda contenga solamente la onda transmitida (,_, eikz). La forma asintótica de la función de onda para x-,.. 1) se encuentra transformando la función hipergeométrica mediante la fórmula (e, 7): = (~-,.. - if; ,...., e-ikx reik)re1-ik) . re -ik)ret-ik) + eik:r • re-s)r(l +s) re -ik-s)re-ik+s+ 1) (2) Calculando el cuadrado del módulo de la razón de coeficientes en esta función, obtenemos la siguiente expresión para el coeficiente de transmisión D = 1 - R: 2 senh ( 1rk/rJ.) ]) = ~~~~~~~~~~~~~~~~ senh 2 (1rk/iJ.)+cos 2[!1r v(l-8mU0/n 2rJ.2)] para 8mU0 /h 2 2 r:1.. < 1, l) = senh 2(1rk/rJ.) ~~~~~~~~~~~~~~~~- sen h 2 e1rk/ cx) + cos h 2[!1r v(8mU0 /h2iJ.2 -l)] para 8mU0 /h > l. La primera de estas fórmulas vale también para el caso en que U0 < O, es decir, cuando la partícula pasa no por encima de una barrera de potencial, sino por encima de un pozo de potencial. Es interesante que en estas condiciones sea D = 1 si 1+8mlUol/ñ2ix2 = (2n+1) 2 ; es decir, que para determinados valores de la profundidad del pozo U0 las partículas que pasan por encima de él no se reflejan. Esto se advierte ya en la expresión (2), en la cual desaparece el término que contiene e-ikz cuando s es un entero positivo. 2 2 r:1.. CAPÍTULO IV MOMENTO CINÉTICO § 26. Momento cinético En el § 15 al deducir la ley de conservación del impulso nos apoyamos en la homogeneidad del espacio con relación a un sistema aislado de partículas. Junto a la homogeneidad, el espacio posee también la propiedad de isotropía - es decir, todas las direcciones son en él equivalentes. Por consiguiente, el hamiltoniano de un sistema aislado no debe cambiar al someter el sistema como un todo a una rotación, cualquiera que sea su amplitud y cualquiera que sea su eje. Como en el § 15, es suficiente imponer la condición de que se cumpla esta condición en una rotación infinitesimal arbitraria. Sea ~9 el vector infinitesimal de la rotación, igual en valor absoluto al ángulo ~<p de la rotación y cuyo vector coincide con el eje en torno del cual se realiza aquélla. Los cambios óra (de los vectores posición de las partículas, r11 ) en dicha rotación son, como es sabido, iguales a: Sr11 = O<p X r 11 • Una función arbitraria 1P(r1 , r 2 , ción ••. ) se convierte en esta transformación en la fun- ip(r1 +Sr1, r 2 +8r 2, ••• ) = tf;(r1 , r 2 , •.• )+ La Sra. v atfa = tf;(r1, r 2, .•• )+ La S<p X ra • V atfa = (1 +scp. Lra X V a)¡/;(ri, r2, ... ). a La expresión se puede considerar como el « operador de rotación infinitesimal». El hecho de que una rotación infinitesimal no cambia el hamiltoniano del sistema, se traduce en la conmutabilidad del « operador rotación» con el operador H (véase § 15). Dado que el operador multiplicación por la unidad conmuta con todos los operado- 96 res, y que Momento cinético ó<p es un vector constante, esta condición conduce a la relación (26.1) que expresa una ley de conservación. La magnitud cuya conservación para un sistema aislado se sigue de la propiedad de isotropia del espacio es el momento cinético del sistema. El operador l:ra X V a debe así corresponder, salvo un factor constante, al momento cinético total del sistemz _ y cada uno de los términos rª x ª de la suma, al momento cinético de cada una de las partículas. v El coeficiente de proporcionalidad debe tomarse igual a -ili; esto resulta inmediatamente de que entonces la expresión para el operador momento de la partícula -ilir x V= r xpcorresponderá exactamente a la expresión clásica ordinaria r x p. En lo que sigue utilizaremos siempre el momento cinético medido en unidades li. El operador determinado de esta manera para el momento de una partícula lo representaremos por i, y el momento cinético de todo el sistema lo designaremos por L. Tenemos así para los operadores componentes del momento cinético de una partícula las expresiones (26.2) Para un sistema que se encuentra en un campo exterior, el momento cinético, en general, no se conserva. Sin embargo, el momento cinético puede conservarse cuando el campo posee determinada simetría. Así, si el sistema se encuentra en un campo que presenta simetría esférica, todas las direcciones en el espacio que parten del centro son equivalentes y, por lo tanto, se conservará el momento cinético respecto de este punto. Análogamente, en un campo con simetría axil se conserva la componente del momento cinético a lo largo del eje de simetría. Todas estas leyes de conservación, que se cumplen en la mecánica clásica, conservan su validez también en la mecánica cuántica. En un sistema en el que no se conserve el momento cinético en los estados estacionarios, el momento cinético carece de valores determinados. En tales casos presenta a veces interés el valor medio del momento cinético en un estado estacionario dado. Es fácil ver que en todo estado estacionario no degenerado el valor medio del momento cinético es igual a cero. En efecto, si se- cambia el signo del tiempo, no cambia la energía, y dado que al nivel energético en cuestión corresponde un sólo estado estacionario, se sigue de aquí que al cambiar ten - t el estado del sistema debe permanecer inalterado. Esto significa que tampoco pueden variar los valores medios de las diferentes magnitudes, en particular, el del momento cinético. Pero al cambiar el signo del tiempo, cambia el signo del momento cinético, con lo que 97 Momento cinético obtendríamos L = - L ; de aquí se sigue que L = O. El mismo resultado se puede obtener partiendo de la definición matemática de valor medio de la magnitud, L, como integral de ip*Lfa. Las funciones de onda de los estados no degenerados son reales (véase el final del § 18). Por consiguiente, la expresión es imaginaria pura, y dado que L debe ser, claro está, una cantidad real, es evidente que L = O. Hallemos las reglas de conmutación de los operadores del momento cinético con los operadores de las coordenadas y de los impulsos. Mediante las relaciones (16.2) obtenemos fácilmente: {Íx,x} = O, {Íx,Y} ='z°Z, {Íx, z} = -iy, {Í111Y} = O, {1 11 ,z} = ix, {!11 , x} = -iz, {tz} = O, {Íz,X} = t)', {Íz,Y} = -ix. } (26.3) Así, por ejemplo Ía:y-yla: = (1/li.)(yi>z-zJ,11)y-y(yJ,z-ZP11)(1/n) = -(z/n){p 111 y} = iz. Todas las relaciones (26.3) se pueden escribir en forma tensorial de la siguiente manera: (26.4) 1 ) donde eikl es el tensor unidad antisimétrico de tercer orden ( y donde se sobreentiende la sumación para cada dos índices mudos· que se repiten. Como es fácil comprobar, relaciones de conmutación totalmente análogas valen para los operadores del momento cinético y del impulso: {Íi,A} = ieikzPz· (26.5) El tensor unidad antisimétrico de tercer orden eikl (llamado también tensor axil unidad) se define como el tensor antisimétrico respecto de sus tres índices y tal que e123 = 1. Es evidente que de las 27 componentes de este tensor, sólo son distintas de cero las 6 componentes para las que los índices i, k, /, forman una permutación cualquiera de los números 1, 2, 3. De éstas, las componentes iguales a + 1 corresponden a~permutaciones i, k, /, que se obtienen a partir de 1, 2, 3, mediante un número par de transposiciones, y son iguales a - 1 las que resultan de un número impar. Es evidente que 1 ( ) eikZeikm = 2Szm, eikleikl = 6. Las componentes del vector C = A x B, que son las componentes del producto vectorial de los dos vectores A y B, se pueden escribir mediante el tensor eik! en la forma 98 Momento cinético Mediante estas fórmulas es fácil encontrar las reglas de conmutación de los operadores la:, ! 71 , 12 entre sí. Tenemos: ñ(l)11 -lJa:) = = = la;(zj,:,;-xp,J-(zJ,a:-XPz)la; (f~-zfa:)P:c-x(fxPz-J>zfa;) -iyJ,a:+ixJ, 11 = iñfz• Así, pues, (26.6) o bien (26.7) Exactamente· las mismas relaciones valen también para los operadores La:, L1,, L 2 . del momento cinético total del sistema. En efecto, dado que los operadores del momento cinético de las diferentes partículas conmutan entre sí, se tiene, por ejemplo: ''J:}a11'Efa,"E[a,"Efa11 a a a a = "E(faJa,-fa,fa11) = i~a fa:,;• a Por lo tanto, (26.8) Las relaciones (26.8) demuestran que las tres componentes del momento cinético no pueden poseer simultáneamente valores determinados (con la única excepción del caso en que las tres componentes son simultáneamente nulas - véase más adelante). Desde este punto de vista, el momento cinético difiere esencialmente del impulso, para el cual las tres componentes pueden tomar simultáneamente valores determinados. de los operadores L~, L 11, L. formemos el operador Lz 2+L./'+L.2, que se puede considerar como el operador del cuadrado del módulo del vector momento cinético; representémoslo por l2: A partir L 2 = Lz2 +L 112 +L,2 • (26.9) Este operador conmuta con cada uno de los operadores Lz, L11 , L.: {L2,La;} = o, {L2,L11} = o, {L2,L,} = En efecto, teniendo en cuenta (26.8), resulta, por ejemplo: o. {La:2,L,} = La:(La;,L,}+{L:r,L,}La: = -i(L:r;l,,+ L11La:), {L112, Lz} = i(L:r;l,,+L 11L:,;), {L,2,L,} = o. (26.10) 99 Momento cinético Sumando estas igualdades obtenemos {L2 , Lz} = O. Las relaciones (26.1 O) significan físicamente que el cuadrado del momento cinético (es decir, de su módulo) puede tener un valor determinado a la vez que una de sus < omponentes. En vez de los operadores lx, sus combinaciones complejas Ly, con frecuencia resulta más conveniente utilizar (26.11) Es fácil verificar, mediante un cálculo directo y teniendo en cuenta (26.8), que para estas combinaciones valen las siguientes reglas de conmutación: 2Lz, {Lz, L+} {Lz, L_} = -L-, {L+, L-} = =L +, (26.12) Tampoco es difícil comprobar que t2 = l+L-+Lz2 -Lz = L-L++Lz2 +Lz. (26.13) Finalmente, escribamos unas expresiones frecuentemente utilizadas para el operador del momento cinético de una sola partícula en coordenadas esféricas. Introduciendo éstas mediante las relaciones habituales x = r sen 8 cos ef,, y= rsen9sen<1>. z = r cos 8, después de un cálculo simple obtenemos las siguientes expres10nes: lz = a oef,' -i- (26.14) 1± = e±tr/J(± !_ +i ctgB!_)· ae (26.15) oef, Substituyéndolas en (26.13), obtenemos el operador del cuadrado del momento cinético de una partícula en la· forma: º)] 1 82 1 ó ~sen8¡2 = - [ ----+--2 se~B óef, sen (} 80 80 • (26.16) Obsérvese que esta expresión es, salvo un factor, la parte angular del operador de La place. 100 § 27. Momento cinético Valores propios del momento cinético Para determmar los valores propios de la proyección del momento cinético de una partícula en una dirección conviene utilizar la expresión de su operador en coordenadas esféricas, eligiendo el eje polar en el sentido de la dirección considerada. Según la fórmula (26.14), la ecuación lzt!, = lzt!, puede escribirse en la forma: (27.1) Su solución es if, = f (r, O)eüztf,, donde f(r, 6) es una función arbitraria de r y 6. Para que la función '1/J sea una función uniforme, es necesario que sea periódica respecto de <p con período 2n. De aquí se sigue (1): l, = m, donde m = O, ±1,± 2, .... (27.2) Así, pues, los valores propios lz son iguales a los números enteros, positivos y negativos, incluido el valor cero. El factor que depende de <p, y que caracteriza las funciones propias del operador lz, lo designaremos por <I> m(<p) = (21r)-l/2eimef,. (27.3) Estas funciones se normalizan de forma que 2ff' fo <I>m*(cf,)<I>m (cp) dcf, 1 = 8mm'· (27.4) Los valores propios de la componente-z del momento cinético total de un sistema son también iguales. evidentemente, a los números enteros positivos y negativos: L. = M, donde M = 0,± 1, ±2, ... (27.5) lesto se sigue del hecho que el operador Lz es la suma de los operadores lz correspondientes a las diferentes partículas, operadores que conmutan entre sí). Dado que la dirección del eje z no es una dirección privilegiada a priori, es claro que el mismo resultado se obtiene para Lx, Ly y, en general, para la componente del momento cinético respecto de una dirección cualquiera - todas ellas pueden tomar solamente valores enteros. Este resultado puede parecer a primera vista paradójico, sobre todo si se aplica a dos direcciones infinitamente próximas. En realidad, sin embargo, no hay que perder de vista que la única función propia común a los operadores lx, ly, lz corresponde a los valores simultáneos L~ = L 11 = L, = O; ( ) La notación generalmente admitida que representa los valores propios de la proyección del momento cinético por la letra m - que es la m,,ma con la que se designa la masa de una partícula-, no puede de hecho conducir a confusión. 1 Valores propios del momento cinético 101 en este caso el vector momento cinético, y, por lo tanto, también su proyecc10n sobre una dirección cualquiera, es igual a cero. Pero basta que uno sólo de los valores propios Lx, Ly, Lz sea diferente de cero, para que no exista función propia alguna común a los operadores.la;, lv, Lz. Con otras palabras, no existe un estado tal que en él dos o tres componentes del momento cinético relativas a direcciones diferentes posean simultáneamente valores determinados (diferentes de cero), de forma que tan sólo de una de ellas podemos decir que toma valores enteros. Los estados estacionarios de un sistema que difieren tan sólo en el valor Lz poseen la misma energía, conforme se sigue de consideraciones generales ligadas con el hecho de que la dirección del eje z no es a priori privilegiada. Así, pues, los niveles energéticos de un sistema cuyo momento cinético se conserva (y es distinto de cero) son siempre degenerados (1). Pasemos ahora a determinar los valores propios del cuadrado L2 del momento cinético, y veamos cómo es posible encontrar estos valores partiendo solamente de las condiciones de conmutación (26.8). Designemos por 1PM las funciones de onda de los estados estacionarios correspondientes a un nivel de energía degenerado y que difieren en el valor Lz = M. Junto con la energía, en estos estados tiene un valor determinado (y único) el cuadrado L2 del momento cinético (2). Observemos ante todo, que en tanto la diferencia t2_ lJz f' 2 -- l :,;2+ l y 2 es igual al operador de una magnitud física esencialmente positiva, Lx2+ Ly2, para un valor dado L2 del cuadrado del momento cinético y para todos los valores propios posibles de la magnitud Lz debe cumplirse la desigualdad L2 > Lz2 , o bien (27.6) Así, pues, los valores posibles Lz (para un L2 dado) están limitados por ciertas cotas superior e inferior; llamemos L el valor del número entero que corresponde al mayor valor de \Lz[· (1) Esta circunstancia es un caso particular del teorema general demostrado en el § 1O relativo a la degeneración de los niveles cuando existen por lo menos dos magnitudes que se conservan y que no conmutan entre sí. Tales magnitudes son aquí las componentes del momento cinético. (2} Se supone aquí que no existe ninguna degeneración adicional que conduzca a valores de la energía iguales para diferentes valores del cuadrado del momento cinético. Esto es lícito para el espectro discreto (con excepción del caso de la llamada degeneración accidental en un campo de Coulomb, véase § 36) y, en general, no lo es para los niveles energéticos del espectro continuo. Sin embargo, incluso cuando existe una tal degeneración adicional es siempre posible elegir las funciones propias de modo que correspondan a estados con valores determinados de V y entre ellos elegir luego los estados con valores iguales de E y L 2 • Esto se traduce matemáticamente en que las matrices de operadores que conmutan entre sí pueden siempre reducirse simultáneamente a la forma diagonal. En lo que sigue, en casos análogos y para abreviar, discurriremos como si no existiera ninguna degeneración adicional, teniendo en cuenta que, en virtud de lo dicho, los resultados obtenidos no dependen, en realidad, de esta hipótesis. 102 Momento cinético Aplicando el operador lzL± a la función propia 1PM del operador Lz y utilizando la regla de conmutación {Lz, L±} = ± L± (26.12), obtenemos: De aquí se sigue que la función L±'PM es (salvo una constante de normalización) función propia correspondiente al valor M ± 1 de la magnitud Lz; podemos escribir: 'PM+l =constantex L+tfiM, 'PM-1 =constantex L-'PM· (27.7) Si en la primera de estas igualdades se hace M = L, debe tenerse idénticamente (27.8) dado que, por definición, no existen estados con M > L. Aplicando a esta igualdad el operador l- y teniendo en cuenta la relación (26.13), obtenemos: L-L+1/;L = (L 2 - Lz 2 - Lz)ih = o. Pero dado que las "PM son funciones propias comunes a los operadores L 2 y será lz, L 2 ipL = L 2ipL, Lz2 1PL = L2ipL, Lz'PL = Lh, de modo que la ecuación obtenida da L2 = L(L+l). (27.9) La fórmula (27.9) determina los valores propios buscados del cuadrado del momento cinético. El número L toma todos los valores enteros positivos;, incluido el valor cero. Para un valor dado del número L, la componente Lz = M del momento cinético puede tener los valores M = L,L-1, ... ,-L, (27.10) es decir, en total 2L+ 1 valores diferentes. El nivel de energía que corresponde al momento cinético L (1) presenta así una degeneración de orden 2L + 1. El estado con valor nulo del momento cinético L = O (con lo que también las tres componentes son iguales a cero) no es degenerado; observemos que la función de onda de dicho estado presenta simetría esférica. Esto se sigue ya de que al aplicarle el operador momento cinético, el resultado se reduce a cero, es decir, dicha función no varía en una rotación infinitesimal. Para el momento cinético de una sola partícula escribiremos la fórmula (27.9) en la forma: 12 = l(l+ 1), (27.11) (') Para abreviar, y como es costumbre, hablaremos con frecuencia del « momento cinético L » de un sistema, sobreentendiendo con ello el momento cinético con valor máximo posible de la proyección de dicho momento igual a L. 103 J' alores propios del momento cinético es decir, representaremos el momento cinético de una partícula por la letra minúscula/. Calculemos los elementos de matriz de las magnitudes Lx y Ly en la representación en la que, junto con la energía, son diagonales L= y L2 (M. BoRN, W. HEISENBERG, P. JORDAN; 1926). Observemos ante todo que dado que los operadores Lx y Ly conmutan con el operador !, sus matrices son diagonales respecto de la energía, es decir, todos los elementos de matriz correspondientes a transiciones entre estados con energía diferente (y diferentes momentos cinéticos L) son iguales a cero. Basta, pues, considerar los elementos de matriz para las transiciones dentro de un grupo de estados con valores diferentes M y correspondientes a un mismo nivel degenerado de la energía. De las fórmulas (27.7) se deduce que en la matriz del operador L+ son distintos de cero tan sólo los elementos que corresponden a las transiciones M + 1 -+ M, y en la matriz del operador L-, los elementos correspondientes a M - 1 -+ M. Teniendo esto en cuenta, formemos los elementos de matriz diagonales en ambos miembros de la igualdad (26.13) y obtendremos (1): L(L+ 1) = (L+)M,M-1(L-)M-1,M+M 2 -M. Observando que en virtud del carácter hermítico de los operadores Lx, Ly, (L-)M-1,M = (L+)*M,M-lt escribiremos esta igualdad en la forma: l(L+)M,M-11 2 = L(L+l)-M(M-1) = (L-M+l)(L+M), de donde (2): (L+)M,M-1 = (L-)M-1,M = v[(L+M)(L-M+ 1)]. (27.12) Para los elementos de matriz, distintos de cero, de las propias magnitudes Lx y Ly se deducen de aquí los valores: (Lx)M,M-1 = (Lx)M-1,M = i v[(L+M)(L-M+ l)], (27.13) (L1JM,M-1 = -(L11)M-1,M = -iiv[(L+M)(L-M+l)]. ( 1) Al representar los elementos de matriz prescindimos, para simplificar, de todos los índices respecto de los cuales dichos elementos son diagonales (entre ellos, del índice L). (2) La elección del signo en esta fórmula está de acuerdo con la elección de los factores de fase en las funciones propias del momento cinético. 104 Momento cinético En las fórmulas análogas para el momento cinético de una partícula hay que escribir/, m en vez de L, M. § 28. Funciones propias del momento cinético Dar los valores de 12 y lz no determina por completo la función de onda de una partícula. Esto se ve ya sin más que tener en cuenta que las expresiones de los operadores correspondientes a estas magnitudes en coordenadas esféricas contienen solamente los ángulos () y <p de modo que sus funciones propias pueden contener un factor arbitrario función de r. Consideraremos aquí tan sólo la parte angular de la función de onda, parte característica de las funciones propias del momento cinético. La representaremos por Yzm((), <p) y la normalizaremos mediante la condición J IYzml (do = 2 do = 1, sen () d() dcp es el elemento de ángulo sólido). Como demostrarán los cálculos que siguen, el problema de determinar las funciones propias comunes a los operadores i 2 y Íz admite la separación de las variables (} y <p y dichas funciones pueden buscarse en la forma: (28.1) donde <I_>ni(</>) son las funciones propias del operador lz determinadas por la fórmula (27.3). Dado que las funciones <I>m están ya normalizadas por la condición (27.4), las funciones 0zm deben normalizarse según la condición 1T fo l0iml senB dB 2 = l. (28.2) Las funciones Y1111 con valores diferentes de I o de m resultan ser automáticamente ortogonales entre sí: 2'11 '1T JJ Yi·m·*YzmSenB dBd<f> = Ozz'Omm', (28.3) o o en tanto que funciones propias de los operadores de momento cinético correspondientes a diferentes valores propios. Por separado son también ortogonales las funciones <I>m(</>) (véase (27.4)) en tanto que funciones propias del operador lz correspondientes a sus diferentes valores propios m. Las funciones 0zm(O), en cambio, no son de suyo funciones propias de ninguno de los operadores del momento cinético; son ortogonales dos a dos para diferentes /, pero no para diferentes m. 105 Funciones propias del momento cinético El método más directo para el cálculo de las funciones buscadas consiste en resolver sin más el problema de hallar las funciones propias del operador i2 escrito en coordenadas esféricas (fórmula (26.16)). La ecuación 1211' = 12 11, se escribe: Olp) 1 8~ 1 82if, - - senO- +--+l(l+l)if, sena 88 88 sen28 8</>2 O. = Substituyendo en esta ecuación 1P en la forma (28.1 ), obtenemos para la función 0 1m la ecuación dE>zm) ---E>zm+l(l+l)E>zm m d ~senB--1- 2 2 sen8 d() d() sen 8 = O. (28.4) Esta ecuación es bien conocida por la teoría de armónicos esféricos. Posee soluciones que cuMplen las condiciones de finitud y uniformidad para valores positivos enteros l > ]ml, de acuerdo con los valores propios del momento cinético obtenido antes siguiendo el método matricial. Las correspondientes soluciones son los polinomios asociados de Legendre Pj(cos 8) (véase el § e de los apéndices matemáticos). Normalizando la solución mediante la condición (28.2), obtenemos (1): E>zm(8) Se supone aquí que m = (- lril v'[i(2l+ 1)(/-m)!/(l+m)!]Pr(cos 8). > O. Para valores m negativos, definimos ~lm (28.5) por la relación (28.6) es decir, 0 1m con m < O viene dada por la fórmula (28.5) en la que hay que escribir lm[ en vez de m y prescindir del factor (- 1}fil. Parn m = O los polinomios asociados de Legendre se llaman, simplemente, polinomios de Legendre P, (cos O); tenemos: (28.7) Desde el punto de vista matemático, las funciones propias del momento cinético resultan no ser así sino los armónicos esféricos normalizados de determinada manera. En virtud de (27.3) y (28.6), las funciones que difieren en el signo de m están ligadas entre sí por la relación (-l)l-m Yi,-m = Yzm*· (28.8) He aquí algunas observaciones relativas a las funciones propias del momento cinético. Para l = O (de modo que también m = O) esta función se reduce a una constante. Con otras palabras, las funciones de onda de los estados de una partícula (1) La elección del factor de fase no queda determinada, claro está, por la condición de normalización. La definición (28.5), que utilizaremos en este libro, es la más natural desde el punto de vista de la teoría general de composición de momentos cinéticos (véase cap. XIV), y difiere de la que se suele aplicar en el factor il. 106 Momento cinético con momento cinético igual a cero dependen sólo de r, es decir, poseen simetría esférica. Para un m dado, los valores l a partir de 1ml ordenan los sucesivos valores propios de la magnitud l en orden creciente. Por lo tanto, teniendo en cuenta el teorema general relativo a los ceros de las funciones propias (§ 21 ), podemos concluir que las funciones E>1m se anulan para l - [mi valores distintos del ángulo-O; con otras palabras, dicha función posee como líneas nodales / - [mi «paralelos» de la esfera. En cuanto a las funciones angufares completas, si las elegimos con los factores reales cos mcf, o sen mcf, en vez de e+im</> (1-), tendrán además como líneas nodales !mi « meridianos »; el número total de lineas nodales será, por lo tanto, igual a /. Finalmente, veamos cómo es posible calcular las funciones E>zm siguiendo el método matricial. El problema se resuelve de manera análoga a como se calcularon en el § 23 las funciones de onda de un oscilador. Partiremos de la igualdad (27.8) Í+Yú = O. Teniendo en cuenta la expresión (26.15) para el operador l y substituyendo Yu = (211)-leil<l>E)u( 8), obtenemos para E>u la ecuación d0zz/d8-l ctg 8 0n = O, sen1 de donde E>u = const. O. Determinando la constante a partir de la condición de normalización, se obtiene: 0n = (-i)1v[!(2l+ 1)!]2-l(l/l!)senzo. (28.9) Recordando (27.12), escribamos luego: 1-Yl,m+l = {L)m,m+1Yzm = v[(l-m)(l+m+ 1)] Y,,,.. La aplicación reiterada de esta fórmula da: v[(l-m)l/(l+m)!] Yzm = [(2Z)!J-1/2(Lt-mlí,. El cálculo del segundo miembro de la igualdad se efectúa fácilmente con ayuda de la expresión (26.15) para el operador f_, según la cual /_[J(B)etm'P] = eHm-ll'Psenl-mO d(jsenmO)/d(cos 8). 1 ( ) Cada una de estas funciones corresponde a un estado en el que lz no tiene un valor determinado, pero puede tener, con igual probabilidad. los valores +m. 107 Elementos de matriz de vectores La aplicación reiterada de esta fórmula da: (L)l-meiltf,0n = eiffl<flsen-mo d1-m(senl8. 0u)/d(cos8)Z-"'. Finalmente, teniendo en cuenta estas relaciones y la expresión (28.9) para tenemos la fórmula J[ 0 1m(8) = (-i)' (2l+ l)(l+m)!] 2(1-m)! 1 az-m sen 218, 21l!senm8 d(cosO)'-m 0u, ob- (28.10) que coincide con (28.5). § 29. Elementos de matriz de vectores Consideremos de nuevo un sistema aislado de partículas (1), y seafuna magnitud física escalar cualquiera que lo caracterice y J el operador que corresponde a esta magnitud. Todo escalar es invariante respecto de una rotación del sistema de coordenadas. Por consiguiente, el operador escalar no varía en una rotación, es decir, conmuta con el operador de rotación. Pero sabemos que el operador de una rotación infinitesimal coincide, salvo un factor constante, con el operador del momento ciné• tico, de modo que J {/, la:} = {/, l (y también 11 } = {/, l,J = o (29.1) {!, t2} = O). De la conmutabilidad de / con el operador del momento cinético se sigue que la matriz de la magnitud f en una representación en la que L 2 y Lz son diagonales, será también diagonal respecto de los índices L, M. Convendremos en representar por n el conjunto de los demás índices que determinan el estado del sistema. Demostremos que los elementos de matriz f:/tL no dependen del valor del índice M. Para ello valgámonos de la conmutabilidad de y L+ J fl+-l+f = o. Escribamos el elemento de matriz de esta igualdad correspondiente a la transición n, L, M ~ n', L, }.{ - 1. Teniendo en cuenta que la matriz de la magnitud L+ posee solamente elementos con n, L, M ~ n, L, M -1, obtenemos: nLM n'LM nLM nLM-1 f n'LM(L+)n'L,M-1-(L+)nL,M-t/n'L ,M-l = O, 1 y dado que los elementos de matriz de la magnitud L+ no dependen del índice n, encontramos: nLM nL,M-1 f n'LM = / n'L,M-1, ( 1) Todos los resultados de este párrafo valen también para una partícula en un campo con simetría central (en general, siempre que se conserve el momento cinético total del sistema). 108 Momento cinético de donde s~ sigue que todos los t:ftf.t con valores de M distintos (y con los restantes índices iguales) son iguales entre sí. A sí, pues, los elementos de matriz de la magnitud f distintos de cero serán: nLM f n'LM donde n', L. f':h nL =fn'L, (29.2) representa una cantidad que depende de los valores de los índices n, Si se aplica este resultado al propio hamiltoniano, obtenemos la independencia ya conocida de la energía de los estados estacionarios respecto de M, es decir, la degeneración de orden 2L+ 1 de los niveles energéticos. Sea ahora A una magnitud física vectorial característica del sistema aislado. En una rotación del sistema de coordenadas (en particular, en la aplicación del operador de rotación infinitesimal, es decir, del operador del momento cinético) las componentes del vector se transformarán entre sí. Por consiguiente, y como resultado de la conmutación de los operadores li con los operadores Á ¡, deben obtenerse de nuevo componentes del mismo vector Ái. Puede encontrarse qué componentes se obtienen precisamente observando que, en el caso particular en que A es el vector posición de una partícula, deben obtenerse las fórmulas (26.3). Encontramos así las reglas de conmutación {lx, Áx} = O, {Lx, Áy} = iÁz, {Lx, Áz} = -iÁ11 , {29.3) (las restantes se obtienen a partir de éstas por permutación circular de los índices x, y, z) o bien {Lt, Á1c} = ieilclAz. {29.4) Estas relaciones permiten obtener una serie de resultados relativos a la forma de las matrices de las componentes de un vector A (M. BoRN, W. HEISENBERG, P. JoRDAN; 1926). Ante todo, es posible encontrar reglas de selección que determinan para qué transiciones los elementos de matriz· pueden ser diferentes de cero. Sin embargo, no nos detendremos aquí en efectuar los correspondientes cálculos, bastante pesados, dado que más adelante veremos (§ 107) que estas reglas son, en realidad, consecuencia directa de propiedades generales de las transformaciones de las magnitudes vectoriales y se pueden obtener a partir de ellas, en esencia, sin cálculo ninguno. Con todo, daremos aquí estas reglas sin demostración. Los elementos de matriz de todas las componentes de un vector pueden ser diferentes de cero tan sólo para aquellas transiciones en las que el momento cinético L varía como máximo en una unidad: L -+L o L±l. (29.5) 109 Elementos de matriz de vectores Además, se cumple otra regla de selección que prohibe las transiciones entre dos estados cualesquiera con L = O; esta regla es consecuencia, evidentemente, de la completa simetría esférica de los estados con momento cinético nulo. Las reglas de selección relativas a la proyección M del momento cinético son diferentes para las diferentes componentes del vector. Así, pueden ser diferentes de cero los elementos de matriz para las transiciones acompañadas de las siguientes variaciones del valor M: para A+ = Ax+iAy, para A- = Ax-iA11 , M~M-1, M~M+l, para Az, M~M. ) (29.6) Además, es posible determinar de forma general la dependencia de los elementos de matriz de un vector respecto del número M. Estas importantes fórmulas, utilizadas con frecuencia, las damos aquí también sin demostración, puesto que también ellas resultan ser, en realidad, un caso particular de relaciones más generales (relativas a cualquier magnitud tensorial)) que se obtendrán. en el § 107. Los elementos de matriz distintos de cero de la magnitud Az se determinan por las fórmulas siguientes: M (A )nLM _ AnL z n'LM - v[L(L+1)(2L+1)] n'L' _ (A )nLM z n',L-1,M - J L2-M2 (A )n,L-1,M _ z n' LM - J L2-M2 AnL L(2L-1)(2L+ 1) n',L-1 , (29.7) An,L-1 L(2L-1)(2L+ 1) n' L · En ellas A:fi., son cantidades que no dependen de M (1), y están ligadas entre sí por las relaciones de « hermiticidad » nL -_ (An' L')* , A n'L' nL (29.8) (1) Estas cantidades se llaman a veces elementos de matriz reducidos. Que en las fórmulas (29.7), (29.9) aparezcan denominadores que dependen de L resulta de la notación general introducida en el§ 107. La conveniencia de que aparezcan estos denominadores se manifiesta, en particular, en la forma simple que adopta la fórmula (29.12) para los elementos de matriz del producto escalar de dos vectores. Observemos que para el propio vector L los elementos de matriz reducidos son Lf = y[L(L+ 1)(2L+ 1)], L L-1 L = LLL-1 = 0, dado que la matriz Lz es diagonal respecto de L y los elementos diagonales son iguales a M. Estos mismos valores se obtienen también. naturalmente, comparando las fórmulas (29.9) y (27.12). 110 Momento cinético que se siguen inmediatamente del carácter hermítico del operador Az. Mediante estas mismas cantidades A:!-¡_,. se determinan los elementos de matriz de las magnitudes A_ y A+. Los elementos de matriz no nulos de A_ son iguales a L M l (A-)!,L'M- = L M l (A-):,.·L-1.M = J(L-M+l)(L+M) L L(L+l)(2L+l) A:,L' J(L-M+ l)(L-M) L L(2L-1)(2L+ 1) A!',L-l' (A )n,f,-1,M-1 = _ J( - n LM (29.9) L+M-l)(L+M) An,f-1 L(2L-1)(2L+ 1) n L · Los elementos de matriz de A+ no exigen fórmulas especiales, ya que en virtud del carácter real de Ax y Ay tenemos (recordando (11.9)): 'L'M' ]*. (A+)!,LM L'M' = [(A-)!LM (29.10) Es útil destacar una fórmula que expresa los elementos de matriz del escalar A. B (A, B, son dos magnitudes físicas vectoriales) en función de los coeficientes A!fL'' B!fL, que aparecen en las fórmulas (29.7-9); en las aplicaciones hay que considerar a menudo productos de este tipo. El cálculo se efectúa de una manera A A cómoda expresando el operador A • B en la forma: (29.11) Es evidente desde luego, que la matriz de A. B (como la de todo escalar) es diagonal respecto de L y M. El cálculo con ayuda de las fórmulas (29.7-9) conduce al resultado nLM _ l (A· B)n'LM - - - 2L+l ¿ nL n" L" An"L"Bn'L ' (29.12) n",L" (L" toma los valores L, L ± 1). PROBLEMAS 1. Determinar los elementos de matriz (respecto de las funciones propias del momento cinético) del versor n del vector posición de una partícula. Solución. Los elementos de matriz de un vector polar relativo a una sola partícula son distintos de cero únicamente para las transiciones /-* l ± 1 (véase§ 30). Su dependencia con relación al número cuántico m se determina mediante las fórmulas generaies (29.7-9), de modo que basta 1 calcular el coeficiente 1 = (n:- )* en dichas fórmulas). Para ello determinemos, por ejemplo, el elemento de matriz de llz = cos O: n:_ Paridad de un estado J( 21 111 1 _ 1; + l) n/- = (cosB)lt·º = [ 01-1,0• cose. 0rosen8 dO, 21 con las funciones E>zo de (28.7) (la integral se calcula mediante la fórmula (107.15) con /1 = 1, = / - 1). Como resultado se obtiene: /2 n~-l = iy'l. 2. Promediar el tensor niuk - ! ,5uc (donde n es el versor del vector posición de una partícula) respecto de un estado con valor absoluto dado del vector l, pero sin que se dé su dirección (es decir, para lz indeterminado). Solución. El valor medio buscado es un operador que puede expresarse en función sólo del operador l. Supongámoslo de la forma esta es la forma más general de un tensor simétrico de segundo orden con traza nula que se puede construir a partir de las componentes de Para determinar la constante a multipliquemos la igualdad que precede a la izquierda por ft y a la derecha por Í~ (sumando respecto de i y k). Dado que t. el vector n es perpendicular al vector ñl = r x p, se tiene ntf, = O. El producto lddk[k = (12) 2 lo substituiremos por el valor propio / 2(/+ 1)2 , y el producto l,lklilk lo transformaremos mediante las relaciones de conmutación (26. 7) de la siguiente manera: Mklilk = MiMk-ieiklMzlk = (i2)2-iietkZii(lzlk-Mz) = (i 2)2+!eiklelkmÍtÍm = (i2)2-i2 = (hemos utilizado la relación eikiemkz resultado: = 12(1+ 1)2-l(l+ 1) 2oim). Después de una simple reducción obtenemos el a= -1/(21-1)(21+3). § 30. Paridad de un estado Además de la translación del sistema de coordenadas (utilizada en el § 15) y la rotación del mismo (utilizada en el § 26), existe todavía una transformación que deja invariante el hamiltoniano de un sistema aislado (1). Es la llamada transformación de inversión, que consiste en cambiar simultáneamente el signo de todas las coordenadas. En mecánica clásica la invariancia de la función de HAMILTON respecto de la inversión no conduce a ninguna ley de conservación. En mecánica cuántica, en cambio, la situación es otra. (1) Lo mismo vale para un sistema que se encuentre en un campo central. 112 Momento cinético Representemos por Í el operador inversión; el resultado de aplicarlo a una función consiste en el cambio de signo de todas las coordenadas. La invariancia de fi respecto de la inversión significa que 111-líJ = o. (30.1) El operador Í conmuta también con los operadores del momento cinético: (30.2) (en la inversión cambian de signo tanto las coordenadas como los operadores de derivación respecto de las mismas, con lo cual los operadores del momento cinético no varían). Es fácil encontrar los valores propios I del operador inversión, determinados por la ecuación N, =N. Para ello observemos que la doble aplicación del operador Í conduce a la identidad, ya que todas las coordenadas recobran su signo inicial. Con otras palabras, tenemos J2«f¡ = J 2«fa = «fa,es decir 12 = 1, de donde 1 = ±1. (30.3) De esta manera las funciones propias del operador inversión o no cambian en modo alguno al aplicarles este operador, o cambian de signo. En el primer caso la función de onda (y el correspondiente estado) se llama par, y en el segundo, impar. La igualdad (30.1) expresa, por consiguiente, la ley de conservación de la paridad: si el estado de un sistema aislado posee una determinada paridad (es decir, si es par o si es impar), esta paridad se conserva en el tiempo. Las igualdades (30.2) significan físicamente que el sistema puede poseer valores determinados de L y M y a la vez una determinada paridad del estado. Además, cabe afirmar que todos los estados que difieren únicamente en el valor de M poseen la misma paridad. Esto se puede demostrar partiendo de la relación l+l-ll+ = o .exactamente de la misma manera como se obtuvo (29.2). Al aplicar la inversión, las magnitudes escalares o no cambian ( escalares en sentido estricto) o cambian de signo (en cuyo caso se las llama pseudoescalares) (1). Si la magnitud física f es un escalar en sentido estricto, su operador conmutará con Í: (30.4) 1/-JJ = o. (1) Pseudoescalar lo es, por ejemplo, el producto escalar de un vector axil y un vector polar. Paridad de un estado 113 De aquí se sigue que si la matriz de 1 es diagonal, también lo será la matriz de f con relación al índice que indica la paridad del estado, es decir, sólo son diferentes de cero los elementos de matriz que corresponden a las transiciones u-+ u, g-+ g (con los índices g y u designamos los estados pares e impares, respectivamente). Para el operador de una magnitud pseudoescalar, en cambio, tenemos 1/ = o bien 1/+/1 = O; - /1, (30.5) Í anticonmuta con/ El elemento de matriz de esta igualdad para la transición g -+ges 1(1(/f(I(/+ f,u,I(I(/ = O, lgy = 1, se tendrá /yy = O (prescindimos de todos los índices salvo del índice que indica la paridad). Análogamente encontramos que también fuu = O. Resulta así que en la matriz de una magnitud pseudoescalar sólo pueden ser distintos de cero los elementos no diagonales respecto del índice de paridad (transiciones con cambio de paridad). y dado que Para las magnitudes vectoriales se obtienen resultados análogos. Los operadores de un vector polar (1) anticonmutan con Í y sus matrices (en una representación en la que Í es diagonal) contienen solamente elementos para las transiciones con cambio de paridad. Los operadores de un vector axil, por el contrario, conmutan con 1 y sus matrices contienen solamente elementos para transiciones sin cambio de paridad. Conviene indicar también otra manera de obtener estos resultados. Por ejemplo, el elemento de matriz de un escalar f para la transición entre estados de paridad diferente es la integral fuu = f 'Pu*/ift0 dq, donde la función 1J}g es par, y la "Pu, impar. Al cambiar de signo todas las coordenadas, el integrando cambia de signo si f es un escalar en sentido estricto; por otra parte, la integral extendida a todo el espacio no puede variar al cambiar la manera de designar las variables de integración. De aquí se sigue que / 11 g = - fug, es decir, fug == O. Determinemos la paridad del estado de una partícula con momento cinético l. La inversión (x -+ - x, y-+ - y, z -+ - z) equivale, en coordenadas esféricas, a la transformación r -+ r, () -+ 1T-8, cf, -+ 11'+</,. (30.6) La dependencia de la función de onda de la partícula con relación a los ángulos viene dada por la función propia del momento cinético Y 1m que, salvo una cons(1) Los vectores ordinarios, es decir, los vectores polares, cambian de signo en la inversión. En cambio, los vectores axilcs (por ejemplo, el producto vectorial de dos vectores polares) no cambian en dicha transformación. 114 Momento cinético tante que no nos interesa aquí, es de la forma P,m(cos 8)eim4>. Al cambiar <p en <f,+n, el factor eim</J queda multiplicado por (- l)ID, y al cambiar() en n - 6, Pr(cos 8) se transforma en P ,m( -cos 8) = ( -1) z-mP r( cos 8). Así, pues, dicha función queda multiplicada por el número (- 1)1 (que no depende de m, de acuerdo con lo dicho antes), es decir, la paridad del estado con valor dado l es 1=(-l)l. (30.7) Vemos así que todos los estados con l par son pares y los de l impar son impares. Una magnitud física vectorial asociada a una partícula individual puede tener elementos de matriz tan sólo para transiciones del tipo l --+ l, l ± 1 (§ 29). Teniendo esto presente y comparando la fórmula (30. 7) con lo antes dicho respecto del cambio de paridad en los elementos de matriz de los vectores, llegamos a la conclusión de que los elementos de matriz de un vector polar son distintos de cero tan sólo para las transiciones con l --+ l ± 1, mientras que para un vector axil lo son únicamente para las transicic;mes /--+ l. § 31. Suma de momentos Consideremos un sistema constituido por dos partes débilmente acopladas entre sí. Si se prescinde por completo de la interacción, para cada una de ellas vale la ley de conservación del momento cinético, y el momento cinético total L del sistema se puede considerar como suma de los momentos L 1 y L 2 de sus partes. En la aproximación siguiente, al tener en cuenta la débil interacción, las leyes de conservación de L 1 y L 2 no se cumplen ya rigurosamente, pero los números L 1, L 2 que determinan sus cuadrados siguen siendo « buenos » números cuánticos, adecuados para una descripción aproximada del estado del sistema. Gráficamente, esto es, considerando los momentos cinéticos clásicamente, cabe decir que en esta aproximación L 1 y L 2 giran en torno de la dirección de L conservando invariable su módulo. Ligado con la consideración de tales sistemas se plantea el problema de la ley de composición de los momentos cinéticos. ¿Cuáles son los valores posibles de L para valores dados de L 1 y L 2? En lo que concierne a la ley de composición de las componentes del momento cinético, esta ley es evidente: del hecho de ser lz = l1z+l2z, se sigue M = M 1 +M 2 • Para los operadores de los cuadrados de los momentos cinéticos, en cambio, no existe una relación tan simple, y para deducir su ley de composición razonaremos de la siguiente manera. Si se elige como sistema completo de magnitudes físicas el formado por las mag- 115 Suma de momentos nitudes L¡2, Ll, L 1z, L 2z (1), cada estado vendrá determinado por los valores de los números L 1, L 2 , M 1 , M 2 • Para valores dados de L 1 y L 2 , los números M 1 y M?. toman, respectivamente, 2L1 + 1 y 2L2 + 1 valores, de forma que en total se tienen (2L1 + 1) . (2L2 + 1) estados diferentes con los mismos valores L 1 , L 2 • Las funciones de onda de los estados en esta representación las designaremos por <f,L1L 2M 1M 2. En vez de las cuatro magnitudes indicadas es posible elegir como sistema completo las cuatro magnitudes L¡2, L 22, L 2, Lz. Cada estado se caracterizará entonces por los valores de los números L 1, L 2 , L, M (las correspondientes funciones de onda las designaremos por 1PLiL 2LM). Para valores dados de L 1 y L 2 deben existir, claro está, al igual que antes (2L1 + 1) · (2L 2 + 1) estados diferentes, es decir, para valores dados de L 1, L 2 , el par de números L, M puede tomar (2L 1 + 1) · (2L 2 + 1) pares de valores. Estos valores se pueden determinar mediante las siguientes consideraciones. a A cada valor L corresponden 2L + 1 diferentes valores posibles M desde +L. El valor mayor posible de M en los estados <p (para L 1 y L 2 dados) es M = - L L1+ +L 2 , que se obtiene para M 1 = L 1, M 2 = L 2 • Por ello, también el valor máximo de M en los estados 1P, y por cons guiente, también el valor máximo de L, es L 1 +L 2 • Además, se tienen dos estados <p con M = L 1 + L 2 - 1, el que corresponde a M 1 = = L 1, M 2 = L 2 - 1 y el que corresponde a M 1 = L1 - 1, M 2 = L2 . En consecuencia, deben existir también dos estados 1P con estos valores de M; uno de ellos es el estado con L = L1 + L 2 ( y M = L - 1), y el otro, evidentemente, con L = L 1 + L 2 - 1 (y M = L). Para el valor M = L 1 +L2 - 2 existen tres estados 1P distintos - con los siguientes pares de valores (M1, M 2 ) : (L1, L2 - - 2), (L1 - 1, L 2 - 1), (L1 - 2, L 2 ). Esto significa que junto a los valores L = L 1 +L2 , L = L 1 +L2 - 1, es también posible el valor L = L1 +L 2 - 2. Este razonamiento se puede repetir exactamente de la misma forma mientras al disminuir en 1 el valor de M aumente en 1 el número de estados con valor dado M. Es fácil ver que ello ocurrirá hasta que M alcance el valor [L 1 - L 2 ]. Si se sigue disminuyendo el valor de M, el número de estados deja de crecer, manteniéndose igual a 2L2 + 1 (si L 2 < L1). Esto significa, que [L1 - L 2 es el menor valor posible de L. l Llegamos así al resultado de que, para valores dados de L 1 y L 2, el número L puede tomar los valores (31.1) es decir, en total 2L2 + 1 valores diferentes (suponiendo que L 2 < L 1). Es fácil com- (1) Y todo un conjunto de otras magnitudes que, con las cuatro indicadas, formen un sistema completo. Estas magnitudes complementarias no representan papel alguno en las consideraciones que siguen, y para simplificar las expresiones no hablaremos de ellas, conviniendo en llamar sistema completo el de las cuatro magnitudes indicadas. 116 Momento cinético probar que efectivamente se obtienen (2L1 + 1) (2L2 + 1) pares distintos de valores de los números M, L. En relación con esto importa hacer notar que (si se prescinde de los 2L + 1 valores distintos de M para un L dado) a cada uno de los valores posibles de L (31.1) corresponde solamente un estado. Este resultado se puede representar gráficamente mediante el llamado modelo vectorial. Si se introducen dos vectores L 1 , L 2 de longitudes L 1 y L 2 , los valores de L se representan como longitudes de valor entero de los vectores L que se obtienen como resultado de la suma vectorial de L 1 y L 2 ; el valor máximo de L, (L1 + L 2), se obtiene cuando L 1 y L 2 son paralelos, y el menor, IL1 - L 2 /, cuando dichos vectores son anti paralelos. La regla de composición de los momentos cinéticos que acabamos de obtener ofrece la posibilidad, claro está, de componer un número arbitrario de momentos cinéticos (mayor que 2) mediante aplicación reiterada de la misma. En los estados con valores determinados de los momentos cinéticos L 1, L 2 y del momento cinético total L, poseen también valores determinados los productos escalares L 1 L 2 , L L 1 , L L 2 • Es fácil encontrar estos valores. Para calcular L 1 • L 2 escribamos L = L¡ +L2 o bien, elevando al cuadrado y pasando términos de un miembro a otro: 2L1 • L 2 = 1}-L¡2-L22 • Substituyendo los operadores que aparecen en el segundo miembro de la igualdad por sus valores propios, obtenemos el valor propio del operador que figura en el primer miembro de la misma: L 1 • L 2 = i{L(L+l)-L1 (L1 +l)-LiL2 +l)}. (31.2) De manera análoga se encuentra: (31.3) Consideremos ahora la regla de composic,ión de paridades. Conforme sabemos, la función de onda 'Y del sistema constituido por dos partes independientes es igual al producto de las funciones de onda 'Y1 y 't·2 de estas partes. Es claro, por consiguiente, que si estas dos últimas poseen la misma paridad (es decir, si ambas cambian, o ambas no cambian, de signo al cambiar de signo todas las coordenadas), la función de onda de todo el sistema será par. Recíprocamente, si 'Y1 y W 2 poseen paridad diferente, la función 'Y será impar. Esta regla, claro está, se generaliza inmediatamente al caso de un sistema constituido por un número arbitrario n de partes independientes. Si éstas se encuentran en estados de paridades determinadas, definidas por los correspondientes valores propios /i = ± 1 del operador Ji, la paridad I del estado de todo el sistema viene Suma de momentos 117 definida por el producto (31.4) En particular, si se trata de un sistema de partículas que se encuentran en un campo central (pero pudiéndose considerar débil la interacción de las partículas entre sí), se tendrá Ji = ( - IYi, donde li es el momento cinético de la i-ésima partícula (véase (30.7)), de forma que la paridad del estado del sistema total viene dada por (31.5) Hay que subrayar que el exponente representa aquí la suma algebraica de los momentos cinéticos li que, en general, difiere de su « suma vectorial», es decir, del momento cinético L del sistema. Si un sistema aislado se desintegra en partes (bajo la acción de las fuerzas internas), deben conservarse su momento cinético total y su paridad. Esta circunstancia puede hacer imposible la desintegración de un sistema, incluso cuando ésta es posible desde el punto de vista energético. Consideremos, por ejemplo, un átomo que se encuentra en un estado par de momento cinético L = O y que energéticamente se podría desintegrar en un electrón libre y un ion en un estado impar con igual momento cinético L = O. Es fácil ver que esta desintegración de hecho no puede tener lugar (como suele decirse, dicha desintegración está prohibida). En efecto, en virtud de la ley de conservación del momento cinético, el electrón libre debería poseer también momento cinético igual a cero y encontrarse por ello en un estado par ([ = ( - 1) º = + 1); pero en este caso el estado del sistema ion +electrón libre sería impar, mientras que el estado inicial del átomo era par. CAPÍTULO V MOVIMIENTO EN UN CAMPO CENTRAL § 32. Movimiento en un campo central El problema-del movimiento de dos partículas en interacción mutua se puede reducir en mecánica cuántica al_problema de una sola partícula, de manera análoga a como se puede hacer en la mecánica clásica. El hamiltoniano de dos partículas (de masas m1 , m2) cuya energía de interacción viene dada por la ley U(r) (res la distancia entre las partículas), es de la forma: (32.1) donde ,6.1, ,6.2 son los operadores de Laplace relativos a las coordenadas de las partículas. Introduzcamos en vez de los vectores posición de las partículas r 1 y r 2 nuevas variables R y r: r = r 2 -ri, R = (m1r 1 +m:ar2)/(m1 +m2); (32.2) r es el vector de posición relatíva de las partículas y R el vector posición de su centro de masas. Un cálculo simple conduce al resultado (32.3) (.6.R y ,6. son los operadores de Laplace correspondientes a los vectores R y r, respectivamente; m1 +m2 es la masa total del sistema, m = m1m2/(m1 +mJ es la llamada masa reducida). Así, pues, el hamiltoniano se descompone en la suma· de dos partes independientes. En consecuencia, cabe buscar V'(r1, rJ en forma de producto c/>(R)1P(r), donde la función cf,(R) describe el movimiento del centro de masas (como movimiento libre de una partícula de masa m1 +mJ, y V'(r) describe el movimiento relativo de las partículas (como movimiento de una partícula de masa m en un campo central U= U(r)). La ecuación de Schrodinger para el movimiento de una partícula en un campo central es de la forma 119 MmJimiento en un campo central 6y,+(2m/ñ2)[E-U(r)]y, O. = (32.4) Utilizando la conocida expresión del operador de Laplace en coordenadas esféricas, escribiremos esta ecuación en la forma: 1 º( 8y,) +- - -8~sen8-8y,) +--8 y,] +-[E-U(r)]y, 2m = O. (32.5) sen 8cf, li -r2 8r 1[ r2- r2 &r 1 2 1 sen(} 88 2 (} 88 2 2 Si se introduce aquí el operador f2 (26.12) del cuadrado del momento cinético, obtenemos (1-): /i2[ 1 8 ( 2ol/J) ¡2 ] -r +-tf, 2m r 2 87 87 72 + U(r)l/J = E,t,. (32.6) En el movimiento en un campo central, el momento cinético se conserva. Consideremos los estados estacionarios en los que 12 y lz tienen valores determinados. Con otras palabras, determinemos las funciones propias comunes a los operadores fl, i 2 y fz. La condición de que 'f/J sea función propia de los operadores 12 y lz determina su dependencia angular. De acuerdo con ello, buscaremos la solución de la ecuación (32.6) en la forma: if, = R(7) Yim(O, cf,), (32.7) donde las funciones Y1m (O, cf,) se definen mediante las fórmulas del § 28. Dado que ¡2y 1m =l(l+l)Yim, para la «función radial» R(r) obtenemos la ecuación 1 d ( 2dR) -- 72 d7 7 - d7 l(l+l) 2m ---R+-[E-U(7)]R = O. 72 /i2 Observemos que esta ecuación no contiene el valor lz a la degeneración de orden 2/ + 1 del nivel ya conocida. (1) = m, lo que corresponde Si se introduce el operador de la componente radial Pr del impulso en la forma: PrY' = A 1 0 -ili- -(rtf,) 787 1) 8 . = -i~ ( -+y,, OT (32.8) T el hamiltoniano se escribe: que coincide formalmente con la función de Hamílton clásica en coordenadas esféricas. 120 Movimiento en un campo central Pasemos ahora a investigar la componente radial de las funciones de onda. La substitución (32.9) R(r) = x(r)/r reduce la ecuación (32.8) a la forma: 2 d x [2m l(l+ 1)] -+ -(E-U)--X= 2 2 dr h r2 O. (32.10) Si la energía potencial U(r) es finita para todo valor de r, también la función de onda deberá ser finita en todo el espacio, incluido el origen de coordenadas, y, por consiguiente, también su parte radial R(r). De aquí se sigue que x(r) debe anularse para r= O: = O. x(O) (32.11) En realidad, esta condición subsiste también (véase § 35) para un campo que tiende a infinito para r ~ O. La condición de normalización para la función radial R(r) viene dada por la integral f~IR] 2 r 2 dr y, por consiguiente, para la función x(r), por la integral J~lx[ 2 dr. La ecuación (32.10) coincide formalmente con la ecuación de SCHRODINGER para el movimiento unidimensional en un campo con energía potencial h2 l(l+ 1) lfz(r) = U(r)+---, 2m r 2 (32.12) igual a la suma de la energía U(r) y un término nl(l+ 1)/2mr 2 2 = h212/2mr2, que se puede llamar energía centrifuga. De esta manera, el problema que plantea el movimiento en un campo central se reduce a un problema de movimiento unidimensional en un intervalo limitado por uno de sus extremos (la condición de con, torno para r = O). En el caso del movimiento unidimensional en un intervalo limitado por un ex tremo, los niveles de energía no son degenerados(§ 21). Por lo tanto, podemos deci que si se da el valor de la energía, la solución de la ecuación (32.10), es decir, la part radial de la función de onda, queda completamente determinada. Teniendo tambié1 en cuenta que la parte angular de la función de onda está completamente definid por los valores l y m, llegamos a la conclusión de que en el movimiento en un camp central la función de onda viene unívocamente determinada por los valores E, /, n Con otras palabras, la energía, el cuadrado del momento cinético y la componente• Movimiento en un campo central 121 del mismo constituyen un sistema completo de magnitudes físicas para ese tipo de movimiento. La reducción del problema del movimiento en un campo central a un problema en una dimensión permite aplicar el teorema de oscilación (véase§ 21). Ordenemos los valores propios de 1a energía (del espectro discreto) para un valor dado de / en orden creciente, numerándolos mediante números ordinales nr de forma que al nivel más bajo le corresponda el número nr = O. En estas condiciones, nr determina el número de nodos de la parte radial de la función de onda para valores finitos de r (sin contar el punto r = O). El número nr se llama número cuántico radial. En el movimiento en un campo central, el número l se llama a veces número cuántico acimutal, y m, número cuántico magnético. Para designar los estados con diferentes valores del momento cinético l de una partícula se adopta en general el siguiente simbolismo: los estados se representan mediante letras del alfabeto latino de acuerdo con la correspondencia: 1=01234567 .. . spdfghik .. . El estado normal para el movimiento de una partícula en un campo central es siempre un estado-s; en efecto, para l =/= O la parte angular de la función de onda posee siempre nodos, mientras que la función de onda del estado normal no puede poseerlos en modo alguno. Cabe también afirmar que el menor valor propio de la energía para un valor de l dado crece al aumentar l. Ello se sigue de que la existencia de un momento cinético va ligada con la adición al hamiltoniano de un término esencialmente positivo li2l(l+l)i2mr~, que crece al aumentar l. Determinemos la forma de la función radial cerca del origen de co01denadas. Supondremos que lím U(r)r 2 = O. r-+o Escribamos R(r) como serie de potencias crecientes de r, conservando para valores pequeños de r únicamente el primer término del desarrollo; con otras palabras, representemos R(r) en la forma R = const. X r 5• Substituyendo esta expresión en la ecuación d(r2 dR/dr)/dr-l(l+ l)R = O, que se obtiene a partir de (32.8) multiplicando esta última por r 2 y pasando al límite para r -* O, se encuentra s(s+ 1) = l(l+ 1). De aquí se sigue 122 Movimiento en un campo central s=l o s=-(1+1). La solución con s = - (/ + 1) no satisface las condiciones necesarias, ya que tiende a infinito en r = O (recordemos que l > O). Queda así la solución con s = !, es decir, cerca del origen de coordenadas las funciones de onda de los estados con valor dado de l son proporcionales a r1: R, ~ constante X r. (32.13) La probabilidad de que la partícula se encuentre a una distancia del centro comprendida entre r y r+dr viene dada por r 2IR( 2 y es así proporcional a , 2<z+ 1 ). Vemos, pues, que dicha probabilidad tiende a cero en el origen de coordenadas tanto más rápidamente cuanto mayor es el valor/. § 33. Movimiento libre (coordenadas esféricas) La función de onda de una partícula que se mueve libremente Y,p = constante xt!.i/A)p,r describe un estado estacionario en el que la partícula posee un impulso determinado p (y una energía E= p 2/2m). Consideremos ahora los estados estacionarios de una partícula libre en los que ésta posee no sólo un valor determinado de la energía, sino también valores determinados del módulo y de la proyección del momento cinético. En vez de la energía convendrá introducir el número de onda k = p/li = v(2mE)/li. (33.1) La función de onda del estado con momento cinético l y su proyección m tiene la forma: 'Pklm = Rki(r) Yím(O, <f,), (33.2) donde la función radial se determina mediante 1a ecuación ,, 2 , Rki +-Rki T +[ k -1(1+1)] - - Rk, = r 2 2 (la ecuación (32.8) con U(r) == O). Las funciones de onda nes de normalización y de ortogonalidad dos a dos: O "Pklm (33.3) satisfacen las condici- La ortogonalidad mutua paré;l diferentes/, l' y m, m' queda garantizada por las funciones angulares. Las funciones radiales, en cambio, deben normalizarse por la condición Movimiento libre ( coordenadas esféricas) jr Rk'iR1c, dr = 8(k'-k). 2 123 (33.4) o Si se normalizan las funciones de onda no « en la escala k », sino « en la escala de energía», es decir, mediante la condición jr RE,¡RE, dr = 8(E'-E), 2 o según la fórmula general (5.14) tendremos: REl = R1ci v'(dk/dE) = (1/li) v'(m/k)R1ci• (33.5) Para l = O la ecuación (33.3) se puede escribir: d 2(rR ) _ _1c0_+k2rR1c0 dr2 = O; su solución, finita parar= O y normalizada por la condición (33.4) (cf. (21.9)), es: R'lcO = J=senkr. r (33.6) 'TT Para resolver la ecuación (33.3) con l =/= O, haremos la substitución: (33.7) Rki = rxki· Para Xkl se tendrá la ecuación Xki"+2(l+1)xki'/r+k 2xk, = O. Si se deriva esta ecuación respecto de r, se obtiene: 2(1+ 1) 2(1+ 1)] Xk1 +--xkz" + [ k2 - - - Xki' = 0. , r2 1 " Mediante la substitución Xkz' = rxk,z+i, esta ecuación toma la forma: Xk,1+1 "+2(!+2) ' k2 ---xk,z+1 + Xk,i+1 r = o, que coincide exactamente con la que debe satisfacer la función Xk,l+i· De este modo las sucesivas funciones lkl están ligadas entre sí por la relación (33.8) y por consiguiente 124 Movimiento en un campo central 1d Xkz = ( ; dr )l Xko, donde Xko = Rko se define por la fórmula (33.6) (esta expresión puede todavía multiplicarse, claro está, por una constante arbitraria). Así, pues, para las funciones radiales del movimiento libre de una partícula obtenemos en definitiva la siguiente expresión: 2 J Rki=(-l)l rl (l d)Z senkr -- -kl r dr -- 7T (33.9) r (el factor k-1 se introduce por razones de normalización - cf. más adelante; factor (- 1) 1 se introduce por comodidad (1)). ';!} Para obtener una expresión asintótica de la función radial (33.9) a grandes distancias, observemos que el término que menos rápidamente decrece para r-+ oo se obtiene derivando l veces la expresión sen kr: Dado que )l d ( d --senkr = ksen(kr-i-1r), ... , - - senkr = k1 sen(kr-!{1r), dr dr 1 ( ) Las funciones Rki se pueden expresar mediante funciones de Bessel de orden semientero en la forma: Rki = v(k/r)]z+112(kr). He aquí algunas de las primeras funciones Rko = (33.9a) Rki: 2 senkr -k--, 7T kr J cos kr] R kl -_ J2-k [senkr ----2 7T (kr) kr ' Rk2 = J:k[(2--~)senkr 3 7T (kr) kr 3 coskr]· (kr) 2 Movimiento libre ( ooordenadas esféricas) 125 obtenemos la siguiente expresión asintótica: Rkz ~ 2 sen(kr-!hr) J - (33.10) · 1T T La normalización de. las funciones Rk1 se puede efectuar mediante sus expresiones asintóticas conforme se explicó en el § 21. Comparando la fórmula asintótica (33.10) con la función normalizada Rko (33.6), vemos que las funciones Rkt, con los coeficientes elegidos en (33.9), están efectivamente normalizadas cual deben. Cerca del origen de coordenadas (r pequeño) tenemos, conservando solamente el término con la más baja potencia de r: d 1d )lsenkr -_ (1- ( r dr r r dr )'¿"' {-l)n_k2n+1,-2n __ (2n+l)! n..o 9 1 21 ~ 1 d )' k' + r (-l)Z ( ; dr {2l+1)1 ... 21 = {-1 )1k2l+l2.4 _ __ (21+ l)! = (-1)1k21+1/1.3 ... (2l+1). Por consiguiente, cerca del origen las funciones R ,.., kl = 2 - J 1r Rkl son de la forma (1): lt-+1 ,.Z (21+ 1)!! ' (33.11) de acuerdo con el resultado general (32.13). En algunos problemas es necesario considerar funciones de onda que no satisfacen las condiciones ordinarias de finitud, sino que corresponden a un flujo de partículas que parten del origen de coordenadas. La función de onda que describe este flujo de partículas con momento cinético l = O se obtiene si en vez de la « onda esférica estacionaria» (33.6) se toma la solución en forma de « onda esférica divergente»: {33.12) En el origen de coordenadas esta función tiende a infinito. (1) El símbolo !! representa el producto de todos los números naturales de igual paridad hasta el número dado inclusive. 126 Movimiento en un campo central Análogamente, un flujo de partículas que se dirigen hacia el centro del campo (con momento cinético l = O), se representa mediante una función de onda cuya forma es la de una « onda esférica convergente »: Rk0- = Ae-ikr¡r. En el caso general de un momento cinético l ecuación (33.3) en la forma (1): r = (-1)1A- Rki± (33.13) =/= O obtenemos la solución de la (i- -)l- . d e±ikr 'Jl, r dr (33.14) r Una expresión asintótica para esta función es Rki* ~ Ae±iCkr-l1r;2>¡r. (33.15) En cambio, cerca del origen de coordenadas toma la forma: Rkl± "' - A (2l-l)l! '/(, ,--z-1 • (33.16) Normalicemos estas funciones de modo que correspondan a la emisión (o a la absorción) de una partícula por unidad de tiempo. Observemos para ello que, a grandes distancias, cada porción pequeña de la onda esférica puede considerarse como plana y que la densidad de flujo de probabilidad en aquélla es igual a i = V'l/J'l/J*, donde v = kli/m es la velocidad de la partícula. La normalización se determina mediante la condición § i df = 1 , donde la integración se extiende a una superficie esférica de radio r grande, es decir, J ir 2 do = 1, donde do es el elemento de ángulo sólido. Conservando la condición de normalización de las funciones angulares como antes, debemos igualar, por consiguiente, el coeficiente A de la función radial a A = 1/ vv = v(m/kli). (33.17) Una expresión asintótica análoga a la (33.10) vale no solamente para la parte radial de la función de onda del movimiento libre, sino también para el movimiento (con energía positiva) en un campo cualquiera que disminuye con rapidez suficiente al crecer la distancia (2). A grandes distancias, es posible prescindir en la ecua(1) Estas funciones se pueden expresar mediante la función de Hankel (33.14a) (de especie 1 ó 2, según el signo sea valores de r es: e±i(kr-l1rJ2) [ ± _ Rkz 2 ( ) - +o A r --:-). El desarrollo asintótico de las funciones 1 l(l+ 1) (l-1)l(l+ 1)(1+2) =F 1! 2ikr + 2! (2ikr)2 Rki para grandes ] =F ··· · Como se demostrará en el § 123, el campo debe disminuir más rápidamente que 1/r. Movimiento libre ( coordenadas esféricas) 127 ción de Schrodinger tanto del campo como de la energía centrífuga, con lo que queda la ecuación aproximada 1 d2(rR ) _ _ _k_Z +k2Rkl T = o. dr2 Su solución general es (33.18) donde o1 es una constante (el corrimiento de fase), y el factor común se ha elegido de acuerdo con la normalización de la función de onda « en la escala k » (1). La constante de fase o1 se determina mediante la condición de contorno (finitud de Rk1 para r -+ O) para lo que hay que resolver la ecuación de SCHRODINGER exacta, y no se puede calcular de forma general. Los corrimientos de fase o1 son, claro está, funciones tanto de l como de k y constituyen una importante característica de las funciones de onda del espectro continuo. PROBLEMAS 1. Determinar los niveles de energía para el movimiento de una partícula con momento cinético I = O en un pozo de potencial central: U(r) = -U0 porr Solución. de < a, U(r) = Oporr > a. Para l =Olas funciones de onda dependen sólo der. Dentro del pozo la ecuación es de la forma: SCHRODINGER 1 d2 2 --:-:Cn/i)+k if, = O, 2 T dr 1 k = ¡;v'[2m(U0 -IEI)]. r,, La solución finita para r = O será senkr if,=A-. T Para r > a tenemos la ecuación 1 d2 --(rip)-K2tp = Ü, T dr2 1 K = -v(2mlEI). ñ La solución que tiende a cero en el infinito será: 1 ( ) El término - ln/2 en el argumento del seno se ha introducido a fin de que cuando no existe campo sea óz = O. Dado que el signo de la función de onda carece de importancia, las fases óz se determinan salvo un múltiplo nn (y no 2nn); por ello sus valores se pueden siempre limitar al intervalo comprendido entre O y n. 128 Movimiento en un campo cent-:-al tf, = A'e-KT/r. La condición de continuidad de la derivada logarítmica de np en r k ctg ka = = a nos da = - v'[(2mU0/lí 2)-k2 ], -K (1) o bien ± v'(n2/2ma 2 U0)ka. senka = (2) Esta ecuación determina en forma implícita los niveles de energía buscados (deben tomarse aquellas raíces de la ecuación para las que ctg ka < O, conforme se deduce de (1)). El primero de estos niveles (el nivel con l = O) es a la vez el más bajo de todos los niveles energéticos, es decir, corresponde al estado normal de la partícula. Para una profundidad U0 demasiado pequeña del pozo de potencial, no existe ningún nivel de energía negativo, la partícula no puede ser «retenida» por el pozo. Esto se ve fácilmente teniendo en cuenta la ecuación (2) y con ayuda de la siguiente construcción gráfica. Las raíces de una ecuación de la forma ± sen x = cxx se representan por los puntos de intersección de la recta y= cxx con la curva y = ± sen x, debiéndose considerar solamente aquellos puntos de intersección en los que ctg x < O; los correspondientes arcos de las curvas y = ± sen x se representan en la fig. 9 mediante líneas de trazo continuo. Vemos que para valores demasiado grandes de oi: (demasiado pequeños de U0 ) no existen tales puntos de intersección. El primero de ellos aparece cuando la recta y = cxx toma la posición Oa, es decir, para ex = 2/n y se encuentra para x = n/2. Haciendo ~ = ñ/v'(2ma2 U0 ), x = ka, obtenemos a partir de aquí y para la mínima profundidad del pozo tal que aparezca el primer nivel negativo, la expresión (3) Esta cantidad es tanto mayor cuanto menor es el radio del pozo a. La posición del primer nivel E 1 en el momento en que aparece se determina a partir de ka = n/2 y es igual a E 1 = O, como era natural esperar. A medida que aumenta la profundidad del pozo, baja también el nivel normal E 1• a y / / - / ' / \ ' ' ,_ ....,-<enx ' / FIG. 9 2. Determinar el orden de los niveles energéticos con diferentes valores del momento cinético len un pozo de potencial muy profundo (Uo ~ ñ.2jma 2 ) (W. ELSASSER, 1933). = la función 1P tienda Solución. La condición en la frontera del pozo exige que para U0 ---+ a cero (véase § 22). Escribiendo la función de onda radial dentro del pozo en la forma (33.9a), obtenemos la ecuación Movimiento libre ( coordenadas esféricas) 129 ]z+1;2(ka) = O, cuyas raíces determinan la posición de los niveles a partir del fondo del pozo (Uo-lEI = ñ2k2/2m) para diferentes valores de /. El orden en que se colocan, partiendo del estado fundamental, resulta ser el siguiente : 1s, 1p, 1d, 2s, 1/, 2p, 1g, 2d, 1h, 3s, 2/, .... El número delante de la letra ordena de manera creciente la sucesión de niveles con igual valor de l (1). 3. Determinar el orden en que aparecen los niveles con diferentes valores de I a medida que crece la profundidad del pozo U0 • Solución. En el momento en que aparece por primera vez, el nuevo nivel posee la energía E = O. La correspondiente función de onda en la región fuera del pozo y que tiende a cero para r-+ = es Ri = const x ,-(l+l) (solución de la ecuación (33.3) con k = O). De la continuidad de Ri y R'i en el límite del pozo se sigue, en particular, la continuidad de la derivada (r 1+1Rl)', de donde se deduce, en el presente caso, para la función de onda dentro del pozo la siguiente condición: (rl+IRz)' =O para r = a. Esta ecuación es equivalente (2) a la condición de que se anule la función R1_ 1 y, teniendo en cuenta (33.9a), obtenemos la ecuación ]z-112(ay(2mUo)/~) = O; para 1 = O hay que substituir la función J¡_ ! por la función cos. De aquí resulta el siguiente orden de aparición de nuevos niveles al crecer U0 : 1s, 1p, 1d, 2s, 1/, 2p, 1g, 2d, 3s, 1h, 2/, .... Obsérvese que las diferencias en el orden de los niveles con relación al caso del pozo profundo se manifiestan solamente para niveles relativamente altos. 4. Determinar los niveles de energía del oscilador espacial (es decir, de una partícula en el campo U = ~ mw 2r 2), la multiplicidad de su degeneración y los valores posibles del momento cinético orbital en los correspondientes estados estacionarios. Solución. La ecuación de SCHRODINGER para una partícula en el campo U= !mw 2(x 2 +y2 +z2 ) admite,la separación de variables, que conduce a 'tres ecuaciones del tipo correspondiente a un oscilador lineal. Por consiguiente, los niveles de energía son: El orden de degeneración del n-ésimo nivel es igual al número de descomposiciones de n en suma de tres números enteros positivos (incluido el valor O)(ª); dicho número es igual a Esta notación es la adoptada para los niveles de las partículas en un núcleo (véase cap. XVI). De acuerdo con (33.7-8) tenemos (r-lR 1)',...., r-lRr+i· Dado que la ecuación (33.3) no cambia al substituir l por - / - 1, tenemos también (rl+lR_¡_ 1)' == rt+ 1 R_1. Finalmente, puesto que las funciones R_1 y R 1_1 , satisfacen la misma ecuación, obtenemos en definitiva (rl+ 1 Rz)' ,...._, rl+ 1 R1_1, relación que se utiliza en el texto. ( 3) Con otras palabras, éste es el número de maneras posibles de distribuir n bolas idénticas entre tres urnas. ( 1 ) ( 2) 130 Movimiento en un campo central l(n+ l)(n+2). Las funciones de onda de los estados estacionarios son (1) donde a: = v'(mw/ñ) (m es la masa de la partícula). Al cambiar -el signo de una coordenada, el polinomio Hn queda multiplicado por (- 1)1'; Por consiguiente, la paridad <le la función (1) es (-t)n1+n2+na = (-t)n. Formando las combinaciones lineales de estas funciones para un valor dado de la suma n1 + n2 + n3 = n, se pueden construir las funciones 'Pnlm = constante X e-a 2 r 2 /2rn0 1m(8)e±imrf>, (2) donde m = O, 1, ... , l, y l toma los valores O, 2, ... , n para n par y 1, 3, ... , n para n rmpar; esto último es evidente comparando la paridad (- l)n de las funciones (1) y la paridad (-1)1 de las funciones (2), que deben ser iguales. Se determinan así los valores posibles del momento cinético orbital que corresponden a los niveles energéticos considerados. El orden de sucesión de los niveles del oscilador espacial (con la misma notación que en los problemas (2) y (3)) es, por lo tanto, la siguiente: (ls), (lp), (ld, 2s), (lf, 2p), (lg, 2d, 3s), ... , donde dentro de un paréntesis se encierran los estados degenerados de igual energía. § 34. Desarrollo de una onda plana Consideremos una partícula libre que se mueve con impulso determinado p = kh en el sentido positivo del eje z. La función de onda de esta partícula tiene la forma: if, = constante X eikz. Desarrollemos esta función en funciones de onda 'Wklm del movimiento libre con valores del momento cinético determinados. Dado que en el estado considerado la energía posee un determinado valor E = k 2 li,2/2m, es claro que en el desarrollo que se busca aparecerán solamente funciones con el mismo valor de k. Además, puesto que la función eikz posee simetría axil en torno del eje z, en su desarrollo pueden aparecer solamente funciones que no dependan del ángulo cf,, es decir, funciones con m = O. Así, pues, debe ser: donde los a1 son constantes. Substituyendo las expresiones (27.3), (28. 7), (33.9) para las funciones <1>, e, R, obtenemos: eikZ = )l senkr¿" CiPi( 8) (r)l(l -d cos l-0 k r dr kr (z = r cos 8), 131 Desarrollo de una onda plana donde C1 son otras constantes. Estas últimas se determinari sin dificultad comparando los coeficientes de (r cos fJ)n en los desarrollos de ambos miembros de la igualdad en potencias de r. En el segundo miembro de ésta, un término de dicho tipo aparece únicamente en el n-ésimo sumando; para l > n el desarrollo de la función radial comienza con potencias de mayor grado en r, y para l < n el polinomio Pt(cos O) contiene potencias menores de cos O. El término con cos1 f) en Pt(cos O) tiene por coeficiente (2!)!/21(/!) 2 (véase la fórmula (c, 2)). Utilizando también la fórmula (33.11), encontramos el término que nos interesa del desarrollo del segundo miembro de la igualdad, (21)! (kr cos 8)1 (-l)'C,-2,-(l!-)2-(2-l+-1)-!I° En el primer miembro, el término correspondiente (en el desarrollo de eikr cos O) es (ikr cos 8)1/l!. Igualando estas dos cantidades, encontramos C1 = (- i)1(2l + 1). Obtenemos así en definitiva el desarrollo buscado: eikZ = " (-i)'(2l+ 1)Pi(cos 8) (')'(1 ¿ - -d)' senkr --. z-o k r dr kr (34.1) Para grandes distancias este desarrollo toma la forma asintótica: eikz 1 ¿ i (2l+ l)Pz(cos8)sen(kr-i11r). kr z-o ~- 00 1 (34.2) Normalizaremos la función de ~mda eikz igualando a la unidad la densidad de corriente de probabilidad, es decir, de forma que corresponda a un flujo de partículas (paralelo al eje z) a través de la superficie unidad tal que por ella pase una partícula por unidad de tiempo. Es fácil ver que esta función es tp = v-I/2eikz = v(m/kfi)eikz, (34.3) (ves la velocidad de las partículas). Multiplicando ambos miembros de la igualdad (34.1) por v'(m/kñ)e introduciendo en el segundo miembro las funciones normalizadas "P±klm = R±k1(r)Y1m(O, cp), obtenemos: El cuadrado del módulo del coeficiente de "P--klo (o de 1P+k10 ) en este desarrollo determina, de acuerdo con las reglas generales, la probabilidad de que una partícula del flujo que se dirige hacia el origen (o que diverge de él) posea un momento cinético l 132 Movimiento en un campo central (con relación al origen de coordenadas). Dado que la función de onda eikzJV v corresponde a un flujo de partículas de densidad igual a la unidad, dicha «probabilidad» posee las dimensiones del cuadrado de una longitud; se puede representar intuitivamente como valor del « área de impacto» (en el plano x, y), área a la que tiene que ir a parar la partícula incidente si su momento cinétic0 es igual a/. Representando esta cantidad por a1, tenemos: ª' = 11'(21+ 1)/k = 11'(Aj211')2(2l+ 1), 2 (34.4) (A es la longitud de onda de De Broglie de la partícula). Para grandes valores de / la suma de las áreas de impacto correspondientes al intervalo M de valores l (tal que 1 ~ f:,.[ ~ l) es igual a: "" ~ Al 17' crz ~ -211:!l k2 lJi2 = 21r-lll. p2 Substituyendo la expresión clásica del momento cinético lil = llamado parámetro de impacto) esta expresión se transforma en pp (donde e es el 211'pllp, que coincide con la expresión clásica. No se trata aquí de un hecho casual: veremos más adelante que para grandes valores de l el movimiento es cuasiclásico (véase capítulo VII). § 35. «Caída» de una partícula hacia un centro de fuerzas Para explicar ciertas características peculiares del movimiento en mecánica cuántica, es útil estudiar un caso que, a decir verdad, no tiene un sentido físico inmediato: el movimiento de una partícula en un campo cuya energía potencial se hace infinita en un cierto punto (el origen de coordenadas) de acuerdo con la ley U(r) ~ -{3/r 2 , f3 > O; la forma del campo lejos del origen de coordenadas no nos interesa aquí. Vimos en el § 18 que es éste un caso intermedio, en cierto sentido, entre aquellos casos en los que &e tienen estados estacionarios en sentido ordinario, y aquellos otros en los que tiene lugar una « caída » de la partícula al origen de coordenadas. Cerca del origen de coordenadas, la ecuación de ScHRODINGER en el caso considerado será la siguiente: R" +2R'/r+yR/r2 = O, (35.1) (R(r) es la parte radial de la función de onda), donde se ha introducido la constante y = 2mfJ/li2 -l(l+ 1) (35.2) y se ha prescindido de todos los términos de orden inferior en 1/r; el valor de la ener- «Caída» de una partícula hacia un centro de fuerzas 133 gía E se supone finito y, por consiguiente, también se prescinde en la ecuación del término correspondiente. Busquemos para R una expresión de la forma R ,...., ,s; se obtiene entonces para s la ecuación de segundo grado s(s+ l)+y = O, que posee las dos raíces S¡ = -}+ y(¡-y), S2 = -!- v(¡-y). (35.3) Para continuar el análisis conviene proceder de la siguiente manera. Tracemos alrededor del origen de coordenadas un pequeño entorno de radio rO y substituyamos en él la función -y/r 2 por la cantidad constante-y/rl. Determinando las funciones de onda en este campo «cortado», veamos qué se obtiene al pasar al límite para 'º~o. Supongamos primero que y < i. Entonces s1 y s2 son números reales negativos, siendo además s1 > s2 • Para r > rO la solución general de la ecuación de SCHRODINGER tiene la forma (se trata siempre de valores de r pequeños): (35.4) R = Arª1+Brª1, (A, B son constantes). Parar < r0 la solución de la ecuación R"+2R'/r+yR/r02 = O que es finita en el origen es de la forma: R senkr = C--, k = v'y/r0 • r (35.5) Para r = rO la función R y su derivada R' deben ser funciones continuas. Conviene escribir una de estas condiciones como condición de continuidad de la derivada logarítmica de rR. Esto conduce a la ecuación A(s1 + l)r/1+B(s2 + 1)r0', - - - - - - - - - - = kctgkr0 , Ar0 ªí+l+Br 0 8 .+1 o bien A(s1 + 1)r0 ªi+B(s 2 + 1)r0 '• -------- = Ar/1+Br0ª• v'y ctg v'y. Una vez resuelta respecto de la razón B/ A, esta ecuación conduce a una expresión de Ja forma 134 Movimiento en un campo central (35.6) Pasando ahora al límite r O ~ O, encontramos que B/ A __,,. O (recordemos que s1 > sJ. De esta manera resulta que de las dos soluciones de la ecuación de SCHRODINGER (35.1) que divergen en el origen de coordenadas debe elegirse la que tiende a infinito más lentamente: R Supongamos ahora y> 1/ • 4 S¡ = A/rl•11. (35.7) Las raíces s1 y s2 son entonces complejas: = -}+iv'(y-1), S2 S¡*, Repitiendo los razonamientos anteriores, llegamos de nuevo a la igualdad (35.6), la cual, al substituir los valores de s1 y s2 , nos da: B/A = constantexr/v'<4.,..-1>. (35.8) Para r O ~ O esta expresión no tiende a ningún límite determinado, de modo que es imposible el paso directo al límite para rO ~ O. Teniendo en cuenta (35.8), la forma general de la solución real se puede escribir de la siguiente manera: R = constante xr-1/2 cos( v'(y-i) log(r/ro)+ constante). (35.9) Esta función posee ceros cuyo número crece sin límite al disminuir r 0 • Dado que, de una parte, la expresión (35.9) es válida para la función de onda (y valores de r suficientemente pequeños) cualquiera que sea el valor finito de la energía E de la partícula, y que, de otra parte, la función de onda del estado normal no puede tener ceros, podemos concluir que el « estado normal » de una partícula en el campo considerado corresponde a la energía E - oo. Pero en cualquier estado del espectro discreto la partícula se encuentra esencialmente en una región del espacio en la que E > U. Por lo tanto, para E ~ oo la partícula se encuentra en una región infinitamente pequeña en torno del origen de coordenadas, es decir, tiene lugar la « caída » de la partícula al centro. El campo «crítico» Ucr para el que es justo posible la «caída» de la partícula al centro, corresponde al valor y= !- El menor valor del coeficiente de - 1/r2 se obtiene para l = O, es decir, Ucr = -ñ.'1·/8mr2 • (35.10) De la fórmula (35.3) (para s1) resulta evidente que la solución admisible de la ecuación de SCHRODINGER (cerca del punto en el que U,......, 1/r2) diverge para r ~ O no más rápidamente que 1/V r. Si el campo tiende a infinito más lentamente que 1/r2 para r ~ O, en la ecuación de SCHRODINGER y en el entorno del origen de coordenadas se puede prescindir por completo de U(r) frente a los términos restantes y obtenemos las mismas soluciones que en el caso del movimiento libre, es decir, 1P,...., r 1 (véase§ 33). Finalmente, si el campo tiende a infinito más rápidamente que Movimiento de un campo coulombiano ( coordenadas esféricas) 135 1¡,s con s > 2), la función de onda en el entorno del origen es proporcional a , 1-s1 (véase el problema del § 49). En todos estos casos el producto rtp se anula parar= O. 1/r 2 fcomo - Examinemos ahora las propiedades de las soluciones de la ecuación de ScHRoDINGER correspondiente a un campo que decrece a grandes distancias de acuerdo con la ley U ~ -f.J/r 2 , con independencia de su forma a distancias pequeñas. Supongamos primero que y < !-. Es fácil ver que en este caso puede existir solamente un número finito de niveles de energías negativos (1). En efecto, para la energía E= O la ecuación de ScHRODINGER a grandes distancias es de la forma (35.1) con la solución general (35.4). Pero la función (35.4) carece de ceros (para r =f= O); por consiguiente, todos los ceros de la función de onda radial buscada se encuentran a distancias finitas del origen de coordenadas y su número es, en cualquier caso, finito. Con otras palabras, el número ordinal que corresponde al nivel E = O, que cierra el espectro discreto, es finito. Si, en cambio y > t, el espectro discreto contiene un número infinito de niveles de energía negativos. En efecto, la función de onda del estado con E = O posee a grandes distancias la forma (35.9), con un número infinito de ceros, de modo que el número ordinal correspondiente es, en cualquier caso, infinito. Finalmente, supongamos que el campo es U= -f.J/r 2 en todo el espacio. En estas condiciones, para y > t tiene lugar la << caída » de la partícula. Si, en cambio, y < no existe ningún nivel de energía negativo. En efecto, la función de onda del estado con E = O será en todo el espacio de la forma (35. 7); carece así de ceros a distancia finita, es decir, corresponde al más bajo nivel de energía (para el valor dado de/). ¡, § 36. Movimiento de un campo coulombiano (coordenadas esféricas) Un caso muy importante de movimiento en un campo central lo constituye el movimiento en un campo coulombiano u= ±('/.Ir (ex es una constante positiva). Consideraremos primero la atracción coulombiana, de acuerdo con lo cual escribiremos U= - (f./r. De las consideraciones generales que preceden resulta evidente que el espectro de valores propios negativos de la energía será discreto (con un número infinito de niveles), y que el espectro de energías positivas será continuo. La ecuación (32.8) para las funciones radiales es de la forma: { 1) Se supone que para valores pequeños de r el campo es tal que no puede tener lugar una «caída» de la partícula. 136 Movimiento en un campo central d2R 2 dR l(l+ 1) 2m( ex.) ----R + -2 E+- R = O. dr2 r dr r2 /i r -+- (36.1) Si se trata del movimiento relativo de dos partículas que se atraen, hay que entender por m su masa reducida. En los cálculos relacionados con el campo de Coulomb, es cómodo utilizar en vez de las unidades ordinarias ciertas unidades particulares para la medida de todas las cantidades, unidades que llamaremos unidades coulombianas. Eligiremos así como unidades de masa de longitud y de tiempo, respectivamente, las cantidades: m, li,2/mcx., n3/ma2• Todas las demás unidades se deducen de aquí; así, la unidad de energía será: m('J.2¡n2. A partir de aquí, en este párrafo y en el que sigue utilizaremos siempre (salvo indicación expresa) esas unidades (1). Escribamos la ecuación (36.1) en las nuevas unidades: 2 d R 2 dR l(l+ 1) ( 1) -+- - - - R + 2 E+- R dr rdr r r 2 2 = O. (36.2) Introduzcamos en vez del parámetro E y de la variable r nuevas cantidades n = 1/ v'(-2E), p = 2r/n. (36.3) Para valores negativos de E (que serán los que primero consideraremos) n es un número real positivo. La ecuación (36.2), después de substituir (36.3), toma la forma: 2 p R"+-R'+ [ n l(l+l)] -!+---R p p2 =0 (36.4) (los apóstrofos significan la derivación respecto de e). 1 ( ) Si rn = 9,11 x 10- 2 s ges la masa del electrón y r:,. = e2 (e es la carga del electrón), las unidades coulombianas coinciden con las llamadas unidades atómicas. La unidad atómica de longitud es: li,2f me2 = 0,529 x 10-s cm (el llamado radio de Bohr). La unidad atómica de energía es igual a me4/n2 = 4,36 X 10-11 erg = 27,21 electrón-volts. La unidad atómica de carga es e = 4,80 x 10- ues. El paso a las fórmulas con unidades atómicas se efectúa formalmente haciendo e= 1, m = 1, h = l. Para r:,. = Ze 2 , las unidades coulombianas difieren de las atómicas. 10 Movimiento de un campo coulombiano ( coordenadas esféricas) 137 Para valores pequeños de e, la solución que cumple las condiciones necesarias de finitud es proporcional a e1 (véase (32.13)). Para determinar el comportamiento asintótico de R para grandes valores de e, prescindiremos en (36.4) de los términos con 1/e y 1/(¿2, obteniendo así la ecuación R" = iR, de donde R = e± P/2 • La solución que nos interesa - la que se anula en el infinito se comporta, por consiguiente, para grandes valores de e como e-P/ 2• En estas condiciones, es natural efectuar la substitución R = p1e-pí2w(p), (36.5) con lo cual la ecuación (36.4) toma la forma: pw"+(2l+2-p)w'+(n-l-1)w = O. (36.6) La solución de esta ecuación debe diverger en el infinito no más rápidamente que una potencia finita de e, y para e = O debe ser finita. La solución que satisface esta última condición es la función hipergeométrica confluente w = F(-n+l+l, 21+2, p) (36.7) (véase § d de los apéndices matemáticos) (1). La solución que satisface la condición en el infinito se obtiene únicamente para valores enteros y negativos (o para el valor nulo) de -n+t+I, en cuyo caso la función (36.7) se reduce a un polinomio de grado (n - l - l ). En el caso contrario, dicha solución diverge en el infinito como eP (véase (d, 14)). Llegamos así a la conclusión de que el número n debe ser un entero positivo y tal que, para un l dado: n > l+l. (36.8) Recordando la definición (36.3) del parámetro n encontramos que: E = -1/2n2, n = 1, 2, .... (36.9) Queda así resuelto el problema de determinar los niveles de energía del espectro discreto en un campo coulombiano. Vemos que existe una multiplicidad infinita de niveles entre el nivel normal E 1 = - l y cero. Los intervalos entre cada dos niveles (1) La segunda solución de la ecuación (36.6) diverge para(!-'?- O como (F 2 i-1 • 138 Movimiento en un campo central consecutivos disminuyen al auamentar n; los niveles se adensan a medida que nos acercamos al vafor E= O, valor en el cual el espectro discreto enlaza con el continuo. En unidades ordinarias la fórmula (36.9) tiene la forma siguiente (1): E = - moc2/2h2n2 • (36.10) El número entero n se llama número cuántico principal. El número cuántico radial, definido en § 32, es, en cambio, igual a n., = n-l-1. Para un valor dado del número cuántico principal, el número l puede tomar los valores l = O, 1, ... , n-1, (36.11) en total n valores diferentes. En la expresión (36.9) de la energía aparece sólo el número n. Por consiguiente, todos los estados con valores diferentes de /, pero con iguales valores de n, poseen la misma energía. Así, pues, cada valor propio resulta degenerado, no só}o en relación con el número cuántico magnético m (cual ocurre en todo movimiento en un campo central)f: sino también respecto del número l. Esta última degeneración (calificada de accidental) es específica precisamente del campo coulombiano. A cada valor dado de l corresponden, conforme sabemos, 21 + 1 valores diferentes m. Por lo tanto, la multiplicidad de la degeneración del n-ésimo nivel energético es igual a: ti-1 ~ (21+1) l=O = nª. (36.12) Las funciones de onda de los estados estacionarios se determinan mediante las fórmulas (36.5), (36. 7). La función hipergeométrica confluente con valores enteros de ambos parámetros coincide, salvo un factor, con los llamados polinomios generalizados de Laguerre (véase§ d de los apéndices matemáticos). Por lo tanto, Rni 2Z+1 = constante Xp1e-Pl 2Ln+l (p). Las funciones radiales deben normalizarse mediante la condición j Rni"r dr = 1. 1 o (1) N. BOHR fue el primero en obtener la fórmula (36.10) en 1913, antes de que apareciera la mecánica cuántica. Dentro del marco de esta última, fue deducida por W. PAuu, en 1926, siguiendo el método matricial y por ScHRODINGER, al cabo de unos meses, a partir de la ecuación de ondas. Movimiento de un campo coulambiano (coordenadas esféricas) 139 Su forma final es la siguiente (1): R = 2 J(n-Z-1)!e-r/n - -[(n+l)I]ª nª ni - J 2 1 2 n + (2l+l)! (n+l)l (n-l-1)! (2r) L (2r) -;;- i 2i+1 n+i -;;- (2r)1e-"fnF(-n+l+ 1 21+2 2r/n) · ' ' '(36.13) (para el cálculo de la integral de normalización, véase§ f, integral (f.6)) (2). Cerca del origen de coordenadas Rnl tiene la forma: zl+l Rn1 ~ ,1. - n2+Z(2l+ 1)! J (n+l)f {n-l-1)! • {36.14) rn-le-r /n. (36.15) A grandes distancias, zn Rni ~ { -1 )n-l-1 nn+l v'[(n+Z)! (n-Z-1)!] La función de onda R10 del estado normal disminuye exponencialmente a distancias del orden de r,...., 1, es decir, en unidades ordinarias, del orden de ñ2 /mct.. Los valores medios de las diferentes potencias de r se calculan mediante la fórmula rk = j rk+ 2R,.i'" dr. o 1 ( ) He aquí, en forma explícita, algunas de las primeras funciones Rnz: Ze-", R10 = R20 = (1/ v2)e-rl2(1-!r), R 21 = (1/2 v6)e-rl2r, R 30 R81 (2/3 V3)e--m( = t-}+ ~,2). 2 (8/27 V6)e-r13r( 1-~,), R88 = (4/81 v30)e-r1s,2. ( 2) La integral de normalización se puede calcular también substituyendo la expresión (d. 13) para los polinomios de Laguerre e integrando por partes (de manera análoga a como se calcula la integral (c.11) para los polinomios de Legendre). 140 Movimiento en un campo central La fórmula general para rk se puede obtener mediante la fórmula (f. 7). He aquí algunos de los primeros valores rk (para k positivo y negativo): i = ![3n2 -l(l+1)], r 2 = }n2[5n2 +1-3l(l+l)], r-1 = 1/n2, r- 2 (36.16) = 1/n3(l+}). El espectro de valores propios de la energía positivos es continuo y se extiende de cero hasta infinito. Cada uno de estos valores propios es degenerado con multiplicidad infinita; a cada valor de la energía E corresponde una multiplicidad infinita de estados con valores de l que recorren todos los valores enteros de cero hasta = (y con todos los valores posibles de m, para cada l dado). El número n y la variable rios puros: (! definidos por las fórmulas (36.3) son ahora imagina- n = -i/ v'(2E) = -i/k, p = 2ikr (hemos introducido en vez de la energía el « número de onda » k funciones propias radiales del espectro continuo son de la forma: Rki = e k (21+1)1 (36.17) = V2E). (2kr)le-ikrF(i/k+l+l, 21+2, 2ikr), Las (36.18) donde Ck es un factor de normalización. Dichas funciones se pueden representar en la forma de una integral compleja (véase § d) 1 Rkz = Ci2kr)le-ikr2'1Ti ,C ( 2ikr)-i¡k-l-1 j eE 1--gg-21-2 df, que se extiende al contorno representado en la fig. 10 (1 ). La substitución~ (t+n reduce esta integral a la forma más simétrica: (36.19) = 2ikr Fm. 10 {1) En vez de este contorno se puede utilizar también cualquier otro circuito cerrado que roüee los puntos singulares~= O y~= 2ikr en sentido positivo. Para l entero, la función V(~)= ~-n-l ·(~ - 2ikr)n-l (véase § d) vuelve ai valor de partida al recorrer por completo dicho contorno. 141 Movimiento de un campo coulombiano ( coordenadas esféricas) (el camino de integración rodea en sentido positivo los puntos t = ± expresión resulta inmediatamente que las funciones Rk1 son reales. Rki = Ck (-2kr)-l-l 1T 2 ij , e2ikrt(t+i)iJk-l-1(t-!)-iJk-z-1 dt; n. De esta (36.20) El desarrollo asintótico (d.14) de la función hipergeométrica confluente permite obtener sin más el mismo desarrollo para las funciones de onda Rkl· Los dos términos en (d.14) conducen en la función Rkz a dos expresiones conjugadas complejas y el resultado que se obtiene es: e-1r¡2k {e-i[kr-1r(Z+1)12+(l/k) log2kr] } Rki = Ck--re . G(l+ 1+i/k, i/k-1, -2ikr) . kr r(l+l-i/k) (36.21) Si se normalizan las funciones de onda « en la escala k » (es decir, mediante la condición (33.4)), el coeficiente de normalización Ck es igual a (36.22) En efecto, la expresión asintótica de Rkz para grandes valores de r (primer término del desarrollo (36.21)) tiene entonces la forma: Rki ~ 2l 1 - -sen(kr+- log 2kr-i11T+1i3,), 1TT k J (36.23) o,= argr(l+l-i/k), de acuerdo con la forma general (33.18) de las funciones de onda normalizadas del espectro continuo en un campo central. La expresión (36.23) difiere de (33.18) en el término logarítmico que aparece en el argumento de la función seno; sin embargo, dado que, al aumentar r, In r crece lentamente en comparación con el propio r, la existencia de este término carece de importancia en el cálculo de la integral de normalización, que diverge en el infinito. El módulo de la función r que encontramos en la expresión (36.22) del factor de normalización, se puede expresar mediante funciones elementales. Utilizando las conocidas propiedades de la función r r(z+ 1) = zr(z}, r(z)r(l-z) = 7T/Sen1TZ, tenemos: r(l+ t+i/k) = (l+i/k) ... (l+i/k)(i/k)r(i/k), r(l+l-i/k) = (l-i/k) ... (1-i/k)r(t-i/k), 142 Movimiento en un campo central y también ¡r(l+ 1-i/k)I = [r(l+ 1-i/k)r(l+ 1+i/k)p12 = J?:Il•-1 J(s k 2 +~)senh-t~. k k Por consiguiente (36.24) (para l = O el producto se substituye por la unidad). Las funciones radiales RE1, normalizadas en la « escala de energías», se obtienen a partir de las funciones Rkz dividiendo por Vk: vk= RE,= k-*Rk, (véase (33.5)). El paso al límite para E-+ O (es decir, para k-+ O) permite obtener a partir de REl la función radial correctamente normalizada R 01 para el caso particular de en~rgía igual a cero (la función REz normalizada en la escala de energía se conserva finita y no nula en el límite E -+ O, mientras que Rk1 -+ O para k -+ O). El límite de la serie F(i/k+l+ 1, 21+2, 2ikr) para k-+ O es 2r (2r)' 1 (21+2)11 + (21+2)(21+3)21 ... = (2l+1)1(2r)-l-1/2J2,+1( v(8r]), donde l 2z+ 1 es la función de Bessel de orden 21+ l. El coeficiente Ck (36.24) se reduce, para k-+ O, a Ck ~ 2k-l+112 as k -? O. De aquí se obtiene sin dificultad: R 0, = v(2/r)J2z+1(,v[8r]). (36.25) La forma asintótica de esta función para grandes valores de r es la siguiente (1): R 0, ~ (2/1r2r3) 1! 4 sen( v[Br]-l1r-b). (36.26) 1 ( ) Obsérvese que esta función corresponde a la aproximación cuasiclásica (§ 49) aplicada al movimiento en el intervalo (/ + l )2 ~ r ~ k-2 • Movimiento de un campo coulombiano ( coordenadas esféricas) 143 En un campo de Coulomb repulsivo ( U = rx/ r) se tiene tan sólo un espectro continuo de valores propios positivos de la energía. La ecuación de SCHRODINGER en este campo se puede obtener formalmente a partir de la ecuación que corresponde a un campo atractivo cambiando el signo der. Por lo tanto, las funciones de onda de los estados estacionarios se obtienen inmediatamente de (36.18) aplicando este mismo cambio. El coeficiente de normalización se determina de nuevo por la expresión a -intótica, y se obtiene en definitiva: Rki e, = e k (21+1)! (2kr)leikrF(i/k+l+ 1, 21+2, -2ikr), = j~ke-",..lr(I+ l+i/kll = 2vk v(e21T/k-1) Ilz s-1 J( 1) s2+ k2 . (36.27) La expresión asintótica de esta función para grandes valores de r es de la forma: R., "' J~ ~ kr-l sen( 8i log 2kr-!f.-+8.). = argr(l+l+i/k). (36.28) PROBLEMAS 1. Determinar la. distribución de probabilidades de los diferentes valores del impulso en el estado fundamental del átomo de hidrógeno. Solución (1). La función de onda del estado fundamental es aµ= R10Yoo = (1/v7T)e-r. La función de onda de este mismo estado en la representación-p resulta de aquélla mediante la integral a(p) = (21r)-3/2 f rf,(r)e-tP,r dV (véase (15.10)). La integral se calcula pasando a coordenadas esféricas con el eje polar dirigido en el sentido del vector p; el resultado que se obtiene es ( 2): (1) En los problemas 1 y 2 utilizamos unidades atómicas. Las funciones de onda en la representación-p para los estados excitados en un campo de Coulomb se pueden encontrar en el libro: H. A. BETHE y E. E. SALPETER, Handbuch der Physik 35, 88, Springer, Berlín 1957. Estas funciones fueron analizadas por V. A. FoK y aplicadas por él al cálculo de toda una serie de sumas complicadas (lzv. AN SSSR. ser. fizich., n. º 2, 169, 1935). (2) 144 Movimiento en un campo central 2,v2 a(p) = 7T 1 (1 +p2)2' y la densidad de probabilidad en la representación-p es [a(p)¡ 2 • 2. Determinar el potencial medio del campo creado por el núcleo y el electrón en el estado fundamental del átomo de hidrógeno. Solución. La manera más fácil de determinar el potencial medio 'Pe ·creado por la « nube electrónica » en un punto arbitrario r consiste en hallar la solución con simetría esférica de la ecuación de Poisson para una densidad de carga e = - [1¡.,2[: 1 d2 --(rc/>e) = 4e-2r. r dr2 Integrando esta ecuación, eligiendo las constantes de forma que cf,e(O) sea finita y que cf,e(=) = O, y sumando luego el potencial del campo del núcleo, se obtiene: 4, ~ +ef,e(r) = = (~ + 1).-•,. parar ~ 1 tenemos cf, ,...._, 1/r (campo del núcleo), y para r ~ 1 se tiene el potencial cf, ,...._, e- 2 r (apantallamiento del núcleo por el electrón). 3. Determinar los niveles de energía de una partícula que se mueve en un campo central cuya energía potencial es U = A/r 2 - B/r (fig. 11). U(r) U(r) r FIG. 11 FIG. 12 Solución. El espectro de energías positivas es continuo, y el de energías negativas, discreto; consideremos este último. La ecuación de SCHRODINGER para la función radial es: d R 2 dR 2m( lt 1 A B) -+---+E--l(l+l)---+R = dr2 r dr lt2 2m r2 r2 r 2 2 Introduzcamos la nueva variable p = 2 v(-2mE)r/lt, O. (1) Movimiento de un campo coulombiano ( coordenadas esféricas) 145 y Ja notación 2mA/n2 +l(l+ 1) = s(s+ 1), (2) (3) Bv'(m/-2E)/ñ = n. La ecuación (1) toma entonces la forma: 2 ( R" +-R' + p 1 n s(s+l)) --+---R 4 p p2 = O, que coincide formalmente con (36.4) .. De ello resulta, sin más, que la solución que satisface las condiciones necesarias es: R = p8 e-P/2F(-n+s+ 1, 2s+2, p), donde n - s - l = p debe ser un número entero positivo (o nulo) y s es la raíz positiva de la ecuación (2). De acuerdo con la definición (3), obtenemos, por consiguiente, los niveles de energía: 4. Problema igual que el anterior, pero con U= A/r 2 +Br 2 (fig. 12). Solución. Sólo existe un espectro discreto. La ecuación de ScHRODINGER será la siguiente: d2R 2 dR Zm[ -+ - - + -2 E dr2 r dr h li 2l(l+ 1) 2mr2 A r2 Br2 ]R = O. Introduciendo la variable f = v'(2mB)r2/h y las notaciones l(l+ 1)+2mA/h2 = 2s(2s+ 1), v'(2m/B)E/ñ = 4(n+s)+3, obtenemos la ecuación 3 fR"+-R'+[n+s+!-!f-s(s+i)/flR 2 La solución buscada se comporta asintóticameme para,;-,.. de ,; es proporcional a c;S, donde s es el valor positivo = O. = como e-;'2, y para valores pequeños s = l[-1+ v'{(2l+1)2+8mA/h2 }]. 146 Movimiento en un campo central Por lo tanto, buscaremos la solución en la forma: con lo que se obtiene para w la ecuación de donde siendo n un número entero no negativo. Para los niveles de energía obtenemos, por consiguiente, una multiplicidad infinita de valores uniformemente distribuidos E,. = liv(B/2m)[4n+2+ v{(2l+ 1)2+8mA/li2}], n = O, 1, 2, .... § 37. Movimiento en un campo coulombiano (coordenadas parabólicas) La separación de variables en la ecuación de ScHRODINGER, escrita en coordenadas esféricas, es siempre posible para el movimiento en un campo central cualquiera. En el caso del campo de Coulomb, la separación de variables es también posible cuando se adoptan coordenadas parabólicas. La solución del problema del movimiento en un campo coulombiano en coordenadas parabólicas es útil para el estudio de una serie de problemas en los que una determinada dirección en el espacio resulta ser privilegiada, por ejemplo, debido a la presencia de un campo eléctrico exterior (aparte del coulombiano) (§ 77). Las coordenadas parabólicas ~' 17, <p se definen mediante las fórmulas X = v(fr¡)coscf,, y T = v(x2+y2+z2) = = v(g71)sencf,, Z = t(g-71), }(g+71), (37.1) o, recíprocamente: g = r+z, 71 = r-z, cf, = arctg(y/x); (37.2) ~ y 17 toman valores comprendidos entre O e oo, y <p recorre el intervalo O, 2n. Las superficies ~ = const. y 17 = const. son paraboloides de rotación de eje z y foco en el origen de coordenadas. Este sistema de coordenadas es ortogonal. El elemento de longitud viene dado por la expresión (di)' = ':,, (dg¡•/:,, (d,¡)'H,1(d<fo)', (37.3) Movimiento en un campo coulombiano ( coordenadas parabólicas) 147 y el elemento de volumen es: (37.4) De (37.3) se sigue para el operador de Laplace la expresión 6 4 [ = ,+11 º'o('º'o) + o( ao)] +, 011 11 1 a2 11 acf,2 • 11 (37.5) La ecuación de ScHRODINGER para una partícula en un campo de Coulomb atractivo U= -1/r = -2/(t+TJ) se escribe: 4 [ ,+11 a( ai¡,) o(11oif,)] 1 02i¡, ( 2 ) ag + 011 011 + , 11 ocf,2 +z E+ ,+ 11 if, = º· 'º' (37.6) Busquemos las funciones propias 1P de la forma: (37.7) donde m es el número cuántico magnético. Substituyendo esta expresión en la ecuación (37.6), multiplicada por (~+17)/4, y separando las variables~ y 17, obtenemos para f 1 y A las ecuaciones (37.8) donde los « parámetros de separación » /31, /32 están ligados entre sí por la relación (37.9) Consideremos el espectro discreto de energía (E< O). Introduzcamos en vez de E, ;, r¡ las cantidades n = 1/ v(-2E), PI = ev(-2E) = eJn, = r,/n, P2 (37.10) con lo que obtenemos la ecuación para f 1 : d2f1 +1 df1 [ 1 (lml+l ) -+ -!+--+n1 -2 dp1 P1 dp¡ P1 2 m2 ] --- / 1 = 4p¡2 O, (37.11) Movimiento en un campo central 148 y la correspondiente ecuación para/.¿, habiendo introducido también las notaciones (37.12) De manera análoga a como se procedió en el caso de la ecuación (36.4), se encuentra que / 1 se comporta para grandes valores de (h como· e-iPz, y para valores de g1 pequeños, como ei1".1112 • De acuerdo con esto, buscaremos la solución de la ecuación (37.11) adoptando para ella la forma: /1(P1) = e-P1/2p¡Jmlf2wi(p1), (y análogamente para / 2), con lo que obtenemos la ecuación en w1 P1W1"+(lml+l-p¡)w¡'+n1W1 = O. Esta es de nuevo la ecuación de una función hipergeométrica confluente. La solución que satisface la condición de finitud será: w1 = F(-n 1 , lml+1, p1 ), donde n1 debe ser un número entero no negativo. Así, pues, cada estado estacionario del espectro discreto se determina en coordenadas parabólicas por tres números enteros: los « números cuánticos parabólicos » n1 y n2 y el número cuántico magnético m. Para el número n ( « número cuántico principal») se tiene, en virtud de (37.9) y (37.12): n = n1 +n2+lml+1. (37.13) Para los niveles de energía se obtiene, claro está, el resultado anterior (36.9). Para n dado, el número \m l puede tomar n valores distintos,de O hasta n - 1. Fijados n y Jm\, el número n1 toma n - \mi valores, desde O hasta n - \mi - 1. Teniendo también en cuenta que para un valor dado de !mi es aún posible elegir funciones con m= ± \mi, encontramos que para el valor n dado se tienen en total n-1 2 L (n-m)+(n-0) = n2 m=l estados diferentes - de acuerdo con el resultado obtenido en el § 36. Las funciones de onda 1Pn,u m del espectro discreto deben normalizarse por la condición 2 f lt/in n ml 1 2 ao ao 2fl' 2 dV = t fff lt/in n ml (g+17) dcpdgd17 = l. 2 1 000 Las funciones normalizadas tienen la forma: 2 (37.14) Movimiento en un campo coulombiano ( coordenadas parabólicas) 149 (37.15) donde 1 fpm(p) = - -,, 1m. J(P+lml)!F(-p, lml+l, p)e-P/2plml/2, p.1 (37.16) Las funciones de onda en coordenadas parabólicas, en contraste con las funciones de onda en coordenadas esféricas, no son simétricas respecto del plano z = O. Para n1 > n2 la probabilidad de encontrar la partícula en el semiespacio z > O es mayor que la de encontrarla en el semiespacio z < O, y para n1 < n2 ocurre lo contrario. Al espectro continuo (E> O) corresponde un espectro continuo de valores reales de los parámetros {31 , /3 2 en las ecuaciones (37.8) (ligados, como antes, claro está, por la relación (37.9)). No nos detendremos aquí en escribir las correspondientes funciones de onda, puesto que por lo general no es necesario utilizarlas. Las ecuaciones (37.8), consideradas como ecuaciones de « valores propios» para las magnitudes /31 , /32 , poseen también (para E> O) un espectro de valores complejos /31 , /32 • Las correspondientes funciones de onda se darán en el § 133, párrafo en el que las utilizaremos para resolver el problema de la dispersión en un campo coulombiano. En el movimiento clásico de una partícula en un campo de Coulomb se cumple una ley de conservación específica de este campo (1) A= pxl-r/r = constante. (37.17) En mecánica cuántica, no es posible que las tres componentes de este vector puedan poseer simultáneamente valores determinados, ya que los operadores Áx, Áy, Áz no conmutan entre sí. Cada uno de estos operadores, por ejemplo, el Áz, conmuta (como la comr,onente-z de cualquier vector, véase (29.3)) con l, pero no conmuta con el cuadrado del momento cinético 12, magnitud que se conserva. La existencia de una nueva magnitud que se conserva, pero que no conmuta con otras magnitudes conservativas, conduce (véase § 10) a una degeneración adicional de los niveles, degeneración que constituye la degeneración « accidental » específica del campo coulombiano. La descripción del movimiento en un campo de Coulomb mediante las funciones de onda "Pnzm en coordenadas esféricas, corresponde a estados en los que, junto con la energía, poseen valores dados el cuadrado del momento cinético y su componente-z. En cambio, las funciones de onda VJn n n en coordenadas parabólicas, describen estados estacionarios en los que poseen valores determinados lz y Az, Se puede demostrar que el valor de Az viene determinado en este caso por los números cuánticos n1, n2, n de acuerdo con la fórmula 1 2 (37.18) (1) Véase tomo I, Mecánica,§ 15. CAPÍTULO VI TEORÍA DE PERTURBACIONES § 38. Perturbaciones independientes del tiempo La solución exacta de la ecuación ScHRODINGER se puede encontrar tan sólo en un número relativamente pequeño de los casos más simples. La mayor parte de los problemas de la mecánica cuántica conducen a ecuaciones demasiado complicadas que no se pueden re.solver de manera exacta. Con frecuencia, sin embargo, en las condiciones del problema figuran cantidades de diferente orden; entre ellas pueden encontrarse pequeñas cantidades tales que si se prescinde de ellas, el problema se simplifica hasta el punto de que sea posible su resolución exacta. En estas condiciones, el ·primer paso en la resolución del problema físico planteado consiste en resolver e~actamente el problema simplificado, y el segundo, en el cálculo aproximado de las correcciones determinadas por los términos pequeños de los que se ha prescindido en el problema simplificado. El método general para el cálculo de estas correcciones se llama teoría de perturbaciones. Supongamos que el hamiltoniano del sistema físico dado es de la forma: fl = flo+ P", donde V representa una pequeña corrección ( perturbación) al operador « no perturbado» H0 • En los §§ 38-39 consideraremos las perturbaciones V que no dependen explícitamente del tiempo (lo mismo se supone acerca del operador H0). Las condiciones necesarias para q~e se pueda considerar el operador V como «pequeño» en relación con el operador HO se deducirán más adelante. EI°problema de teoría de perturbaciones para el espectro discreto se puede formular de la siguiente manera. Se supone que las funciones propias 1Pn (o) y los valores propios En <o) del espectro discreto del operador no perturbado H0 se conocen, es decir, que se conocen las soluciones exactas de la ecuación flotf;<o> = E<º>tf;<o> (38.1) Se pide hallar soluciones aproximadas de la ecuación. (38.2) Perturbaciones independientes del tiempo 151 es decir, expresiones aproximadas de las funciones propias 1Pn y de los valores propios En del operador perturbado fi. En este párrafo supondremos que ninguno de los valores propios del operador fJ es degenerado. Además, para simplificar el razonamiento admitiremos que el espectro de valores propios es sólo discreto ;,,todas las fórmulas se generalizan de manera inmediata al caso en que existe un espectro continuo. Es conveniente realizar los cálculos ya desde el principio en forma matricial. Para ello desarrollemos la función incógnita 1P en funciones "Pn (o): (38.3) Substituyendo este desarrollo en (38.2), obtenemos: y multiplicando ambos miembros de esta igualdad por "Pk(o)* e integrando, se encuen- tra: (38.4) Hemos introducido aquí la matriz Vkm del operador de perturbaciones P' definida mediante las funciones no perturbadas 1Pm(o): Vkm = J V'k(O)*Vt/Jm(O) dq. (38.5) Buscaremos los valores de los coeficientes cm y de la energía E en forma de series E = E<0>+E<1>+E<2>+ ... , Cm = cm<0>+cm<1>+cm<2>+ ... , donde las cantidades Eü>, cm<1> son del mismo orden de magnitud que la perturbación V, las cantidades E< 2>, cm<2> son de segundo orden (considerando que V es una magnitud de primer orden), y así sucesivamente. Determinemos las correcciones al n-ésimo valor propio y a la correspondiente función propia, de acuerdo con lo cual haremos: cn (o) = 1, cm(o) = O, m =f= n. Para determinar la primera aproximación, substituyamos en la ecuación (38.4), los valores E= E,/º)+En<1 \ ck = c/0>+ck<ü, conservando solamente los términos de primer orden. La ecuación correspondiente a k = n nos da: (38.6) 152 Teoría de perturbaciones La corrección en primera aproximación al valor propio En (o) resulta así igual al valor medio de la perturbación en el estado "Pn <oJ. La ecuación (38.4) con k =I=- n nos da: ck<1> = Vkn/(En<0>-Ek<0>) para k =I= n, mientras que en <1 > queda indeterminado y debe elegirse de forma tal que la función 1Pn = "Pn (o)+ "Pn <1> resulte normalizada hasta los términos de primer orden inclusive. Para ello se puede hacer en <1 > = O. En efecto, la función V I ,f, (1) 't'n - "" ~ m E mn ,f, (O) (O)_E (O)'t'm n (38.7) m (el apóstrofo en el signo de suma significa que al sumar respecto de m hay que prescindir del término m = n) es ortogonal a 1Pn (o) con lo que la integral de ]1Pn (o)+ 1Pn(l)J 2 difiere de la unidad tan sólo en términos que son de segundo orden. La fórmula (38.7) determina la corrección en primera aproximación a las funciones de onda. De ella se deduce cuál es la condición de aplicabilidad del método de perturbaciones que estamos considerando. Debe cumplirse, en efecto, la desigualdad (38.8) es decir, los elementos de matriz del operador V deben ser pequeños respecto de las diferencias correspondientes entre los niveles de energía no perturbados. Determinemos ahora la corrección de segundo orden relativa al valor propio En (o). Substituyamos para ello en (38.4) E= En <0 )+E1/ 1 >+En <2 >, ck = ck< 0 >+ck<1 >+ck<2 >, y consideremos los términos de segundo orden. La ecuación con k = n nos da En<2>cn<0> = m~' Vnmem<1>, de donde E (2) _ ~' n - L, E m 1V mnl 2 n (OLE (O) (38.9) m (hemos substituido cm <1 > = Vmn/(E,/º>-Em co>), y se ha tenido en cuenta que, en virtud del carácter hermítico del operador V, es Vmn =::f .Vnm*). Obsérvese que la corrección de segundo orden a la energía del estado normal es siempre negativa. En efecto, si En (o) corresponde al valor mínimo, todos los términos en la suma (38.9) son negativos. 153 Perturbaciones imlependientes del tiempo Las aproximaciones siguientes se pueden calcular de manera por completo análoga. Los resultados obtenidos se generalizan de manera inmediata al caso en que el operador Íf O posee también un espectro continuo (limitándonos siempre, como antes, a la perturbación de los estados del espectro discreto). Para ello basta solamente añadir a las sumas relativas al espectro discreto las correspondientes integrales relativas al espectro continuo. Caracterizaremos los diferentes estados del espectro continuo mediante el índice v, que recorre una sucesión continua; convendremos en que dicho índice representa un conjunto de valores de las magnitudes suficientes para una determinación completa del estado (si los estados del espectro continuo son degenerados, cual ocurre casi siempre, dar solamente el valor de la energía no basta para definir el estado) (1 ). Entonces, por ejemplo, en vez de (38, 7) será necesario escribir 'Pn(l) = ~, Lm E 'P V mn n (O)_E (O) m f (O) m + E 'P (O) dv Vvn n (O)_E v v (38.10) ' y análogamente para las demás fórmulas. Conviene indicar también la fórmula que da los valores perturbados de los elementos de matriz de una magnitud física f, calculados, incluyendo los términos de primer orden, mediante las funciones "Pn = "Pn(oJ + "Pn(n, con 11•11( 1 ; dada por (38,7). Es fácil obtener la siguiente expresión: I _ (O) Ínm -fnm En la primera suma es k V ""' + =/= n, L E k I (O) nkJ km I (OLE (O)+ k n en la segunda, k V . ""' L E k I (O) kmJ nk (38.11) (OLE (O) k m =/= m. PROBLEMAS 1. Determinar la corrección de segundo orden "Pn (2 ) a las funciones propias. Solución. Los coeficientes ck( 2l, k =/= n, se calcularán a partir de las ecuaciones (38.4) con k =/= n, incluyendo sólo hasta los términos de segundo orden, y el coeficiente cn< 2> se elegirá de manera que la función 'Pn = 'Pn<ºl+"1n< 1 l+"1n< 2 J resulte normalizada dentro del mismo orden de aproximación. El resultado que se obtiene es: ' ./, (2) 'f'n = ""' ""' Lm ¿k I V V mk 1..2 IV V kn ./, (O)_ ""' r1, WnkWnm 'f'm Lm nn 1..2 I IV mn,/, (O)_!·'· (O)""' n Wnm 2'f'm -'f'n ¿m ¡2 ~ 1;;2 n Wnm 2' (1) En este caso las funciones de onda 1/'I' t()l deben estar normalizadas respecto de la función-ó de las magnitudes v. 154 Teoría de perturbaciones donde hemos introducido las frecuencias 2. Determinar la corrección de tercer orden a los valores propios de la energía. Solución. nemos: Escribiendo en la ecuación (38.4), con k = n, los términos de tercer orden, obte- 2 V nn ""'' 1Vnml L.., m 1::2 2 '" Wmn 3. Determinar los niveles de energía del oscilador lineal anarmónico caracterizado por el hamiltoniano Solución. Los elementos de matriz de x3 y x 4 se pueden obtener inmediatamente aplicando la regla de multiplicación de matrices y teniendo en cuenta la expresión (23.4) para los elementos de matriz de x. Para los elementos de matriz no nulos de x3 se encuentra: (x3)n-3,n = (x3)n,n-a = (li/mw) 3 12 y'[-ln(n-1)(n-2)], (x3)n-1,n = (x3)n,n-1 = (li/mw)312y(9n3/8). Los elementos diagonales en esta matriz son nulos, de forma que no existe corrección de primer orden correspondiente al término cxx3 del hamiltoniano (término considerado como perturbación del oscilador armónico). En cambio, la corrección de segundo orden correspondiente a este término es del mismo orden que la corrección de primer orden relativa al término {Jx 4 • Los elementos de matriz diagonales de x 4 tienen la forma: (x4)n,n = (li/ mw) 2 . f(2n 2 +2n+ 1). Mediante las fórmulas generales (38.6) y (38.9) encontramos finalmente la siguiente expresión aproximada de los niveles energéticos del oscilador anarmónico: En § 39. = )ª(n +n+-3011) +-~32 ( -mwli )2(n +n+i). 15 a.2 ( - /;, liw(n+l)--4 liw mw 2 2 La ecuación secular Pasemos ahora al caso en que el operador no perturbado H0 posee valores propios degenerados. Designaremos por VJn,(0 ), 'lfJn (0 ), ••• las funciones propias que corresponden al mismo valor propio de la energía En(o). La elección de estas funciones, conforme sabemos, no es única, ya que en vez de ellas se pueden elegir un número s de combinaciones lineales independientes cualesquiera de dichas funciones (s es la multiplicidad del nivel deg,nerado En (o)). Sin embargo, dicha elección deja de ser arbitraria si imponemos a, las funciones de onda la condición de que la variación 155 La ecuación secular que en ellas determina la pequeña perturbación aplicada sea a su vez pequeña. Por el momento supondremos que 'Pn <0 >, ifan,< 0 >, ••• , son funciones propias no perturbadas elegidas arbitrariamente. Las funciones correctas que corresponden a la aproximación de orden cero son combinaciones lineales de la forma en <O>ifan (O)+ Cn'<0>ifan,<0>+ •••• Los coefiéíentes de estas combinaciones se determinan, junto con las correcciones de primer orden a los valores propios, de la siguiente manera. Escribamos las ecuaciones (38.4) con k = n, n', ... , substituyendo en ellas en primera aproximaciónE = En< 0 >+E<1 >;y teniendo en cuenta que para las cantidades ck basta limitarse a los valores de orden cero: en = en <0 >, en. = cn.< 0 >, ••• ; cm = O para m '4= n, n', ... Obtenemos entonces o bien ~ n1 (Vnn , -E<% nn ,)en ,<0> = O, (39.1) donde n, n' toman todos los valores que numeran los estados asociados con el valor propio dado no perturbado En(o). Este sistema de ecuaciones lineales homogéneas resP.etto de las cantidades cn<o) tiene soluciones diferentes de cero si se anula el determinante de los coeficientes de las incógnitas. Obtenemos así la ecuación. (39.2) Esta ecuación es de grados respecto de E(l) y posee, en general, s raíces reales distintas. Estas raíces constituyen precisamente las correcciones de primer orden buscadas relativas a los valores propios. La ecuación (39.2) se llama ecuación secular (1). Observemos que la suma de sus raíces es igual a la suma de los elementos de matriz diagonales Vnn, Vn·n·, ... (que es el coeficiente de [E<1 >J s-1 en la ecuación). Substituyendo sucesivamente las raíces de la ecuación (39.2) en el sistema (39.1) c,/0> y se determinan así las funciones propias en la aproximación de orden cero. y resolviendo este último, se encuentran los coeficientes Obsérvese que, como resultado de la perturbación, el nivel de energía inicialmente degenerado d~ja de ser, en general, degenerado (las raíces de la ecuación (39.2) son, en general, diferentes): como se suele decir, la perturbación «rompe» la degeneración. La degeneración puede romperse bien sea del todo, bien tan sólo en parte (en este último caso, como consecuencia de la perturbación resulta una degeneración de multiplicidad menor que la inicial). Puede ocurrir que todos los elementos de matriz correspondientes a las transi(1) Este nombre se ha tomado de la mecánica celeste. 156 Teoría de perturbaciones ciones entre estados n, n', de un mismo nivel energético sean iguales a cero. En este caso se anula la corrección de primer orden a la energía. Calculemos para el mismo la corrección en segunda aproximación. En la ecuación (38.4) con k = n hagamos en el primer miembro de la igualdadE = En< 0 >+E<2 >,y en vez de c11 escriba.mos e,?). En el segundo miembro son diferentes de cero solamente los términos con m -=f= n, n', ... , y dado que cm(o) = O tenemos: E<2>cn (o) = ~ m V nmem (1) • (39.3) En cambio, la ecuación (39.4) con k = m -=/= n, n', ... da, hasta el primer orden de magnitud: [En(O)_Em(O)]cm(l) = ~ V mn' Cn' (O), n de donde e = (1) m ¿ n Vmn' E , n e ,(o>. (O)_E (O) n m Substituyendo este resultado en (39.3), obtenemos: Este sistema de ecuaciones en las en <0> substituye ahora al sistema (39.1); la condición de compatibilidad de estas ecuaciones es "" I VnmV mn' ~E m n (39.4) (O)_E (O) m Por consiguiente, también aquí las correcciones relativas a la energía se calculan como raíces de una ecuación secular en la cual, en vez de los elementos de matriz vn n' aparecen las sumas "" VnmV mn' ~E m n (O)_E (O). m PROBLEMAS 1. Determinar en la aproximación de primer orden las correcciones correspondientes al valor propio, y las funciones correctas en la aproximación de orden cero ,para un nivel doblemente degenerado. Solución. La ecuación (39.2) es aquí de la forma: Vu-E<1> li'."21 l.= o La ecuación secular 157 (los índices 1, 2 corresponden a dos funciones propias no perturbadas elegidas arbitrariamente, V't(o) y v• 2 (0 ), del nivel doblemente degenerado en cuestión). Resolviendo esta ecuación encontramos: (1) Si se resuelven luego las ecuaciones (39.1) con estos valores E(IJ, para los coeficientes que corresponden a las funciones correctas normalizadas en la aproximación de orden cero,i/¡(º>=c1 (0)i/¡1 (0) + c2< 0>iJ,2( 0>, se obtienen los valores (2) 2. Deducir las fórmulas que dan las correcciones de primer orden a las funciones propias y las correcciones de segundo orden relativas a los valores propios. Solución. Supondremos que como funciones tpn(o) se han elegido las funciones correctas de la aproximación de orden cero. La matriz que determinan, Vnn', es diagonal, evidentemente, respecto de los índices n, n' (que se refieren al mismo grupo de funciones del nivel degenerado), y los elementos diagonales Vnn, Vn'n', son iguales a las correspondientes correcciones de la primera aproximación En( 1 >, EnP>, ... Consideremos la perturbación de la función propia "Pn(o), de forma que en la aproximación de orden cero E=En< 0 >, cn< 0 > = 1, cm< 0 >=0, para m-=/=- n. En primeraaproximación,E=En<º>+ Vnn, e,.= 1 +en<~>, c111 = c,,p>. Del sistema general (38.4), escribamos la ecuación con k-=/=- n, n', .. , , conservando en ella los términos de primer orden: de donde (1) Escribamos luego la ecuación correspondiente a k gundo orden: = n', conservando en ella los términos de se- En<1>c n , <1> = V nn , , en , <1>+ mI:" Vnmm , e <1> (en la suma respecto de m se prescinde de los términos con m = n, n', ... ). Substituyendo En< 1 > = Vnn y la expresión (1) para cm( 1 ), obtenemos cuando n'-=/=- n: (2) (El coeficiente cn(i) en esta aproximación es, en cambio, igual a cero). Las fórmulas (1), (2) determinan la corrección tf,11<1 ) = }:;.cm< 1 >if,m<º> de primer orden relativa a las funciones propias. 158 Teoría de perturbaciones Finalmente, escribiendo los términos de segundo orden en la ecuación (38.4) con k = n, obtenemos para la corrección de segundo orden al valor de la energía la fórmula E (2) _ n - "' ~ m ' E Vn m V mn n (O)_E (O)' m (3) que coincide formalmente con (38.9). 3. En el instante inicial t = O el sistema se encuentra en el ,estado 'Pi (o), que corresponde a un nivel doblemente degenerado. Determinar la probabilidad de que en un instante ulterior t el sistema se encuentre én el otro 'estado '1'2 (0 ) asociado a la misma energía; la transición ocurre por la acción de una perturbación constante. Solución. Formemos las funciones correctas en la aproximación de orden cero donde ci, c2 y c1 ', c2 ' son los dos pares de coeficientes definidos por las fórmulas (2) del problema 1 (en todas las cantidades se prescinde de los índices (O) para abreviar). Recíprocamente: Las funciones 'P y 'P' corresponden a estados cuyas energías perturbadas son E+E(1) y E+E( 1 )', donde E(1 ), E( 1)' son los dos valores de la corrección (1) del problema l. Introduciendo los factores temporales, pasamos a la función de onda dependiente del tiempo: e-<ifll,)Et 'I"1 = ' ' [c2'if;e-<i/1i)ECi>t_c2i/;' e-<i/11,)Eh>' '] C¡Cz -C¡ Cz (en el instante t = O es 'Y1 = '1jJ1). Finalmente, expresando de nuevo 'P, 'P' en función de 'Pi, 'P2 obtenemos 'Y1 como combinación lineal de 'Pi, 'P 2 con coeficientes que dependen del tiempo. El cuadrado del módulo del coeficiente de 'P 2 determina la probabilidad buscada de la transición, w12 • El cálculo da o bien, substituyendo las fórmulas (1) y (2) del problema 1: (1) Vemos así que la probabilidad oscila periódicamente con una frecuencia (E< 1 >-E<1 >')/1i. Para tiempos t pequeños en comparación con el correspondiente período, la expresión entre corchetes, Y .con ella la probabilidad w12 , es proporcional a t 2: w 12 = ¡v12¡2t2;n2. Perturbaciones dependientes del tiempo 159 esta fórmula se puede obtener de manera muy sencilla siguiendo el método que se expone en el párrafo siguiente (mediante la ecuación (40.4)). § 40. Perturbaciones dependientes del tiempo Pasemos ahora a estudiar las perturbaciones que dependen explícitamente del tiempo. Es imposible en este caso hablar de correcciones relativas a los valores propios de la energía, ya que cuando se trata de un hamiltoniano dependiente del tiempo (como lo es el operador perturbado.B = B 0 + t\t)),la energía no se conserva, con lo cual no existen estados estacionarios. El problema que aquí se plantea es el de calcular aproximadamente las funciones de onda como combinaciones de las funciones de onda de los estados estacionarios del sistema no perturbado. Aplicaremos para ello un método análogo al conocido método de vanac1on de las constantes para la resolución de ecuaciones diferenciales lineales (P. A. M. DIRAC, 1926). Sean 'fl'k(o) las funciones de onda (incluido el factor temporal) de los estados estacionarios del sistema no perturbado. En estas condiciones, una solución cualquiera de la ecuación de onda no perturbada se puede escribir en forma de suma: 'Y = ~ak'F k(O). Busquemos ahora la solución de la ecuación perturbada in a'Y/ot = (H + -P)'F 0 (40.1) como suma de la forma (40.2) donde los coeficientes del desarrollo son funciones del tiempo. Substituyendo (40.2) en (40.1) y recordando que las funciones 'F/0> satisfacen la ecuación ili 8'Yk<0>/ot = B0'Yk<o>, obtenemos Multiplicando a la izquierda ambos miembros de la igualdad por 'Ym <0 >* e integrando, obtenemos (40.3) donde V mit) J = 'Y m(O)*v''F k(O) dq _ V mke'-'i /11,XE m(o~ E kCo\t - 160 Teoría de perturbaciones son los elementos de matriz de la perturbación, que incluyen el factor temporal (es necesario tener en cuenta, sin embargo, que cuando V depende explícitamente del tiempo, también las cantidades V mk son funciones del tiempo). Como función de onda no perturbada eligiremos la función de onda del n-ésimo estado estacionario, a la que corresponden los valores de los coeficientes en (40.2): ªn(O) = 1, ak(O) = O para k =/= n. Pára determinar la aproximación de primer orden, escribamos ak en la forma ak = ak< 0>+ak<1>, haciendo en el segundo miembro de la ecuación (40.3) (que contiene ya las cantidades pequeñas Vmk•)ak = ak<o> . Esto nos da: (40.4) Para indicar para cual de las funciones no perturbadas se calcula la corrección, introduzcamos un segundo índice en los coeficientes ak, escribiendo 'f"n = f akn(t)'f"k(OJ. De acuerdo con esto, escribiremos el resultado de la integración de la ecuación (40.4) en la forma: (40.5) (hemos introducido las frecuenciasrokn = (Ek< 0 >-En <0 >)/ñ.). Esta fórmula determina las funciones de onda en la aproximación de primer orden. De manera análoga es posible calcular las aproximaciones siguientes (de hecho, en la mayor parte de los casos basta ya la primera aproximación). Consideremos con mayor detenimiento el caso importante de una perturbación que es función periódica del tiempo de la forma: P' = fte-iwt+(;eiwt, (40.6) donde F y G son operadores que no dependen del tiempo. En virtud de la hermiticidad de V, debe ser Vnm = V*mn, o bien de donde Gnm = Fmn*, igualdad que determina la relación entre los operadores (40.7), obtenemos: (40.7) G y F. Teniendo en cuenta Vkn(t) = Vkneiwk,.' = Fknei(wk11-w>t+Fnk•ei(wk11+w'Jt. (40.8) 161 Perturbaciones dependientes del tiempo Substituyendo en (40.5) e integrando, obtenemos la siguiente expresión para los coeficientes del desarrollo de las funciones de onda: (40.9) Estas expresiones son aplicables si no se anula ninguno de los denominadores (1), es decir, si para todo k (y el valor dado den) (40.10) Para muchas aplicaciones es útil tener las expresiones de los elementos de matriz de una magnitud cualquiera f determinados mediante las funciones de onda perturbadas. En primera aproximación tenemos donde fnm(Ol(t) = J'Yn(O)*/'F m(O) dq = fnm(O)eiwnmt, fnm(ll(t) = f ['Y n(O)*/'F m(l)+'f'n(l)*/'J! m(O)] dq. Substituyendo aquí '}' (1) - n con las cada. akn (I) ~ -k a kn (lYq," k(O), determinadas por la fórmula (40.9), es fácil obtener la expresión bus- (40.11) Esta fórmula es aplicable si ninguno de los términos llega a ser grande, es decir, si ninguna de las frecuencias wkn, wkm es excesivamente próxima al valor w. Para w = O volvemos a la fórmula (38.11 ). En todas las fórmulas escritas aquí se supone que el espectro de niveles energé(1) Más exactamente, los denominadores no deben ser tan pequeños que las cantidades de ser pequeñas comparadas con la unidad. Gkn( 1 ) dejen 162 Teoría de perturbaciones ticos no perturbado es puramente discreto. Sin embargo, es posible generalizarlas inmediatamente al caso en que existe también espectro continuo (si bien, como antes, nos limitamos a la perturbación de estados del espectro discreto), lo que se consigue simplemente añadiendo a las sumas relativas a los niveles del espectro discreto las correspondientes integrales del espectro continuo. Para ello es necesario que en las fórmulas.(40.9), (40.11) los denominadores wkm ± w sean diferentes de cero cuando la energía Ek<o) recorre todos los valores, no sólo del espectro discreto, sino también del continuo. Si, como ocurre de ordinario, el espectro continuo se encuentra por encima de todos los niveles del espectro discreto, la condición (40.10), por ejemplo, debe completarse con la condición 'Em.tn(O)_En(O) donde Emín (o) > nw, {40.12) es la energía del nivel más bajo del espectro continuo. PROBLEMA Determinar el cambio en las soluciones n-ésima y m-ésima de la ecuación de Schrodinger debido a la existencia de una perturbación periódica (de la forma (40.6)) cuya frecuencia w es tal que E.,.< 0>-E.< 0>= li(w+E), donde e es una cantidad pequeña. Solución. El método desarrollado en el texto no es aplicable en este caso dado que el coeficiente amn<1) en (40.9) es grande. Partamos de nuevo de las ecuaciones exactas (40.3) con Vmk(t) dado por (40.8). Es evidente que el efecto más importante procede de aquellos términos de las sumas que aparecen en el segundo miembro de las ecuaciones (40.3) en los que la dependencia respecto del tiempo viene determinada por la pequeña frecuencia Wmn - w. Prescindiendo de todos los demás. obtenemos el sistema de dos ecuaciones i/idan/dt = F mn•e-idam. Efectuemos la substitución con lo que se obtienen las ecuaciones Eliminando entre ellas am, obtenemos: Como par de soluciones independientes de estas ecuaciones podemos elegir (1) y (2) Transiciones , de una perturbación que actúa en un tiempo finito 163 donde A, B son constantes (que deben determinarse a partir de la condición de normalización) y se ha introducido la notación OC¡ f = - + n, CX2 = f + n, Q = Ve: +- ~2 JFmnl 2 Así, pues, bajo la influencia de la perturbación, 'F11<0 >, 'F111<0 > se transforman en las funciones a11'F11<º*a,,.'Y m< 0 >con an, am dados por (1) o (2). Supongamos que en el instante inicial (t = O) el sistema se encontraba en el estado 'Ym<0>. El estado del sistema en los instantes ulteriores se determina por la combinación lineal de las dos funciones que hemos obtenido que se reduce a 'Y m<0> para t = O: El cuadrado del módulo del coeficiente de 'Y n <0 > es igual a (4) Este cuadrado determina la probabilidad de encontrar el sistema, en el instante t, en el estado 'Yn(o). Vemos así que esta probabilidad es una función periódica, con período n/0, que varía entre los límites O y !Fnin\ 2/h20 2 • Para e = O (resonancia exacta) la probabilidad (4) pasa a ser i(l-cos 2¡Fmnlt/li). Esta probabilidad varía periódicamente (con período nh/lFmn\) entre los límites O y 1; con otras palabras, el sistema pasa periódicamente del estado 'Y m{o) al estado 'Yn<0 >. § 41. Transiciones debidas a una perturbación que actúa durante un tiempo finito Supongamos que la perturbación V(t) actúa tan sólo durante un intervalo de tiempo finito (o bien, que V(t) disminuye con rapidez suficiente para t ~ ± oo). Supongamos que antes de empezar a actuar la perturbación (o en el límite para t ~ - oo) el sistema se encontraba en el n-ésimo estado estacionario (del espectro discreto). En un instante ulterior cualquiera el estado del sistema vendrá determinado por la función 'Y= akn'Y k(o), donde en primera aproximación 1. akn is' . = akn(l) = -h Vkne"-wknt dt for k =fa n, -ao (41.1) t ª•• = l+a••(ll = 1-~ fv•• -ao dt; 164 Teoría de perturbaciones los límites de integración en (40.5) se eligen de manera que para t-+ - = todos los coeficientes akn (I) tienden a cero. Una vez transcurrido el tiempo durante el cual actúa la perturbación (o en el límite t ----++ =), los coeficientes akn toman valores constantes akn ( =), y el sistema se encontrará en un estado caracterizado por la función de onda 'Y = ~ k akn(co)'Yk(o>, que satisface de nuevo la ecuación de ondas no perturbada, pero que difiere de la función 'Yn (o). De acuerdo con las reglas generales, el cuadrado del módulo del coeficiente akn( =) determina la probabilidad de que el sistema tenga la energía Ek(0>, es decir, de que se encuentre en el k-ésimo estado estacionario. Así, pues, bajo la influencia de la acción de la perturbación el sistema puede pasar del estado estacionario inicial a otro estado cualquiera. La probabilidad de la transición del estado inicial (el n-ésimo) al estado estacionario k-ésimo es igual a: (41.2) Consideremos ahora una perturbación que, una vez ha empezado a actuar, sigue actuando indefinidamente (conservándose, claro está, pequeña durante todo el tiempo). Con otras palabras, V(t) tiende a cero para t -+ - = y a un límite finito, distinto de cero, para t-+ =. La fórmula (41.2) no es aquí aplicable de manera inmediata, ya que la integral que aparece en ella es divergente. Sin embargo, esta divergencia carece de importancia desde el punto de vista físico y se puede soslayar fácilmente. Para ello escribamos, integrando por partes: El valor del primer término se anula en el límite inferior, y en el límite superior coincide formalmente con los coeficientes del desarrollo de la fórmula (38. 7) (la presencia del factor periódico suplementario iw",.t se debe al hecho de que los akn son los coeficientes del desarrollo de la función de onda total 'Y, mientras que los ckn en el § 38 son los coeficientes del desarrollo de la función 1p, independiente del tiempo). Es claro, por esto, que su límite para t -+ = determina simplemente la variación de la función de onda inicial 'Yn (o) debida a la influencia de la « parte constante» V(+=) de la perturbación y nada tiene que ver, por consiguiente, con las transiciones a otros estados. La probabilidad de la transición viene determinada, en cambio, por el cuadrado del segundo término y es igual a (41.3) Transiciones de una perturbación que actúa. en un tiempo finito 165 Las fórmulas obtenidas son válidas también cuando la transición tiene lugar desde un estado del espectro discreto a un estado del espectro continuo. La diferencía consiste tan sólo en que se trata entonces de la probabilidad de la transición desde el estado dado (el n-ésimo) a los estados que corresponden a valores de las magnitudes v (véase § 38) que pertenecen al intervalo v, v+dv, de forma que, por ejemplo, la fórmula (41.2) debe escribirse f 00 dwn, = ~ 2\ V ,.,,w,., dt \"dv. (41.4) -00 Si la perturbación V(t) varía poco en intervalos de tiempo del orden del período 1/wkm el valor de la integral que aparece en (41.2) o en (41.3) será muy pequeño. En el límite en que la perturbación aplicada varía tan lentamente cuanto se quiera, la probabilidad de toda transición acompañada de variación de la energía (es decir con un valor no nulo de la frecuencia wkn) tiende a cero. Así, pues, para una variación suficientemente lenta de la perturbación aplicada (variación adiabática) el sistema que se encuentra en un estado estacionario no degenerado cualquiera seguirá en el mismo estado (véase también § 53). En el caso límite opuesto de una perturbación que se introduce muy rápidamente ( conexión brusca), las derivadas ó V kn/ ót tienden a infinito en el « instante de conexión». En la integral de ( 8Vkn/ 8t)eiw1cnt, puede sacarse entonces fuera del signo integral el factor eiw1cnt , que varía de forma relativamente lenta, tomando para él el valor correspondiente a este instante. La integral se calcula luego inmediatamente y se obtiene: (41.5) Las probabilidades de transición en el caso de perturbaciones bruscas se pueden encontrar también cuando la perturbación no es pequeña. Supongamos que el sistema se halla en un estado representado por una de las funciones propias 1Pn'º> del hamiltoniano inicial H0 • Si la variación del hamiltoniano tiene lugar «bruscamente» (es decir, durante un tiempo que es pequeño con relación a los períodos 1/ wkn de las transiciones desde el estado n dado a los demás), la función de onda del sistema « no consigue » variar y permanece siendo la misma que era antes de· 1a perturbación. Sin embargo, dicha función no será ya función propia del nuevo hamiltoniano del sistema, fl, es decir, el estado 1Pn (o) no será estacionario. En cuanto a las probabilidades wkn de la transición del sistema a uno cualquiera de los nuevos estados estacionarios, éstas vienen determinadas, de acuerdo con las reglas generales de la mecánica cuántica, por los coeficientes del desarrollo de la función 'lf)n(o) en funciones propias 'lf)n del hamiltoniano b: Wnk = 1 f lfn <Olif;k* dqj 2 • (41.6) 166 Teoría de perturbaciones Veamos cómo esta fórmula general se transforma en la fórmula (41.5) si el cambio del hamiltoniano P- = fJ -flo resulta ser pequeño. Multipliquemos las ecuaciones respectivamente por 'IJ)k * y 'lf'n <0 )*, integremos respecto de q y restemos los resultados miembro a miembro. Teniendo en cuenta también que el operador ít es autoconjugado, obtenemos: Si la perturbación Pes pequeña, podemos susbstituir en primera aproximación Ek por el nivel no perturbado próximo a dicho valor E/0 ) y la función de onda lfk (en el segundo miembro de la igualdad) por la correspondiente función tp/0). Obtenemos entonces: y la fórmula (41.6) pasa a ser la (41.5). PROBLEMAS 1. A un oscilador cargado, que se encuentra en el estado fundamental, se aplica bruscamente un campo eléctrico homogéneo. Determinar las probabilidades de transición del oscilador a los estados excitados bajo la acción de esta perturbación. Solución. La energía potencial del oscilador en un camno homogéneo (que actúa sobre aquél con una fuerza F) es U(x) = fmw2x2-Fx = }mw2(x-x0)2+constante (donde x0 = F/mw 2 ), es decir, su forma es de nuevo la de un potencial puramente oscilatorio (con la posición de equilibrio desplazada). Por consiguiente, las funciones de onda de los estados estacionarios del oscilador perturbado son 'IJ)k(x - x 0), donde 'IJ)k(x) son las funciones del oscilador (23.12); la función de onda inicial es, en cambio, la 'IJ)o(X) de (23.13). Mediante estas funciones y la expresión (23.11) de los polinomios de Hermite encontramos: donde se ha introducido la notación ~o = x 0 grando k veces por partes, a la integral Vmw/h~ La integral que aquí aparece se reduce, inte- Transiciones de una perturbación que actúa en un tiempo finito 167 00 -00 Para la probabilidad de transición buscada (41.6) se obtiene así en definitiva la fórmula to2k 'WOk = --e-fo2f2. 2kk! Como función del número k, es una distribución de Poisson con valor medio de k igual a = F 2/2mliw2. La teoría de perturbaciones es aplicable cuando los valores de F son tan pequeños que k ~ 1. Las probabilidades de excitación son entonces pequeñas y disminuyen rápidamente cuando crece k. La mayor de ellas es wo1 ~ k. k = tfo2 En el caso opuesto de grandes valores de F (k ~ 1), la excitación del oscilador tiene lugar con probabilidad muy elevada: la probabilidad de que el oscilador permanezca en el estado normal es woo = e-k. 2. El núcleo <le un átomo que se encuentra en el estado normal experimenta un choque brusco como resultado del cual adquiere una velocidad v ;· la duración de la colisión 1: se supone pequeña tanto respecto de los períodos electrónicos, como comparada con a/v, donde a son las dimensiones atómicas. Determinar la probabilidad de excitación del átomo debida a una tal « colisión » (A. B. MIGDAL, 1939). Solución. Pasemos al sistema de referencia K' que se mueve con el núcleo después del choque. En virtud de la condición 1: ~ a/v, se puede considerar que el núcleo prácticamente no se mueve durante la colisión, de forma que las coordenadas de los electrones en el sistema K' y en el sistema inicial K coinciden inmediatamente después de la perturbación. La función de onda inicial en el sistema K' es ¡/lo' = ¡/lo exp( -iq . ~a ra), q = mv/li, donde "Po es la función de onda del estado normal para el núcleo en reposo y la suma en el exponente se extiende a todos los Z electrones del átomo (véase problema 2, § 15). La probabilidad buscada de transición al k-ésimo estado excitado se determina ahora, de acuerdo con (41.6), mediante la fórmula wok = 1 Jtpk* exp(-iq. f ra)tpo dVi ... dVzl 2 . En particular, si qa ~ 1, desarrollando el factor exponencial que aparece en el integrando y observando que la integral de 'l/1k*tp0 se anula en virtud de la ortogonalidad de las funciones "Po y tJ)k' obtenemos wok = 1 J tpk*(q. ~ ra)tpo dVi ... dVzl 2 • 3. Determinar la probabilidad total de excitación e ionización del átomo de hidrógeno como consecuencia de una « sacudida » brusca (véase el problema anterior). Solución. La probabilidad buscada se puede calcular como diferencia 1-woo = 1-I J¡fJ 2e-iq.r dVj2 , 0 168 Teoría de perturbaciones donde w00 es la probabilidad de que el átomo permanezca en el estado fundamental (t/io = Tr-112e-rfa es la función de onda del estado fundamental del átomo de hidrógeno; a es el radio de Bohr). Calculando la integral, obtenemos: l-w00 = 1-1/(1 +fq2a2)4. En el caso límite en que qa ~ l, esta probabilidad tiende a cero como 1 qa ~ 1 tiende a la unidad como 1 - Woo ,...__, 1 - (2/qa) 8 • Woo"-' q 2a 2, y para 4. Determinar la probabilidad de emisión de un electrón de la capa K de un átomo de número atómico Z elevado en la desintegración-¡5' del núcleo. La velocidad de la partícula-¡5' se considera grande con relación a la velocidad del electrón-K (A. B. MIGDAL, E. L. FEINBERG, 1941). Solución (1). En las condiciones indicadas, la duración del paso de la partícula-¡5' a través de la capa K es pequeña comparada con el período de rotación de un electrón, de modo que el cambio de la carga del núcleo se puede considerar como instantáneo. El papel de perturbación lo representa aquí la variación V= 1/r del campo del núcleo para una variación pequeña de su carga (en la razón de 1 a Z). De acuerdo con (41.5), la probabilidad de la transición de uno de los dos electrones de la capa K con energía. E0 = - Z 2/2 (2) a un estado del espectro continuo con energía E = k 2/2 en el intervalo dE = kdk es dw = 2 41 v.Ok 12 (k2+z2)2 dk. En la integral que determina el elemento de matriz Vok cuenta fundamentalmente el intervalo de distancias próximas al núcleo(,_, 1/Z), intervalo en el que para la función de onda de un estado del espectro continuo es también posible utilizar expresiones correspondientes a un sistema hidrogenoide. El estado final del electrón debe poseer un momento cinético l = O (que coincide con el momento cinético del estado inicial). Mediante las funciones R 10 y Rko, normalizadas en la escala k, obtenidas en el § 36 y las fórmulas (f. 3) del apéndice matemático encontramos (3): 4yk (1 +ik/Z)iZ/k(l-ik/Z)-iZ/k y(l-e-211Z/k) 1 +k2/Z2 y dado que 1(1 + iet:)i/a¡2 = exp[ -(2/et:) tan-1 IX], obtenemos finalmente dw = 27 í.(k/Z)k dk Z4(1+k2¡z2l' , donde se ha introducido la notación f(et:) = (1) 1 1-e-2rr/a exp[-(4/a) tan-lal En los problemas 4 y 5 utilizamos unidades atómicas. Aquí y en lo que sigue se tiene en cuenta el carácter hidrogenoide del estado de los electrones-K (véase § 74). (ª) En el cálculo conviene utilizar unidades coulombianas, pasando luego a unidades atómicas en el resultado final. 2 ( ) Transiciones de una perturbación que actúa en un tiempo finito 169 Los valores límites de la función f(rx) son: f = e- 4 para rx ~ 1; f = para rx ~ l. rx/2 n La probabilidad total de ionización de la capa K se obtiene integrando respecto de w para todas las energías del electrón emitido. El cálculo numérico da w = 0,65· Z 2 • 5. Determinar la probabilidad de emisión de un electrón de la capa K de un átomo de gran Z en la desintegración-rx del núcleo. La velocidad de la partícula-rx es pequeña respecto de la velocidad del electrón-K, pero el tiempo que emplea en escapar del núcleo es pequeño con relación al tiempo de rotación del electrón (1). Solución. Después de emitida la partícula-rx. la perturbación que actúa sobre el electrón es de carácter adiabático. Por lo tanto, el efecto buscado viene determinado en esencia por el tiempo próximo al « instante de conexión » de la perturbación en el que se viola el carácter adiabático, tiempo durante el cual la partícula-rx, que ha escapado del núcleo y se mueve como una partícula libre, se encuentra aún a distancias que son pequeñas respecto del radio de la órbita K. El papel de la perturbación V, que provoca la ionización del átomo, lo representa aquí la desviación del campo creado por el núcleo y la partícula-rx respecto del campo puramente coulombiano Z/r. El momento dipolar de dos partículas de pesos atómicos 4 y A - 4 y cargas 2 y Z - 2 separadas por una distancia vt (ves la velocidad relativa del núcleo y la partícula-rx) es igual a (2): 2(A-4)-(Z-2)4 2(A-2Z) --------nt = vt. A A Por consiguiente, el término dipolar del campo del núcleo y la partícula-rx es (3): 2(A-2Z) z V = -----vt-, A r3 donde el eje z está dirigido en el sentido de la velocidad v. El elemento de matriz de esta perturbación se reduce al elemento de matriz de z: de la ecuación del movimiento del electrón z = - Zz /r3, se deduce, en efecto, el elemento de matriz: (z/r 3 )ok = (E-Eo) 2zok/Z. La probabilidad buscada de transición de uno de los dos electrones de la capa K es, según (41.2), 2 00 dw = 21 JVokei(Eo-E>t dtl dk o = 8(A-2Z)2v2 A2z2 lzokl 2 dk· ' Este problema fue estudiado por primera vez por A. B. MIGDAL (1941). La necesidad de tener en cuenta en este problema a la vez el movimiento de la partícula-rx y el del núcleo fue señalada por J. S. LEVINGER (1953). (ª) Si la diferencia A - 2Z es pequeña, puede ser necesario tener en cuenta también el término sig11iente, el cuadripolar. (1) (2) 170 Teoría de perturbaciones (para calcular la integral hemos introducido en el integrando un factor adicional de convergencia A> O, después de lo cual se ha hecho A-+ O en el resultado obtenido). Para calcular el elemento de matriz de z = r cos O observemos que, dado que el momento cinético orbital en el estado inicial es l =;: O, la expresión cos O tiene un elemento de matriz diferente de cero tan sólo para la transición al estado l = 1 ; en este caso e-M, l l(cos8)01l 2 = (cos8)oo = y lzokl Calculando rok 2 = ilrokl mediante las funciones radiales R00 y dw = 2- Rki, obtenemos en definitiva: 211(A-2Z)2v2 +-(k/Z)k dk 3A2Z6(1 +k2/Z2)5 JI ' (la función .f es la definida en el problema 4). § 42. Transiciones provocadas por una perturbación periódica Para la probabilidad de la transición a estados del espectro continuo determinada por la acción de una perturbación periódica, se obtiene otro tipo de resultados. Supongamos que en el instante inicial t = O el sistema se encuentra en el n-ésimo estado estacionario del espectro discreto. Supondremos que la frecuencia w de la perturbación periódica es tal que (42.1) donde Emín es el valor de la energía a partir del cual comienza el espectro continuo. Por los resultados del§ 40 es ya evidente que el papel fundamental lo representarán los estados cuyos valores de la energía E se encuentran en la vecindad inmediata de la energía « de resonancia » E,,, <0 >+ liw, es decir, aquellos estados para los que la diferencia wvn - w es pequeña (1). Por esta misma razón, en los elementos de matriz de la perturbación (40.8) basta considerar solamente el primer término (con frecuencia wvn - w próxima a cero). Substituyendo este término en (40.5) e integrando, obtenemos: i a.,n = -li f t o . )t ei<w""-w -1 (42.2) V.,n(t) dt = -F.,n . li(w,n-w) El límite inferior de integración se elige de manera que para t acuerdo con la condición inicial impuesta. = O sea avn De aquí se sigue para el cuadrado del módulo de avn la expresión: 1 ( ) Recordemos que el índice v se refiere al espectro continuo (véase el final del § 38). =-= O, de 171 1'ransiciones provocadas por una perturbación periódica (42.3) Es fácil ver que para grandes valores de testa función se puede considerar proporcional a t. Observemos para ello que la fórmula siguiente es válida: sen 2ext lim - - = 8(ex). t_,,. co 71'tex2 (42.4) En efecto, para ex -=f=. O el límite en cuestión es igual a cero, y para ex O tenemos . es 1gua . 1a m . fi mto. . s·m em bargo, mtegran . d o rest, de forma que e1 límite sen2 ext --- = trx.2 pecto de mos: = cx entre los límites - f 00 1 - 71' -~ y oo + oo (haciendo la substitución sen 2cxt 1 foo sen - - dcx = tcx2 71' -~ o:t = ~), obtene- 2 g2 f df = l. Así, pues, la función que aparece en el primer miembro de la igualdad (42.4) satisface, en efecto, todas las condiciones que definen a la función-o. De acuerdo con esta fórmula, podemos escribir para grandes valores de t la.,nl 2 = o bien, substituyendo liwvn {l/li2)lF11nl 27TlS{!wm-lw), = Ev-En <0 > y teniendo en cuenta que lavnl 2 o(ax) = o(x)/a: = (21r/li)IF11 nl 28(Ev-En(O)_Jiw)t. La expresión lavnl 2 dv es la probabilidad de la transición desde el estado inicial a los estados que se encuentran en el intervalo entre v y v+dv (cf. § 5). Vemos, pues, que para grandes valores de t dicha expresión resulta proporcional al tiempo transcurrido desde el instante t = O. La probabilidad de transición dwnv por unidad de tiempo es igual, en cambio, a (1): (42.5) De acuerdo con lo que era de esperar, esta probabilidad es diferente de cero tan sólo para las transiciones a los estados cuya energía es Ev = En <0 >+ liro. Si los niveles energéticos del espectro continuo no son degenerados, de forma que se puede entender por v los valores de la energía solamente, todo el «intervalo» de estados dv se reduce a un solo estado con energía E = En <0 l+ñw,y la probabilidad de (1) Es fácil comprobar que si se tiene en cuenta el segundo término de (40.8), término del que hemos prescindido, se obtendrían expresiones adicionales que, divididas luei;o por t, tienden a cero para t-++CX). 172 Teoría de perturbaciones transición al mismo es (42.6) § 43. Transiciones en el espectro continuo Una de las aplicaciones más importantes de la teoría de perturbaciones es el cálculo de la probabilidad de transición en el espectro continuo bajo la acción de una perturbación constante (es decir, no dependiente del tiempo). Hemos mencionado ya que los estados del espectro continuo son prácticamente siempre degenerados. Una vez elegido de determinada manera el conjunto de funciones de onda no perturbadas que corresponden a un cierto nivel dado de energía, podemos plantear el problema de la siguiente manera: sabiendo que en el instante inicial el sistema se encontraba en uno de estos estados, se pide determinar la probabilidad de la transición a otro estado de igual energía. Si el estado inicial se caracteriza por el índice v0 , para las transiciones a los estados pertenecientes al intervalo entre v y v+dv se sigue directamente de (42.5) (suponiendo w = O y cambiando la notación): (43.1) Esta expresión, comó debía ser, resulta diferente de cero tan sólo para Ev = Ev,: bajo la acción de una perturbación constante, las transiciones tienen lugar tan sólo entre estados de igual energía. Es necesario observar que para las transiciones a partir de estados del espectro continuo, la magnitud dwvov no se puede considerar sin más como igual a la probabilidad de transición; de hecho ni tan sólo posee las dimensiones adecuadas (1/tiempo). La expresión (43.1) representa el número de transiciones por unidad de tiempo y sus dimensiones dependen del criterio de normalización elegido para las funciones de onda del espectro continuo. Calculemos la función de onda perturbada que coincide en el estado inicial con la función no perturbada de partida 'Pv. <0 >. Según la fórmula (42.2) (en la que hacemos w = O y cambiamos la notación) se tiene: La función de onda perturbada tiene la forma: 'Y V = 0 'Y V (o)+ Ja<I> 'Y (O) dv V11e 8 V ' o bien 'Y v, [ f = .,. 'f'v 8 (O)+ V .,. vv 0 'f'v l-e<iJli)(E.,,0 -E.,,)t (O) E -E Vo V dv ] e-<iJTt>E.,, 0 t , (43.2) Transiciones en el espectro continuo 173 donde la integración se extiende a todo el espectro continuo (1). Veamos cuál es la forma límite de esta función para grandes valores de t. Para ello separemos en dv la diferencial dEv de la energía (escribiendo dv = dEv dT, donde dT es el producto de las diferenciales de las demás magnitudes que determinan el estado del espectro continuo) y consideremos formalmente Ev como una variable compleja. La integral que aparece en (43.2) se calcula a lo largo del eje real. Desplacemos un poco el camino de integración hacia el semi plano inferior; es posible efectuar este desplazamiento sin cambiar el valor de la integral, dado que el integrando carece de singularidades sobre el eje real. Podemos luego descomponer la integral en dos partes: (en la integración a lo largo del eje real estas integrales carecen de sentido, ya que divergen en el punto Ev = Ev.). Dado que a lo largo del contorno de integración se tiene Im(Ev) < O, al tender t a infinito la segunda de estas integrales tiende a cero (debido a la presencia del factor exp[lm(Ev)t/h] en el integrando). En la primera integral, en cambio es posible desplazar de nuevo el camino de integración hasta hacerlo coincidir con el eje real, evitando tan sólo el punto Ev = Evo , que se deja a la izquierda. Es cómodo representar esta manera de efectuar la integración en otra forma, sumando a la constante Evo que figura en el denominador del integrando una pequeña cantidad imaginaria positiva io. Con esto el polo del integrando se desplaza hacia el semiplano superior y es posible efectuar la integración simplemente a lo largo del eje real (que pasa ahora por debajo del polo), haciendo luego tender a cero la cantidad o. 9 Obtenemos así para la función de onda la expresión (43.3) El factor temporal prueba que esta función corresponde, como debe ser, a la misma energía Evo que la función no perturbada inicial. Con otras palabras, la función ,/, '(Jv. = ,/, '(Jv, (O)+ I V""• ,/, (O) E -E '(Jv V• dv V ( 1) Si existe también un espectro discreto, en esta fórmula (y en las siguientes) hay que añadir a la integral la suma correspondiente a los estados del espectro discreto. 174 Teoría de perturbaciones satisface la ecuac10n de SCHRODINGER (H 0 + t>)Pv. = Ev.V'v. Es natural por ello que esta expresión corresponda exactamente a la fórmula (38. 7) (1). Los cálculos que preceden corresponden a la primera aproximación de la teoría de perturbaciones. No es difícil calcular también la segunda aproximación. Para ello es necesario deducir la fórmula que corresponde a la aproximación siguiente de 'Y1, 0 , lo que se consigue fácilmente siguiendo el método del§ 38 (conocido ahora ya el método que debe emplearse para tratar las integrales «divergentes»). Un cálculo simple conduce a la fórmula: 'Y v. = ('f'v. f [ vv, f ,/, {O)+ V + Vvv, Vv,v º dv' E -E , V0 V ] if, (O) dv ) v e-<i!A)E"ot, E -E (43.4) Vo (aplicando la misma regla que antes para evitar la singularidad en las integrales). Comparando esta expresión con la fórmula (43.3), podemos escribir la fórmula correspondiente para la probahilidad (mejor dicho, para el número de transiciones) directamente por analogía con (43.1): (43.5) Puede ocurrir que el elemento de matriz Vvv 0 que corresponde a la transición considerada sea igual a cero. No existe entonces efecto de primer orden, y para el número de transiciones tenemos: (43.6) (en las aplicaciones de esta fórmula, el punto Ev' = Evo no es en general un punto singular del integrando; por consiguiente, no importa cómo se integre respecto de Ev y la integración se puede efectuar sin más a lo largo del eje real). Los estados v•, para los que Vvv' y V v'vo son diferentes de cero, se suelen calificar de intermedios para la transición v0 -~ v. Puede ocurrir que la transición v0 --;. v sea posible no pasando por un estado intermedio, sino tan sólo recorriendo una sucesión de tales estados. La fórmula (43.6) se generaliza de manera inmediata a estos casos. Así, si son necesarios dos estados intermedios, se tendrá. (43.7) (1) Si se parte de esta fórmula, se puede establecer cómo hay que tomar la integral teniendo en cuenta la condición de que la expresión asintótica de 'lfvo a grandes distancias contenga exclusivamente una onda divergente, no una convergente (véase § 134). La relación de indeterminación para la energía § 44. 175 La relación de indeterminación para la energía Consideremos un sistema constituido por dos componentes que interactúan entre sí débilmente. Supongamos que en un cierto instante se sabe que estas componentes poseen valores determinados de la energía, que designaremos por E y e, respectivamente. Supongamos también que transcurrido un cierto intervalo de tiempo M se efectúa de nuevo una medición de la energía; esta medición dará ciertos valores E', e', en general distintos de E, e. Es fácil determinar cuál es el orden de magnitud del valor más probable de la diferencia E' + l - E - i que puede resultar de dicha medición. De acuerdo con la fórmula (42.3) (con w = O), la probabilidad de la transición del sistema (al cabo de un tiempo t), determinada por una perturbación independiente del tiempo, desde el estado con energía E al estado con energía E', es proporcional a sen sen2 [(E'-E)t/2h]/(E' -E)2. Vemos así que el valor más probable de la diferencia E' - E es del orden de magnitud ñ/t. Aplicando este resultado al caso que consideramos (la perturbación es la interacción mutua de las dos partes del sistema), obtenemos la relación (44.1) Así, pues, cuanto menor sea el intervalo de tiempo M, tanto mayor será la variación detectada de la energía. Es esencial observar que su orden de magnitud ñ/ M no depende del valor de la perturbación. La variación de la energía determinada por (44.1) se manifestará por débil que sea la interacción entre las dos partes del sistema. Este resultado es puramente cuántico y posee una profunda significación física. Prueba que en mecánica cuántica la ley de conservación de la energía puede comprobarse mediante dos mediciones tan sólo con una precisión que es del orden den/ M, donde M es el intervalo de tiempo transcurrido entre las mediciones. Se suele decir que la relación (44.1) expresa la relación de indeterminación para la energía. Sin embargo, hay que subrayar que su sentido es esencialmente distinto del sentido que poseen la relación de indeterminación !::.p!::.x ,_, ñ relativa a la coordenada y al impulso. En esta última !::.p y !::.x son las indeterminaciones en los valores del impulso y de la coordenada en un mismo instante y ponen de manifiesto que estas dos magnitudes no pueden poseer simultáneamente valores rigurosamente determinados. En cambio, las energías E, e pueden, por el contrario, ser medidas en cada instante con la precisión que se quiera. La cantidad (E +e) - (E' +e') en (44.1) es la diferencia entre dos valores de la energía E+ E medidos exactamente en dos instantes distintos, y en modo alguno se refiere a la indeterminación en el valor 176 Teoría de perturbaciones de la energía en un instante determinado. Si se considera E como energía de un cierto sistema y E' como la energía del « aparato de medida », podemos decir que la energía de interacción entre ellos se puede tener en cuenta tan sólo con una precisión que es del orden de li./ M. Designemos por 11E, ~E', ••• los errores en las mediciones de las cantidades correspondientes. En el mejor de los casos, cuando E", E'' se conocen exactamente ( i1E" = 11e' = O), tenemos: D.(E-E') "'li./M. (44.2) De esta relación se pueden deducir importantes consecuencias relativas a la medición del impulso. El proceso de medición del impulso de una partícula (para concretar, hablaremos de un elect_rón) supone la colisión del electrón con alguna otra partícula (la « de medida ») cuyos impulsos antes y después del choque se pueden considerar conocidos exactamente (1). Si a esta colisión se aplica la ley de conservación del impulso, obtenemos, tres ecuaciones (las tres componentes de una ecuación vectorial) con seis incógnitas - las componentes del impulso del electrón antes y después del choque. Para aumentar el número de ecuaciones cabe realizar una serie de colisiones sucesivas del electrón con las partículas « de medida » y aplicar la ley de conservación del impulso a cada una de dichas colisiones. Sin embargo, se aumenta con esto también el número de incógnitas (los impulsos del electrón entre colisión y colisión), y es fácil ver que cualquiera que sea el número de colisiones el número de incógnitas excederá en tres al número de ecuaciones. Por consiguiente, para medir el impulso de un electrón es necesario aplicar, junto con la ley de conservación del .impulso, la ley de conservación de la energía en cada colisión. Con todo, esta última, conforme vimos, sólo puede aplicarse con una precisión que es del orden de ñ/ M, donde M es el tiempo transcurrido entre el principio y el final del proceso considerado. Para simplificar el razonamiento que sigue conviene considerar un experimento ideal en el que la « partícula de medida » es un espejo plano que actúa como un reflector perfecto; entra entonces en juego solamente una componente del impulso - la componente perpendicular al plano del espejo. Para determinar el impulso P de la partícula, las leyes de conservación del impulso y de la energía nos dan las ecuaciones p'+P'-p-P = O, (44.3) je'+E'-e-E/ ,..._,Ji/f:..t, (44.4) (P, E son el impulso y la energía de la partícula, p, E' el impulso y la energía del espejo; las cantidades sin y con apóstrofo se refieren respectivamente a los instantes antes 1 ( ) Para el análisis que se efectúa aquí, no es esencial como se conoce la energía de la partícula « de medida». La relación de indeterminación para la energía 177 1 y después del choque). Las cantidades p, p', €, € que corresponden a la « partícula de medida », se pueden considerar conocidas exactamente, es decir, sus errores son iguales a cero. Para los errores que afectan a las restantes cantidades se tiene entonces, en virtud de las ecuaciones que preceden: , !lP = !lP', !lE'-!lE l'-.J ñ/!lt. óE Pero 11E = éJP 11P = v11P, donde v es la velocidad del electrón (antes del choque), y análogamente 11E' = v' 11P' = v' 11P. Obtenemos, por lo tanto: (44.5) Hemos escrito explícitamente aquí los índices x para la velocidad y el impulso con el fin de subrayar que esta relación vale para cada una de las componentes por separado. Ésta es precisamente la relación buscada. Esta relación pone de manifiesto que la medición del impulso de un electrón (con una precisión dada 11P) está inevitablemente ligada con una variación de su velocidad (es decir, con una variación del propio impulso). Este cambio es tanto mayor cuanto más corta es la duración del propio proceso de medida. Se puede conseguir que la variación de la velocidad sea tan pequeña cuanto se quiera solamente si se hace M -+ =, pero las mediciones del impulso que se prolongan durante un tiempo grande sólo pueden tener sentido para una partícula libre. Se manifiesta aquí de manera particularmente clara la no reproducibilidad de la medición del impulso al cabo de cortos intervalos de tiempo y la « doble faz» que ofrece la medición en mecánica cuántica: la necesidad de distinguir entre el valor medido de la magnitud y el valor que surje como resultado del proceso de medición (1). La conclusión a que hemos llegado al principio de este párrafo basándonos en la teoría de perturbaciones, se puede deducir desde otro punto de vista considerando la desintegración de un sistema provocada por una perturbación cualquiera. Sea E 0 un nivel de energía del sistema calculado prescindiendo por completo de la posi.bilidad de su desintegración. Designaremos por • la duración de la vida de este estado del sistema, es decir, la cantidad igual al recíproco de la probabilidad de desintegración por unidad de tiempo. Procediendo igual que antes, encontramos entonces que (44.6) donde E, € son las energías de las dos componentes en que se ha desintegrado el sistema. Pero de la suma E+€ cabe deducir una estimación de la energía del sistema antes de la desintegración. Por lo tanto, la relación obtenida prueba que la energía de un sistema que puede desintegrarse y que se halle en un estado cuasiestacionario (1) La relación (44.5), como la explicación del sentido físico que encierra la relación de indeterminación de la energía, se debe a N. BOHR (1928). 178 Teoría de perturbaciones se puede determinar tan sólo con una precisión que es del orden de magnitud de ñ/r. Esta cantidad se suele llamar anchura r del nivel. Así, pues, r t"-Jñ,J,r. § 45. (44.7) La energía potencial como perturbación Merece particular atención el caso en que la energía potencial total de la partícula en el campo exterior se puede considerar como una perturbación. La ecuación no perturbada de ScHRODINGER es entonces la ecuación del movimiento libre de una partícula k = y'(2mE/Ji2) = p/li, (45.1) y tiene ondas planas como soluciones. El espectro energético del movimiento libre es continuo, con lo que nos encontramos ante un caso característico de teoría de perturbaciones en el es¡:ectro continuo. La resolución del problema resulta aquí particularmente cómoda procediendo directamente, sin acudir a las fórmulas generales. La ecuación que da la corrección de primer orden onda es: tp(I) relativa a la función de (45.2) ( U es la energía potencial). La solución de esta ecuación, como es sabido por electro- dinámica, se puede escribir en la forma de potenciales retardados es decir, en la forma (1): ¡J,<1l(x, y, z) = -(m/21rli2) f ¡J,<0lU(x',y', z')etkr dV'Jr, (45.3) donde dV' = dx'dy'dz', r 2 = (x-x') 2 +(y-y')2+(z-z')2. Veamos a que condiciones debe satisfacer el campo U para que podamos considerarlo como una perturbación. La condición de aplicabilidad de la teoría de perturbaciones puede resumirse en la condición de que sea if,<I> ~ if,<o>. Sea a el orden de magnitud de las dimensiones de la región del espacio en las que el campo difiere apreciablemente de cero. Supongamos primero que la energía de la partícula es tan pequeña, que el producto ak es menor que o del orden de la unidad. El factor eikr en el integrando de la expresión (45.3) carece entonces de importancia en la estimáción del orden de magnitud, y toda la integral será del orden de tp(o)¡ Uja 2, de forma que (1) Es ésta una integral particular de la ecuación (45.2), a la que se puede añadir todavía una solución cualquiera de la ecuación homogénea (es decir, de la ecuación no perturbada (45.1)). La energfo potencial como perturbación 179 y obtenemos la condición Uf~ 1 li2/ma2 ( para ka < 1). (45.4) Obsérvese que la expresión que aparece en el segundo miembro posee un simple significado físico; es el orden de magnitud de la energía cinética que poseería la partícula limitada a un volumen cuyas dimensiones lineales fuesen del orden de a (ya que, según la relación de indeterminación, su impulso sería del orden de ñ/a). Consideremos, en particular, un pozo de potencial tan poco profundo que para él se cumple la condición (45.4). Es fácil ver que en un tal pozo no existen niveles de energía negativos (R. PEIERLS, 1929); nos hemos encontrado ya con esta situación en el problema del § 33 para el caso particular de un pozo que presenta simetría esférica. En efecto, para E = O la función de onda no perturbada se reduce a una constante, que se puede tomar igual a la unidad: if;< 0 > = l. Dado que if;<1 > ~ if;< 0 >, es claro que la función de onda del movimiento en el pozo, if; = 1 +if;<1 > no se anula en ningún punto; pero una función propia que no presenta nodos corresponde al estado normal, de forma que E = O sigue siendo el menor valor propio posible de la energía de la partícula. Así, pues, si el pozo no es suficientemente profundo, es sólo posible un movimiento infinito de la partícula - la partícula no puede ser «capturada» por el pozo. Conviene llamar la atención sobre el hecho de que este resultado posee un carácter típicamente cuántico: en la mecánica clásica la partícula puede realizar un movimiento finito en un pozo de potencial cualquiera. Es necesario subrayar que todo lo que acabamos de decir se refiere solamente a un pozo tridimensional. En un pozo de una y de dos dimensiones (es decir, un pozo en el que el campo es función solamente de una o de dos coordenadas) existen siempre niveles de energía negativa (véanse los problemas de este párrafo). Ello está ligado con el hecho de que, en los casos de una y de dos dimensiones, la teoría de perturbaciones considerada no es aplicable para una energía E igual a cero (o muy pequeña) (1). En el caso de grandes energías, cuando ka ~ 1, el factor eikr del integrando representa un importante papel, ya que disminuye fuertemente el valor de la integral. La solución (45.3) puede transformarse, en este caso, llevándola a otra forma, para obtener la cual, sin embargo, es más cómodo partir directamente de la ecuación (45.2). Elijamos la dirección del movimiento no perturbado como eje x; la función de onda no perturbada tiene entonces la forma if;< 0 > = eikx (convendremos en tomar (1) En el caso bidimensional, 'ljJ(I) se expresa (como es sabido por la teoría de la ecuación de las ondas en dos dimensiones) en U(@ forma análoga a la de la integral (45.3), en la que en vez de eikr dx' dy' dz' aparece inH0 ( 1 )(kr) dx' dy' (H0 ( 1 ) es la función de Hankel de orden cero de primera especie), y r = l(x' -x)2+(y' -y) 2 • Para k-+ O, la función de Hankel, y con ella toda la integral, tiende logarítmicamente a infinito. A!'álogamente, en el caso de una dimensión, en el integrando de la fórmula que determina 1jJ( 1 ) aparece 2n/ eikr dx' (donde r = 1x' - x y para k-+ O la corrección "P(ll tiende a infinito como J/k. 1 ) 180 Teoría de perturbaciones el factor constante igual a la unidad). Busquemos la solución de la ecuación 6,fJ.l>+k2,¡Jl> = (2m/Ji2)Ueikx en Ja forma ifi<I> = eikx¡; teniendo en cuenta que, dado que k se ha supuesto grande, basta conservar en !J. 1/1) únicamente aquellos términos en los que se deriva (aunque sólo sea una vez) al factor eikx. Obtenemos entonces para f la ecuación 2ik 8f/8x = 2mU/li2 , de donde J ,fJ<l) = eikx¡ = -(im/n 2k)eikx U dx. (45.5) La estimación de esta integral da !ifi<1>¡ ,._ mUa/Ji2k, de forma que la condición de aplicabilidad de la teoría de perturbaciones será en este caso: JU/ ~ (n2/ma2)ka = ñv/a (ka> 1), (45.6) (v = klitm es la velocidad de la partícula). Obsérvese que esta condición es menos restrictiva que la (45.4). Por lo tanto, si es posible considerar el campo como una perturbación para energías pequeñas de la partícula, ello será también posible para grandes energías, mientras que el recíproco no vale en general (1). La aplicabilidad de la teoría de perturbaciones que hemos desarrollado aquí al campo de Coulomb exige un análisis especial. En el campo U= a/res imposible separar una región finita del espacio fuera de la cual U sea considerablemente menor que dentro de ella. La condición que se busca se puede obtener escribiendo en (45.6) la distancia variable r en vez del parámetro a; ello conduce a la desigualdad r,./Jiv ~ 1. (45.7) Así, pues, para grandes energías de la partícula el campo de Coulomb se puede considerar como una perturbación (2). Finalmente, deduzcamos la fórmula que determina aproximadamente la función de onda de una partícula cuya energía E es, en todo el espacio, mucho mayor que la energía potencial U (no se exige aquí que se cumpla ninguna otra condición). En primera aproximación, la dependencia de la función de onda respecto de las coordenadas es la misma que en el movimiento libre (cuya dirección eligiremos como (l) En el caso unidimensional, la condición de aplicabilidad de la teoría de perturbaciones viene dada por la desigualdad (45.6) cualquiera que sea el producto ka. El método seguido para llegar a la condición (45.4) en el caso de tres dimensiones, no se puede aplicar al caso unidimensional debido a la divergencia de la función ,¡,( 1 ) construida de esta manera, divergencia que se hizo notar en la nota de la pág. 179). 2 ( ) Hay que tener en cuenta que la integral (45.5) para el campo U= r1./r diverge (logarítmicamente) para grandes valores de x/Vy2 +z 2:-l>or lo tanto, la función de onda obtenida mediante la teoría de perturbaciones en el caso de un campo de Coulomb, no es aplicable dentro de un estrecho cono cuyo eje coincide con el eje x. La energía potencial como perturbación 181 eje x). De acuerdo con esto, busquemos '1/J en la forma 1P = eikxF, donde Fes una función de las coordenadas que varía lentamente con relación al factor eikx (sin que, en general, sea posible afirmar que dicha función es próxima a la unidad). Substituyendo en la ecuación de SCHRODINGER, obtenemos para F la ecuación 2ik 8F/8x = (2m/lí 2) UF, (45.8) de donde = eikxp = ,f, constante xeikxe-<i!Av>Juctx. (45.9) Ésta es precisamente la expresión buscada. Con todo, no hay que perder de vista que dicha expresión no es aplicable a distancias demasiado grandes. En la ecuación (45.8) se ha prescindido del término ~F, que contiene las segundas derivadas de F. La derivada [J2F/ox 2 , junto con la derivada primera oF/ox, tiende a cero a grandes distancias. Las derivadas correspondientes a las direcciones transversales J', z, en cambio, no tienden a cero y sólo es posible prescindir de ellas si se cumple la condición x ~ ka 2 • PROBLEMAS 1. Determinar el nivel de energía en un pozo de potencial unidimensional de pequeña profundidad; se supone que se cumple la condición (45.4). Solución. Supongamos - suposición que vendrá confirmada por el resultado - que el nivel de energía es tal que :E: ~ U!. Entonces, en el segundo miembro de la ecuación de SCHRODINGER 1 d2,f,/dx2 = (2m/lí2)[U(x)-E]if,, se puede prescindir de E dentro del pozo y también considerar 1P como una constante que, sin restringir la generalidad, se puede tomar igual a la unidad: d2,f,/dx2 = 2mU/lí2 • Integremos esta igualdad respecto de x entre dos puntos ± x 1 tales que a ~- x 1 ~ 1/,c donde a es la anchura del pozo y x = V2m[Ejh. Dada la convergencia de la integral de U(x), podemos extender la integración del segundo miembro desde a + =: = 00 d,f,]X1 [dx -~ 1 2mf Udx. =lí 2-00 Lejos del pozo, la función de onda es de la forma 1P -2K = = e± Y.x. Substituyendo en (1 ), encontramos: (2m/h')_Í U dx o bien IE/ = (m/2h')[] U dx]'· -X (1) 182 Teoría de perturbaciones Vemos así que, de acuerdo con la hipótesis hecha, el valor del nivel resulta ser una cantidad pequeña de orden superior (de segundo orden) con relación a la profundidad del pozo. 2. Determinar el nivel de energía en un pozo de potencial de dos dimensiones U(r) (r es el 00 radio vector en el plano) de pequeña profundidad; se supone que la integral f rUdr es convergente. o Solución. Procediendo como en e1 problema anterior, obtenemos dentro del pozo la ecuación Integrándola respecto de r desde O a r 1 (donde a~ r 1 clip 1 f 1/x), tenemos: 00 2 -] =; [ clr r=r li ~ '1 rU(r) dr. (1) o Lejos del pozo, la ecuación del movimiento libre bidimensional 1 d ( clip) 2m - - r- +-Eip = O, r dr clr li2 tiene la solución (que se anula en el infinito) '1/J = const· K 0 (xr), donde K 0 es la función de Hankel de primera especie y orden cero de argumento imaginario; para valores pequeños del argumento, el término principal en K 0 es proporcional a In xr. Teniendo esto en cuenta, igualaremos parar,._, a las derivadas logarítmicas de '1/J, calculadas en el pozo (segundo miembro de (1)) y fuera de él, con lo que obtenemos: 1 a de donde IE/ - Iog Ka 2 _!!!_ /i2a f 00 U(r)r dr, o m:: ex+ ~'[f¡u¡, dr] + o Vemos así que el nivel de energía es un infinitésimo de orden exponencial con relación a la profundidad del pozo. CAPÍTULO V11 EL CASO CUASICLÁSICO ~ 46. La función de onda en el caso cuasiclásico Si las longitudes de onda de de Broglie de las partículas son pequeñas respecto de las dimensiones características que determinan las condiciones del problema concreto planteado, las propiedades del sistema se aproximan a las clásicas (1). (Se trata aquí de un caso análogo al de la óptica ondulatoria, que se reduce a la óptica geométrica cuando se hace tender a cero la longitud de onda.) Analicemos ahora de manera más detenida las propiedades de los sistemas « cuasiclásicos ». Para ello, en la ecuación de ScHROCINGER substituyamos formalmente ip = e<tlnlu, (46.1) Para la función a obtenemos la ecuación (46.2) Dado que el sistema se supone casi clásico por sus propiedades, determinaremos a en forma de serie <J = cro+(n/i)cr1 +(ñ/i) 2cr2+ ... , (46.3) ordenada en potencias de li. 1 ( ) Señalemos, en particular, que los estados del espectro discreto con valores grandes del número rnántico n poseen un carácter cuasiclásico. En efecto, el número n -- número ordinal del estado - determina el número de nodos de la función propia (véase§ 21 ). Pero la distancia entre dos nodos consecutivos coincide en orden de magnitud con la longitud de onda de de Broglie. Para valores grandes de n esta distancia es pequeña, de forma que la longitud de onda es pequeña con relación a las dimensiones de la región en que tiene Jugar el movimiento. 184 El caso cuasiclásico Consideremos primero el caso más simple, el movimiento unidimensional de una partícula. La ecuación (46.2) se reduce entonces a la ecuación (46.4) cr' 2 /2m-iñcr" /2m = E- U(x), (donde el apóstrofo significa derivación respecto de la coordenada x). En primera aproximación hagamos a = a0 y prescindamos en la ecuación del término que contiene ñ: cr0 ' 2 /2m = E- U(x). Se sigue de aquí: O'o = ± f v'{2m[E- U(x)]} dx. El integrando no es sino el impulso clásico p(x) de la partícula expresado en función de la coordenada. Eligiendo para la función p(x) el signo + antes de la raíz, tendremos: cr0 = ± f p dx, p = v'[2m(E- U)], (46.5) lo que era de esperar teniendo en cuenta la expresión límite (6.1) para la función de onda (1). Es lícito prescindir de los términos de que hemos prescindido en la ecuación (46.4) únicamente cuando el segundo término del primer miembro de la igualdad es pequeño comparado con el primero, es decir, debe tenerse ñ[a"/a' 2 / ~ 1, o bien jd(n/cr')/dxj ~ l. En primera aproximación tenemos, de acuerdo con (46.5), condición obtenida se puede escribir en la forma: jd(.\/21r)/dxj ~ 1, a' = p, de modo que la (46.6) donde ). = J./2n y }.(x) = 2nnlp(x) es la longitud de onda de de Broglie de la partícula expresada en función de x mediante la función clásica p(x). Hemos obtenido así una condición cuantitativa que expresa el carácter cuasiclásico; la longitud de onda de la partícula debe variar poco a lo largo de distancias que son del mismo orden que ella misma. Las fórmulas deducidas aquí dejan de ser aplicables en aquellas regiones del espacio en las que esta condición no se cumple. La condición (46.6) puede escribirse también en otra forma, observando que (1) Como es sabido, J p dx es la parte de la acción que no depende del tiempo. La acción mecánica total S de la partícula es S = - Et ± Jp dx. En a 0 el término - Et no existe debido a que la función de onda considerada es la independiente del tiempo, "P· 185 La /unción de onda en el caso cuasiclásico dp - dx d = -y[2m(E- U)] dx mdU = -- - pdx mlF/ = -, p donde F = - dU/dx es la fuerza clásica que actúa sobre la partícula situada en el campo exterior. Introduciendo esta fuerza, encontramos: mlílF/(p3 ~ l. (46.7) Se sigue de aquí que la aproximación cuasiclásica deja de ser aplicable cuando el impulso de la partícula es demasiado pequeño. En particular, es claramente inaplicable cerca de los puntos de retroceso, es decir, cerca de aquellos puntos en los que la partícula, según la mecánica clásica, se pararía para empezar luego a moverse en sentido opuesto. Estos puntos vienen determinados por la igualdad p(x) = O, es decir, E = U(x). Para p -> O, la longitud de onda de de Broglie tiende a infinito y es claro que en ningún caso se puede entonces considerar pequeña. Pasemos ahora al cálculo del término siguiente en el desarrollo (46.3). Los términos de primer orden respecto de·ñ en la ecuación (46.4) nos dan de donde a'¡' = -a0 "/2a0 ' = -p'/2p. Integrando, se encuentra: a1 = -! logp, (46.8) (prescindimos de la constante de integración). Substituyendo la expresión obtenida en (46.1), (46.3), obtenemos la función de onda en la forma: (46.9) Los términos siguientes en el desarrollo (46.3) conducirían a la aparición de términos de primer orden y de orden superior respecto de ñ en los coeficientes de las exponenciales; por lo general, estos términos no son necesarios en los cálculos. La presencia del factor 1!V p en la función de onda admite una simple interpretación. La probabilidad de encontrar la partícula en puntos cuyas coordenadas están comprendidas entre x y x+dx viene determinada por el cuadrado 11') 2, es decir, es proporcional en esencia a 1/p. Esto es precisamente lo que era de esperar para una « partícula cuasiclásica », puesto que en el movimiento clásico el tiempo que pasa la partícula en el segmento dx es inversamente proporcional a la velocidad (o al impulso) de la misma. J El cmw cua.o1iclásico 186 En las regiones del espacio « clásicamente inaccesibles », donde E < U(x), la función p(x) es imaginaria pura, de modo que los exponentes son reales. Escribiremos la función de onda en estas regiones en la forma: C' C' vlPI '\IIPI Y, = _ 1_e-(l /11,)J IP I dx +-2-e{l /h)f IP ldx. (46.10) PROBLEMAS Determinar la función de onda en la aproximación cuasiclásica hasta los términos del orden de h inclusive en el coeficiente de la exponencial. Solución. Los términos del orden de lt 2 en la ecuación (46.4) nos dan ªo' ª2' +icri' 2 +icri'' = O, de donde (substituyendo (46.5) y (46.8) en vez de a 0 y a 1) Integrando (el primer término se integra por partes) e introduciendo la fuerza F = pp'/m obtenemos: La función de onda en esta aproximación es de la forma: o bien J(F2jp5) dx . . 2 3-}ilím y, = constante [1-iimñF/p vP § 47. J ]e<illtl P dx. Condiciones en los límites en el caso cuasi clásico Sea x = a un punto de retroceso (de forma que U(a) = E) y supongamos que U> E para todo x > a de forma que la región a la derecha del punto de retroceso es clásicamente inaccesible. La función de onda debe tender a cero a medida que se penetra en esta región. A suficiente distancia del punto de retroceso, dicha función tiene la forma para x > a, (47.1) que corresponde al primer término de (46.10). En cambio, a la izquierda del punto de retroceso, la función de onda debe venir representada por la combinación real 187 Condiciones en los límites en el caso cua.,;iclásico (46.9) de dos soluciones cuasiclásicas de la ecuación de SCHRODINGER: ~ = ~: exp(H pdx)+ ~; exp(-H pdx) para a x < a. (47.2) a Para determinar los coeficientes de esta combinación hay que seguir la marcha de la función de onda desde valores positivos de x - a (donde es válida la expresión (47.1)) a valores negativos. Sin embargo, al hacerlo habría que atravesar el dominio en torno del punto de retroceso, donde la aproximación cuasiclásica es ·inaplicable y es necesario considerar la solución exacta de la ecuación de ScHRODINGER (1). Es posible evitar este paso si se considera formalmente '1/J como una función de la variable compleja x y se pasa de valores positivos a valores negativos de x - a a lo largo de un camino situado todo él en un dominio suficientemente alejado del punto a, dominio en el cual se cumple formalmente la condición para el carácter cuasi clásico. Sigamos primero la variación de la función de onda (47.1) al rodear el punto a de derecha a izquierda a lo largo de una semicircunferencia de radio grande situada en el semiplano superior de la variable compleja x. Para mayor claridad escribamos (47.1) en la forma v(2m) IX ) if,(x)=!C[2m(U-E)]-lf4exp ( - l i - v[U(x)-E]dx, (47.3) a poniendo de manifiesto explícitamente la función p(x). Es desde luego evidente que, al recorrer el camino indicado, la función (47.3) debe en definitiva transformarse en el segundo término que aparece en (47.2), dado que todo a lo largo de dicho camino es precisamente ese término el fundamental en comparación con el primer término, que tiende a cero exponencialmente a medida que penetramos en el semiplano superior. Y, en efecto, cuando x varía a lo largo de dicho camino,la fase de la diferencia U(x) - E, junto con la fase de la diferencia x - a, aumenta en n. Por consiguiente, la función (47.3) pasa a coincidir con el segundo término de (47.2) con un coeficiente C2 = !Ce-i11'!4. De manera análoga, al recorrer la semicircunferencia de derecha a izquierda en el semiplano inferior, la función (47.3) se transforma en el primer término de (47.2) con el coeficiente A la función de onda (47.1) para x > a corresponde así para x <ala función (2) (1) Cerca del punto de retroceso E - U "-' F0 (x - a) (donde F., = - (dU/dx)x=ª; la correspondiente solución exacta de la ecuación de ScHRODINGER viene dada por las fórmulas obtenidas en el § 24. 2 ( ) Si la región en la que U < E se encontrara a la derecha del punto de retroceso x (47.4) sería entonces necesario escribir: b ~= ~P cosGJ pdx+VT) X = b, en vez de X = ~p senG f p dx+!1r). b (47.4a) 188 El caso cuasiclásico para x < a. (47.4) Las funciones (47.1) y (47.4) son expresiones aproximadas, a la derecha y a la izquierda del punto de retroceso, de la misma solución exacta de la ecuación de SCHRODINGER (H. KRAMERS, 1926). Si la región clásicamente admisible está limitada (para x = a) por un « muro de potencial » infinitamente alto, la condición de contorno para la función de onda en x = a es 1p = O (véase § 18). La aproximación cuasiclásica es aplicable en este caso hasta el propio « muro » y la función de onda es: 1f X e if, = -senv'P ñ para x < a, pdx (47.5) a para x > a. § 48. Regla de cuantificación de Bohr-Sommerfeld Los resultados obtenidos permiten deducir la condición que determina los niveles cuánticos de energía en el caso cuasiclásico. Para ello consideremos el movimiento unidimensional finito de una partícula en un pozo de potencial; el dominio accesible clásicamente, b s x s a, está limitado por los dos puntos de retroceso (1). La condición de contorno en el punto x del mismo) a la función de onda (47.4a) = b conduce (en la región a la derecha (48.1) (1) En la mecánica clásica, una partícula en un campo de esta naturaleza efectuaría un movimiento periódico con período (tiempo empleado en el movimiento de ida y vuelta del punto b al punto a) a T = 2 f dx/v b (v es la velocidad de la partícula). a = f 2m dx/p, b Regla de cuantificación de Bohr-Sommer/eld 189 Aplicando la fórmula (47.4) a la región a la izquierda del punto x = a, obtenemos la misma función en la forma .¡, = v'P sen[1Ji f p dx+t,,-J a C' :.r: Para que estas dos expresiones coincidan en toda la región, la suma de las fases (que es una constante) debe ser un múltiplo entero de n: a ~ f p dx+},r = (n+l),,, b (con C = (- l)nC'). De aquí resulta . donde la integral fp f p dx = 2 Jp d.x dx = 21rn(n+!), (48.2) se extiende a todo un período del movimiento & clásico de la partícula. Ésta es precisamente la condición que determina en el caso cuasiclásico los estados estacionarios de una partícula. Dicha condición corresponde a la regla de cuantificación de Bohr-Sommerfeld de la antigua teoría cuántica. Es fácil ver que el número entero n es igual al número de ceros de la función de onda y coincide, por consiguiente, con el número ordinal del estado estacionario. En efecto, la fase de la función de onda (48.1) crece desde n/4 en el punto x = b a (n+nn en el punto x = a, de forma que la función seno se anula en este intervalo n veces (fuera del intervalo b s:: x ::;; a, la función de onda decrece con monotonía, sin anularse en ningún punto a distancia finita) (1). Recordemos en relación con esto que la aproximación cuasiclásica, y, por lo tanto, también la regla de cuantificación (48.2), es aplicable solamente para grandes valores de n (2). Para la normalización de la función de onda basta integrar j v,¡ 2 en el intervalo b s:: x s:: a, ya que fuera de él v,(x) disminuye exponencialmente. Dado que el argumento del seno en (48.1) es una función que varía rápidamente, con precisión suficiente podemos substituir el cuadrado del seno por su valor medio, es decir, por 1/ 2 • Obtenemos entonces: (1) En rigor, el cálculo del número de ceros debería efectuarse teniendo en cuenta la forma exacta de la función de onda cerca de los puntos de retroceso. Este análisis confirma el resultado indicado en el texto. 2 ( ) En algunos casos la expresión exacta de los niveles de energía E(n) (como función del número cuántico n) obtenida a partir de la ecuación exacta de SCHRODINGER es tal que paran---+ oo conserva su forma: ejemplo de ello lo ofrecen los niveles de energía en un campo coulombiano y los niveles de energía del oscilador armónico. Es natural que en estos casos la regla de cuantificación de BOHR, aplicada para valores grandes den, dé para la función E(n) una expresión que coincide con la exacta. 190 El caso cuasiclásico a f 2 1"11 dx f ~ tc ~ p(x) 2 b = TTC2/2mw = 1, donde w = 2:n/T es la frecuencia del movimiento periódico clásico. Así, pues, la función cuasiclásica normalizada es ~ = J1: se{Hp dx+!,rJ (48.3) b Hay que recordar que la frecuencia w es, en general, diferente para los diferentes niveles, siendo una función de la energía. La relación (48.2) se puede interpretar de otra manera todavía. La integral dx es el área limitada por la trayectoria cerrada clásica en el espacio de las fases de la partícula (es decir, por la curva en el plano p, x del espacio de las fases de la misma). Dividiendo esta área en celdas de área 2:nlf cada una, obtenemos en total n celdas. Pero n es el número de estados cuánticos con energías que no superan el valor dado de la energía (que corresponde a la trayectoria considerada en el espacio de las fases). Podemos decir así que en el caso cuasiclásico a cada estado cuántico corresponde una celda de área 2:n/ren el espacio de las fases. Dicho de otra manera, el número de estados que corresponden al elemento de volumen !:l.p !:l.x del espacio de las fases es fp (48.4) b.p!ix/2Trñ. Si se introduce en vez del impulso el número de onda k = p/li; este número se escribe en la forma 6.k 6.x/2;i y coincide, como era de esperar, con la conocida expresión del número de vibraciones propias de un campo de ondas (1). Partiendo de la regla de cuantificación (48.2), se puede explicar el carácter general de la distribución de niveles en el espectro energético. Sea !:l.E la distancia entre dos niveles consecutivos, es decir, entre dos niveles cuyos números cuánticos n difieren en una unidad. Dado que !:l.E es pequeño tpara n grande) respecto a la propia energía de los niveles, basándonos en (48.2) podemos escribir: M f (8p/8E) dx = 2Trñ. Pero oE/óp = v, de modo que: f (8p/8E) dx = f dx/v = T. 1 ( ) Véase, por eJemplo, vol. II, Teoría Clásica de los Campos, § 52. Regla de cuantificación de Bohr-Sommerfeld 191 Obtenemos, por lo tanto: !lE = 21Tli/ T = liw. (48.5) Así, pues, la distancia entre dos niveles de energía consecutivos resulta ser igual a liw. Para toda una serie de niveles vecinos (tales que la diferencia de sus números n es pequeña comparada con los propios valores de n), las correspondientes frecuencias w se pueden considerar iguales aproximadamente. Por lo tanto, llegamos a la conclusión de que en cada pequeño intervalo de la parte cuasiclásica del espectro los niveles se distribuyen de manera uniforme, estando separados cada dos por el mismo intervalo liw. Este resultado, dicho sea de paso, era ya de esperar, puesto que en el caso cuasi clásico las frecuencias correspondientes a transiciones entre diferentes niveles de nergía deben ser múltiplos enteros de la frecuencia clásica w. Es interesante ver en qué se transforman los elementos de matriz de una magnitud física f cualquiera al pasar al límite clásico. Partamos para ello del hecho de que el valor medio f en un cierto estado cuántico debe transformarse, en el límite, simplemente en el valor clásico de dicha cantidad, con tal que el propio estado conduzca, en el límite, a un movimiento de la partícula a lo largo de una trayectoria determinada. A un estado de esta naturaleza corresponde un paquete de ondas (véase§ 6) que se obtiene superponiendo toda una serie de estados estacionarios con valores de la energía próximos entre. sí. La función de onda de dicho estado es de la forma: donde los coeficientes an difieren apreciablemente de cero tan sólo en un cierto intervalo ~n de valores del número cuántico n, intervalo tal que 1 ~ ~n ~ n; los números n se suponen grandes, de acuerdo con el carácter cuasiclásico de los estados estacionarios. El valor medio de fes igual, por definición, a o bien, substituyendo la suma respecto de n, m por una suma respecto de n y de la diferencia s = m - n: f _ ns ªn+s*ªnJn+, • neiwst, - donde se ha hecho wmn = ~~ .f ¿,.,(.,¡ sw en correspondencia con (48.5). Los elementos de matriz fnm calculados a partir de las funciones de onda cuasiclásicas disminuyen rápidamente en valor absoluto al aumentar la diferencia m - n, resultando a la vez ser funciones lentamente variables del propio número n (para un valor dado de m - n). En vista de esto, se puede escribir aproximadamente f = :E:E J eiwst = :En lan ¡2 ~fseiwst, ns a n*a ns 8 192 El caso cuasiclásico donde se ha introducido la notación f 8 = f ñ+s,ñ, ñ y ñ es un cierto valor medio del número cuántico en el intervalo lln. Pero i:¡anl 2 = 1; por lo tanto, J= ~f,éwst. 8 La suma obtenida tiene la forma de una serie de Fourier ordinaria. Dado que f debe coincidir en el limite con la cantidad clásica f(t), llegamos al resultado de que los elementos de matriz.(mn se reducen, en el límite, a las componentes f m-n del desarroJlo de la función clásica f(t) en serie de Fourier. Análogamente, los elementos de matriz correspondientes a las transiciones entre estados del espectro continuo se transforman en las componentes de la representación de/(t) por una integral de Fourier. Para ello, sin embargo, las funciones de onda de los estados estacionarios deben normalizarse respecto de la función-6 de la energía, dividida por lí. Todos los resultados expuestos se generalizan desde luego a los sistemas con varios grados de libertad que efectúan un movimiento finito tal que el problema de mecánica (clásica) permite una separación completa de las variables en el método de Hamilton-Jacobi (es decir, en el llamado movimiento cuasiperiódico) (1). Después de separar las variables para cada grado de libertad, el problema queda reducido a un problema unidimensional y las correspondientes condiciones de cuantificación tienen la forma: (48.6) donde la integral se extiende a un período de variación de la coordenada generalizada q; y}'; es un número del orden de la unidad que depende del carácter de las condiciones de contorno para el grado de libertad considerado (2). En el caso general de un movimiento multidimensional cualquiera (no cuasiperiódico), no existen los números cuánticos n;. En cambio, el concepto de «celdas» en el"espacio de las fases es siempre aplicable (en la aproximación cuasiclásica). Esto es claro por lo dicho antes acerca de la relación de este concepto con (1) (2) Véase vol. I, Mecánica, § 50. Así, para el movimiento en un campo central: f Pr dr = 21rñ(nr+i), f Po dB = 21rli(l-m+i), f p'P dcf, = 21rlim, (donde nr = n - 1 - 1 es el número cuántico radial). La última igualdad expresa simplemente el hecho de que Pq> es la componente-z del momento cinético, igual a hm. Movimiento cuasiclásico en un campo central 193 el número de vibraciones propias del campo de ondas en el volumen dado del espacio. En el caso general de un sistema con s grados de libertad, a cada elemento del espacio de las fases corresponden (48.7) ~N = ~q1 ··· ~qs~Pi ... ~Ps/(21rli) 8 estados cuánticos. PROBLEMAS l. Determinar (aproximadamente) el número de niveles discretos de energía de una partícula que se mueve en un campo U(r) que satisface la condición relativa al carácter cuasiclásico. Solución. El número de estados que « corresponden » al volumen del espacio de las fases definido por los impulsos comprendidos en el intervalo O < p < Pmax y por las coordenadas de la partícula pertenecientes al elemento de volumen d V es igual a Para un r dado, la partícula puede poseer (en su movimiento clásico) un impulso que satisface la condición E= p 2/2m+U(r) < O. Substituyendo Pmax = V-2mU(r), obtenemos el número total de estados del espectro discreto: v'2 m3/2 -31r2 li3 f (-U)ªl 2 dV, donde la integración se extiende a la región del espacio en la que U < O. Esta integral diverge (el número de niveles es infinito) si U tiende a cero en el infinito como r- 8 , con s < 2, lo que está de acuerdo con los resultados del § 18. 2. El mismo problema, pero para un campo central clásico U(r) (V. L. Pokrovskii) Solución. En un campo central, el número de estados no coincide con el número de niveles de energía debido a la degeneración de estos últimos en la dirección del momento cinético. El número buscado podemos hallarlo observando que el número de niveles con un valor dado del momento cinético M coincide con el número de niveles (no degenerados) para el movimiento unidimensional en un campo con energía potencial Ue¡ = U(r)+M 2/2mr 2 • El valor máximo posible del impulso Pr para un r dado y energías E < O es Pr max = - V2mUe¡, Por consiguiente, el número de estados (es decir, el número de niveles) es igual a f dr dpr = v'(2m) 21rli 21rli f J(-u- ~) dr. 2mr2 El número total buscado de niveles discretos se obtiene a partir de aquí integrando respecto de M/h (que substituye en el caso cuasiclásico a la suma respecto de /) y es igual a (m/41i2) § 49. f (- U)r dr. Movimiento cuasiclásico en un campo central Conforme sabemos, en el movimiento de una partícula en un campo central la 194 El caso cuasiclásico función de onda se descompone en una parte angular y una parte radial. Consideremos ante todo la primera de ellas. La dependencia de la función de onda angular respecto del ángulo <p (determinada por el número cuántico m) es tan sencilla, que para ella no se plantea la cuestión de hallar fórmulas aproximadas. En cambio, en lo que concierne a su dependencia respecto del ángulo polar o, esta dependencia es, de acuerdo con la regla general, cuasiclásica si el númer9 cuántico que le corresponde, /, es grande (una formulación más precisa de esta condición _se dará más adelante). Nos limitaremos aquí a deducir la expresión cuasiclásica de la función angular tan sólo para el caso de los estados con número cuántico magnético igual a cero (m = O), que es el más importante en las aplicaciones. Esta función coincide, salvo un factor constante, con el polinomio de Legendre P1(cos()) (véase (28,7)) y satisface la ecuación diferencial (49.1) La substitución Pz(cosB) = x(B)/y'senB (49.2) x" + [(l-H) 2 +i cosec2B]x = O, (49.3) conduce a la ecuación que no contiene la derivada primera y que por su aspecto es análoga a la ecuación unidimensional de ScHRODINGER. En la ecuación (49.3) el papel de « longitud de onda de De Broglie » lo representa la cantidad ,\ = 27T í(l+!)2+! cosec 2 BJ-l/2. La condición de que la derivada dÁ/dx sea pequeña(condición (46.6)) conduce a las desigualdad es Bl ~ 1, (7r-B)l ~ 1, (49.4) (condiciones para que la parte angular de la función de onda se pueda considerar como cuasiclásica). Para grandes valores de l estas condiciones quedan satisfechas ca5i en todo el intervalo de valores o, con la única excepción de los ángulos muy próximos a cero o a n. · Si se cumplen las condiciones (49.4), se puede prescindir en la ecuación (49.3) del segundo término entre paréntesis rectos frente al primero: x" +(l+U2x = o. 195 Movimiento cuasiclásico en un campo central La solución de esta ecuación da: X= ysenO Pz(cosO) = Asen[(l+!)O+(X], (A, <1.. (49.5) son constantes). Para ángulos O ~ 1, en la ecuación (49 .1) se puede hacer ctgO ""' 1/O; substituyendo también aproximadamente en vez de l(l+ 1) el valor (1+ 1 / 2) 2, obtenemos la ecuación d2P 1 dP1 1 -+-+(l+!) P, = d0 O dO 2 2 O ' que tiene como solución la función de Bessel de orden cero P1(cos0) =]0 [(l+!j8], (49.6) 8 ~ l. El factor constante lo hacemos igual a la unidad, puesto que para e= O debe ser P 1 = l. La expresión aproximada de (49.6) para P 1 es válida para todos los ángulos O ~ 1. En particular, es posible aplicarla también para ángulos en la región 1/ l ~ O ~ 1, donde debe coincidir con la expresión (49.5), que es válida para cualesquiera O ~ 1/l. Si 0/ ~ 1, la función de Bessel se puede substituir por su expresión asintótica para grandes valores del argumento, con lo que obtenemos: J_:_ sen[(l+!)O+t,r] Pi ~ yO 1rl (en el coeficiente se puede prescindir del sumando ! frente a /). Comparando con (49.5), encontramos que A = VC2/ ni) <l.. = n/4. Se obtiene así en definitiva la siguiente expresión para P1 ( cos O), válida en el caso cuasiclásico (1): Pz(cosO) ~ 2 sen[(l+!)O+b] . 1rl ysen8 J (49.7) La normalización de la función de onda 0 10 se consigue, según (28. 7), multiplicando por ¡1 V(!+~) ,..., ¡1 V l: 0zo(8) . J2sen[(l+!)0+!1r] . 7T ysenO ~ il (49.8) Pasemos a la componente radial de la función de onda. En el § 32 se demostró que la función x(r) = rR(r) satisface una ecuación que es idéntica a la ecuación (1) Conviene llamar la atención sobre el hecho de que, precisamente como resultado de la substitución de /(/+ 1) por (/+} )2, hemos obtenido una expresión que queda multiplicada por (- J)I al cambiar O por ::r -0, cual debe ser para la función Pz{cos 0). 196 unidimensional de El caso cuasiclásico ScHRODINGER U1(r) con una energía potencial ñ2 l(l+ 1) = U(r)+- - -2 . 2m r Por consiguiente, podemos aplicar los resultados obtenidos en los párrafos precedentes, entendiendo por energía potencial la función Uz(r ). El caso más simple es el de l = O. No existe entonces energía centrífuga, y si el campo U(r) satisface la condición necesaria (46.6), la función de onda radial será cuasiclásica en todo el espacio. Para r = O debe ser x = O, por lo que la función cuasiclásica x(r) viene determinada según las fórmulas (47.5). En cambio, si l =I= O, también la energía centrífuga debe satisfacer la condición ( 46.6). En la región en que r es pequeño, región en que la energía centrífuga es del mismo orden de magnitud que la energía total, la longitud de onda es A= li/p ,._ r/l, y la condición (46.6) nos da l ~ l. Así, pues, si les pequeño, en la región en que también r es pequeño la energía centrífuga no cumple la condición que impone el carácter cuasiclásico. Es fácil comprobar que se obtiene el valor correcto de la fase de la función de onda cuasiclásica x(r) si la calculamos mediante las fórmulas del movimiento unidimensional substituyendo en la energía potencial Uz(r) el coeficiente l(l +1) por (l + n2 ( 1): l]z(r) = n2 (Z+t)2 U(r)+ - - - . 2m ,2 (49.9) La cuestión de la aplicabilidad de la aproximación cuasiclásica al campo coulombiano U= ± rf-/r exige consideración especial. De toda la región en que tiene lugar el movimiento, la parte más importante es la que corresponde a distancias r para las cuales IU/ ,. ., [EJ, es decir, r,...,, rf-/lE[. La condición para que el movimiento sea cuasiclásico en este dominio se reduce a la condición de que la longitud de onda A 2m[EI sea pequeña comparada con las dimensiones rf-/\E\ de la región; esto nos da: "'lí!V (49.10) es decir, el valor absoluto de la energía debe ser pequeño comparado con la energía de la partícula en la primera órbita de Bohr. La condición (49.10) se puede escribir también en la forma rxjñv ~ 1, (49.11) (1) Así, en el caso más sencillo, que es el del movimiento libre ( U = O), la fase de la función calculada según la fórmula (47.4) con el valor uz dado por (49.9) será igual, para grandes valores de r, a kr - nl/2, cual debe ser. 197 Movimiento cuasiclásico en un campo central V donde v "' IE !fm es la velocidad de la partícula. Obsérvese que esta condición es la opuesta a la condición de aplicabilidad de la teoría de perturbaciones al campo cóulombiano (45. 7). En cuanto a la región de distancias pequeñas (1 U(r)I ~ E), en un campo coulombiano repulsivo esta región carece de interés, ya que si U> E las funciones de onda cuasiclásicas tienden a cero exponencialmente. Si, en cambio, el campo es atractivo, para valores pequeños de l existe la posibilidad de que la partícula penetre en una región en la que j UJ ~ jEJ, con lo cual se plantea la cuestión de los límites de aplicabilidad de la aproximación cuasiclásica en este caso. Partamos de la condición general (46. 7), haciendo en ella: = -dU/dr p ~ v'(2ml UI) ""'v'(m(J./r). Se obtiene así que la región de aplicabilidad de la aproximación cuasiclásica viene limitada a las distancias F = - (J./r 2, r~ n/mrx., 2 (49.12) es decir, a distancias que son grandes comparadas con el «radio» de la primera órbita de Bohr. PROBLEMA Determinar el comportamiento de la función de onda cerca del origen de coordenadas si para ± rx/r8 con s > 2. r-+ O el campo tiende a infinito como Solución. Para valores de r suficientemente pequeños, la longitud de onda es tal que " _, ñ/ v(m! Uf) _, lir8 12 / v(mcx), con lo cual d,\/dr-, ñ.r•/2-1/y(mcx) ~ 1; se cumple así la condición que supone el carácter cuasiclásico. En un campo de atracción se tiene Ui-+ - oo para r-+ O. La región en tomo del origen de coordenadas es, en este caso, clásicamente accesible y la función de onda radial es x ,_, 1/VP, de donde !p-., rs/4-1. En urt campo repulsivo, la región en que r es pequeño no es accesible clásicamente. En este caso la función de onda tiende exponencialmente a cero para r-+ O. Prescindiendo del coeficiente de la función exponencial, tenemos: r I" - ex{ -~I f P drlJ. o bien I" - r o exp( 2v'(2m(J.)r-Cs/2-1>). (s-2)/i 198 § 50. El caso cuasiclásico Paso a través de una barrera de potencial Consideremos el movimiento de una partícula en un campo de la forma representada en la figura 13, campo caracterizado por la existencia de una barrera de potencial, es decir, por la existencia de un intervalo en el que la energía potencial U(x) es mayor que la energía total E de la partícula. En la mecánica clásica, una barrera de potencial es « impenetrable » para una partícula; en la mecánica cuántica, en cambio, la partícula puede pasar « a través de la barrera» con una probabilidad diferente de cero (véase también el problema 2, § 25). Si el campo U(x) satisface las U(x) a b Frn. 13 condiciones que requiere el carácter cuasiclásico, el coeficiente de transmisión de una barrera se puede calcular de forma general. Observemos que estas condiciones conducen, en particular, a que la barrera debe ser « ancha », y por ello el coeficiente de transmisión será pequeño en el caso cuasiclásico. Para no interrumpir cálculos ulteriores, resolvamos antes el sigu ente problema. Supongamos que la función de onda cuasiclásica tiene la forma de una onda móvil en la región a la derecha del punto de retroceso x = b (donde U(x) < E): (50.1) Se trata de hallar la función de onda de este mismo estado en la región en que x < b (1). Busquemos para ella una expresión de la forma (50.2) que crece a medida que penetramos en la región x < b; prescindimos del término que decrece exponencialmente frente al término creciente. Para determinar el coe(1) En el problema relativo al paso a través de una barrera de potencial nos encontramos ante un movimiento que es infinito en ambos sentidos; los correspondientes niveles son doblemente degenerados (véase § 21 ), con lo que las funciones de onda no son necesariamente reales. Paso a través de una barrera de potencial 199 ficiente C' procederemos de la siguiente manera. Observemos que, según las fórmulas (47 .1) y (47.4a), existe una correspondencia entre las funciones (50.3) if, = _l_ 2v11P1 exp{-~I fxp dxl) para . 1t x < h. b Por otra parte, entre dos soluciones exactas diferentes, "Pi y dimensional de ScHRODINGER existe la relación (21.2) i/,1i/J2' -i/;2i/;i' 1P2, de la ecuación uni- =constante. Apliquemos esta relación al caso en que "Pi es la solución definida por las fórmulas (50.1-2) y tp2 es la solución (50.3). A la izquierda del punto x = b tenemos: i/,1i/J2' -i/J2i/Ji' = -i/J22(i/J1N2)' = C'Jñ, mientras que a la derecha encontramos, en cambio: i/J1i/J2' -i/J2i/Ji' = i/;i2(i/J2/i/;1)' = -iC/ñ. Igualando estas dos expresiones obtenemos C' = - iC. Así, pues, la función de onda cuasiclásica buscada tiene la forma: para x < b, .¡, ·e = - 11 ;/p/ exp(,¡ f pdxl)• X b =; exp(H (50.4) X para x > b, .¡, pdx-li")· b Pasemos ahora al cálculo del coeficiente de penetrabilidad de la partícula a través de la barrera. Supongamos que la partícula incide sobre ella en el sentido de izquierda a derecha. Dado que la probabilidad de que atraviese la barrera es pequeña en el caso cuasiclásico, basta, con precisión suficiente, escribir la función de onda en la región I (fig. 13), antes de la barrera, como si la barrera fuese totalmente impenetrable, es decir, en la forma (47,4): X .¡, = ~v co{~ fp dxH"J. a (50.5) 200 El caso cuasiclásico (hemos introducido la velocidad v = p/m, y acerca de la elección del coeficiente de normalización, véase más abajo). Si escribimos esta función como suma de dos expresiones complejas el primer término (que para x ~ - = se reduce a la onda plana '1/J eipx/ll) representa una partícula que incide sobre la barrera, y el segundo término, una partícula que es reflejada por ella. La normalización elegida corresponde a una densidad de corriente de probabilidad igual a la unidad en la onda incidente. f"'o,J Al otro lado del punto de retroceso x = a (en la región II dentro de la barrera) a la función de onda (50.5) corresponde, según los resultados del§ 47, la función (50.6) Escribiendo esta última en la forma: (50.7) y aplicando las fórmulas (50.4), encontramos la función de onda en la región III: b 1 .¡, = Vv exp [ 11 :,; i -¡¡lf dx/+¡¡f p dx+!i,J a (50.8) b La densidad de corriente en la región III calculada mediante esta función es (50.9) Dado que la densidad de corriente en la onda que incide"sobre la barrera se ha elegido igual a la unidad, la cantidad D representa precisamente el coeficiente de transmisión de la barrera. Subrayaremos que esta fórmula es solamente aplicable cuando la expresión que aparece en el exponente es grande, de forma que el propio D es pequeño. En lo que precede se ha supuesto que el campo U(") satisface la condición que corresponde al caso cuasiclásico en toda la extensión de la barrera (excluyendo solamente los entornos inmediatos de los puntos de retroceso). De hecho, sin embargo, con frecuencia hay que considerar barreras en las que la curva de la energía Paso a través de una barrera de potencial 201 potencial es tan escarpada en uno de los lados, que la aproximación cuasiclásica resulta inaplicable. El factor exponencial que aparece en D sigue siendo el mismo que en la fórmula (50.9), pero el coeficiente de la exponencial (igual a la unidad en (50.9)), cambia. Para calcularlo es necesario, en principio, calcular exactamente la función de onda en la región « no cuasi<;lásica » y, de acuerdo con ella, determinar la función de onda cuasiclásica dentro de la barrera. En la fórmula (50.6) aparece entonces un coeficiente fJ distinto de la unidad, y en (50.9) un coeficiente /1 2 • PROBLEMAS 1. U(x) Determinar el coeficiente de transmisión de la barrera de potencial representada en la fig. 14: x < O, U(x) = U0 - Fx para x > O; calcular solamente el factor exponencial. = O para Solución. Un cálculo simple conduce al resultado 4y'(2m)(U. -E)ª/2} O 3hF • 2. Determinar la probabilidad de que una partícula (con momento cinético igual a cero) escape de un pozo de potencial que presenta simetría esférica: U(r) = - U0 parar< r0 , U(r) = cx/r para r > r0 (fig. 15). uCrJ U(x) FIG. 14 FIG. 15 Solución. El problema con simetría esférica se reduce a un problema unidimensional, de modo que se pueden aplicar directamente las fórmulas obtenidas más arriba. Tenemos: ro Calculando la integral, se obtiene finalmente: w ,_, exp J {Er E cos- JEr {-,;¡2a.J2m[ 1 0 --;-- 0 --;- ( Erº)}]) . 1----;- 202 El caso cuasiclásico En el caso límite r 0 ~ O esta fórmula se transforma en la siguiente w ~ e-(1ra/1i)V(2m/E) = e-2Tta/7tv. Estas fórmulas son aplicables cuando el exponente es grande, es decir, cuando a/hv ~ l. Esta condición, como debe ser, coincide con la condición (49.11) para que el movimiento en un campo coulombiano se pueda considerar cuasiclásico. 3. El campo U(x) está constituido por dos pozos de potencial simétricos (1 y II, fig. 16) separados por una barrera. Si la barrera fuese impenetrable para la partícula, existirían niveles de energía correspondientes al movimiento de la partícula en un pozo solamente o en el otro solamente, niveles que serían los mismos para ambos. La posibilidad de que se atraviese la barrera conduce a un desdoblamiento de cada uno de estos niveles en dos niveles próximos que corresponden a estados en los que la partícula se mueve a la vez en ambos pozos. Determinar la magnitud del desdoblamiento (el campo U(x) se supone cuasiclásico). Solución. Sea E0 un nivel cualquiera correspondiente al movimiento de la partícula en uno de los pozos (digamos, en el pozo I), y %(X) la correspondiente función de onda (normalizada de forma que la integral % 2 en la región del pozo I sea igual a la unidad). Al tener en cuenta la pequeña probabilidad de paso a través de la barrera, el nivel se descompone en los niveles E 1 y E 2 , con funciones de onda que son la combinación simétrica y antisimétrica de tpo(x) y %(-x): ipi(x) = (1/y'2)[ip0(x)+ifio(-x)], ip 2(x) = (1/y'2)[ip0(x)-ip0 (-x)]. (1) La función cuasiclásica '1/Jo(X) decrece exponencialmente fuera del pozo, en particular para valores negativos de x. Por consiguiente, en la región del pozo I la función tpo(- x) es despreciable comparada con '1/Jo(X), y en el pozo II ocurre lo contrario. Las funciones (1) se han normalizado de forma que son iguales a la unidad las integrales de sus cuadrados extendidas a los pozos I y 11. U(x) a FIG. 16 Escribamos las ecuaciones de multipliquemos la primera por tpi, X ScHRóDINGER la segunda por "Po, restemos miembro a miembro e integremos 203 Paso a través de una barrera de potencial respecto de x entre los límites O e =. Teniendo en cuenta que para x = O es tp1 = y 2tpo, tp1 ' =O y que f f C1J a) 1 if,0¡/,1 dx ~ - y'2 o = l/y'2, ¡/,0 2 dx o encontramos: De manera análoga para E 2 - E0 encontramos la misma expresión con signo opuesto. Así, pues, Mediante la fórmula (47.1), con el coeficiente C de (48.3), encontramos que donde v0 = V2(U0 -Eo)/m. Por consiguiente, a E,-E, = w: ex{-~ f !P! dx J. -a 4. Determinar el valor exacto del coeficiente de transmisión D (sin suponerlo pequeño) para una barrera de potencial parabólica U(x) = - (1/2)kx 2 (E. KEMBLE, 1935) (1). Solución. Para valores cualesquiera k y E, el movimiento es cuasiclásico a distancias suficientemente grandes !xi, donde p y'[2m(E+}kx2 )] = ~ xy'(mk)+Ey'(m/k)/x, y la forma asintótica de la solución de la ecuación de ScHRÓDINGER es 2 if, = constante X e±if 12f±i•-11 2, donde se han introducido las notaciones: g = x(mk/li2 ) 1 14, € = (E/li)y'(m/k). Nos interesa la solución que para x--?"+= contiene solamente la onda que ha atravesado la barrera, es decir, la onda que se propaga de izquierda a derecha. Hagamos: -+ oo, para X para X -+ - oo, ip = Beie12giE-1/2, if, = e-it121e1-ÍE-1/2 +Aé~2 /2lfli€-l/2. (1) (2) (1) La solución de este problema se puede aplicar también al paso a través de una barrera cualquiera U(x) a una altura suficientemente próxima de su máximo, barrera que depende cuadráticamente de x cerca del mismo. 204 El caso cuasiclásico El primer término en (2) representa la onda incidente, el segundo, la onda reflejada (el sentido de propagación de una onda es aquél en que crece su fase). La relación entre A y B se puede determinar partiendo del hecho que la expresión asintótica 1P es válida en todo dominio, suficienSigamos la variación de la función (1) al temente alejado, del plano complejo de la variable recorrer una semicircunferencia de radio grande situada en el semiplano superior de~ (cf. § 47). A lo largo de todo el camino, el término con ei$ 2 /2 es la parte principal de la solución, y por ello la función (1) debe transformarse, al final del recorrido, en el segundo término de la función (2). Por consiguiente, r A = B(é1T)ú-112 = -iBe-m. Por otra parte, la condición de que se conserve el número de partículas es A partir de estas dos relaciones encontramos el coeficiente de transmisión buscado D = IBl 2 : Esta fórmula es válida cualquiera que sea E. Si la energía es negativa y grande en valor absoluto, se obtiene D ~ e-211 IEI, de acuerdo con la fórmula (50.9). Para E > O la cantidad R = 1-D = 1/(1 +e21te) es el coeficiente de « reflexión por encima de la barrera». § 51. Cálculo de los elementos de matriz cuasiclásicos El cálculo directo de los elementos de matriz de cualquier magnitud física J mediante funciones de onda cuasiclásicas presenta grandes dificultades. Supondremos que las energías de los estados a los que se refiere la transición representada por el elemento de matriz que se quiere calcular no son próximas entre sí, de forma que dicho elemento no se reduce a la componente de Fourier de la magnitud!(§ 48). Las dificultades proceden de que, en virtud del carácter exponencial (con exponente imaginario grande) de las funciones de onda, el integrando resulta ser una cantidad rápidamente oscilante, lo que complica extraordinariamente incluso una estimación aproximada de la integral. Consideremos el caso unidimensional (movimiento en un campo U(x)) y supongamos, para simplificar, que el operador de la magnitud física fes simplemente función de la coordenada x. Sean "Pi y '11'2 las funciones de onda correspondientes a ciertos valores, E 1 y E 2, de la energía de la partícula (siendo E 2 > E 1, fig. 17); admitiremos que 1P1, ip2 se han elegido reales. Hemos de calcular la integral 00 /12 = Jf d ff2dx. (51.1) En las regiones a uno y otro lado del punto de retroceso x = a 1, pero no en la inmediata proximidad de este último, la función de onda t/'i tiene la forma (47.1), (47.4a): Cálculo de los elementos de matriz cuasiclásicos 205 para x < a 1 , (51.2) para x y análogamente para > a1 , 1112 ( cambiando el índice 1 por el 2). (x) -----E2 FIG. 17 Sin embargo, el cálculo de la integral (51.1) efectuado substituyendo en ella estas expresiones asintóticas para las' funciones de onda daría un resultado incorrecto. Ello se debe a que, como veremos más adelante, esta integral es una cantidad exponencialmente pequeña, mientras que la función integrando no es, de suyo, pequeña. Por consiguiente, incluso una variación relativamente pequeña de esta última modi.fica, en general, el orden de magnitud de la integral. Esta dificultad puede soslayarse de la siguiente manera. Representemos la función tp2 = tp2 + + tp2- descomponiendo el coseno (en la región x > aJ en suma de dos expresiones exponenciales. Según las fórmulas (50.4) tendremos [11 fz p dxI] , l/;2+ = --iC2 - - exp - 2v/P2I para x > a 2 , l/;2+ 2 n ªª [iñ fz p = -C - - exp - 2v/P2/ 2 2 ªª J dx-¡i1r ; (51.3) 206 El caso cuasiclásico la función tp-2 es la conjugada compleja de tJJ2 +[ tp2- = ( tJJ2 +)*]. La integral (51.1) se descompone también en suma de dos integrales conjugadas complejas, f 12 = f 12+ +f12- , que pasamos a calcular. Observemos ante todo que la integral 00 /12+ = f if,ifif,2+ dx -oo converge. En efecto, aunque la función tp2 + en la región x < a 2 tiende exponencialmente a =, la función tp1 tiende exponencialmente a cero todavía con mayor rapidez en la región x < a, (dado que en toda la región x < a2 tenemos !Pil > 1p 2 ¡). Consideremos la coordenada x como una variable compleja y desplacemos el camino de integración desde el eje real al semiplano superior. Cuando x presenta una parte imaginaria positiva, en la función tp1(y en la región x > a1) aparece un término creciente, pero en cambio la función tp2 + disminuye más rápidamente, ya que en toda la región x > a. tenemos p2 > p 1• Por consiguiente, el integrando disminuye. El camino de integración desplazado no pasa ya por los puntos x = a 1, a 2 situados sobre el eje re.al y cerca de los cuales la expresión cuasiclásica es inaplicable. Por lo tanto, a lo largo de dicho camino se puede utilizar para tp1 y tp2 las funciones que son sus expresiones asintóticas en el semiplano superior. Estas funciones son o: ,f,, = 2[2m(i~E,)]''' expG fv'{Zm(U-E,)} dxJ. ª1 (51.4) donde las raíces se determinan de forma que sobre el eje real y en la región x sean positivas < a2 En la integral /12+ -iC1 C2 f = 4y(2m) exp li fa:v{2m(U-E1)} dx-¡1 fa:y{2m(U-E2)} dx [1 f(x) dx x~~~~~~~- [(U-E1)(U-E )]1/4 J X (51.5) 207 Cálculo de los elementos de matriz cuasiclásicos veamos de desplazar el camino de integración de forma tal que, en lo posible~ disminuya el factor exponencial. El exponente presenta un extremo tan sólo en los puntos en los que U(x) = = (para E 1 ,=/: E 2 su derivada respecto de x no se anula en ningún otro punto). Por consiguiente, el contorno de integración desplazado al semiplano superior viene limitado solamente por la necesidad de evitar los puntos singulares de 1a función U(x); según la teoría general de las ecuaciones diferenciales lineales, dichos puntos coinciden con los puntos singulares de las funciones de onda v{x). La elección concreta del contorno depende de la forma concreta del campo U(x). Así, si la función U(x) presenta en el semiplano superior tan sólo un punto singular, x = x 0 , se puede efectuar la integración a lo largo de un camino del tipo representado en la fig. 18. El papel principal lo representa en la integral la vecindad inmediata del punto singular, de forma que el elemento de matriz buscado / 12 = = 2 ref+ 12 es, en esencia, proporcional a una expresión exponencialmente pequeña que se puede representar en la forma: Xo J12 - Xo exp(- ~im[ f v'[2m(E2-U)] dx- f v'[2m(E1- U)] dx]) (51.6) (L. LANDAU, 1932) (1). Como límites inferiores de las integrales se pueden elegir puntos cualesquiera en la regiones clásicamente accesibles; la elección que se haga no influye, evidentemente, sobre la parte imaginaria de las integrales. Si la función U(x) presenta más de un punto singular en el semiplano superior, como punto x0 en (51.6) debe elegirse un punto para el que el exponente tome el menor valor absoluto (2). FIG. 18 (1) La substitución de las funciones de onda por sus expresiones asintóticas que hemos efectuado al deducir (51.5-6), es lícita, ya que el orden de magnitud de la integral, tomada a lo largo del contorno representado en la fig. 18, viene determinado por el orden de magnitud del integrando, y, por lo tanto, una variación relativamente pequeña de este último no influye esencialmente en el valor de la integral. (2) Suponemos que la propia función f(x) no posee puntos singulares. El caso cuasiclásico 208 El cálculo de los elementos de matriz cuasiclásicos correspondientes al movimiento en un campo central se efectúa siguiendo el mismo método. Sin embargo, por U(r) debemos entender ahora la energía potencial efectiva (suma de las energías potencial y centrífuga) y será distinta para estados con valores distintos de /. Con vistas a aplicaciones ulteriores del método que acabamos de exponer, escribiremos las energías potenciales efectivas en dos estados en una forma general, como funciones Ui(r) y U2(r). El exponente del factor exponencial en el integrando de 51.5) presentará entonces un extremo no sólo en los puntos en los que o U1(r) o Ulr) tienden a infinito, sino en los puntos en los que (51.7) Por lo tanto, en la fórmula ro /i2 - r0 exp(-iim[f v'[2m(E2-U2)] dr- fv'[2m(E1-U1)] dr ]) (51.8) entre los posibles valores de rO hay que considerar no solamente los puntos singulares de U1 (r) y de U2(r), sino también las raíces de la ecuación (51.7). El caso de un potencial central difiere, además, en que la integración respecto de r en (51.1) se efectúa entre los límites O (y no - oo) y + oo: 00 /12 = fo xdx2 dr. En relación con esto hay que distinguir dos casos. Si el integrando es una función par de r, la integración se puede extender formalmente a lo largo de todo el intervalo desde - oo a + =, de modo que no existe diferencia ninguna con relación al caso anterior. Este caso puede presentarse si Ui(r) y U2(r) son funciones pares de r[ U(- r) = U(r)]. Las funciones de onda xi{r) y x2(r) son entonces o funciones pares o funciones impares (véase § 21) (1) y si la función f(r) es también par o impar, el producto xifx2 puede resultar par. En cambio, si el inteBrando no es par (lo que ocurre en cualquier caso si U(r) no es par), el origen del camino de integración no puede desplazarse del punto r = O, y entre los posibles valores de r 0 en (51.8) hay que incluir también el valor r 0 = O. PROBLEMAS 1. Calcular los elementos de matriz cuasiclásicos (limitándose al factor exponencial) en el campo U = U0e-·rr.x. (1) Si U(r) es par, la función de onda radial R(r) es par (impar) si les par (impar), como se ve considerando su comportamiento para valores pequeños de r (donde R ,.._, rl). Probabilidad de transición en el caso cuasiclásico 209 Solución. U(x) tiende a infinito solamente para x---+ - oo. De acuerdo con esto supondremos en (51.6) x 0 = - =. La integración se puede extender hasta +=. Cada una de las dos integrales por separado diverge en el límite - oo. Por ello las calcularemos primero entre los límites - x y +oo y pasaremos luego al límite x---+ oo. Obtenemos como resultado Jl'l, ,. ._, e-{1rm/a.'AXva-v >, 1 donde v1 = V(2E1 /m)v 2 =V(2E2 /m)son las velocidades de la partícula en el infinito (x---+ oo), donde el movimiento es un movimiento libre. 2. Igual problema en el campo coulombiano U = r:x./r y para transiciones entre estados con/ = O. Solución. El único punto singular de la función U(x) es el punto r = O. La correspondiente integral se ha calculado en el problema 2, § 50. Según la fórmula (51.8). obtenemos el resultado § 52. Probabilidad de transición en el caso cuasiclásico El paso a través de una barrera de potencial es ejemplo de un proceso que es completamente imposible en la mecánica clásica. Otro ejemplo lo ofrece la « reflexión por encima de la barrera», es decir, la reflexión de una partícula cuya energía es mayor que la altura de la barrera. En el caso cuasiclásico la probabilidad de tales procesos es exponencialmente pequeña. El correspondiente exponente se puede determinar como sigue. Al considerar la transición de un sis.tema cualquiera desde un estado a otro, resolvamos las correspondientes ecuaciones clásicas del movimiento, lo que nos dará la «trayectoria» de la transición que, sin embargo, resultará ser compleja de acuerdo con la imposibilidad del proceso en la mecánica clásica. En particular, resulta, en general, complejo el « punto de transición » %, en el que tiene lugar la transición formal del sistema de un estado al otro; la posición de este punto viene determinada por las leyes clásicas de conservación. Calculemos luego la acción S 1(q1 , %)+Sl%, q2 ) correspondiente al movimiento del sistema en el primer estado a partir de una cierta posición inicial q1 hasta el « punto de transición» % y, luego, en el segundo estado, desde% hasta la posición final q2 • La probabilidad buscada del proceso se determina entonces mediante la fórmula (1) w - exp (- : im [Si(q,,qo) + S2 (qo,q2)J}. (52.1) ( 1) Si el punto de transición es real, pero se encuentra en un dominio clásicamente inaccesible, la fórmula (52.1) corresponde (en el caso más simple de un movimiento unidimensional) a la fórmula (50.9) para la probabilidad de atravesar una barrera de potencial. Un ejemplo de aplicación de la fórmula (52.l) a un problema con varios grados de libertad (desintegración del deuteron en el campo de un núcleo) puede verse en el trabajo de E. M. LIFSHITZ, ZhETF 8, 930, 1938. 210 El cmm cuasiclásico Si la posición del « punto de transición » no es única, debe elegirse de manera, que el exponente en (52.1) posea el menor valor absoluto (a la vez que, claro está, este valor debe ser suficientemente grande para que la fórmula (52.1) sea en efecto aplicable) (1). La fórmula (52.1) está de acuerdo con la regla obtenida en el párrafo anterior para el cálculo de los elementos de matriz cuasiclásicos. Hay que subrayar, sin embargo, que el cálculo del coeficiente de la exponencial, que aparece en la expresión de la probabilidad de las transiciones de este tipo, como cuadrado del correspondiente elemento de matriz sería incorrecto. Si se aplica la fórmula (52.1) a la « reflexión por encima de la barrera » de la partícula (en el caso unidimensional), hay que entender por % la coordenada compleja x 0 del « punto de parada», en el que la partícula cambia su sentido de movimiento por el opuesto, es decir, la raíz compleja de la ecuación U(x) = E. Veamos cómo en este caso se puede calcular también, con gran precisión, el coeficiente de reflexión - a la vez que el coeficiente de la exponencial. De nuevo debemos establecer (al igual las funciones de onda lejos a la derecha de izquierda (ondas incidente+reflejada). Es logo al aplicado en el § 47 considerando 1P que en el § 50) la correspondencia entre la barrera (onda transmitida) y lejos a la fácil hacerlo siguiendo un método anácomo función de la variable compleja x. Escribamos la onda transmitida en la forma X f+ = :P expGJ P dx ), X¡ (donde x 1 es un punto cualquiera del eje real) y sigamos su variación al recorrer, en el semiplano superior, el camino C que rodea (a distancia suficiente) el punto de retroceso x0 (fig. 19); la última parte de este camino debe pasar por una región tan alejada hacia la izquierda, que a lo largo de ella el error de la función de onda aproximada (cuasiclásica) de la onda incidente sea menor que la pequeña cantidad bus- V cada ,¡;_. Rodear el punto x0 conduce al cambio de signo de la raíz E - U(x), y al volver al eje real la función '1/J+ se transforma, por consiguiente, en la onda 1p_, que se propaga hacia la izquierda, es decir, en la onda reflejada (2). Dado que las amplitudes de las ondas incidente y transmitida se pueden considerar iguales, el coeficiente de reflexión buscado R se determina simplemente como razón de los cuadra(1) Si la propia energía potencial del sistema presenta puntos singulares, estos puntos deben también formar parte de los posibles valores de q0 • 2 ( ) En cambio, recorrer un camino que pase por debajo del punto x 0 (por ejemplo, simplemente a lo largo del eje real) transforma la función '1/J+ en la onda incidente. Probabilidad de transición en el caso cuasiclásico dos de los módulos de 1p_ 211 y '/1+: R = lif;-¡ if;+ f 2 = exp ( - I ) zh1m . p dx . (52.2) e Una vez: obtenida esta fórmula, en el exponente se puede deformar el camino de integración de manera arbitraria; si lo reducimos al camino C' indicado en la fig. 19, la integral f p dx se reduce al doble de la integral a lo largo del camino desde xl a x 0 y obtenemos (1): x, FIG. 19 (52.3) X1 Dado que en todo el eje real pes real, la elección de x 1 no influye sobre la parte imaginaria de la integral que aparece en el exponente. Conforme se indicó ya, de todos los valores posibles x 0 debe elegirse aquél para el que e] exponente en (52.3) presenta el menor valor absoluto (a la vez que este valor debe ser asimismo suficientemente grande en comparación con 1) (2). Se supone tamhién que si la propia energía potencial U(x) posee puntos singulares en el semiplano superior, la integral Xo unH pdx 1 ( ) Esta fórmula con el coeficiente de la exponencial (igual a la unidad) fue obtenida por primera vez por V. L. POKROYSKII, s. K. SAYYINYJ, F. R. ULINICH (1958). 2 ( ) Claro está, deben considerarse solamente puntos x 0 para los que Jp Xo im dx > O, es decir, puntos que se encuentran en el semiplano superior. 212 El caso cuasiclásico toma en ellos grandes valores (en caso contrario, en efecto, uno de estos puntos determina el valor del exponente, pero el coeficiente de la exponencial no será ya el que aparece en (52.3)). La última condición se viola, evidentemente, al aumentar la energía E si U(x) tiende a infinito en algún punto del semi plano superior: llega un momento en que el punto x 0 , en el que ú = E, se acerca tanto al punto x oo en el que U = oo, que ambos dan una contribución comparable al coeficiente de reflexión (la integral imH Xo pdx - 1), Xoo y la fórmula (52.3) pasa a ser inaplicable. En el caso límite en que E es tan grande que la citada integral resulta pequeña comparada con la unidad, se puede aplicar la teoría de perturbaciones (véase el problema 1) (1). PROBLEMAS 1. Determinar el coeficiente de reflexión por encima de la barrera cuando las energías de la partícula son tates que es aplicable la teoría de perturbaciones. Solución. Esta se obtiene aplicando la fórmula (43.1) en la que las funciones de onda inicial y final son ondas planas que se propagan en sentidos opuestos y normalizadas según la densidad de corriente unidad y según la función-<5 del impulso, respectivamente. Además, dv = dp', donde p' es el impulso después de la reflexión. Efectuando en (43.1) la integración respecto de p' (teniendo en cuenta la presencia de la tunción-<5) obtenemos: R I 1 = -m2- Joo U(x)e2ipx/1t dx\2· ñ2p2 (1) -00 Esta fórmula es válida si se cumple la condición de aplicabilidad de la teoría de perturbaciones: Ua/hv ~ 1, donde a es la anchura de la barrera (véase la nota en la pág. 180), y a Ja vez pa/h ,:'.:, l, La última condición garantiza el carácter no exponencial de la dependencia R(p); en el caso contrario, la cuestión de la aplicabilidad de la fórmula (1) requiere un estudio aparte. 2. Determinar el coeficiente de reflexión por encima de la barrera correspondiente a una barrera cuasiclásica cuando la función U(x) presenta un punto anguloso. Solución. Si la función U(x) posee una singularidad para x real, el coeficiente de reflexión viene determinado en esencia por el campo cerca de este punto, y para calcularlo se puede aplicar formalmente la teoría de perturbaciones sin exigir, con ello, que se cumpla la condición de aplicabilidad para todo x; basta que se cumpla la condición relativa al carácter cuasiclásico. Llegamos así a la fórmula (1), con la única diferencia de que en vez del impulso de la partícula incidente debe substituirse en ella el valor de la función p(x) para x = x 0 • Eligiendo en el presente caso el punto anguloso como punto x ( ) El caso intermedio ha sido estudiado por 1713, 1961; JETP 13, 1207, 1961. O, tenemos cerca del mismo: U = - F2x para x < O, U = -F1x para x > O, 1 = v. L. POKROVSKII y l. M. JALATNIKOV (ZhETF,40, 213 Transiciones debidas a perturbaciones adiabáticas con valores diferentes de F 1 y F 2 • La integración respecto de x se efectúa introduciendo en el integrando el factor de convergencia e±Ax ( después de lo cual se hace A.-,,. O). Obtenemos finalnente donde Po § 53. = p(O). Transiciones debidas a perturbaciones adiabáticas Hemos dtcho ya en el § 41 que en el caso límite de una perturbación que varía con el tiempo tan lentamente cuanto se quiera, la probabilidad de la transición de un sistema de un estado a otro tiende a cero. Examinemos ahora esta cuestión cuantitativamente, calculando la probabilidad de la transición provocada por una perturbación lentamente variable (perturbación adiabática). Supongamos que el hamiltoniano del sistema es una función lentamente variable del tiempo que tiende a límites determinados para t-+ ± =. Sean, además, 1Pn(q, t) y En (t) las funciones propias y los valores propios de la energía (que dependen del tiempo como parámetro) obtenidos resolviendo la ecuación de SCHRODINGER fl(t)t/,n = Enz/,n ; teniendo en cuenta el carácter adiabático de la variación temporal de Íl, la dependencia de En y de 1Pn con relación al tiempo resulta también ser lenta. El proh:ema que se nos plantea consiste en determinar la probabilidad w12 de encontrar el sistema para t --,,. -+ oo en un cierto estado lflz si cuando t --,,. se encontraba en el estado tp 1 . = La lentitud de. la perturbación conduce a que la duración del << proceso de transición>, sea larga por lo que el cambio de la acción durante este tiempo (dado por la integral - f E(t) dt) es grande. En este sentido, el problema planteado posee un carácter cuasiclásico y en la determinación de la probabilidad de transición buscada representan un papel esencial los valores t = t0 para los que (53.1) los cuales,. en cierto modo, corresponden al « instante de transición » en la mecánica clásica (cf. § 52); en realidad, claro, esta transición es imposible desde el punto de vista clásico, lo que se refleja en el hecho de que las raíces de la ecuación (53.1) son complejas. Con ello surge la necesidad de examinar las propiedades de las soluciones de la ecuación de ScHRODINGER para valores complejos del parámetro t en un entorno del punto t = t0 en el que los valores propios de la energía pasan a ser iguales. Conforme veremos, cerca de este punto las funciones propias 1Pi, 1Pz dependen fuertemente de t. Para determinar esta dependencia, introduzcamos primero las combinaciones lineales de las mismas (designémoslas por <f,1, </> 2) que satisfacen las condiciones: 214 El caso cuasiclásico J</>1</>2 dq = J. (53.2) Esto se puede conseguir siempre mediante una elección adecuada de los coeficientes complejos (que son funciones de t). Las funciones </,1, </>2 no son ya singulares para t = t0 • Buscaremos ahora las funciones propias en la forma de combinaciones lineales (53.3) Al hacerlo hay que tener presente que para valores complejos del « tiempo » t, el operador .H(t) (de la_forma (17.4)), que depende de él._coincide, como antes, con su transpuesto (íl = fl), pero no es ya hermítico (íl f= H*), ya que la energía potencial U(t) f= U*(t). Substituyamos (53.3) en la ecuación de ScHRODINGER, y multiplicándola a la izquierda una vez por cp1 y otra por </,2, integremos respecto de q. Introduciendo la notación: (53.4) y teniendo en cuenta que H 12 = H 21 en virtud de la propiedad antes indicada del hamiltoniano, obtenemos el sistema de ecuaciones H11a1 + H12a2 = Ea2, H12a1 + H22a2 = Ea 1, La condición de compatibilidad de este sistema nos da la ecuación (H12 = H 11H 22 , cuyas raíces determinan los valores propios de la energía (53.5) E)2 = (53.6) De (53.5) se deduce entonces: (53.7) De (53.6) resulta, evidentemente, que para que en el punto t = f 0 coincidan los dos valores propios deben anularse en él o H 11 o H 22 ; supongamos que se anula H 11 • La tendencia de una función a cero en un punto regular resulta, en general, proporcional a t - f 0. Por lo tanto, E(t)-E(to) = ±constante X y(t-to), (53.8) es decir, E(t) presenta en t = f 0 un punto de ramificación. Además, también a 2 ,_, ,. ., V-¡=- f 0 , de forma que en el punto t =-~ f O se tiene sólo una función propia, que coincide con <p 1 . 215 Transiciones debidas a perturbaciones adiabáticas Vemos ahora que el problema planteado es formalmente del todo análogo al problema estudiado en el § 52 relativo a la reflexión por encima de una barrera. Se trata ahora de una función de onda 'F(t) « cuasiclásica » respecto del tiempo (en vez de la función del § 52 que era cuasiclásica respecto de la coordenada) y se trata de determinar un término de la forma c2lf;2e-iEP1t en la función de onda para t -++ oo, si cuando t-+ - oo la función de onda era 'Y(t) = lJ;1e-iEp1t (problema análogo al de la determinación de la función reflejada para x-+ - = cuando se conoce la función transmitida para x -++ =); la probabilidad de transición buscada es w12 = hl 2 • La acción S = - f E(t) dt se expresa por una integral respecto del tiempo de una función que presenta puntos de ramificación complejos (de manera semejante a como la función p(x) presentaba puntos de ramificación complejos en la integral f p dx). Por consiguiente, el problema considerado se resuelve por deformación del camino de integración en el plano de la variable compleja t (desde grandes valores negativos a grandes valores positivos) de manera del todo análoga a cómo se procedió en el§ 52 en el plano de la variable x, por lo que no repetiremos aquí los correspondientes razonamientos. Supondremos que sobre el eje real es E 2 > E 1 ; entonces el camino de integración debe recorrer el semiplano superior de la variable compleja t (al pasar al cual crece la razón e-iEp1t¡e-iEp1t Obtenemos en definitiva la fórmula (análoga a la fórmula (52.2)): w12 = exp( - ~ im JE(t) dt), (53.9) C' donde la integración se efectúa a lo largo del contorno representado en la fig. 19 (en el sentido de izquierda a derecha). En la rama izquierda de este contorno es E = E 1 , y en la derecha, E consiguiente, es posible escribir (53.9) en la forma = E 2 • Por to w12 = exp(-2im f w21(t) dt), (53.10) ti donde w 21 = (E2 - E 1)/li, t1 es un punto arbitrario sobre el eje real t, y para t0 se debe elegir la raíI de la ecuación (53.1) que se encuentra en el semi plano superior y para la que el exponente en (53.10) toma el menor valor absoluto (1). Además, con la transición directa del estado 1 al estado 2 pueden competir también « caminos de transición » que pasan por diferentes estados intermedios y cuyas probabilidades se expresan por fórmulas análogas. Así, para la transición a lo largo del « camino » (1) Entre los valores de t 0 posibles deben tenerse en cuenta también los puntos en los que E(t) tiende a infinito (pero para dichos puntos el coeficiente de la exponencial en (53.9) sería diferente). 216 El caso cuasiclásico 1 _,.. 3 _,.. 2 la integral en (53.10) se substituye por la suma de las integrales t/31) t/23) f w31(t) dt + f w23(t) dt, cuyos límites superiores son los « puntos de intersección» de los términos E1(t), Ez(t) y Ez(t), Fa(t), respectivamente; este resultado se obtiene integrando a lo largo de un contorno que rodea a estos dos puntos del plano complejo (1). (1) El caso de estados intermedios relativos al espectro continuo exige un análisis especial. CAPÍTULO VIII SPIN § 54. Spin Consideremos una partícula compuesta, digamos un núcleo atómico, que efectúa un cierto movimiento en conjunto. Supondremos que la energía interna del núcleo posee un valor determinado. Sin embargo, con esto el estado interno del núcleo no queda aún, en general, determinado por completo; así, el momento cinético « interno» del núcleo, L (es decir, el momento cinético de las partículas en su movimiento dentro del núcleo), puede todavía estar orientado de diferentes maneras en el espacio. El número de posibles orientaciones distintas de este momento cinético es igual, conforme sabemos, a 2L + 1. De esta manera, al considerar el movimiento del núcleo (que se encuentra en un estado interno dado) como un todo, debemos considerar, junto a sus coordenadas, una variable discreta: la proyección de su momento cinético interno sobre una dirección, cualquiera, en el espacio. Vemos, por lo tanto, que el formalismo de la mecánica cuántica, al considerar el movimiento de una partícula arbitraria, permite introducir junto a sus coordenadas una cierta variable específica para cada partícula dada que puede tomar un número limitado de valores discretos. No tenemos, a priori, ningún derecho a suponer que dicha variable no existe cuando la partícula es elemental. Con otras palabras, debemos admitir, en general, que en la mecánica cuántica hay que atribuir a una partícula elemental un cierto momento cinético « propio », no ligado a su movimiento en el espacio. Esta propiedad de las partículas elementales es específicamente cuántica (desaparece cuando se pasa al límite para ñ ~ O, véase la nota en la pág. 219) y no admite así, por su propia esencia, una interpretación clásica. En particular, carecería por completo de sentido el representarnos el momento cinético « propio » de una partícula elemental como resultado de su rotación en torno de « su eje». El momento cinético propio de una partícula se llama su spin, para distinguirlo del momento cinético ligado al movimiento de la partícula en el espacio, al que nos referimos cuando hablemos de momento cinético orbital {1). Se puede tratar en todo (1) La idea física acerca de la existencia en el electrón de un momento cinético propio se debe a G. S. GouosMIT, 1925. En la mecánica cuántica el spin fue introducido por W. PAULI en 1927. UHLENBECK y 218 Spin esto tanto de una partícula elemental, como de una partícula que, si bien es compuesta, se comporta como elemental en una cierta área considerada de fenómenos (por ejemplo, un núcleo atómico). El spin de una partícula (medido al iguai que el momento cinético orbital en unidades li) lo representaremos por s. En los capítulos precedentes hemos supuesto siempre que las tres coordenadas constituyen un sistema completo de magnitudes para una partícula, dadas las cuales queda totalmente determinado el estado de la misma. Vemos ahora que, en general, no es así: para determinar por completo el estado de una partícula deben darse, no sólo sus coordenadas, sino también la dirección del vector spin. Por ello, también la función de onda de una partícula debe ser función de cuatro variables - las tres coordenadas y la « variable spin », que indica el valor de la proyección del spin sobre la dirección elegida en el espacio, y que toma un número limitado de valores discretos. Estos valores se pueden atribuir a la función de onda en forma de índice. De esta manera la función de onda de una partícula que tiene spin no nulo, es, en realidad, no una, sino el conjunto formado por un cierto número de funciones de las coordenadas distintas, funciones que difieren por su índice de spin. El operador que en la mecánica cuántica corresponde al spin de una partícula es tal que al aplicarlo a una función de onda actúa precisamente sobre la « variable de spin ». Con otras palabras, dicho operador transforma linealmente entre sí las funciones que difieren en el índice de spin. La forma de este operador se establecerá más adelante. Pero, incluso partiendo de las consideraciones más generales, es fácil comprobar que los operadores (,;, sv, §~ satisfacen las mismas condiciones de conmutación que los operadores de1 momento cinético orbital. El operador del momento cinético coincide en esencia con el operador de una rotación infinitesimal. Para deducir en el § 26 la expresión del operador del momento cinético orbital, se estudió el resultado de aplicar la operación rotación a una función de las coordenadas. En el caso del momento cinético de spin, este razonamiento pierde su significado, ya que el operador spin actúa sobre la « variable de spin », y no sobre las coordenadas. Por consiguiente, para obtener las relaciones de conmutación buscadas hemos de considerar la rotación infinitesimal de una manera general, como rotación del sistema de coordenadas. Aplicando sucesivamente rotaciones infinitesimales en torno del eje x y del eje y y luego en torno de estos mismos ejes, pero en orden inverso, es fácil comprobar, mediante un cálculo inmediato, que la diferencia entre los resultados de estas dos operaciones equivale a una rotación infinitesimal en torno del eje z (caracterizada por un ángulo que es ig1J.al al producto de los ángulos de giro en torno de los eje x y y). No nos detendremos aquí a efectuar estos sencillos cálculos, que conducen de nuevo a las relaciones ordinarias de conmutación entre los operadores de las componentes del momento cinético, las cuales, en consecuencia, deben valer también para los operadores de spin: (54.1) Spin 219 junto con todas las consecuencias físicas que se siguen de ellas. Las relaciones de conmutación (54.1) permiten determinar los valores posibles del módulo y de las componentes del spin. Todo el razonamiento desarrollado en el § 27 (fórmulas (27.7-9)) se basaba tan sólo en las relaciones de conmutación y es por ello aplicable completamente también aquí; es necesario únicamente suponer que en dichas fórmulas se tiene s en vez de L. De las fórmulas (27.7) se sigue que los valores propios de la componente-z del spin forman una sucesión de números que difieren en una unidad. Sin embargo, no podemos afirmar ahora que estos valores deban ser números enteros, como ocurría en el caso de la proyección Lz del momento cinético orbital (el razonamiento presentado al principio del § 27 no es aplicable aquí, ya que se basa en la expresión (26.14) del operador lz, específica del momento cinético orbital). Además, la sucesión de valores propios Sz está limitada superior e inferiormente por valores que son iguales en valor absoluto y de signos opuestos, valores que designaremos por ± s. La diferencia 2s entre los valores máximo y mínimo de Sz debe ser un número entero o cero. En consecuencia, el números puede tomar los valores O, !, 1, }, .... Así, pues, los valores propios del cuadrado del spin son iguales a s 2 = s(s+ 1), (54.2) donde s puede ser un número entero (incluido el valor nulo) o un número semientero. Para un s dado, la componente Sz del spin puede tomar los valores s, s - 1, ... , - s, en total 2s + 1 valores. En relación con lo dicho antes, llegamos al resultado de que el estado de una partícula con spin s debe describirse por una función de onda que es el conjunto de 2s+ 1 funciones de las coordenadas (1). Prueba la experiencia que la mayoría de partículas elementales - electrones, positones, protones, neutrones, mesones-µ y todos los hiperones ( A, 1:, 8) - poseen spin t. Además, existen partículas elementales - los mesones n y los mesones K que poseen spin O. El momento cinético total de una partícula es la suma de su momento cinético orbital I y del spin s. Los correspondientes operadores, que se aplican a funciones de variables completamente distintas, conmutan entre sí, claro está. Los valores propios del momento cinético total (1) Puesto que ses un número dado para cada especie de partículas, al pasar al límite de la mecánica clásica (h-+ O) el momento cinético de spin, hs, se anula. Este razonamiento carece de sentido en el caso del momento cinético orbital, ya que l puede tomar valores cualesquiera. El paso a la mecánica clásica se consigue mediante la tendencia simultánea de ha cero y del a oo, de forma que el producto hl se conserve finito. Spin 220 (54 3) j = l+s se determinan según la misma regla del « modelo vectorial » que se aplica a la suma de los momentos cinéticos orbitales de dos partículas distintas (§ 31 ). Así, para valores dados l y s, el momento cinético total puede tomar los valores l+s, l+s - 1, ... , \l - si. Por ejemplo, para un electrón (spin l) de momento cinético orbital distinto de cero, el momento cinético total puede ser j = l ± ! ; para l = O, el momento cinético j posee, claro, solamente un valor, el j = ! . El operador del momento cinético total J de un sistema de partículas es igual a la suma de los operadores de los momentos cinéticos j de cada una de ellas, de modo que sus valores vienen de nuevo determinados por las reglas del modelo vectorial. El momento cinético J se puede representar en la forma: J = L+ S, S = ~ Sa, a (54.4) donde S se puede llamar spin total, y L, momento cinético orbital total del sistema. Obsérvese que si el spin total del sistema es semientero (o entero), lo mismo valdrá también para el momento cinético total, ya que el momento cinético orbital es siempre entero. En particular, si el sistema está constituido por un número par de partículas idénticas, su spin total será siempre entero y, por consiguiente, también será entero el momento cinético total. Los operadores del momento cinético total de una partícula j (o de un sistema de partículas J) satisfacen las mismas reglas de conmutación que los operadores del momento cinético orbital o del spin, puesto que estas reglas son reglas generales de conmutación, válidas para cualquier momento cinético. Las fórmulas (27.13) para los elementos de matriz del momento cinético, que se siguen de las reglas de conmutación, son también válidas para cualquier momento cinético si los elementos de matriz se determinan respecto de las funciones propias de este mismo momento cinético. Conservan también su validez (con el correspondiente cambio de notación) las fórmulas (29.7-10) para los elementos de matriz de magnitudes vectoriales arbitrarias. PROBLEMA Una partícula de spin ! se encuentra en un estado con valor determinado Sz = !. Hallar las probabilidades de los valores posibles de la proyección del spin sobre el eje z' que forma con el eje z un ángulo (). Solución. El vector medio de spin s está dirigido, evidentemente, a lo largo del eje z y su valor es igual a t. Proyectándolo sobre el eje z', encontramos que el valor medio del spin en la dirección de este eje es sz' = ! cos O. Por otra parte, tenemos sz' = ! (w+ - w_), donde w+ son las probabilidades de los valores sz' = ± t. Teniendo en cuenta también que w + +w_ = 1, encontramos: w+ = cos2!B, W- = sen2!B. Espinores § 55. 221 Espinores Sea "P(x, y, z; a) la función de onda de una partícula de spin a; a representa la componente-z del spin y toma los valores desde - s a +s. Llamaremos« componentes» de la función de onda a las funciones "P(a) con diferentes valores de a. Sometemos la elección de estas « componentes » a la condición de que la integral f j "I'( a)! 2 d V determine la probabilidad de que la partícula tenga una componente-z del spin igual a a. En cambio, la probabilidad de que la partícula se encuentre en el elemento de volumen del espacio dV es dV s ~ li/;(a)l 2 • Si la partícula se encuentra en un u= -s estado con valor determinado a = a0 , de todas las componentes "P(a) será diferente de cero sólo la componente para la que a = a0 , es decir, la función de onda tiene la forma: ip(x,y, z; cr) = ip(x,y, z)8ªªº. En este capítulo no nos interesará en lo que sigue la dependencia de las funciones de onda con relación a las coordenadas. Por ejemplo, al hablar del comportamiento de las funciones v{a) en una rotación del sistema de coordenadas, se puede suponer que la partícula se encuentra en el origen de dicho sistema, con lo cual sus coordenadas no variarán al aplicar dicha rotación y los resultados obtenidos serán característicos precisamente del comportamiento de la función "P(a) con relación a la variable de spin, a. Efectuemos una rotación infinitesimal de ángulo <5</> en torno del eje z. El operador de este giro se expresa mediante el operador del momento cinético (en el presente caso, del spin) en la forma 1 +i8cp. sz. Por consiguiente, como resultado de la rotación, las funciones "P(a) se transforma en ip(a)+8¡/;(a), donde 8¡/;(a) = i8ef,. Szip(a) Pero Szip(a) = aip(a), de modo que oip(a) = ia1p(a)8ef,. En una rotación de ángulo finito ef,, las funciones '1/,'(a) se transforman, por consiguiente, en las funciones i/,'( a) = ew4>ip( a). (55.1) En particular, en una rotación de ángulo 2:n quedan multiplicadas por el factor el mismo para todos los a e igual a (- 1)28 (2a tiene siempre la misma paridad que 2s). Vemos así que en una rotación completa del sistema de coordenadas en torno 9e un eje, las funciones de onda de la partícula con spin entero recobran su valor inicial, y las funciones de onda de las partículas de spin semientero cambian de signo. e2Ttia , La variable a difiere de las variables ordinarias (las coordenadas) por su carácter discreto. La forma más general de un operador lineal que se aplica a funciones de una variable discreta a es (/ip)( cr) = ~faú'P( a'), (55.2) 222 Spin donde Íaa' son constantes; al encerrar J'f/J entre paréntesis, queremos subrayar que el argumento de spin a que le sigue no se refiere ya a la función inicial 'f/J, sino a la función que resulta de la aplicación del operador/ Es fácil ver que las cantidadesfaa', coinciden con los elementos de matriz del operador /definidos de la manera ordinaria. En efecto, la « función propia » del operador Sz que corresponde al valor Sz = a0 es tf;( cr) = Suuo. Para esta función tenemos: JsCTCT. o = ~/c,c,'sc,'c, ª' o = faa' o El último miembro de la igualdad puede escribirse también en la forma: ~iu'- Sª ,; CT' "o C1 entonces Js(T(To = ~CT' f a'u.o sua'· (55.3) Pero esta igualdad corresponde a la definición ordinaria de la matriz del operador J respecto de las funciones propias del operador Sz, Así, pues, los operadores que se aplican a funciones de a se pueden representar en la forma de matrices de orden 2s + l. En particular, para los operadores de las propias componentes del spin tenemos: (55.4) (y análogamente para §11 , sz) ( ). De acuerdo con lo dicho antes, las matrices de sx, sy, Sz coinciden con las matrices obtenidas en el§ 27 para Lx, Ly, Lz en las que sólo hay que cambiar las letras L y M por las letras s y a. De esta manera, los elementos de matriz distintos de cero de los operadores de spin serán: 1 (s:r)a,crl = (s:r)u-1,a = h/[(s+ cr)(s-cr+ 1)], } (sv)c,,c,~ = -(sv)u-1,c, = -!iv[(s+cr)(s-cr+l)], (55.5) (sz)ao - cr En el caso importante de spin igual a ! (s = t, a segundo orden y tienen la forma: = ± D, estas matrices son de 1[O -1º]. 1 (s.) = (55.6) Estas matrices (sin el factor i) se llaman matrices de Pauli. Escribamos también las matrices para las combinaciones complejas s± = sx ± isy: (s+) = [~ ~J. (55.7) (1) Hay que observar que el orden de los índices en los elementos de matriz que aparecen en el segundo miembro de la igualdad (55.4) es el opuesto, en cierto sentido, al orden ordinario que encontramos en (55.3). 223 Espinores Multiplicando directamente las matrices de Pauli, es fácil comprobar que se cumplen las relaciones: (55.8) Combinándolas con las reglas generales de conmutación (54. I), encontramos que (55.9) es decir, las matrices de Pauli « anticonmutan » entre sí. Mediante estas relaciones es fácil comprobar la validez de las siguientes fórmulas útiles: §2 = !, (55.10) (s. a)(s. b) = !(a. b)+!is. (ax b), (55.11) donde a y b son dos vectores arbitrarios (1 ). s s. Observemos que toda expresión cuadrática respecto de las componentes de se reduce así a términos que no dependen de y a términos de primer grado en De aquí se sigue que cualquier función del operador (de spin D se reduce a una función lineal (véase el problema 1). s s Pasemos a un estudio más detenido de las propiedades « espinoriales » de las funciones de onda. Para un spin igual a cero, la función de onda tiene una sola componente, 1p(O). Al aplicarle los operadores de spin, se obtiene como resultado el valor cero: Sx'P = Sv'P = Szlf = O. Dado que los operadores de spin están ligados con los operadores de rotac10n, esto significa que la función de onda de una partícula con spin O no varía en las rotaciones del sistema de coordenadas, es decir, es un escalar. Las funciones de onda de las partículas de spin ! tienen dos componentes, ip( D y 11{Por conveniencia con vistas a ulteriores generalizaciones, designaremos estas componentes por 1P1 y 1P2, respectivamente (con los índices l y 2 escritos arriba). En una rotación arbitraria del sistema de coordenadas, 1p1 y 1p2 experimentan una transformación lineal: n (55.12) (1) Los términos que no dependen de s en los segundos miembros de estas igualdades deben interpretarse, claro está, como constantes multiplicadas por la matriz unidad de segundo orden. 224 Spin Los coeficientes :x, fJ, ¡·, r) (1), en general, son complejos y dependen de los ángulos de la rotación. Estos coeficientes están ligados entre sí por una relación que deduciremos partiendo de la forma bilineal (55.13) donde ( 1p1, y (cp1, son dos funciones de onda que se transforman según (55.12). Un cálculo sencillo da v., 2) </>2) if,I'ef,2'-if,2'cf>1' = (a8-/3y)(if,I</>2-i¡,2ef,1), es decir, en una rotación del sistema de coordenadas la magnitud (55.13) se transforma linealmente en sí misma. Pero si existe sólo una función cuya transformada es un . múltiplo de ella, dicha función puede considerarse como correspondiente a spin nulo y, por lo tanto, debe ser un escalar, es decir, debe conservarse invariable en las rotaciones del sistema de coordenadas. De aquí se sigue la igualdad a8-f3y = l. (55.14) Ésta es precisamente la relación buscada. Las transformaciones lineales (55.12) que dejan invariante la forma bilineal (55.13) se califican de binarias. La magnitud de dos componentes ( "P1, "P2) que se transforma en una rotación del sistema de coordenadas según una transformación binaria, se llama espinar. Así, pues, la función de onda de una partícula de spin i es un espinor. Al álgebra de espinores se le puede dar una forma análoga a la del álgebra tensorial. Ello se consigue introduciendo un espacio vectorial de dos dimensiones en el que la métrica se define por un tensor métrico anti simétrico: (55.15) Los vectores de este espacio son también espinores. Junto a las componentes contravariantes "P1, "P2 de un espinor, se pueden introducir las componentes covariantes mediante las fórmulas ordinarias del álgebra tensorial de modo que (55.16) (1) Se les llama parámetros de Cay/ey-Klein. Espinores 225 Las transformaciones binarias para las componentes covariantes de un espinor tienen, evidentemente, la forma: (55.17) La transformación inversa, de componentes covariantes a contravariantes, se puede escribir en la forma: yi'A = ~µ. gP.'Aif,µ., (55.18) donde el « tensor métrico » contravariante gJ,µ tiene por componentes gll g12] [ Q [ g21 g22 = -1 (55.19) que coinciden con las componentes g;_µLa combinación invariante (55.13) se puede escribir en la forma de un « producto escalar» (55.20) (aquí y en lo que sigue, con la repetición de dos índices se supone la suma respecto de los mismos, de manera análoga a como se procede en el álgebra tensorial, es decir, se aplica la llamada suma respecto de índices «mudos»). Obsérvese la siguiente regla, que hay que tener en cuenta en el álgebra espinorial. Se tiene: Así, pues, (55.21) De aquí se sigue, evidentemente, que el producto escalar de un espinor cualquiera por sí mismo es igual a cero: (55.22) La expresión que determina la probabilidad de encontrar la partícula en un punto dado del espacio, debe ser, evidentemente, un escalar. Comparándola con el escalar (55.20), vemos que las componentes 11,,t*, 1P2*, conjugadas complejas de las 1P1 , 1P2 de la función de onda, se transforman como componentes covariantes de un espinor, es decir, . como 1P2, - 1P1, respectivamente: yiH=' = f>¡/,l*-y¡/,2*, ¡f,2*' = -fJif,l*+rxif,2*. Por otra parte, escribiendo las igualdades conjugadas complejas de (55.12) 226 Spin y comparándolas con las anteriores, encontramos que los coeficientes ~, /3, Y, ligados entre sí, además, por las relaciones f1 ex.= 8*, o están (55.23) = -y*. En virtud de las relaciones (55.14), (55.23), las cuatro cantidades complejas ~, /3, y, o contienen en realidad tres parámetros reales independientes en total, lo que corresponde a los tres ángulos que determinan una rotación del sistema de coordenadas de tres dimensiones. El hecho de que vi*, tp2* se transformen como 11'2, - 1/, está íntimamente ligado con la simetría respecto al cambio de signo del tiempo. Como se hizo observar en el§ 18, en la mecánica cuántica al cambio de signo del tiempo corresponde el cambio de la función de onda en su conjugada compleja. Pero al cambiar el signo del tiempo cambia también el signo del momento cinético. Por ello ]as funciones conjugadas complejas de las componentes tp1, tp2, que corresponden a las proyecciones del spin a = ! y a = - t, deben ser equivalentes por sus propiedades a las componentes que corresponden, respectivamente, a las proyecciones del spin a = - ! y ª= L PROBLEMAS Reducir una función arbitraria del escalar a+ 2b • i, lineal respecto de i ), a otra función que sea lineal. Solución. Para determinar los coeficientes de la fórmula buscada l. s (s es el operador de spin J(a+2b. s) = cx+2,8b. s/b, observemos que si se elige el eje z en la dirección del vector b, los valores propios del operador a+2b.s son iguales a a±b, y los correspondientes valores propios del operador f(a+2b.s)son f(a±b). De aquí se sigue: ex = i[f(a+b)+J(a-b)], f3 = i[f(a+b)-f(a-b)]. 2. Determinar los valores del producto escalar s1 • s2 de los spins (D de dos partículas en estados en los que el spin total del sistema S = s1 +s 2 posee valores determinados (O ó 1). Solución. Según la fórmula general (31.2), que vale para la composición de dos momentos cinéticos cualesquiera, encontramos: -!paraS = O. ¿Qué potencias del operador s de un spin arbitrario s son independientes? s1 • s2 3. Solución. = ;-paras = 1, s1 • 52 = El operador (sz-s)(sz-s+ 1) ... (sz+s), producto de las diferencias de Sz y todos los valores propios posibles sz, da cero al aplicarlo a una función de onda cualquiera y, por consiguiente, es el operador cero. De aqm se sigue que(Sz)2s+ 1 se expresa en función de las potencias más bajas del operador Sz, con lo que resultan independientes solamente sus potencias desde 1 hasta 2s. Espinores de orden superior § 56. 227 Espinores de orden superior De manera análoga a como se pasa de los vectores a los tensores en el álgebra tensorial ordinaria, se puede introducir el concepto de espinares de orden superior. Así, se llama espinor de segundo orden a una cantidad de cuatro componentes "PAµ, cuyas componentes se transforman como los productos tpAcpµ de las componentes de dos espinores (espinores de primer orden). Junto a las componentes contravariantes 1P;.µ, se pueden considerar las componentes covariantes, 1P).µ y las mixtas 1P)P, que se transforman, respectivamente, como los productos w;.</>µ y n</>.u. El paso de unas componentes a otras se efectúa mediante el « tensor métrico » g J.µ de acuerdo con las fórmulas ordinarias Así w12 = - 1¡,/ = - tp21 , 1Pn = "Pi2 = tp22 , etc. De manera análoga se definen los es pin ores de orden cualquiera. Las propias cantidades g ;,1t forman un espinor ·antisimétrico de segundo orden. Se comprueba fácilmente que en las transformaciones binarias no varían los valores de sus componentes. Es fácil verificar que el producto g J.vg.uv es, cual debe ser, el espinor unidad de segundo orden, es decir, el espinor de componentes S} = S~ = 1, S¡ = S} = O. Así, pues, (56.1) Como en el álgebra tensorial ordinaria, en el álgebra espinorial se tienen dos operaciones fundamentales: la multiplicación y la contracción respecto de un par de índices. La multiplicación de dos espinores conduce a un espinor de orden más elevado; así, a partir de dos espinores de segundo y de tercer orden 1P Aµ y tpvp j podemos formar el espinor de orden cinco 1P ;.µ tpi-pa. La contracción respecto de un par de índices (es decir, la suma de las componentes con valores iguales de un determinado índice covariante y un determinado índice contravariante) disminuye el orden del espinor en dos unidades. Así, la contracción del espinor "P ).µvpa respecto de los índices µ y v da al espinor de tercer orden "P J.µPPª; la contracción del espinor '1/J ;_ll conduce al escalar tp/. En todas estas operaciones vale una regla análoga a la expresada por la fórmula (55.21); si se cambian las posiciones (superior e inferior) de los índices respecto de los cuales se contrae, cambia el signo del resultado (es decir, n). = = - 1P) ;.). De aquí se sigue, en particular, que si un espinor es simétrico respecto de dos cualesquiera de sus índices, el resultado de la contracción respecto de ellos es el valor cero. Así, para el espinor simétrico de segundo orden 1P J.µ tenemos tp).;,. = O. Llamamos espinor simétrico de orden n un espinor que es simétrico con relación a todos sus índices. A partir de un espinor no simétrico se puede formar un espinor simétrico por simetrización, es decir, sumando las componentes que se obtienen al aplicar a los índices todas las permutaciones posibles. En virtud de lo dicho antes, a partir de las componentes de un espinar simétrico es imposible formar (mediante 228 Spin contracción) un espinor de orden inferior. En lo que concierne a los espinores antisimétricos (respecto de todos sus índices), sólo puede serlo el espinor de segundo orden. En efecto, dado que cada índice puede tornar, en total, sólo dos valores, cuando se trate de tres o más índices por lo menos dos de ellos tendrán valores iguales y, por lo -tanto, las componentes del espinor se anularán idénticamente. Todo espinor antisimétrico de segundo orden se reduce a un escalar multiplicado por el espinor unidad g).µ- Observemos aquí la siguiente relación, que resulta de lo que precede, (56.2) donde 'IJJ J. es un espinor arbitrario; esta regla es una mera consecuencia de que la expresión que aparece en el primer miembro de la igualdad es (como se comprueba fácilmente) un espinor antisimétrico de tercer orden. El espinor formado multiplicando el espinor "P }.µ por sí mismo y contraído después con relación a un par de índices es antisimétrico respecto del otro par; en efecto: lf>.vlf/ = -ip;/lfµ,v· Por lo tanto, y en virtud de lo dicho antes, este espinor debe reducirse al espinor g;,µ multiplicado por un escalar. Determinando este último de manera que la contracción respecto del segundo par de índices dé el resultado correcto, se encuentra: (56.3) Las componentes del espinor '1/J}.µ-··*, conjugado complejo del '1/Ji,1, ... , se transforman como las componentes de un espinor contravariante '1/J;P ... , y recíprocamente. La suma de los cuadrados de los módulos de las componentes de un espinor cualquiera, es, por consiguiente, un invariante. § 57. Funciones de onda de las partículas de spin arbitrario Una vez desarrollada el álgebra formal de los espinores de orden cualquiera, podemos pasar a nuestro problema inmediato: el estudio de las propiedades de las funciones de onda de las partículas de spin arbitrario. Es conveniente abordar este problema considerando un sistema de partículas de spin ~. El máximo valor posible de la conponente-z del spin total del sistema es igual a n/2 y se obtiene cuando, para cada una de las partículas, es Sz = ! (todos los spins están dirigidos en el mismo sentido, a lo largo del eje z). En este caso, evi<lentemente, es posible afirmar que también el spin total S del sistema es igual a n/2. Todas las componentes de la función de onda '1/J (a1' a 2 , ••• , a11 ) del sistema de partículas son, en este caso, iguales a cero salvo una, la componente v{t, i, '. .. , D. Funciones de onda de las partículas de spin arbitrario 229 Si se escribe la función de onda como producto de n espinores vicp.u ... , cada uno de los cuales se refiere a una de las partículas, para cada uno de ellos será diferente de cero tan sólo la componente con i., µ, ... = 1. Así, pues, será diferente de cero únicamente el producto '1/hp ... Pero el conjunto de todos estos productos es un cierto espinor de orden n, simétrico respecto de todos sus índices. Si se efectúa una transformación del sistema de coordenadas (de manera que los spins no estén dirigidos en el sentido del eje z), obtenemos un espinor general de orden. n, pero como antes simétrico. Las propiedades « espinoriales » de las funciones de onda, que son esencialmente sus propiedades respecto de las rotaciones del sistema de coordenadas, son idénticas, evidentemente, para una partícula de spin s y para un sistema de n = 2s partículas de spin ;· cuyos spins están dirigidos de tal forma que el spin total del sistema es igual a s. De aquí se sigue que la función de onda de una partícula de spin ses un espinor simétrico de orden n = 2s. Es fácil ver que el número de componentes independientes de un espinor simétrico de orden 2s es también igual a 2s+ 1, como debía ser. En efecto, sólo serán distintas las componentes entre cuyos índices se tengan 2s iguales a la unidad y O iguales a dos, 2s - 1 iguales a la unidad y 1 igual a dos, etc., hasta O iguales a la unidad y 2s iguales a dos. Desde un punto de vista puramente matemático, se puede decir que los espinores simétricos permiten clasificar los tipos posibles de transformación de las cantidades en las rotaciones del sistema de coordenadas. Si se tienen 2s+ 1 cantidades distintas, que se transforman linealmente entre sí (no siendo posible disminuir su número mediante combinaciones lineales de las mismas), se puede afirmar que su ley de transformación es equivalente a la ley de transformación de las componentes de un espinor simétrico de orden 2s (1 ). Todo conjunto de un número cualquiera de funciones que se transforman linealmente entre sí en las rotaciones del sistema de coordenadas, se puede reducir (mediante una transformación lineal adecuada) a un o a varios espinores simétricos. Así, un espinor arbitrario de orden n, "P }.µv···, se puede reducir a espinares simétricos de órdenes n, n - 2, n - 4, ... Esta reducción se puede efectuar prácticamente de la siguiente manera. Simetrizando el espinar "P ;.pv ... respecto de todos sus índices, formamos un espinor simétrico del mismo orden, n. Por otra parte, contrayendo el espinor de partida "P iµv .. , respecto diferentes pares de índices, obtenemos espinores de.orden n - 2 de la forma "P;,_ Jv, .. , que a su vez simetrizamos, con lo que obtenemos espinores simétricos de orden n - 2. Simetrizando los espinores que se obtienen después de contraer "P ;,µ .. ,, respecto de dos pares de índices, obtenemos espinores ( 1) Con otras palabras, los espinores simétricos son bases de las llamadas representaciones irreducibles del grupo de rotaciones (véase § 98). S11in 230 simétricos de orden n - 4, y así sucesivamente. Nos queda todavía por establecer la relación entre las conponentes de un tensor simétrico de orden 2s y las 2s+ 1 funciones w(a) (donde a = s, s - 1, ... , - s). La componente !f11 ••. 1 22 ... 2 s+a s-a' entre cuyos índices se repite el índice 1 s+a veces y el índice 2 se encuentra s - a veces, corresponde a la proyección del spin sobre el eje z igual a a. En efecto, si consideramos de nuevo el sistema de n = 2s partículas de spin ! en vez de una partícula de spin s, a la componente antes escrita corresponderá el producto ifAp1 ... x2p2 .•• ~~ este producto corresponde a un estado en el que s+a partículas tiene una proyección del spin igual a +t y s - a, una proyección igual a - i, de forma que la proyección total es igual a i (s+a) -Hs - a) =- a. Finalmente, el coeficiente de proporcionalidad entre la componente considerada del espinor y '!/-'(a) lo eligiremos de forma que valga la igualdad • ~ lip( cr)l2 = U=-S 2 ~ ).,µ, ... -1 ltJ,>iµ .•. ¡2 (57.1) (esta suma es un escalar, como debe ser, ya que determina la probabilidad de encontrar la partícula en un punto dado del espacio). En la suma que aparece en el segundo miembro de la igualdad, las componentes con s+a índices 1 se encuentran (2s)! (s+ cr)! (s-cr)! veces. Es claro por ello que la correspondencia entre las funciones 1P(a) y las componentes del espinor viene dada por la fórmula ip(cr) = J[ (2s)! (s+ cr)! (s- cr)! Jtj,~~. s+a (57.2) s-a La relación (57.2) garantiza no sólo que se cumpla la condición (57.1), sino, como es fácil comprobar, el que se cumpla también la condición más general: ip>.µ ...'P;Jp, ... = ~ (-1) 8 -ªtf,( cr)cp(-cr), (57.3) donde "Pi.P ... y </)P ... son dos espinores diferentes de igual orden y "P(a), </>(a) son funciones formadas con estos espinores de acuerdo con la fórmula (57.2) (el factor (- 1y-a procede de que al elevar todos los índices en las componentes de un espinor, 231 La relación entre espinares y tensores el signo cambia tantas veces cuantas veces veces aparezca el 2 entre los índices). Las fórmulas (55.4) determinan el resultado de aplicar un operador de spin a las funciones de onda tp( a). No ofrece dificultad el establecer cómo actúan estos operadores al aplicarlos a una función de onda escrita en la forma de un espinor de orden 2s. En el caso de spin !, las funciones 1P( +U, 1P(- !) coinciden con las componentes 1P1, 1P2 de un espinor. De acuerdo con (55.4) y (55.6), el resultado de aplicarles los operadores de spin será: (Srx:!f)1 = ÍVJ2 , (s111P) 1 = -fi¡/; 2 , (szi/;) 1 = i¡/;1, (sxi/;) 2 = !if,1, (s11ifi) 2 = iW, (szi/;)2 = -tif,2 • (57.4) Para pasar al caso general de un spin arbitrario, consideremos de nuevo un sistema de 2s partículas de spin ! y escribamos su función de onda como producto de 2s espinores. El operador de spin del sistema de partículas es la suma de los operadores de spin de cada una de ellas, operadores que se aplican solamente al correspondiente espinor, viniendo determinado el resultado de su aplicación por las fórmulas (57.4). Pasando luego nuevamente a espinores simétricos arbitrarios, es decir, a las funciones de onda de una partícula de spin s, obtenemos las siguientes fórmulas ( A ,f,)= ~• -- .l(s + cr) ',,,fu' -... 2 Sa;'f' s+u s-u ••• 22 ••• s 11',/,)11 f'-- A ( s+a s-a ,, ·'·)11 ... 22 ( Sz'f' - ... _ - s+u s-u --+ .l(s-cr)'''s+a+I s-u-1' 22 ••• s+u-l s-a+I - 2 11 ••• 22 ••• 'f'---- ••• 22 ••• + 1 '( ),/, 11 ,., 22 ••• s + cr),/,11 'f'----i 2 s-cr ' f ' - - - - 1 '( 2i s+a-I s-a+I .,.11 ... 22 ... cr'f'- --. s+u s-o 1 /- s+a+l s-u-1' (57.5) J Observemos que, partiendo de estas fórmulas y de las relaciones (57.2), se podrían deducir las expresiones (55.5) para los elementos de matriz del operador de spin que se aplica a las funciones 1P(a). § 58. La relación entre espinores y tensores Hasta aquí hemos hablado de los espinores en tanto que funciones de onda del momento cinético propio de las partículas elementales. Sin embargo, desde un punto de vista formal no existe ninguna diferencia entre el spin de una sola partícula y el momento cinético total de un sistema cualquiera, considerado como un todo, prescindiendo de su estructura interna. Por ello es evidente que las propiedades de transformación de los espinores en relación con las rotaciones espaciales se refieren también y en igual medida al comportamiento de las funciones de onda "Pim de una partícula cualquiera (o de un sistema de partículas) de momento cinético total j, con independencia de su naturaleza (orbital o de spin). Debe existir, por lo tanto, 232 Spin una determinada correspondencia entre las leyes de transformación de las funciones propias '1/'im en las rotaciones del sistema de coordenadas y las leyes de transformación de las componentes de un espinor simétrico de orden 2j. Al establecer esta correspondencia es necesario, sin embargo, distinguir rigurosamente entre dos aspectos de la dependencia de las funciones de onda respecto de la proyección del momento cinético, m (para un valor dado de j). Se puede tratar de una función de onda en tanto que amplitud de probabilidad de los diferentes valores de m, y se puede tratar de una función propia en tanto que correspondiente a un valor dado de m. Nos hemos encontrado ya con estos dos aspectos al principio del § 55, donde se introdujo la « función propia » ,5ªªº del operador Sz correspondiente al valor Sz = a 0 • La diferencia matemática entre ambos resulta particularmente clara para una partícula de spin s = f. En este caso, la función espinorial es, respecto de la variable a, un espinor contravariante de primer orden, es decir, debe escribirse, de acuerdo con las notaciones espinoriales, en la forma o'1ao· Respecto de a 0 , dicha función es, en consecuencia, un espinor covariante. Esta circunstancia posee, evidentemente, un carácter general: las funciones propias tp¡m pueden hacerse corresponder con las componentes de un espinor simétrico covariante de orden 2j de acuerdo con las fórmulas, análogas a la (57.2) (1): lfjm = J (. (2j)! )'( . /n . . 22 ... • J+m. 1-m. -.--.- (58.1) J+m J-m Los armomcos esféricos Y¡m son las funciones propias correspondientes a los valores enteros del momento cinético j y la fórmula (58.1) establece su correspondencia con las componentes de un espinor covariante de orden par. Particularmente importante es el caso j = 1. Los tres armónicos esféricos Y 1m son: Y10 =i Y1,:1::1 = J: J: ::¡: z· cos9 =i n., j2-s~ sen Oe±i</> = ::¡: ij~nQ:±in")' s~ (1) A este resultado se puede llegar también siguiendo un camino algQ. distinto. Si se desarrolla la función de onda tp de una partícula en un estado de momento cinético j en funciones propias tp:Jm: tp = = L Om'IJ'Jm, los coeficientes Om son las amplitudes de probabilidad de los diferentes valores m. En este ,n sentido, los am corresponden a las « componentes » tp(m) de una función de onda espinorial, con lo que se fija su ley de transformación. Por otra parte, el valor de 'P en un punto dado del espacio no puede depender de la elección del sistema de coordenadas, es decir, la suma L-OmtpJm debe ser un escalar. Comparando con el escalar (57.3), vemos que los am deben transformarse como (- l)J-m,¡'J,-m. 233 La relación entre espinores y tensores (n es el vector unitario correspondiente al vector posición). La comparación de estas expresiones con la fórmula (58.1) prueba que es posible hacer corresponder las componentes de un vector con las componentes de un espinor de segundo orden mediante las fórmulas (1): i t/,12 = -az, (58.2) v'2 o bien 'l ip22 = - -(ax+iay). v'2 (58.3) Recíprocamente: az = iy2ip12, ax = i y2(ip22-ipll), 1 ay = - ( ipll y2 + ip22). (58.4) Es fácil comprobar que, con esta definición, es válida la igualdad 'Pil.µ'Pil.µ = a.b, (58.5) donde a y b son los vectores que corresponden a los espinores simétricos tp;.,µ y <p;.,µ. Tampoco es difícil comprobar que al espinor lfvil.cf,µv + lfvµ<pil.v corresponde el vector yZaxb. La correspondencia (58.2) o (58.3) es caso particular de una regla general: a cada espinor simétrico de orden par 2j, donde j es entero, se le puede hacer corres-· ponder un tensor simétrico de orden mitad (j) cuya contracción respecto de un par cualquiera de índices se anula (a un tensor de este tipo lo llamaremos irreducible). Este resultado se sigue ya de que el número de componentes independientes en dicho espinor y en dicho tensor es el mismo (igual a 2j+ 1), como es fácil comprobar mediante un simple cálculo (2). La correspondencia entre las componentes del espinor (1) Entre las funciones tp 1m y las componentes de dicho vector existe la relación (58.2a) (2) Desde un punto de vista matemático cabe decir que las 2j+ l (j entero) componentes de un tensor irreducible de ordenj, al igual que el conjunto de los 2j+ l armónicos esféricos Yjm, y al igual que las 2j+ 1 componentes de un espinor simétrico de orden 2j, son bases de una misma representación irreducible del grupo de rotaciones. 234 Spin y del tensor se puede hallar mediante las fórmulas (58.2-4) si se considera el espinor de orden dado como producto de espinores de segundo orden, y el tensor como producto de vectores. Finalmente, determinemos la relación entre los ángulos de rotación del sistema de coordenadas y los coeficientes oc, /3, y, o de la transformación binaria. Para ello lo más fácil es observar que, de una parte, los cosenos de los ángulos entre los ejes de coordenadas originales y los nuevos son los coeficientes de las fórmulas de transformación de las componentes de un vector (58.6) y que, de otra, esta misma transformación se. puede efectuar mediante la transformación binaria utilizando las fórmulas (58.4), (55.12). Tenemos así, por ejemplo: a',= iy2,f,12 ' = iy2[cxy,f,11 +f3Sys22 +(cxS+f3y),f,12] = (-cxy+f3S)ax+i(cxy+f3S)a 11 +(rx8+f3y)a, De manera análoga se determinan los demás coeficientes r1.¡k y obtenemos en definitiva la siguiente tabla para los coeficientes de la transformación: (58.7) Las expresiones inversas, que dan los coeficientes oc, /3, y, o en función de los ángulos de la rotación del sistema de coordenadas, se pueden encontrar utilizando para definir la rotación los ángulos de Euler. La matriz de los coeficientes oc, /3, y, <5 que corresponde a una rotación de ángulo cp en torno del eje z (designémosla por w(cp)), según la fórmula (55.1) con a= ± t, tiene la forma: rx. [ y /3] =w(</>) = [é<M'oJ 8 O e-i</J/2 J • (58.8) La matriz O(O) que expresa la rotación de ángulo O en torno del eje x se calcula fácilmente a partir de las fórmulas (58.7), en las que hay que hacer rxxx = 1, rxyy = {Xzz = cose, rxyz = - ªzy = sen e, rxxy = rxyx = ªxz = ªzx = O: Se tiene entonces !2(8) = cos }8 [ t' sen iB i sen !8] cos f 8 . (58.9) La relación entre espinores y tensores 235 La rotación determinada por los ángulos de Euler cf,, e, 1P (fig. 20; ON es la interseccción de los planos xy y x'y'), se efectúa en tres fases; giro de ángulo cf, en torno del eje z, a continuación giro de ángulo e en torno de la nueva posición del eje x y, finalmente, giro de ángulo 1P en torno de la dirección final que se obtiene para el z 4> y' .,,....---,, / / / I I I / I \ \ \ I I \ \ \ ' , __ ..... I I / FIG. 20 eje z. De acuerdo con esto, la matriz de la transformación total es igual al producto w( tp)O.(fJ)w(cf,). Multiplicando, sin más, las matrices, obtenemos finalmente [ rt. f3] y 8 = [ cos }8 . e~<cf,H)/2 i sen }8 . et<cf,- I/J)/2 i sen ¡o cos }8 . ~-i(cf,-r/,J/2] • . e-iCcf,+t/JJ/2 (58.10) En particular, a la rotación de ángulo n en torno del eje y corresponden los valores de los ángulos de Euler fJ = n, cf, - 1P = n, de forma que rf. =8= o, /3 = 1, y = -1. Esto significa que las componentes de un espinor se transforman en esta rotación de acuerdo con 1P\' = 1P2, ,p21 = - 1P\ o bien (58.11) PROBLEMAS Expresar la definición (57.4) del operador de spin 1/2 mediante las componentes espinoriales del vector s. l. Solución. y el espinor Teniendo en cuenta las fórmulas (58.3) que establecen el enlace entre el vector s la definición (57.4) se escribe en la forma sJ.µ, 236 Spin 2. Escribir las fórmulas que determinan el efecto de la aplicación del op,~rador de spin a la función de onda de una partícula de spin 1. Solución. La relación que liga las componentes de la función vectorial 1P con las componentes del espinor 1PAµ viene dada por las fórmulas (58.3), y la última de las fórmulas (57.5) nos da: -t/J+, szt/J- = t/1-, Sztpz = O Sztpx = - itf¡y, Sztpy = it/Jx, Sztpz = O. szt/J+ = o bien Las restantes fórmulas se obtienen a partir de éstas mediante permutación circular de los índices x, y, z. Todas en conjunto se pueden escribir en la form.i Es posible representar el vector complejo 1P en la forma 1P = eicx(u + iv), donde u y v son vectores reales que, mediante una elección adecuada de la fase común ét, se pueden suponer perpendiculares entre sí. Los dos vectores u y v determinan un plano que posee la propiedad de que la proyección del spin sobre la perpendicular al mismo puede tomar sólo los valores ± 1. § 59. Polarización parcial de las partículas Mediante una elección adecuada del eje z, es siempre posible reducir a cero una de las componentes (por ejemplo, la 1P2) de un espinor dado que es la función de onda de una partícula de spin l. Esto es evidente, ya que una dirección en el espacio viene determinada por dos cantidades (dos ángulos), es decir, el número de parámetros que tenemos a nuestra disposición es igual al número de cantidades que queremos reducir a cero (la parte real y la parte imaginaria del número complejo 1P2). Físicamente esto significa que si una partícula de spin !- (para concretar hablaremos de un electrón) se encuentra en el estado descrito por una cierta función de onda de spin, existe una dirección en el espacio tal que la proyección del spin de la partícula sobre la misma tiene el valor determinado a= t. Cabe decir que en dicho estado el electrón está completamente polarizado. Sin embargo, existen también estados del electrón que se pueden calificar de parcialmente polarizados. Estos estados se describen, no por funciones de onda, sino solamente por matrices densidad, es decir, son estados mezclados (respecto del spin) (véase § 14). La matriz densidad de spin del electrón es un espinor de segundo orden 2 i.p, normalizado por la condición 237 Polarización parcial de las partículas (59.1) y que satisface la condición de « hermiticidad » (pÁµ)* = p/. (59.2) En el caso de un estado de spin puro del electrón (es decir, completamente polarizado), el espinor e;_µ se reduce al producto de las componentes de la función de onda 1p ;_: (59.3) Las componentes « diagonales »·de la matriz densidad, ei1 y ez2, determinan las probabilidades de los valores k y - ! de la proyección del spin del electrón sobre el eje z. El valor medio de esta proyección es, por lo tanto: + s; = i(p11- p2 2), o bien, teniendo en cuenta (59.1), p11 = i+Sz, (59.4) En un estado puro el valor medio de la magnitud s ' = sx mediante las fórmulas ±- isy se calcula S+ = iµA* s+iµA = ipl*¡/;2, ¡:_ = if;A* §_if;:>.. = if;2*if;l (véase (55. 7)). Análogamente, en un estado mezclado tenemos: Pl2 = S+, p21 = L. (59.5) En resumen, pues, !! = ! ( 1 ~ 2§ · a) Vemos así que todas las componentes de la matriz densidad de spin del electrón se expresan en función de los valores medios de las componentes de su vector spin. Con otras palabras, el vector real s determina por comp1eto las propiedades de polarización de una partícula de spin ! . En el caso límite de polarización completa, una de las componentes de este vector (mediante la correspondiente elección de la dirección de los ejes) es igual a!, y las otras dos son nulas. En el caso opuesto de un estado no polarizado, las tres componentes son iguales a cero. En cambio, en el caso general de polarización parcial arbitraria y de una elección arbitraria del sistema de coordenadas, se cumple la desigualdad O s Q s l, donde p = 2(sx2 + .sy2 + .5z2)1/2 es una cantidad que se puede 11amar grado de polarización del electrón. Para una partícula de spin cualquiera s, la matriz den sí dad es un espinor Q }.µ ... pa ... 238 Spin de orden 4s, simétrico respecto de los 2s primeros índices y de los 2s últimos, espinor que satisface las condiciones PAµ ••• Aµ ••• = 1, (PAµ •• .Pu· .. )* = Ppa'···Aµ •••• (59.6) (59.7) Para calcular el número de componentes independientes de la matriz densidad, observemos que entre los posibles sistemas de valores de los índices A, µ, ... ( o de los índices !!, a, ... ) existen solamente 2s+ 1 esencialmente distintos. Teniendo en cuenta también que las componentes del espinor !! ¡_ 11 ••• P11 ••• están ligadas por la relación (59.6), encontramos que el número de componentes distintas es igual a (2s+ 1)2 - 1 = = 4s(s+I). Aunque estas componentes son números complejos, sin embargo y en virtud de las relaciones (59. 7), este hecho no aumenta el número total de cantidades independientes que caracterizan el estado de polarización parcial de la partícula, número que es igual, por lo tanto, 4s(s+ 1) (1). Como término de comparación, obsérvese que un estado de polarización total de la partícula se define por 4s cantidades (las 2s+ 1 componentes complejas de la función de onda v/µ ... , ligadas por una condición de normalización y que contienen una fase común que carece de importancia para la descripción del estado). Como todo espinor de orden 4s, el espinor 1P ).µ ... pa... equivale a un conjunto de tensores irreducibles de órdenes 4s, 4s - 2, ... , O. En el presente caso; se tiene un solo tensor de cada uno de estos órdenes, ya que, en virtud de las propiedades de simetría del espinor 11' ¡_1, •.• Pª···, cada una de las contracciones se puede realizar de una sola manera - respecto de uno (cualquiera) de los índices }., µ, ... y uno de los p, a, ... Además, no existe el escalar (tensor de orden cero), ya que se reduce a la unidad en virtud de la condición (59.6). ~ 60. Inversión del tiempo y teorema de Kramers La simetría del movimiento respecto del cambio de signo del tiempo se traduce en mecánica cuántica en el hecho de que si 1P es la función de onda de un estado estacionario del sistema, también la función de onda« invertida respecto del tiempo» (designémosla por 1Pinv) describe un posible estado que corresponde precisamente a la misma energía. Al final del § I 8 se demostró que 'IJ'inv coincide con la función conjugada compleja 1P*. En esta simple forma, la afirmación que precede se refiere a las funciones de onda sin tener en cuenta el spin de las partículas. Cuando existe spin es necesario precisar más. Representemos la función de onda de una partícula de spin s como espinor con(1) Dar estas cantidades eguivale a dar los valores medios de las componentes del vector s y de todas las potencias y los productos de 2, 3, ... , 2s, componentes que no se reducen aun a potencias más bajas (véase el problema 3, § 55). 239 Inversión del tiempo y teorema ,le K ramers travariante 1/,µ .. , (de orden 2s). AJ pasar a ]as funciones conjugadas complejas, tp).µ ... *, obtenemos, sin embargo, un conjunto de cantidades que se transforman como las componentes de un espinor covariante. A la operación de inversión del tiempo corresponde por ello el paso de la función de onda 1p'-! 1··• a una nueva función de onda cuyas componentes covariantes se determinan de acuerdo con la igualdad (60.1) Para un conjunto dado de valores de los índices J., ¡,, ... las componentes covariantes y contravariantes de los espinores corresponden a valores de la proyección del momento cinético que difieren en el signo. Por lo tanto, en términos de las funciones 1Pscr, a la inversión del tiempo corresponde el paso de 'Y\ 7 a 1ps, -:,, como debía ser, ya que el cambio de signo del tiempo cambia el sentido del momento cinético. La correspondencia exacta se establece de acuerdo con (60. 1): i//n__: = lfs<T*( - J)S-<T. Con otras palabras, la operación inversión del tiempo exige la substitución 'Pscr ~ lps ,-<T( - 1)S-<T. (60.2) Consideremos un sistema arbitrario de partículas en interacción mútua. En general, los momentos cinéticos orbital y de spin de un tal sistema no se conservan, cada uno por separado, si se tienen en cuenta las interacciones relativistas. Se conserva tan -,ólo el momento cinético total J. Si no existe ningún campo exterior, cada uno de los niveles de energía del sistema es degenerado de orden (21 + 1). Al dejar actuar un campo exterior, esta degeneración, en general, se rompe. Se plantea la cuestión de si la degeneración se puede romper por completo, es decir, de tal manera que el sistema posea solamente niveles simples. Este problema está íntimamente ligado con la simetría respecto de la inversión del tiempo. En la electrodinámica clásica se cumple la invariancia de las ecuaciones respecto del cambio de signo del tiempo si se conserva el campo eléctrico y se cambia el signo del campo magnético (1). Esta propiedad fundamental del movimiento debe conservarse también en la mecánica cuántica. Por consiguiente, la simetría respecto de la inversión del tiempo se cumple no solamente en el caso de un sistema aislado, sino también cuando existe un campo eléctrico exterior cualquiera (en ausencia de campo magnético). Las funciones de onda del sistema son espinares tp J.,u ••• , cuyo orden n es igual al doble de la suma de los spins de todas las partículas (n = 2 ~ sa); esta suma puede no coincidir con el spin total S del sistema. De acuerdo con lo antes dicho, cabe afirmar que en un campo eléctrico arbitrario la función de onda y la función que 1 ( ) Véase tomo 11, Teoría clásica de los c:impos, § 17. Véase también la nota al final del§ 110. 240 Spin resulta de invertir el sentido del tiempo deben corresponder a estados de igual energía. Para que el nivel sea no degenerado, es necesario en cualquier caso que estos estados coincidan, es decir, que las correspondientes funciones de onda coincidan salvo un factor constanteº Se supone, claro está, que ambas funciones se expresan en la forma de espinores de igual tipo (covariantes o contravariantes). Escribamos 11·~~~- = C1p;.p ... , o bien, según (60.1) .,.).µ.... • 'f' = e,,.\ 'f'I\µ. ••• , (60.3) donde Ces una constante. Formando las expresiones conjugadas complejas de ambos miembros de esta igualdad, obtenemos: .,.).µ.... 'f' = e•.,.\ •. 'f'Aµ ••. Bajemos los índices en el primer miembro de la igualdad, subiendo a la vez los del segundo miembro. Esto significa que multiplicamos ambos miembros de la igualdad por g,y_;_g~µ ... y sumamos respecto de los índices Ji., µ, ... ; al hacerlo, en el segundo miembro hay que tener en cuenta que ga).g/3µ •. • = { -1 )ng).<Xgµ/1 •.•• Obetenemos así: 'P>..µ,... = C*( -1 tl/J).µ ...=11=. Substituyendo 1p).p ... * por la expresión dada por (60.3), encontramos: IP..\p... = ( -1 rcc•ipAµ .... Esta igualdad debe quedar satisfecha idénticamente, es decir, debe tenerse (-- I)nCC* = l. 2 Pero dado que es positivo en cualquier caso, es claro que esta igualdad es sólo posible si n es par (es decir, si el valor de la suma ~sa es un número entero). Sin es impar (es decir, cuando el valor de ~sa e'.; semientero) (1 ) la condición (60.3) no puede quedar satisfecha. J cJ Llegamos así al resultado de que el campo eléctrico puede romper la degeneración por completo tan sólo en un sistema en el que la suma de los spins de las partículas es un número entero. En un sistema en el que dicha suma es un número semientero, todos los niveles deben ser doblemente degenerados cuando aquél se encuentra en un campo eléctrico arbitrario, y a dos estados distintos de igual energía corresponden espinores conjugados complejos (2) (H. A. KRAMERS, 1930). (1) Cuando la suma ~sa es un número entero (semientero) son también enteros (semienteros) todos los posibles valores del spin total S del sistema. 2 ( ) Si el campo eléctrico posee una simetría elevada (cúbica), puede presentarse también una degeneración de orden cuarto (véase § 99 y el problema propuesto en el mismo). Inversión del tiempo y teorema de Kramers 241 Hagamos aún una observación de carácter matemático. Una correspondencia de la forma (60.3) con una constante C rea], representa, desde e] punto de vista matemático, ]a condición de que a las componentes del espinor se pueda hacer corresponder un conjunto de ciertas cantidades reales; dicha condición se puede llamar condición de «realidad» de] spinor (1). La imposibilidad de que se satisfaga ]a relación (60.3) cuando n es impar significa que a ningún espinor de orden impar se puede asociar una magnitud reaJ. Por el contrario, si n es par, la condición (60.3) puede quedar satisfecha con C igual a un número reaJ. En particular, a un espinor simétrico de segundo orden se le puede hacer corresponder un vector real si se cumple la condición (60.3) con C = 1: if;Aµ=YF = 'PJ..µ {lo cual es fácil comprobar mediante las fórmulas (58.2-3)). En genera], la condición (60.3) con C = 1 es la condición de « realidad» de un espinor simétrico de orden par cualquiera. (1) Hablar del carácter real de un espinor en sentido literal carece en general de significado, ya que los espinores conjugados complejos poseen leyes de transformación diferentes. CAPÍTULO IX PARTÍCULAS IDÉNTICAS § 61 . Principio de indistinguibilidad de las partículas idénticas En la mecánica clásica las partículas idénticas (por ejemplo, los electrones), a pesar de la identidad de sus propiedades físicas, no pierden, sin embargo, su «individualidad». Así, cabe imaginar que las partículas que forman parte del sistema físico dado se <<numeran» en un cierto instante y que luego se sigue el movimiento de cada una de ellas a lo largo de su trayectoria; entonces en un instante cualquiera será posible identificar las partículas. En la mecánica cuántica, sin embargo, la situación cambia por completo, conforme se sigue directamente del principio de indeterminación. Más de una vez se ha señalado ya que, en virtud de este principio, el concepto de trayectoria de un electrón pierde por completo su sentido. Si se conoce exactamente la posición de un electrón ahora, ya en un instante infinitamente próximo sus coordenadas no tienen ningún valor determinado. Por ello, localizando los electrones y numerándolos en un cierto instante, nada conseguimos con vistas a identificarlos en un instante ulterior; al localizar uno de los electrones en otro instante en un cierto punto del espacio no podremos indicar cuál de los electrones precisamente fue a parar a este punto. Así, pues, no existe por principio posibilidad ninguna de seguir por separado cada una de las partículas idénticas y con ello distinguirlas. Cabe decir que en mecánica cuántica las partículas idénticas pierden por completo su « individualidad ». La identidad de las partículas en lo que concierne a sus propiedades físicas tiene aquí un sentido muy profundo: conduce a la indistinguibilidad completa de las partículas. Este principio, llamado principio de indistinguibilidad de las partículas idénticas, representa un papel fundamental en el estudio mecánico-cuántico de un sistema constituido por partículas idénticas. Consideremos primero un sistema formado por sólo dos partículas. En virtud de su identidad, los estados del sistema que se obtienen mediante la simple permutación de las dos partículas deben ser completamente equivalentes desde el punto de vista físico. Esto significa que como resultado de esta permutación, la función de onda del sistema puede variar tan sólo en un factor Principio de indistinguibilidad 243 de fase carente de importancia. Sea 11'(~1 , ~2) la función de onda del sistema y convengamos en designar por ~1, ~ 2 el conjunto de las tres coordenadas y la proyección del spin de cada una de las partículas. Debe tenerse entonces iµ(g1, g2) = eiªiµ(g2, g1), donde c1 es una constante real. El resultado de permutar de nuevo las dos partículas es volver al estado inicial, mientras que la función 11' queda multiplicada por e2 irx. De aquí se sigue que e2 irx = 1 o bien ei:I- = ± l. Así, pues, ip(~1, ~ 2) = ± 11' (~2 l 1). Llegamos así al resultado de que existen sólo dos posibilidades: la función de onda o es simétrica (es decir, no cambia en absoluto como resultado de la permutación de las partículas), o es antisimétrica (es decir, cambia de signo al efectuar la permutación). Es evidente que las funciones de onda de los diversos estados de un mismo sistema deben poseer la misma simetría; de no ser así, la función de onda de un estado que es superposición de estados de simetrías diferentes, no sería ni simétrica ni antisimétrica. Este resultado se generaliza inmediatamente a sistemas constituidos por un número arbitrario de partículas idénticas. En efecto, en virtud de la identidad de las partículas, es claro que si un par cualquiera de ellas tiene la propiedad de poderse describir por funciones de onda, digamos, simétricas, también cualquier otro par de dichas partículas poseerá la misma propiedad. Por consiguiente, la función de onda de un sistema de partículas idénticas debe ser tal que o no. varía al permutar un par cualquiera de partículas (con lo que tampoco variará en una permutación cualquiera de partículas) o cambia de signo al permutar las partículas de cada par. En el primer caso la función de onda se dice que es simétrica, en el segundo caso, que es antisimétrica. La propiedad de poderse describir o por funciones de onda simétricas o por funciones de onda antisimétricas depende del género de partículas. De las partículas que se describen mediante funciones antisimétricas se dice que obedecen a la estadística de Fermi-Dirac o que son fermiones, y de las partículas que se describen por funciones simétricas, se dice que obedecen a la estadística de Base-Einstein, o que son bosones (1 ). La mecánica cuántica relativista demuestra que la estadística a que obedecen las partículas está ligada unívocamente con su spin: las partículas de spin semientero son fermiones, y las de spin entero son bosones. (1) Esta terminología está ligada con el nombre de las estadísticas mediante las cuales se describe un gas perfecto constituido por partículas cuyas funciones de onda son antisimétricas o simétricas, respectivamente. En realidad, nos encontramos aquí no sólo ante estadísticas distintas, sino ante mecánicas esencialmente distintas. La estadística de Fermi fue propuesta por E. FERMI para los electrones en 1926 y su relación con la mecánica cuántica fue puesta de manifiesto por P. A. M. DIRAC (1926). La estadística de Bose fue propuesta por S. N. BosE para los cuanta de luz y generalizada por A. EINSTEIN ( 1924). 244 Partículas idénticas La estadística de las partículas compuestas se determina por la paridad del número de fermiones elementales que entran en su constitución. En efecto, la permutación de dos partículas idénticas compuestas es equivalente a la permutación simultánea de algunos pares de partículas elementales idénticas. La permutación de bosones no modifica la función de onda en absoluto, y la permutación de fermiones cambia su signo. Por ello, las partículas compuestas que contienen un número impar de fermiones elementales obedecen a la estadística de Fermi, y las que contienen un número par, obedecen a la estadística de Bose. Este resultado está de acuerdo, naturalmente, con la regla general antes indicada, ya que una partícula compuesta tiene spin entero o semientero según sea par o impar el número de partículas de spin semientero que entran en su composición. Así, los núcleos atómicos de peso atómico impar (es decir, formados por un número impar de protones y neutrones) obedecen a la estadística de Fermi, y los de peso par, a la estadística de Bose. En cambio, para los átomos, que, además del núdeo, contienen también los ·electrones, la estadística viene determinada, evidentemente, por la paridad de la diferencia entre el peso atómico y el número atómico. Consideremos un sistema formado por N partículas idénticas de cuya interacción mutua se puede prescindir. Sean 1/'i, tp2 , ••• las funciones de onda de los diferentes estados estacionarios en que pueden encontrarse cada una de las partículas por separado (1). El estado del sistema como un todo se puede determinar indicando los números que caracterizan los estados en que se encuentran las diferentes partículas. Se plantea el problema de ver cómo se puede construir la función de onda o/ del sistema como un todo a partir de las funciones tp1, tp2 , ••• Sean Pi, p 2 , ••• , P.-v los números que fijan los estados en los que se encuentran las partículas por separado (entre estos números puede haberlos iguales entre sí). Para un sistema de bosones, la función de onda o/(,;1 , ~2 , ••• , ~s) se expresa como suma de productos de la forma: q,"'l (f1)q,f!2 (f2) ••• q,flB (fN), con todas las permutaciones posibles de los diferentes índices Pi, p2 ••• ; esta suma posee, evidentemente, la propiedad de simetría exigida. Así, por ejemplo, para un sistema de dos partículas (61.1) (suponemos que p 1 =f=. p 2 ). El factor J"fV 2 se introduce para normalizar 'lº (todas las funciones 'f'i, ,,,2 , ••• son ortogonales dos a dos y se suponen normalizadas). (1) estados. Si existiera una fuerte interacción entre las partículas, sería imposible, claro está, hablar de tales Interacción de intercambio 245 Para un sistema de fermiones, la función de onda 'F es la combinación antisimétrica de los productos indicados. Esta función se puede escribir en forma de determinante 'P1> (t1) 'P1> (t2) 'P1> (tN) 'P112 (t1) 'P1>2 (t2) 'P1>2 (tN) 1 1 'f" = vN! 1 1 (61.2) 'P1>)t1) 'P1>8 (t2) 'P1>N (tN) A la permutación de dos partículas corresponde aquí la permutación de dos columnas del determinante, cuyo resultado, como es sabido, es cambiar el signo del mismo. Para un sistema constituido por dos partículas tenemos: (61.3) De la expresión (61.2) se deduce el siguiente importante resultado. Si entre los números Pi, P2, ... hay dos que son iguales, dos filas del determinante resultan ser iguales y éste se anula idénticamente. El determinante será distinto de cero solamente cuando todos los números Pi, p 2 , ••• sean diferentes. Así, pues, en un sistema de fermiones idénticos dos (o más) partículas no pueden encontrarse a la vez en el mismo estado. Éste es el llamado principio de Pauli (1925). § 62. Interacción de intercambio El hecho de que en la ecuación de ScHRODINGER no se tenga en cuenta la existencia del spin de una partícula, en modo alguno hace perder su valor ni a esta ecuación ni a los resultados que se obtienen a partir de ella. Y ello es así porque la interacción eléctrica de las partículas no depende de sus spins (1 ). Desde el punto de vista matemático, esto significa que el hamiltoniano de un sistema de partículas en interacción eléctrica (y si no existe campo magnético) no contiene los operadores de spin y, por lo tanto, al aplicarlo a una función de onda, no actúa sobre las variables espinoriales. Por lo tanto, en realidad, satisfacen a la ecuación de SCHRODINGER cada una de las componentes de la función de onda; con otras palabras, la función de onda 'J:(r1, a 1 ; r 2 , a2 ; ••• ) de un sistema de partículas se puede escribir en forma de producto x( ª1, ª2, ••. )<fo(r1, r2, •.. ) de una función <p que depende solamente de las coordenadas de las partículas y una función x de los spins (llamaremos a la primera función de onda de coordenadas ( 1) Esto vale sólo en tanto se trata de la aproximación no relativista. Si se tienen en cuenta los efectos relativistas, la interacción de las partículas cargadas resulta depender del spin. 246 Partículas idénticas u orbital, y a la segunda, función de onda de spin). La ecuación de ScHRODINGER determina esencialmente tan sólo la función de coordenadas cp, dejando arbitraria la función X· En todos los casos en que no nos interesa el propio spin de las partículas, es posible, por consiguiente, aplicar la ecuación de ScHRODINGER considerando como función de onda únicamente la función de coordenadas, que es precisamente lo que se hizo en cuanto se ha expuesto hasta aquí. Sin embargo, resulta que, a pesar de la independencia que hemos señalado de la interacción eléctrica de las partículas con relación a su spin, existe una dependencia peculiar de la energía del sistema respecto de su spin total, dependencia que procede en último término del principio de indistinguibilidad de las partículas idénticas. Consideremos un sistema constituido solamente por dos partículas idénticas. Como resultado de resolver la ecuación de ScHRODINGER, encontramos toda una serie de niveles energéticos a cada uno de los cuales corresponde una determinada función de onda de coordenadas cp(r1, r 2) que es simétrica o antisimétrica. En efecto, en virtud de la identidad de las partículas, el hamiltoniano del sistema (y, por consiguiente, también la ecuación de ScHRODINGER) es invariante respecto la permutación de las mismas. Si los niveles de energía no son degenerados, al permutar las coordenadas r 1 y r 2 , la función cp(r1 , r 2) puede cambiar tan sólo en un factor constante; pero si se aplica de nuevo la permutación, se observa que este factor únicamente puede ser igual a ± 1 (1). Supongamos primero que las partículas tienen spin nulo. No existe factor de spin para tales partículas y la función de onda se reduce solamente a una función de las coordenadas cp(r1, r 2), que debe ser simétrica (ya que las partículas de spin nulo obedecen a la estadística de Bose). Así, pues, no todos los niveles de energía que se obtienen al resolver formalmente la ecuación de SCHRODINGER pueden existir en realidad~ aquéllos a los que corresponden funciones </> anti simétricas son imposibles para el sistema considerado. La permutación de dos partículas idénticas equivale a invertir el sistema de coordenadas (cuyo origen se elige de forma que coincida con el punto medio del segmento que une ambas partículas). Por otra parte, como resultado de la inversión, la función de onda </> debe quedar multiplicada por (- 1)1, donde les el momento cinético orbital del movimiento relativo de ambas partículas (véase § 30). Comparando estas consideraciones con lo dicho antes, llegamos a la conclusión de que un sistema de dos partículas idénticas de spin nulo tan sólo puede poseer momentos cinéticos orbitales pares. (1) Cuando existe degeneración, es siempre posible elegir combinaciones lineales de las funciones relativas al nivel dado, tales que dichas combinaciones satisfacen también esta condición. Interacción de intercambio 247 Supongamos ahora que el sistema está constituido por dos partículas de spin ! {por ejemplo, dos electrones). La función de onda total del sistema (es decir, el producto de la función cp(r1, r 2) y la función de spin x(a1 , a 2)) debe ser entonces nece. sariamente antisimétrica respecto de permutación de ambos electrones. Por ello, si la función de las coordenadas es simétrica, la función de spin debe ser antisimétrica, y recíprocamente. Escribiremos la función de spin en forma espinorial, es decir, como espinor de segundo orden x},µ, cada uno de cuyos índices corresponde al spin de uno de los electrones. A una función simétrica respecto de los spins de ambas partículas corresponde un espinor simétrico (xAµ = xµA), y a una función antisimétrica, un espinor antisimétrico (xAp, = - xµA). Pero sabemos que un espinor simétrico de segundo orden representa un sistema cuyo spin total es igual a la unidad, y que un espinor antisimétrico se reduce a un escalar, que corresponde a un spin igual a cero. Llegamos así al siguiente resultado. Los niveles de energía a los que corresponden soluciones </>(r1, r2) de la ecuación de SCHRODINGER simétricas pueden efectivamente existir para un spin total del sistema igual a cero, es decir, cuando los spins de ambos electrones son « antiparalelos », lo que da una suma nula. En cambio, los valores de la energía ligados a funciones cp(r1, rJ, antisimétricas exigen un spin total igual a la unidad, es decir, los spins de los dos electrones deben ser« paralelos». Con otras palabras, los valores posibles de la energía de un sistema de electrones dependen de su spin total. Basándose en esto, cabe hablar de una cierta interacción peculiar de las partículas, interacción que conduce a dicha dependencia. Esta interacción se llama interacción de intercambio. Se trata de un efecto puramente cuántico que desaparece por completo (como el propio spin) al pasar al límite de la mecánica clásica. He aquí una circunstancia que es característica del caso que acabamos de examinar, el de un sistema de dos electrones. A cada nivel de energía corresponde un determinado valor del spin total: O ó 1. Esta correspondencia entre los valores del spin y los niveles de energía se conserva también, como veremos a continuación (§ 63), en los sistemas constituidos por un número arbitrario de electrones. Sin embargo, dicha correspondencia deja de existir en los sistemas constituidos por partículas de spin mayor que !. Consideremos un sistema de dos partículas de spin arbitrario s. Su función de onda de spin es un espinor de orden 4s >.µ ••. p(I ••• X~2s' de cuyos índices la mitad (2s) corresponden al spin de una partícula, y la otra mitad, al spin de la otra. Este espinor es simétrico con relación a los índices de cada uno 248 Partículas idénticas de estos grupos de índices. A la permutación de ambas partículas corresponde ]a permutación de todos ]os índices }., ,,, ... del primer grupo con los índices Q, a, ... del segundo grupo. Para obtener la función de spin de un estado del sistema con spin total S, hay que contraer este espinor respecto de 2s - S pares de índices (cada par contiene uno de los índices }., p, ... y uno de los índices !.!, a, ... ) y simetrizar luego respecto de los restantes; se obtiene como resultado un espinor simétrico de orden 2S. Pero, conforme sabemos, la contracción de un espinor respecto de un par de índices significa construir una combinación de componentes antisimétrica respecto de estos índices. Por lo tanto, al permutar las partículas la función de onda de spin queda multiplicada por (- 1)2s-s. Por otra parte, la función de onda total del sistema de dos partículas ·debe quedar multiplicada por (- 1)2s al permutarlas (es decir, por + 1 para s entero y por - l paras semientero). De aquí se sigue que la simetría de la función de onda de coordenadas respecto de la permutación de las partículas viene dada por el factor (- l)\ que depende sólo de S. Llegamos así al resultado de que la función de onda de coordenadas de un sistema de dos partículas idénticas es simétrica cuando el spin total es par, y antisimétrica cuando es impar. Recordando lo antes dicho respecto de la permutación de las partículas y de la inversión del sistema de coordenadas, llegamos a la conclusión de que cuando el spin Ses par (impar), el sistema puede poseer solamente un momento cinético orbital par (impar). Vemos, por lo tanto, que también en este caso se manifiesta una cierta dependencia entre los valores posibles de la energía del sistema y el spin total, pero esta dependencia no es del todo unívoca. Los niveles de energía a los que corresponden funciones de onda de las coordenadas simétricas (antisimétricas) pueden existir para todos )os valores de S pares (impares). Determinemos cuántos estados diferentes de un sistema de dos partículas de spin s existen en total con valores de S pares e impares. La cantidad S toma 2s+ 1 valores: 2s, 2s - 1, ... , O. Para cada S dado, se tienen 2S + 1 estados que difieren en el valor de la componente-z del spin (en total (2s+I)2 estados distintos). Supongamos que ses entero. Entonces entre los 2s+ 1 valores S hay s+ 1 pares y s impares. El número total de estados con S par es igual a la suma ~ (2S+l) = (2s+l)(s+l); 8-0,2,...,28 249 Interacción de i1J,tercambio los restantes s(2s+ 1) estados tienen spin Simpar. De manera análoga encontramos que cuando s es semientero se tienen (2s +1) estados con valores S pares y (s + 1) (2s+ 1) con valores impares. PROBLEMAS 1. Determinar el desdoblamiento de intercambio de los niveles de energía de un sistema de dos electrones: la interacción de los electrones se considera como una perturbación. Solución. Supongamos que las partículas se encuentran (sin tener en cuenta su interacción mutua) en estados cuyas funciones de onda orbitales son cf,i(r) y cf,lr). A los estados del sistema con spin total S = O y S = 1 corresponden, respectivamente, los productos simetrizados y antisimetrizados: Los valores medios del operador interacción de las partículas U(r2 iguales a A ± J, donde r1) en estos estados son (la integral J se llama integral de intercambio). Prescindiendo de la constante aditiva A, que no tiene el carácter de intercambio, encontramos así para los desplazamientos de los niveles: llEo = J, llE1 = - J (el subíndice indica el valor de S). Estas cantidades pueden interpretarse como valores propios del « operador de intercambio» de spin (1) Vcamb = -V(l +4s1. s2); (1) (en cuanto a los valores propios del producto s1 • s2 , véase el problema 2, § 55). Si los electrones pertenecen, por ejemplo, a átomos diferentes, la integral de intercambio disminuye exponencialmente al aumentar la distancia R entre los átomos. La estructura del integrando pone claramente de manifiesto que esta integral viene determinada por el « solapamiento » de las funciones de onda de los estados cf,1(r1) y ,"2(r2); teniendo en cuenta la ley asintótica (cf. (21.6)) del decrecimiento de las funciones de onda de los estados del espectro discreto, encontramos que Kl = y1(2mlE11)/n, donde Ei, E 2 son los niveles de energía del electrón en uno y otro átomo. 2. El mismo problema, pero para un sistema de tres electrones. Solución. Teniendo en cuenta la fórmula (1) del problema 1, escribiremos el operador de interacción binaria de intercambio para un sistema de tres electrones en la forma (1) 1 ( ) Este operador fue introducido por primera vez por DIRAc. 250 Partículas idénticas donde la suma se extiende a todos los pares de partículas 12, 13 y 23. Los elementos de matriz de los operadores 8b entre estados con valores diferentes de los pares de números ªª' ab se determinan mediante las fórmulas (55.6) y son iguales a: sa. Determinemos primero la energía que corresponde al máximo valor posible de la proyección del spin total Ms = a 1 +a2 +a3 , es decir, al valor Ms = 3/2; con ello determinamos también la energía del estado con spin total S = 3/2. Calculando el correspondiente elemento de matriz diagonal del operador (1 ), encontramos: Pasemos ahora a los estados con Ms = t. Este valor de Ms puede obtenerse de tres maneras, que dependen de cuál de los números O'i, a 2 , a 3 es igual a - ! (y los otros dos iguales a ~ ). Obtendríamos así para estos estados una ecuación secular de tercer grado. Sin embargo, el cálculo se puede simplificar sin más que observar que una de las raíces de esta ecuación debe corresponder a la energía ya encontrada del estado con S = 3/2, y que, por lo tanto, la ecuación secular ha de ser divisible por ll.E - ll.E3, 2; esta circunstancia permite en el caso presente eludir el cálculo del término independiente de la ecuación cúbica (1). Así, calculando los términos de mayor grado de la ecuación, obtenemos (.6.E)3 + (li2 + lia + l2a)(.6.E2) + [li2l1a + l12l2a + lial2a- 9(1122 + lia2 + 12a2)/4 ].6.E + ... = O. y dividiendo por ll.E+J12 +J13 +J21i, se encuentran los dos niveles de energía que corresponden a los estados con spin S = ~: Se tienen así en total tres niveles de energía, de acuerdo con el cálculo efectuado en el problema del § 63. 3. ¿En qué estados el núcleo Be8 puede desintegrarse en dos partículas rx? Solución. Dado que una partícula rx carece de spin, el sistema de dos partículas rx puede poseer solamente un momento cinético orbital par (que coincide con el momento cinético total), y sus estados son pares. Por consiguiente, la desintegración en cuestión es tan sólo posible a partir de estados pares del núcleo Be8 con momento cinético total par. § 63. Simetría respecto de las permutaciones Al considerar un sistema formado por dos partículas solamente, podíamos afirmar que las funciones de onda de coordenadas de sus estados estacionarios, cp(r1, r2), deben ser o simétricas o antisimétricas. En cambio, en el caso general de un sistema formado por un número arbitrario de partículas, las soluciones de la ecuación de SCHRODINGER (funciones de onda de las coordenadas) no tienen porqué 1 ( ) Este método es particularmente útil en cálculos análogos para sistemas con un gran número de partículas. Simetría respecto de las permutaciones 251 ser, sin más, simétricas o antisimétricas respecto de la permutación de un par cualquiera de partículas, como sí ocurre para las funciones de onda totales (que incluyen el factor de spin). Ello se debe a que permutar tan sólo las coordenadas de dos partículas no corresponde aún a su permutación física. La identidad física de las partículas conduce aquí únicamente a que el hamiltoniano del sistema sea invariante respecto de una permutación cualquiera de aquéllas y, por lo tanto, si una cierta función es solución de la ecuación de SCHRODINGER, también serán solución las funciones que se obtienen a partir de ella mediante permutaciones diferentes de las variables. Antes de proseguir haremos algunas observaciones acerca de las permutaciones en general. En un sistema de N partículas son posibles en total N! permutaciones diferentes. Si imaginamos que las partículas están numeradas, cada permutación se puede representar mediante una determinada sucesión de los números 1, 2, 3, ... Cada una de estas sucesiones se puede obtener a partir de la sucesión natural 1, 2, 3, ... mediante permutaciones sucesivas de pares de partículas. La permutación se llama par o impar según sea par o impar el número de permutaciones de pares. Designemos por P los operadores de permutación de N partículas e introduzcamos la cantidad op, igual a + 1 si¡, es una permutación par e igual a - 1 si la permutación es impar. Si </> es una función simétrica respecto de todas las partículas, se tendrá Pef, = cfo, y si es una función antisimétrica respecto de todas ellas, será A partir de una función arbitraria <f>(r1, r 2 , ••• , r.v) es posible formar una función simétrica mediante la operación de simetrización, que se puede escribir así: cf,sim = constante X ~ Pq,, (63.1) donde Ja suma se extiende a todas las permutaciones posibles. En cambio, la operación que conduce a una función antisimétrica (esta operación se llama a veces alternación) se puede escribir en la forma: 'Pant = constante X ~ p 8pP<f,. (63.2) Volvamos a la cuestión de cómo se comportan las funciones de onda cp de un sistema de partículas idénticas respecto de las permutaciones (1). El hecho de que el hamiltoniano del sistema B es simétrico respecto de todas las partículas, significa matemáticamente que fl conmuta con todos los operadores de permutación P. Sin embargo, estos operadores no conmutan entre sí, y por ello no pueden reducirse simultáneamente a la forma diagonal. Esto quiere decir que las funciones de onda cp ( 1) Desde el punto de vista matemático, el problema consiste en encontrar las representaciones irreducibles del grupo de las permutaciones. Para una exposición detallada de la teoría matemática de los grupos de permutaciones (de los llamados grupos simétricos), véase: H. WEYL, Gruppentheorie und Quantenmechanik, 1931; D. E. RuTHERFORD, Substitutional Analysis, University Press; Edinburgh, 1949; F. D. MuRNAGHAN, The theory of group representations, Johns Hopkins Press, Baltimore, 1938. 252 Partículas idénticas no se pueden elegir de manera que cada una de ellas sea simétrica o antisimétrica con relación a todas las permutaciones binarias por separado (1). Planteémonos el problema de determinar los tipos posibles de simetría de las funciones cf,(r1, r 2 , ••• , rN) de Nvariables (o de conjuntos de algunas de tales funciones) respecto de las permutaciones de las variables. La simetría debe ser tal que « no pueda ser aumentada », es decir, que toda operación adicional de simetrización o alternación, al ser aplicada a estas funciones, las reduciría o bien a una combinación lineal de ellas mismas, o idénticamente a cero. Conocemos ya dos operaciones que conducen a funciones de máxima simetría: la simetrización respecto de todas las variables y la alternación respecto de todas las variables. Estas operaciones se pueden generalizar de la siguiente manera. Descompongamos el conjunto de las Nvariables r 1, r 2, ... , rN (o, lo que es lo mismo, el conjunto de los índices 1, 2, 3, ... , N) en filas que contienen N 1, N 2 , ••• elementos (variables); N 1 +N2 +... = N. Una tal descomposición se puede representar gráficamente por un diagrama (el llamado diagrama de Young), en el cual cada uno de los números N 1, N 2 , ••• se representa por una fila de varias celdillas (así, en la fig. 21 se representan los esquemas de las descomposiciones 6+4+4+3+3+1 +1 y 7 + 5 + 5 + 3 + 1 + 1 para N = 22); en cada uno de los cuadrados hay que colocar uno de los números 1, 2, 3, ... Si se distribuyen las filas en orden de longitudes decrecientes (conforme se ha hecho en la fig. 21), el esquema contendrá no solamente sucesivas filas horizontales, sino también columnas verticales. 1 1 - - 1 1 -FIG. 21 Simetricemos la función arbitraria </>(r1, r 2, ... , rN) respecto de las variables que aparecen en cada una de las filas. Después de esta operación, la alternación se puede aplicar solamente a las variables que se encuentran en diferentes filas; la alternación respecto de pares de variables que se encuentran en una misma fila da, claro está, un resultado idénticamente nulo. (1) Tan sólo para un sistema de dos partículas se tiene un unico operador de permutación, operador que se puede reducir a la forma diagonal a la vez que H. Simetría respecto de las permutaciones 253 Al elegir una variable de cada fila, podemos suponer sin restringir la generalidad que dicha variable se encuentra en la primern celdilla de cada una (después de la simetrización, el orden en que se distribuyen las variables entre las diferentes celdillas de una fila carece de importancia); efectuemos la alternación respecto de estas variables. Suprimiendo luego la primera columna, apliquemos la alternación a variables elegidas una en cada una de las filas del diagrama así « acortado >>; al hacerlo. podemos de nuevo suponer que las variables se encuentran en las primeras celdillas de las filas «acortadas». Iterando este proceso, llegamos a una función simetrizada primero respecto de las variables de cada fila, y sometida luego a alternación respecto de las variables de cada columna (después de la alternación, la función, claro está, en general deja de ser simétrica respecto de las variables de cada fila; el carácter simétrico se conserva solamente con relación a las variables que se encuentran en las celdillas de la primera fila que sobres,alen de las restantes filas). Distribuyendo las N variables de diferentes maneras según las filas del diagrama de Y oung (la distribución entre las celdillas de cada fila carece de importancia), obtenemos una sucesión de funciones que en una permutación arbitraria de las variables se transforman linealmente entre sí (1). Sin embargo, es necesario subrayar que no todas estas funciones son linealmente independientes; el número de funciones independientes es, en general, menor que el número .de distribuciones posibles de las variables entre las filas del diagrama; no nos detendremos aquí en los pormenores (2). De esta manera, cada diagrama de Young determina un cierto tipo de simetría de las funciones respecto de las permutaciones. Formando todos los diagramas de Young posibles (para un N dado), encontramos todos los tipos posibles de simetría. El problema se reduce a descomponer el número N, de todas las maneras posibles, en suma de sumandos más pequeños, incluyendo también en el número de las descomposiciones posibles el propio número N (así, para N = 4 son posibles las descomposiciones: 4,3+1,2+2,2+ 1+1,1 +l +I + 1). A cada nivel de energía del sistema se puede hacer corresponder un cierto diagrama de Y oung que determina la simetría de permutación de las correspondientes soluciones de la ecuación de ScHRODINGER; a cada valor de la energía corresponde, en general, un cierto número de funciones diferentes que se transforman entre sí al aplicarles una permutación (3). Sin embargo, es necesario subrayar que este hecho (1) Sería posible efectuar la simetrización y la alternación en el orden contrario - alternar primero respecto de las variables de cada columna, y simetrizar luego con relación a las variables de las diferentes filas. Sin embargo, nada nuevo conseguiríamos con ello, ya que las funciones obtenidas siguiendo uno y otro método son combinaciones lineales unas de otras. 2 ( ) Para el caso de partículas de spin ! , el número de funciones independientes (es decir, la dimensión de la representación irreducible) se determina en el problema propuesto en este párrafo. (•) La existencia de esta « degeneración permutativa » está ligada con el hecho de que los operadores de permutación, que conmutan con el hamiltoniano, no conmutan, en general, entre sí (véase§ 10, pág 34). 254 Partículas idénticas no significa que exista una degeneración física adicional de los niveles de energía. Todas estas diferentes funciones de onda de las coordenadas, una vez multiplicadas por las funciones de spin, conducen a una determinada combinación - la función de onda total - que cumple la condición de ser simétrica o antisimétrica (según sea el número de partículas). Entre los diferentes tipos de simetría existen siempre (para un N dado) dos a los que corresponden, a cada uno, tan sólo una función. A uno de estos tipos corresponde una función que es simétrica respecto de todas las variables; al otro, una que es anti simétrica (en el primer caso, el diagrama de Y oung consta de una sola fila de N celdillas; en el segundo, hay una sola columna). Pasemos ahora a las funciones de onda de spin x( a 1, a 2 , ••• , ªN ). Sus tipos de simetría respecto de las permutaciones de las partículas se determinan mediante los mismos diagramas de Y oung en los que el papel de variables lo representan ahora las proyecciones de los spins de las partículas. Se plantea la cuestión de qué diagrama debe corresponder a la función de spin para un diagrama dado de la función de coordenadas. Supongamos primero que las partículas poseen spin entero. La función de onda total 111 debe ser entonces simétrica respecto de todas las partículas. Para que así sea, la simetría de las funciones de spin y de coordenadas debe venir determinada por un mismo diagrama de Y oung y la función de onda total tp se expresa en la forma de ciertas combinaciones bilineales de unas y otras; no nos detendremos aquí a considerar el problema de cómo construir estas combinaciones. Supongamos ahora que las partículas poseen spin semientero. La función de onda total debe entonces ser antisimétrica respecto de todas las partículas. Se puede demostrar que para ello los diagramas de Young de las funciones de coordenadas y de spin deben poderse obtener substituyendo las filas del uno por las columnas del otro, y recíprocamente (dos de estos esquemas se representan, por ejemplo, en la fig. 21). Analicemos más detenidamente el caso importante de las partículas con spin ! (por ejemplo, electrones). Cada una de las variables de spin a 1 , a 2 , ... toma aquí solamente dos valores, ±t. Dado que una función antisimétrica respecto de dos variables cualesquiera se reduce a cero cuando estas variables poseen valores iguales, es claro que la función x puede ser sometida a alternación solamente respecto de pares de variables; ya al alternar respecto de tres variables, dos de ellas tendrán, necesariamente, los mismos valores, de forma que se obtendrá un resultado idénticamente nulo. Así, pues, para un sistema de electrones los diagramas de Young de las funciones de spin pueden contener columnas cuya longitud es solamente de una o dos celdillas (es decir, una o dos filas en total); en cambio, en los diagramas de Young de las Simetría respecto de las permutaciones 255 funciones de coordenadas, esto mismo vale para la longitud de una fila. El número de tipos posibles de simetría de permutación para un sistema de N electrones es igual, por consiguiente, al número de descomposiciones posibles (particiones) del número Nen suma de unos y doses. Cuando N es par, este número es igual a N/2 + 1 (descomposición en O, 1, ... , N/2 doses), y cuando N es impar, es igual a (N+l)/2 (descomposición en O, 1, ... , (N - 1)/2 doses). Así, por ejemplo, en la fig. 22 se representan los posibles diagramas de Young (de coordenadas y de spin) para N = 4. Es fácil ver que cada uno de estos tipos de simetría (es decir, cada uno de los diagramas de Y oung) corresponde a un determinado spin total S del sistema de electrones. Consideraremos las funciones de spin en su forma espinorial, es decir, en la forma de un espinor de orden N, cuyos índices (cada uno de los cuales corresponde al spin de una sola partícula) serán las variables que se distribuirán entre las celdillas de los diagramas de Y oung. Consideremos un diagrama de Y oung de spin constituido por dos filas, que contienen N 1 y N 2 celdillas, respectivamente (N1 +N2 = N, N 1 > N 2). En las N 2 primeras columnas se tienen en cada una dos celdillas y el espinor debe ser antisimétrico respecto de los correspondientes pares de índices. En cambio, respecto de los índices que se encuentran en las n = N 1 - N2 últimas celdillas de la primera fila, el espinor debe ser simétrico. Pero, conforme sabemos, un espinor de orden N de este tipo se reduce a un espinor simétrico de orden n, al que corresponde un spin total S = n/2. Volviendo a los diagramas de Y oung de las funciones de coordenadas, podemos decir que un diagrama con n filas que contienen una celdilla cada una, corresponde a un estado con spin total S = n/2. Cuando N es par, el spin total puede tener los valores enteros comprendidos entre cero y N/2, y cuando N es impar, los valores semienteros entre ! y N/2, como debía ser. i1.µ ... Subrayemos que esta correspondencia unívoca entre los diagramas de Young y el spin total vale solamente para los sistemas de partículas de spin 4 ; que así es lo comprobamos ya en el párrafo anterior para el caso de un sistema con sólo dos partículas (1). (1) En la nota de la pág. 70 se señaló que para un sistema de varias partículas idénticas es imposible afirmar que la función de onda correspondiente al estado estacionario de energía mínima carece de nodos. Podemos ahora precisar esta observación y aclarar su origen. Una función de onda (se trata de la función de coordenadas) que no posee nodos, debe ser necesariamente simétrica respecto de todas las partículas; si fuese antisimétrica respecto de la permutación de un par cualquiera de partículas 1, 2, se anularía para r 1 = r 2 • Pero si el sistema consta de tres o más electrones, una función de onda de coordenadas completamente simétrica es inadmisible (en un diagrama de Young de la función de coordenadas, ninguna fila puede contener más de dos celdillas). Así, pues, aunque la solución de la ecuación de ScHRODINGER que corresponde al valor propio mínimo carece de nodos (de acuerdo con el teorema del cálculo de variaciones), esta solución puede resultar físicamente inadmisible; al estado normal del sistema no corresponderá entonces el menor de los valores propios de la ecuación de ScHRODINGER, y la función de onda de este estado presentará, en general, nodos. Para partículas de spin semientero s esta situación se da en los sistemas que contienen más de 2s+ 1 partículas. En cambio, para sistemas formados por bosones, una función de onda de las coordenadas completamente simétrica es siempre posible. 256 Partículas idénticas S:2 S =1 5:0 FIG. 22 PROBLEMA Determinar el número de niveles de energía con valores diferentes del spin total S para un sistema de N partículas de spin i. Solución. se211ir de Un valor dado de la proyección del spin total del sistema M s f(Ms) = = kO' se puede con- N!/(iN+Ms)!(}N-Ms)! maneras (igual al número de combinaciones de orden N/2+Ms de N elementos; a N/2+Ms partículas atribuimos a = t, a las restantes, a = - -! ). A cada nivel de energía con el valor dado del spin S corresponden 2S + 1 estados con valores M s = S, S - 1, ... , - S de la proyección del spin. Se comprende fácilmente, por el1o, que el número de niveles de energía diferentes con el valor dado S es igual a n(S) El número total n = f(S)-f(S+ 1) = N! (28+ 1)/(!N+S+ 1)! (!N-S)t = kn(S) s de niveles de energía distintos es igual a n = Z n(S) = f(O) = N!/fü-N)!]2 s para N par, o bien n = f (!) = N!/(}N+!)! (!N-!)! para N impar. § 64. Segunda cuantificación. Estadística de Hose En el estudio mecánico cuántico de los sistemas constituidos por un número muy grande de partículas idénticas que interactúan arbitrariamente, resulta útil un método particular de análisis conocido por el nombre de segunda cuantificación. Este método es absolutamente necesario en la teoría relativista, en la que se estudian Segunda cuantificación. Estadística de Bose 257 sistemas en los que el propio número de partículas es una variable (1). Consideremos primero sistemas de partículas que obedecen a la estadística de Bose. Designemos por tpi(;), tpl;), ... un sistema completo, cualquiera, de funciones de onda ortogonales y normalizadas. Estas funciones pueden corresponder, por ejemplo, a los estados estacionarios de una sola partícula en un cierto campo exterior. Hay que subrayar que la elección de este campo es arbitraria y no tiene por qué coincidir necesariamente con el campo real en el que se encuentran las partículas del sistema físico estudiado. Como en el § 61, ~ representa el conjunto de las coordenadas y de la proyección del spin a de una partícula. Consideremos de una manera puramente formal un sistema de N partículas que no interactúan entre sí y que se encuentran en el campo que hemos elegido. Cada partícula se halla entonces en uno de los estados tp1 , tp2 , ••• Sea N 1 el número de partículas que se encuentran en el estado 'Pi· Este número, claro está, puede ser igual a cero. Dar los números N 1, N 2 , ••• (es evidente que "i:.N¡ == N) determina un estado del sistema en conjunto; lo representaremos mediante subíndices en la,función de onda del sistema 'Y N.N•...• Se trata de construir un formalismo matemático en el que los números de ocupación de los estados, N 1, N 2 , ... (y no las coordenadas de las partículas) representen el papel de variables independientes. La función 'YNi N es la suma simetrizada (las partículas obedecen a la estadística de Bose) de productos de las funciones tp¡. Escribámosla en la forma: 2 ••• (64.1) Pi, p 2, ••• , p N son aquí los números que fijan los estados en los que se encuentran las diferentes partículas, y la suma se extiende a todas las permutaciones de los índices Pi, p 2 , ••• , PN· Los números N¡ indican cuántos de los índices Pi, p 2 , ••• , PN poseen los valores dados i. El número total de términos enJa suma (64.1) es igual, evidentemente, a Nf/N1!N2! .... El factor constante en (64.I) se ha elegido de manera que la función resulte normalizada (en virtud de la ortogonalidad de las funciones tp¡, en la integración (2) del cuadrado l'Y[N1N2 •••2 respecto de ; 1, ; 2, ••• , ;N se anulan todos los términos con la única excepción de los cuadrados de los módulos de cada uno de los términos de la suma). 1 ( ) El método de la segunda cuantificación fue desarrollado por DIRAC en el caso de partículas que obedecen a la estadística de Bose (1927) y extendido luego por E. W1GNER y P. JoRDAN (1928) a las partículas de Fermi. 2 ( ) Por integración respecto de ~ convenimos en entender la integración respecto de las coordenadas junto con la suma respecto de a. 258 Partículas idénticas Sea ahora J<1 >ª el operador de una magnitud física cualquiera correspondiente a la a-ésima partícula, es decir, este operador se aplica solamente a funciones de ~a· Introduzcamos el operador, simétrico respecto de todas las partículas, fl'(l} = ~/<1>a, (64.2) (la suma se extiende a todas las partículas) y determinemos sus elementos de matriz respecto de las funciones de onda (64.1). Es fácil ver, ante todo, que los elementos de matriz serán diferentes de cero únicamente para las transiciones en las que no varían los números N 1, N 2 , ... (elementos diagonales) y para las transiciones en las que uno de estos números aumenta en una unidad a la vez que otro disminuye en una unidad. En efecto~ dado que cada uno de los operadores J <1 >a actúa solamente sobre una función en el pr:oducto t/JpJt1)t/ip (t2) ••• t/ip/tN), sus elementos de matriz pueden ser diferentes de cero tan sólo para las transiciones en las que varía el estado de una única partícula; pero esto significa que el número de partículas que se encuentran en un estado disminuye en una unidad y las que se encuemran en otro aumenta asimismo en una unidad. El cálculo de estos elementos de matriz es en esencia muy simple; es más fácil realizarlo uno mismo, que seguir su explicación. Por ello presentaremos solamente el resultado. Los elementos no diagonales son iguales a 1 (64.3) Indicamos únicamente lo~ índices respecto de los cuales el elemento de matriz no es diagonal, prescindiendo de los restantes para abreviar. J;_k(I) es aquí el elemento de matriz (64.4) No hay que perder de vista que los operadores/ <1 >ªdifieren tan sólo en las variables a que se aplican, por lo que las integrales /¡ 1_{1) no dependen del índice a. Los elementos de matriz diagonales de p(l) son los valores medios d@ la magnitud p(U en los estados 'Y N,N 2••• • El cálculo da: (64.5) Introduzcamos ahora los operadores ái, fundamentales en el método de segunda cuantificación, operadores que se aplican no ya a las funciones de las coordenadas, sino a las variables N 1 , N2 , ... , y que se definen del siguiente modo. La aplicación del operador oi a la función 'YN,N disminuye el índice Ni en una unidad y a la vez multiplica la función de onda por Ni: 2 ••• , V (64.6) Cabe decir que el operador ái disminuye en una unidad el número de partículas que se encuentran en el i-ésimo (se le llama por ello operador de destrucción de las partí- Segunda cuantificación. Estadística de Bose 259 culas). Este operador se puede representar en forma de matriz cuyo único elmento no nulo es (64.7) El operador ái +, conjugado del ái, se representa, por definición (véase § 3), por la matriz cuyos elementos son es decir, (64.8) Esto significa que al aplicarlo a la función 'Y N,N 2 ,.., aumenta Ni en una unidad: (64.9) Con otras palabras, el operador ái + aumenta en una unidad el número de partículas que se encuentra en el i-ésimo estado (por ello se le llama operador de creación de las partículas). Al aplicar el producto de operadores ái+ái a la función de onda, el resultado es, evidentemente, multiplicarla por una constante, conservando todas las variables N 1, N 2 , ••• : el operador ái disminuye Ni en una unidad y el operador ái + vuelve Ni a su valor inicial. El producto de las matrices (64.7) y (64.8) prueba, sin más, que ái+ai se representa, como debía ser, por una matriz diagonal cuyos elementos diagonales son iguales a Ni. Podemos escribir que (64.10) Análogamente, se encuentra que (64.11) Por consiguiente, la regla de conmutación de los operadores ái y ái + será la siguiente: (64.12) En cuanto a los operadores ái y ák (o ái y ak +) con subíndices i y k distintos, que actúan sobre diferentes variables (Ni y Nk), conmutan, claro está. entre sí: (i =I= k). (64.13) Partiendo de las propiedades de los operadores ái, ái +, es fácil ver que el operador fl'Cl) = ~ jCl) .ká .+ák i,k i i (64.14) Partículas idénticas 260 coincide con el operador (64.2). En efecto, todo& los elementos de matriz calculados mediante (64.7), (64.8) coinciden con los elementos (64.3), (64.5). Este resultado es muy importante. En la fórmula (64.14) las cantidadesfik(l) son simplemente números. De esta manera hemos conseguido expresar un operador ordinario (hasta ahora solamente de la forma (64.2)), que actúa sobre funciones de las coordenadas, como operador que actúa sobre funciones de las nuevas variables - los números de ocupación Ni (1). El resultado obtenido se generaliza fácilmente a operadores de otro tipo. Sea fl'(2) = ~ j(2>ab, a>b (64.15) donde J <2 >ab es el operador de una magnitud física que se refiere de modo inmediato a un par de partículas, por lo que actúa sobre una función de;ª y ;b. Cálculos análogos demuestran que un tal operador se puede expresar en función de los operadores ái, ái + mediante la igualdad ftc2> = 1 ~ 1" i,k,l,m (jC2))iká,+á lm • k+á m á z, (64.16) donde Las matrices calculadas para (64.15) y (64.16) coinciden. La generalización de esras fórmulas a operadores de cualquier otro tipo simétricos respecto de todas las partícu]as (por ejemplo, de la forma.P<3 > = ~ J<3 >abc' etc.) es obvia. Finalmente nos queda por expresar en función de los operadores ái el hamiltoniano H del sistema físico realmente estudiado y constituido por N partículas idénticas en interacción mútua. El operador fI, claro está, es simétrico respecto de todas las partículas. En la aproximación no relativista (2), no depende de sus spins y se puede representar en forma general de la siguiente manera: (64.17) 1 ( ) La fórmula (64.14) es análoga a la expresión (11-1) para el valor medio de una magnitud f, expresado en función de los coeficientes ai del desarroilo de la función de onda del estado dado en funciones de onda de los estados estacionarios. Con este hecho está ligado el nombre de segunda cuantificación aplicado al método expuesto. ( 2 ) Cuando no existe campo magnético. Segunda cuantificación. Estadística de Bose 261 1l<1 >ª es aquí la parte del hamiltoniano que depende de las coordenadas de una sola partícula (la a-ésima) : (64.18) donde u<1 )(ra) es la energía potencial de una partícula en el campo exterior. Los demás términos de (64.17) corresponden a la energía de interacción mútua, habiendo separado, por comodidad, unos de otros los términos que dependen de las coordenadas de 2, de 3, etc., partículas, respectivamente. La representación del hamiltoniano en esta forma permite aplicar directamente las fórmulas (64.14), (64.16) y las demás análogas a ellas. Así, pues, (64.19) Con esto hemos conseguido hallar la expresión buscada del hamiltoniano en forma de operador que actúa sobre una función de los números de ocupación. Para un sistema de partículas que no interactúan entre sí, en la expresión (64.19) queda sólo el primer término: ll = l: ¡¡o.>,ká,+ák. i,k Si como funciones 'lfi se eligen las funciones propias del hamiltoniano 0<1 > de una sola partícula, la matriz Hik< 1> es diagonal y sus elementos diagonales son los valores ~propios de la energía de la partícula, Ei· De esta manera n= ~ Eiá/ái; 1, substituyendo el operador ái+á¡ por sus valores propios (64.10), obtenemos para los niveles de energía del sistema la expresión E=~ f:iNi, 1, - resultado trivial, que es precisamente el que debía obtenerse. El formalismo desarrollado aquí se puede presentar en una forma algo más compacta, introduciendo los operadores (1) (64.20) donde las variables ; se consideran como parámetros. En virtud de lo dicho antes acerca de los operadores á¡, ái + es claro que el operador 'Y disminuye en una unidad el número total de partículas del sistema, mientras que el operador 't+ aumenta dicho número en una unidad. (1) Conviene llamar la atención sobre la analogía entre esta expresión y el desarrollo 'f' = La¡'Yi de una función de onda en funciones propias de un operador (cf. la nota en la pág. anterior). :262 Partículas idénticas Es fácil ver que el operador 'l'+(f0 } crea una partícula que se encuentra en el punto ; 0 • En efecto, al aplicar el operador ai + se crea una partícula en el estado cuya función de onda es v,¡(~). De aquí se sigue que el resultado de la aplicación del operador 'l'+(f0) es crear una partícula en el estado cuya función de onda L1JJ¡*(nw¡(~0}, o, de acuerdo con la fórmula general (5. 12), con la función de onda o(; - ; 0) ( 1), lo que corresponde a una partícula con valores determinados de las coordenadas (y del spin). Las reglas de conmutación para 'Y y 'l'+ se obtienen inmediatamente a partir de las reglas de conmutación para áh ái +. Es evidente que (64.21) además, obtenemos o bien (64.22) Mediante nuestros nuevos operadores, la expresión (64.14) del operador (64.2) se escribe en la forma: (64.23) Se supone aquí que el operador /<1) actúa en '1"( f). sobre funciones de los parámetros~. En efecto, substituyendo (64.20), tenemos: L /Cl) i'ká,+ák , i,k que coincide con (64.14). Análogamente, en vez de (64.16) tendremos: (64.24) En particular, a una magnitud físicaf(~), que es función sólo de las~' corresponde un operador (64.23) que en este caso se puede escribir en la forma: f /(f)'Y+(f)'P(g) df. Vemos así que 'l'+(f)'Y(t) dg es el operador del número de partículas que se encuentran en el intervalo d.;. (1) Se conviene en que o(~ -~o) representa el producto Segunda cuantificación. Estadística de Fermi Una vez expresado en función de los operadores 11", en la forma 263 11"+, el operador H se escribe (64.25) Hemos utilizado aquí la expresión (64.18) para _f/(1), y se ha integrado por partes (respecto de las coordenadas) el término que contiene el laplaciano. La fórmula (64.25) puede hacerse más intuitiva si se observa lo siguiente. Supongamos que tenemos un sistema de partículas cada una de_ las cuales se describe (en un instante dado) por una misma función de onda "P(~), que supondremos normalizada de manera que f 1"11 2 = N. Entonces, como se ve inmediatamente, si en la expresión (64.25) substituimos el operador 4· por la función 1p, esta expresión pasa a ser la energía media del sistema en el estado considerado. Esta circunstancia conduce a la siguiente regla para determinar el hamiltoniano en el formalismo de segunda cuantificación. Se escribe la expresión correspondiente a la energía media en función de la función de onda de una partícula individual (normalizada del modo indicado), y se substituye luego esta última por el operador 'Í\ debiendo además escribir los operadores conjugados 11"+ a la izquierda de los operadores 11". de Si el sistema está constituido por bosones de especie diferente, en el método de segunda cuantificación deben introducirse para cada especie de partículas los correspondientes operadores á, á+ ó 11", 11"+ En este caso, evidentemente, los operadores que se refieren a especies distintas de partículas conmutan entre sí. § 65. Segunda cuantificación. Caso de la estadística de Fermi Todos los rasgos fundamentales del método de segunda cuantificación se conservan invariables al pasar a sistemas constituidos por fermiones idénticos. Sin embargo, cambian, naturalmente, las fórmulas concretas relativas a los elementos de matriz de las distintas magnitudes y a los operadores ái. La función de onda 'YN,N 2 ••• tiene ahora la forma (61.2): ,¡,,,l (f1) 'P111 U2) 'P1>1 (fN) (65.1) 264 Partículas idénticas Ligada con el carácter antisimétrico de esta función, se plantea ante todo la cuestión de elegir su signo. En el caso de la estadística de Bose no se planteaba este problema, ya que, en virtud del carácter simétrico de la función de onda, una vez elegido su signo éste se conserva en todas las permutaciones de las partículas. Para hacer del signo de la función (65.1) algo determinado, convendremos en fijarlo de la siguiente manera. Numeremos, una vez para todas, todos los estados 1Jli mediante número consecutivos. Una vez hecho esto, las filas del determinante (65.1) se dispondrán siempre de tal manera que sea P1 <P2 <Pa < ... <PN, (65.2) mientras que en las columnas aparecerán funciones de las diferentes variables en el orden ~1, ~2, ••• S.N, Entre los números Pi, p 2, ••• no puede haber dos iguales, ya que de haberlos el determinante se anularía. Con otras palabras, los números de ocupación Ni pueden tomar solamente los valores O ó 1. Consideremos de nuevo un operador de la forma (64.2), 1J'C1> = ~/ <1>ª. Por las mismas razones que en el § 64, sus elementos de matriz serán diferentes de cero únicamente para las transiciones sin cambio en los números de ocupación y para las transiciones en las que uno de ellos (N¡) disminuye en una unidad (pasando a ser igual a cero, en vez de igual a 1), y otro (Nk) aumenta en una unidad (pasando de cero a uno). Es fácil hallar que para i < k (65.3) Por Ot, Ii designamos aqui los valores Ni O, Ni l, y el simbolo í:.(k, l) representa la suma de los números de ocupación para todos los estados desde el k-ésimo al l-ésimo (1): l :E (k, l) = :E Nn, n=k Para los elementos diagonales, en cambio, se obtiene la fórmula anterior {64.5) F(l>; = "f J< >uN,. 1 (65.4) Para que el operador P<1 > se pueda representar en la forma (64.14), los operadores ái deben definirse como matrices cuyos elementos son: (a¡);, ' = (ai+)o1, = (-1)¡{1, i-1>. (65.5) 1 1 ( ) Cuando i > k, en el exponente de (65.3) hay que escribir Í:.(k+ 1, i-1). Si i sumas hay que substituirlas por ceros. k ± 1, estas Segunda cuantificación. Estadística de Fermi Multiplicando estas matrices, se encuentra (para k > 265 i) o bien (65.6) Si, en cambio, i unidad para N¡ = k, la matriz ái+ái es diagonal y sus elementos son iguales a la = 1 e iguales a cero para Ni = O; esto se puede expresar en la forma: (65.7) Substituyendo estas expresiones en (64.14), obtenemos en efecto (65.3-4). Multiplicando á; +, ák en orden contrario, tendremos o bien (65.8) Comparando (65.8) con (65.6), vemos que estas cantidades son de signos opuestos, es decir, se puede escribir: (i # k). Para la matriz diagonal áiái+, encontramos: (65.9) Sumando con (65. 7), obtenemos: Las dos igualdades así obtenidas se pueden escribir en forma de una sola igualdad: (65.10) Efectuando cálculos análogos, para los productos á¡ák, se obtienen las relaciones (65.11) (en particular, á¡á¡ = O). Vemos así que los operadores á¡ y d¡ (oák+) con i # k resultan« anticonmutativos », mientras que en el caso de la estadística de Bose conmutaban entre sí. Esta 266 Partículas idénticas diferencia es completamente natural. En el caso de la estadística de Bose, los operadores á¡ y á,. eran del todo independientes; cada uno de los operadores á¡ actuaba solamente sobre una variable N¡, y el resultado de su aplicación no dependía de los valores de los demás números de ocupación. En cambio, en el caso de la estadística de Fermi, el resultado de aplicar el operador G¡ depende no sólo del propio número N¡, sino también de los números de ocupación de todos los demás estados anteriores, conforme se ve en la propia definición (65.5). Por ello los efectos de la aplicación de los operadores distintos á¡, á,. no se pueden considerar como independientes. Una vez determinadas de esta manera las propiedades de los operadores á¡, á¡ +, todas las demás fórmulas (64.14-19) conservan completamente su validez. Valen también las fórmulas (64.23-25), que expresan los operadores de las magnitudes físicas en función de los operadores 'l"(t),'tr+(g) definidos por (64.20). En cambio, las reglas de conmutación (64.21-22) se substituyen ahora, evidentemente, por las igualdades 'Y+(fl'Y([)+ 'Y(fl'Y+(f) = 8([-g'), 'l"(f)'Y(t)+ 'Y(g)'Y(r) = O. (65.12) Si el sistema está formado por partículas de diferente especie, para cada especie de partículas deben introducirse los correspondientes operadores de segunda cuantificación (como se señaló ya al final del párrafo anterior). Los operadores que se refieren a bosones y a fermiones conmutan entre sí. En lo que concierne a los operadores que corresponden a diferentes fermiones, dentro de los límites de la teoría no relativista es posible considerarlos formalmente o como operadores que conmutan, o como operadores que anti conmutan; en ambos supuestos la aplicación del método de segunda cuantificación conduce a los mismos resultados. Sin embargo~ con vistas a una ulterior aplicación a la teoría relativista, que admite las transformaciones de diferentes partículas entre sí, debemos considerar como anticonmutativos los operadores de creación y de destrucción de fermiones diferentes. Este hecho resulta evidente si se consideran como partículas « diferentes » dos estados « internos » distintos de una misma partícula compleja. CAPÍTULO X EL ÁTOMO § 66. Niveles atómicos de energía En la aproximación no relativista, los estados estacionarios de un átomo se determinan mediante la ecuación de ScHRODINGER para un sistema de electrones que se mueven en el campo coulombiano del núcleo y que interactúan eléctricamente entre sí; en esta ecuación no intervienen en absoluto los operadores de spin de los electrones. Conforme sabemos, para un sistema de partículas en un campo exterior central se conserva e1 momento cinético orbital total, L, y también la paridad del estado. Por ello cada estado estacionario de un átomo se caracterizará por valores determinados del momento cinético L y por su paridad. Además, las funciones· de onda de coordenadas de los estados estacionarios de un sistema de partículas idénticas poseen una determinada simetría respecto de las permutaciones. Vimos en el § 63 que, para un sistema de electrones, a cada tipo determinado de simetría de permutación (es decir, a un determinado esquema de Young) corresponde un valor determinado del spin total del sistema. Por lo tanto, cada estado estacionario del átomo se caracterizará también por el spin total S de los electrones. Sin embargo, claro está, el recíproco no es cierto: dar L, S y la paridad no determina aún de manera unívoca la energía del estado. Un nivel energético con valores dados de S y Les degenerado con relación a las distintas direcciones posibles de los vectores L y S. El orden de degeneración respecto de estas últimas es igual, a 2L + 1 y 2S + 1, respectivamente. El orden de degeneración del nivel con L y S dados es igual, por consiguiente, al producto (2L+ 1) (2S + 1). Con todo, siempre existe, en realidad, una cierta interacción electromagnética relativista de los electrones, interacción que depende también de sus spins. Esta interacción conduce a que la energía del átomo dependa no sólo de los valores absolutos de los vectores del momento cinético orbital y del spin, sino también de su posición relativa. Rigurosamente hablando, si se tienen en cuenta los términos relativistas en el operador de Hamilton, éste ya no conmuta con los operadores L y S, es decir, el momento cinético orbital y el de spin no se conservan por separado. 268 El átomo Solamente se conserva el momento cinético total, J = L+S. La conservación del momento cinético total es una ley exacta que resulta directamente de la isotropía del espacio con relación a un sistema aislado. Debido a ello, los niveles de energía deben caracterizarse por los valores J del momento cinético total. Sin embargo, si los efectos relativistas son relativamente pequeños (como ocurre en muchos casos), es posible tenerlos en cuenta considerándolos como una perturbación. Bajo la acción de ésta, un nivel con valores dados de L y S y degeneración de orden (2L+ 1) (2S + 1) se « desdobla» en una serie de diferentes niveles (próximos entre sí) que difieren en los valores del momento cinético total J. Estos niveles vienen determinados (en primera aproximación) por la correspondiente ecuación secular (§ 39) y sus funciones de onda (en la aproximación de orden cero) son ciertas combinaciones lineales de las funciones de onda del nivel degenerado de partida con valores dados de L y S. Por consiguiente, en esta aproximación es posible considerar, al igual que antes, los valores absolutos del momento cinético orbital y del spin (pero no sus direcciones) como magnitudes que se conservan y caracterizar los niveles también por los valores L y S. De esta manera, como resultado de los efectos relativistas, un nivel con valores dados L y S se descompone en una serie de niveles con diferentes valores J. Este desdoblamiento se llama estructura fina (o desdoblamiento multiplete) del nivel. Conforme sabemos, J toma todos los valores entre L+S y jL - s¡; por ello un nivel con valores dados L y S se desdobla en 2S+l (si L > S) o 2L+1 (si L < S) niveles diferentes. Cada uno de estos niveles es degenerado respecto de las direcciones del vector J; el orden de esta degeneración es igual a 2J + l. Es fácil comprobar que la suma de los números 2J + 1, con todos los valores posibles de J, es igual, como debe ser, a (2L+l) (2S+l). Los niveles atómicos de energía (o también, los términos espectrales de los átomos) se suelen designar por símbolos análogos a los que se utilizan para designar los estados de las partículas individuales con valores determinados del momento cinético (§ 32). Así, los estados con valores distintos del momento cinético orbital L se representan por letras mayúsculas del alfabeto latino de acuerdo con la siguiente correspondencia: L = O 1 2. 3 4 5 6 7 8 9 10 SPDFGHIKLMN A la izquierda y en la parte superior de un símbolo, se indica el número 2S + 1, llamado multiplicidad del término (es necesario, sin embargo, no perder de vista que este número determina el número de componentes de la estructura fina del nivel tan sólo cuando L 2 S). A la derecha y en la parte inferior, se indica el valor del momento cinético total J. Así, los símbolos 2P 112 , 2P 3, 2 representan niveles con L=1,S=i,J=t,t Estado.'> de los electrones en un átomo § 67. 269 Estados de los electrones en un átomo Un átomo con más de un electron es un sistema compuesto de electrones en interacción mútua que se mueven en el campo del núcleo. Para un sistema de esta naturaleza, rigurosamente hablando, es sólo posible considerar los estados del sistema como un todo. A pesar de ello, el hecho es que en un átcmo es posible, con buena precisión, introducir el concepto de estados de cada uno de los electrones por separado en el sentido de estados estacionarios del movimiento de un electrón en un cierto campo central efectivo creado por el núcleo y todos los demás electrones. Para diferentes electrones en un átomo estos campos, en general, son diferentes, y deben determinarse todos a la vez, ya que cada uno de ellos depende de los estados de todos los demás electrones. Este campo se llama campo autoconsistente (véase § 69). Dado que el campo autoconsistente es un campo central, cada estado de un electrón se caracteriza por un valor determinado de su momento cinético orbital l. Los estados de un electrón individual, para l dado, se numeran (en el orden de las energías crecientes) mediante el número cuántico principal n, que toma los valores n = l + 1, l + 2, ... ; esta manera de elegir el orden de numeración está de acuerdo con la adoptada para el átomo de hidrógeno. Hay que hacer notar, sin embargo, que el orden de crecimiento de los niveles de energía asociado. con los diferentes valores de /, difiere, en general, en los átomos complejos del que encontramos en el átomo de hidrógeno. En este último las energías no dependen de /, de forma que los estados con valores mayores den poseen siempre una energía mayor. En cambio, en los átomos complejos, un nivel, por ejemplo, con n = 5, l = O se encuentra por debajo del nivel con n = 4, l = 2 (para más detalles, véase el§ 73). Los estados de los electrones individuales con diferentes valores n y l se suelen designar mediante un símbolo formado por una cifra, que indica el valor del número cuántico principal, y una letra, que indica el valor de l (1). Así, 4d representa el estado con n = 4, l = 2. Una descripción completa del estado de un átomo exige, junto con la indicación de los valores de L, S y J, la enumeración de los estados de todos los electrones. Así, el símbolo ls 2p 3P 0 representa el estado de un átomo de helio en el que L = 1, S = 1, J = O y los dos electrones se encuentran en los estados ls y 2p. Si algunos electrones se encuentran en estados con iguales valores de l y n, se simplifica la notación indicando este hecho con un exponente; así 3p2 representa dos electrones en estados 3p. Una distribución de los electrones en un átomo entre estados con diferentes valores /, n se llama configuración electrónica. Para valores dados de n y !, el electrón puede poseer valores distintos de las proyecciones del momento cinético orbital (m) y de spin (a) respecto del eje z. Para l 1 ( ) n = También se emplea la terminología en la que de los electrones con números cuánticos principales l, 2, 3, ... se dice que son electrones de las capas K, L, M, ... , respectivamente (véase § 74). 270 El átomo dado, m toma 21 + 1 valores; el número a, en cambio, queda limitado a los dos valores ± t. Por lo tanto, se tienen en total 2(2/ +1) estados diferentes con los mismos n, /; estos estados se llaman equivalentes. En cada uno de ellos se puede encontrar, de acuerdo con el principio de PAULI, un solo electrón. Así, pues, en un átomo pueden tener a la vez iguales valores de n y l no más de 2(2/ + 1) electrones. Del conjunto de electrones que ocupan todos los estados con n, l dados se dice que constituye una capa cerrada (o completa) del tipo considerado. La diferencia en energía de los niveles atómicos a los que corresponden valores L, S distintos, pero una misma configuración electrónica (1), se debe a la interacción electrostática de los electrones. Dicha diferencia es, de ordinario, relativamente pequeña - varias veces menor que la distancia entre niveles correspondientes a configuraciones distintas. Acerca de la distribución relativa de niveles de una misma configuración, pero con valores L, S distintos, existe la siguiente regla establecida empíricamente (regla de Hund): La mínima energía la posee el término con el máximo valor posible S para la configuración electrónica dada y el mayor valor de L (posible para este S) (2). Veamos cómo se pueden hallar los términos atómicos posibles para una configuración electrónica dada. Si los electrones no son equivalentes, la determinación de los valores L, S posibles se efectúa directamente aplicando la regla de composición de momentos. Así, por ejemplo, para la configuración np, n'p (con n, n' distintos) el momento cinético orbital L puede tomar los valores, 2, 1, O, y el spin total S es S = O, 1; combinándolos entre sí, obtenernos los términos 1 •3 S, 1 •3P, 1 ·ªD. Pero si se trata de electrones equivalentes, nos encontrarnos con limitaciones impuestas por el principio de PAULI. Consideremos, por ejemplo, una configuración de tres electrones-p equivalentes. Cuando l = 1 (estado-p), la proyección m del momento cinético orbital puede tener los valores m = 1, O, - 1, de forma que son posibles seis estados con los siguientes pares de índices m, a: (a) 1, ! (a') 1, -! (b) O, l (b') O, -! (e) -1, ! (e') -1, -f. Los tres electrones se pueden distribuir en tres cualesquiera de estos estados, uno en cada uno. Obtenernos así los estados del átomo con los siguientes valores de las Prescindimos aquí de la estructura fina de cada nivel multiplete. La condición de que S sea máximo se puede justificar de la siguiente manera. Consideremos. por ejemplo, un sistema de dos electrones. En este caso, puede ser S = O ó S = 1, correspondiendo al spin 1 una función de onda de coordenadas antisimétrica f(ri, r 2). Para r 1 = r 2 esta función se anula idénticamente; con otras palabras, ·en el estado con S = I la probabilidad de encontrar ambos electrones cerca e! ui:io del otro es pequeña. Esto conduce a una repulsión electrostática relativamente menor, y, por consiguiente, a una energía más baja. Análogamente, en un sistema de varios electrones, al spin máximo corresponde la función de onda de coordenadas « más antisimétrica ». (1) 2 ( ) 271 Estados de lo.i; electrones en un átomo proyecciones ML = '1:.m, Ms= '1:.cr de los momentos cinéticos orbital y de spin totales: (a+a' +b) 2, i (a+a' +e) 1, i (a+b+c) O,% (a+b+b') 1, ! (a+b+c') O, i (a+b' +e) O,! (a' +b+c) O,¡. (podemos dejar de escribir los estados con valores negativos M L, M s porque nada dan de nuevo). La existencia de un estado con ML = 2, Ms = ! demuestra que debe tenerse un término 2D; a este término deben corresponder todavía uno de los estados (1, i) y uno de los (O, Además, queda aún un estado con (1, t), de forma que debe tenerse un término 2P; a éste corresponde también uno de los estados con (O, t). Finalmente, quedan todavía los estados (O, ü y (O, i), que corresponden a un término 4 S. Así, pues, para la configuración de tres electrones p equivalentes son posibles tan sólo un término de cada uno de los tipos 2D, 2P, 4S. n. TABLA 1 Términos posibles para las configuraciones de electrones equit·alentes p,ps pz, P' Pª d, d 9 a2, dª 2p ap SD '-PD 1 'S zv 1 SDG d3 , d 1 2PDFGH d4, d 6 1 ªPF 'PF 2 SDFGl 2 2 d5 2 ZSPDFGHI ªPDFGH 2 5D 2 'PDFG 6S 3 2 2 En la tabla 1 se dan los términos posibles para diferentes configuraciones de electrones-p y electrones-d equivalentes. Los números debajo de los símbolos de los términos indican el número de términos del tipo en cuestión que se tienen para la configuración dada, si este número es mayor que la unidad. Para la configuración con el mayor número posible de electrones equivalentes (s 2 , p6 , d 1º, ...) el término es siempre un término 1 S. Obsérvese la coincidencia del carácter de los términos que corresponden a dos configuraciones cada una de las cuales posee tantos electrones cuantos faltan a la otra para llenar una capa. Esto es un resultado evidente de que la falta de un electrón en una capa se puede considerar como un hueco cuyo estado El átomo 272 se determina por los mismos números cuánticos que caracterizan el estado del electrón que falta. Al aplicar la regla de HUND a la determinación del término normal de un átomo cuando se conoce la configuración electrónica, hay que considerar únicamente la capa no completa, ya que los momentos cinéticos de los electrones que se encuentran en las capas cerradas se compensan entre sí. Por ejemplo, supongamos que fuera de las capas completas de un átomo se tienen cuatro electrones-d. El número cuántico magnético de un electrón-d puede tomar cinco valores: O, ± 1, ± 2. Por ello, los cuatro electrones pueden tener la misma proyección del spin a = l, de modo que el spin entero máximo posible es S = 2. Hay que atribuir luego a los electrones los diferentes valores del número m que dan el mayor ML = :Em; éstos son 2, 1, O, - 1, de modo que ML = 2. Esto significa que también es igual a 2 el mayor valor de L posible para S = 2 (término 5D). PROBLEMA Hallar las funciones de onda orbitales de los posibles estados de un sistema de tres electrones-p equivalentes. Solución. En el estado 4 S los spins <1 de los tres electrones son iguales y, por consiguiente, los valores m son distintos. La función de onda viene dada por un determinante 'de la forma (61.2) formado por las funciones %, tpi, tp_1 (el subíndice indica el valor de m). Para el término 2D, consideremos el estado con el mayor valor posible ML = 2. En estas condiciones, dos de las proyecciones m deben ser iguales a l, y una, a O. Supongamos que los electrones 2, 3 tengan a = + ! y el electrón 1, a = - ! (de acuerdo con el spin total S = ! ). La correspondiente función de onda orbital que cumple la condición exigida de simetría es (el número en el argumento de una función indica el número del electrón a que dicha función se refiere). Para el término 2P, consideremos el estado con ML = 1 y los mismos valores de las proyecciones del spin de los electrones que en el caso anterior. Este estado se puede construir con dos sistemas distintos de valores m, de modo que la función de onda orbital viene dada por la combinación lineal tp = atp-m + bi/;100, r/s-111 = tp1(1)[r/s-1(2)tp1(3)-i/;-1(3)i/;1~)], i/;100 = tpo(l )[tft1(2)tfto(3)-,f,1(3),f,o(2) ]. Para determinar los coeficientes utilizaremos la relación Niveles de energía hidrogenoides a la que debe satisfacer la función de onda con ML de matriz (27 .12) encontramos que = 273 L (véase (27.8)). Mediante los elementos y, por lo tanto, l+i/; = y2(a+b)i/;on = O. De aquí se sigue a+b = O; teniendo también en cuenta la condición de normalización, resulta a= -b = }. Las funciones de onda de los estados con M L < L se obtienen a partir de las funciones que acabamos de· haliar aplicándoles el operador § 68. Niveles de energía hidrogenoides El único átomo para el que la ecuación de SCHRODINGER se puede resolver exactamente es el más simple de todos los átomos: el átomo de hidrógeno. Los niveles de energía del átomo de hidrógeno, y también de los iones He+, Li + + , ... , que contienen cada uno tan sólo un electrón, se determinan por la fórmula de BoHR (36.1 O): E= 1 (68.1) 2li2(l+m/M) Ze es aquí la carga del núcleo, M su masa y m la masa del electrón. Obsérvese que la dependencia respecto de la masa del núcleo es muy débil. La fórmula (68.1) no tiene en cuenta ningún efecto relativista. En esta aproximación, se presenta la degeneración adicional específica del átomo de hidrógeno ( degeneración accidental) de la que ya se habló en el § 36: para un número cuántico principal n dado, la energía no depende del momento cinético orbital l. En otros átomos existen estados que por sus propiedades recuerdan los estados del átomo de hidrógeno. Se trata de estados fuertemente excitados en los que uno de los electrones posee un gran número cuántico principal y se encuentra, por ello, prácticamente siempre a grandes distancias del núcleo. El movimiento de un electrón de este tipo se puede considerar, en una cierta aproximación, como el movimiento en el campo coulombiano del átomo residual con una carga efectiva igual a la unidad. Los niveles de energía que así se obtienen resultan ser, sin embargo, demasiado inexactos y hay que añadirles una corrección que tenga en cuenta la desviación del campo, a pequeñas distancias, respecto de un campo puramente coulombiano. Es fácil poner de manifiesto el carácter de esta corrección mediante las consideraciones que siguen. Dado que los estados con números cuánticos grandes son cuasiclásicos, los 274 El átomo niveles de energía se pueden determinar en este caso mediante las reglas de cuantificación de BoRH-SOMMERFELD (48.6). La desviación del campo respecto del coulombiano a distancias del núcleo que son pequeñas (comparadas con el « radio de la órbita »), se puede tener en cuenta formalmente modificando la condición de contorno impuesta a la función de onda para r = O. Esto conduce a cambiar la constante· y en la condición de cuantificación del movimiento radial. Dado que, por lo demás, esta condición no se modifica, podemos concluir que para los niveles de energía se obtiene una expresión que difiere de la correspondiente al hidrógeno en el cambio del número cuántico radial, o, lo que es lo mismo, del número cuántico principal n, que pasa a ser n + A 1, donde Az es una constante (la llamada corrección de Rydberg): E= me4 (68.2) La corrección de Rydberg no depende de n (por su propia definición), pero es, naturalmente, función del número cuántico acimutal I del electrón excitado (que atribuimos a A en forma de subíndice), y también de los momentos cinéticos L y S del átomo en conjunto. Para L y S dados, A 1 disminuye rápidamente cuando aumenta l. Cuanto mayor es /, tanto menos tiempo pasa el electrón cerca del núcleo, y por ello los niveles de energía deben acercarse tanto más a los del hidrógeno (1). § 69. El campo autoconsistente La ecuación de ScHRODINGER para los átomos que contienen más de un electrón no se puede resolver prácticamente de un modo directo, ni tan sólo por métodos numéricos. Debido a esto cobran valor los métodos aproximados para el cálculo de las energías y de las funciones de onda de los estados estacionarios de los átomos. El más importante de estos métodos es el llamado método del campo autoconsistente. La idea central de este método consiste en que se considera que cada electrón del átomo se mueve en un campo autoconsistente creado por el núcleo junto con todos los demás electrones. Tomemos como ejemplo el átomo de helio limitándonos a aquellos términos del mismo en los que ambos electrones se encuentran en estados-s (con valores den (1) Como ejemplo, damos los valores empíricos de la corrección de Rydberg para estados fuertemente excitados del átomo de helio. El spin total de éste puede tener los valores S = O, 1, y el momento cinético orbital total L coincide, en los estados considerados, con el momento cinético l del electrón excitado (el segundo electrón se encuentra en un estado Is). Las correcciones de Rydberg son: para S = O: Lio = -0.140, Li1 = +0.012, para S = 1: ~o= -0.296, Li 1 = ~2 = -0.0022; -0.068, ~ 2 = -0.0029. 275 El campo autoconsistente iguales o distintos); en estas condiciones, también los estados de todo el átomo serán estados-S. Sean 1P1(r 1) y 1P2(r 2) las funciones de onda de los electrones; en los estados s estas funciones dependen solamente de las distancias r 1, r 2 entre los electrones y el núcleo. La función de onda 1P(r1, rJ del átomo como un todo se representa por el producto simetrizado (69.1) o antisimetrizado (69 2) de ambas funciones, según se trate de estados con spin total S = O o ·spin total S = 1 (1). Consideraremos el segundo de estos casos; las funciones "Pi y 1P2 se pueden suponer entonces ortogonales entre sí (2). Veamos cómo se puede determinar una función de la forma (69.2) que resulte ser la mejor aproximación de la función de onda real del átomo. Para ello es natural partir del principio variacional, considerando en él como funciones admisibles tan sólo funciones de la forma (69.2) (el método que se expone, fue propuesto por V. A. FoK, 1930). Conforme sabemos, es posible obtener la ecuación de del principio variacional SCHRODINGER a partir con ]a condición suplementaria (la integración se efectúa respecto de las coordenadas de los dos electrones del átomo de helio). La variación conduce a la ecuación (69.3) de donde, se sigue, para una variación arbitraria de la función de onda tp, la ecuación ordinaria de ScHRODINGER. En cambio, en el método del campo autoconsisLos estados del átomo de helio con S = O se suelen llamar estados de parahelio, y los estados con l, estados de ortohelio. 2 ( ) Las funciones de onda lf'i, lp 2 , ••• de los distintos estados del electrón que se obtienen con el método del campo autoconsistente no son, en general, ortogonales dos a dos, ya que son soluciones no de una misma ecuación, sino de ecuaciones diferentes. Sin embargo, en (69.2) es posible substituir '1{' 2 por (1) S = lp/ = lp 2 +const· '1{'1 sin modificar la función 1P del átomo en conjunto; eligiendo la constante de manera adecuada, se puede siempre conseguir que "Pi y ip/ sean ortogonales entre sí. 276 El átomo tente se substituye en (69.3) la expresión (69.2) para 1P y la variación se aplica a las funciones '!/Ji y 1P2 por separado. Con otras palabras, se busca el extremo de la integral con relación a las funciones 1P de la forma (69.2); como resultado se obtiene, naturalmente, un valor propio de la energía que no es exacto, como tampoco lo es la función de onda, pero sí la mejor de todas las funciones que se pueden representar en dicha forma. El hamiltoniano del átomo de helio se escribe (1): f1 = f11 +f12 + 1/r12 , f11 = -l6 1 -2/r1 , (69.4) (r12 es la distancia entre los dos electrones). Substituyendo (69.2) en (69.3), efectuando la variación e igualando a cero los coeficientes de t5 "Pi y t5 i¡,2 en el integrando, obtenemos fácilmente las siguientes ecuaciones: [!6 +2!r+E-H22 -G2ir)]if,1(r)+[H12 +G12(r)]if, 2(r) = O, [!6 +2/r+E-H11 -G11 (r)]if, 2(r)+ [H12 +G12(r)]if,1 (r) = O, (69.5) donde Gair1) = Hab = J1fa(r2)1fb(r2) d V2/r12, J'Pa[-!6-2/r ]if,b d V (a, b = 1, 2). (69.6) Éstas son precisamente las ecuaciones finales a que conduce el método del campo autoconsistente; "SU solución es sólo posible, claro está, en forma numérica (2). De manera análoga deben deducirse las ecuaciones en casos más complicados. La función de onda del átomo que hay que substituir en la integral del principio variacional se construye como combinación lineal de productos de funciones de onda de los electrones individuales. Esta combinación debe elegirse tal que, en primer lugar, su simetría de permutación corresponda al spin total S del estado considerado del átomo y, en segundo lugar, ha de corresponder al valor dado de su momento cinético orbital total L. Al utilizar en el principio variacional una función de onda que posea la simetría de permutación debida, tenemos con ello en cuenta la interacción de intercambio de los electrones en el átomo. Se obtienen ecuaciones más sencillas (pero que conducen (1) En este párrafo y en los problemas que en él se proponen utilizamos unidades atómicas (véase la nota en la pág. 136). (2) La comparación de los niveles de energía de los átomos ligeros calculados siguiendo el método del campo autoconsistente con los datos espectroscópicos permite estimar la precisión del método en un 5 %, aproximadamente. El campo autoconsistente 277 a resultados menos precisos) si se prescinde de la interacción de intercambio, como también de la dependencia de la energía del átomo con relación a L para una configuración electrónica dada (D. R. HARTREE, 1928). Tomando de nuevo como ejemplo el átomo de helio, podemos entonces escribir directamente las ecuaciones para las funciones de onda de los electrones como ecuaciones ordinarias de ScHRODINGER (69.7) en las que Va es la energía potencial de un electrón que se mueve en el campo del núcleo y en el campo de la carga distribuida del segundo electrón: (69.8) (y análogamente para VJ. Para hallar la energía E del átomo, hay que observar que en la suma E 1 + E 2 se cuenta dos veces la interacción electrostática de los dos electrones entre sí, ya que dicha interacción interviene en la energía potencial tanto del primer electrón, V1(r1), como del segundo, Vlr 2 ). Por ello E resulta de la suma E 1 +E 2 restando una vez el valor medio de dicha interacción, es decir, (69.9) Para mejorar los resultados obtenidos mediante este método simplificado, la interacción de intercambio y la dependencia de la energía respecto de L se pueden tener luego en cuenta considerándolas como una perturbación. PROBLEMAS 1. Determinar aproximadamente la energía del nivel fundamental del átomo de helio y de los iones helioides (un núcleo de carga Z y dos electrones), considerando la interacción entre electrones como una perturbación. Solución. En el estado fundamental del ion, ambos electrones se encuentran en estados-s. El valor no perturbado de la energía es igual al doble (dos electrones) de la energía del nivel fundamental de un ion hidrogenoide: ECO>= 2c-1z2) = _z2. La corrección de primer orden viene dada por el valor rtí.edio de la energía de interacción de los electrones relativa a un estado con función de onda za if, = i/ii(r1),P2(r2) = -e-Z(r1+r2> (1) 1T (producto de dos funciones hidrogenoides con l = O). La manera más fácil de calcular la integral El átomo 278 es considerarla en la forma oo f r2 :,J ¡;;i.11 = 2 dV2 ·P• p1dV1, o o dV, = 4""12dr1, (que es la energía de la distribución de cargas e2 = 111'2 12 en el campo central de la distribución = 111'1 12 ; el integrando de la integral respecto de V 2 es la energía de la carga Qir 2) en el campo de la esfera r1 < r 2 ; el factor 2 ante la integral tiene en cuenta la contribución de las configuraciones en las que r 1 > r 2). Obtenemos así E(1l = 5Z/8 y, finalmente, e1 Para el átomo de helio (Z = 2) esta fórmula da - E= 11/4 = 2,75 (el valor real de la energía del estado fundamental de este átomo es, en cambio, - E= 2,90 u.a. = 78,9 eV). 2. Resolver el mismo problema aplicando el principio variacional y aproximando la función de onda mediante un producto de dos funciones hidrogenoideas con una cierta carga efectiva del núcleo. Solución. Calculemos la integral Z Z 1 lJ = -!(61 + 62)----+r1 r2 r12 con la función 11' dada por la expresión (1) del problema anterior, y escribiendo en ella Zet en vez de Z. La integral de 1P2/r12 se calcula como en el problema 1 ; la integral de 1jJÍl 11P se puede reducir a la integral 11'2/ri, observando que, en virtud de la ecuación de Schrodinger, El resultado que se obtiene es: Esta expresión, como función de Zet, presenta un mínimo para Zet = Z - t 6 . El correspondiente valor de la energía es: E= -(Z - ¡56)2. Para el átomo de helio esta igualdad da - E = 2,85. Hay que hacer notar que la función de onda (1) con el valor hallado para Zet es efectivamente la mejor, no sólo de todas las funciones de la forma (1), sino también de todas las funciones que dependen solamente de la suma r 1 +r 2 • Ecuación de Thomas-Fermi § 70. 279 Ecuación de Thomas-Fermi Los cálculos numéricos de la distribución de carga y del campo en un átomo siguiendo el método del campo autoconsistente son extraordinariamente engorrosos, en particular para átomos complejos. Pero precisamente para estos átomos existe otro método aproximado cuyo valor consiste justamente en su simplicidad; verdad es que conduce a resultados mucho menos buenos que el método del campo autoconsistente. En la base de este método (E. FERMI y L. THm.tAS, 1927) se encuentra el hecho de que en los átomos complejos, con un gran número de electrones, la mayoría de ellos poseen números cuánticos principales relativamente altos. En estas condíciones, es aplicable la aproximación cuasiclásica. Podemos por ello aplicar a los .estados de los electrones individuales del átomo el concepto de « celdas en el espacio de las fases » (§ 48). El volumen del espacio de las fases que corresponde a los electrones cuyo impulso es menor que p y que se encuentran en el elemento de volumen d V del espacio físico, 4:rp 3d V «celdas» (1), es decir, es igual a i:rp 3 dV. A este volumen corresponden - 3(2 :-r) 3 éste es el número de estados posibles, en los que se pueden encontrar simultáneamente no más de Pª 3772 4-rrpª 2--dV =-dV 3 3(277) electrones (dos electrones en cada «celda», con spins opuestos). En el estado normal del átomo, los electrones que se encuentran en cada elemento de volumen d V, deben llenar (en el espacio de las fases) las celdas que corresponden a un impulso desde cero hasta un cierto valor máximo p0 • La energía cinética de los electrones tendrá entonces, en cada punto, el menor valor posible. Si el número de electrones en el volumen d V se escribe en la forma n d V (donde n es la densidad de número de electrones), podemos afirmar que el valor máximo p0 del impulso de los electrones en cada punto está ligado con n por la relación Pl/3772 = n. El valor máximo de la energía cinética de los electrones en un punto en el que 1a densidad electrónica es n será, por consiguiente: (70.1) (1) En este párrafo utilizamos unidades atómicas. El átomo 280 Sea ahora <f,(r) el potencial electrostático, que tomamos igual a cero en el infinito. La energía total del electrón es p2/2 - q>. La energía total de cada electrón debe ser negativa, evidentemente; de no serlo, el electrón escaparía al infinito. Designemos el valor máximo de la energía total del electrón en cada punto por - </>0 , donde 'Pu es una constante positiva (si esta cantidad no fuera constante, los electrones pasarían de los puntos con valor menor de </>0 a puntos con valor mayor de </>0). Así, pues, podemos escribir: iPo2 = c/>-<f,o. (70.2) Igualando las expresiones (70.1) y (70.2), obtenemos n = [2(cf>-ef,0)]ª/2/31r2, (70.3) - relación que liga la densidad electrónica y el potencial en cada punto del átomo. Para </> = </>0 la densidad n se anula; es evidente que n debe ser igual a cero también en todo dominio en el que </> < </>0 , dominio en que la relación (70.2) conduciría a una energía cinética máxima negativa. De esta manera la ecuación</> = </>0 determina el límite del átomo. Pero fuera de una distribución central de cargas cuya carga total es igual a cero no existe campo. Por ello en la frontera de un átomo neutro debe ser </> = O. De aquí se sigue que, para un átomo neutro, la constante </>0 debe tomarse igual a cero. En cambio, para un ion la constante </>0 no es nula. Consideraremos a continuación un átomo neutro y, de acuerdo con ello, haremos Según la ecuación electrostática de Poisson, tenemos ~</> = 4nn; substituyendo aquí (70.3), obtenemos la ecuación fundamental de Thomas-Fermi: 'Po e::::: O. .64> = (8y2/31r)<f>312• (70.4) La distribución del campo en el estado normal de un átomo se determina como solución, con simetría esférica, de esta ecuación que satisface las siguientes condiciones de contorno: para r -+ O el campo debe reducirse al campo coulombiano del núcleo, es decir, ha de tenerse </>r -+ Z; parar -+ oo, debe ser lim <f,r = O. Introduciendo en vez de la variable r una nueva variable x definida por r = xbz-113, b = Hf17) 2'ª = o,885, (70.5) y en vez de <p una nueva función incógnita x: (1) </>(r) z ( r z1¡3) =-x - T b Z4/3 x(x) =--, b X (70.6) obtenemos la ecuación (70.7) 1 ( ) En unidades ordinarias: cf,(r) = ( Ze/r)x(r Z1/ 3 me2/0,885n 2). 281 Ecuació,1 de Thomas-Fermi con las condiciones de contorno x = l para x = O y x = O para x = =. Esta ecuación no contiene ya ningún parámetro y determina así una función universal x(x). En la tabla 2 se dan los valores de esta función obtenidos por integración numérica de la ecuación (70.7). La función x(x) disminuye con monotonía, anulándose únicaTABLA 2 Valores de la función x(x) X 0,00 0,02 0,04 0,06 0,08 0.10 0,2 0,3 0,4 0;5 0,6 0.7 0,8 0,9 1,0 1,2 x(x) X x(x) 1,000 0,972 0,947 0,924 0,902 0,882 0,793 0,721 0,660 0,607 0,561 0,521 0,485 0,453 0,424 0,374 1,4 1,6 1,8 2,0 2,2 2.4 2,6 2,8 3,0 3,2 3,4 3,6 3,8 4,0 4,5 5,0 0.333 0,298 0,268 0,243 0,221 0,202 0,185 0,170 0,157 0,145 0,134 0,125 0,116 0,108 0,0919 0,0788 X x(x) 6 7 8 9 10 11 12 13 14 15 20 25 30 40 50 60 0,0594 0,0461 0,0366 0,0296 0,0243 0.0202 0,0171 0,0145 0,0125 0,0108 0,0058 0,0035 0,0023 0,0011 0,00063 0,00039 1 mente en el infinito (1). Con otras palabras, en el modelo de Thomas-Fermi el átomo carece de fronteras y se extiende formalmente hasta el infinito. El valor de la derivada x'(x) para x = O es x'(O) = -· 1,59. Por ello, cuando x--* O la función x(x) tiene la forma x ,. ._., 1 - 1,59x y, de acuerdo con esto, el potencial </>(r) es: cp(r) ~ Z/r- l,80Z4f3. (70.8) El primer término es el potencial del campo del núcleo, el segundo (-l,80me3Z41ª/ñ2 en unidades ordinarias) es el potencial creado por los electrones en el origen de coordenadas. Substituyendo (70.6) en (70.3), encontramos para la densidad electrónica una expresión de la forma n = Z2f(rZ1!3/b), f(x) = (32/91T3)(x/x)3!2. (70.9) _(1) La ecuacion (70.7) tiene la solución exacta x<x) = 144x-:i, que se anula en el infinito, pero que no satisface la condición de contorno en x = O. Cabría utilizarla como expresión asintótica de la función 7.(x) para grandes valores de x. Sin embargo, esta expresión da valores más o menos correctos tan sólo para valores muy grandes de x, mientras que precisamente a grandes distancias la ecuación de ThomasFermi es del todo inaplicable (véase más adelante). 282 El átomo Vemos así que en el rr:odelo de Thomas-Fermi la distribución de la densidad de carga presenta la misma fcrma. en los diferentes átomos, representando el papel de parámetro de longitud característico la cantidad z-113 (en unidades ordinarias: h2/me 2Z 113 , es decir, el cociente del radio de Bohr por Z 1 ' 3). En particular, si se miden las distancias en unidades atómicas, las distancias a las que la densidad electrónica es máxima será la misma para tcdcs los Z. Podemos afirmar, por lo tanto, que la mayor parte de los electrones en un átomo de número atómico Z se encuentran a distancias del núcleo que son del orden de z-113 • El cálculo numérico prueba que la mitad de la carga electrónica total de un átomo se encuentra dentro de una esfera de radio l ,33Z-1 ' 3 . Razonamientos análogos demuestran que la velocidad media de los electrones en un átomo (considerada, en orden de magnitud, como igual a la raíz cuadrada de la energía) es del orden de z 2 13 _ La ecuación de Thomas-Fermi deja de ser aplicable tanto a distancias del núcleo demasiado pequeñas, como a distancias demasiado grandes. Su dominio de aplicación, para valores pequeños de r, queda limitado por la desigualdad (49.12); a distancias menores en el campo coulombiano del núcleo, la aproximación cuasiclásica deja de ser aplicable. Haciendo en (49.12) 'Y. = Z, encontramos como límite inferior de dichas distancias el valor 1/Z. La aproximación cuasiclásica deja también de ser aplicable, en núcleos complejos, para grandes valores der. En efecto, es fácil ver que para r ,.._, la longitud de onda de de Broglie del electrón pasa a ser del orden de esta misma distancia, de modo que se viola por completo la condición necesaria para el carácter cuasiclásico. Cabe comprobar que así es estimando el valor de los diferentes términos en las ecuaciones (70.2) y (70.4); por lo demás, el resultado era de prever, evidentemente, sin cálculo alguno, ya que la ecuación (70.4) no contiene Z. De esta manera, la aplicabilidad de la ecuación de Thomas-Fermi viene limitada a un intervalo de distancias grandes respecto de 1/ Z y pequeñas con relación a l. Sin embargo, en los átomos complejos la mayor parte de los electrones se encuentran en este intervalo. Esta última circunstancia significa que· 1a « frontera exterior» del átomo en el modelo de Thomas-Fermi se encuentra en r ,.._, 1, es decir, las dimensiones de los átomos no dependen de Z. Junto con ellas resulta ser también independiente de Z la energía de los electrones exteriores, es decir, el potencial de ionización del átomo (1). Siguiendo el método de Thomas-Fermi se puede calcular la energía total de ionización E, es decir, la energía necesaria para separar todos los electrones del (') Este modelo no refleja, naturalmente, la dependencia periódica de las dimensiones de los átomos Y de sus potenciales de ioniLación respecto de Z, propiedades que se manifiestan en el sistema periódico de lm, elementos. Además, los datos empíricos revelan también la existencia de un aumento sistemático, no despreciable, de las dimensiones del átomo y una disminución de los potenciales de ionización a medida que aumenta 7. 283 Ecuación de Thomas-Fermi átomo neutro. Para ello es necesario calcular la energía electrostática de la distribución de Thomas-Fermi que corresponde a las cargas en el átomo; la energía total que se busca será igual a la mitad de esta energía electrostática, ya que en un sistema de partículas que interactúan entre sí según la ley de Coulomb, la energía cinética media es igual (de acuerdo con el teorema del virial) a la mitad de la energía potencial media cambiada de signo. La dependencia de E respecto de Z se puede determinar de antemano a partir de sencillas consideraciones: la energía electrostática de Z electrones en el campo de un núcleo de carga Z y que se encuentran a una distancia media z-1 13 del mismo, es proporcional a Z · z;z-1 13 = Z 7 13 . El cálculo numérico conduce al resultado: E= 20,8Z7 / 3 eV. La dependencia con relación a Z concuerda bien con los datos experimentales; en cambio, el valor empírico del coeficiente se aproxima a 16. Hemos señalado ya que los valores no nulos y positivos de la constante cp0 corresponden a átomos ionizados. Si se define la función x por la relación <p - </>0 = Zx/r, obtenemos para X la anterior ecuación (70.7). Sin embargo, nos deben interesar ahora no las soluciones que se anulan en el infinito, como ocurre para el átomo neutro, sino las que se anulan para valores finitos x = x 0 ; tales soluciones existen para cualquier x 0 • En el punto x = x 0 , la densidad de carga se anula a la vez que X, pero el potencial se conserva finito. El valor x 0 depende del grado de ionización de la siguiente manera. Según el teorema de Gauss, la carga total dentro de una esfera de radio r es igual a - r 2 ~<p cr = 1Z7.(x) · x7.'(x). I · (La carga total del ion, z, se obtiene si se hace aquí x se tendrá = x 0 ; dado que x(x0 ) = O, (70.10) En la fig. 23 la línea continua de trazo grueso representa la curva x = x(x) para el átomo neutro y debajo de ella se han trazado dos curvas para iones con diferentes grados de ionización. La razón z/Z viene representada gráficamente por la longitud del segmento que determina sobre el eje de ordenadas la tangente a la curva en el punto x = x 0 • La ecuación (70.7) tiene también soluciones que no se anulan en ningún punto; estas soluciones divergen en el infinito. Es posible considerarlas como soluciones correspondientes a valores negativos de la constante </,0 . En la misma fig. 23 se han representado dos de tales curvas x = x(x); todas pasan por encima de la curva que corresponde al átomo neutro. En el punto x = x 1, para el que (70.11) la carga total, contemda dentro de la esfera x < x 1, se anula (gráficamente, este punto 284 El átomo coincide, claro está, con el punto en el que la tangente a la curva pasa por el origen de coordenadas). Interrumpiendo la curva en este punto, podemos decir que dicha curva determina z(x) para un átomo neutro en cuya frontera la densidad de carga se conserva diferente de cero. Físicamente esta situación corresponde a un átomo como si dijéramos « comprimido », « encerrado » en un cierto volumen finito dado (1 ). 1·0 0·8 06 X 02 o 2 3 4 7 5 8 9 10 11 12 )( FIG. 23 La ecuación de Thomas-Fermi no tiene en cuenta la interacción de intercambio entre los electrones. los efectos ligados a ella son del orden siguiente de magnitud respecto de z-·m. Por consiguiente, tener en cuenta la interacción de intercambio en el método de Thomas-Fermi exige tener a la vez en cuenta todos los efectos de este orden (2 ). PROBLEMA Hallar la relación entre la energía de interacción electrostática de los electrones entre sí y la energía de su interacción con el núcleo en un átomo neutro, según el modelo de Thomas-Fermí. Solución. El potencial ef>e del campo creado por los electrones se obtiene restando del potencial total ef, el potencial del núcleo Z/r. Por ello la energía de interacción entre electrones es Uee = J<pendV -! (1) Esta interpretación puede ser útil en el estudio de la ecuación de estado de la materia sometida a elevados niveles de compresión. e) Esto han hecho A. s. KOMPANrlFTS y E. S. PAVLOVSKI. (ZhETF, 31,427, 1956) y D. A. KtRZHNITS (ZhETF, 32, 115, 1957). Funciones de onda de los electrones cerca del núcleo 285 (hemos expresado</, en función den de acuerdo con (70.3)). Por otra parte, la energía de interacción de los electrones con el núcleo Uen y su energía cinética T son iguales a: Uen= -zf¿v, ff Po T= 2 ¡p2. +rrp2dpd V o =3 f (31r2)2/3 n5/3dV. 10 Comparando estas expresiones con la igualdad ant~rior. obtenemos la relación Al mismo tiempo, según el teorema del virial (1), para un sistema de cargas que interactúan de acuerdo con la ley de Coulomb tenemos 2 T = - U = - Ven - Uee· Encontramos así finalmente: § 71. Funciones de onda de los electrones exteriores cerca del núcleo Hemos visto (basándonos en el modelo de Thomas-Fermi) que en los átomos complejos (grandes valores de Z) los electrones exteriores se encuentran esencialmente a distancias r ,_, 1 del núcleo (2). Sin embargo, toda una serie de propiedades atómicas dependen fundamentalmente de la densidad electrónica cerca del núcleo (encontraremos tales propiedades en los §§ 72 y 120). Para determinar el orden de magnitud de esta densidad, veamos cómo varía la función de onda de un electrón en el átomo, l/'(r), al variar r desde grandes distancias (r ,..._, 1) a distancias pequeñas. En la región r ,_, 1 el campo del núcleo está apantallado por los restantes electrones, de forma que la energía potencial U(r) ,_, 1/r ,..._, l. La energía del nivel del electrón en este campo es E,_, l. En cambio, a distancias que son del orden de magnitud del radio de Bohr en el campo de una carga Z, es r ,..._, I/ Z, y el campo del núcleo puede considerarse que no está apantallado: U= - Z/r. En la región de transición, 1/Z ~ r ~ 1, la energía potencial \U\ es ya grande comparada con la energía del electrón E y se cumple la condición d ( 1) dr (1) (2) p d "'dr v Véase tomo I, Mecánica, § 10. En este párrafo utilizamos unidades atómicas. 1 ~1 U1 I 286 El átomo (p es el impulso), de modo que el movimiento de aquél es cuasi clásico. La función de onda cuasiclásica con simetría esférica es tal que 1 1 1tf,(r) 1 " ' - - - - 1 para -~r~l, ryp rj Ujl/4 Z (71.1) y el orden de magnitud del coeficiente en ella (,....,, 1) viene determinado por la condición '1/J ""' 1 de « empalme » con la función de onda para r ,....,, 1. Aplicando la expresión (71.1) en orden de magnitud parar ""'1/Z (substituyendo en ella U= - Z/r), obtenemos el valor buscado de la función de onda cerca del núcleo (1): tf,(1/Z)- yZ. (71.2) De acuerdo con las propiedades generales de las funciones de onda en un campo central (§ 32), si sigue disminuyendo la distancia, o tp(r) se conserva constante en orden de magnitud (para un electrón-s), o empieza a decrecer (para l =I= O). La probabilidad de encontrar el electrón en la región r ·-;; l / Z es; w- 1tJ, 12,3_, 1¡z2. (71.3) Las fórmulas (71.2-3) determinan, claro está, solamente la marcha sistemática de la variación de las diferentes cantidades al aumentar Z, sin tener en cuenta las variaciones no sistemáticas que se presentan al pasar de un elemento al siguiente. ~ 72. Estructura fina de los niveles atómicos El estudio detenido de las interacciones relativistas se realizará más adelante, en el tomo IV de este curso. Pero algunas propiedades de dichas interacciones las indicaremos ya aquí. Los términos relativistas en el hamiltoniano de un átomo se distribuyen en dos categorías: unos son lineales respecto de Ios operadores de spin de los electrones, los otros dependen cuadráticamente de dichos operadores. Los primeros corresponden a algo así como una interacción del movimiento orbital de los electrones con sus spins; es la llamada interacción spin-órhita. Los segundos, en cambio, corresponden a la interacción entre los spins de los electrones ( interacción spin-spin). Ambas formas de interacción son del mismo orden (de segundo) respecto de v/c - de la razón de la velocidad de los electrones a la velocidad de la luz. De hecho, sin embargo, en los átomos pesados la interacción spin-órbita es considerablemente mayor que la (') Para determinar el coeficiente en esta fórmula (cuando se conoce la función de onda en la región ,:S. 1/Z. r""" 1) sería necesario utilizar la expresión (36.25) en ta región r Estructura fin.a de los niveles atómico .., 287 interacción spin-spin. Ello está ligado con el hecho de que la interacción spin-órbita crece rápidamente al aumentar el número atómico, mientras que la interacción spin-spin no depende en esencia de Z (véase más adelante). El operador de interacción spin-órbita tiene la forma: v',i = ~ A.a • Sa (72.1) a (la suma se extiende a todos los electrones del átomo), donde sa son los operadores de spin de los electrones y Áa ciertos operadores « orbitales », es decir, operadores que se aplican a funciones de las coordenadas. En la aproximación del campo autoconsistente, los operadores Áa resultan ser proporcionales a los operadores 10 del momento cinético orbital de los electrones, y entonces se puede escribir v'8 z en la forma (72.2) Los coeficientes de la suma se expresan en función de la energía potencial U(r) < O del electrón en el campo autoconsistente de la siguiente manera: h2 dU(ra) eta=---- 2m2c2ra dra Dado que \U(r)\ decrece al alejarnos del núcleo, todas las (72.3) IY.a > O. Considerando la interacción (72.1) como una perturbación, para calcular la energía hay que promediar (72.1) respecto de un estado no perturbado. La contribución principal a la misma procede de la región de distancias próximas al núcleo - distancias que son del orden de magnitud del radio de Bohr ( "'h2/ Zme 2) para un núcleo de carga Ze. En esta región, el campo del núcleo prácticamente no está apantallado y la energía potencial es U(r),...., Ze2/r- z2me4¡ n2, de modo que (J."-' h2U/m2c2r2 ,...., Z4(e2/hc)2me4/ñ2. El valor medio IY. se obtiene de aquí multiplicando por la probabilidad w de encontrar el electrón cerca del núcleo. Según (71.3), es w ~ z-2, de modo que para la energía de la interacción spin-órbita del electrón obtenemos finalmente ci,...., ( Ze2 ne )2 me4 n2 , 288 El átomo es decir, dicha energía difiere de Ja energía fundamental del electrón exterior en el átomo ("' me4ffi2) sólo en el factor (Ze2/fic)2. Este factor crece rápidamente al aumentar el número atómico y en los átomos pesados alcanza valores que son del orden de magnitud de la unidad. El promedio del operador (72.1) se realiza de hecho en dos etapas. Ante todo, se promedia respecto de los estados electrónicos con valores absolutos dados L y S de los momentos cinéticos totales orbital y de spin, pero no respecto de sus direcciones. Después de este promedio, t>"sz sigue siendo todavía, claro está, un operador, que representaremos por t>"sL (1). Por razones de simetría, es evidente que los valores medios sª deben estar dirigidos según S - el único vector de spin que caracteriza el átomo en conjunto (hay que recordar que, en la aproximación de orden cero, las funciones de onda se descomponen en productos de una función de spin por una función de coordenadas). Análogamente, los valores medios iª deben estar dirigidos según I.. Así, pues, el operador t>"sL tiene la forma: frsL = A s.L. (72.4) donde A es una constante característica del término dado (no desdoblado), es decir, una constante que depende de S y L, pero no del momento cinético total J del átomo. Para calcular la energía de desdoblamiento de un nivel degenerado (con S y L dados) hay que resolver la ecuación secular formada por los elementos de matriz del operador (72.4 ). En el presente caso, sin embargo, conocemos ya las funciones correctas de la aproximación de orden cero, respecto de las cuales la matriz VsL es diagonal. Éstas son las funciones de onda de los estados con valores dados del momento cinético total J. Promediar con relación a un tal estado significa substituir el operador S.L por sus valores propios. que, de acuerdo con la fórmula general (31.2), son iguales a: L.S = tl/U+l)-L(L+l)-S(S+l)]. Dado que para todas las componentes del multiplete los valores S y L son los mismos, y que nos interesa solamente su posición relativa, se puede escribir la energía de desdoblamiento en Ja forma: !AJ(J+l). (72.5) Los intervalos entre dos componentes consecutivas (caracterizadas por los números 1) son iguales, por consiguiente, a J y J- !::iEJ,J-1 = Aj. (72.6) Esta fórmula expresa la llamada regla de los intervalos de Landé (1923). (1) Dicho promedio significa, en esencia, formar las matrices de elementos (nM'LM'si V8 1tnMLMs) con todos los valores posibles ML, M'L y Ms, M's y diagonales respecto de los demás números cuánticos (cuyo conjunto designamos por n). Estructura fina de los niveles atómicos 289 La constante A puede ser tanto positiva como negativa. Cuando A > O, la más baja de las componentes del nivel multiplete es el nivel con el menor valor posible de J, es decir, J = [L - s¡; tales multipletes se califican de normales. Si, en cambio, A < O, el nivel más bajo corresponde a J = L+S (multiplete invertido). Es fácil determinar el signo de A para los estados normales de los átomos si ta configuración electrónica es tal que sólo existe una capa incompleta. Si esta capa está ocupada sólo hasta la mitad como máximo, según la regla de H und (§ 67) los n electrones que se encuentran en ella tienen todos spins paralelos, de forma que el spin total tenga el mayor valor posible, S = n/2. Substituyendo en (72.2) sa = S/n y sacando factor común ::xª (que es la misma para todos los electrones de una misma capa), obtenemos: Pú = (rx/2S)S •L, es decir, A = ::x/2S > O. Si, en cambio, la capa está ocupada hasta más de la mitad, sumemos y restemos antes de (72.2) la misma suma extendida a los estados vacantes - a los « huecos » de la capa incompleta. Dado que para una capa totalmente ocupada sería V.~, = O, el operador Vs 1 se presenta finalmente como suma Vsz = - ~ ex.a ia.Sa, extendida tan sólo a los «huecos», siendo el spin y el momento cinético orbital totales del átomo S = - ~sa, L = - 1:lw De Ja misma manera que antes, obtenemos así A = - ::x!2S, es decir, A < O. De Jo dicho resulta una simple regla que determina el valor J en el estado normal de un átomo con una capa no ocupada del todo. Si en esta última se encuentran no más de la mitad del número máximo de electrones posibles en ella, será J = IL-s¡. Si, en cambio, la capa está ocupada en más de su mitad, se tiene J = L+S. Conforme se indicó ya, la interacción spin-spin, a diferencia de la interacción spin-órbita, no depende esencialmente de Z. Esto es evidente en virtud de su propia naturaleza - la de una interacción directa de los electrones entre sí que nada tiene que ver con el campo del núcleo. Para el operador promediado de la interacción spin-spin debe obtenerse, como en el caso de la fórmula (72.4), una expresión que es cuadrática respecto de S. Las expresiones cuadráticas en S son S2 y (S.L) 2 • La primera tiene valores propios que no dependen de J, por lo que no conduce a un desdoblamiento del término. Podemos así prescindir de ella y escribir Vss = B(S.L)2, (72.7) donde B es una constante. Los valores propios de este operador contienen términos que no dependen de J, términos proporcionales a J(J + I ), y, finalmente, términos 290 El átomo proporcionales a P(J + 1)2. De ellos, los primeros no contribuyen al desdoblamiento y carecen, por lo tanto, de interés; los segundos pueden incluirse en la expresión (72.5), lo que equivale simplemente a un cierto cambio de la constante A. Finalmente, a los terceros corresponde en la energía del término la expresión (72.8) El esquema de construcción de los niveles atómicos expuesto en los §§ 66-67 se basa en un modelo en el que los momentos cinéticos orbitales de los electrones se componen entre sí para dar lugar al momento cinético orbital total L del átomo, y en el que de la misma manera sus spins forman el spin total S. Como se indicó ya, esta representación es únicamente posible si se cumple la condición de que los efectos relativistas sean pequeños; más exactamente, los intervalos de estructura fina deben ser pequeños respecto de las diferencias entre niveles con valores distintos L, S. Esta aproximación se llama aproximación de Russe/1-Saunders ; se la llama también enlace del tipo LS (o acoplamiento LS). De hecho, sin embargo, el campo de aplicabilidad de esta aproximación es limitado. De acuerdo con' el tipo LS se construyen los niveles de los átomos ligeros, pero a medida que aumenta el número atómico, las interacciones relativistas en el átomo se intensifican y la aproximación de Russell-Saunders llega a ser inaplicable (1). Hay que hacer observar también que esta aproximación es inaplicable, en particular, a los niveles fuertemente excitados en los que el átomo contiene un electrón en un estado con un valor de n grande, electrón que, por ello, se encuentra prácticamente a gran distancia del núcleo (§ 68). La interacción electrostática de este electrón con el movimiento de los restantes es relativamente débil; en cambio, la interacción relativista en el « átomo residual » no disminuye. En el caso límite opuesto, la interacción relativista es grande respecto de la electrostática (más exactamente, respecto de aquella parte de esta última con la que está ligada la dependencia de la energía respecto de S y L). Es imposible en este caso hablar de momento cinético orbital y de spin por separado, ya que ni uno ni otro se conservan. Los electrones individuales se caracterizan por sus momentos cinéticos totales j, que se componen para formar el momento cinético total del átomo J. Este esquema de construcción de los niveles atómicos se llama enloce dt:i Tipo .ii (o acoplamiento ji). En su aspecto puro, no se encuentra de hecho este tipo de enlace; entre los niveles de los átomos muy pesados se observan algunas formas de enlace intermedias entre los tipos LS y jj (2). (1) Hay que decir, sin embargo. que a pesar de que las fórmulas cuantitativas que describen este tipo de enlace dejan también entonces de ser aplicables, el propio método de clasificación de los niveles basado en este esquema puede tener sentido incluso para átomos más pesados, en particular para los estados más bajos (entre ellos, para el estado normal). (') Más detalles acerca de los tipos de enlace y del aspecto cuantitativo de la cuestión se pueden ver, por ejemplo, en: E. U. CoNDON y J. H. SHORTLEY, The theory of atomic sp,:ctm, Cambridge University Press, 1935. El sistema periódico de D. l. Mendeleev 291 Un tipo peculiar de enlace se observa en algunos estados fuertemente excitados. El << átomo residual» puede encontrarse en este caso en un estado Russell-Saunders, es decir, puede venir caracterizado por los valores de L y de S; en cambio, su acoplamiento con el electrón fuertemente excitado es del tipo ¡¡ (lo que de nuevo está ligado con el carácter débil de la interacción electrostática para este electrón). La estructura fina de los niveles de energía del átomo de hidrógeno posee ciertas características específicas; esta estructura se calculará en el tomo IV de este curso. Indicaremos aquí solamente que, para un valor dado del número cuántico principal n, la energía depende tan sólo del momento cinético total j del electrón. De esta manera, la degeneración de los niveles no se rompe más que en parte: al nivel con valores dados den y j corresponden dos estados con momentos cinéticos orbitales 1 = j ± 1 (con tal que j no tenga su mayor valor posible para el valor dado de n, j = n - 1). Así, el nivel con n = 3 se desdobla en tres niveles, de los cuales a uno corresponden ]os estados s1¡ 2 , p 1¡ 2 , al otro, los estados p 312 , d3 ., 2 y al tercero, el d 512 • § 73. El sistema periódico de los elementos de D. l. Mendeleev Para explicar la naturaleza de la periodicidad en el cambio de las propiedades que se observan en la serie de los elementos, colocados en orden de números atómicos crecientes, hay que examinar las singularidades que se dan en el proceso de completar sucesivamente las capas electrónicas de los átomos (N. BoHR, 1922). Al pasar de un átomo al siguiente, la carga aumenta en una unidad y a una capa se le añade un electrón. A primera vista cabría esperar que las energías d:: enlace de cada uno de los electrones que se añaden sucesivamente presentasen una variación monótona al aumentar el número atómico. En realidad, sin embargo, esto no es así. En el estado normal del átomo de hidrógeno se tiene sólo un electrón que se encuentra en el estado Is. En el átomo del siguiente elemento - el helio - se añade un electrón más en el mismo estado Is. La energía de enlace de cada uno de los electrones Is en el átomo de helio es, sin embargo, considerablemente mayor que la energía de enlace del electrón en el átomo de hidrógeno. Esta circunstancia es una consecuencia natural de la diferencia entre el campo en que se encuentra un electrón en el átomo H y el campo a que se ve sometido el electrón que se añade al ion He : a grandes distancias, estos campos coinciden, aproximadamente, pero cerca del núcleo con carga Z = 2 el campo del ion He+ es más intenso que el campo del núcleo del átomo de hidrógeno con Z = 1. En el átomo de litio (Z = 3), el tercer electrón va a parar a un estado 2s, ya que en estados Is no pueden encontrarse más de dos electrones a la vez. Para un valor El átomo 292 Z dado, el nivel 2s está situado por encima del nivel Is; a medida que aumenta la carga de.l núcleo, descienden tanto el uno como el otro. Sin embargo, cuando se pasa de Z = 2 a Z = 3, el primer efecto predomina considerablemente respecto del segundo, y por ello la energía de enlace del tercer electrón en el átomo Li es considerablemente más pequeña que la energía de enlace de los electrones en el átomo de helio. En los átomos desde el Be (Z = 4) hasta el Ne (Z = 10), se añaden, sucesivamente, al principio un electrón 2s más y luego seis electrones 2p. Las energías de enlace de los electrones que se añaden en este orden, crecen, en general, debido al aumento de la carga del núcleo. El electrón siguiente que se añade al pasar al c:itomo Na (Z = I I) va a ocupar un estado 3s; el efecto del paso a una capa más alta predomina en este caso sobre el efecto de aumento de la carga del núcleo, y la energía de enlace disminuye de nuevo fuertemente. Este cuadro de la manera cómo se llenan las capas electrónicas es característico para toda la serie de los elementos. Todos los estados electrónicos se pueden distrihuir en grupos que se completan sucesivamente: a medida que cada uno de ellos se va completando al avanzar en la serei de los elementos, la energía de enlace en general crece, pero en el momento en que comienzan a ocuparse los estados del grupo siguiente, la energía de enlace disminuye fuertemente. En la fig. 24 se presentan los potenciales de ionización de los elementos, obtenidos a partir de datos espectroscópicos; estos potenciales determinan las energías de enlace de los electrones que se añaden al pasar de cada elemento al siguiente. Los diferentes estados se distribuyen de la siguiente manera en grupos que se llenan sucesivamente: ls 2s, 3s, 4s, 5s, 6s, 2p 3p 3d, 4p 4d, 5p 4/, 5d, 6p 7s, 6d, 51, ... 2 electrones 8 ,, 8 ,, 18 ,, 18 ,, 32 ,, l (73.1) J EJ primer grupo se completa en el H y el He; la ocupación de1 segundo y tercero corresponde a los dos primeros períodos (los cortos) del sistema periódico, que contienen 8 electrones cada uno. Siguen luego dos períodos largos de I 8 elementos, y un período largo que incluye las tierras raras y que contiene en total 32 elementos. El último grupo de estados no llega a ocuparse por completo en los elementos que existen en la naturaleza (ni en los transuránicos artificiales). 25t- He Ne ~ ~· ;(I¡ ;: =i Ar ~ .,.... ~h ~ Kr ~ ev ;:;· Xe Q Hg I I Rn ~ /'· ~ \ \ ~ Po'1 5t- Li Pr \ Gd Lo Bo Sm Eu V Al No K Rb es .,.°1.... ~ 1 Ac Hf . . --o.J YbLu '{\ Ro ;:i ~ ;- \ b u ~ \'!t 0 ~,---=-5----~,o,,_---,L5----2~0----2~5~--3~0-----3L5----40.1-...---4~5----5~0----~55_____60.,_____6~5----7~0----7~5----~80L-----8L5----90-L-- Frn. 24 ~ ~ 294 El átomo Para comprender la marcha del cambio de las propiedades de los elementos a medida que se ocupan los estados de cada grupo, es esencial la siguiente propiedad de los estados d y f, que los distingue de los estados s y p. Las curvas de la energía potencial efectiva del campo central (constituido por el campo electrostático y el campo centrífugo) para un electrón en el campo de un átomo pesado, después de una caída rápida, casi vertical, cerca del origen de coordenadas, presentan un mínimo acentuado, a continuación del cual comienzan a crecer, tendiendo asintóticamente a cero. Para los estados s y p estas curvas marchan, en su parte creciente, muy cerca la una de la otra. Esto significa que en estos estados el electrón se encuentra aproximadamente a iguales distancias del núcleo. En cambio, las curvas para los estados d y, en particular, para los estados f pasan mucho más a la izquierda; la región « clásicamente accesible» que limitan termina considerablemente más cerca que la correspondiente a los estados s y p para una misma energía total del electrón. Con otras palabras, en los estados d y f el electrón se encuentra, esencialmente, mucho más cerca del núcleo que en los estados s y p. Toda una serie de propiedades de los átomos (entre ellas Jas propiedades químicas de los elementos, véase § 81) dependen, principalmente, de Jas regiones exteriores de las capas electrónicas. En relación con esto es muy importante la particularidad de los estados d y f que hemos señalado. Así, por ejemplo, a medida que se ocupan los estados 4/ (en los elementos de tierras raras, véase más abajo), los electrones que se añaden se colocan mucho más cerca del núcleo que los electrones en los estados ocupados antes. Como resultado de ello, estos electrones no se manifiestan casi en las propiedades químicas y todos los elementos de tierras raras resultan ser muy parecidos químicamente. Los elementos que contienen capas d y f completas (o que carecen de ellas) se llaman elementos de los grupos principales; los elementos en los que se van ocupando dichos estados, se llaman elementos de los grupos de transición. Conviene considerar por separado los elementos de estos grupos. Comencemos por los elementos de ]os grupos principales. El hidrógeno y el helio tienen los estados normales: (el subíndice a 1a izquierda de un símbolo químico representa siempre el rtúmero atómico). Las configuraciones electrónicas de los restantes elementos de los grupos principales se dan en la tabla 3. En cada átomo, están del todo completas las capas indicadas a la derecha de la tabla en la misma línea y en todas las anteriores. La configuración electrónica de las capas que se están ocupando se indica en la parte superior, indicándose con un número el número cuántico principal de los electrones en estos estados, número que 295 El sistema periódico de D. l. Mendeleev aparece a la izquierda de la tabla en la misma línea. Debajo se indican los estados normales del átomo en conjunto. Así, el átomo Al tiene la configuración electrónica 1s22s22p63s23p2P112· TABLA 3 Configuraciones electrónicas de los elementos de los grupos principales ----il-__ n = 2 3 4 4 5 5 6 6 7 s_ _ s_ª_ aLi uNa 19K 29Cu 37Rb 47Ag ssCs 79Au s1Fr 4Be 12Mg 20Ca soZn asSr 4sCd saBa soHg ssRa _!!__ szpz ~1~1~ szp• sB 1aAl aC 14Si 7N 1sP sO 10S 9F 11Cl 10Ne 1sAr 31Ga a2Ge aaAs 34Se asBr aaKr 49ln soSn s1Sb s2Te sal 54Xe s1Tl s2Pb saBi s4Po ssAt saRn I____ 1s2 2s1 2p• 3s2 3pª 3d1 º 4s 2 4p 8 4d 1 º Ssª Sp• 4f1' Sd 10 6s 1 6p 6 Los valores L y Sen el estado normal del átomo se pueden determinar (cuando se conoce la configuración electrónica) mediante la regla de Hund (§ 67), y el valor de J se determina siguiendo la regla indicada en el ~ 72. Los átomos de gases nobles (He, Ne, Ar, Kr, Xe, Rn) ocupan en la tabla una posición especial: en cada uno de ellos se completan los grupos de estados enumerados en (73.1 ). Sus configuraciones electrónicas gozan de particular estabilidad (los potenciales de ionización son los mayores en las correspondientes series). Con ello está ligada también la inercia química de estos elementos. Vemos así que en la serie de elementos del grupo principal los diferentes estados se van ocupando de manera muy regular: se ocupan primero los estados s y luego los estados p de cada número cuántico principal n. También son regulares las configuraciones electrónicas de los iones de estos elementos (hasta que la ionización afecta a los electrones de las capas d y f): cada ion tiene una configuración que corresponde a la del átomo precedente. Así, el ion Mg+ tiene la configuración del átomo Na, el ion Mg+ + la configuración del Ne. Pasemos ahora a los elementos de los grupos de transición. Las capas 3d, 4d, 5d se van completando en los grupos de elementos llamados, respectivamente, grupos del hierro, del paladio y del platino. En la tabla 4 se presentan las configuraciones electrónicas y los términos de los átomos de estos grupos deducidos de datos espectroscópicos experimentales. Conforme se ve en ella, las capas d se ocupan de manera mucho menos regular que las capas s y p en los átomos de los elementos 296 El átomo de los grupos principales. Un rasgo característico es aquí la «competencia» entre los estados s y d. Esta competencia se manifiesta en que, en vez de una sucesión regular de configuraciones del tipo dPs 2 con p creciente, son a menudo más ventajosas las configuraciones del tipo dJJ+ls o dP+ 2 • Así, en el grupo del hierro, el átomo Cr tiene la configuración 3d54s y no la 3d44s2 ; después del Ni, con ocho electrones d, sigue inmediatamente el átomo de Cu con la capa d totalmente ocupada {por lo que lo hemos atribuido a los grupos principales). Esta misma falta de regularidad se observa también en los términos de los iones: las configuraciones electrónicas de los iones frecuentemente no coinciden con la configuración de los átomos precedentes. Por ejemplo, el ion v+ tiene la configuración 3d4 (y no la 3d24s2, como el Ti), el ion Fe+ tiene la configuración 3d64s (en vez de la configuración 3d54s2 del átomo Mn). 4 TABLA Configuraciones electrónicas de los átomos de los elementos de los grupos del hierro, paladio y platino Grupo del hierro 22Ti 21Sc Capa Ar+ 3d 4s 2 2 3d 4s 2Da;2 2aV 2 3 3d 4s ªF2 24Cr 2 2sMn 1 ~ ~ 1 2 s N i 3d 4s 3d5 4s2 3d 8 4s 2 3d 7 4s2 3d 8 4s1 7Sa ªS&¡2 ,,D, 5 'Fa¡2 'Fo/2 ªF, Grupo del paladio sgY Capa Kr+ 4d 5s2 2 41Nb 42Mo 4d2 5s2 4d4 Ss 4d6 Ss ªF2 1sª 40Zr Da¡2 ªD1;2 l 4sPd 44Ru 4sRh 4d5 5s2 4d 7 Ss 4d 8 Ss 4dl0 'Fo¡2 1so 43Tc r,F& 6 Ss¡2 Grupo del platino Capa Xe+ Sd 6s 2 Da;2 2 nLu Capa Xe+4f14 + ) 1 72Hf 7sTa 74W 1 7sRe 1 760s nlr 7sPt - - - - - -2 - - - - - - - - - ' - - - - - - - - Sd 6s 2 2 D 3¡ 2 2 5d 6s ªF2 3 , 5d 6s 1 4Fa¡2 2 l 5d' 6s 6 D 0 5 2 5d 6s , 6 S 5¡ 2 11 Sd6 6s2 5d7 6s2 5 D4 4F9¡2 5d 9 6s 3 D3 TABLA 5 Configuraciones electrónicas de los átomos de los elementos de tierras raras ssCe --Capa Xe+ sgPr 6oNd 4f 2 6s 2 4J3 6s 2 4J' 6s1 3H4 •1,,, I •1, s1Pm 63EU s2Sm &sTb 64Gd &&DY &sEr 67HO 69Tm 70Yb ~ --- --- - - - ---- ~- 4f5 6s2 4J 6 6s1 4J 7 6s1 4J 7 5d6s1 4f 8 Sd 6s2 4f1º 6s2 4f 11 6s2 4f126s2 4f ia 6sl 4¡1c 6sl :: 6Hs¡2 8 7Fo •D.,. S1¡1 'H11,· I ~ ~ l ·1is,. ·1, ~ 3H6 'F1¡1 1so 'ti ~ Q~ ~ §" TABLA 6 ~ Configuraciones electrónicas de los átomos del grupo de los actínidos s9Ac Capa Rn+ 6d 7s1 1 Da;1 90Th 01Pa ----- 6d2 7s2 5J 2 6d7s 2 3 F2 4K11;2 92U 9sNp :-- ¡.. Pu 5/3 6d7s1 5f4 6d7s 2 5f 6 1s2 r.La 6 L11¡2 ~ 7Fo 9sAm 96cm Sf 7 7s1 5f7 6d7s 1 8 S1¡2 : ;:s r 8 D2 1 ~ ....., El átomo 298 Obsérvese que todos los iones que se encuentran de manera natural en cristales y en soluciones, contienen en las capas no completas solamente electrones d (pero no electrones s y p ). Así, el hierro se encuentra en los cristales o en las soluciones sólo en la forma de iones Fe++ y Fe+++, con las configuraciones 3d6 y 3d5 , respectivamente. Una situación análoga se presenta también cuando se llena la capa 4f, lo que tiene lugar en la serie de elementos conocidos con el nombre de tierras raras (tabla 5) (1). El llenado de la capa 4/ se efectúa también de manera no del todo regular, caracterizándose por la « competencia » entre los estados 4f, 5d y 6s. El último grupo de elementos de transición empieza con el actinio. En este grupo se van ocupando las capas 6d y 5f, de modo análogo a como ocurre en la serie de elementos de tierras raras (tabla 6). Para terminar este párrafo, consideremos una interesante aplicación del método de Thomas-Fermi.Vimos que los electrones de la capa p aparecen por primera vez en el elemento quinto (8), los electrones d, para Z = 21 (Se), y los electrones f, para Z = 58 (Ce). Estos valores de Z pueden predecirse con ayuda del método de Thomas-Fermi de la siguiente manera. Un electrón con momento cinético orbital l que pertenece a un átomo complejo se mueve con una « energía potencial efectiva» (2) igual a U1(r) = -cp(r)+!(l+i)2/r2 • El primer término es la energía potencial en el campo eléctrico definido por el potencial de Thomas-Fermi </>(r). El segundo término es, en cambio, la energía centrífuga, 2 en la que hemos substituido en vez de l(l+ 1) teniendo en cuenta el carácter cuasiclásico del movimiento. Dado que la energía total del electrón en el átomo es negativa, es claro que si (para valores dados de Z y/) es U1(r) > O para todo r, en el átomo dado no pueden existir electrones con aquel valor,/, del momento cinético. Si se considera un valor determinado cualquiera,/, y se hace variar Z, resulta que para valores Z demasiado pequeños efectivamente será -en todo el espacio U1(r) > O. A medida que Z aumenta, llega un momento en que la curva U1 = U1(r) es tangente al eje de abcisas, y para valores mayores de Z se tiene ya un dominio en el que U1(r) < O. De esta manera, el momento en que aparecen en el átomo electrones con el valor dado del viene determinado por la condición de tangencia de la curva U1(r) y el eje de abcisas, es decir, por las ecuaciones u+n Ui(r) = -c/>+!(l+t)2/r2 = O, Uz'(r) = -c/>'(r)-(l+};:)2/r3 = O. (1) En los cursos de química, con frecuencia se incluye también el Lu entre los elementos de tierras raras. Esto, sin embargo, no es correcto, ya que en él la capa 4/ está ya completa; el Lu debe colocarse en el grupo del platino, como se hace en la tabla 4. 2 ( ) Como en el § 70, utilizamos unidades atómicas. 299 Términos de rayos X Substituyendo aquí la expresión (70.6) del potencial, obtenemos las ecuaciones Z213x(x)/x = ( 4/31r) 213 (l+i)2/x2, Vl 3 [xx'(x)-x(x)]/x = -2(4/31r) 21ª(l+i)2/x2. (73.2) Dividiendo miembro a miembro la segunda de estas ecuaciones por la primera, se encuentra para x la ecuación x'(x)/x(x) = -1/x, que junto con la primera de las ecuaciones (73.2) permite calcular Z. El cálculo numérico da: Z = 0·155(21+1) 3 • Esta fórmula determina los valores Z para los que aparecen por primera vez en un átomo electrones con un valor dado del (el error es de un 10 % aproximadamente). Valores muy precisos se obtienen si en vez del coeficiente O, 155 se toma 0.17: Z = 0·17(21+1) 3 • (73.3) Para l = 1, 2, 3 esta fórmula da, después de redondear al número entero más próximo, justamente los valores correctos 5, 21, 58. Para l = 4 la fórmula (73.3) da Z = 124; esto significa que los electrones g deberían aparecer por vez primera solamente en el elemento 124. § 74. Términos de rayos X La energía de enlace de los electrones interiores en un átomo es tan grande, que si uno de ellos pasa a una capa exterior incompleta (o si escapa del átomo), el átomo excitado (o el ion) resulta mecánicamente inestable respecto de la ionización acompañada de una reordenación de la nube electrónica y la formación de un ion estable. Sin embargo, en virtud del carácter relativamente débil de las interacciones electrónicas en el átomo, la probabilidad de esta transición es relativamente pequeña, de modo que el tiempo de vida r del estado excitado es grande. Por ello la «anchura» del nivel h/r (véase § 44) resulta suficientemente pequeña para que pueda tener sentido considerar las energías del átomo con un electrón interior excitado como niveles discretos de estados « cuasiestacionarios » del mismo. Estos niveles se llaman términos de rayos X (1). Los términos de rayos X se clasifican, en primer lugar, indicando la capa de la que ha partido el electrón o, como se suele decir, en la que se ha producido un « hueco». Adónde va a parar precisamente el electrón, no se manifiesta casi en la energía del átomo y carece por ello de importancia. (1) Este nombre procede de que las transiciones entre dichos niveles conducen a la emisión de rnyos X por el átomo. El átomo 300 El momento cinético total del conjunto de los electrones que llenan una cierta capa es igual a cero. Después de haber escapado de ella un electrón, la capa tiene un cierto momento cinético j. Para la capa (n, /) el momento cinético j puede tomar, evidentemente, los valores I ± ! . Obtenemos así niveles que se podrían representar por ls1¡2 , 2s1¡ 2, 2p 112 , 2p312 , ••• , donde el valor de j se añade como subíndice al símbolo que indica la posición del« hueco». Sin embargo, se suelen utilizar símbolos especiales de acuerdo. con la siguiente correspondencia: ls112 2s112 3d5¡2 K L1 Mv Los niveles con n = 4, 5, 6 se designan de manera análoga con las letras N, O, P. Los niveles con igual valor de n (designados con la misma letra mayúscula) son próxim,os entre sí y se encuentran lejos de los niveles con otros valores de n. Ello se debe a que, gracias a la relativa proximidad de los electrones interiores al núcleo, el campo en que se encuentran es el campo del núcleo casi no apantallado. Sus estados son así del tipo « hidrogenoide » y su energía, en primera aproximación, es 'igual a - Z2/2n 2 (en unidades atómicas), es decir, depende sólo de n. Cuando se tienen en cuenta los efectos relativistas, se produce un alejamiento mutuo de los términos con valores j distintos (cf. lo dicho en el § 72 acerca de la estructura fina de los niveles del hidrógeno), como, por ejemplo, L 1 y L 11 respecto de L 111 ; M 1 y Mu respecto de M 1 11 y Mrv- Tales pares de niveles se llaman dobletes regulares (o relativistas). En cambio, la separación de los términos con valores l diferentes e igual valor dej (por ejemplo, L 1 de L 11 , M1 de M 11 ) se debe a la desviación del campo en que se encuentran los electrones interiores respecto del campo de Coulomb del núcleo, es decir, aparece al tener en cuenta las interacciones del electrón con los demás electrones. Tales dobletes se califican de irregulares (o apantallados). El término correctivo principal que afecta a la energía « hidrogenoide » del electrón resulta del potencial creado por los restantes electrones en el dominio próximo al núcleo; dicho término es proporcional a Z4 13 (véase (70.8)). Sin embargo, dado que esta corrección no depende ni de n ni de /, no se manifiesta en los intervalos entre niveles. Por ello los términos correctivos principales en las diferencias de niveles resultan de la interacción de un electrón con los electrones más próximos a él. Dado que la distancia entre electrones interiores es r ,_, 1/Z (radio de Bohr en el campo de una carga Z), la energía de dicha interacción es ,_, 1/r ,_, Z. Si se tiene en cuenta esta corrección, se puede escribir la energía de un término de rayos X, con igual precisión, en la forma - (Z - <5)2/2n 2, donde b = <5(n, /) es una cantidad pequeña (comparada con Z) que podemos considerar como índice del grado de apantallamiento de la carga del núcleo. Términos de rayos X 301 Además de los términos de rayos X con un « hueco » en las capas electrónicas, pueden existir también términos con dos y tres « huecos ». Dado que la interacción spin-órbita es fuerte para los electrones interiores, el enlace de los huecos entre sí es del tipo jj. La anchura de un término de rayos X se determina por la probabilidad total de todos los procesos posibles de reordenación de la capa electrónica del átomo cuando se llena el « hueco » dado. En los átomos pesados, representan un papel fundamental en este proceso las transiciones de un hueco desde la capa dada a otra más alta (es decir, las transiciones inversas de los electrones), acompañadas de la emisión de un cuanto X. Las probabilidades de estos procesos « radiativos », y con ellas la parte correspondiente de la anchura del nivel, crecen muy rápidamente - como Z 4 - al aumentar el número atómico, pero decrecen (para un Z dado) al pasar de los niveles más bajos a otros que lo son menos (1). Para átomos más ligeros (y para niveles más altos) un papel importante e incluso preponderante lo representan las transiciones no acompañadas de radiación, transiciones en las que la energía que se libera al llenarse un hueco por un electrón procedente de un nivel más alto, se utiliza para arrancar del átomo otro electrón interno (éste es el llamado efecto Auger); como resultado de este proceso, el átomo queda en un estado con dos huecos. La probabilidades de estos procesos, y su correspondiente contribución a la anchura del nivel, no dependen en primera aproximación (respecto de 1/Z) del número atómico (véase el problema) (2). PROBLEMA Hallar la ley límite que liga la anchura Auger de los términos de rayos X con el número atómico para valores suficientemente grandes de este último. Solución. La probabilidad de una transición Auger es proporcional al cuadracto de un elemento de matriz de la forma: donde "Pi, 1jJ2 y "Pi', 1jJ2 ' son las funciones de onda iniciales y finales de los dos electrones que toman parte en la transición, y V= e2/r12 es su energía de interacción. Para valores Z suficientemente grandes, las funciones de onda de los electrones interiores se pueden considerar como del tipo hidrogenoide y cabe prescindir del apantallamiento del campo del núcleo por los demás electrones (hidrogenoide es también la función de onda del electrón de ionización en la región interior del átomo que es esencial para la integral M). Si se efectúa el cálculo expresando todas las cantidades en unidades coulombianas (con la constante tX = Ze 2 ; véase § 36), la única cantidad que depende de Zen la integral M será V= 1/Zr12 , de forma que M"" 1/Z. La probabilidad de la transición, y con ella también la anchura Auger, t:.E, del nivel, será proporcional a z-2 •.Pasando de nuevo a unidades ordinarias (la unidad coulombiana de energía es Z 2me4/h 2 ), encontramos que t:.E no depende de Z. e) Véase el tomo siguiente de este curso. Indicaremos como ejemplo que la anchura Auger del nivel K es del orden de 1 eV, mientras para niveles más altos alcanza valores ......, 10 eV. (2) 302 § 75. El átomo Momentos multipolares Como es sabido, las propiedades eléctricas de un sistema de partículas se caracterizan en la teoría clásica por los momentos multipolares de diferentes órdenes, momentos que se expresan en función de las cargas y de las coordenadas de las partículas. En la teoría cuántica, las definíciones de estas cantidades conservan la misma forma, pero deben considerarse como relativas a operadores. El primero de los momentos multipolares es el momento dipolar, definido como igual al vector d= ~er, (la suma se extiende a todas las partículas del sistema; hemos prescindido, P.ara simplificar, del índice que numera las partículas). La matriz de este operador - como la de todo vector polar (véase § 30) - tiene elementos distintos de cero solamente para las transiciones entre estados de diferente paridad. Por ello son iguales a cero, en cualquier caso, todos los elementos diagonales. Con otras palabras, los valores medios del momento dipolar de un sistema cualquiera de partículas (por ejemplo, de un, átomo) son iguales a cero en los estados estacionarios (1). Evidentemente, lo mismo vale en general para todos los momentos 21-polares con valores impares de /. Las componentes de uno de estos momentos constituyen un polinomio de grado impar (/-ésimo) en las coordenadas, que cambia de signo - al igual que las componentes de un vector polar - en la inversión de las coordenadas; también para ellos es válida, por lo tanto, la misma regla de selección relativa a la paridad. El momento cuadripolar de un sistema se define como tensor simétrico Qik = ~e(3xixk-Dikr2), (75.1) cuya suma de los términos diagonales es igual a cero. La determinación de los valores de estas cantidades en un estado cualquiera de un sistema (por ejemplo, de un átomo) exige promediar el operador (75.1) respecto de la correspondiente función de onda. Este promedio conviene efectuarlo en dos etapas (cf. § 72). Llamemos Qu, el operador del momento cuadripolar promediado respecto de (1) Para evitar interpretaciones erróneas, subrayaremos que se trata aquí de un sistema aislado de partículas o de un sistema de partículas en un campo eléctrico exterior central. Así, si se consideran los núcleos como «fijados», aquella afirmación general vale para el sistema electrónico de un átomo, pero no para una molécula. Se supone también que no existe ninguna degeneración adicional(« accidental») del nivel de energía aparte de la degeneración asociada con las direcciones posibles del momento cinético total. En el caso contrario, cabe construir funciones de onda de estados estacionarios tales que no posean paridad determinada, y los correspondientes elementos diagonales del momento dipolar no tienen entonces por qué anularse. Momentos multipolares 303 los estados electrónicos con un valor dado del momento cinético total J (pero sin que se dé su proyección MJ). El único vector que caracteriza al átomo en conjunto es el « vector » J Por ello, el único operador tensorial simétrico de traza nula es un tensor de la forma: (75.2) La constante Q se define de tal manera, que en el estado con M J = J sea Qzz = Q; esta cantidad se suele llamar, simplemente, momento cuadripolar. Hay que interpretar los operadores ji como las matrices conocidas del momento cinético para el valor dado J, que son no diagonales respecto de M. 1 ; el operador J 2 puede substituirse, claro está, por su valor propio J(J+I), sin más. Para J = O (con lo que también MJ = O), wdos los elementos de estas matrices son iguales a cero, es decir, los operadores se anulan idénticamente. Idénticamente se anulan también para J = i. Es fácil comprobarlo sin más que multiplicar directamente las matrices de Pauli (55.6), que son las matrices de las componentes de todo momento cinético igual a t. Esta circunstancia no es casual y constituye un caso particular de una regla general: el tensor del momento 2t_polar (con l par) es diferente de cero tan sólo para los estados del sistema cuyo momento cinético total J > l/2 (1). PROBLEMAS 1. Hallar la relación entre los operadores del momento cuadripolar de un átomo en los estados corre~pondiehtes a las distintas componentes de estructura fina de un nivel (esto es, a los· estados con valores diferentes de J para valores dados L y S). Solución. En los estados con valores dados de L y de S, el operador del momento cuadripolar, en tanto que magnitud puramente «orbital», depende tan sólo del operador L y se expresa así mediante la misma fórmula (75.2) cambiando en ella J por L (y con otra constante Q). El operador (75.2) se obtiene a partir de él promediando, además, respecto del estado con el valor dado J: (1) Esta regla es consecuencia de las propiedades generales de simetría respecto '1e las rotaciones. El tensor del momento 21-polar D(l) es un tensor irreducible de orden l (véase torno II, Teoría clásica de los campos, § 41); por sus propiedades de transformación, este tensor corresponde a un espinor simétrico de orden 2/ (véase § 58). Las funciones de onda 'PJ corresponden, en cambio, a un espinor de orde~ 2J. Los elementos de matriz del operador D(l) son distintos de cero si en las integrales que los definen el mtegra!ld<!(,J,.1• .6<1> ,¡,.,)contiene una parte escalar. Esta parte se obtiene contrayendo respecto de tos.tos los pares de md1ces de spin, debiendo referirse los índices de cada para factores diferentes (i/u*, ,¡,., y D< 1>) - de lo ~on_trario, el resultado es cero. Es evidente que esta contracción es posible tan sólo cuando la suma de los md1ces en tpJ y tpJ* no es menor que el número de índices en D(l). es decir, cuando 41? 21. El átomo 304 3QJ AJ Udk+ ]k i-iJU+ l)Sik] 2](2]-1) 3 QL [Ltlk+Lklt-iL(L+ 1)8ik]• 2L(L-1) A A Qik = A (1) Se trata de hallar la relación entre los coeficientes QJ y QL. Multipliquemos para ello la igualdad (1) a la izquierda por Ji y a la derecha por Jk (sumando respecto de i de k) y pasemos a los valores propios de los operadores diagonales. En todo esto es donde, según la fórmula (31.3), 2J.L = En cambio, el producto .A l1c l, jk ](] + l)+L(L+ 1)-S(S+ 1). se transforma mediante las fórmulas de manera parecida a como se hizo en el problema 2, § 29, lo que da: Análogamente J,],Jk]k = (12)2, J,Jk]1]k = J2(J2-l). De (1) se deduce así la siguiente relación: QJ= QL En particular, para S = ! 3J.L(2J.L-1)-2](] + l)L(L+ 1) (]+1)(2]+3)L(2L-1) . (2) esta fórmula da QJ= QL QJ= QL (L-1)(2L+3) L(ZL+l) para J = L+l, para J = (3) L-!. 2. Expresar el momento cuadripolar de un electrón (carga - e) con momento cinético orbital l en función del valor medio del cuadrado de su distancia al centro. Solución. Hemos de promediar la expresión respecto de un estado con momento cinético orbital dado l y con proyección del m_ismo m = l. El valor medio del factor angular se determina directamente aplicando la fórmula obtenida en el 305 Momentos multipolares problema 2 del § 29 (en la que hay que substituir lz por/), y encontramos en definitiva: 21 Qz=er2--. (4) 21+3 El signo de esta cantidad es opuesto al signo de la carga (- e) del electrón, como debe ser; una partícula que se mueve con movimiento cinético dirigido a lo largo del eje z, se encuentra esencialmente en la cercanía del plano z = O, por lo cual cos2 8< t. Para un electrón con valor dado j = l ± 1/2 la aplicación de la fórmula (3) da tS) Qi = ;;2(2j-1)/(2j+2). 3. Determinar el momento cuadripolar de un átomo (en el estado fundamental) en el que todos los electrones, en número de v, por encima de las capas ya completas se encuentran en estados equivalentes con momento cinético orbital /. Solución. Dado que el momento cuadripolar total de las capas completas es igual a cero, el operador del momento cuadripolar del átomo es la suma Qtk = extendida a los l' 3 2 er ~[hfk+Mi-il(l+ l)Sik-J, (21-1)(21+3) ~ electrones exteriores (se utiliza aquí la fórmula (4)). Supongamos primero que v < 21 + 1, es decir, que en la capa están ocupados la mitad o menos de la mitad de los puestos. Entonces, según la regla de Hund (§ 67), los spins de todos los v electrones son paralelos (de modo que S = v/2). Esto significa que la función de onda de spin del átomo es simétrica y, por consiguiente, la función de onda de coordenadas es antisimétrica respecto de estos electrones. En consecuencia, todos los electrones deben tener valores m distintos, de modo que el mayor valor posible ML (y el de L, que coincide con él) es igual a L = (ML)max = z L m = !v(2l-v+ 1). m=l-v+l El valor buscado QL es el valor propia Qzz para ML = L. Tenemos por esto: 6er2 QL = z ~ [m 2 -1-l(l+ 1)] 3 (21-1)(21+3) ~ m=l-v+l de donde, después de calcular la suma: 21(2l-2v+ 1) _ QL = (2/-1)(21+3( El paso final de QL a QJ se efectúa según la fórmula (2). 2 º ' El átomo 306 El caso de un átomo con la capa exterior ocupada hasta más de la mitad se reduce al anterior pasando a considerar los « huecos » en vez de los electrones; por ello la respuesta nos la da la misma fórmula (6) cambiada de signo (la carga de un «hueco» es igual a +e), debiéndose entender ahora por v. no el número de electrones, sino el número de puestos vacantes en la capa. 4. Determinar el desdoblamiento cuadripolar de los niveles en un campo eléctrico exterior que presenta simetría axil (1). Solución. En virtud de la simetría axil de] campo (cuyo eje de simetría supondremos es el eje z), tenemos: fAf,/ox2 = o2cf,/oy2 donde cf, es el potencial del campo, y en virtud de la ecuación electrostática Í!J.cf, fAf,/8z2 = = O, resulta -282c/,/8x2 El hamiltoniano del momento cuadripolar en el campo exterior es (2): de donde en el presente caso: Í1 = A(}x+ Jy2)-2A}2 2 = A(J2_3J z2), Do A=--- 2](2]-1) ax2. Substituyendo los operadores por sus valores propios, obtenemos el desplazamiento de los niveles: § 76. Efecto Stark Si se coloca un átomo en un campo eléctrico exterior, cambian sus niveles de energía; este fenómeno se llama efecto Stark. Al colocar un átomo en un campo eléctrico exterior homogéneo, nos encontramos ante un sistema de electrones situados en un campo con simetría axil (el campo del núcleo más el campo exterior). Debido a ello, el momento cinético total del átomo, rigurosamente hablando, deja de conservarse; tan sólo se conserva la proyección MJ del momento cinético total J sobre la dirección de este campo. Los estados con diferentes valores M J tendrán energías diferentes, es decir, el campo, (1) (2) El problema análogo para un campo arbitrario puede verse en el problema 5, § J03. Véase el tomo 11, Teoría clásica de los campos,§ 42. Efecto Stark 307 eléctrico rompe la degeneración asociada con las direcciones posibles del momento cinético. Sin embargo, esta ruptura de la degeneración no es completa: los estados que difieren tan sólo en el signo de MJ siguen siendo degenerados entre sí, como antes. En efecto, un átomo en un campo eléctrico exterior homogéneo es simétrico respecto de la reflexión en cualquier plano que pasa por el eje de simetría (eje que pasa por el núcleo y tiene la dirección del campo; lo e1egiremos luego como eje z). Por ello los estados que se obtienen uno de otro mediante una de estas reflexiones deben tener la misma energía. Pero en la reflexión en un plano que pasa por un cierto eje el momento cinético respecto del mismo cambia de signo (el sentido positivo de rotación en torno del eje se transforma en el negativo). Supondremos que el campo eléctrico es suficientemente débil como para que la energía adicional que determina sea pequeña respecto de las distancias entre los niveles de energía del átomo vecinos, en particular, respecto de los intervalos de estructura fina. Para calcular el desplazamiento de los niveles en el campo eléctrico podemos entonces utilizar la teoría de perturbaciones desarrollada en los §§ 38, 39. El operador de perturbación es, en este caso, la energía del sistema de electrones en el campo homogéneo 8, igual a (76.1) donde d es el momento dipolar del sistema. En la aproximación de orden cero, los niveles de energía son degenerados (respecto de las direcciones del momento cinético total); sin embargo, esta degeneración carece de importancia en el presente caso y al aplicar la teoría de perturbaciones se puede proceder como si se tratase de niveles no degenerados. Esto se sigue de que en la matriz de la magnitud dz (como la de la componente z de cualquier otro vector) son diferentes de cero únicamente los elementos que corresponden a transiciones sin cambio en el valor de MJ (véase § 29), y, por consiguiente, los estados que difieren en el valor de MJ se comportan con independencia entre sí al aplicar la teoría de perturbaciones. El desplazamiento de los niveles de energía viene determinado en primera aproximación por los correspondientes elementos diagonales de la matriz de perturbación. Sin embargo, los elementos de matriz diagonales del momento dipolar se anulan idénticamente (§ 75). Por ello el desdoblamiento de los niveles en el campo eléctrico es un efecto de segundo orden y proporcional al cuadrado del campo (1). El cálculo de aquél debe efectuarse siguiendo las reglas generales de la teoría de perturbaciones, pero la dependencia del desplazamiento de los niveles respecto del número cuántico MJ se puede establecer ya partiendo de consideraciones más generales. (1) El átomo de hidrógeno constituye una excepción, ya que en él el efecto Stark es lineal respecto del campo (véase el párrafo siguiente). De manera análoga al hidrógeno se comportan también, en campos suficientemente intensos, los átomos de otros elementos que se encuentran en estados fuertemente excitados <y por ello del tipo hidrogenoide, véase § 68). El átomo 308 En tanto que magnitud cuadrática respecto del campo, el desplazamiento ó.Ek del nivel En debe expresarse mediante una fórmula del tipo (76.2) donde rx¡/ ) es un tensor simétrico de segundo orden; eligiendo el eje z en la dirección del campo, obtenemos: 11 (76.3) El tensor rx¡/ ) caracteriza el nivel dado (no desdoblado) y depende también del número MJ. Los valores rx¡¡/ 11 ) para diferentes valores MJ se pueden considerar como valores propios del operador 11 (76.4) Ésta es la forma general de un tensor simétrico de segundo orden que depende del vector J (cf. § 75). De (76.3) y (76.4) se sigue: (76.5) Obsérvese que al sumar respecto de todos los valores MJ, el segundo término entre corchetes se anula, de forma que el primer término representa el corrimiento común del « centro de gravedad » del nivel desdoblado. Obsérvese también que según (76.5) el nivel con J = t no se desdobla, de acuerdo con el teorema de Kramers (§ 60). El tensor rx¡k(n) que figura en las fórmulas que acabamos de escribir representa a la vez la polarizabilidad del átomo en el campo eléctrico exterior. En efecto, según una fórmula general, (oH/o:>t.)nn = oEn/o>.. (véase el problema del § 11 ). Considerando en ella como parámetros A las componentes del vector 8 y haciendo H = H0 -tff.d, encontramos para el valor medio del momento dipolar del átomo (76.6) Si el átomo se encuentra en un campo exterior no homogéneo (que cambia poco en una región de las dimensiones del átomo), puede existir también un efecto de desdoblamiento lineal respecto del campo ligado con el momento cuadripolar de aquél. El operador de interacción cuadripolar del sistema con el campo tiene una forma que corresponde a la expresión clásica de la energía cuadripolar (1): (76.7) 1 ( ) Véase tomo 11, Teoría clásica de los campos, § 42. Efecto Stark 309 donde <p es el potencial del campo eléctrico (los valores de las derivadas son los correspondientes al lugar en que se encuentra el átomo). En particular, es posible aplicar esta fórmula a un átomo neutro que se encuentra en el campo de un electrón cuya distancia al átomo es grande respecto de las dimensiones atómicas. El campo del electrón en el lugar donde se halla el átomo satisface entonces la condición de ser cuasihomogéneo, y la primera aproximación de la teoría de perturbaciones conduce a una energía de la perturbación electrón-átomo que es proporcional a 1/r3 (puesto que </> ,_, 1/r). Este resultado se refiere, sin embargo, tan sólo a estados con valores dados de la proyección MJ del momento cinético total. Si se promedia respecto de todas las direcciones del mismo (es decir, respecto de todos los valores MJ) la interacción proporcional a l/r 3 se anula, ya que Qii = O. Además, esta interacción tampoco existe si el momento cinético del átomo es J = O ó ! (en estos casos Que - O, véase § 75). De orden siguiente respecto de las potencias de 1/r, y siempre diferente de cero, es la interacción que aparece en la aproximación de segundo orden de la teoría de perturbaciones aplicada al operador dipolar (76.1). Dado que el campo del electrón es tff "' 1/r2,la energía U de esta interacción resulta proporcional a 1/r4 • Si el átomo se encuentra en su estado normal, esta energía (como toda corrección de segundo orden a la energía del estado fundamental, véase § 38) es negativa, es decir, entre el átomo y el electrón actúa una fuerza atractiva. La atracción entre un electrón y un átomo es la causa de que algunos átomos tengan la propiedad de formar iones negativos uniendo a ellos un electrón (1). De esta propiedad, sin embargo, no gozan, ni con mucho, todos los átomos. Ello se debe a que en un campo que disminuye a grandes distancias como 1/r 4 (o como 1/r3), el número de niveles (que corresponden a un movimiento finito del electrón) es siempre finito, y en ciertos casos particulares puede ocurrir que ni tan solo existan. PROBLEMAS 1. Determinar la dependencia respecto de J del desdoblamiento por efecto Stark de las diferentes componentes de un nivel multiplete. Solución. Conviene resolver el problema cambiando el orden en que se aplican Jas perturbaciones: consideraremos primero el desdoblamiento del nivel por efecto Stark sin tener en cuenta la estructura fina, e introduciremos luego la interacción spin-órbita. Dado que el spin del átomo no interactúa con el campo eléctrico exterior, el desdoblamiento por efecto Stark de un nivel con momento cinético orbital L se determina por una fórmula del mismo tipo (76.2), con un tensor 1 ( ) Así, los átomos de halógenos se unen con un electrón con una energía de enlace del orden de 2 a 4 eV, mientras que el átomo de hidrógeno lo hace con una energía de enlace de 0,7 eY. 310 El átomo <Xtkque se expresa en función del operador L de la misma manera que función de J : rxik en (76.4) se expresa en (prescindimos en todo esto del índice n). Después de introducir la interacción spin-órbita, los estados del átomo deben caracterizarse por el momento cinético total J. El promedio del operador .<Xtk respecto de estados con valor dado del momento cinético J (pero no de su proyección M J) coincide formalmente con el promedio que se calculó en el problema 1 del § 75. Volvemos entonces a las fórmulas (76.4), (76.5) con constantes rx, f3 que se expresan en función de las constantes a, b de acuerdo con las relaciones: r1.. 3J.L[2J.L-1]-2J(] +l)L(L+ 1) ](] + 1)(2]-1)(2] +3) · = a, f3 = b De la misma manera se determina la dependencia del desdoblamiento respecto de J (pero no, claro está, la dependencia respecto de L y S, cantidades de las que - al igual que de otras características del término no desdoblado-, dependen también las constantes a, b). 2. Determinar la descomposición de un nivel doblete (spin S arbitrario (no débil). = t) en un campo eléctrico Solución. Si la magnitud del desdoblamiento no e·s pequeña comparada con el intervalo entre las componentes del doblete, la perturbación del campo eléctrico y la interacción spin-órbita deben considerarse a la vez, es decir, el operador perturbación es la suma: t = AS.L-¡c2{a+2b[Lz2-!L(L+ 1)]} (cf. (72.4) y el problema que precede). Prescindiendo de términos constantes que no son esenciales para el desdoblamiento, escribiremos este operador en la forma (véase (29.11)) Para cada valor dado MJ, los valores propios de este operador se determinan por las raíces de la ecuación secular formada por sus elementos de matriz respecto de los estados: (1) ML = MJ-!, (2) ML = MJ+t, Ms=i, Ms=-!, Mediante las fórmulas (27.12) se encuentra: Vu = iA(MJ-!)-bC2(MJ-!)2, Vi2 = -!A(MJ+!)-bC2(MJ+f)2, Vi2 = iAv[(L+MJ+i)(L-MJ+i)]. Para el desplazamiento de los niveles obtenemos finalmente (véase problema 1, § 39): (1) El e/ecto Stark en el hidrógeno 311 (se ha prescindido aquí de todos los términos que son iguales para todas las componentes del doblete descompuesto). Esta fórmula (con ambos signos ante la raíz) vale para todos los niveles con IMJ/ < L - t. Para MJ = L+ 1 [o MJ = - (L+!)] no existe el estado que hemos llamado estado 2 (ó 1); para este nivel el desplazamiento viene dado simplemente por el elemento de matriz V11 (o V22), es decir [eligiendo la constante aditiva de la misma manera que en (l)J: t:,.E = (lA+bC2)(L+!)-bC2(L+l)2. (2) (que coincide con el resultado obtenido según la fórmula (1) con uno de los signos ante la raíz). 3. Determinar el desdoblamiento cuadripolar de los niveles en un campo eléctrico con simetría axil. Solución. En un campo que es simétrico respecto del eje z, tenemos: 82ef,/ox2 = é)2q,/oy2 = a, o2ef,/oz2 = -2a, las demás derivadas segundas son iguales a cero. El operador (76.7) de la energía cuadripolar tiene la forma: Substituyendo los operadores por sus valores propios, obtenemos para el desplazamiento de los niveles: !:,.E= a ºº 2](2]-l) § 77. [](] + 1)-3MJ2]. El efecto Stark en el hidrógeno Los niveles del átomo de hidrógeno difieren de los niveles de los demás átomos en que, en un campo eléctrico homogéneo, experimentan un desdoblamiento proporcional a la primera potencia del campo ( efecto Stark lineal). Este hecho está ligado con la degeneración accidental de los términos del hidrógeno, degeneración en virtud de la cual los estados con valores l diferentes (para un número cuántico principal dado n) poseen las mismas energías. Los elementos de matriz del momento dipolar para las transiciones entre estos estados no son nunca nulos, por lo cual la ecuac1on secular da, ya en primera aproximación, un corrimiento de los niveles diferente de cero. Para efectuar el cálculo (1) conviene elegir las funciones de onda no perturbadas de manera que la matriz de perturbación sea diagonal respecto de cada grupo de estados degenerados entre sí. Esto se consigue cuantificando el átomo de hidrógeno (1) En los cálculos que siguen no tenemos en cuenta la estructura fina de los niveles del _hidróge!1º· Por ello, el campo no sólo debe ser débil (condición de aplicabilidad de la teoría de perturbac10nes), smo a l;l vez tal que el desdoblamiento por efecto Stark sea grande comparado con la estructura fina. El átomo 312 en coordenadas parabólicas. Las funciones de onda V'n,n.m de los estados estacionarios del átomo de hidrógeno en coordenadas parabólicas vienen definidas por las fórmulas (37.15-16). El operador de perturbación (1) (energía del electrón en el campo C ) es Gz = t C(g-r¡); (el campo está dirigido en el sentido positivo del eje z, y la fuerza que actúa sobre el electrón, en el sentido negativo). Nos interesan los elementos de matriz correspondientes a las transiciones n1n2m ~ n1'n 2'm', para las que la energía (es decir, el número cuántico principal n) no cambia. Es fácil ver que de ellos son diferentes de cero tan sólo los elementos de matriz diagonales: oooo27r f l'Pn n ml <fz d V = i<f fff (g2-r¡ )!'Pn n m! 2 1 2 2 1 2 2 d</>d[dr¡ ooo = ¡tff fJÍn m2(P1)fn m (P2)(P1 -pl) 2 1 2 2 dp¡dp2 (77.1) o o (hemos efectuado la substitución ~ = ne 1, r1 = ne 2). El carácter diagonal de lamatriz considerada respecto del número m es evidente; en lo que concierne a los números n1, n2 , el carácter diagonal respecto de los mismos se sigue de la ortogonalidad dos a dos de las funciones fn,m con diferentes n1 e iguales valores n (véase más abajo). Las integraciones respecto de e1 y de Q2 en (77.1) se pueden efectuar por separado; se obtienen así las integrales calculadas en el § f del apéndice matemático [integral (f, 6)J. Después de un cálculo simple, obtenemos finalmente para la corrección de primer orden relativa a los niveles de energía (2}. (77.2) o en unidades absolutas: E<1> = !n(n1 -n 2 )eCn 2/me 2 • Las dos componentes extremas del nivel que se desdobla corresponden a n1 = n - 1, n2 = O y n1 = O, n2 = n - l. La distancia entre dichos dos niveles es, según (77.2), 3c9'n(n-1), es decir, el desdoblamiento total del nivel en el efecto Stark e,s proporcional aproximadamente a n2 • Es natural que el desdoblamiento aumente con el número cuántico principal: cuanto más lejos del núcleo se encuentran los electrones, tanto mayor 1 ( ) En este párrafo utilizamos unidades atómicas. Este resultado fue obtenido por K. SCHWARTZSCHILD y P. EPSTEIN (l 913) basándose en ia antigua teoría cuántica, y por W. PAULI y E. ScHRODINGER ( 1926) mediante la mecánica cuántica. 2 ( ) El efecto Stark en el hidrógeno 313 es el momento dipolar del átomo. La existencia de un efecto lineal significa que en un estado no perturbado el átomo posee un momento dipolar cuyo valor medio es (77.3) Esto está de acuerdo con que, en un estado determinado por los números cuánticos parabólicos, la distribución de las cargas en el átomo no es simétrica respecto del plano z O (véase§ 37). Así, para n1 > n2 el electrón se encuentra preferentemente en el semiespacio de valores z positivos, por lo que el momento dipolar del átomo está dirigido en sentido opuesto al campo exterior (¡la carga del electrón es negativa!). En el párrafo anterior se demostró que un campo eléctrico homogéneo no puede romper por completo la degeneración - queda siempre la doble degeneración de los estados que difieren en el signo de la proyección del momento cinético sobre la dirección del campo (en el presente caso, la degeneración de los estados con proyecciones del momento cinético iguales a ± m). Sin embargo, por las fórmulas (77 .2) es claro que en el efecto Stark lineal del hidrógeno no se alcanza ni aún este grado de ruptura de la degeneración: el desplazamiento de los niveles (para valores dados den y de n1 n2) no depende en absoluto ni de m ni de n2 • Una ulterior ruptura de la degeneración tiene lugar en el efecto de segundo orden; el cálculo de este efecto es tanto más interesante cuanto que en los estados con n1 n2 desaparece el efecto Stark lineal. Para calcular el efecto cuadrático no conviene utilizar la teoría ordinaria de perturbaciones, ya que, de hacerlo, sería necesario manejar sumas infinitas de forma complicada. En vez de ello utilizaremos el siguiente método, que es una ligera variante de aquélla. La ecuación de SCHRODINGER para el átomo de hidrógeno en un campo eléctrico homogéneo tiene la forma: (V~+E+l/r-Cz)t/J = o. Al igual que la ecuación con 8 = O, esta ecuación admite la separación de variables en coordenadas parabólicas. La misma substitución (37.7) del§ 37 conduce a las dos ecuaciones: 2 ~(TJd/ )+(!E11-~+!c!112)/2 d17 d17 17 /31 +/32 = 1, (77.4) = -f3J2, 314 El átomo que difieren de (37.8) en la presencia de los términos que contienen l. En estas ecuaciones consideraremos la energía E como un parámetro que tiene un valor dado, y las cantidades /31, /32 , como valores propios de los correspondientes operadores (es fácil comprobar que estos operadores son autoconjugados). Al resolver las ecuaciones, estas cantidades se determinan como funciones de E y de I , hecho lo cual la condición /31 +/32 = 1 conduce a ]a re]ación que debe existir entre E y 8, es decir, a la energía como función del campo exterior. Al resolver aproximadamente las ecuaciones (77.4), consideraremos los términos que contienen el campo 8 como una pequeña perturbación~ En la aproximación de orden cero ( 8 = O), las ecuaciones poseen las soluciones ya conocidas (77.5) donde las funciones fn m son las mismas que en (37 .16), y donde en vez de la energía se ha introducido el parámetro 1 E= y(-2E). (77.6) Los correspondientes valores de las cantidades /31, /32 (según las igualdades (37.12), en las que hay que substituir n por 1/e) serán: (77.7) Las funciones / 1 con diferentes valores n1 y un valor dado e son ortogonales entre sí en tanto que funciones propias de un operador autoconjugado (hemos utilizado ya antes este hecho, al considerar el efecto lineal); en (77.5) están normalizadas por las condiciones co ffl d11 = 1. o Las correcciones de primer orden para /31 y /32 se determinan por los elementos diagonales de la matri'.l de perturbación: ex, 00 /J1(l) = f llif f1?d,' o fJ2(1> = -!G f 112Ndr¡. o El cálculo da: {J1(1> = i8(6ni2+6nilm(+m2 +6n1 +3lml+2)/E2 • La expresión para 132<1) difiere de ésta en la substitución de n1 por n2 y en el cambio de signo. 315 El efecto Stark en el hidrógeno En segunda aproximación tenemos, de acuerdo con las fórmulas generales de la teoría de perturbaciones: Las integrales que intervienen en los elementos de matriz (~2Jn n, se han calculado en el § f del apéndice matemático. Son diferentes de cero tan sólo los elementos 1 (g2)v11 -1 1 , = (g2\-1,'\ = -2(2n1+!ml)y'(n¡(n¡+lml)]/E2, (f2\,n 1 -s = (g2)n1 -s,n1 = v'[n1(n1-l)(n¡+ !ml)(n1+lm!-1)]/E2• Las diferencias que aparecen en los denominadores son iguales a /31<0>(n1)-/31<0>(n¡') = E(n¡-n1'). Como resultado del cálculo se obtiene: /31<2> = _ g 2(lml +2n1+ 1)[4m2 + 17(2lmln1+2n12 +lml +2n1)+ 18]/16E5 ; (la expresión para /3,/ 2) difiere de ésta en la substitución de n1 por n2). Reuniendo las expresiones obtenidas y substituyéndolas en la relación /31 +/32 = 1, llegamos a la ecuación €n-G2n(l7n2 +51(n1-n2)2-9m2 + 19]/16e5+-!Gn(n1-n2)/€2 = l. Resolviéndola por aproximaciones sucesivas, obtenemos en segunda aproximación e2 para la energía E = - 2 la expresión (77.8) El segundo término es el efecto Stark lineal que ya conocemos, y el tercero, el efecto cuadrático buscado (G. WENTZEL, l. WALLER, P. EPSTEIN, 1926). Obsérvese que esta cantidad es siempre negativa, es decir, gracias al efecto cuadrático los términos siempre se desplazan hacia abajo. El valor medio del momento dipolar se obtiene derivando (77 .8) respecto del campo; en los estados con n1 = n2 es igual a (77.9) Así, la polarizabilidad del átomo de hidrógeno en el estado normal (n = 1, m = O) es igual a 9/2 (en unidades absolutas: (9/2) (ñ2/me 2)3). El valor absoluto de la energía de los términos del hidrógeno disminuye rápida- 316 El átomo mente al aumentar el número cuántico principal n, y el desdoblamiento por efecto Stark crece. En relación con esto es interesante considerar el efecto Stark en los niveles fuertemente excitados cuando los campos son tan intensos que el desdoblamiento que provocan es comparable con el valor de la energía del propio nivel, con lo cual 1a teoría de perturbaciones es inaplicable (1). Esto puede hacerse utilizando el carácter cuasiclásico de los estados con grandes valores de n. La substitución /1 = x1/v'f, (77.10) lleva las ecuaciones (77.4) a la forma: (77.11) Pero cada una de estas ecuaciones tiene la forma de una ecuación de ScHRODINGER unidimensional, representando el papel de energía total de la partícula el término E/4, y el papel de energía potencial, las funciones (77.12) respectivamente. En las figs. 25 y 26 se presenta la forma típica de estas funciones (para m > I ). De acuerdo con las reglas de cuantificación de BoHR-SOMMERFELD (48.2), escribiremos: e. f v'{2[!E- Ui(,)]} dg = (n +fr;r, 1 f1 (77.13) 711 f v'{2[!E- Ul71)]} d71 = (n2+Hrr, 711 (1) La aplicabilidad de la teoría de perturbaciones a los niveles elevados exige que la perturbación sea pequeña tan sólo respecto de la energía del propio nivel (de la energía de enlace del electrón), y no respecto de los intervalos entre niveles. En efecto, en el caso cuasiclásico (al que corresponden precisamente los estados fuertemente excitados) la perturbación puede considerarse pequeña si la fuerza que ejerce es pequeña con relación a las fuerzas que actúan sobre la partícula en el sistema no perturbado; pero esta condición es equivalente a la indicada más arriba. 317 El efecto Stark en el hidrógeno (n1, n2 son números enteros) (1). Estas ecuaciones determinan en forma implícita la dependencia de los parámetros {J1 , {J2 respecto de E. Junto con la igualdad {J1 + {J2 = 1, determinan, por consiguiente, las energías de los niveles desplazados por el campo eléctrico. Las integrales en las ecuaciones (77 .13) se pueden reducir a integrales elípticas; la resolución de estas ecuaciones es sólo posible numéricamente. El efecto Stark en campos intensos se complica todavía con otro fenómeno - la ionización del átomo por el campo eléctrico. La energía potencial del electrón en un campo exterior tfz toma valores negativos tan grandes cuanto se quiera para z ~ - oo. Al sumarse a la energía potencial del electrón dentro del átomo, aquella energía conduce a que el dominio en que es posible el movimiento del electrón (cuya energía total E es negativa) pasa de quedar limitado a la región interior del átomo, a extenderse a gran distancia del núcleo en la dirección del ánodo. Estas dos regiones están separadas por una barrera de potencial cuya anchura disminuye <12 E,4 FIG. 25 FIG. 26 al aumentar el campo. Pero sabemos que en mecánica cu'ántica existe siempre una cierta probabilidad no nula de que la partícula atraviese la barrera de potencial. En el caso presente, el paso del electrón desde el oominio interior del átomo al exterior a través de la barrera no es ni más ni menos que el proceso de ionización del mismo. En campos débiles la probabilidad de esta ionización es sumamente pequeña. Sin embargo, dicha probabilidad crece exponencialmente con el campo y en campos suficientemente fuertes llega a ser considerable (2). 1 ( ) Un estudio detenido muestra que se obtiene un resultado más preciso si se escribe m2 en vez de m2 - 1 en las expresiones de Ui, U2 • Los números enteros ni, n2 coinciden entonces con los números cuánticos parabólicos. 2 ( ) Este fenómeno puede servir de ilustración de cómo una perturbación pequeña puede cambiar el carácter del espectro energético. Ya un campo débil tf basta para crear una barrera de potencial y hacer de la región a gran distancia del núcleo un dominio en principio accesible al electrón. Como consecuencia, el movimiento del electrón pasa a ser, estrictamente hablando, un movimiento infinito, con lo cual el espectro energético pasa de ser discreto a ser continuo. Con todo, la solución formal obtenida por el método de la teoría de perturbaciones tiene un significado físico. Dicha solución determina los niveles de energía de los estados que, si no del todo estacionarios, sí son « casi estacionarios». El átomo que se encuentra en uno de estos estados en un cierto instante inicial, permanece en él durante un intervalo muy largo de tiempo. Por otra parte, la serie a que conduce la teoría de perturbaciones para la descomposición de los niveles por efecto Stark no puede ser convergente en el sentido estricto de la palabra, sino tan sólo de manera asintótica; a partir de un determinado término de la serie (tanto más alejado cuanto menor es la magnitud de la perturbación) los términos que siguen no tienden a cero, sino que crecen. 318 El átomo PROBLEMA Determinar la probabilidad (por unidad de tiempo) de ionización de un átomo de hidrógeno (en el estado fundamental) en un campo eléctrico fuerte. Solución. En coordenadas parabólicas se tiene una barrera de potencial « a lo largo de la coordenada r¡ » (fig. 26); al proceso de «arrancar» el electrón del átomo en la dirección z~ - oo corresponde su paso al dominio de grandes valores r¡. Para determinar la probabilidad de ionización hay que investigar la forma de la función de onda para grandes valores r¡ (y valores no grandes de ~; veremos más adelante que en la integral que determina el flujo total de probabilidad del electrón que escapa del átomo intervienen los valores pequeños de ~). La función de onda del electrón en el estado normal (cuando no existe el campo) es (1) Cuando existe el campo, la dependencia de tp respecto de ~ en la región que nos interesa se puede considerar que es la misma que en (1) y para determinar la dependencia respecto de r¡ tenemos la ecuación (2) donde x = Vr¡tp (esta es la ecuación (77.11) con E = - !, m = O, /32 = D. Sea r¡0 un valor de 1J (perteneciente al «interior» de la barrera) tal que 1 ~ 1/o ~ 1/8. Para 11 ~ 1/o, la función de onda es cuasiclásica. Por otra parte, dado que la ecuación (2) tiene la forma de una ecuación de SCHRODINGER unidimensional, podemos utilizar las fórmulas (50.4). Aplicando en el punto r¡ = r¡0 la expresión exacta (1) de la función de onda, obtenemos en el dominio exterior a la barrera la expresión donde J[-i+ ~+-+!811]· 1 P('ri) = 27} 41]2 En lo que sigue nos interesa solamente el cuadrado lxl 2, Carece por ello de importancia la parte imaginaria del exponente. Llamando r¡ 1 la raíz de la ecuación p(r¡) = O, tenemos: lxl 2 = ?Jo IPol 711 -e-f-exp[-2 JIPI d71-710]· 'TT' p 710 En el coeficiente de la exponencial hagamos en el exponente, en cambio, hay que conservar también el término siguiente del desarrollo: 319 El efecto Stark en· el hidrógeno lxl2 = f 111 -e exp[1ry(t.i'r¡-l) TJo f d 111 v(l-t.i'r¡) dr¡+ 'lo r¡ r¡y(l-t.i'r¡) TJo], 110 (donde T/i ~ 1/C ). Efectuando la integración y prescindiendo donde sea posible de 1704frente a la unidad, obtenemos: lxl2 4 e-f = -e-21st1 . (3) v( Cr¡-1) 1rt.i' La corriente total de probabilidad a través de un plano perpendicular al eje z (es decir, la probabilidad de ionización buscada, w) es 00 W = f lifal vz21T1' dr. 2 o Para 17 grande (y ~ pequeña) se puede hacer dr = dy(fr¡) ~ !v(r¡/f) df. Substituyendo también en vez de la velocidad del electrón va;~ vr2<-1+1cr¡)J = v(Cr¡-1), obtenemos 00 w f = lxl 21ry( Cr¡-1) df o 4 tB' fo e-f df' 00 = -e-2 ¡st! es decir, en definitiva: w = o bien, en unidades ordinarias: (4/C)e-2 13t1, CAPÍTULO XI LA MOLÉCULA DIATÓMICA § 78. Términos electrónicos de una molécula diatómica En la teoría de las moléculas representa un papel fundamental el hecho de que las masas de los núcleos de los átomos son muy grandes comparadas con la masa de los electrones. Gracias a esta diferencia entre las masas, las velocidades del movimiento de los núcleos en la molécula son pequeñas respecto de las velocidades de los electrones. Esto ofrece la posibilidad de considerar el movimiento electrónico suponiendo los núcleos en reposo y situados a distancias dadas unos de otros. Al determinar los niveles de energía Un de un tal sistema, encontramos los llamados términos electrónicos de la molécula. A diferencia de los átomos, en los que los niveles energéticos eran números determinados, los términos electrónicos son no números, sino funciones de ciertos parámetros - las distancias entre los núcleos de la molécula. En la energía Un se incluye también la energía electrostática de interacción de los núcleos entre sí, de forma que Un es por su propia esencia la energía total de la molécula para una distribución dada de los núcleos en reposo. Comenzaremos el estudio de las moléculas con las de tipo más simple - las moléculas diatómicas, que son las que admiten un análisis teórico más completo. Uno de los principios fundamentales de la clasificación de los términos atómicos era la clasificación de acuerdo con los valores del momento orbital total L. En las moléculas, en cambio, no existe en general una ley de conservación del momento cinético orbital total de los electrones, ya que el campo eléctrico de los varios núcleos no presenta simetría central. En las moléculas diatómicas, sin embargo, el campo posee ~imetría axil respecto del eje que pasa por los dos núcleos. En consecuencia, se conserva aquí la proyección del momento cinético orbital sobre dicho eje y podemos clasificar los términos electrónicos de la molécula según los valores de esta proyección. El valor absoluto de lá proyección del momento cinético orbital sobre el eje de la molécula se suele designar con la letra .\; esta cantidad toma los valores O, 1, 2, ... Los términos con valores diferentes .\ se designan con letras mayúsculas griegas, que corresponden a los símbolos latinos de los términos atómicos con valores L distintos. Así, para Término.'> electrónico.., de u11a molPcula dfotómica 321 .\ = O, 1, 2, se habla de términos 2:, n, ~' respectivamente; de ordinario, no hay que considerar valores de .\ mayores. Cada estado electrónico de la molécula se caracteriza, además, por el spin total 5 de todos sus electrones. Cuando 5 es diferente de cero, se produce la degeneración asociada con las direcciones posibles del spin total, cuya multiplicidad es 25 :- I (1). El número 25 + 1, al igual que en los átomos, se llama multiplicidad del término y se escribe en forma de superíndice del símbolo del mismo; así, :311 representa un término con ~1 = 1, S = 1. Junto con los giros de ángulo arbitrario en torno del ~je, la simetría de la molécula admite también la reflexión en un plano cualquiera que pase por dicho eje. Si se aplica esta reflexión, la energía de la molécula se conserva invariable, evidentemente. En cambio, el estado que se obtiene como resultado de esta aplicación no será exactamente idéntico al estado de partida. Así, en la reflexión en un plano que pase por el eje de la molécula, cambia el signo del momento cinético respecto de este eje. Llegamos así al resultado que todos los términos electrónicos con valor .. 1 distinto de cero son doblemente degenerados - a cada valor de la energía corresponden dos estados que difieren en el sentido de la proyección del momento cinético orbital sobre el eje de la molécula. En lo que concierne al caso A = O, en general no varía el estado de la molécula en la reflexión, de modo que los términos 2: no son degenerados. La función de onda de un término 2: puede tan sólo quedar multiplicada por una constante como resultado de una reflexión. Dado que aplicar dos veces una reflexión respecto de un mismo plano equivale a la transformación idéntica, esta constante debe ser igual a l. De esta manera es necesario distinguir los términos ~ cuya función de onda no cambia de signo en la reflexión y los términos cuya función de onda cambia de signo. Los primeros se representan por ~>, y los segundos, por ~-. Si la molécula está constituida por dos átomos idénticos, aparece una nueva simetría y con ella una característica más de los términos electrónicos. U na molécula diatómica formada por núcleos iguales posee además un centro de simetría, que coincide con el punto medio del segmento que une a los dos núcleos (2). (Elegimos este punto como origen de coordenadas). Por ello el hami1toniano es invariante respecto del cambio simultáneo de signo de las coordenadas de todos los electrones de la molécula (dejando fijas las coordenadas de los núcleos). Dado que el operador de esta transformación (3) conmuta también con el operador del momento cinético (') Pn:scindiremos aquí de la estructura tina, ligada con las interacciones relativistas (véase más adelante,~~ 83, 84). (') Fsta molécula posee también un plano de simetría que es perpendicular al eje de la molécula en su punto medio. Sin embargo, no hay necesidad de considerar este elemento de simetría en particular, ya que la existencia de este plano se sigue automáticamente del hecho de que exista aquel centro y aquel eje de simetría. (ª) ¡No se la confunda con la inversión de las coordenadas de todas las partículas del sistema (cf. § 86)! 322 La molécula diatómica orbital, vemos la posibilidad de clasificar los términos con valores dados A teniendo en cuenta, además, su paridad: la función de onda de los estados pares (g) no cambia al cambiar el signo de las coordenadas de los electrones, y las impare'i (u), cambian de signo. Los índices u, g, que indican la paridad, se suelen escribir como subíndices del símbolo del término: Ilu, Iry, etc. Indicaremos finalmente una regla empírica según la cual en la inmensa mayoría de moléculas diatómicas químicamente estables el estado electrónico normal posee simetría completa - la función de onda electrónica es invariante respecto de todas las transformaciones de simetría de la molécula. Como se verá en el § 81, en la inmensa mayoría de los casos es también igual a cero el spin total Sen el estado normal. Con otras palabras, el término fundamental de una molécula es 1 l:+, y si la molécula está formada por átomos iguales, dicho término es 1 l:+ a (1). PROBLEMA Efectuar la separación de variables en la ecuación de ScHRÓDINGER para los términos electrónicos del ion H 2 + utilizando coordenadas elípticas. Solución. reposo es: La ecuación de Schrodinger para un electrón en el campo de dos protones en (utilizamos unidades atómicas). Las coordenadas elípticas ~. r¡ se definen por las relaciones y la tercera coordenada cf, es el ángulo de giro en tomo del eje que pasa por los dos núcleos, situados a una distancia R el uno del otro (2). El operador de Laplace ~e escribe en estas coordenadas: Haciendo obtenemos para X e Y las siguientes ecuaciones: (') Una excepción a estas reglas lo son las moléculas 0 2 (término normal ªl:-g)y NO (término normal "11). 2 ( ) Véase tomo 1, Mecánica, § 48. La intersección de término.-. electrónicos 323 dXJ + ( .lER2g2+zRt+A--A2 ) X= O -d [ (t2-1)2 dg dg s g2 - 1 ' dYJ + ( -fER2r¡2-A- -A2-) Y= O, -d [ (l-172)d17 d77 l-17 2 donde A es el parámetro de separación. Cada término electrónico se caracteriza por tres números cuánticos: ~\ y los dos números n;, n,¡, que determinan el número de ceros de las funciones X(~) e Y(17). Dado que todos estos números están ligados con funciones de la intersección de los términos lesquiera, entre ellos los valores también la misma simetría (cf. § 79. variables diferentes, no hay, en general, razón alguna que impida E(R) que difieran en los valores de dos números cuánticos cuadel par n~, n,1 para el mismo valor~\, aunque tales términos poseen la nota en la pág. 325). La intersección de términos electrónicos Los términos electrónicos de una molécula diatómica son funciones de un parámetro - la distancia r entre núcleos. Estas funciones se pueden representar gráficamente expresando la energía como función de r. La cuestión relativa a la intersección de las curvas que representan los diferentes términos ofrece entonces fundamental interés. Sean Vi(r), Ulr) dos términos electrónicos diferentes. Si se cortan en un cierto punto, cerca de éste las funciones U1 , V 2 tomarán valores próximos. Para resolver el problema de si es o no posible esta intersección, conviene plantearlo de la siguiente manera. Consideremos un punto r 0 en el que las funciones U1(r), Ulr) toman valores muy próximos entre sí, pero no iguales (llamémoslos E 1 y E 2) y consideremos si no sería posible hacer que V1 y V 2 se igualen desplazando este punto en una pequeña cant:dad ,5r. Las energías E 1 y E 2 son los valores propios del hamiltoniano H0 del sistema de electrones en el campo de los núcleos, que se encuentran a la distancia rO uno de otro. Si se incrementa la distanciar en or, el hamiltoniano se transforma en I10 +P-, donde P- = 8r. oll0 /or es una pequeña corrección; los valores de las funciones U1, U2 en el punto r0 +,5r se pueden considerar como valores propios del nuevo hamiltoniano. Esta manera de abordar el problema permite determinar los valores de los términos Ui(r) y U2(r) en el punto r0 +,,r mediante la teoría de perturbaciones, considerando r como una perturbación del operador H0 • Sin embargo, el método ordinario de la teoría de perturbaciones es aquí inaplicable, ya que los valores propios de la energía, E 1 y E 2 , del problema no perturbado son muy próximos entre sí y su diferencia, en general, no es grande comparada con la magnitud de la perturbación (no se cumple la condición (38.8)). La molécula diatómica 324 Dado que cuando, en el límite, la diferencia E 2 - E 1 se anula pasarnos a un caso de valores propios degenerados, es natural intentar aplicar al caso de valores propios próximos un método análogo al desarrollado en el § 39. Sean tp1 , tp2 las funciones propias del operador no perturbado H0 , correspondientes a las energías E 1 , E 2 • Como aproximación inicial de orden cero tornemos, en vez de las funciones 1Pi y 1P2 , combinaciones lineales de las mismas de la forma lf = (79.1) C1'f1 +Cz'f2• Substituyendo esta expresión en la ecuación perturbada (79.2) obtenernos: Multiplicando esta ecuación a la izquierda, sucesivamente, por grando, se obtienen dos ecuaciones algebraicas: c 1 (E1 + V 11-E)+c 2V 12 c1V21 +clE2+ v•i* y = O, "1/' 2 * e inte- (79.3) V22-E) = O, donde Vik = Sifi/P-tf,k dq. En virtud del carácter herrnítico del operador V, las cantidades V11 y Vi 2 son reales, y V12 = V21 *. La condición de compatibilidad de estas ecuaciones es E 1+ V 11 -E V21 V12 E2+ V22-E 1 = o, de donde se sigue: E= }(E1+E2+ Vn+ V22)±v[HE1-E2+ Vu-V22) 2+l V12l 2J. (79.4) Esta fórmula determina en primera aproximación los valores propios buscados de la energía. Si los valores de la energía de ambos términos pasan a ser iguales en el punto r0 +<5r (los términos se cortan), esto significa que los dos valores E determinados por la fórmula (79.4) coinciden. Para ello es necesario que el radicando en (79.4) se anule. Dado que éste es suma de dos cuadrados, como condición para que exista un punto de intersección de los términos obtenernos las ecuaciones (79.5) Sin embargo, disponernos de un solo parámetro arbitrario, que determina la perturbación V - el valor del desplazamiento r5r. Por esto las dos ecuaciones (79.5) La intersección de términos electrónicos 325 (suponemos que las funciones "Pi,, v·2 se han elegido reales; entonces también V12 es real) no pueden en general quedar satisfechas simultáneamente. Puede ocurrir, sin embargo, que el elemento de matriz V12 se anule idénticamente; queda entonces tan sólo una ecuación (79.5), la cual puede quedar satisfecha mediante una elección adecuada de ,5r. Esto ocurre en todos los casos en que los dos términos considerados poseen simetría diferente. Por simetría entendemos aquí todas las formas posibles de simetría - respecto de rotaciones en torno del eje, de reflexiones en planos que pasan por el mismo, de la inversión, y también respecto de las permutaciones de los electrones Para una molécula diatómica, esto significa que se puede tratar de términos con valores A diferentes, de distinta paridad o multiplicidad, y para términos I:, además, de términos 1: + y 1:-. En la demostración de esta proposición es esencial el hecho de que el operador V (como el propio hamiltoniano) conmuta con todos los operadores de simetría de la molécula - con el operador del momento cinético respecto del eje, con los operadores de reflexión e inversión, con los operadores de permutación de los electrones. En los§§ 29, 30 se demostró que para una magnitud escalar cuyo operador conmuta con los operadores del momento cinético y de inversión son solamente diferentes de cero los elementos de matriz para las transiciones entre estados de igual momento cinético e igual paridad. Esta demostración, esencialmente en la misma forma, conserva su validez en el caso general de un operador de simetría arbitrario. No nos detendremos en repetirla aquí, tanto más cuanto que en el § 97 se dará otra demostración general basada en la teoría de grupos. Llegamos de esta manera al resultado de que en una molécula diatómica pueden cortarse solamente los términos de diferente simetría, mientras que, en cambio, la intersección de términos de simetría igual es imposible (E. WIGNER y J. VON NEUMANN, 1929). Si como resultado de cualquier cálculo aproximado obtuviéramos dos términos de igual simetría que se cortan, al calcular la siguiente aproximación dichos términos se separarían conforme se indica en la fig. 27 mediante líneas de trazo continuo (1). Subrayemos que este resultado se refiere no sólo a las moléculas diatómicas, sino que, en realidad, es un teorema general de mecánica cuántica válido siempre que el hamiltoniano contiene un parámetro, como consecuencia de lo cual también sus funciones propias son funciones de dicho parámetro. En una molécula poliatómica los términos electrónicos son funciones no de un parámetro, sino de varios - las distancias entre los diferentes núcleos. Sea s el (1) De esta regla existe una singular excepción, excepción que se presenta cuando el problema relativo a la determinación de los términos electrónicos admite la total separación de variables (véase el problema del § 78). 326 La molécula diatómica u<r> FIG. 27 número de distancias independientes entre núcleos; en una molécula N-atómica (N > 2), para una distribución arbitraria de los núcleos este número es igual a s = = 3N - 6. Cada término Un(r 1 , ... , rs) representa, desde el punto de vista geométrico, una superficie en un espacio des+ I dimensiones y se puede hablar de intersecciones de estas superficies según multiplicidades de diferentes dimensiones - desde O (intersección en un punto) hasta s - l. Todos los razonamientos desarrollados antes conservan su validez, con la única diferencia de que la perturbación V viene determinada ahora no por un parámetro, sino por s parámetros (los corrimientos or1, ... , ór8 ). Pero ya para dos parámetros las dos ecuaciones (79.5) pueden, en general, ,quedar satisfechas. Llegamos así al resultado de que en las mol~culas poliatómicas dos términos cualesquiera pueden cortarse. Si los términos tienen la misma simetría, la intersección se determina por las dos condiciones (79.5), de lo que se sigue que el número de dimensiones de la variedad determinada por la intersección es s - 2. Pero si los términos son de diferente simetría, queda sólo una condición y la intersección es una variedad de s - I dimensiones. u Fm. 28 Relación entre términos moleculares y atómicos 327 Así, para s = 2 los términos se representan por superficies en un sistema de coordenadas tridimensional. La intersección de estas superficies es una línea (s - 1 = 1), cuando los términos son de diferente simetría, y un punto (s - 2 = O) cuando la simetría es la misma. No es difícil determinar qué forma tienen en el último caso las superficies cerca del punto de intersección. Los valores de la energía cerca del punto en que se cortan los términos vienen determinados por la fórmula (79.4). En esta expresión, los elementos de matriz V11 , V22 . V12 son funciones lineales de los desplazamientos ,5r 1, r5r 2 , y, por ello, son también funciones lineales de las propias distancias r 1 , r2 • Pero una ecuación de este tipo define, como es sabido por geometría analítica, un cono elíptico. Por lo tanto, cerca del punto de intersección los términos vienen representados por la superficie de un cono elíptico completo colocado arbitrariamente (fig. 28). § 80. Relación entre los términos moleculares y los atómicos Aumentando en una molécula diatómica la distancia entre núcleos, obtenemos en el límite dos átomos aislados (o dos iones). En relación con esto surge la cuestión de qué correspondencia existe entre un término electrónico de la molécula y los estados de los átomos que se obtienen al descomponerla. Esta relación no es biunívoca: al acercar dos átomos que se encuentran en determinados estados, se puede obtener una molécula en diferentes estados electrónicos. Supongamos primero que la molécula está constituida por dos átomos distintos. Supongamos, además, que los átomos aislados se encuentran en estados con momentos cinéticos orbitales L 1, L 2 y spins S1 , S2 y sea L 1 > L 2 • Las proyecciones de los momentos cinéticos sobre la recta que une los dos núcleos toman los valores M 1 = = - L1 , - L1 + 1, ... , L1 y M 2 = - L 2 , - L2 + 1, ... , L 2 • El valor absoluto de la suma M 1 +M 2 determina el momento cinético A que se obtiene al aproximar los átomos. Combinando todos los valores posibles M 1 y M 2, encontramos que los diferentes valores A = JM1 + M 2 / se obtienen tantas veces como se indica a continuación: A= L1+L2 L1+Lz-l dos veces cuatro veces L1-L2 2(2L 2+ 1) veces Li-La-1 2(2L 2+ 1) veces 1 2(2L 2 + 1) veces o 2L 2 +1 veces 328 La molécula diatómica Recordando que todos los términos con A =f=. O son doblemente degenerados y que no lo son aquéllos para los que A= O, encontramos que se pueden obtener: 1 término con A = L1 + L2 , 2 términos con A = L1 + L 2 - l, 2L 2 + 1 términos con A = L1 -L 2 (80.1) 2L 2 +l términos con A= L1 -L 2 -l, 2L 2 + 1 términos con A = O; en total (2L 2 + 1) (L1 + 1) términos con valores A desde O hasta L1 + L 2 • Los spins S1 , S2 de los dos átomos se componen para formar el spin total de la molécula de acuerdo con la regla general de composición de momentos, dando los siguientes valores posibles de S: (80.2) Combinando cada uno de estos valores con todos los valores de A (80.1 ), obtenemos la lista completa de todos los términos posibles de la molécula que se forme. Para los términos í: se plantea aun la cuestión de cuál sea su signo. Es fácil resolverla observando que las funciones de onda de la molécula se pueden escribir, parar---+ =, en forma de productos (o de suma de productos) de funciones de onda de ambos átomos. El momento cinético A = O puede obtenerse o como resultado de componer los momentos cinéticos no nulos de los átomos M 1 = - M 2 , o bien para M 1 = M 2 = O. Las funciones de onda del primer átomo y del segundo las designaremos por 11m.w,, 1P( 2 )~w Para M = \M 1 \ = \M2 =f=. O, formemos los producros simétricos y antisimétricos 2 • 1 tf;+ = tf;<1lMtf;<2 )-M+tJPl_Mtf;<2lM, ¡f;- = ¡f;(l)Mtp(2)_M_tp(1}_Mtp(2}M· La reflexión en un plano vertical (un plano que pase por el eje de la molécula) cambia el signo de la proyección del momento cinético sobre el eje, de modo que vP>M, 1P( 2 >¡w se transforman, respectivamente, en 1P( 1 >_.,1 , 11'( 2)_.w, y recíprocamente. Con esto la función 1J!+ no varía, y la 1p-, cambia de signo: la primera corresponde, por consiguiente, a un término í:+, y la segunda, a un término í:-. Así, pues, para cada valor M se obtiene un término í:+ y un término í:-. Dado que M puede tener L2 valores diferentes (M = 1, ... , L2), obtenemos en total L 2 términos í:+ y L2 términos í:- 329 Relación entrt> términos moleculares y atómicos Si, en cambio, se tiene .M1 = .M2 = O, la función de onda de la molécula es de la forma '!jJ = %lI)%( 2). Para ver cuál es el comportamiento de la función %(I) en una reflexión en un plano vertical, elijamos el sistema de coordenadas con origen en el centro del primer átomo y el eje z a lo largo del eje de la molécula y observemos que la reflexión en el plano vertical xz equivale al producto de la inversión respecto del origen de coordenadas y una rotación de 180º en torno del eje y. En la inversión la función %(I) queda multiplicada por 11 , donde 11 = ± 1 es la paridad del estado dado del primer átomo. Por otra parte, el resultado de aplicar a la función de onda una rotación infinitamente pequeña (y con ella, el de toda rotación finita) viene determinado completamente por el momento cinético orbital total del átomo. Por consiguiente, basta considerar el caso particular de un átomo con un solo electrón de momento cinético orbital l (y componente z del momento m = O); escribiendo en el resultado L en vez de /, obtenemos la solución buscada para un átomo cualquiera. La parte angular de la función de onda de un electrón con m = O es, salvo un coeficiente constante, P 1(cos8) (véase (28. 7)). Una rotación de 180º en torno del eje y equivale a la transformación x _,.. - x, y_,.. y, z _,.. - z o bien, en coordenadas esféricas r _,.. r, e _,.. n - e, <p _,.. n - <p. Con esto coso _,.. - cose, y la función P 1(cos 8) queda multiplicada por (- 1)1. Llegamos así a la conclusión de que, como resultado de la reflexión en un plano vertical, la función %l1 ) queda multiplicada por (- l)L 1J1 . Análogamente, %( 2) queda multiplicada por (- l)L J2 , de modo que la función de onda '!jJ = %(I) ,¡} 2) quedará en definitiva multiplicada por (- l)L 1 +L 2J/2. El término será :E+ o 1:según este factor sea 1 o - l. 2 + + Reuniendo los resultados obtenidos, vemos que del número total 2L2 1 de términos :E (de cada una de las multiplicidades posibles) L 2 1 términos serán términos :E+, y L 2 términos serán términos :E- (si (- lf 1 +L 2J/2 = + 1), o recíprocamente (si (- 1f,+L f/2 = - 1). + 2 Pasemos ahora a considerar una molécula constituida por átomos idénticos. Las reglas de composición de los spins y de los momentos orbitales de los átomos para formar los valores totales S y A de la molécula siguen siendo aquí las mismas que para una molécula constituida por átomos diferentes. La novedad consiste en que los términos pueden ser pares o impares. En relación con esto hay que distinguir dos casos: la unión de átomos que se encuentran en estados iguales y la unión de átomos que se encuentran en estados diferentes. Si los átomos se encuentran en estados distintos (1), el número total de términos posibles queda multiplicado por dos con relación al número que se obtendría en el caso de átomos diferentes. En efecto, la reflexión en el origen de coordenadas (que (') En particular, puede tratarse de la unión de un átomo neutro y un átomo ionizado. La molécula diatómica 330 coincide con el punto medio del eje de la molécula) conduce a una permutación de los estados de ambos átomos. Simetrizando o antisimetrizando la función de onda de la molécula respecto de la permutación de dichos estados, se obtendrán dos términos (con iguales A y S), de los cuales uno será par, y el otro, impar. Obtenemos así, en total, números iguales de términos pares e impares. Si, en cambio, ambos átomos se encuentran en el mismo estado, el número total de estados sigue siendo el mismo que para una molécula constituida por átomos distintos. En lo que concierne a la paridad de estos estados, el análisis (que no efectuamos aquí debido a su complejidad) (1) conduce a los resultados siguientes: Sean Ng y Nu los números de términos pares e impares con valores dados A y S. Entonces: si A es impar, Ng = Nu; si A es par y Ses par (S = O, 2, 4, ... ), Ng = N 11 +l; si A es par y Simpar (S = 1, 3, ... ), Nu = Ny+I. Finalmente, entre los términos L hay que distinguir todavía entre términos L+ y L-. Vale aquí la siguiente regla: si Ses par, N+ g = N- 11 +I = L+1, si Ses impar, N+ u= N-g+1 = L+I (donde L 1 = L 2 == L). Todos los términos L+ tienen paridad (- I)S, y todos los términos L-, paridad (- 1)8 +1. Junto a la cuestión que hemos analizado de cuál es la relación entre los términos moleculares y los términos atómicos que se obtienen cuando r -+ oo, cabe también plantearse el problema de cuál es la relación entre los términos moleculares y los términos del « átomo compuesto» que se obtendría parar--+ O, es decir, si los dos núcleos se reunieran en un mismo punto (por ejemplo, la relación entre los términos de la molécula H 2 y los del átomo He). Acerca de esto se pueden obtener sin dificultad las siguientes reglas. A partir de un término del átomo « compuesto » con spin S, momento cinético orbital L y paridad I pueden obtenerse, al « separar los átomos componentes », términos moleculares con spin igual a S y momento cinético relativo al eje igual a A = O, 1, ... , L, obteniéndose un término para cada uno de estos valores A. La paridad del término molecular coincide con la paridad I del término atómico (g para I = + 1 y u para I = - 1). El término molecular A = O será un término L+, si (- l)Lf =+l, o un término L- si (- I)LJ = -1. (') Puede encontrarse en el trabajo original: E. WIGNER, E. W1TMER. Zs.f Physik, 51,859, 1928. 331 La valencia PROBLEMAS J. Determinar los términos posibles de las moléculas H 2 , N 2 , 0 2 , Cl 2 , que se pueden obtener al unir dos átomos en sus estados normales. Solución. De acuerdo con las reglas expuestas en el texto, encontramos los siguientes términos posibles: molécula H 2 (átomos en estados 2S): » N2 ( » » » 'S): lL+a, » Cl 2 ( 21L+a, » 02 ( » » lL-u, » » 21L+a, lL-u, ªL+u, sL+a, 7L+u; 2P): » lIJa, » lIJu, 1~ª' 23L+u, aL-a, ªIIa, ªIlu, 3~u; l~a, 23L+u, 3L-a, ªIlu, ªIla, 3~u, 5L-u, 5IJa, ªP): lIJa, lIJu, 25L+a, 5IJu, 5~a· (el número delante del símbolo de un término indica el número de términos del tipo dado, si este número es mayor que la unidad) .. 2. Lo mismo para las moléculas HCI, CO. Solución. Al unir átomos diferentes, es también esencial la paridad de sus estados. De acuerdo con la fórmula (31.5), encontramos que los estados normales de los átomos H, O, C, son pares, y los de los átomos CI, impares (véanse en la tabla 3 las configuraciones electrónicas de estos átomos). Según las reglas expuestas en el texto, se encuentra: molécula HCl (átomos en estados ªSu 2P.u): 1,aL+, 1,aIJ; )) co ( )) » » ªPu, ªPu): z1.a,sL+, § 81. 1,s,sL-, zi.s.sII, ·1,s,s~. La valencia La propiedad de los átomos de unirse unos con otros para formar una molécula se describe mediante el concepto de valencia. A cada átomo se le atribuye una determinada valencia, y en la unión de los átomos sus valencias deben saturarse mutuamente, es decir, a cada enlace de valencia de un átomo debe corresponder un enlace de valencia de otro átomo. Por ejemplo, en una molécula de metano, CH.1, cuatro enlaces de valencia del átomo tetravalente de carbono se saturan por los enlaces 332 La molécula diatómica de valencia de los cu<;1.tro átomos univalentes de hidrógeno. Al pasar a la interpretación física de la valencia, comenzaremos por el ejemplo más simple - la unión <le dos átomos de hidrógeno en la molécula H 2 • Consideremos dos átomos de hidrógeno que se encuentran en el estado fundamental (2S). Al acercarlos puede obtenerse un sistema que se encuentra en el estado molecular 1 L + g o en el 3 L + u· El término singlete corresponde a la función de onda de spin antisimétrica, y el término triplete, a la función simétrica. Por el contrario, la función de onda de coordenadas en el término 1 ~ es simétrica, y en el término 3 L, antisimétrica. Es evidente que tan sólo el término 1 L puede ser el término fundamental de la molécula H 2 • En efecto, la función de onda antisimétrica cf,(r1, r2) (r1 , r2 son los vectores posición de los dos electrones) presenta siempre nodos (se anula para r1 = r2) y no puede por ello corresponder al estado más bajo del sistema. El cálculo numérico prueba que el término electrónico 1 L presenta efectivamente un mínimo acentuado, mínimo que corresponde a la formación de la molécula estable H 2 • En cambio, en el estado 3 L la energía U(r) disminuye con monotonía al aumentar la distancia entre núcleos, lo que corresponde a la repulsión mutua de los dos átomos H (1) (fig. 29). r FIG. 29 De esta manera, el spin total de la molécula de hidrógeno en el estado fundamental es igual a cero, S = O. Las moléculas de prácticamente todos los compuestos químicamente estables de los elementos de los grupos principales poseen, de hecho, (l) Prescindimos aquí de las fuerzas de atracción de van der Waals entre los átomos (véase§ 89). La existencia de estas fuerzas trae consigo la existencia de un mínimo (situado a mayores distancias) también para la curva U(r) del término 3 L. Este mínimo, sin embargo, es muy poco profundo comparado con el mínimo de la curva 1L y a la escala de la fig. 29 ni tan solo se notaría. La valencia 333 esta propiedad. Entre las moléculas inorgánicas constituyen excepción las moléculas <.liatómicas 0 2 (estado fundamental 3 ~) y NO (estado fundamental 2 II) y las moléculas triatómicas N02, Cl02 (spin total S = !). En lo que concierne a los elementos de los grupos de transición, éstos gozan de propiedades peculiares de las que hablaremos más adelante, una vez hayamos estudiado las propiedades de los elementos de los grupos principales desde el punto de vista de la valencia. La capacidad de los átomos de combinarse entre sí está ligada, por consiguiente, con sus spins (W. HEITLER y H. LoNDON, 1927). La unión se efectúa de tal manera que los spins de los átomos se compensan. Como característica cuantitativa de la capacidad de los átomos para combinarse en la molécula resulta cómodo utilizar un número entero: el doble del spin del átomo. Este número coincide con la valencia química del mismo. En relación con esto hay que tener presente que un mismo átomo puede poseer valencias distintas según sea el estado en que se encuentre. Examinemos desde este punto de vista los elementos de los grupos principales del sistema periódico. Los elementos del primer grupo (columna primera de la tabla 3, grupo de los metales alcalinos) en el estado normal tienen spin S = ! y, según esto, su valencia es igual a la unidad. Un estado excitado con spin mayor se puede obtener tan sólo excitando un electrón de una capa completa. Estos estados se encuentran por ello tan altos, que el átomo excitado no puede formar una molécula estable (1). Los átomos de los elementos del segundo grupo (segunda columna de la tabla 3, grupo de los metales alcalinotérreos) tienen spin S = O en el estado normal. Por consiguiente, en este estado dichos átomos no pueden combinarse químicamente. Sin embargo, relativamente cerca del estado fundamental se encuentra un estado excitado que posee en la capa incompleta la configuración sp en vez de la s 2 y un spin total S = 1. La valencia del átomo en este estado es igual a 2 ~ ésta es precisamente la valencia fundamental de los elementos del segundo grupo. Los elementos del tercer grupo tienen en su estado normal la configuración electrónica s2p con spin S = t Sin embargo, por excitación de un electrón de la capa s completa se obtiene un estado excitado con la configuración sp 2 y spin S = 1, estado situado cerca del normal. De acuerdo con esto, los elementos de este grupo se comportan como univalentes y como trivalentes. Los primeros elementos del mismo (B, Al) se comportan solamente como trivalentes. La tendencia a que se manifieste la valencia 1 crece al aumentar el número atómico y el TI se comporta ya en igual medida como elemento univalente y trivalente (por ejemplo, en los compuestos TlCl y TlCl3). Este comportamiento está ligado con el hecho de que, en los primeros elementos del grupo, la ventaja energética vinculada a la gran energía de enlace en (1) Acerca de los elementos Cu, Ag, Au, véase el final de este párrafo. 334 La molécula diatómica los compuestos de un elemento tri valen te (comparada con la de los compuestos de un elemento univalente) predomina sobre la energía de excitación del átomo. En los elementos del cuarto grupo el estado fundamental tiene la configuración s 2p 2 con spin I y el estado excitado próximo a él presenta la configuración sp3 con spin 2. A estos estados corresponden las valencias 2 y 4. Como en el grupo tercero, los primeros elementos del cuarto grupo (C, Si) se comportan en esencia según la valencia más alta (constituye excepción, por ejemplo, el compuesto CO), y la tendencia a que aparezca la valencia más pequeña crece al aumentar el número atómico. En los átomos de los elementos del quinto grupo el estado fundamental presenta la configuración s2p 2 con spin S = t de forma que la correspondiente valencia es igual a 3. Un estado excitado con valor mayor del spin puede conseguirse tan sólo mediante el paso de uno de los electrones a la capa con el siguiente valor del número cuántico principal. El más próximo de estos estados tiene la configuración sp2s' y spin igual a f (con s' convenimos en designar aquí el estados del electrón con número cuántico principal mayor en una unidad al del estado s). Aunque la energía de excitación de este estado es relativamente grande, el átomo excitado puede, con todo, formar un compuesto estable. De acuerdo con esto, los elementos del grupo quinto se comportan como trivalentes y pentavalentes (así, el nitrógeno en NH3 es trivalente y en HN03 pentavalente). En el sexto grupo de elementos, el espin es igual a 1 en el estado fundamental (configuración s2p 4 ), de modo que el átomo es divalente. La excitación de uno de los electrones p conduce al estado s2p 3s' con spin 2, y la ulterior excitación de un electrón s lleva al estado sp2s'p' con spin 3. En ambos estados excitados el átomo puede formar moléculas estables, manifestándose, respectivamente, como tetra y hexavalente. El primer elemento del grupo sexto (oxígeno) presenta sólo la valencia 2, mientras que los siguientes elementos del grupo presentan también valencias más elevadas (por ejemplo, el azufre en H 2S, S02, S03, es, respectivamente, di, tetra y hexavalente). En el séptimo grupo (grupo de los halógenos) los átomos son monovalentes en el estado fundamental (configuración s2p 5 , spin S = i ). Sin embargo, pueden formar compuestos estables encontrándose en estados excitados, con las configuraciones s2p 4s', s2p 3s'p', sp3s'p' 2, cuyos spins son iguales a i, !, {, respectivamente, lo que corresponde a valencias 3, 5, 7. El primer elemento del grupo (F) es siempre monovalente y los siguientes elementos poseen también valencias más elevadas .(por ejemplo, el cloro en HCl, HC102, HC103, HC104, es, respectivamente, mono, tri, penta y heptavalente). Finalmente, los átomos de los elementos del grupo de los gases nobles tienen, en su estado fundamental, completas todas sus capas (de forma que el spin S = O), y sus energías de excitación son grandes. De acuerdo con esto, la valencia es igual La valencia 335 a cero y sus elementos son químicamente inertes (1). A propósito de todas estas consideraciones, es necesario hacer la siguiente observación general. Decir que un átomo integra una molécula con una valencia propia de uno de sus estados excitados, en modo alguno significa que al separar los átomos a gran distancia obtengamos necesariamente un átomo excitado. Dicha afirmación significa solamente que la distribución de la densidad electrónica en la molécula es tal, que en torno del núcleo del átomo dado dicha distribución se aproxima a la distribución electrónica en el átomo excitado aislado. En cambio, el límite a que tiende la distribución electrónica al aumentar la distancia entre núcleos puede coresponder a átomos no excitados. Cuando los átomos se unen en una molécula, las capas electrónicas completas de los mismos varían poco. La distribución de la densidad electrónica en las capas incompletas puede, en cambio, variar esencialmente. En los casos más acusados del llamado enlace heteropolar todos los electrones de valencia pasan de unos átomos a otros, de modo que es posible decir que la molécula está constituida por iones con cargas iguales (en unidades e) a sus valencias. Los elementos del primer grupo son electropositivos ~ en los compuestos heteropolares ceden electrones, formando iones positivos. Al pasar a los grupos siguientes, el carácter electropositivo va disminuyendo, tendiendo al carácter electronegativo, característico en su mayor grado de los elementos del séptimo grupo. Acerca de la naturaleza heteropolar hay que hacer la misma observación que se hizo antes acerca de los átomos excitados en una molécula. Si la molécula es heteropolar, esto no significa en absoluto que al separar los átomos obtengamos necesariamente dos iones. Así, a partir de la molécula KCl obtendríamos, en efecto, iones K + y c1-, pero la molécula NaCI da, en el límite, los átomos neutros Na y Cl (debido a que la afinidad del cloro para un electrón es mayor que el potencial de ionización del potasio, pero menor que el potencial de ionización del sodio). En el caso límite opuesto, el del llamado enlace homopolar, los átomos en la molécula se conservan en promedio neutros. Las moléculas homopolares, en contraste con las heteropolares, no poseen un momento dipolar apreciable. La diferencia entre los tipos de enlace heteropolar y homopolar es puramente cualitativa y pueden darse todos los casos intermedios. 1 ( ) Los elementos Xe, Rn (y con mayor dificultad, el Kr) forman, a pesar de todo, compuestos estables con el flúor. Es posible que estas valencias se deban a la transición de los electrones desde una capa interior completa a estados no ocupados del tipof(o d). relativamente próximos desde el punto de vista energético. Señalaremos también el particular efecto atractivo que se manifiesta en la interacción de un átomo de gas noble con un átomo excitado del mismo elemento. Este efecto se debe a la duplicación del número de estados posibles que se obtiene al unir dos átomos idénticos que se encuentran en estados distintos (véase § 80). El paso de la excitación de un átomo al otro substituye en este caso a la interacción de intercambio que conduce a la valencia ordinaria. Un ejemplo de tales moléculas Jo ofrece la molécula He2. Este mismo tipo de enlace se presenta en los iones moleculares constituidos por dos átomos idénticos (por ejemplo, H 2+). 336 La molécula diatómica Pasemos ahora a los elementos de los grupos de transición. Los elementos de los grupos del paladio y del platino difieren poco de los elementos de los grupos principales en lo que concierne a sus propiedades de valencia. La diferencia consiste en que, gracias a la posición relativamente profunda de los electrones d en el átomo, su interacción con los otros átomos de la molécula es débil. De aquí resulta que entre los compuestos de estos elementos se encuentran con relativa frecuencia compuestos « no saturados», cuyas moléculas tienen un spin diferente de cero (de hecho, no mayor que f). Cada uno de estos elementos puede comportarse con distintas valencias, y éstas pueden diferir ahora en una unidad, y no tan sólo en dos unidades como en el caso de los elementos de los grupos principales (para los que el cambio de valencia se debe a la excitación de un electrón cuyo spin estaba compensado, y como consecuencia de lo cual quedan libres de pronto los spins de un par de electrones). Los elementos del grupo de las tierras raras ·se caracterizan por la existencia de una capa f incompleta. Los electrones f se encuentran a una profundidad mucho mayor que los electrones d, y debido a ello no contribuyen a la valencia. Como consecuencia, la valencia de los elementos de ferras raras viene determinada solamente por los electrones s y p de las capas incompletas (1 ). Sin embargo, hay que tener en cuenta que, en la excitación de un átomo, los electrones f pueden pasar a estados s y p, aumentando así la valencia en una unidad. Por ello, también los elementos de tierras raras presentan valencias que difieren en una unidad (de hecho, todos son tri y tetravalentes). Los elementos del grupo del actm10 ocupan una pos1c10n muy particul~r. El Ac y el Th no contienen, en general, electrones f y a su valencia contribJyen los electrones d; por consiguiente, en sus propiedades químicas son análogos a los elementos de los grupos del paladio y del platino, y no a los elementos de tierras raras. En lo que concierne al uranio, aunque en el estado normal el átomo U contiene electrones f, en sus compuestos tampoco posee electrones de este tipo. Finalmente, los átomos de los eJementos Np, Pu, Am y Cm conservan electrones f incluso en los compuestos, pero los electrones que intervienen en la valencia son electrones s y d. En este sentido se parecen al uranio. El número máximo posible de electrones s y d « no apareados» es igual, respectivamente, a I y 5; por ello la valencia máxima de los elementos en el grupo del actinio es igual a seis, mientras que la valencia máxima de los elementos de tierras raras (con electrones s y p que contribuyen a la valencia) es igual a 1 +3 = 4. Los elementos del grupo del hierro ocupan, desde el punto de vista de sus propiedades de valencia, una posición intermedia entre los elementos de tierras raras (1) Los electrones d que encontramos en las capas incompletas de los átomos de algunos elementos de tierras raras carecen de importancia, ya que de hecho estos átomos forman siempre parte de un compuesto en estados excitados en los que no existen electrones rl La valencia 337 y los elementos de los grupos del paladio y del platino. En sus átomos, los electrones d están situados a una profundidad relativamente grande y en toda una serie de compuestos no toman parte en el enlace de valencia. En estos compuestos, por consiguiente, los elementos del grupo del hierro se comportan de manera semejante a los elementos de tierras raras. A este tipo corresponden los compuestos del tipo iónico (por ejemplo, FeCl 2, FeCl3), en los que el átomo del metal interviene en la forma de simple catión. De manera análoga a los elementos de tierras raras, los elementos del grupo del hierro pueden presentar en estos compuestos las más diferentes valencias. Otro tipo de compuestos de los elementos del grupo del hierro son los llamados compuestos complejos. Éstos se caracterizan por el hecho de que el átomo del ele- mento de transición interviene en la molécula, no en la forma de un ion simple, sino que es parte de un ion complejo (por ejemplo, el ion Mnü; en KMn04, el ion Fe(CN)f- en K 4 Fe(CN) 6 • En tales iones complejos, los átomos están situados más próximos entre sí que en los compuestos iónicos simples, y en ellos los electrones d participan en el enlace de valencia. De acuerdo con esto, los elementos del grupo del hierro se comportan en los compuestos complejos de manera análoga a los elementos de los grupos del paladio y del platino. Finalmente, es necesario señalar que los elementos Cu, Ag y Au, que hemos atribuido en el § 73 a los grupos principales, en toda una serie de compuestos se comportan como elementos de transición. Estos elementos son capaces de presentar valencias mayores que la unidad debido a la transición de electrones de la capa d a la capa p, próxima en energía (por ejemplo, en el Cu, de 3d a 4p). En tales compuestos los átomos tienen una capa d incompleta y se comportan así como elementos de transición (el Cu, como elemento del grupo del hierro, y el par Ag, Au, como elementos del grupo del Pd y del Pt). PROBLEMA Determinar los términos electrónicos del ion molecular H 2 + que se obtienen al unir un átomo de hidrógeno en el estado normal con un ion H + cuando la distancia R entre núcleos es grande (comparada con el radio de Bohr). Solución. Este problema, por su planteo, es análogo al problema 3 del § 50: en vez de dos pozos de potencial unidimensionales tenemos aquí dos pozos de tres dimensiones (en torno de los dos núcleos) con una simetría axil común respecto de la recta que une los núcleos. El nivel E 0 = - i (nivel fundamental del átomo de hidrógeno) (1) se desdobla en dos niveles Ug(R) y Uu(R) (términos 2~u + y 21:u +), que corresponden a las funciones de onda electrónicas 1 lfg,u(x,y,z) = (') Utilizamos aquí unidades atómicas. V 2 [ifio(x,y,z) ± i/io(-x,y,z)], 338 La molécula diatómica simétrica y antisimétrica respecto del plano x = O perpendicular en su punto medio al segmento determinado por los núcleos (que se encuentran en los puntos x = ±R/2 del eje x). 1JJo(X, y, z) es aquí la función de onda del electrón en uno de los pozos de potencial. De manera análoga a como se procedió en el problema 3 del § 50, obtenemos U0 ,u(R)-Eo = + donde la integración se efectúa en el plano x ff éifao ifaoa:; dy dz, (1) = O. Para la función "Po (que corresponde al movimiento, por ejemplo, en torno del núcleo 1 situado en el punto x = R/2) buscaremos una expresión de la forma: (2) donde a es una función lentamente variable (en el átomo de hidrógeno sería a debe satisfacer la ecuación de Schrodinger l.6ifa+ ( -!- -1 + -1 + -1 ) 1P = o, R r1 = 1). La función "Po (3) r2 (ri, r 2 son las distancias del electrón a los núcleos 1 y 2); como energía total del electrón figura en esta ecuación la diferencia E 0 -1/R, ya que en E 0 se incluye también la energía 1/R del campo de Coulomb repulsivo de los núcleos. Dado que la función "Po disminuye ripidamente al alejarnos del eje x, en la integral (1) solamente cuenta el dominio de valores y, z pequeños (comparados con R). Para y, z ~ R, la substitución de (2) en (3) da: ca a a -+-----=O; óx fR+x R (se ha prescindido de las derivadas segundas de la función lentamente variable a y hemos hecho r 2 ,....._,}R + x). La solución de esta ecuación que tiende a la unidad para X-* R/2 (es decir, cerca del núcleo 1), es a = -3!!__ exp (--=R+2x R La fórmula (1) nos da ahora: f G() U0 ,u-Eo = 4 +1re R/2 +(2/e)Re-R. -!) . Estructuras de bibración y rotación de los términos singlete 339 A distancias suficientemente grandes, esta expresión, que disminuye exponencialmente, llega a ser menor que el efecto de segundo orden respecto de 1a interacción dipolar del átomo H con el ion H+. Dado que la polarizabilidad del átomo de hidrógeno en el estado normal es igual a 9/2 (véase (77.9)), y que el campo del ion es ~- = 1/R2, la correspondiente energía de interacción es igual a - 9/4R4 y teniéndola en cuenta resulta: Uu,u(R)-Eo = 2 9 e 4R4 + -Re-R- - . (4) El segundo término es comparable con el primero tan sólo para R = 10,8. Indicaremos también que el término Uu presenta para R = 12,6 un mínimo, igual a -5,8· l0-5u.a. (- l,6· 10-3 eV)(1) § 82. Estructuras de vibración y rotación de los términos singlete de una moJécuJa diatómica Conforme se indicó ya al principio de este capítulo, la gran diferencia entre la masa de los núcleos y la de los electrones ofrece la posibilidad de descomponer el problema que plantea la determinación de los niveles energéticos de una molécula en dos partes. Se determinan primero los niveles de energía del sistema de electrones, suponiendo los núcleos inmóviles, como función de la distancia entre estos últimos (términos electrónicos). Se puede estudiar luego el movimiento de los núcleos para un estado electrónico dado; esto se reduce a considerar los núcleos como partículas que interactúan entre sí según la ley Un(r ), donde Un es el correspondiente término electrónico. El movimiento de la molécula se compone de su movimiento de translación en conjunto y del movimiento de los núcleos respecto de su centro de masas. El movimiento de traslación carece de interés, claro está, y podemos suponer que el centro de masas se encuentra en reposo . .Para facilitar la exposición estudiaremos primero los términos electrónicos en los que el spin total S de la molécula es igual a cero (términos singlete). El problema del movimiento relativo de dos partículas (dos núcleos) que interactúan según una ley U(r) se reduce, conforme sabemos, al problema del movimiento de una partícula de masa M (masa reducida de las dos partículas) en un campo central U(r). La función U(r) representa aquí la energía del término electrónico considerado. Pero el problema del movimiento en un campo central U(r) se reduce, a su vez, a un problema de movimiento unidimensional en un campo con una energía efectiva igual a la suma de U(r) y la energía centrífuga. Designemos por K el momento cinético total de la molécula, resultante del momento cinético orbital de los electrones L y del momento cinético de rotación de los núcleos. El operador de la energía centrífuga de éstos será entonces B(r)(R-t)2, Este mínimo, ligado con las fuerzas de van der Waals, es muy poco profundo comparado ~º!1 el mínimo principal del término Ug(R), que corresponde al estado normal del ion estable Ht·: este ultimo mínimo se encuentra en R = 2,0 y su valor es de 0,60 u. a. (- 16,3 eV). 1 ( ) 340 La molécula diatómica donde hemos introducido la notación B(r) = li 2/2Mr 2 (82.1) que resulta cómoda para simplificar las fórmulas de la teoría de las moléculas diatómicas. Promediando esta magnitud (para un valor dado r), obtenemos la energía centrífuga como función de r, energía que debe conducir a la energía potencial efectiva UK(r ). De esta manera U K(r) = U(r)+B(r)(K-L)2, donde el trazo superior significa el promedio ya indicado. Desarrollando el paréntesis y recordando que el cuadrado K2 del momento cinético total, que se conserva, tiene un valor determinado, igual a K(K + 1) (K es un número entero), escribiremos esta expresión en la forma: UK(r) = U(r)+B(r)K(K+l)+B(r)(L2-2L. K); (82.2) (se ha prescindido del trazo sobre la magnitud conservativa K). En un estado con valor determinado de Lz = A, los valores medios de las otras dos componentes del momento cinético orbital son ·-iguales a cero: L x = LY = O; esto se sigue directamente de que en la representación en la que Lz es diagonal los elementos de matriz diagonales de los operadores ix Ly son iguales a cero(véase §27). Por ello, el valor medio del vector L está dirigido según el eje z y podemos escribir L =nA, donde n es e] vector unitario correspondiente al eje de la molécula. Además, en la mecánica c1ásica, el momento cinético de un sistema constituido por dos partículas (los núc1eos) es perpendicular a la recta que las une; en la mecánica cuántica ocurrirá lo mismo para el operador del momento cinético. Podemos escribir, por lo tanto, (1t-L). n = O, ó 1t. n =L. n. De aquí se sigue para los valores propios K.n =L.n =A. (82.3) Así, pues, la proyección del momento cinético total K sobre el eje de la molécula resulta también igual a A. De aquí se sigue que en un estado con valor -dado A, el número cuántico K puede tomar valores sólo a partir de .\: K;>A. Finalmente, substituyendo en (82.2) L-K = (82.4) An·K = .\ 2 , obtenemos: U K(r) = U(r)+B(r)K(K+ l)+B(r)(L2 -2A2 ). (82.5) El último término del segundo miembro es una cierta función de r que depende únicamente del estado electrónico y que no contiene el número cuántico K. Esta función se puede incluir en la energía U(r), con lo cual (82.5) adopta la forma: Estructuras de vibración y rotación de los términos singlete U x(r) = U(r)+B(r)K(K+ 1). 341 (82.6) Resolviendo la ecuación unidimensional de SCHRODINGER con esta energía potencial, obtenemos toda una serie de niveles energéticos. Se suele convenir en numerar estos niveles (para cada K dado) en orden creciente mediante un número v que toma los valores v = O, 1, 2, ... ; v = O corresponde al nivel más bajo. El movimiento de los núcleos conduce, pues, al desdoblamiento de cada término electrónico en una serie de niveles que se caracterizan por los valores de los dos números cuánticos K y v. El número de estos niveles (para cada término electrónico dado) puede ser tanto finito como infinito. Si el estado electrónico es tal que en el límite r ---+ = la molécula se convierte en dos átomos neutros aislados, la energía potencial U(r) (y con ella también UK(r)) tiende a un límite constante U(=) parar~ = (límite que es la suma de las energías de los dos átomos aislados) más rápidamente que 1/r (véase § 89). El número de niveles en este campo es finito (véase § 18); pero la verdad es que, de hecho, en las moléculas resulta ser muy grande. Los niveles están distribuidos de tal manera que para cada valor dado K se tiene un número determinado de niveles (que difieren en el valor de v), número de niveles que va disminuyendo al aumentar K hasta que se alcanza un valor de este número para el cual los niveles ya no existen. Pero si para r ---+ = la molécula se descompone en dos iones, a grandes distancias la diferencia U(r) - U(=) pasa a ser la energía de atracción de los mismos de acuerdo con la ley de Coulomb ( ,.._, 1/r). En este campo se tiene un número infinito de niveles, que se adensan a medida que nos acercamos al valor límite U(=). Obsérvese que el primer caso se da para la mayor parte de las moléculas en el estado normal; tan sólo un número relativamente pequeño de moléculas dan lugar a iones al separar los núcleos. La dependencia de los niveles energéticos con relación a los números cuánticos no se puede calcular por completo de manera general. Este cálculo es posible tan sólo para niveles cuya excitación es relativamente débil y que se encuentran no muy por encima del nivel fundamental (1). A estos niveles corresponden pequeños valores de los números cuánticos K y v. En la mayor parte de los casos son precisamente estos niveles los que hay que considerar al estudiar los espectros moleculares, por lo que presentan particular interés. El movimiento de los núcleos en estados débilmente excitados se puede caracterizar como pequeñas vibraciones respecto de la posición de equilibrio. De acuerdo con esto, podemos desarrollar U(r) en serie de potencias de la diferencia~ = r - re, donde re es el valor de r para el que U(r) presenta el mínimo. Dado que U'(re) = O, hasta términos de segundo orden se tiene U(r) = Ue+}Mw/t2, (1) Se trata siempre de niveles que se obtienen a partir de un mismo término electrónico dado. 342 La molécula diatómica donde Ue = U(re) y we es la frecuencia de las vibraciones (1). En el segundo término de (82.6) - la energía centrífuga - basta hacer r = re, dado que dicho término contiene ya la pequeña cantidad K(K 1). De esta manera tenemos: + (82.7) donde Be=· k 2/2Mr e2 = li. 2/21 es la llamada constante de rotación (I el momento de inercia de la molécula). = Mre 2 es Los dos primeros términos de (82. 7) son constantes y el tercero corresponde a un oscilador armónico unidimensional. Por ello podemos escribir, sin más, para los niveles de energía buscados: (82.8) Así, pues, en la aproximación considerada los niveles energéticos se componen de tres partes independientes: (82.9) Aquí Ec1 = Ue es la energía electrónica (que incluye la energía de la interacción coulombiana de los núcleos para r = re); (82.10) es la energía de rotación (o rotatoria), debida a la rotación de la molécula (2); (82.11) es la energía de vibración de los núcleos en la molécula. El número v numera, de acuerdo con la definición adoptada, los niveles que corresponden a un valor dado de K en orden creciente; este número se llama número cuántico de vibración (o vibratorio). Para una forma dada de la curva U(r) de la energía potencial, la frecuencia we es inversamente proporcional a Por ello también los intervalos b.Ev entre niveles de vibración son proporcionales a 1/V M. Los intervalos b.Er entre niveles de rotación contienen en el denominador el momento de inercia /, es decir, son proporcionales a 1/M. En cambio, los intervalos b.Eez entre niveles electrónicos, al igual que los propios niveles, no contiene M en absoluto. Dado que m/ M (m es la masa del electrón) es un pequeño parámetro en la teoría de las moléculas diatómicas, vemos que VM. {') En la teoría de las moléculas diatómicas se adoptan determinados símbolos, a los que nos atenemos aquí. 2 ( ) Un sistema constituido por dos partículas rígidamente unidas entre sí y que se encuentra en rotación se suele llamar rotador. La fórmula (82. JO) determina los niveles cuánticos de la energía de un rotador. Las funciones de onda de los estados estacionarios del mismo corresponden, evidentemente, al caso A = O y coinciden con los armónicos esféricos ordinarios (véase el problema de este párrafo). E.dructuras de bibración y rotación de los términos singlete 343 Así, pues, la distribución de niveles energéticos de la molécula posee un caracter peculiar. El movimiento vibratorio de los núcleos desdobla los términos electrónicos en niveles que están situados relativamente cerca unos de otros. Estos niveles experimentan, a su vez, un desdoblamiento todavía más fino bajo la acción del movimiento de rotación de la molécula (1). En las aproximaciones siguientes, la descomposición de la energía en una componente de vibración y otra de rotación independientes resulta ya imposible; aparecen términos de rotación-vibración que contienen a la vez K y v. Calculando las siguientes aproximaciones, obtendríamos los niveles E en la forma de series de potencias de los números cuánticos K y v. Calculemos aquí la aproximación que sigue a la (82.8). Hay que continuar para ello el desarrollo de U(r) en potencias de ; hasta los términos de cuarto orden (cf. el problema acerca del oscilador anarmónico en el § 38). De acuerdo con esto, desarrollaremos la energía centrífuga hasta los términos que incluyen ; 2 • Se obtiene entonces: U x(r) = Ve+l¿Mw/t 2 +(ñ,2J2Mr/)K(K+ l)-ag8+bt4-(n2/Mr/)K(K+ l)t+(3n 2/2Mr6 4)K(K+ l)t2• (82.12) Calculemos ahora la corrección a los valores propios (82.8) mediante la teoría de perturbaciones considerando los cuatro últimos términos (82.12) como operador de perturbación. Al hacerlo, en los términos con ; 2 y ; 4 basta limitarse a la primera aproximación de la teoría de perturbaciones, y en los términos con ; y ; 3 hay que calcular la segunda aproximación, ya que los elementos de matriz diagonales de ; y ; 3 se anulan idénticamente. Todos los elementos de matriz necesarios para el cálculo se obtuvieron en el§ 23 y en el problema 3 del§ 38. Como resultado de los cálculos se obtiene una expresión que se suele escribir en la forma: (82.13) donde (82.14) Las constantes Xe, Be, oce, De están ligadas con las constantes que intervienen en (82.12) por las relaciones B6 = n /21, 2 D6 = 4Be3/n 2 w6 2 , Los términos que no dependen ni de v ni de K se incluyen en Eel· (1) Como ejemplo indicaremos los valores Ue, ñwe y Be (en electrón-voltios) para algunas moléculas: H2 N2 02 4,7 7,5 5,2 -Ue 0,54 0,29 0,20 hwe 7•6 0,25 0,18 10 3 X Be I,a molécula diatómica PROBLEMA Determinar la parte angular de la función de onda de una molécula diatómica cuyo spin es igual a cero (F. REICHE, 1926). Solución. Las funciones buscadas no son sino las funcione propias del momento cinético total de 1a molécula. K. El operador momento cinético total ef la suma donde p es el impulso del movimiento relativo de los núcleos, r es el vector posición que éstos determinan y ra, Pa son los vectores posición y los impulsos de los electrones (respecto del centro de masas de la molécula). Introduciendo el ángulo polar e y el acimut ef, del eje de la molécula respecto de un sistema.de coordenadas fijo x, y, z, tenemos para las componentes del operador K expresiones análogas a las (26.14-15), de forma que (8' 8') K+ =él> -+icot8- +l+, 88 8</> 8' 8') +L ' 1{_ = e-i<P(--+i cot (J - Kz -i-+lz, 8() Ó<p 8' = 8</J (1) j son los operadores del momento cinético de los electrones; los apóstrofos en las que la derivación debe efectuarse manteniendo constantes Xa, Ya, za,. a;ae y 8/8</, indican Introduzcamos, además del sistema de coordenadas fijo x, y, z, un sistema móvil,;, r¡, !; que tiene el mismo origen, cuyo eje !; coincide con el eje de la molécula y cuyo eje ,; se encuentra en el plano x, y. Las coordenadas $a, t'/a, Ca de los electrones en este sistema están ligadas con las coordenadas Xa, Ya, za por las relaciones fa = -x 0 sen <f>+Ya cos<f,, 7Ja = -Xa cosB cos</>-Ya cos8sen<f,+zasen8, {a= xasenB cos<f,+y0 sen8sen<f,+za cosO. Transformemos mediante estas fórmulas las derivadas: Estructuras de vibración y rotación de lo.~ términos singlete - ó ó 345 ó =sen8-+cos8-, etc., OZa ª'ª Ó~a donde 8/80 y 8/84> (sin apóstrofo) representan la derivación manteniendo constantes .;a, r¡a, ;°a. Se obtiene así para los operadores de las componentes del momento cinético total respecto del sistema fijo las expresiones: (-+i a ctg8 -a) +--lt;, 88 84> sen8 ( a a) K- = e-i</> --;:;-+ictg8- +--lt;, l Kz = J ei</> K+ = ei</> e-i<f> 08 8</> sen8 - i a¡a4>, (2) donde es el operador del momento cinético de los electrones respecto del eje de la molécula. Sea (3) la función de onda de un estado con valores determinados del módulo K y de la componente-z, M x, del momento cinético total de la molécula y del valor A de la componente-( del momento cinético de los electrones (n representa el conjunto de los demás números cuánticos que determinan el estado de la molécula). 'Pn.l\.K es la función de onda electrónica, que depende de r como parámetro,Qn.l\.K es la « parte radial» de la función de onda de los núcleos, 0.1\.KMx es la función buscada del ángulo e; la dependencia de '1/J respecto del ángulo </> es evidente: <J>M K (<p) = 1 --eiMKr/>. ,V(21r) 346 La molécula diatómica Al aplicar a la función (3) los operadores de modo que /(_+ Í{z, L, cabe substituirlos por sus valores propios Mx, A, 8 ) ei</> = ei</> ( --MK ctge +--A, sene 8() 8 ) e-it/> /(__ = e-i</> ( ---MKctgfJ +--A. sene 8() El resto del razonamiento corresponde exactamente al que se desarrolló al final del § 28. Al aplicar el operador Í{+ a la función '1/JnAKK (con Mx = K) se obtiene el valor cero; de aquí se sigue la ecuación = O, ( !_-Kctg8+~)@AKK 88 sene cuya solución es (1): @AKK = ( - i)I{ {2K+l)! J 22K+I(K + A)!(K -A)! X (1- cos 8)<1{-A)/2(1 + cos 8)(K+A)/2· (4) ' (la función está normalizada por la condición 1T f eiKK sene dB o = 1, la integral de normalización se reduce a la función B de Euler). Las demás funciones se calculan luego mediante la fórmula: (2K)l(K-MK)! ------@AKM = Í(_K-MK@AKK, (K+MK)! K J y se obtiene finalmente: .J @AKMx = ( - t)K (2K+l)!(K+MK)I (K+A)!(K-A)!(K-MK)! E) x [ (- 8 cos8 Para A = (1-cos8)(·\-Jh)/2 X X (1 +cosB)<A+MK)/2 )K-MK ] (1-cos B)K-A(I+cosO)K+A . O estas funciones se reducen, como debe ser, a los armónicos esféricos ordinarios E>oKM K = constante x pMK( cos 8) K ' y son las funciones de onda del rotador (funciones propias del momento cinético libre K). (') La elección del factor de fase está de acuerdo con la definición de las funciones propias del momento cinético libre (§ 28), que se obtienen para _\ = O. Términos multiplete § 83. 347 Términos multiplete. Caso a Pasemos ahora a la cuestión de cómo clasificar los niveles moleculares con spin S no nulo. En la aproximación de orden cero, y prescindiendo por completo de los efectos relativistas, la energía de la molécula, como la de cualquier sistema de partículas, no depende de la dirección del spin (spin «libre»), lo que conduce a una degeneración de los niveles de orden 2S + 1. Pero si se tienen en cuenta las interacciones relativistas, los niveles degenerados se desdoblan, y como resultado de ello, la energía pasa a depender del valor de la proyección del spin sobre el eje de la molécula. Llamaremos interacción spin-eje a las interacciones relativistas en las moléculas. El papel principal lo representa en este caso (al igual que en el de los átomos) la interacción de los spins con el movimiento orbital de los electrones (1). El carácter y la clasificación de los niveles moleculares depende esencialmente del papel relativo que desempeñan la interacción del spin con el movimiento orbital, de una parte, y la rotación de la molécula, de otra. El papel de esta última se caracteriza por las distancias entre niveles de rotación vecinos. De acuerdo con esto, hay que considerar dos casos límite. En uno de ellos la energía spin-eje es grande comparada con las diferencias entre los niveles de rotación, y en el otro, es pequeña. El primer caso se suele llamar, según Hund, caso a (o enlace tipo a), el segundo, caso b. El que se da con mayor frecuencia es el caso a. Constituyen una excepción los términos k, en los que esencialmente se presenta sólo el caso b debido a que el efecto de la interacción spin-eje es para ellos pequeño (véase más adelante) (2). Para los demás términos, el caso b se encuentra a veces en las moléculas más ligeras como consecuencia de que la interacción spin-eje es aquí relativamente débil y las distancias entre niveles de rotación son grandes (momento de inercia pequeño). Claro está, son también posibles casos intermedios entre el a y el b. Tampoco hay que perder de vista que un mismo estado electrónico puede pasar de manera continua del caso a al caso b al variar el número cuántico de rotación. Ello se debe a que las distancias entre niveles de rotación vecinos crecen al aumentar el número cuántico de rotación y, en consecuencia, para grandes valores de éste dichas distancias pueden llegar a ser grandes comparadas con la energía de enlace spin-eje (caso b), incluso si para los niveles de rotación bajos se daba el caso a. (1) Además de las interacciones spin-órbita y spin-spin existe también la interacción del spin y del n:1?Vimiento orbital de los electrones con la rotación de la molécula. Sin embargo, esta parte de la interacc1on es muy pequeña y el considerarla sólo puede presentar interés para términos con spin S = ! (véase § 84). 2 ( ) El término electrónico normal de la molécula 0 2 (término 3 ~ ) es un caso singular. En él se pre<;enta un tipo de enlace que es intermedio entre el a y el b (véase el problema 3 del § 84). La molécula diatómica 348 En el caso a, la clasificación de los niveles difiere en esencia poco de la clasificación de ]os términos con spin igual a cero. Consideremos primero los términos el~trónicos para núcleos en reposo, es decir, prescindiendo por completo de la rotación; junto a la proyección .\ del momento orbital de los electrones, hay que considerar ahora la proyección del spin total sobre el eje de la molécula; esta proyección se designa por I: (1 ); toma los valores S, S - 1, ... , - S. Convendremos en considerar I: positiva cuando el sentido de la proyección del spin coincida con el sentido del momento cinético orbital respecto del eje (recordemos que .\ representa el valor absoluto de este último momento). Las cantidades .\ y I: se componen para formar el momento cinético total de los electrones respecto del eje de la molécula: Q = A+~; (83.1) !l toma los valores .\ +s.. \ +s - 1, ... , .\ - S. Así, pues, el término electrónico con momento cinético orbital .\ se desdobla en 2S + I términos que difieren en los valores de n (este desdoblamiento se llama, como en el caso de los términos atómicos, estructura fina o desdoblamiento de los niveles electrónicos en multipletes). El valor n se suele indicar en forma de subíndice en el símbolo del término: así. para.\= I y S = t obtenemos los términos 2 11 112 , 2 11:312 • El tener en cuenta el movimiento de los núcleos conduce, para cada uno de estos términos, a la aparición de estructuras de vibración y de rotación. Los diferentes niveles de rotación se caracterizan por los valores del número cuántico J, es decir, del momento cinético total de la mo.lécula, que incluye los momentos cinéticos orbital y de spin de los electrones y el momento cinético de rotación de los núcleos (2). Este número toma valores enteros a partir de I nJ: l>IDJ, (83.2) (generalización evidente de la regla (82.4)). Deduzcamos ahora las fórmulas cuantitativas que determinan los niveles moleculares en el caso a. Consideremos ante todo la estructura fina de un término electrónico. Al estudiar en el 72 la estructura fina de los términos atómicos, utilizamos la fórmula (72.4) según la cual el valor de la interacción spin-órbita es proporcional a la proyección del spin total del átomo sobre el vector momento cinético orbital. De manera completamente análoga, la interacción spin-eje en una molécula diatómica (promediada respecto del estado electrónico para una distancia dada r entre núcleos) es proporcional a la proyección }: del spin total de la molécula sobre su * 1 ( ) ¡No se confunda con el símbolo de los términos con .\ = O! (2) La notación K sigue representando, conforme se ha convenido, el momento cinético total de la molécula sin tener en cuenta el spin. En el caso a el número cuántico K no existe, ya que el momento cinético K no se conserva ni tan sólo aproximadamente. Términos multiplete 349 eje, de manera que podemos escribir el término electrónico desdoblado en la forma: U(r)+A(r)~, donde U(r) es la energía del término de partida (no desdobladq) y A(r) es una cierta función de r; esta función depende del término inicial (en particular., del valor .\), pero no depende de ~- Dado que de ordinario se utiliza el número cuántico n y no el ~' en vez de A~ conviene más escribir A n; estas expresiones difieren en la can tidad A.\, que se puede incluir en U(r). De esta manera tenemos para un término electrónico la expresión U(r)+A(r)D. (83.3) Obsérvese que las componentes del término desdoblado están uniformemente distanciadas entre sí - la distancia entre dos componentes vecinas (con valores n que difieren en una unidad) es igual a A(r) y no depende de n. Mediante consideraciones generales es fácil ver que para los términos 1: la cantidad A es igual a cero. Apliquemos para ello la operacivn de cambiar el signo del tiempo. La energía debe entonces conservarse invariable, mientras que el estado de la molécula varía en el sentido de que la dirección del momento cinético orbital y del spin respecto del eje se cambia por la opuesta. En la energía A(r)}:~ cambia el signo de I:, y para que se conserve invariable, es necesario que A(r) cambie de signo. Si .\ =/= O, no cabe sacar de aquí ninguna conclusión respecto del valor de la cantidad A(r), ya que esta última depende del momeni.0 cinético orbital, que cambia de signo. Si, en cambio, .\ = O, es siempre posible afirmar que A(r) no cambia y, por consiguiente, debe anularse idénticamente. De esta manera, para los términos I: la interacción spin-órbita, en primera aproximación, no conduce a desdoblamiento; se produciría un desdoblamiento (proporcional a 1:2) solamente si se tuviera en cuenta esta interacción en la aproximación de segundo orden, o la interacción spin-spin en la aproximación de primer orden, y sería relativamente pequeño. Con esto está relacionado el hecho que hemos señalado ya, a saber, que para los términos ~ se presenta de ordinario el caso b. Una vez determinado el desdoblamiento en un multiplete, se puede tener en cuenta la rotación de la molécula como una perturbación de manera completamente análoga a como se procedió al principio del párrafo anterior. El momento cinético de rotación de los núcleos se obtiene a partir del momento cinético total restando de éste el momento cinético orbital y de spin de los electrones. Por consiguiente, el operador energía centrífuga tiene ahora la forma: B(r)(j-L-S)2. Promediando esta magnitud respecto del estado electrónico y sumando con (83.3), obtenemos la energía potencial efectiva buscada UJ(r): La molécula diatómica 350 UJ(r) = U(r)+A(r)O+B(r)(J-L- S) 2 = U(r)+A(r)O+B(r)[J 2 -2J. (L+ S)+L2 +2L. s+ S2 ]. ~ El valor propio de J 2 es J(J -t- 1). Además, por las mismas razones que en el tenemos: L y también {j-L-S) . n = = nA. S = n~, 82, (83.4) O . de donde resulta para los valores propios: J. n = (L+ S) . n = A+~ = Q. (83.5) Substituyendo estos valores encontramos UJ(r) = U(r)+A(r)O+B(r)[J(] + 1)-202 +L2+2L. S+ S2 ]. El promedio respecto del estado electrónico se efectúa mediante las funciones de onda de la aproximación de orden cero (1). Pero en esta aproximación se conserva el valor del spin; por consiguiente S 2 = S(S+I). La función de onda es, en cambio, el producto de la función de spin por la función de las coordenadas; por ello el promedio de los momentos cinéticos L y S se efectúa con independencia e] uno del otro y obtenemos: L. S = An. S = AL. Finalmente, el valor medio del cuadrado de] momento cinético orbital V no depende del spin y es una función de r característica del término electrónico dado (no desdoblado). Todos los términos que son funciones de r y que no dependen ni de J ni de ~ se pueden incluir en U(r), y el término proporcional a L (o, lo que es Jo mismo, a !1) puede incluirse en la expresión A(r)!!. Tenemos así para la energía potencial efectiva la fórmula UJ(r) = U(r)+A(r)O+B(r)[J(]+ 1)-202]. (83.6) Los niveles de energía de la molécula pueden obtenerse a partir de aquí siguiendo el mismo método que se aplicó en el § 82 a la fórmula (82.6). Desarrollando A(r) y U(r) en serie de potencias de ~ y conservando en el desarrollo de U(r) los términos hasta el segundo orden inclusive, y en los desarrollos del segundo y del tercer término, solamente los términos de orden cero, obtenemos los niveles de energía en la forma: (83.7) (l) De orden cero tanto con relación al efecto de rotación de la molécula, como a la interacción spin-eje. Términos mriltiplete 351 donde Ae = A(re); las Be son constantes características del término electrónico dado (no desdoblado). Continuando el desarrollo, obtendríamos toda una serie de términos con potencias más elevadas de los números cuánticos; no nos detendremos en escribirlos aquí. § 84. Términos multiplete. Caso b Pasemos ahora al caso b. El efecto de rotación de la molécula predomina aquí sobre el desdoblamiento en multiplete. Por ello debemos considerar primero el efecto de la rotación, prescindiendo de la interacción spin-eje, y únicamente después debe tenerse en cuenta esta última en forma de perturbación. En una molécula con spin «libre» se conserva, no solamente el momento cinético total J, sino también la suma del momento cinético orbital de los electrones K y el momento cinético de rotación de los núcleos, suma ligada con J por la relación J = K+S. (84.1) El número cuántico K distingue los diferentes estados de la molécula en rotación con spin libre que se obtienen a partir del término electrónico dado. La energía potencial efectiva UK.(r) en un estado con valor dado de K se determina, evidentemente, por la misma fórmula (82.6) que en el caso de los términos con S = O: U K(r) = U(r)+B(r)K(K+ 1), (84.2) donde K toma los valores .\, .\ + 1, ... Jncluir la interacción spin-eje conduce a un desdoblamiento de cada término en 2S + 1 términos, en general (o en 2K + 1, si K < S), que difieren en los valores del momento cinético J (1 ). Según la regla general de composición de momentos, el número J toma (para un K dado) valores desde K +s a \K - SJ: IK-S/ <J < K+s. (84.3) Para calcular la energía de desdoblamiento (en la primera aproximación de la teoría de perturbaciones) hay que determinar el valor medio del operador energía de la interacción spin-eje relativo al estado correspondiente a la aproximación de orden cero (respecto de esta interacción). En el caso considerado esto significa promediar tanto respecto del estado electrónico, como respecto de la rotación de la molécula (parar dado). Como resultado del primer promedio se obtiene, conforme sabemos, un operador de la forma A(r)n. S, proporcional a la proyección del operador de spin sobre el eje de la molécula. Promediemos luego este operador respecto de la rotación de esta última, considerando arbitraria la dirección del vector (1) En el caso b, la proyección n· S del spin sobre el eje de la molécula no tiene un valor determinado, de forma que el número cuántico ~ (y 0) no existe. La molécula diatómica 352 de spin; entonces n. S = ñ. S. El valor medio ñ es un vector que, por razones de simetría, debe tener la misma dirección que el «vector» K - el único vector que caracteriza la rotación de la molécula. Podemos escribir, por lo tanto, ñ = constante x K. El coeficiente de proporcionalidad se determina fácilmente multiplicando los dos miembros de esta igualdad por K; observando que ]os valores propios de n · K y K 2 son, respectivamente (véase (82.3)), .\ y K(K I ), encontramos: + A/K(K+l). De esta manera n.S = Aít.S/K(K+l). Finalmente, el valor propio del producto K · S, según la fórmula general (31.2), es igual a: K. S = i[T(J + 1)-K(K+ 1)-S(S+ 1)]. (84.4) Llegamos así a la siguiente expresión para el valor medio buscado de la energía de interacción spin-eje: A(r)A[J(J + 1)-S(S+ 1)-K(K+ 1)]/2K(K+ 1) = A(r)A[(J-S)(J +s+ 1)]/2K(K+ 1)-iA(r)A. Esta expres10n debe sumarse a la energía (84.2). Al hacerio, el término !A(r).\, en tanto que no depende ni de K ni de J, se puede incluir en U(r), de modo que obtenemos finalmente para la energía potencial efectiva la expresión U x(r) = U(r)+B(r)K(K+ l)+A(r)A(J-S)(J +s+ 1)/2K(K+ 1). (84.5) El desarrollo en serie de potencias de f = r - re conduce, como de ordinario, a la siguiente expresión para los niveles de energía de la molécula en el caso h: (84.6) Conforme se indicó ya en el párrafo anterior, en los términos ~ la interacción spin-órbita no conduce en primera aproximación a un desdoblamiento en multiplete, y para determinar la estructura fina hay que tener en cuenta la interacción spin-spin, cuyo operador es cuadrático respecto de los spins de los electrones. Nos interesa ahora no el propio operador, sino el resultado de promediarlo respecto del estado electrónico de la molécula, de manera análoga a como se hizo para el operador de interacción spin-órbita. Es evidente, por razones de simetría, que el operador promediado que buscamos ha de ser proporcional al cuadrado de la proyección del spin total de la molécula sobre el eje, es decir, que se puede escribir en la forma: C1.(r) (S. n)2, (84.7) Términos multiplete 353 donde '.X(r) es de nuevo una cierta función de la distancia r característica del término electrónico dado (la simetría admite también un término proporcional a S2 ; sin embargo, este término carece de interés, ya que el valor absoluto del spin es simplemente una constante). No nos detendremos aquí a deducir la complicada fórmula general para el desdoblamiento que determina el operador (84.7); en el problema ( 1) de este párrafo se deduce la fórmula para los términos L triplete. Un caso particular lo constituyen los términos L doblete. Según el teorema de KRAMERS (§ 60), en un sistema de partículas con spin total S = ! la degeneración de segundo orden se mantiene necesariamente incluso cuando se consideran del todo las interacciones relativistas internas que se dan -en el mismo. Por ello los términos 2 L no se desdoblan ni aun teniendo en cuenta (en cualquier aproximación) tanto la interacción spin-órbita, como la spin-spin. Se llegaría aquí al desdoblamiento tan sólo introduciendo la interacción relativista del spin con la rotación de la molécula; este efecto es muy pequeño. El operador promediado de esta interacción debe tener, evidentemente, la forma y:R:.. S, y sus valores propios se determinan por la fórmula (84.4), en la que hay que hacer S=!, J = K ± !. Para los términos 2 L obtenemos la fórmula E = Ue+nwe(v+t)+BeK(K+ l)±}y(K+t); (en Ve hemos incluido la constante - (84.8) y/4). PROBLEMAS 1. Determinar el desdoblamiento en multiplete del término 3 L en el caso b. (H. KRAMERS, 1929). Solución. El desdoblamiento buscado se determina mediante el operador (84.7), que debe promediarse respecto de la rotación de la molécula. Escribámoslo en la forma rxenmkStSk, donde rxe = rx(r0 ). Dado que S es un vector que se conserva, hay que promediar solamente el producto nink. Según la fórmula análoga obtenida en el problema 2 del § 29, tenemos: l?.a<k+J?.kl?.i - (2K-1)(2K+3) + ... ; no se han escrito aquí los terminas (proporcionales a ,5il.) que darían para la energía una contribución independiente de J, por lo que no conducen al desdoblamiento que nos interesa. Así, pues, este último viene determinado por el operador Dado que S conmuta con K, es 354 La molécula diatómica donde el valor propio de S. K resulta de la fórmula (84.4). Además, tenemos: siskK1cl<.i = siskK.iKk + isiskekuKi = (S. K)2+t(SiSk- SkSi)ieikzKi = (S. K)2+}eikleikmSmKz =(S.K)2+S.K. A las tres componentes EK del triplete 3 L (S = 1) corresponden J valos entre estas componentes, obtenemos los valores: = K, K ::!:: l. Para los inter- 2. Determinar la energía del término doblete (con A -=f=. O) para casos intermedios entre el a y el b (E. HILL, J. VAN VLECK, 1928). Solución. Dado que la energía de rotación y la energía de interacción spin-eje se suponen del mismo orden de magnitud, hay que considerarlas a la vez en la teoría de perturbaciones, de modo que el operador de perturbación tiene la forma (1): V = B R2 +Aen. S. Como funciones de onda de la aproximación de orden cero es conveniente utilizar las funciones de onda de estados en los que los momentos cinéticos K y J tienen valores determinados (es decir, las funciones del caso b). Puesto que para el término doblete es S = J, para un valor dado de J el número cuántico K puede tomar los valores K = J ± i. Para establecer la ecuación secular :;J (n designa el conjunto de los números cuánticos hay que calcular los elementos de matriz que determinan el término electrónico), donde K, K' toman los valores indicados. La matriz del operador K. 2 es diagonal (los elementos diagonales son iguales a K(K + 1)). En cambio, los elementos de matriz de (n· S) se calculan mediante la fórmula general (109.5) (en la que el papel de j 1 ,j 2 , J lo representan S, K, J); los elementos de matriz den vienen dados por las fórmulas (87.1). Como resultado del cálculo se llega a la ecuación secular v;f Be(]+!)(] +!)-AeA/(2] + l)-E<1> 1 Aev[(J +!) 2 -A 2 ]/(2J + 1) Aev[(J +!)2-A 2]/(2J + 1) 1 Be(] +!)(J-!)+AeA/(2] + l)-E<1 > = o. Resolviendo esta ecuación y sumando E< 1J a la energía no perturbada, obtenemos: (en Ue se ha incluido la constante Be/4). Al caso a corresponde Ae contraria. ~ Be J, al caso b, Ja desigualdad 3. Determinar los intervalos entre las componentes del nivel triplete 3 L en un caso intermedio entre el a y el b. 1 ( ) El promedio respecto de las vibrar.iones se debe efectuar antes de promediar respecto de fa rotación. Por ello hemos substituido (limitándonos a los primeros términos del desarrollo en potencias de~) las funciones B(r) y A(r) por los valores Be, Ap y los niveles no perturbados de la energía por: E< 0 > = Ue+ nwe(v + ~ ). 355 Términos multiplete Solución. Como en el problema 2, la energía de rotación y la energía de interacción spin-spin se consideran simultáneamente en la teoría de perturbaciones. El operador de perturbación tiene la forma: Como funciones de onda de la aproximación de orden cero utilizaremos las funciones del caso b. Los elementos de matriz (n . S)~, (se prescinde de todos los índices respecto de los cuales la matriz es diagonal) los calculamos de nuevo según las fórmulas (109.5) y (87.1), esta vez con A = O y S = 1. Diferentes de cero lo serán los elementos de la forma: (n. S)r_ 1 = v[(J + 1)/(2] + 1)], (n. S)f+i = vU/(2] + 1)]. Dado J, el número K puede tomar los valores K = J, J ± 1. Para los elementos de matriz Vf, encontramos: VJ J VJ+i J+I = BeJU + l)+r1.e, VJ-I J-1 = Be(J-1)] +ae(J + 1)/(2] + 1), =Be(]+ l)(J +2)+aef/(2] + 1), V~~~ = V~~~ = r1.ev[J(] + 1)]/(2] + 1). Vemos así que no son posibles las transiciones entre los estados con K = J y los estados con K = J ± 1. Por ello uno de los niveles es, simplemente, E 1 = Vf Los otros dos (E 2 , E:i) se obtienen como resultado de resolver la ecuación secular de segundo grado construida a partir de los elementos de matriz v~:L Interesándonos solamente la distribución relativa de las componentes del triplete, restemos de éstas tres energías E1,2,:i la constante 'Y.e. Obtenemos así: V~+L V~+i· En el caso b ('Y. pequeña), si se consideran tres niveles con el mismo valor de K y valores diferentes de J (J = K, K 1), se obtienen de nuevo las fórmulas que encontramos en el problema 1. § 85. Términos multiplete. Casos e y d Además de los casos de enlace a y h y de los intermedios entre ambos, existen también otros tipos de enlace. El origen de éstos consiste en Jo que sigue. La aparición del número cuántico .\ se debe, en último término, a la interacción eléctrica de los dos átomos en la molécula, interacción que conduce a que el problema de la determinación de los términos electrónicos presente simetría axil (esta interacción en la molécula se llama enlace del momento cinético orbital con el eje). Una medida de la magnitud de esta interacción lo es la distancia entre 'los términos con diferentes valores de .\. En todo lo que precede se ha supuesto tácitamente que esta interacción es tan fuerte que estas distancias son grandes, tanto respecto de los intervalos del desdoblamiento en multiplete, como respecto de los intervalos de la estructura de rotación de los términos. Sin embargo, existen también los casos opuestos, en los que la interacción del momento cinético orbital con el eje es comparable e incluso 356 La molécula diatómica pequeña respecto de los otros efectos; en tales casos, claro está, es imposible hablar, en ninguna aproximación, de conservación de la proyección del momento cinético orbital sobre el eje, de modo que el número _\ pierde su sentido. Si el enlace del momento cinético orbital con el eje es pequeño comparado con el enlace spin-órbita, se habla del caso c. Este caso se presenta en moléculas que contienen un átomo de un elemento de tierras raras. Estos átomos se caracterizan por la existencia de electrones f con momentos cinéticos no compensados; su interacción con el eje de la molécula queda debilitada debido a la profundidad a que se encuentran los electrones f en el átomo. Los tipos de enlace intermedios entre el a y el e se presentan en moléculas constituidas por átomos pesados. Si el enlace del momento cinético orbital con el eje es pequeño comparado con los intervalos de la estructura de rotación, se habla del caso d. Este caso se presenta para niveles de rotación elevados (con grandes valores de J) de algunos términos electrónicos de las moléculas más ligeras (H 2 , He2). Estos términos se caracterizan por la existencia en la molécula de un electrón fuertemente excitado cuya interacción con los demás electrones (o, como suele ·decirse, con la molécula «residual») es tan débil, que su momento cinético orbital no se cuantifica a lo largo del eje de aquélla (mientras que el « residuo » de la misma posee un momento cinético determinado Ares respecto del eje). Al aumentar la distancia r entre los núcleos, la interacción de los átomos se debilita y llega al final a ser pequeña respecto de la interacción spin-órbita en los propios átomos. Por ello, al considerar los términos electrónicos para valores de r suficientemente grandes, nos encontramos en el caso c. Esta circunstancia debe tenerse presente al establecer la correspondencia entre términos electrónicos de la molécula y los estados de los átomos que se obtienen para r-+ =. En el § 80 estudiamos esta correspondencia prescindiendo de la interacción spin-órbita. Pero si se considera la estructura fina de los términos, surge además la cuestión de cuál es la correspondencia entre los valores J 1 y 1 2 de los momentos cinéticos totales de los átomos aislados y los valores del número cuántico n de la molécula. Presentaremos aquí los resultados sin repetir los razonamientos, que son por completo análogos a los que se desarrollaron en el § 80. Si la molécula está constituida por átomos diferentes, los valores posibles de 1 y 1 2 ( ]1 > 1 2 ) vienen dados por la misma tabla (80.1) en la que en vez de L1 , L 2 hay que escribir 1 1, 1 2 y en vez de _\ hay que substituir In¡. La única diferencia consiste en que, para 1 1 +12 semientero, el menor valor de [n[ no será cero, según indica la tabla, sino L. En cambio, para 1 1 +12 entero se tienen 212 + 1 términos con n = O para los que 1 n¡ (1) que se obtienen al unir los dos átomos con momentos cinéticos 1 (1) Al componer los dos momentos cinéticos totales J 1 y J 2 de los átomos para formar el momento resultante n, el signo de n, evidentemente, no es esencial. Términos multiplete 357 (como también para los términos L cuando se prescinde de la estructura fina) se plantea la cuestión de cuál sea su signo. Si 1 1 y 12 son ambos semienteros, el número (212 +1) es par y se tiene un número igual de términos, que convendremos en representar por o+ y 0-. Pero si 1 1 y 1 2 son ambos enteros, 12 + 1 términos serán o+ y 12 serán o- (si ( - l f1 +J.¡1/ 2 = 1), o recíprocamente (si (-l)J1+J,J1/ 2 = -1). Si la molécula está formada por átomos idénticos que se encuentran en estados diferentes, los estados moleculares resultantes serán los mismos que en el caso de átomos distintos, con la única diferencia de que el número total de términos queda multiplicado por dos, interviniendo cada término una vez como par y otra ve7 como impar. Finalmente, si la molécula está formada por átomos idénticos en los mismos estados (con momentos 1 1 = 1 2 == J), el número total de estados es el mismo que en el caso de átomos distintos y su distribución atendiendo la paridad es tal que si J entero y n par: Nu = N 11 +I s1 J entero y n impar: Na= Nu s1 J semientero y n par: Nu = Na si J semientero y n impar: Nu = Ng+ l. Todos los términos o+ son aquí pares, y todos los términos o,- impares. A medida que se acercan los núcleos, el enlace del tipo e se transforma de ordinario en un enlace del tipo a (1). Cuando así ocurre, puede presentarse la siguiente interesante situación. Conforme se dijo ya, un término con A = O pertenece al caso b; desde el punto de vista de la clasificación del caso a, en cambio, esto significa que a los niveles multiplete con diferentes valores de n (y el mismo A = O) corresponde la misma energía. Pero tales niveles pueden aparecer al acercar dos átomos que se encuentran en diferentes estados de estructura fina. Así, pues, puede ocurrir que a pares distintos de estados atómicos de estructura fina corresponda el mismo término molecular. Una situación análoga puede presentarse para aquellos términos con n =Oque, al acercar los núcleos, se convierten en un término molecular con A =/= O (y, según esto, con L = - ~\); tales niveles resultan doblemente degenerados, ya que a los términos o+ y o- (que pueden proceder de diferentes pares de estados atómicos) corresponde en el caso a la misma energía (2). (1) La correspondencia entre la clasificación de los términos de tipo a y la del tipo e no se puede establecer de forma general. Se exige para ello un estudio concreto de las curvas de la energía potencial teniendo en cuenta la regla 'de no intersección de los niveles con igual simetría (§ 79). (2) Prescindimos aquí de la llamada duplicación A (véase § 88). 358 § 86. La molécula diatómica Simetría de los términos moleculares En el § 78 examinamos ya algunas propiedades de la simetría de los términos de una molécula diatómica. Estas propiedades se caracterizaban por el comportamiento de las funciones de onda en las transformaciones que no alteran las coordenadas de los núcleos. Así, la simetría de una molécula en la reflexión en un plano que pasa por su eje conduce a la diferencia entre los términos I:+ y t-; la simetría respecto del cambio de signo de las coordenadas de todos los electrones (1) (para moléculas formadas por átomos idénticos) conduce a la clasificación de los términos en pares e impares. Estas propiedades de simetría caracterizan los términos electrónicos y son las mismas en todos los niveles de rotación que se refieren a un mismo término electrónico. Además, los estados de la molécula (como el de cualquier sistema de partículas - véase § 30) se caracterizan por su comportamiento respecto de la inversión - cam":Ó bio simultáneo del signo de las coordenadas de todos los electrones y de los núcleos. En relación con esto, todos los términos de una molécula se dividen en positivos - aquéllos cuyas funciones de onda no cambian al cambiar de signo las coordenadas de los electrones y de los núcleos-, y negativos - aquéllos cuyas funciones de onda cambian de signo en la inversión (2). Para A=/= O cada término es doblemente degenerado en correspondencia con los dos posibles sentidos del momento cinético respecto del eje de la molécula. Como resultado de la inversión, el momento cinético, él, no cambia de signo, pero sí cambia de sentido el eje de la molécula (¡los átomos cambian sus posiciones!), y con ello también el sentido del momento cinético A respecto de la molécula pasa a ser el opuesto. Por consiguiente, dos funciones de onda relativas al nivel dado de la energía se transforman entre sí, y a partir de ellas se puede siempre construir una combinación lineal que es invariante respecto de la inversión y una combinación que en dicha transformación cambia de signo. Para cada término obtenemos de este modo dos estados -de los que uno será positivo, y el otro, negativo. De hecho, cada término con A=/= O se desdobla de todas maneras (véase § 88) de forma que estos dos estados corresponderán a diferentes valores de la energía. (1) Se supone que se ha elegido como origen de coordenadas el punto medio entre los dos núcleos sobre el eje de la molécula. (2) Nos atenemos a la terminología generalmente adoptada. Ésta es, sin embargo, poco afortunada, ya que, en el caso de un átomo, al considerar el comportamiento de los términos respecto de la inversión se habla de su paridad, no de su signo. ¡Para los términos I:, no se confunda el signo de que se trata aquí con los signos + y - que aparecen como superíndice! Simetría de los términos moleculares 359 Los términos L exigen consideración aparte para determinar su signo. Ante todo, es claro que el spin no tiene relación ninguna con el signo del término; la operación de inversión afecta solamente a las coordenadas de las partículas, dejando invariable la parte de spin de la función de onda. Por ello todas Jas componentes de la estructura multiplete de cada término dado tienen el mismo signo. Con otras palabras, el signo del término dependerá solamente de K, pero no de J (1). La función de onda de la molécula es el producto de las funciones de onda de los electrones y de los núcleos. En el ~ 82 se demostró que en los estados L el movimiento de los núcleos es equivalente al movimiento de una partícula con momento cinético orbital K en un campo central U(r ). Podemos por e11o afirmar que al cambiar el signo de las coordenadas, la función de onda de los núcleos queda multiplicada por {- J)K (véase (30.7)). La función de onda electrónica caracteriza el término electrónico y para determinar su comportamiento en la inversión hay que considerarla en un sistema de coordenadas rígidamente unido a los núcleos y que gira junto con ellos. Sea x, y, z el sistema de coordenadas fijo en el espacio y~. 11, ; el sistema de coordenadas en rotación en el que la molécula está en reposo como un todo. La dirección de los ejes t 1¡, !; se tomará de tal manera que el eje ; coincida con el eje de la molécula, estando dirigido, por ejemplo, del núcleo 1 a] núcleo 2, y que la posición relativa de los sentidos positivos de los ejes ;, >¡, !; sea la misma que en el sistema x, y, z (es decir, si el sistema x, y, z es directo, también debe ser directo el sistema ;, 1¡, ;). Como resultado de la inversión, los sentidos de los ejes x, y, z se cambian en los opuestos, y el sistema de coordenadas pasa de ser directo a ser retrógrado. Con esto también el sistema ;, 1¡, : debe pasar a ser retrógrado. Pero dado que el eje : está rígidamente unido a los núcleos, conserva su sentido anterior; por el1o es necesario cambiar el sentido de uno de los ejes; o 1¡ en el opuesto. Así, pues, la inversión en el sistema de coordenadas fijo es equivalente, en el sistema en movimiento. a la reflexión en un plano que pasa por el eje de la molécula. Pero en una tal reflexión la función de onda electrónica de un término L no varía, y la de un término L- cambia de signo. -1- El signo de las componentes de rotación de un término L + viene así determinado por el factor (- 1) K; todos los niveles con K par son positivos, y aquéllos para los que K es impar son negativos. Para un término L- el signo de los niveles de rotación queda determinado por el factor {- 1) 1' +1 y todos los niveles con K par son negativos, y con K impar, positivos. Recordaremos que para los términos números cuánticos K y J. (1) ]o<; ~ se da de ordinario el caso b, por lo cual hay que utilizar 360 La molécula diatómica Si la molécula está constituida por átomos idénticos (1), su hamiltoniano es también invariante respecto de la permutación de las coordenadas de los dos núcleos. El término se llama simétrico respecto de los núcleos si su función de onda no cambia al permutarlos, y antisimétrico, si la función de onda cambia de signo. La simetría respecto de los núcleos está íntimamente ligada con la paridad y el signo del término. La permutación de las coordenadas de los núcleos es equivalente al cambio de signo de las coordenadas de todas las partículas (electrones y núcleos) seguida del cambio de signo de las coordenadas de los electrones únicamente. De aquí se sigue que si un término es par (impar) y a la vez positivo (negativo), es simétrico respecto de los núcleos. Si, en cambio, un término es par (impar) y a la vez negativo (positivo), es antisimétrico respecto de los núcleos. Al final del § 62 se estableció un teorema general según el cual la función de onda de coordenadas de un sistema formado por dos partículas idénticas es simétrica si el spin total del sistema es par, y antisimétrica, si es impar. Si aplicamos este resultado a los dos núcleos de una molécula formada por átomos idénticos, encontramos que la simetría del término está ligada con la paridad del spin total I que se obtiene como resultado de componer los spins i de ambos núcleos. El término es simétrico si I es par, y antisimétrico, si I es impar(2). En particular, si los núcleos carecen de spin (i = O), también I es igual a cero; por ello la molécula no puede en modo alguno tener entonces términos antisimétricos. Vemos, pues, que el spin nuclear influye de manera indirecta, pero fundamental, sobre los términos moleculares, a pesar de que su acción directa (estructura hiperfina de los términos) es completamente despreciable. El tener en cuenta el spin de los núcleos conduce a una degeneración adicional de los niveles. En el mismo § 62 se estableció el número de estados con valores pares e impares de I que se obtienen al componer dos spins i. Así, si i es semientero, el número de estados con I par es igual a i(2i + 1), y con I impar es igual a (i + 1) (2i + 1). Teniendo en cuenta lo dicho antes, llegamos a la conclusión de que la razón de las multiplicidades g~, gª de la degeneración (3) de los términos simétricos y antisimétricos para i semi entero es igual a: gs/ga = i/(i+ 1). (86.1) En cambio, para i entero se obtiene, de manera análoga, que esta razón es igual a: g 8 /ga = (i+ 1)/i. (86.2) ( ) Es necesario que ambos átomos pertenezcan no sólo al mismo elemento, sino también al mismo isótopo. 1 (2) Teniendo en cuenta la relación entre paridad, signo y simetría de los términos, llegamos a la conclusión que para un spin total de los núcleos I par los niveles positivos son pares, y los negativos, impares; para I impar, ocurre lo contrario. 3 ( ) Refiriéndose a la multiplicidad de la degeneración de un nivel, desde este punto de vista, se suele hablar de su peso estadístico. Las fórmulas (86.1-2) determinan las razones de los pesos estadísticos nucleares de los niveles simétricos y antisimétricos. Elementos de la matriz para una molécula diatómica 361 Vimos que el signo de las componentes de rotación del término ~+ viene determinado por el número (- 1) 1{. En consecuencia, por ejemplo, las componentes de rotación del término L+ 9 para K par son positivas y, por consiguiente, simétricas, y para K impar, negativas y, por lo tanto, antisimétricas. Teniendo presente los resultados obtenidos antes llegamos a la conclusión de que los pesos estadísticos nucleares de las componentes de rotación de un nivel L+ !I con valores consecutivos de K cambian alternativamente en correspondencia con (86.1) o (86.2). Una situación completamente análoga encontramos para los niveles ~+ 11 y también para los ~-!,, ~-". En particular, para i = O son iguales a cero los pesos estadísticos de los niveles con K par en los términos :~::+ 11 , L-r, y los de los niveles con K impar en los términos ~+ 9 , L- 11 • Con otras palabras, en los estados electrónicos ~+m L- y no existen estados de rotación con K par, y en los estados L+ 9 , ~-,, no existen estados de rotación con K impar. Dado que la interacción de los spins nucleares con los electrónicos es extraordinariamente débil, la probabilidad del cambio de I es muy pequeña, incluso en las colisiones moleculares. Por esto las moléculas que difieren en la paridad de I y que poseen, por consiguiente, o tan sólo términos simétricos o tan sólo antisimétricos, se comportan prácticamente como modificaciones diferentes de la materia. Así ocurre, por ejemplo, con los llamados ortohidrógeno y parahidrógeno; en una molécula del primero los spins i = ! de ambos núcleos son paralelos (I = I ), y en una del segundo, anti paralelos (I = O). § 87. Elemeótos de matriz para una molécula diatómica Iniciaremos el cálculo de las matrices de las diferentes magnitudes asociadas con una molécula diatómica con el de los elementos de matriz para las transiciones entre estados con spin igual a cero. Sea n el vector unitario del eje de la molécula. El vector n, considerado como operador, conmuta con los operadores de energía de los electrones y con el de la energía de vibración, pero no con el momento cinético K de la molécula. Por ello la matriz n es diagonal respecto de todos los números cuánticos con la única excepción de los números K y M 1{ (por M K designamos el valor de la proyección del momento cinético K sobre el eje z fijo en el espacio). Prescindiendo de todos los índices salvo estos dos, escribiremos los elementos de matriz en la forma (K'M'K\nJKMK). Su dependencia con relación a M K se determina mediante las fórmulas generales (29. 7), (29.9), en las que en vez de L y M se escribe ahora K y MR (y el índice n se puede suprimir). Los coeficientes en estas fórmulas los representaremos en el presente caso por n-ff, de modo que, por ejemplo, (K.ll1KlnzlKMK) = MK K nK. \i[K(K+ 1)(2K+ 1)] La molécula diatómica 362 Para calcular las cantidades n{, partiremos de las igualdades n . escritas en la forma (véase (29. 11 )) : 1t = A, n 2 = 1, fn+K++fn1-+nz.Kz = A, n+n-+nz 2 = 1, y de la relación de conmutación Formando los elementos de matriz diagonales que se siguen de estas igualdades (los elementos de matriz de K se determinan mediante las fórmulas generales (27.12) con K, M nen vez de l, M), después de un cálculo del que prescindimos aquí obtenemos las siguientes fórmulas para. las cantidades buscadas (H. H6NL y F. LONDON, 1925): K nK =A J 2K+l K(K+ 1)' n~- 1 = (n~_ 1 )* = iy'[(K2-A2)/K]. (87.1) Para .\ = O estas fórmulas dan: nK K = Ü nK-1 = K ' iy'K; que, como era de esperar, son precisamente los que corresponden a los elementos de matriz de un vector unidad para el movimiento en un campo central (véase el problema 1, § 29). Sea ahora A una magnitud física vectorial cualquiera que caracteriza el estado de la molécula cuando los núcleos están en reposo (1). Consideremos primero esta cantidad en el sistema de coordenadas~' 1¡, ; que gira junto con la molécula (coincidiendo el eje ( con el eje de fa misma). Aplicar aquí todos los resultados del § 29 es imposible, ya que el mornt·nto cinético de la molécula respecto del sistema de coordenadas t, 1¡, ( (es decir, el momento cinético electrónico L) no se conserva; únicamente se conserva su componente ;, es decir, .\. En cambio, los resultados que se refieren a las reglas de selección correspondientes al número cuántico .\ (M en el § 29), conservan, evidentemente, toda su validez. Por lo tanto, los elementos de matriz del vector A diferentes de cero serán: (A { )ni\ n A' 1 (A + iA 1J )ni\ n',i\-1' g (A1:-iA \> )n,A-i. 1J n'i\ ' (87.2) (n representa aquí el conjunto de los números cuánticos del término electrónico, excluido .\). (1) Una magnit.ud de este tipo puede ser, por ejemplo, el momento dipolar o el momento magnético de la molécula. Elementos de la matriz para una molécula diatómica 363 _Si ambos términos son términos I:, hay que tener también en cuenta la regla de selección ligada con la simetría respecto de la reflexión en un plano que pasa por el eje de la molécula (eje ;). En una reflexión de este tipo la componente C de un vector ordinario (polar) no cambia, mientras que la de un vector axil cambia de signo. De aquí deducimos que, para un vector polar, A, tiene elementos de matriz diferentes de cero tan sólo para las transiciones I;+ --+ }:+ y }:- --+ L-, y para una vector axiL únicamente para las transiciones L+ --+ L-. No se habla aquí de las componentes ÁE, Ar, dado que para ellas son absolutamente imposibles las transiciones sin cambio de "\. Si la molécula está constituida por átomos idénticos, existe todavía una regla de selección respecto de la paridad. Las componentes de un vector (polar) cambian de signo en la inversión. Por eJJo sus elementos de matriz son diferentes de cero tan sólo para las transiciones entre estados de paridad distinta (para un vector axil ocurre lo contrario). En particular, se anulan idénticamente todos los elementos de matriz diagonales de las componentes de un vector polar. Se plantea ahora la cuestión de cómo están ligados los elementos de matriz (87.2) con los elementos de matriz de las componentes del mismo vector A en el sistema de coordenadas fijo. En este sistema podemos utilizar nuevamente las fórmulas generales (29.7), (29.9), que permiten determinar la dependencia de los elementos de matriz (n .\KM KJAjn' "\' K' M' H) respecto del número cuántico M 1{_. Es natural designar los coeficientes en dichas fórmulas por A~,f~,; se trata de ligarlos con las cantidades (87.2). Es claro. por (87.2), que se tienen elementos de matriz diagonales respecto de A tan sólo para la componente a lo largo del eje de la molécula. Podemos escribir por ello la siguiente igualdad particular. (nAKMKIAzln'AK' MK) = (A,):~A(KMKlnzlK' MK). Poniendo de manifiesto la dependencia respecto de M 1,, obtenemos AnAK _ nK (A )nA (87.3) n AK K n A' donde n~. se determina mediante las fórmulas (87.1 ). Hemos hallado así parte de las relaciones que nos interesan. 1 1 - 1 { 1 Para hallar las restantes (las relaciones para las componentes no diagonales respecto de .\) observemos que dado que la magnitud A se refiere a una molécula cuyos núcleos están en reposo, los operadores Ag, A11 , A, conmutan, evidentemente, con el vector n. Pero las componentes del vector A en el sistema x, y, =se expresan 364 La molécula diatómica linealmente en función de las componentes en el sistema t, ,1, :;, expresándose los coeficientes que aparecen en estas relaciones lineales en función de nx, ny, nz. Por consiguiente, también Ax, A Y' A z conmutan con el vector n. En particular, Áz11z-nzÁz = O. Formando en esta igualdad los elementos de matriz para las transiciones.\, K--+ .\ - 1, K' con K' = K, K ± 1, obtenemos tres ecuaciones que permiten determinar la dependencia de las cantidades buscadas respecto de K. Los coeficientes en las fórmulas que se obtienen se pueden ligar con las cantidades (87.2) comparando los elementos de matriz del escalar A2 , calculados, una vez, en el sistema de coordenadas x, y, z y, otra, en el sistema t, ,1, :; (1). Se obtienen así las siguientes fórmulas finales: A:1~t.K' A:~A-1,K l = !(Ae+iA7]1~1-1 v[(2K+l)(K+A)(K-A+l)/K(K+ 1)], A:~:-i.K-i = -!(Ag+iA 77 ):,~_1 y'[(K+A)(K+A-l)JK], An.\,K-1 n ,A-1,K 1 = (87.4) !(A,:+iA,,,)nn~.A-i'\l[(K-A)(K-A+ 1)/K]. ¡, ., Las componentes con _\ que hemos escrito. 1 _,.. .\ son iguales a las conjugadas complejas de las Finalmente, hemos de ver cómo deben modificarse las fórmulas obtenidas para el caso de las transiciones entre estados con valores del spin diferentes de cero. Es aquí fundamental el hecho de que los estados correspondan al caso a o al caso b. Supongamos primero que ambos estados correspondan al caso a. El vector unitario n conmuta con el vector de spin S y por ello su matriz es diagonal respecto de los números S y L (o, lo que es lo mismo, respecto de S y n, ya que O= A+L, y respecto de .\ esta matriz es también diagonal). Los números cuánticos K y M 1\. no existen, y en vez de ellos se tienen el momento cinético total J y su proyección M sobre el eje z. En vez de la relación n.k = ,\ que utilizamos para deducir (87. l ), tenemos ahora n · J = n. De acuerdo con esto, resultan de nuevo las mismas fórmulas (87.1), en las que es necesario solamente substituir K y _\ por J y n, respectivamente (prescindimos del índice diagonal S). Lo mismo vale también para cualquier vector orbital A (es decir, no dependiente del spin). Un vector de este tipo conmuta con S y, por ello, su matriz es diagonal respecto de S y L; pero si se utiliza en vez de L el número cuántico n, en los elementos de matriz diferentes de cero dicho número cambia junto con .\ (es decir, (1) Conviene efectuar el cálculo aplicando la fórmula (29.12) en la que hay que hacer A tituir L por K y suponer que n significa 11, _\. = B. subs- Elementos de la matriz para una molécula diatómica 365 si A = A ± 1, también !Y = n ± 1). Las fórmulas (87.3), (87.4) cambian tan sólo en el sentido de que hay que introducir los indices n, n' y substituir en todas partes (incluso en los índices) K y A por J y n. 1 Pero, si el vector A depende del spin, cambian las reglas de selección. El vectór S conmuta con el momento cinético orbital, y también con el hamiltoniano, y por ello su matriz es diagonal respecto den y A (prescindimos de estos índices). Sin embargo, dicha matriz no es diagonal respecto de ~ (o de O). Los elementos de matriz de las componentes de S en el sistema t;, 1í, ( se determinan mediante las fórmulas (27.13) C''Jn S, ~ en vez de L, M, hecho lo cual el paso al sistema x, y, z se efectúa según las fórmulas (87.3-4), en las que hay que substituir en todas partes (incluso en los índices) K, A por J, n. Supongamos ahora que ambos estados corresponden al caso b. El cálculo de los elementos de matriz se efectúa en dos fases. Consideremos primero la molécula en rotación sin tener en cuenta la composición del spin y el momento cinético K; los elementos de matriz se determinan entonces por las mismas fórmulas (87.1-4). El vector A se supone orbital, de forma que él, al igual que n, conmuta con S y, por consiguiente, las matrices son diagonales respecto del número cuántico S, del que prescindimos en tanto que índice. Se compone luego el momento cinético K con el S, formando el momento cinético total J, y el paso a los nuevos elementos de matriz se efectúa según las fórmulas generales (109.3) (el papel de j 1, j 2 , J lo representan ahora en estas fórmulas S, K, J, y en vez de n1 hay que escribir n, A). Si uno de los estados corresponde al caso a y el otro al caso b, el cálculo de los elementos de matriz para las transiciones entre ellos es más complicado; no nos detendremos a considerar esta cuestión (1). PROBLEMAS 1. Determinar el desdoblamiento de los términos por efecto Stark para una molécula diatómica cuyo momento dipolar es constante; el término corresponde al caso a. Solución. La energía del dipolo d en el campo eléctrico C es igual a -d. tf. Por razones de simetría, es evidente que el momento dipolar de la molécula diatómica está dirigido en el sentido de su eje: d = dn (d es una constante). Eligiendo como eje z la dirección del campo, obtenemos para el operador de perturbación -dnz<ff. Determinando los elementos de matriz diagonales de nz de acuerdo con las fórmulas obtenidas en el texto, se encuentra que en el caso a el desdoblamiento de los niveles viene determinado por la fórmula (2) !J,.EM = -CdMJD./J(]+l). J (1) Véase el artículo: E. HILL, J. VAN VLECK, Phys. Rev., 32, 250, 1928. Puede parecer que existe aquí una contradicción con la afirmación general (§ 76) acerca de la no existencia de un efecto Stark lineal. En realidad, claro está, no existe tal contradicción, ya que el efecto lineal está ligado en este caso con la doble degeneración de los niveles cuando O =l= O; la fórmula obtenida es por ello aplicable con tal que la energía del desdoblamiento por efecto Stark sea grande comparada con la energía de la llamada duplicación A rn 88). (2) 366 2. La molécula diatómica El mismo problema, pero para un término correspondiente al caso b (con A Solución. Siguiendo el mismo método, encontramos: ](] + 1)-S(S+ l)+K(K+ 1) !J.EM = - <ffdMJA J 3. -=p O). 2K(K+1)](]+1) . El mismo problema para un término 1I:. Solución. Para A = O no existe efecto lineal y hay que acudir a la aproximación siguiente de la teoría de perturbaciones. Al sumar en la fórmula general (38.9), basta conservar únicamente los términos que corresponden a transiciones entre componentes de rotación del término electrónico dado (en los demás términos las diferencias de energías que aparecen en los denominadores son grandes). Se encuentra de esta manera donde Ex = BK(K + J ). Un cálculo sencillo conduce al resultado d2<f 2 K(K+ 1)-3MK2 B 2K(K+ 1)(2K-1)(2K+3) § 88. Duplicación A La doble degeneración de los términos con .\ -=/=- O (§ 78) es, en realidad, aproximada. Se presenta tan sólo debido a que, conforme se hizo en toda la teoría que precede, se ha prescindido de la influencia de la rotación .de la molécula sobre el estado electrónico (y también de aproximaciones de orden superior respecto de la interacción spin-órbita). Cuando se tiene en cuenta la interacción entre estados electrónicos y estados de rotación, los términos con A-=/=- O se desdoblan formando dos niveles vecinos. Este fenómeno se llama duplicación .\ (E. HILL, J. VAN VLECK y R. de l. KRONIG, 1928). El estudio cuantitativo de este efecto lo iniciaremos, una vez más, con los términos singlete (S = O). El cálculo de la energía de los niveles de rotación se efectuó (en el§ 82) en la primera aproximación de la teoría de perturbaciones, determinando los elementos de matriz diagonales (valores medios) del operador B(r) (R-t)2. Para calcular las aproximaciones siguientes es necesario considerar los elementos de este operador no diagonales respecto de .\. Los operadores K2 y L2 son diagonales respecto de .\, de modo que es necesario considerar sólo el operador -2Bit. L. '367 Duplicación A El cálculo de los elementos de matriz de 1t . L se efectúa sin dificultad mediante la fórmula (29.12), en la que hay que hacer A= K, B = L; el papel de L, M lo representan K, MK, y en vez den debemos escribir n, A, donde n representa el conjunto de los números cuánticos (excluido A) que determinan el término electrónico. Dado que la matriz del vector conservativo K es diagonal respecto de n, A y que la matriz del vector L contiene elementos no diagonales tan sólo para las transiciones en las que A cambia en una unidad (cf. lo dicho en el§ 87 acerca del vector arbitrario A), encontramos, utilizando las fórmulas (87.4): (nAKMKjK.Lln', A-1, KMK) = i(L~+iL11 ):~A-i y[(K+A)(K+l-A)]. (88.1) No existen elementos de matriz correspondientes a una mayor variación de A. La acción perturbadora de los elementos de matriz con A --+ A - 1 puede manifestarse en la aparición de una diferencia de energías entre los estados con ± A tan sólo en la 2A-ésima aproximación de la teoría de perturbaciones. De acuerdo con esto, el efecto será proporcional a B 2 A, es decir, a (m/ .M)2 A (M es la masa del núcleo, m la masa del electrón). Para A> 1 esta cantidad es tan pequeña que carece en absoluto de interés. Así, pues, el efecto de la duplicación A es importante únicamente para los términos II ( A = 1), que cortsideramos a continuación. Para A = 1 hay que acudir a la aproximación siguiente. Las correcciones a los valores propios de la energía se pueden determinar mediante la fórmula general (38.9). En los denominadores de los términos de la suma que aparece en esta ecuación encontramos diferencias de energía de la forma EnAK -En',A-i.K· En estas diferencias los términos que contienen K se reducen entre sí, ya que para una distancia r dada entre núcleos la energía de rotación es exactamente la misma cantidad~ B(r)K(K + 1), para todos los términos. Por ello la dependencia buscada del desdoblamiento tl.E con relación a K queda completamente determinada por los cuadrados de los elementos de matriz que aparecen en los numeradores. Entre ellos habrán cuadrados de los elementos para transiciones con cambio de A de 1 a O y de O a - 1; unos y otros dan, según (88.1 ), la misma dependencia respecto de K, y encontramos así que el desdoblamiento del término 1 II tiene la forma: !J..E = constante xK(K+ 1), expresión en la que (en orden de magnitud) const ,.._, B2/s, donde magnitud de la diferencia entre términos electrónicos vecinos. (88.2) E es del orden de Pasemos a los términos con spin diferente de cero (términos 2 II y 3 II; valores mayores de S no se encuentran en•la práctica). Si el término corresponde al caso b, el desdoblamiento multiplete no se manifiesta, en general, en la duplicación A de los niveles de rotación, la cual, como antes, se determina mediante la fórmula (88.2). En cambio, en el caso a la influencia del spin es, por lo contrario, fundamental. 368 La molécula diatómica Cad¡l. término electrónico se caracteriza ahora, además de por el número _\, también por el número n. Si se substituye simplemente _\ por - .\, cambia n = ;\+ 1:, de modo que obtenemos un término completamente distinto. Los estados con _\, n y - .\, - n son degenerados entre sí. La ruptura de esta degeneración puede ocurrir aquí no sólo debido al efecto antes considerado de la interacción del momento cinético orbital con la rotación de la molécula, sino también a causa de la interacción spin-órbita. Ello se debe a que la conservación de la proyección n del momento cinético total sobre el eje de la molécula es (en el caso de núcleos en reposo) una ley exacta de conservación y no puede quedar violada por la interacción spin-órbita; esta última puede, sin embargo, cambiar a la vez .\ y 1: (es decir, puede tener elementos de matriz no nulos para las correspondientes transiciones) de tal manera, que n se conserve invariable. Este efecto, de por sí o en combinación con la interacción órbita-rotación (que cambia _\ sin cambiar 1:), puede conducir a la duplicación _\. Consideremos primero los términos 2 I1. Para el término 2 II 112 (-\ = 1, 1: = - !, n = D el desdoblamiento se consigue al tener en cuenta a la vez las interacciones spin-órbita y órbita-rotación (cada una de ellas en primera aproximación). En efecto, la primera da la transición .\ = 1, 1: = - 1 -j>- A = O, 1: = !, después de Jo cual la segunda lleva el estado .\ = O, 1: = ! al estado con _\ = - I, 1: = fr, que difiere del de partida en el cambio de signo de _\ y n. Los elementos de matriz de la interacción spin-órbita no dependen del número cuántico de rotación J, y para la interacción órbita-rotación la dependencia respecto de dicho número viene dada por la fórmula (88.1), en la que hay que substituir (en el radicando) K y A por J y n. Obtenemos así para la duplicación _\ del término 2 II112 la expresión ~E1¡ 2 = constante X (] +!), (88.3) 2 donde const ""'AB/e. Para el término II112 , en cambio, la descomposición se produce tan sólo en las aproximaciones de orden superior, de modo que prácticamente ~E3/2 = O. Finalmente, consideremos los términos 3 II. En el término 3 II 0 (A 1, ~ = - 1) el desdoblamiento se consigue al tener en cuenta la interacción spin-órbita en segunda aproximación (debido a las transiciones _\ = 1, 1: = - 1 -j>- .\=O, ~ = =O-+ A = - I, 1: = 1). Según esto, la duplicación .\ no depende en absoluto de J en este caso : =.; ~E0 = constante ,.., A2/E. (88.4) donde const A 2/F. Para el término 3 II 1 es ~ = O, por lo que el spin no influye en modo alguno en el desdoblamiento y obtenemos así de nuevo una fórmula del tipo (88.2), con K substituido por J: r-..; b.E1 = constante xj(J + 1). (88.5) Interacción de los átomos 369 En cambio, para el término 3 Il 2 son necesarias aproximaciones de orden más elevado, de forma que se puede considerar que D.E2 = O. Uno de los niveles del doblete que resulta de la duplicación .\ es siempre positivo, y el otro negativo; de esto hablamos ya en el § 86. El estudio de las funciones de onda de la molécula permite establecer el orden en que se siguen los niveles positivos y negativos. Indicaremos aquí solamente los resultados de este estudio (1). Según éstos, si para un cierto valor J el nivel positivo es más bajo que el negativo, en el doblete con J + l el orden será el inverso - el nivel positivo será más alto que el negativo, y así sucesivamente; el orden de sucesión cambia alternativamente con los valores sucesivos del momento cinético total (nos referimos a términos del caso a; en el caso b ocurre lo mismo respecto de los sucesivos valores del momento cinético K). PROBLEMA Determinar la duplicación A para un término 1D.. Solución. El efecto aparece aquí en el cuarto orden de aproximación de la teoría de perturbaciones. Su dependencia respecto de K viene determinada por el producto de cuatro elementos de matriz (88.1) para las transiciones con los cambios de A : 2--?- l, 1--?- O, O-?" - l, - 1---?" - 2. Esto da tJ.E = constantex(K-l)K(K+l)(K+2), donde const .-, B4 /c3. § 89. La interacción de los átomos a grandes distancias Consideremos dos átomos, en estados S, que se encuentran a gran distancia uno del otro (respecto de sus dimensiones) y determinemos su energía de interacción. Con otras palabras, se trata de determinar la forma de los términos electrónicos Un(r) cuando las distancias entre los núcleos son grandes. Para resolver este problema aplicaremos la teoría de perturbaciones, considerando los dos átomos aislados como un sistema no perturbado y la energía potencial de su interacción eléctrica como operador de perturbación. Es sabido por la electrostática que la interacción eléctrica entre dos sistemas de cargas que se encuentran a gran distanciar una de otra se puede desarrollar en serie de potencias de 1/r, correspondiendo los sucesivos términos de este desarrollo a la interacción de las cargas totales, de los momentos dipolar, cuadripolar, etc., de ambos sistemas. En los átomos neutros las cargas totales son iguales a cero. El desarrollo comienza entonces con la interacción dipolar-dipolar ( _, 1/r3); a ella siguen los términos dipolar-cuadripolar (1) Se puede encontrar en el artículo de WIGNER y WrrMER 370 La molécula diatómica (,_, Jjr 4), cuadripolar-cuadripolar (y dipolar-octopolar) ( ,.._, 1/r5), etc. En la primera aproximación de la teoría de perturbaciones, la energía de interacción de los átomos viene determinada como elemento de matriz diagonal del operador de perturbación calculado mediante las funciones de onda no perturbadas del sistema (expresadas como producto de funciones no perturbadas de los átomos) (1). Pero en los estados S los elementos de matriz diagonales, es decir, los valores medios de los momentos di polar, cuadripolar, etc., son iguales a cero; esto se sigue por meras razones de simetría, sin más, dado que la distribución de cargas en un átomo en el estado S posee en promedio simetría esférica. Por ello, cada uno de los términos del desarrollo del operador de perturbación en potencias de 1/r da el valor cero en la primera aproximación de la teoría de perturbaciones (2). En la segunda aproximación basta limitar el operador de perturbación a lcl¡ interacción dipolar, en tanto que es éste el término que más lentamente disminuye al aumentar r, es decir, basta tomar (89.1) (n es el. vector unitario correspondiente a la posición relativa de los dos átomos). Dado que los elementos de matriz no diagonales del momento dipolar son, en general, diferentes de cero, en la segunda aproximación de la teoría de perturbaciones obtenemos un resultado no nulo que, siendo cuadrático respecto de V, es proporcional a l/r 6 • La corrección de segundo orden al más bajo valor propio es, conforme sabemos, siempre negativa (§ 38). Obtenemos así para la energía de interacción de los átomos que se encuentran en sus estados normales una expresión de la forma (3): U(r) = -constante/r6, (89.2) donde constes una constante positiva (F. LONDON, 1928). Así, pues, dos átomos en estados S normales que se encuentran a gran distancia uno de otro se atraen con una fuerza (- dU/dr) que es inversamente proporcional a la séptima potencia de la distancia. Las fuerzas de atracción entre átomos a grandes distancias se suelen llamar fuerzas de van der Waals. Estas fuerzas conducen a que (1) Prescindimos aquí de los efectos de intercambio que disminuyen exponencialmente al aumentar la distancia (cf. pág. 7 3). (2) Esto no significa, claro está, que el valor medio de la energía de interacción de los átomos sea igual a cero exactamente. Esta energía disminuye con la distancia exponencialmente, es decir, más rápidamente que cualquier potencia finita de 1/r, hecho que conduce a la anulación de cada uno de los términos del desarrollo. En rigor, de lo que se trata es de que el propio desarrollo del operador de perturbación en momentos multipolares se basa en la hipótesis de que las cargas de los dos átomos están, separadas una de otra por una gran distanciar. En cambio, la distribución de densidad electrónica a que conduce la mecánica cuántica posee un valor no nulo (aunque exp<1nencialmente pequeño) también a grandes distancias. 3 ( ) Para abreviar prescindimos aquí y en lo que sigue de un término constante en U(r) que no nos interesa (el valor U(=), que es igual a la suma de las energías de los dos átomos aislados). Interacción de los átomos 371 aparezca una depresión también en las curvas de energía potencial de los términos electrónicos de los átomos que no forman una molécula estable. Estas depresiones, sin embargo, son muy poco pronunciadas (sus profundidades son del orden de las décimas o incluso de las centésimas de electrón-voltio), y están situadas a distancias varias veces mayores que la distancia entre átomos en las moléculas estables. Si en el estado S se encuentra solamente uno de los átomos, para la energía de interacción se obtiene el mismo resultado (89.2), ya que para la anulación de la aproximación de primer orden basta que se anulen los momentos- dipolar, cuadripolar, etc., de uno solo de los átomos. La constante en el numerador (89.2) depende ahora no sólo de los estados de ambos átomos, sino también de su orientación relativa, es decir, del valor n de la proyección del momento cinético sobre el eje que los une. Pero si ambos átomos tienen momentos cinéticos orbitales y totales distintos de cero, la situación cambia. En lo que concierne al momento dipolar, su valor medio es igual a cero en cualquier estado del átomo (§ 75). El valor medio del momento cuadripolar (en los estados con L :/: O, J i= O, D es, en cambio, diferente de cero. Por ello el término cuadripolar-cuadripolar en el operador de perturbación da un resultado no nulo ya en primera aproximación, y encontramos así que la energía de interacción de los átomos disminuye, no según la sexta potencia de la distancia, sino según la potencia quinta: U(r) = constante /r 5 • (89.3) La constante puede ser aquí tanto positiva como negativa, es decir, puede tener lugar tanto una atracción como una repulsión. Como en el caso anterior, esta constante depende no solamente de la distancia entre los átomos, sino también del estado del sistema formado por uno y otro. Un caso particular es el de la interacción de dos átomos idénticos que se encuentran en estados distintos. El sistema no perturbado (los dos átomos aislados) presenta ahora una degeneración adicional ligada con la posibilidad de permutar los estados entre los átomos. De acuerdo con esto, la corrección de primer orden se determinará mediante la ecuación secular en la que intervienen no sólo los elementos diagonales, sino también los elementos de matriz no diagonales de la perturbación. Si los estados de los dos átomos tienen diferente paridad y momentos cinéticos L que difieren en ± 1 ó O, sin ser ambos nulos (exigiéndose lo mismo de J), los elementos de matriz no diagonales del momento dipolar para las transiciones entre estos estados son, en general, diferentes de cero. El efecto de primer orden se obtiene, por consiguiente, ya a partir del término dipolar del operador de perturbación. 372 La molécula diatómica De esta manera la energía de interacción de los átomos será en este caso proporcional a l/r 3 : (89.4) U(r) = constante/r3; la constante puede tener ambos signos. Sin embargo, de ordinario tiene interés la interacción de los átomos promediada respecto de todos los estados posibles del sistema (para estados dados de los átomos), incluidas todas las orientaciones posibles de los momentos cinéticos de aquéllos (1). Como resultado de este promedio todos los efectos lineales respecto de los momentos dipolar y cuadripolar de cada uno de los átomos (es decir, todos los efectos de primera aproximación de la teoría de perturbaciones) se anulan. Por ello las fuerzas de interacción promedias entre los átomos, a gran distancia uno de otro, siguen en todos los casos la ley (89.2) (2). PROBLEMA Para dos átomos idénticos que se encuentran en estados S, obtener una fórmula que determine las fuerzas de van der Waals a partir de los elementos de matriz de sus momentos dipolares. Solución. La respuesta se obtiene aplicando la fórmula general de la teoría de perturbaciones (38.9) al operador (89.1). Dada la isotropía de los átomos en un estado S, es desde luego evidente que, al sumar respecto de todos Jos estados intermedios, los cuadrados de los elementos de matriz de fas tres componentes de cada uno de los vectores d1 y d2 dan la misma contribución, y que los términos que contienen el producto de componentes diferentes se anulan. El resultado que se obtiene es 6 U(r) = - - r6 ¿ n,n' (dz)on 2(dz)on 12 , 2Eo-En-En' donde E 0 , En son los valores no perturbados de la energía de los estados fundamental y excitados del átomo. Dado que, por hipótesis, en el estado fundamental es L = O, los elementos de matriz (dz)on son diferentes de cero tan sólo para las transiciones a estados P (L = 1) (3). Mediante las fórmulas (29.7), escribiremos U(r) en la forma definitiva: 2 U(r) = _ _ ""' (dºº)2(dº? )2 nl n 1 3r6 ~ 2Eo- En1 - En'l n,n' , 1 ( ) A este promedio corresponde, por ejemplo, el problema de determinar la interacción de los átomos en un gas. 2 ( ) Esta ley, obtenida basándonos en la teoría no relativista, es válida tan sólo en tanto se pueda prescindir de los efectos de retardo de las interacciones electromagnéticas. Para ello la distancia r entre átomos debe ser pequeña respecto de c/Won, donde Won es la frecuencia de las transiciones entre los estados fundamental y excitados del átomo. 3 ( ) El spin de los átomos nada tiene que ver con el problema considerado. Predisociación 373 donde en los índices matriciales nL el segundo número da el valor L y el primero representa el conjunto de los restantes números cuánticos que· determinan el nivel de energía (1). § 90. Predisociación La hipótesis fundamental de la teoría de las moléculas diatómicas expuesta en este capítulo consiste en admitir que la función de onda de la molécula se descom pone en el producto de la función de onda electrónica (que depende de la distancia entre los núcleos como parámetro) y la función de onda del movimiento de los núcleos. Esta hipótesis es equivalente a prescindir en el hamiltoniano exacto de la molécula de algunos términos pequeños que corresponden a la interacción del movimiento nuclear con el de los electrones. Tener en cuenta estos términos al aplicar la teoría de perturbaciones conduce a la aparición de transiciones entre diferentes estados electrónicos (2). Físicamente son particularmente importantes las transiciones entre estados uno por lo menos de los cuales pertenece al espectro continuo. En la fig. 30 se representan las curvas de la energía potencia] para dos términos electrónicos ( ª). La energía E' (línea de puntos inferior en la fig. 30) es la energía de un cierto nivel de vibración de la molécula estable en el estado electrónico 2. En el estado 1, esta energía va a parar al dominio del espectro continuo. Con otras palabras, al pasar del estado 2 al estado 1 tiene lugar una desintegración espontánea de la molécula; este fenómeno se llama predisociación (4). Como resultado de la predisociación, un estado del espectro discreto que corresponde a la curva 2 posee, en realidad, una vida de duración finita. Esto significa que el nivel discreto de energía « se difumina», es decir, adquiere una cierta anchura (véase el final del § 44). En cambio, si la energía total E se encuentra en ambos estados por encima del límite de disociación (recta de puntos superior en la fig. 30), la transición de un estado a otro corresponde a la llamada colisión de segunda especie. Así, la transición 1 ~ 2 representa el choque de dos átomos como resultado del cual éstos pasan a estados excitados y se separan con menor energía cinética (para r ~ oo la curva 1 pasa por debajo de la curva 2; la diferencia Ul oo) - U1( oo) es la energía de excitación de los átomos). 1 ( ) El cálculo da para el coeficiente en U= - Ar- 6 (todas las cantidades se expresan en unidades atómicas) los siguientes valores: para dos átomos de hidrógeno, A = 6,5; para átomos de helio, A = 1,6. Y también al desdoblamiento de los niveles, a la duplicación A (§ 88). Rigurosamente hablando, estas curvas deben representar la energía potencial efectiva UJ en los estados de rotación dados de la molécula. (4) La curva I puede también no presentar un mínimo, lo que ocurre si corresponde a fuerzas entre · los átomos puramente repulsivas. (2) 3 ( ) 374 La molécula diatómica t&(r -------------E 2 FIG. 30 Dado el gran valor de la masa de los núcleos, su movimiento es cuasiclásico. El problema de determinar la probabilidad de las transiciones consideradas corresponde por ello a la categoría de problemas de los que se habló en el § 52. A la luz de las consideraciones generales expuestas allí podemos afirmar que el papel determinante para la probabilidad de transición lo representará el punto en que la transición se pueda efectuar de manera clásica (1). Dado que la energía total del sistema de los dos átomos (de la molécula) se conserva en la transición dada, la condición de que sea « clásicamente realizable» exige la igualdad de las energías potenciales efectivas UJ 1(r) = UJlr). Teniendo en cuenta que también el momento cinético total de la molécula se conserva, la energía centrífuga es la misma en ambos estados y, por lo tanto, la condición que acabamos de escribir se reduce a la igualdad de las energías potenciales: (90.1) igualdad que no contiene el valor del momento cinético. Si la ecuación (90.1) no tiene raíces reales en la región clásicamente accesible (región donde E> UJ 1, UJ 2), la probabilidad de la transición es, según el § 52, exponencialmente pequeña (2). Las transiciones ocurrirán con una probabilidad apreciable tan sólo si las curvas de energía potencial se cortan en dicha región (como se representa en la fig. 30). En tal caso el exponente en la fórmula (52.1) se anula (de modo que esta fórmula, claro está, es inaplicable), y en consecuencia la (1) O el punto r = O, en el que la energía potencial se hace infinita. Una situación singular debe presentarse en el caso de una transición en la que toma parte un término molecular que puede formarse a partir de dos pares distintos de estados atómicos (véase el final del§ 85), es decir, cuando la curva de la energía potencial en cierto modo se desdobla formando dos ramas, en la dirección de las distancias crecientes. En esta situación la probabilidad de la transición debe crecer considerablemente; este problema no se ha considerado todavía en la literatura física. 2 ( ) Predisociación 375 probabilidad de transición viene determinada por una expres1on no exponencial (que se obtendrá más adelante). la condición (90. 1) puede interpretarse de modo intuitivo de la siguiente manera. Para una igual energía potencial (y total), son también iguales los impulsos. Por consiguiente, en vez de (90. l) se puede escribir: (90.2) donde p es el impulso del movimiento radial relativo de los núcleos y los índices I y 2 se refieren a los dos estados electrónicos. Podemos así decir que, en el momento de la transición, la distancia mutua y el impulso de los núcleos se conserva invariable (principio de Franck-Condon). Físicamente, ello se debe al hecho de que las velocidades electrónicas son grandes comparadas con las nucleares y así « durante la transición electrónica» los núcleos no consiguen cambiar apreciablemente ni su posición ni su velocidad. No es difícil establecer las reglas de selección para las transiciones consideradas. Ante todo, se cumplen dos reglas exactas evidentes. En la transición no deben cambiar ni el momento cinético total J ni el signo del término (su carácter positivo o negativo, véase § 86). Esto se sigue, sin más, del hecho de que la conservación del momento cinético total y la conservación del carácter de la función de onda respecto de la inversión del sistema de coordenadas son leyes exactas para cualquier sistema (aislado) de partículas. Además, con gran precisión se cumple la regla que prohibe (en una molécula formada por átomos idénticos) las transiciones entre estados de diferente paridad. En efecto, la paridad de un estado viene unívocamente determinada por el spin nuclear y el signo del término. Pero la conservación del signo del término es una ley exacta y el spin nuclear se conserva dentro de límites muy próximos debido al carácter débil de su interacción con los electrones. la condición de que exista un punto de intersección de las curvas de energía potencial significa que los términos deben poseer distinta simetría (véase § 79). Consideremos las transiciones que aparecen ya en la primera aproximación de la teoría de perturbaciones (la probabilidad de las transiciones asociadas a las aproximaciones de orden superior es relativamente pequeña). Observemos primero que los términos que en el hamiltoniano conducen a las transiciones consideradas son precisamente los que determinan la duplicación ~\ de los niveles. Entre ellos se tienen, ante todo, los términos que corresponden a la interacción spin-órbita. Estos términos son el producto de dos vectores axiles, de los cuales uno tiene carácter espinorial (es decir, está formado por los operadores de spin de los electrones), y el otro es un vector de coordenadas; sin embargo, hay que subrayar que estos vectores en modo alguno se reducen simplemente a los vectores S y L. Poseen por elJo elementos de matriz no nulos para transiciones en las que S y .\ cambian en O, I. 376 La molécula diatómica Hay que prescindir del caso en que se tiene simultáneamente ~S = ~ .\ = O (con .\. =/=- O), dado que entonces la simetría del término no cambiaría en la transición. La transición entre dos términos L es posible si uno de ellos es un término L _:_, y el otro, un término L- (un vector axil tiene elementos de matriz únicamente para transiciones entre L+ y L-, véase § 87). El término en el hamiltoniano que corresponde a la interacción entre la rotación de la molécula y el momento cinético orbital es proporcional a J ·L. Sus elementos de matriz son diferentes de cero para las transiciones con ~ .\. = ± l sin cambio del spin (en cambio, se tienen elementos de matriz con ~ .\ = O tan sólo para la componente C de un vector, es decir, para L:; pero L: es diagonal respecto de Jos estados electrónicos). Además de los términos considerados, existe todavía una perturbación ligada con el hecho de que el operador de energía cinética de los núcleos (el de derivación respecto de las coordenadas de Jos mismos) actúa no solamente sobre la función de onda de los núcleos, sino también sobre la de los electrones, que depende de r como parámetro. Los correspondientes términos en el hamiltoniano tienen la misma simetría que en el hamiltoniano no perturbado. Por lo tanto, pueden conducir solamente a transiciones entre términos electrónicos de igual simetría, transiciones cuya probabilidad es despreciable debido a que los términos no se cortan. Pasemos al cálculo de la probabilidad de transición. Para concretar, consideraremos una colisión de segunda especie. Según la fórmula general (43.l), la probabilidad buscada viene determinada por Ja expresión w = 27TI h f Xnuc,2""V(r)xnuc,1 dr 12, (90.3) donde Xnuc = f'I/Jnuc { l/'nuc es la función de onda del movimiento radial de los núcleos), y V(r) es la energía de perturbación (como magnitud v en (43.1 ), elegimos la energía E e integramos respecto de ella). La función de onda final Xnuc, 2 debe normalizarse respecto de la función <5 de la energía. La función cuasiclásica (47.4a), normalizada de esta manera, tiene la forma: 2 Xnuc,2 J- 1 = 1TnV2 COS {n- f r a, P2 dr-i7T i.) (90.4) (el factor de normalización se determina mediante la regla indicada al final del § 21). La función de onda del estado inicial la escribiremos, en cambio, en la forma: Predisociación 2 1 377 r cosÍl-f P1 dr-!1r l. VV1 /i ) Xnuc,l = - (90.5) ª1 Ésta se ha normalizado de manera que la densidad de corriente sea igual a la unidad en cada una de las ondas móviles en las que se descompone la onda estacionaria (90.5); v1 y v 2 son las velocidades del movimiento relativo radial de los núcleos. Substituyendo estas funciones en (90.3), se obtiene la probabilidad de transidón sin dimensiones, w. Podemos considerar w como probabilidad de transición para un doble paso de los núcleos por el punto r = r 0 (punto de intersección de los niveles); hay que tener en cuenta que la función de onda (90.5) corresponde, en cierto sentido, a un doble paso por este punto, ya que contiene tanto la onda incidente como la onda reflejada. El elemento de matriz de V(r), calculado mediante las funciones (90.4-5), presenta en el integrando un producto de cosenos que se puede desarrollar en cosenos de la suma y de la diferencia de los argumentos. Al integrar en torno del punto r = r O de intersección de los términos, sólo cuenta el segundo coseno, de modo que se obtiene: f w = -4 n2 1 cos [1- n Jrp ª1 1 dr--1 /i Jrp drJV(r) dr 12. 2 V(V¡V2) ª• La integral converge rápidamente al alejarnos del punto de intersección. Por ello cabe desarrollar el argumento del coseno en potencias de ~ = r - rO y efectuar la integración respecto de t entre los límites - = y +=(substituyendo al mismo tiempo el coeficiente lentamente variable del coseno por su valor para r = ; 0). Teniendo en cuenta que en el punto de intersección es Pi = p 2 , encontramos: donde S 0 es el valor de la diferencia de las integrales en el punto r = r0 • La derivada del impulso se puede expresar en función de la fuerza F = - dU/dr; derivando la 2 igualdad }!J___ + U1 2µ De esta manera, 2 = p 2 + V 2 (p es la masa reducida de los núcleos), se obtiene: 2µ La molécula diatómica 378 (ves el valor común de v 1 y v 2 en el punto de intersección). La integración se efectúa mediante la conocida fórmula 00 J cos(,x+¡¡~) d! = Ji cos(,xH,r), -co y obtenemos en definitiva: (90.6) La cantidad S0 /ñ es grande y varía rápidamente al cambiar la energía E. Por ello, al promediar, incluso en un intervalo no muy grande de energías. se puede substituir el cuadrado del coseno por su valor medio. Se obtiene así la fórmula (90.7) (L LANDAU, 1932). Todas las cantidades que aparecen en el segundo miembro de la igualdad se toman en el punto de intersección de las curvas de la energía potencial. Al aplicar estas consideraciones a la predisociación, nos interesa la probabilidad de desintegración de la molécula por unidad de tiempo. En su movimiento de vibración, los núcleos pasan 2·<•42n veces, por unidad de tiempo, por el punto r = r0 ((1) es la pulsación de las vibraciones). La probabilidád buscada de predisociación se obtiene, por ello, multiplicando w (probabilidad de un doble paso) por <•> 2n, es decir, es igual a: (90.8) Acerca de todos estos cálculos es necesario hacer la siguiente observación. Al hablar de intersección de los términos nos referíamos a los valores propios del hamiltoniano « no perturbado» f/ 0 del movimiento electrónico en la molécula, hamiltoniano en el que no se han tenido en cuenta los términos V que conducen a las transiciones consideradas. Pero si incluimos estos términos en el hamiltoniano, será imposible que los términos se corten y las curvas se separan un poco (conforme representa la fig. 31 ). Esto se sigue de los resultados del 79, considerados desde un punto de vista un tanto distinto. * Sean U.1i(r) y U.1 2(r) dos valores propios del operador H0 (en el que r se considera como un parámetro). En un dominio próximo al punto r 0 de intersección de las curvas U.1 1(r) y U., 2(r), para determinar los valores propios U(r) del operador perturbado R0 +·P hay que utilizar el método expuesto en el* 79, con lo que se ohtiene la fórmula 379 Predisociación (los elementos de matriz V11 , V22 , V12 , como los propios U.lJ, U. 12 , son funciones de r). El intervalo entre dos niveles es ahora igual a: (90.10) Vemos así que si existen transiciones entre ambos estados (et elemento de matriz V12 es diferente de cero), los niveles dejan de cortarse. La distancia mínima entre las curvas será ahora igual a: - - - - - - - - - - -E r r¡, FIG. 31 Las fórmulas obtenidas antes para la probabilidad de transición son aplicables solamente en tanto que la « divergencia » de las curvas sea suficientemente pequeña. Pero si ésta llega a ser considerable, la probabilidad de transición no se puede calcular mediante la teoría ordinaria de perturbaciones. Para investigar esta cuestión aplicaremos el siguiente método (C. ZENER, 1932). Sean lf'i, 11 12 las funciones de onda de los estados electrónicos que corresponden a los términos « no perturbados» U. 11 y U. 12 , es decir, estas funciones son soluciones de las ecuaciones Hof1 = UJ1!f1, Hof2 = UJ21f2· Para la solución de la ecuación de onda perturbada ili o'Y/ot = (fl0 + t>)'Y buscaremos una expresión de la forma: (90.11) 380 La molécula diatómica Substituyéndola en la ecuación de onda, multiplicando ésta primero por VJ 1 y luego por 1.p2 e integrando, obtenemos dos ecuaciones para las funciones h 1(t) y h2(t): (90.12) (hemos incluido Vu, V22 en U.Ji, U. 12 , y V12 se ha representado simplemente por V(r), en correspondencia con las notaciones de las fórmulas anteriores). El movimiento de los núcleos lo consideramos en la aproximación cuasiclásica ~ de acuerdo con esto, las variables r y t están ligadas entre sí por la relación dr/dt = v, donde v es la velocidad clásica de los núcleos. Cerca del punto r 0 de intersección de las curvas UJ 1(r) y U.1 2 (r) (representadas por puntos en la fig. 31) se puede desarrollar U. 11 y U., 2 en seiie de potencias de E = = r - r0 , escribiendo (90.13) donde U. 1 es el valor común de U.1 1 y U.1 2 en el punto r =-= r 0 y hemos introducido la notación F., = - (8U.1/ór),.0 • Introduciendo también en vez de las cantidades h 1, b 2 nuevas incógnitas a 1, a 2 de .acuerdo con (90.14) y substituyendo la derivación respecto de t por la derivación respecto de ~ (d/dt = = vd/d~), obtenemos las ecuaciones (90.12) en la forma: (90.15) (para v y V basta tomar, con precisión suficiente, sus valores en el punto de intersección). Si se resuelven las ecuaciones (90. I 5) con las condiciones de contorno a 1 = 1, 2 a 2 = O para t -:,- + =, ia 1( determina la probabilidad de que al pasar los núcleos por el punto ~ = O la molécula permanezca en el estado electrónico 'Pi, lo que significa pasar de la curva 12' a la curva 21' (véase fig. 31). Análogamente, ial- 00)¡ 2 = 1 - ja1( - =)\2 es la probabilidad de la transición al estado electrónico lf'z, es decir, la probabilidad de que la molécula permanezca sobre la curva 12'. En cambio, el paso de la curva I a la curva 2 (para ~ --~--:- Y)) mediante el doble paso por el punto de intersección se puede efectuar de dos maneras: o bien mediante I --+ l' --+ 2 (al acercarse los núcleos tiene lugar el paso de la curva I 2' a la curva 21 ', y al separarse los mismos la molécula permanece sobre la curva 21 '), o bien mediante I --+ 2' --+ 2. Por ello la probabilidad buscada de dicha transición es =)\ No nos detendremos aquí a exponer la marcha de la resolución de las ecuaciones (90.15) (se reducen a una ecuación de segundo orden que se puede resolver siguiendo 381 Predisociación el método de Laplace) y únicamente daremos el resultado final (1): lai(- 00)12 = (la diferencia esta manera e-21TV2;11,v1F.-F1i F., 2 - F.'1 se substituye por la diferencia F2 - F1 , igual a ella). De (90.16) Vemos así que la probabilidad de la transición considerada es pequeña en ambos casos límite -- para valores suficientemente pequeños y para valores suficiente mente grandes de V. Para V 2 ~ ñv¡F2 -F1 1, la fórmula (90.16) se reduce a la (90.7). Finalmente, consideremos el fenómeno de las llamadas perturbaciones en el espectro de las moléculas diatómicas, fenómeno emparentado con el de la predisociación. Si dos niveles moleculares discretos E1 y E2 , que corresponden a dos términos electrónicos que se cortan, son próximos entre sí, la posibilidad de la transición entre ambos estados electrónicos conduce a un desplazamiento de los niveles. Según la fórmula general de la teoría de perturbaciones (79.4), para los niveles desplazados tenemos la expresión (90.17) donde V12 , 11111 • es el elemento de matriz de la perturbación para la transición entre los estados moleculares I y 2 (los elementos de matriz V11 , 11111 • y V22 • 11111., en cambio, deben incluirse, evidentemente, en E1 y E 2 ). Esta fórmula nos hace ver que ambos niveles se ramifican, desplazándose en sentidos opuestos (el mayor nivel aumenta, el menor. disminuye). El valor del desplazamiento es tanto mayor cuanto menor es la diferencia IE 1 - Ezl. El elemento de matriz V12 ,nul' se calcula exactamente de la misma manera como se determinó antes la probabilidad de una colisión de segunda especie. La diferencia consiste tan sólo en que las funciones de onda lnut·•i y 7. 1111 (', 2 corresponden al espectro discreto y deben normalizarse, por consiguiente, a la unidad. Según (48.3), tenemos para estas funciones: J l !i f ) r Xnuc,1 = 2w1 (1 7TV¡ COS P1 dr-b f , a1 J 2 Xnuc,2 = 2 w cos 1TV2 1 ( ) Véase C. ZFNfR, r j~ ln f P dr-vr ~. 2 ª2 Proc. Roy. Soc. A 137, 696, 1932. J 382 La molécula diatómica La comparación con las fórmulas (90.3-5) prueba que el elemento de matriz ahora considerado, V12,nue, está ligado con la probabilidad H' de la transición en un doble paso por el punto de intersección por la relación (90.18) PROBLEMAS 1. Determinar la sección eficaz total de las colisiones de segunda especie en función de la energía cinética E de los átomos que chocan y para transiciones ligadas con la interacción spinórbita. Solución. Teniendo en cuenta el carácter cuasiclásico del movimiento de los núcleos, es posible introducir el concepto de « parámetro de impacto»(! (es decir, el de distancia a que pasarían los núcleos uno de otro si no existiera interacción entre ellos) y determinar la sección eficaz da como producto del « área de impacto» 2n(! d(! por la probabilidad de la transición w((!) correspondiente a una colisión (1). La sección eficaz total a resulta integrando respecto de (!. Para la interacción spin-órbita, el elemento de matriz V(r) no depende del momento cinético M de los átomos que chocan. Escribamos la velocidad v en el punto r = r0 de intersección de las curvas en la forma: v = v[(2/µ)(E-U-M 2/2µr 02 )] = v[(2/µ)(E- U-p 2E/r0 2 )]. U es aquí e. valor común de U1 y U2 en el punto de intersección, pes· la masa reducida de los átomos y el momento cinético M = f'(]Voo (voo es la velocidad relativa de los átomos en el infinito). El origen de energías lo elegiremos de manera que la energía de interacción de los átomos en el estado inicial sea igual a cero en el infinito; entonces E = ¡1.r/2=/2. Substituyendo en (90. 7) encontramos: da = 27Tp dp. w 81r2 V2 pdp lílF2-F1I v[2(E- U-p 2E/rl)/µ] La integración respecto de (! hay que efectuarla entre los límites cero y el valor de (! para el cual la velocidad v es nula. Como resultado se obtiene: 4y(2µ)7T 2 V2r02 v(E-U) (j = ------- ----- h!F2-F1I E 2. El mismo problema para las transiciones ligadas con la interacción de la rotación de la molécula con el momento cinético orbital. Solución. El elemento de matriz V tiene la forma V(r) = M D/¡u- 2 , donde D(r) es el elemento de matriz del momento cinético orbital de los electrones. Siguiendo el mismo método que en el problema 1, obtenemos: 16y27T2D 2 (E- U)s/2 3hvµIF2-F1l E ------(1) Cf. tomo 1, Mecánica,§ 18. 383 Predisociación 3. Determinar la probabilidad de transición para energías E próximas al valor U. 1 de la energía potencial en el punto de intersección. Solución. Para valores pequeños de E - UJ la fórmula (90.7) no es aplicable, ya que es imposible considerar constante la velocidad de los núcleos v cerca del punto de intersección y, por ello, es asimismo imposible sacarla fuera de la integral, como se hizo al deducir (90.7). Cerca del punto de intersección substituiremos las curvas de U. 11 , VJ 2 por las rectas (90. 13). Las funciones de onda Znuc 1 y Znuc 2 coinciden en esta región con las funciones de onda del movimiento unidimensional en un campo uniforme (§ 24). El cálculo se efectúa de manera fácil mediante las funciones de onda en la representación de impulsos. La función de onda normalizada respecto de la función a de la energía tiene la forma (véase el problema del § 24): ( i 1 y(21rñlFJ 2 1) ) exp-l: -[(E- UJ)p-ps/6µ,]),., ñFJ 2 y la función normalizada a la densidad de corriente unidad en las ondas incidente y reflejada se obtiene multiplicando por l' 2nh: Al integrar, la energía de perturbación V (el elemento de matriz) se puede de nuevo sacar fuera de la integral substituyéndola por su valor en el punto de intersección: ~Jv f CX) w = a,a,• dp/'. -co Se obtiene así: donde <l>(.;) es la función de Airy (véase § b de los apéndices matemáticos). Para grandes valores de E - UJ esta fórmula pasa a ser la (90. 7). CAPÍTULO XII TEORÍA DE LA SIMETRÍA § 91. Transformaciones de simetría La clasificación de los términos de una molécula poliatómica está ligada de manera esencial, como en el caso de la molécula diatómica, con su simetría. Por ello comenzaremos con un estudio de los tipos de simetría que puede presentar una molécula. La simetría de un cuerpo viene determinada por el conjunto de aquellas transformaciones que llevan al cuerpo a coincidir consigo mismo; estas transformaciones se llaman transformaciones de simetría. Cada una de las posibles transformaciones de simetría se puede representar como combinación de una o algunas transformaciones pertenecientes a tres tipos fundamentales. Estos tipos esencialmente distintos, son: la rotación del cuerpo en torno de un cierto eje y de ángulo determinado, la reflexión en un cierto plano y la translación del cuerpo en cierta dirección a una cierta distancia. De ellos, únicamente pueden presentar el último tipo de simetría los cuerpos de extensión infinita (red cristalina), evidentemente. En cambio, un cuerpo de dimensiones finitas (en particular, una molécula), puede ser simétrico tan sólo respecto de las rotaciones y las reflexiones. Si un cuerpo pasa a coincidir consigo mismo en una rotación en torno de un cierto eje y de amplitud 2n/n, este eje se llama eje de simetría n-aria. El número n puede tomar cualquier valor entero: 11 = 2, 3, ... ; el valor 11 = 1 corresponde a una rotación de ángulo 2n o, lo que es lo mismo, de ángulo nulo, es decir, corresponde a Ja transformación idéntica. La operación definida por la rotación en torno del eje dado de ángulo 2n/ n la represen.taremos simbólicamente por C n- Repitiendo esta operación dos, tres, ... veces, obtenemos rotaciones de ángulos 2(2n/n), 3(2n/n), ... , que hacen coincidir el cuerpo consigo mismo; estas rotaciones se pueden representar en la forma C11 2, C,,3, ... Es evidente que si n es un múltiplo de p, se tendrá CnP = cn/11· (91.1) En particular, aplicando la rotación n veces, volvemos a la posición de partida, es decir, aplicamos la transformación idéntica; esta última se suele designar por E, o sea, se puede escribir: Transformacione.-. de simetría 385 (91.2) Si el cuerpo pasa a coincidir consigo mismo en una reflexión en un cierto plano, este plano se llama plano de simetría. La operación de reflexión en un plano la designaremos con el símbolo a. Es evidente que la doble reflexión en un plano es la transformación idéntica: cr 2 = E. (91.3) la aplicación simultánea de ambas transformaciones - rotación y reflexión conduce a lo que se llama un eje de giro reflejado. Un cuerpo presenta un eje n-ario de giro reflejado si pasa a coincidir consigo mismo en una rotación en torno de este eje de ángulo 2n/n seguida de una reflexión en un plano perpendicular al eje (fig. 32). Es fácil comprender que ésta es una nueva forma de simetría tan sólo cuando n es un número par. En efecto, sin es un número impar, aplicar n veces el giro reflejado equivaldrá, simplemente, a la reflexión en un plano perpendicular al eje (ya que el ángulo de rotación será igual a 2n y un número impar de reflexiones en un mismo plano es una simple reflexión). Repitiendo esta transformación todavía n veces, Jlegamos al resultado de que un eje de giro reflejado se reduce a la existencia simultánea de un eje de simetría n-ario y de un plano de simetría perpendicular al mismo independientes. Si, en cambio, n es un número par, aplicar n veces la transformación reflexión-rotación vuelve el cuerpo a su posición inicial. ~--.--.op , 2rr/n ') Fm. 32 La transformación reflexión-rotación la designaremos con el símbolo S,,. Representando la reflexión en un plano perpendicular a un eje dado por a11., podemos escribir, por definición: (91.4) (el orden en que se aplican las operaciones C11 y ah no influye, evidentemente, en el resultado). 386 Teoría de la simetría Un caso particular importante es el de un eje de giro reflejado binario. Es fácil ver que una rotación de ángulo n seguida de la reflexión en un plano perpendicular al eje de rotación es precisamente la operación inversión, en la que un punto P del cuerpo se transforma en otro punto P' que se encuentra sobre la recta que une el punto P con el punto O de intersección del eje con el plano y tal que las distancias OP y OP' son iguales. De un cuerpo que es simétrico respecto de esta transformación se dice que posee un centro de simetría. Representaremos la operación inversión por el símbolo I; tenemos: (91.5) Es evidente también que /ah = C2 , IC2 = a¡¡; con otras palabras, un eje binario, un plano de simetría perpendicular al mismo y un centro de simetría en el punto de su intersección, dependen entre sí: la existencia de dos cualesquiera de estos elementos conduce automáticamente a la existencia del tercero. Señalaremos aquí toda una serie de propiedades puramente geométricas de las rotaciones y las reflexiones que conviene tener presente al estudiar la simetría de los cuerpos. La aplicación de dos rotaciones en torno de ejes que se cortan en un cierto punto es una rotación en torno de un tercer eje que pasa por el mismo punto. El producto de dos reflexiones en planos que se cortan es equivalente a una rotación; el eje de esta rotación, evidentemente, coincide con la recta de intersección de los planos y el ángulo de rotación es igual, como es fácil ver mediante una simple construcción geométrica, al doble del ángulo formado por los dos planos. Si designamos el giro de ángulo <p en torno de un eje por C(<p) y la reflexión en dos planos que pasan por este eje mediante lm símbolos a,1 y a' 11 (1), la proposición que acabamos de enunciar se puede escribir en la forma: (91.6) donde <pes el ángulo formado por los dos planos. Es necesario observar que el orden en que se aplican las dos reflexiones no es indiferente: el producto a,/a 11 equivale a un giro en el sentido que lleva del plano a'n al av, y al permutar los factores obtenemos un giro de sentido contrario. Multiplicando la igualdad (91.6) a la izquierda por rrn, se obtiene: (91.7) con otras palabras, aplicar una rotación y una reflexión en un plano que pasa por el eje equivale a la reflexión en otro plano que corta al primero formando un ángulo igual a la mitad del ángulo de rotación. En particular, de aquí se sigue que un eje de simetría binario y dos planos de simetría perpendiculares entre sí que pasan (1) Con el índice v se suele distinguir la reflexión en un plano que pasa por el eje dado (plano« vertical»), y con el índice h, la reflexión en un plano perpendicular al eje (plano «horizontal»). Tram,f ormaciones de simetría 387 por él dependen entre sí: la existencia de dos de ellos implica la existencia del tercero. Demostremos que el producto de dos rotaciones de ángulo n en torno de dos ejes que se cortan formando el ángulo </> ( Oa y Oh en la fig. 33) es una rotación de ángulo 2</> en torno de un eje perpendicular a los dos primeros (PP' en la fig. 33). En efecto, es claro desde luego que la transformación resultante es también una rotación; después de la primera rotación (en torno de Oa) el punto P pasa a coincidir con P', y después de la segunda (en torno de Oh) vuelve a la posición de partida. Esto significa que la recta PP' no cambia y, por consiguiente, es un eje de rotación. Para determinar el ángulo de giro basta observar que en la primera rotación el eje Oa queda en reposo, y que después de la segunda pasa a ocupar la posición Oa', que forma con Oa el ángulo 2</>. De la misma manera es fácil comprobar que al permutar el orden en que se aplican ambas transformaciones obtenemos una rotación en sentido contrario. p p' FIG. 33 Aunque el resultado de dos transformaciones sucesivas depende, en general, del orden en que se aplican, hay muchos casos en que el orden de las operaciones carece de importancia -- las transformaciones son conmutables. Esto ocurre para las siguientes transformaciones: I) dos rotaciones en torno de un mismo eje; 2) dos reflexiones en planos perpendiculares entre sí (equivalen a un giro de ángulo n en torno de la recta de intersección de los dos planos); 3) dos rotaciones de ángulo n en torno de dos ejes perpendiculares entre sí (equivalentes a una rotación de ángulo igual en torno de un tercer eje perpendicular a aquéllos); 4) rotación y reflexión en un plano perpendicular al eje de rotación; 5) una rotación (o una reflexión) cualquiera y la inversión respecto de un punto que se encuentra sobre el eje de rotación (o en el plano de reflexión); esto se sigue de l y 4. 388 § 92. Teoría de la simetría Grupos de transformaciones El conjunto de todas las transformaciones de simetría de un cuerpo dado se llama su grupo de transformaciones de simetría o, simplemente, su grupo de simetrías. Hemos hablado antes de estas transformaciones como cambios geométricos del cuerpo. En las aplicaciones a la mecánica cuántica es más conveniente, sin embargo, considerar las transformacior..:s de simetría como transformaciones de coordenadas que dejan invariante el hamiltoniano del sistema en cuestión. Es evidente que si el sistema pasa a coincidir consigo mismo en un cierto giro, la correspondiente transformación de coordenadas no cambia su ecuación de ScHRODINGER. Hablaremos así de un grupo de transformaciones respecto del cual es invariante la ecuación de SCHRODINGER de que se trate (1). El estudio de los grupos de simetrías conviene esfectuarlo con ayuda del formalismo matemático general de la teoría de grupos, cuyos fundamentos exponemos a continuación. Consideraremos primero los grupos que contienen un número finito de transformaciones diferentes (los llamados grupos finitos). De cada una de las transformaciones que forman parte del grupo se dice que es un elemento del grupo. Los grupos de simetrías poseen las siguientes propiedades evidentes. De cada grupo forma parte la transformación idéntica E (que se llama elemento unidad del grupo). Los elementos del grupo se pueden <<multiplicar>> entre sí; se entiende por producto de dos ( o de varias) transformaciones del grupo el resultado de su aplicación sucesiva. Es evidente que el producto de dos elementos del grupo es un elemento del propio grupo. En la multiplicación de elementos vale la ley asociativa (AB)C = A(BC), donde A, B, C son elementos del grupo. En cambio, la ley conmutativa en general no se cumple; en el caso general es AB i= BA. Para cada elemento del grupo, A, existe en el propio grupo el elemento inverso A-1 (la transformación inversa), tal que AA-1 = E. En algunos casos un elemento puede coincidir con su inverso, en particuiar E-1 = E. Es evidente que dos elementos A y A-1 inversos el uno del otro conmutan entre sí. (1) Este punto de vista permite incluir en los razonamientos no sólo los grupos de las rotaciones y de las reflexiones, de los que tratamos aquí, sino también otros tipos de transformaciones que dejan invariante la ecuación de ScHRODINGER. A ellos pertenecen las permutaciones de las coordenadas de las partículas idénticas que forman parte del sistema dado (la molécula o el átomo). Del conjunto de todas las permutaciones posibles de partículas idénticas en el sistema considerado se dice que constituye su grupo de permutaciones (tratamos ya de él en el § 63). Las propiedades generales de los grupos que se presentan a continuación valen también para los grupos de permutaciones; no nos ocuparemos aquVen estudiar más detenidamente este tipo de grupos. Acerca de las notaciones que hemos adoptado en este capítulo hay que hacer la siguiente observación. Las transformaciones de simetría son, en esencia, operadores como los que hemos considerado todo a lo largo del libro (en particular, el operador de inversión, se estudió ya en el§ 30). Por ello habría que designarlos por letras con circunflejo. No lo haremos así; tanto para respetar la notación generalmente admitida, como teniendo en cuenta el hecho de que ello no puede conducir a confusiones en el presente capítulo. Por la misma razón, para representar la transformación idéntica utilizamos el símbolo E, y no 1, como correspondería a las notaciones empleadas en los demás capítulos. Grupos de transformaciones 389 El elemento inverso del producto AB de dos elementos es igual a (AB)- 1 = B-IA-1, y análogamente para el producto de un mayor número de elementos; es fácil comprobarlo efectuando el producto y utilizando la propiedad asociativa. Si todos los elementos de un grupo conmutan entre sí, este grupo se llama abeliano. Un caso particular de grupo abeliano lo constituyen los grupos cíclicos. Se entiende por grupo cíclico un grupo cuyos elementos se pueden obtener elevando a las sucesivas potencias uno de los elementos del grupo, es decir, un grupo formado por los elementos donde n es un número entero. Sea G un cierto grupo (1 ). Si es posible separar de él un conjunto de elementos H tal que este conjunto forme también un grupo, el grupo II se llama subgrupo del grupo G. Un mismo elemento del grupo puede pertenecer a diferentes subgrupos. Si se elige un elemento cualquiera A del grupo y lo elevamos a potencias sucesivas, obtendremos finalmente el elemento unidad (ya que el número total de elementos del grupo es finito). Si n es el menor número para el cual A 11 = E, el número n se llama orden del elemento A, y el conjunto de los elementos A, A 2 , ••• , An = E, período de A. El período se representa por {A}; forma a su vez un grupo, es decir, es un subgrupo del grupo inicial, y, además, un subgrupo cíclico. Para verificar si un conjunto dado de elementos de un grupo forma un subgrupo del mismo, basta comprobar si al multiplicar dos cualesquiera de sus elementos se obtiene un elemento que pertenece al mismo conjunto. En efecto, si así ocurre, con cada elemento A se tendrán también todas sus potencias, entre ellas A11 - 1 (n es el orden del elemento) que representa el papel de inverso (ya que All-IA = An = E); en él se tendrá también, evidentemente, el elemento unidad. El número total de elementos del grupo se llama orden del grupo. Es fácil ver que el orden de un subgrupo es un divisor del orden del grupo. Para ello consideremos un subgrupo H del grupo G y sea G1 un elemento del grupo G que no pertenezca a H. Multiplicando todos los elementos de H por G1 (por ejemplo, a la derecha), obtenemos un conjunto de elementos (o, como se suele decir, un complejo) que representaremos por JIG 1 . Todos los elementos de este complejo pertenecen, evidentemente, al grupo G. Sin embargo, ninguno de ellos pertenece a ll; en efecto, si para dos elementos Ha, Hb de H fuera HaG 1 = H¡,, de aquí se seguiría G1 = Ha- 1 H1,, (1) Representaremos simbólicamente los grupos por negrillas en cursiva. 390 Teoría de la simetría es decir, G1 también pertenecería al subgrupo H, en contra de lo supuesto. Análogamente se puede demostrar que si G2 es un elemento del grupo G, que no pertenece ni a JI ni a HG1, ningún elemento del complejo HG 2 pertenecerá ni a JI ni a JIG1. Continuando este proceso agotaremos finalmente todos los elementos del grupo finito G. De esta manera todos los elementos se reparten entre los complejos H, HGi, HG2• ••• , HGm (donde mes un cierto número), cada uno de los cuales contiene h elementos, donde h es el orden del subgrupo JI. De aquí se sigue que el orden g del grupo Ges g = hm, como se trataba de demostrar. Si el orden de un grupo es un número primo, de lo que acabamos de demostrar se deduce que este grupo no posee ningún subgrupo (salvo E y el propio grupo). Es también válida la proposición recíproca: todo grupo que carece de subgrupos es de orden primo y, además, debe ser cíclico (de no serlo, contendría elementos cuyos períodos constituirían subgrupos). Introduzcamos el importante concepto de elementos conjugados: dos elementos A y B se llaman conjugados entre sí si se tiene A= CBC- 1 , donde C es también un elemento del grupo (multiplicando la igualdad anterior a la derecha por C y a la izquierda por c-1 obtenemos la igualdad inversa B = c-1 AC). Una propiedad fundamental de la conjugación consiste en que si A es conjugado con B, y B lo es con C, A es conjugado con C; en efecto, de B = p-1 AP, C = Q-1 BQ (donde P, Q son elementos del grupo) se sigue que C = (PQ)- 1A(PQ). Por esto se puede hablar del conjunto de los elementos del grupo que son conjugados entre sí. Estos conjuntos de elementos se llaman clases del grupo. Cada clase viene por completo determinada por uno cualquiera de sus elementos A; en efecto, dado A obtenemos toda la clase formando los productos GAc-1, donde Ges uno cualquiera de los elementos del grupo (con ello, claro está, cada elemento de la clase se puede obtener más de una vez). De esta manera cabe descomponer todo el grupo en clases; cada elemento del grupo puede pertenecer, evidentemente, tan sólo a una clase. El elemento unidad del grupo forma de por sí una clase, ya que para cualquier elemento del grupo GEG-1 == E. Si el grupo es abeliano, lo mismo vale para cada uno de sus elementos; dado que todos los elementos de un grupo de este tipo conmutan, por definición, entre sí, cada elemento es conjugado tan sólo consigo mismo y constituye así, él sólo, una clase. Hay que subrayar que una clase de un grupo (que no coincida con E) no es nunca un subgrupo; ello resulta claramente de que no contiene el elemento unidad. Todos los elementos de una misma clase poseen el mismo orden. En efecto, Grupos puntuale... 391 sin es el orden del elemento A (de forma que An = E), igual ocurrirá con el elemento conjugado B = CAC-1 : (CAC-1)11 = CAnc-1 = E. SeaH un subgrupo de G y G1 un elemento de G que no pertenezca aH. Es fácil comprobar que el conjunto de elementos G1I1G 1- 1 satisface todas las condiciones que caracterizan un grupo, es decir, dicho conjunto es un subgrupo del grupo G. Los subgrupos JI y G1I1G- 1 se califican de conjugados; cada elemento de uno de ellos es conjugado con un elemento del otro grupo. Dando a G 1 diferentes valores, obtenemos toda una serie de subgrupos conjugados que, en parte, pueden coincidir unos con otros. Puede ocurrir que todos los subgrupos conjugados con lJ coincidan con JI. En este caso 11 se llama divisor normal del grupo G. Así, por ejemplo, todo subgrupo de un grupo abeliano es, evidentemente, un divisor normal del mismo. Consideremos un grupo A con n elementos A, A', A", ... y un grupo R con 111 elementos B, B', B", ... y supongamos que todos los elementos de A (salvo el elemento unidad E) son diferentes de los elementos de R y que conmutan con ellos. Si multiplicamos cada elemento del grupo A por cada elemento del grupo B, obtenemos un conjunto de nm elementos que forman también un grupo. En efecto, para cada dos elementos de este conjunto tenemos AB·A'B'=AA'·BB'=A"B", es decir, de nuevo un elemento del mismo conjunto. El grupo de orden nm así obtenido se designa por A X B y se llama producto directo de los grupos A y B. Finalmente, introduzcamos el concepto de isomorfismo de dos grupos. Dos grupos A y B del mismo orden se llaman isomo,fos si entre sus elementos es posible establecer una correspondencia biunívoca tal que si al elemento A corresponde el elemento By al elemento A' el elemento B', al elemento A" == AA' corresponde el elemento B" = BB'. Dos de tales grupos, considerados en abstracto, poseen, evidentemente, las mismas propiedades, aunque el significado concreto de sus elementos sea diferente. § 93. Grupos puntuales Las transformaciones que forman parte del grupo de simetrías de un cuerpo de dimensiones finitas (en particular, de una molécula), deben ser tales que por lo menos un punto de éste quede en reposo al aplicar una cualquiera de dichas transformaciones. Con otras palabras, todos los ejes y planos de simetría de una molécula deben tener por lo menos un punto de intersección común. En efecto, la rotación sucesiva de un cuerpo en torno de dos ejes que no se cortan o la reflexión del mismo en dos planos que no se cortan, conduce a un movimiento del cuerpo que no puede, evidentemente, llevarlo a coincidir consigo mismo. Los grupos de simetrías que poseen aquella propiedad se llama grupos puntuales. 392 Teoría de la simetría Antes de pasar a la construcción de los tipos posibles de grupos puntuales, expondremos un simple método geométrico que permite clasificar fácilmente en clases a los elementos de un grupo. Sea Oa un cierto eje y A un elemento del grupo que representa precisamente una rotación de determinado ángulo en torno de este eje. Sea, además, G una transformación del mismo grupo (rotación o reflexión), que aplicada al mismo eje Oa lo lleva a la posición Ob. Demostremos que el elemento B = GAG·-1 corresponde entonces a una rotación en torno del eje Ob de ángulo igual al que el elemento A hace girar e'1 torno de Oa. En efecto, consideremos el efecto de la transformación GAG-1 sobre el propio eje Ob. La transformación c-1 , inversa de G, lleva el eje Ob a la posición Oa, de modo que la rotación siguiente A Jo mantiene en esta posición; finalmente, G lo vuelve a la posición de partida. De esta manera, como resultado de la operación, el eje Ob sigue en el mismo sitio, de modo que B es una rotación en torno de este eje. Dado que A y B pertenecen a la misma clase, el orden de estos elementos es el mismo; esto significa que determinan una rotación de ángulo igual. Llegamos así al resultado de que dos rotaciones de igual ángulo pertenecen a una misma clase si entre los elementos del grupo existe una transformación mediante la cual uno de los ejes de rotación se puede hacer coincidir con el otro. Exactamente de la misma manera es posible demostrar que también dos reflexiones en planos distintos pertenecen a una misma clase si una cierta transformación del grupo lleva a uno de los planos a coincidir con el otro. De los ejes o de los planos de simetría que se pueden llevar a coincidir uno con otro se dice que son equivalentes. Algunas observaciones más son necesarias en el caso en que ambas rotaciones se efectúan en torno de un mismo eje. El elemento inverso de la rotctción C,/' (k = l, 2, ... , n - l) en torno de un eje de simetría n-ario es el elemento c 11 -k = C,/l-k, es decir, la rotación de ángulo (n - k) · (2n/n) en el mismo sentido o, lo que es lo mismo, la rotación de ángulo 2kn/n en sentido contrario. Si entre las transformaciones del grupo existe una rotación de ángulo n en torno de un eje perpendicular a aquél (una tal rotación cambia el sentido del eje considerado en el sentido contrario), según la regla general ya demostrada las rotaciones C,/' y C11 -k pertenecerán a la misma clase. La reflexión a1z en un plano perpendicular al eje cambia también su sentido en el opuesto; sin embargo, hay que tener presente que la reflexión cambia el sentido de la rotación. Por ello la existencia de ah no hace que los elementos C,/" y c 11 -k sean conjugados. En cambio, la reflexión en un plano que pasa por el eje no altera el sentido de éste, pero cambia el sentido de la rotación, y por ello c/1-k = ª1,C,/"av, de forma que cuando existe un tal plano de simetría, e,/ Y c/1-k pertenecen a una misma clase. Si las rotaciones en torno de un eje, de ángulos iguales y sentidos contrarios, son conjugadas, este eje se llamará bilateral. La determinación de las clases de un grupo puntual se facilita con frecuencia por la siguiente regla. Sea G un cierto grupo que no contiene la inversión /, y C¡ Grupo.~ puntuales 393 el grupo formado por los dos elementos I y E. Entonces el producto directo G >< ( '; es un grupo que contiene un número doble de elementos que el G; la mitad de ellos coinciden con los elementos del grupo G y los demás se obtienen multiplicando estos últimos por /. Dado que I conmuta con cualquier otra transformación del grupo puntual, es claro que el grupo G >< ( '¡ contiene un número de clases doble que el G; a cada clase ...-1 del grupo G corresponden en el grupo G x C; dos clases: la .-1 y la A l. En particular, la inversión 1 siempre constituye de por sí una clase. Pasemos ahora a enumerar todos los posibles grupos puntuales. Los construiremos empezando por los más simples, añadiéndoles luego nuevos elementos de simetría. Los grupos puntuales los designaremos por carácteres cursivos en negrillas con los correspondientes índices. l. Grupos C 11 El tipo más simple de simetría posee solamente un eje de simetría de orden n. El grupo C 1 es el grupo de las rotaciones en torno de un eje n-ario. Este grupo, evidentemente, es cídico. Cada uno de sus 11 elementos forma de suyo una clase. El grupo ('1 contiene solamente la transformación idéntica, E, y corresponde a la ausencia total de simetría. I l. Grupo S 2n El grupo S 211 es el grupo de las rotauones en torno de un eje de giro reflejado de orden par 211. Contiene 211 elementos y es, evidentemente, cíclico. En particular, el grupo S 2 contiene tan sólo dos elementos: E e 1; se le representa también por C;, Observemos también que si el orden del grupo es un número de la forma 2n = 4p--;-2. entre sus elementos figura la inversión; es evidente que (Swt2f' 1 +1 = Cp1, = !. Un grupo de estas características se puede escribir como producto directo: S 4p+ 2 = _ X ( '¡; se le designa también por (' 211 +1,;. 211 1 0 (' 111. Grupos C 11 1, Estos grupos se obtienen añadiendo a un eje de simetría n-ario un plano de simetría perpendicular a él. El grupo C 11 1i contiene 2n elementos: las 11 rotaciones del grupo (' 11 y las 11 transformaciones de reflexión-rotación C,/a1i, k = 1, 2, ... , n (entre ellas la reflexión C,/'a 11 = a11 ). Todos los elementos del grupo son conmutables, es decir, el grupo es abeliano; el número de clases es igual al número de el~mentos. Sin es par (n = 2p), el grupo contiene un centro de simetría (ya que C2;/a1i = = C..p1, = 1). El grupo más simple C 11t contiene en total dos elementos: E y a1i; se le representa también por ( \. IV. Grupo (' 1111 Si a un eje de simetría n-ario se añade un plano de simetría que pasa por él, esto 394 TPoria ,/(• la .~imPtria conduce automáticamente a la aparición de otros (11 -- 1) planos que se cortan a lo largo del eje formando üngulos :r n (esto se sigue directamente del teorema geométrico (91.7) demostrado en el ~ 91 (1). El grupo (' 11 " que así se obtiene posee, por consiguiente, 211 elementos: 11 rotaciones en torno del eje n-ario y 11 reflexiones rr,1 en planos verticales. En la fig. 34 se representan como ejemplos los sistemas de ejes y planos de simetría de los grupos ( ':l/! y ( '-tw FIG. 34 Para determinar las clases observemos que, gracias a la existencia de planos de simetría que pasan por el eje de simetría, este eje es bilateral. La clasificación efectiva de los elementos en clases es diferente según 11 sea par o impar. Si n es impar (11 = 2p7 I ), las sucesivas rotaciones C 211 + 1 hacen coincidir cada uno de los planos con todos los restantes 2p planos sucesivamente, de modo que todos los planos de simetría son equivalentes y las reflexiones en ellos conducen a una sola clase. Entre las rotaciones en torno del eje, se tienen 2p operaciones distintas de la idéntica, que son conjugadas dos a dos y forman p clases, cada una de las cuales consta de dos elementos (C 2 µ+/' y C:!,,+ 1-"", k = 1, 2, ... , p); además, E forma una clase separada. De esta manera, en total tenemos p- 2 clases. Si, en cambio, n es par (n = 2p), mediante las sucesivas rotaciones C 21 , se pueden intercambiar solamente pares de planos alternados; dos planos consecutivos no pueden intercambiarse entre sí. De esta manera se tienen dos conjuntos de p planos equivalentes cada uno y, de acuerdo con esto, dos clases de p elementos (reflexiones) cada una. En lo que concierne a las rotaciones en torno del eje, C.21 ?''' = E y C 21 t = C2 cada una constituye una clase de por sí, y las restantes 2p - 2 rotaciones son conjugadas a pares y dan p - I clases de dos elementos cada una. Todo el grupo ( '211 , 11 tiene, por consiguiente, p ~ 3 clases. (') Es fácil ver que e111 un grupo finito no pueden haber dos planos de simetría que se corten formando un úngulo que no sea igual a una fracción racional de 2:r. Del hecho de la existencia de dos de tales planos se seguiría la existencia de un número infinito de otros planos de simetría que -.e cortarían a lo largo de una misma recta y que se obtendrían reflejando un número infini,o de veces un plano en otro. Con otras palabras, la existencia de dos de tales planos conduce inmediatamente a la simetría axil total. Grupo.-; puntuale... 395 V. Grupos 1) 11 Si a un eje de simetría de orden 11 se añade un eje binario perpendicular al primero, esto conduce a la aparición de otros 11 - l ejes del mismo tipo, de forma que en total habrán 11 ejes horizontales de orden dos que se cortan formando ángulos :r n. El grupo 1) 11 que así se obtiene posee 211 elementos: 11 rotaciones en torno del eje 11-ario y 11 rotaciones de ángulo ;-r en torno de los ejes horizontales (convendremos en designar estas últimas por U"!,, conservando la notación C'2 para el giro de ángulo ;-r en torno de un eje vertical). En la fig. 34 se representan, como ejemplo, los sistemas de ejes de los grupos l>:1 y 1) 4 • De manera completamente análoga al caso anterior, se comprueba que el eje de orden 11 es bilateral y que los ejes horizontales binarios son todos equivalentes, si 11 es impar, o forman dos conjuntos no equivalentes, si 11 es par. Por consiguiente, el grupo 1>'2.,i tiene las siguientes p+3 clases: E, 2 clases de p rotaciones 1/2 cada una, la rotación C'2 y p - l clases de dos rotaciones en torno del eje vertical. En cambio, el grupo 1)'211 1 tiene p~2 clases: E, 2p+ l rotaciones 1/2 y p clases de dos rotaciones cada una en torno del eje vertical. Un caso particular importante es el grupo 1)'2. Su sistema de ejes está constituido por tres ejes de segundo orden perpendiculares entre sí. Este grupo se designa también por J'. VI. Grupo /) 1111 Si se añade al sistema de ejes del grupo l)n un plano horizontal de simetría que pasa por los 11 ejes bina:-ios, aparecen con ello automáticamente 11 planos verticales, cada uno de los cuales pasa por el eje vertical y uno de los ejes horizontales. El grupo así obtenido 1) 1111 contiene 411 elementos; además de los 2n elementos del grupo l)m de él forman parte también 11 reflexiones au y 11 giros reflejados C,/'ah. En la fig. 35 se representa el sistema de ejes y planos del grupo 1)311 • ª" La reflexión conmuta con todos los demás elementos del grupo; por ello se puede escribir 1),, 11 como producto directo l)nh = /) 11 x ( \, donde ( 's es el grupo formado por los dos elementos E y a 11 • Para n par, entre los elementos del grupo figura la inversión y se puede escribir también JJ 21 i,h = 1J;,i >< ('¡. De aquí se sigue que el número de clases en el grupo J) 11 1i es igual al doble del número de clases en el grupo l)w La mitad de ellas coincide con las clases del grupo J),, (rotaciones en torno de los ejes), y el resto se obtiene a partir de elias multiplicando por ªh· Las reflexiones a 11 en los planos verticales pertenecen todas a una misma clase (si 11 es impar) o forman dos clases (cuando 11 es par). Las transformaciones de reflexión-rotación a1,Ckn y a1,c-1.,, son conjugadas a pares. 396 Teoría ,le la simetría 02d FIG. 35 VI l. Grupos IJ 11 t1 Existe todavía otra posibilidad de añadir planos de simetría al sistema de ejes del grupo l)w Cabe, en efecto, hacerlos pasar por el eje n-ario bisecando el ángulo entre cada dos ejes horizontales consecutivos de segundo orden. Una vez más, la adición de uno de estos planos trae consigo la aparición de otros n - 1 planos. El sistema que se obtiene de ejes y de planos de simetría determina el grupo D 11 ,1 (en la fig. 35 se representan los ejes y planos de los grupos D 2t1 y D 3 i1). El grupo l),u 1 contiene 4n elementos. A los 2n elementos del grupo D 11 se añaden las n reflexiones en los planos verticales ( representadas por ai1-reflexiones en los planos «diagonales>>) y 11 transformaciones del tipo G = U.pi1. Para poner de mafiesto el carácter de estas últimas, observemos que la rotación U2 se puede escribir, es la reflexión en el plano vertical según (91.6), en la forma U2 = a1ia,,, donde que pasa por el eje dado de segundo orden; entonces G = a 1p,p" (de suyo, las transformaciones a 11 y ª1i no son, claro está, elementos del grupo). Dado que los planos de reflexión a,, y ªr1 se cortan a lo largo del eje n-ario formando el ángulo (:r,1211) (2/.: I ), donde k = 1, 2, ... , (n -- I) (ya que aquí el :ingulo entre planos contiguos es igual a :r2n), en virtud de (91.6) tenemos a1,a" = C 2 /"+ 1 • Encontramos de esta manera que G = a 11 C211 2"+ 1 = S 2,/·+ 1, es decir, estos elementos son giros reflejados, en torno del eje vertical, que es, por consiguiente no un simple eje de simetría n-aria, sino un eje de reflexión-rotación de orden 211. ªu + Los planos diagonales reflejan entre sí dos ejes horizontales consecutivos de segundo orden; por ello, en los grupos considerados todos los ejes binarios son equivalentes (tanto para 11 par como para 11 impar). Análogamente, son equivalentes todos los planos diagonaíes. Los giros reflejados S 2,,2 1·+ 1 y S 211 - 2"- 1 son conjugados a pares (1). (1) En efecto, tt,nemos: Grupos puntuales 397 Aplicando estas consideraciones al grupo /) 211 ,,1, encontramos que contiene ]as siguientes 2p _J._ 3 clases: E, la rotación C2 en torno del eje n-ario, p -- I clases de rotaciones conjugadas en torno del mismo eje con dos elementos cada una, la clase de 2p rotaciones U2 , la clase de 2p reflexiones <rt1, y p clases de transformaciones de reflexión-rotación con dos elementos en cada clase. Para n impar (n == 2p---':- l ), entre los elementos del grupo figura la inversión (lo que se deduce de que uno de los ejes horizontales es, en este caso, perpendicular al plano vertical). Por ello se puede escribir /) 211 +1,t1 = /) 211 + 1 x ('¡, de modo que el grupo D 2µ+i,d contiene 2p+4 clases, que se obtienen inmediatamente de las p__J._2 clases del grupo D 21 1+i· C3 / ('.- ' e2 ' -¿ / - / ' '..J.," / T FIG. 36 V 111. Grupo T (grupo del tetraedro) El sistema de ejes de este grupo es el sistema de ejes de simetría del tetraedro. Se puede obtener añadiendo al sistema de ejes del grupo r cuatro ejes oblicuos de tercer orden, las rotaciones en torno de los cuales transforman entre sí los tres ejes binarios. Es cómodo representar este sistema de ejes haciendo pasar los tres ejes binarios por los centros de las caras opuestas de un cubo y representando los ejes de tercer orden como diagonales espaciales de este cubo. En la fig. 36 se indica 1a posición de estos ejes en el cubo y en el tetraedro (un eje de cada tipo). Los tres ejes binarios son equivalentes entre sí. Los ejes terciarios son también equivalentes, ya que se transforman entre sí por las rotaciones C2 , pero no son ejes bilaterales. De aquí se sigue que los 12 elementos del grupo T se distribuyen en cuatro clases: E, las tres rotaciones C2, las cuatro rotaciones C3 y las cuatro rotaciones C/. IX. Grupo T<i Este grupo contiene todas las transformaciones de simetría del tetraedro. El sistema de sus ejes y planos se puede obtener añadiendo a los ejes del grupo T planos de simetría tales que cada uno de ellos pasa por un eje binario y dos ejes ternarios. Al hacerlo, los ejes binarios pasan a ser ejes de reflexión-rotación de orden cuatro Teoría tle la simetría 398 (de manera análoga a lo que ocurre en el grupo /) 2 i1). Es cómodo representar este sistema trazando los tres ejes de reflexión-rotación por los centros de los pares de caras opuestas de un cubo. los cuatro ejes ternarios, en forma de diagonales espaciales y los seis planos de simetría, uno por cada par de aristas opuestas (en la fig. 37 se representa uno de cada uno de estos tipos de ejes y de planos). I -------...11 I / / 1 1 / L_ 1 1 1 1 1 1 1 1 --J / I I 1I / ~------ FIG. / 37 Dado que los planos de simetría son verticales respecto de los ejes ternarios, éstos son ejes bilaterales. Todos los ejes y planos de cada tipo son equivalentes. Por ello, los 24 elementos del grupo se distribuyen entre las 5 clases siguientes: E, las ocho rotaciones Ca y C/, las seis reflexiones en los planos, los seis giros reflejados S 1 y S/ y las tres rotaciones C2 =--- S/. X. Grupo 1'¡, Este grupo se obtiene a partir del 1' añadiendo un centro de simetría: 1',, = -== T i< ( '¡. Como resultado de ello aparecen tres planos de simetría perpendiculares entre sí, que pasan por cada dos ejes binarios. y los ejes ternarios pasan a ser ejes de reflexión-rotación de orden seis (en la fig. 38 se representa uno de cada uno de estos ejes y planos). El grupo contiene 24 elementos. distribuidos en g clases, que se obtienen inmediatamente a partir de las clases del grupo T. 399 Grupo.~ puntuales XI. Grupo () (grupo del octaedro) El sistema de ejes de este grupo es el sistema de ejes de simetría del cubo: tres ejes de cuarto orden pasan por los centros de las caras opuestas, cuatro ejes ternarios pasan por vértices opuestos y seis ejes binarios pasan por los puntos medios de pares de aristas opuestas (fig. 39). Es fácil ver que todos los ejes de igual orden son equivalentes y que cada uno de ellos es bilateral. Por lo tanto, los 24 elementos se distribuyen en las siguientes 5 clases: E, las ocho rotaciones Ca y C/·, las seís rotaciones C-1 y C.¡2, las tres rotaciones C/' y las seis rotaciones C-2. ¡r-1 1 I C2 1 (f f-+- 1 1 1 1 1 1 1 1 ,1 -------;71 --71 I¡ C4 ---( 1 1 1 1 I¡ 1 1 1 1 c2 / 1 -¡--J I I 1 1/ __ _y iL __ 1 1 1 J._-¿ / ¡ / 1 / ¡¿_ _____ _ / 1¡ o 7i; FIG. 38 FIG. 39 XI l. Grupo (}¡¡ Este es el grupo de todas las transformaciones de simetría del cubo (1 ). Se obtiene añadiendo al grupo () un centro de simetría: 01, = () ,. ( '¡. Con ello los ejes de tercer orden del grupo () se transforman en ejes de reflexión-rotación de sexto orden (diagonales espaciales del cubo); adem~is, aparecen todavía seis planos de simetría, ------7! ¡ t C4 1 1 (Í 1 1 I f- r--1 ' 1 10' 1 1 1 1 1 I I 1 '' 1 / ~' ' 1 1 -} / I¡ ll_,_ _ _ _ _ _ _ oh FIG. 40 ( 1 ) Los grupos '/', '/',¡, '/',,, O, 0 11 se llaman con frecuencia grupos tf,,f cuho, o cúhicos. 400 Teoría de la .'limetría que pasan por cada par de aristas opuestas, y tres planos, que son paralelos a las caras del cubo (fig. 40). El grupo contiene 48 elementos distribuidos en 10 clases, que se pueden obtener directamente a partir de las clases del grupo O. Así, 5 coinciden con ]as clases del grupo O, y las restantes son : /; los ocho giros reflejados S 6 y S 6 5 , ]os seis giros reflejados C4ah y C}ah en torno de los ejes de cuarto orden; las tres reflexiones ah en los planos que son horizontales respecto de los ejes cuaternarios, y las seis reflexiones a,, en planos verticales respecto de estos ejes. XIJI y XIV. Grupos r, r1i (grupos del icosaedro) Estos grupos no tienen interés desde el punto de vista físico, ya que no se presentan en la naturaleza como grupos de simetría de las moléculas. Por ello aquí nos limitaremos a indicar que }' es el grupo de las 60 rotaciones en torno de ]os ejes de simetría del icosaedro (poliedro regular de 20 caras triangulares) o del dodecaedro pentagonal (poliedro regular de 12 caras pentagonales), con seis ejes de quinto orden, 1O de tercero y 15 de segundo. El grupo r1i se obtiene añadiendo un centro --= .>( ( '; y representa el grupo completo de transformaciones de de simetría: simetría de los poliedros en cuestión. r,, r Con estos grupos se agotan todos los tipos posibles de grupos puntuales que contienen un número finito de elementos. A ellos hay que añadir los llamados grupos puntuales continuos, que contienen un número infinito de elementos. Tales grupos se estudiarán en el 98. * § 94. Representaciones de los grupos Consideremos un grupo cualquiera de simetría y sea ~, 1 una función uniforme de las coordenadas (1). En la transformación del sistema de coordenadas que corresponde al elemento G del grupo, esta función se transforma en otra. Aplicando sucesivamente todas las g transformaciones del grupo (g es el orden del grupo), obtenemos a partir de ~, 1, en general, g funciones diferentes. Sin embargo, para determinadas funciones ~, 1, algunas de estas funciones transformadas pueden resultar ser linealmente dependientes. Obtenemos así un cierto número f (f <. g) de funciones linealmente independientes 1¡ 1, ~,2 , ... , ~'! que al aplicar las transformaciones de simetría que ;orman el grupo considerado se transforman linealmente entre sí. Con otras palabras, como resultado de la transformación G cada una de las funciones ~';(i = l, 2, ... , f) pasa a ser una combinación lineal de la forma: 1 f ~ k-1 Gki'Pk, donde los G¡¡, son constantes que dependen de la transformación G. Se llama matri:: de la transformación (2 ) al conjunto de estas constantes. 1 En el espacio de las configuraciones del sistema físico en cuestión. Dado que las funciones '/'i se suponen uniformes, a cada elemento del grupo corresponde una determinada matriz. ( ) {2) 401 Representación de los grupos En relación con esto conviene considerar los elementos G del grupo como operadores que actúan sobre las funciones "Pi, de modo que se podrá escribir: (94.1) Las funciones "Pi se pueden siempre elegir de tal manera que sean ortogonales dos a dos y normalizadas. El concepto de matriz de la transformación coincide entonces con el concepto de matriz de un operador en la forma como se la definió en el § 11 : (94.2) Al producto de dos elementos G y. H del grupo corresponde la matriz definida por las matrices G y H de acuerdo con la regla ordinaria de multiplicación de matrices (l l.12): (94.3) Del conjunto de las matrices de todos los elementos del grupo se díce que constituyen una representación del grupo. Las funciones "Pi, ... , "Pt, mediante las cuales se definen estas matrices, se llama base de la representación. El número f de estas funciones determina k llamada dimensión de la representación. Consideremos la integral fl1P[ 2 dq, donde 1P es una cierta función de las coordenadas. Dado que la integral se extiende a todo el espacio, es evidente que en cualquier rotación o reflexión del sistema de coordenadas su valor no variará. Por ello, para cualquier transformación de simetría G se puede escribir; f (G*i/¡*)(Gi/¡) dq f if¡*if¡ dq. lntroduciendo el operador G transpuesto del G, tenemos f (G*¡/J*)(G¡/J) dq = f if¡ÚG*if¡* dq f if¡*if¡ dq, = de donde sigue, dada la arbitrariedad de 1p, que (;(;• es decir, los operadores G son º* 1, ó = (;-1, unitarios. Así, pues, una representación del grupo realizada mediante funciones de base ortonormalizadas es unitaria, es decir, el grupo viene representado por matrices unitarias. Aplicando a las funciones "Pi, ... , "Pt una transformación lineal unitaria 402 Teoría de la simetría (94.4) obtenemos un nuevo sistema de funciones "P'i, 1P't, también ortonormalizadas (véase § 12) (1). Tomando como base de la representación las funciones 1P' ¡, tendremos una nueva representación cuya dimensión será la misma. Tales representaciones, que se obtienen una de otra mediante una transformación lineal de las funciones de base, se IJaman equivalentes; es evidente que no son esencialmente distintas. Las matrices de dos representaciones equivalentes están ligadas entre sí por una sencilla relación: según (12. 7), la matriz del operador G en la nueva representación es igual a la matriz del operador C' =S-1GS (94.5) en la representación primera. La suma de los elementos diagonales (es decir, la traza) de la matriz que representa a un elemento G del grupo se llama su carácter; designaremos los caracteres por x(G). El hecho de que los caracteres de las matrices de representaciones equivalentes coinciden es muy importante (véase el final del § 12). Este hecho hace particularmente útil el describir la representación de un grupo por sus caracteres; ello permite distinguir inmediatamente las representaciones esencialmente distintas de las representaciones equivalentes. En lo que sigue, cuando hablemos de representaciones distintas nos referimos solamente a representaciones no equivalentes. Si por S se entiende en (94.5) el elemento del grupo que liga dos elementos conjugados G y G', llegamos al resultado de que, en una representación dada cualquiera del grupo, los caracteres de las matrices que representan a los elementos de una misma clase son iguales. Al elemento unidad del grupo, E, corresponde la transformación idéntica. Por ello la matriz que lo representa es diagonal en cualquier representación y, además, los elementos diagonales son iguales a la unidad. El carácter x(E) es, por consiguiente, igual simplemente a la dimensión de la representación x(E) = f. (94.6) (1) Obsérvese también que una transformación unitaria deja invariable la suma de los cuadrados de los módulos de las funciones que se transforman. En efecto, teniendo en cuenta (12.6), tenemos: Representación de los grupos 403 Consideremos una representación de dimensión f Puede ocurrir que, como resultado de una transformación lineal de la forma (94.4), las funciones de base se agrupen en conjuntos def1,h, ... funciones U~+f2 +... =!) de tal manera que, al aplicar todos los elementos del grupo, las funciones de cada conjunto se transforman tan sólo entre sí, sin que intervengan funciones de los otros conjuntos. Se dice en tal caso que la representación dada es reducible. Si, en cambio, el número de funciones de base que se transforman entre sí no se puede disminuir mediante combinaciones lineales de las mismas, la representación que proporcionan se llama irreducible. Toda representación reducible se puede descomponer, conforme suele decirse, en representaciones irreducibles. Esto significa que, mediante la correspondiente transformación lineal, las funciones de base se distribuyen en una serie de conjuntos, cada uno de los cuales se transforma al aplicar los elementos del grupo de acuerdo con una representación irreducible. Puede suceder que algunos conjuntos diferentes se transformen según la misma transformación irreducible; en tal caso se dice que la representación irreducible está contenida en la inicial el correspondiente número de veces. Las representaciones irreducibles son características esenciales de un grupo y desempeñan un importante papel en todas las aplicaciones de la teoría de grupos a la mecánica cuántica. Veamos cuáles son las propiedades fundamentales de dichas representaciones (1). Se puede demostrar que el número de representaciones irreducibles de un grupo diferentes es igual al número r de clases del grupo. Distinguiremos los caracteres de las diferentes representaciones irreducibles mediante superíndices; los caracteres de las matrices del elemento G en las distintas representaciones serán x<1 >(G), x<2 >(G), ... , x<r>(G). Los elementos de matriz de las representaciones irreducibles satisfacen toda una serie de relaciones de ortogonalidad. En primer lugar, para dos representaciones irreducibles distintas vale la relación ~ G G(a.)i "kG(/J)l m *=o (94.7) donde rL =/= fJ caracterizan dos representaciones irreducibles y la suma se extiende a todos los elementos del grupo. Para cada representación irreducible se tiene, en cambio. la relación LG c<a.>i .kG<ª'z m * = .!_3 fa. i..,8k m (94.8) (1) La demostración de estas propiedades se puede encontrar en los cursos especiales de teoría de grupos, por ejemplo, en el libro de V. l. SMIRNOV, Kurs vysshei matematiki, tomo III, parte I, Fizmatgiz, 1958 (existe traducción inglesa; A course of higher Mathematics, Pergamon Press, 1964). Teoría de la simetría 404 es decir, son diferentes de cero tan sólo las sumas de los cuadrados de los módulos de los elementos de matriz: ~ [G(:x)ik[ 2 = G glfa.• Las relaciones (94.7-8) se pueden escribir juntas en la forma: ~ G<cx.>ikG(JJ)im* = ~a./>izSkm· (94.9) Ícx. G En particular, a partir de aquí es posible obtener una importante relación de ortogonalidad para los caracteres de las representaciones; sumando los dos miembros de la igualdad (94.9) respecto de los pares de índices i, k y /, m, obtenemos: (94.10) Para et. = f3 se tiene: ti [x<º:l(G)l2 = g, es decir, la suma de los cuadrados de los módulos de los caracteres de una representación irreducible es igual al orden del grupo. Obsérvese que esta relación se puede utilizar como criterio de irreducibilidad de una representación - para una representación reducible esta suma es siempre mayor que g (y, además, igual a ng, donde n es el número de representaciones irreducibles contenidas en ella). De (94.10) se sigue también que la igualdad de los caracteres de dos representaciones irreducibles es, no sólo condición necesaria, sino también suficiente para que sean equivalentes. Dado que los caracteres que se refieren a los elementos de una clase son iguales, en la suma (94.10) se tienen realmente, en total, r términos independientes y es posible escribirla también en la forma: (94.11) donde la suma se extiende a las r clases del grupo (que convenimos en designar por la letra C), y ge es el número de elementos en la clase C (1). ( 1) Dado que el número de representaciones irreducibles coincide con el número de clases, las cantidades /a.e = Vgclgx(ix)(C) forman una matriz cuadrada de orden r. De las relaciones de ortogonalidad respecto del primer índice ("E-fa.cff3*c = Oa.f3) St; siguen entonces e , automáticamente las relaciones de ortogonalidad respecto del segundo índice: "E-Ja.c/a.*c, = <5cc, Por (J. ello, junto a las (94.11), valen también las fórmulas: (94.lla) 405 Representación de los grupos La relación (94.10) permite muy fácilmente llevar a cabo la descomposición de toda representación reducible en representaciones irreducibles si se conocen los correspondientes caracteres. Sean x(G) los caracteres de una cierta representación reducible de dimensión f y supongamos que los números aül, a< 2 >, ... , a<r> indican cuantas veces están contenidas en ella las correspondientes representaciones irreducibles, de modo que ,. ~ d/J>J13 P-1 =!, (94.12) (f{J son las dimensiones de las representaciones irreducibles). Los caracteres x(G) se pueden escribir entonces en la forma: r x( G) = ~ d/Jlx</Jl( G). {3-1 (94.13) Multiplicando esta igualdad por x(~l(G)* y sumando respecto de todos los G, obtenemos en virtud de (94.1 O): 1 a<cx> = - ~ x(G)x<cxl(G)*. g G (94.14) Consideremos la representación de dimensión!= g cuya base son las g funciones G1f), donde 1P es una función general cualquiera de las coordenadas (de modo que todas las g funciones G'lj) que se obtienen a partir de ella son linealmente independientes); dicha representación se llama regular. Es claro que los elementos diagonales de las matrices de esta representación serán nulos, con la única excepción de la matriz que corresponde al elemento unidad; por ello será x(G) = O para G =/= E y x(E) = g. Descomponiendo esta representación en representaciones irreducibles, para los números a(~) obtenemos, según (94.14), los valores a<cx> = (1/g)g¡<rx> = ¡<ex>, es decir, cada representación irreducible está contenida en la representación reducible considerada un número de veces igual a su dimensión. Substituyendo este resultado en (94.12), encontramos la relación N+N+ ··· +fr2 = g; (94.15) la suma de los cuadrados de las dimensiones de las representaciones irreducibles de un grupo es igual a su orden (1). De aquí se sigue, en particular, que en los grupos abelianos (en los que r = g) todas las representaciones irreducibles son unidimensionales (f1 =J; = ... =fr = 1). Haremos notar también, sin demostrarlo, que las dimensiones de las representaciones irreducibles de un grupo son divisores de su orden. (1) Obsérvese que, para los grupos puntuales, y dados r y g, la ecuación (94.15) puede de hecho quedar satisfecha tan sólo para un sistema de números enteros .(1, ••• , fr. 406 Teoría de la simetría Entre las representaciones irreducibles de cualquier grupo existe siempre una que es trivial, representación realizada por una función de base invariante respecto de todas las transformaciones del grupo. Esta representación unidimensional se llama representación unidad; todos los caracteres son en ella iguales a 1. Consideremos dos sistemas diferentes de funciones "Pi(rt.), ... , "Pt/rt.) y 1p//3), ... , 'I.J)¡¡/!3> que constituyen dos representaciones irreducibles de un grupo. Formando los productos 1p/'Xl1JJ1}f3), obtenemos un sistema de f 'Y..f¡-3 funciones nuevas que pueden· servir como base de una nueva representación de dimensión f 'Y..f(3. Esta representación se llama producto directo de las dos primeras, y es irreducible tan sólo si uno por lo menos de los números f 'Y. o !{3 es igual a la unidad. Es fácil ver que los caracteres del producto directo son iguales a los productos de los caracteres de las dos representaciones componentes. En efecto, si (j,l,.(rx) =~G.(rx),/,(rx) 'l'i l h 'l'l , se tendrá de aquí se sigue para los caracteres, que designaremos por (i'X) x x<:'1>)(G), la relación: es decir, (94.16) En particular, las dos representaciones irreducibles que se multiplican pueden coincidir; en este caso se tienen dos sistemas distintos de funciones 1JJ1 , ... , "Pt y c/,1, ••• , </>¡ que realizan una y la misma representación, y el producto directo de la representación por si misma tiene como base las f2 funciones 1JJ¡</>1,: y como caracteres los valores (xxx)(G) = [x(G)]2. Esta representación reducible se puede descomponer inmediatamente en dos representaciones de menor dimensión (pero, en general, asimismo reducibles, con todo). Una de ellas tiene como base las/(/+ 1)/2 funciones 1JJ¡</>1,:+1JJ1,:</>¡; la otra, las/(/- 1)/2 funciones 1JJ¡<p1,: - 1Pk'Pi, i =/= k (es evidente que las funciones de cada uno de estos sistemas se transforman únicamente entre sí). El primer sistema se llama producto simétrico de la representación por sí misma (sus caracteres se designan por el símbolo [x 2 J(G)), y el segundo, producto antisimétrico (sus caracteres se designan por el iÍmbolo {.7.2 }( G)). Representación de los grupos 407 Para determinar los caracteres del producto simétrico escribamos: G(t/¡i</>k+'Pk'Pi) = GuGmi'Pi'Pm+'Pm'Pz) l,~ = ! l:n(GzPmk+GmPi1c)(tpz</>m+'Pm'Pz). De aquí resulta para el carácter [x2 ](G) = Pero~• Gii la fórmula = x(G), y~ GikGki í,k = t i,k ~ (Gipkk+GikGki). x(G 2); de esta manera obtenemos en definitiva [x2](G) = i{[x(G)]2+x(G2)}, (94.17) que permite determinar los caracteres del producto simétrico de una representación por sí misma en función de los caracteres de la representación de partida. De manera del todo análoga encontramos para los caracteres del producto antisimétrico la fórmula {x2}(G) = füx(G)] 2-x(G2)}. (94.18) Si las funciones '!f)¡ y <p¡ coinciden, a partir de ellas es posible determinar, evidentemente, tan sólo el producto simétrico, cuya base está constituida por los cuadrados '!f)? y los productos '!f)¡'lf'k, i ==/= k. En las aplicaciones es necesario considerar también productos simétricos de grado más elevado; sus caracteres se pueden obtener de manera análoga. Hay que hacer notar una propiedad de los productos directos cuya importancia se verá más adelante. La descomposición del producto directo de dos representaciones irreducibles distintas en componentes irreducibles nunca contiene la representación unidad; en cambio, el producto directo de una representación irreducible por sí misma (es decir, su parte simétrica, evidentemente) siempre contiene dicha representación - y precisamente una sola vez. En efecto, para saber si en la representación (94.16) está o no contenida la representación unidad, es necesario (según (94.14)) tan sólo sumar sus caracteres respecto de G (y dividir el resultado por el orden del grupo g). Pero teniendo en cuenta las relaciones (94. 10), obtenemos en este caso el valor cero si ==/= fJ o la unidad si 'Y. = fJ. (X Para las aplicaciones es útil conocer una fórmula que permite representar una función arbitraria '!f) como suma de funciones que se transforman según las representaciones irreducibles de un grupo, es decir, en la forma: lf = LJLJ tp.(CX) °' i i (94.19) ' donde las funciones '!f)/x) (i = 1, 2, ... , /,y_) se transforman de acuerdo con la representación irreducible 'Y.-ésima. El problema consiste en determinar las funciones 408 Teoría de la simetría 1P/'Y..) dada la función 1P y se resuelve mediante la fórmula (94.20) Para demostrarlo basta probar que la expresión que aparece en el segundo miembro de la igualdad se reduce idénticamente a 1P/'Y..) si hacemos 1P = 1P/r:1.), y a cero, si hacemos 1P = 'lf)¡/fJ) con k =J=. i o fJ =J=. r:,.; tanto lo uno como lo otro se siguen inmediatamente de las relaciones de ortogonalidad (94.7-8) si en ellas se hace Cif;k(JJ) = 1:: G lk (JJ>if; ¡<P>. l Si se substituye (94.20) en (94.19) y se efectúa la suma respecto de i, obtenemos un desarrollo más simple de la función arbitraria 1P en funciones 1P('Y..~ asociadas a las distintas representaciones irreducibles, pero no a determinadas filas de las mismas: (94.21) Finalmente, haremos algunas observaciones acerca de las representaciones irreducibles de un grupo que es producto directo de otros dos grupos (¡no se confunda con el producto directo de dos representaciones de un mismo grupo!). Si las funciones 1P/rt.> son base de una representación irreducible del grupo-A. y las funciones 'lf)/fl> lo son para el grupo B, los productos 1P/f1>1P/rt.) serán la base de una representación del grupo A X B de dimensión f J (J, y esta representación es irreducible. Los caracteres de la misma se obtienen multiplicando los correspondientes caracteres de las representaciones de partida (cf. la deducción de la fórmula (94.16)); al elemento C = AB del grupo A x B corresponde el carácter x(C) = x<cx>(A)x<P>(B). (94.22) Multiplicando de esta manera todas las representaciones irreducibles de los grupos A y B, obtenemos todas las representaciones irreducibles del grupo A x B. § 95. Representaciones irreducibles de los grupos puntuales Pasemos ahora a la determinación concreta de las representaciones irreducibles de los grupos puntuales que son interesantes desde el punto de vista físico. La mayor parte de las moléculas poseen solamente ejes de simetría de segundo, tercero, cuarto y sexto orden. Por ello no hay necesidad de considerar los grupos del icosaedro Y, Y h; los grupos Cm C nh, C nv, D n, D nh los estudiaremos tan sólo para los valores n = 1, 2, 3, 4, 6, y los grupos S 2n, Dnd sólo paran = 1, 2, 3. Los caracteres de las representaciones de estos grupos se dan en las tablas adjun- 409 Representaciones irreducibles de grupos puntuales tas. Los grupos isomorfos tienen las mismas representaciones y se presentan juntos en una sola tabla. Los números ante los símbolos de los elementos del grupo que aparecen en las primeras filas indican los números de elementos en las correspon7 TABLA Caracteres de las representaciones irreducibles de los grupos funcionales E 1 E E A 1 A;z a ¡ E; x±iy A;z A';x,y Au;x,y,z B;x,y A";z 1 1 -1 1 E 2C 3 3a,, a' 11 E 2C 3 3U1 1 1 A 1 ;z -1 A -1 -1 E;x,y -1 1 -1 -1 E;x,y 2 -1 o -1 Ca A;z A;z A 1 B B;z 1 -1 E;x±iy E;x±iy ¡ 1 1 1 1 -1 B E1 -1 -i - i -1 E,; x±iy ¡ ¡ 1 1 1 1 1 1 -1 1 -1 1 -1 w1 -,.JJ 1 -e.u 1 w w 1 -w w1 1 -w w 1 w 2 -1 -w -w 1 1 -w2 -w -1 w1 w Teoría de la simetría 410 TABLA 7 (Continuación) c..., E C2 2e, 2a 11 2a' 11 E e2 2e, 2U2 2U'i Du E e,. 2s, 2u. 2a 11 D, A1;z A1 A1 1 1 1 1 1 A2 A2;z Aa 1 1 1 -1 -1 B1 B1 B1 1 1 -1 1 -1 B2 B2 B 2; z 1 1 -1 -1 1 E;x,y E;x,y E;x,y 2 -2 o o o E e,. 2e. 2e1 3Ua 3U'1 E c. 2e1 2ee 3a 11 3a' 11 Du E ª" 2e, 2s, 3Ua 3a' 11 1 1 1 1 1 1 -1 -1 De Co 1 A1 A1;z A1' A2; z A2 A2' B1 B2 Ai'' 1 -1 1 -1 1 -1 Bs Bi A,/'; z 1 -1 1 -1 -1 1 Ea Ea E';x,y 2 2 -1 -1 2 -2 -1 1 o o o o E 1 ;x,y Ei;x,y E" 1 o T, E se, 3e2 6a 4 6S, A1 A1 1 1 e:I As A1 1 1 1 -1 -1 e: E E 2 -1 2 o o Fa F2 ;x,y, z 3 o o -1 T E 3e1 4e, 4e1 2 A 1 1 1 1 1 1 e: 1 e:• E F; x,y, z { 3 -1 E Se, 3e2 6e1 6e, o o F1;x,y,z Fi 3 1 1 -1 -1 -1 1 Representaciones irreducibles de grupos puntuales 411 dientes clases (véase § 93). En las primeras columnas se indican los símbolos de las representaciones generalmente adoptados. Las representaciones unidimensionales se designan por las letras A, B, las de dos dimensiones por la letra E y las de tres, por F (¡no se confunda la notación E para una representación irreducible bidimensional con la notación E para el elemento unidad del grupo!) (1). Las funciones de base de las representaciones A son simétricas, y las funciones B, antisimétricas, respecto de las rotaciones en torno del eje principal n-ario. Las funciones de distinta simetría respecto de la reflexión ah se distinguen entre sí mediante apóstrofos (uno o dos), y los índices g y u indican la simetría respecto de la inversión. Junto con los símbolos de las representaciones, se indica con las letras x, y, z respecto de qué representación se transforman las propias coordenadas (con vistas a las ulteriores aplicaciones a la mecánica cuántica); el eje z se elige siempre de forma que coincida con el eje principal de simetría. Las letras e y w significan: • = él:rri/3, w = e?.rri/6 = _ w'. La determinación de las representaciones irreducibles de los grupos cíclicos (grupos Cm Sn) es la más simple de todas. Un grupo cíclico, como todo grupo abeliano, tiene sólo representaciones unidimensionales. Sea G el elemento generador del grupo (es decir, el elemento cuya aplicación sucesiva da todos los elementos del mismo). Dado que GY = E (g es el orden del grupo), es claro que al aplicar el operador G a una función de base "P esta última únicamente puede quedar multiplicada por u V1, es decir (2), (;i¡, = e2TTikJo,¡, (k = 1, 2, ... , g). El grupo C"h (v sus isomorfos C 20 y D 2) es abeliano, de modo aue todas sus repre· sentaciones irreducibles son también unidimensionales, pudiendo ser sus caracteres tan sólo iguales a ± 1 (ya que el cuadrado de cada elemento es igual a E). Consideremos ahora el grupo Cav· Comparado con el grupo Ca, se añade aquí las reflexiones a0 en los planos verticales (que pertenecen todas a una misma clase). Una función invariante respecto de la rotación en torno del eje (función de base de la representación A del grupo Ca), puede ser simétrica o antisimétrica respecto de las reflexiones ªv· En cambio, las funciones que en la rotación Ca quedan multiplicadas por e y e2 (funciones de base de las representaciones conjugadas complejas E), se transforman entre sí en una reflexión (3). De estas consideraciones se sigue ( 1) La razón por la que dos representaciones conjugadas complejas unidimensionales se representan como una bidimensional se explica en el § 96. ( 2) Para el grupo puntual C n se puede elegir como función VJ, por ejemplo, la función ,p = eik</>, k = l, 2, ... , n, donde ,f, es el ángulo de rotación en torno del eje contado a partir de una dirección determinada. (3) Estas funciones se pueden elegir, por ejemplo, de la forma tp1 = et</>, tp2 = e-t</> En una reflexión en un plano vertical ,f, cambia de signo. Teoría de la simetría 412 que el grupo C 3v (y su isomorfo el grupo D 3) tiene dos representaciones unidimensionales y una representación bidimensional irreducibles con caracteres que se dan en la tabla. Hemos obtenido así efectivamente todas Jas representaciones irreducibles, como puede comprobarse observando que la suma 12 +1 2 +22 = 6, es decir, es igual al orden del grupo. Consideraciones análogas permiten hallar los caracteres de las representaciones de otros grupos del mismo tipo ( C 4v, C 6v), El grupo T se obtiene a partir del grupo V añadiendo las rotaciones en torno de los cuatro ejes oblicuos ternarios. Una función que es invariante respecto de las transformaciones del grupo V (base de la representación A), puede quedar multiplicada en una rotación C 3 por 1, s o s2 • En cambio, las funciones de base de las tres representaciones unidimensionales B1 , B2 , B3 del grupo V, en las rotaciones en torno del eje de tercer orden se transforman entre sí (lo que se ve fácilmente si, por ejemplo, se toman para estas funcion~1as propias coordenadas x, y, z). De esta manera obtenemos tres representaciones unidimensionales y una tridimensional irreducibles (1 2 +1 2 +1 2 +3 2 = 12). Finalmente, consideremos los grupos isomorfos O y T d· El grupo T d se obtiene a partir del grupo T añadiendo las reflexiones ad en planos tales que cada uno. pasa por dos .ejes ternarios. La función de base de la representación unidimensional A del grupo T puede ser simétrica o anti simétrica respecto de estas reflexiones (que pertenecen todas a una misma clase), lo que da dos representaciones unidimensionales del grupo T d· Las funciones que quedan multiplicadas por s o s2 en una rotación en torno de un eje ternario (base de las representaciones conjugadas complejas E del grupo T), en la reflexión en un plano que pase por este eje se transforman entre sí, de modo que se obtiene una representación bidimensional. Finalmente, de las tres funciones de base de la representación F del grupo T una se transforma en sí misma en la reflexión (pudiendo conservar su signo o cambiarlo) y las otras dos se transforman entre sí. Obtenemos de esta manera, en total, dos representaciones unidimensionales, una bidimensional y dos de tres dimensiones. En cuanto a los demás grupos puntuales que nos interesan, sus representaciones se pueden obtener directamente de las que preceden observando que estos grupos son productos directos de los grupos ya considerados por el grupo C i ( o C s). Se tiene, en efecto: C311, = C3 XC 8 D 211, = D 2 xC, D 3 ci = D 3 XCi C411, = c,xci D,11, = D,xci D 6 11, = D 6 xC, Ca11, = CaxCi S6 = C3 xC, T11, = TxCi oh = oxci Representaciones irreducibles y clasificación de los términos 413 Cada uno de estos productos directos posee un número de representaciones irreducibles doble que el grupo de partida, de las cuales la mitad son simétricas respecto de la inversión (se designan por el índice g), y la otra mitad, antisimétricas (índice u). Los caracteres de estas representaciones se obtienen a partir de los caracteres de las representaciones del grupo inicial multiplicando por ± 1 (de acuerdo con la regla (94.22)). Así, por ejemplo, para el grupo Dad se obtienen las representaciones: Dad § 96. E Á¡g 1 A2u 1 Eu 2 A1u 1 A2u 1 Eu 2 2C3 3U2 1 1 -1 1 1 -1 1 -1 1 1 o 1 2S6 3ad 1 -1 2 1 1 -1 1 -1 -1 -1 -1 -1 -1 1 1 o -2 o o Representaciones irreducibles y la clasificación de los términos Las aplicaciones de la teoría de grupos a la mecánica cuántica se basan en que la ecuación de SCHRODINGER correspondiente a un sistema físico (átomo, molécula) es invariante respecto de las transformaciones de simetría de este sistema. De aquí se sigue, sin más, que después de aplicar los elementos del grupo a una función que satisface la ecuación de ScHRODINGER para un cierto valor de la energía (valor propio), debe obtenerse de nuevo una solución de la misma ecuación con igual valor de la energía. Con otras palabras, en una transformación de simetría las funciones de onda de los estados estacionarios del sistema que corresponden a un mismo nivel de energía se transforman entre sí, es decir, constituyen la base de una cierta representación del grupo. El hecho de que esta representación es irreducible es importante. En efecto, las funciones que se transforman entre sí en las transformaciones de simetría deben corresponder, en cualquier caso, al mismo nivel energético; pero la coincidencia de los valores propios de la energía ligados a diferentes grupos de funciones (en los que se puede descomponer la base de una representación reducible), grupos que no se transforman entre sí, sería una casualidad totalmente improbable (con tal que para ello no exista alguna causa especial, véase más adelante). Así, pues, a cada nivel de energía del sistema corresponde una representación irreducible de su grupo d~ simetría. La dimensión de esta representación determina la multiplicidad de la degeneración del nivel dado, es decir, el número de estados diferentes que poseen la energía dada. Una vez dada la representación irreducible, quedan determinadas todas las propiedades de simetría del estado en cuestión, 414 Teoría de la simetría es decir, su comportamiento con relación a las distintas transformaciones de simetría. Representaciones irreducibles con dimensiones mayores que la unidad se encuentran tan sólo para aquellos grupos que contienen elementos no conmutativos (los grupos abelianos poseen solamente representaciones irreducibles de una dimensión). Recordemos, a propósito de esto, que la relación entre la degeneración de un nivel y la existencia de operadores que no conmutan entre sí (pero sí con el hamiltoniano) se hizo notar ya antes partiendo de consideraciones no ligadas con la teoría de grupos (§ 1O). Todas estas afirmaciones están sujetas a una restricción fundamental. Conforme se indicó antes(§ 18), la simetría respecto del cambio de signo del tiempo (que se cumple cuando no existe campo magnético) conduce en mecánica cuántica a que las funciones de onda conjugadas complejas deban pertenecer a un mismo valor propio de la energía. De aquí se sigue que si un cierto sistema de funciones y el sistema de funciones conjugadas complejas de aquéllas son bases de representaciones irreducibles distintas de un mismo grupo, estas dos representaciones conjugadas complejas deben considerarse, desde un punto de vi ~ta físico, como una misma representación de dimensión doble. En el párrafo anterior encontramos ejemplos de estas representaciones. Así, el grupo C 3 tiene solamente representaciones unidimensionales; sin embargo, dos de ellas son conjugadas complejas y corresponden, físicamente, a niveles de energía doblemente degenerados. (Cuando existe campo magnético, la simetría respecto del cambio de signo del tiempo no se presenta, y por ello a las representaciones conjugadas complejas corresponden diferentes niveles de energía.) Supongamos que el sistema físico se somete a la acción de una perturbación (es decir, el sistema se coloca en un campo exterior). Se plantea la cuestión de en qué medida puede la perturbación conducir a un desdoblamiento de los niveles degenerados. El campo exterior posee, de por sí, una cierta simetría propia (1). Si esta simetría es igual o mayor (2) que la simetría del sistema no perturbado, la simetría del hamiltoniano perturbado 11 = 110 + t>" coincide con la simetría del operador no perturbado h 0 • Es claro que, en este caso, no puede producirse ningún desdoblamiento de los niveles degenerados. Pero si la simetría de la perturbación es menor que la simetría del sistema no perturbado, la simetría del hamiltoniano fi coincidirá con la simetría de la perturbación V. Las funciones de onda que son base de una representación irreducible del grupo de. simetría del operador fi 0 , serán también base de una representación del grupo de simetría del operador perturbado h, y como puede ocurrir que esta representación sea reducible, esto significa un 1 ( ) Por ejemplo, puede tratarse de los niveles de energía de las capas d y f de los iones en una red cristalina, iones que se encuentran en interacción débil con los átomos que los rodean. La perturbación (campo exterior) es, en este caso. el campo que actúa sobre un ion debido a los demás átomos. (2) Si el grupo de simetría H es subgrupo del grupo G, se dice que JI corresponde a una simetría menor que la simetría (mayor) del grupo G. Es evidente que la simetría de la suma de dos expresiones, de las cuales una tiene la simetría de G, y la otra, la de H, coincide con la simetría menor, la de H. Reglas de .i;elección para los elementos de matriz 415 posible desdoblamiento del nivel degenerado. Veamos en un ejemplo cómo el formalismo matemático de la teoría de grupos permite resolver efectivamente el problema del desdoblamiento de un cierto nivel. Supongamos que el sistema no perturbado posee la simetría T d y consideremos un nivel degenerado de orden tres que corresponde a la representación irreducible F 2 de este grupo: los caracteres de esta representación son iguales a: E o 3 1 -1 -1 Imaginemos que el sistema se somete a la acción de una perturbación que posee la simetría Cw (con el eje ternario coincidente con uno de los ejes ternarios del grupo T d). Tres funciones de onda del nivel degenerado constituyen la base de una representación del grupo C 3v (que es subgrupo del grupo 7 1a), siendo los caracteres de esta representación iguales, simplemente, a los caracteres de los mismos elementos en la representación inicial del grupo T d, es decir, E 2Ca 3 o 1 Sin embargo, esta representación es reducible. Si se conocen los caracteres de las representaciones irreducibles del grupo C3v, es fácil conseguir su descomposición en partes irreducibles (siguiendo la regla general (94.14)). Encontramos de esta manera que aquélla se descompone en las representaciones A 1 y E del grupo Cav· Por consiguiente, el nivel triplemente degenerado F 2 se descompone en un nivel no degenerado A 1 y un nivel doblemente degenerado E. Si el mismo sistema se somete a la acción de una perturbación dotada de la simetría C 2v ( que es también subgrupo del grupo T d), las funciones de onda del mismo nivel F2 proporcionan una representación con los caracteres I E 3 (J V -1 1 1 Descomponiéndola en partes irreducibles, encontramos que dicha representación contiene las representaciones A1 , B1 , B2 . Así, pues, en este caso se consigue un completo desdoblamiento del nivel en tres niveles no degenerados. § 97. Reglas de selección para los elementos de matriz La teoría de grupos permite no solamente efectuar la clasificación de los términos de cualquier sistema físico simétrico, sino que da también un método simple para hallar las reglas de selección de los elementos de matriz de las diferentes magnitudes 416 Teoría de la Rimetría que lo caracterizan. Este método se basa en el siguiente teorema general. Sea 'f/J/ ix) una de las funciones de base de una representación irreducible (distinta de la representación unidad) del grupo de simetrías. Su integral extendida a todo el espacio (1) es entonces idénticamente nula: Ji¡4cx> dq = O. (97.1) La demostración se basa en el hecho evidente de que la integral extendida a todo el espacio es invariante respecto de cualquier transformación del sistema de coordenadas, en particular, respecto de una transformación cualquiera de simetría. Por ello Sumemos esta igualdad para todos los elementos del grupo. La integral que aparece en el primer miembro queda simplemente multiplicada por el orden del grupo, g, y obtenemos: Pero para cada representación irreducible distinta de la representación unidad se tiene idénticamente (éste es un caso particular de las relaciones de ortogonalidad (94. 7), aquél en que una de las representaciones irreducibles es la unidad). Con esto queda demostrado el teorema. Si 1P es una función que corresponde a una cierta representación reducible del grupo, la integral f 1P dq será diferente de cero únicamente cuando la representación contenga la representación unidad. Este teorema es consecuencia inmediata del que precede. Sea/ el operador de una magnitud física escalar. Por definición, este operador es invariante respecto de todas las transformaciones de simetría. Sus elementos de matriz son las integrales (97.2) (1) Se trata del espacio de configuraciones del sistema físico considerado. Reglas de selección para los elementos de matriz 417 donde los índices ce, fJ distinguen los diferentes términos del sistema, y los índices i, k numeran las funciones de onda de los estados correspondientes a un mismo término degenerado. Designemos simbólicamente las representaciones irreducibles del grupo de simetría del sistema dado de las que son base las funciones 1J)/ce) y 'lfJk(/J) por n<ce) y n</J). Los product~s 1/<J.)'lfJk(.B) son base de la representación D (ce) x n</J); dado que el propio operador fes invariante con relación a todas las transformaciones, todo el integrando corresponderá a esta representación. Pero (véase§ 94) el producto directo de dos representaciones irreducibles diferentes no contiene la representación unidad; en cambio, el producto directo de una representación irreducible por sí misma la contiene siempre (y sólo una vez, y las integrales (97 .2) son iguales a const cJik, donde const no depende ni de i ni de k). Llegamos así a la conclusión de que, para una magnitud escalar, son diferentes de cero tan sólo los elementos de matriz que corresponden a transiciones entre estados del mismo tipo (es decir, que corresponden a la misma representación irreducible). Ésta es la formulación más general de un teorema cuyos casos particulares hemos encontrado ya más de una vez. Consideremos ahora una magnitud física vectorial A. En las transformaciones de simetría, las tres componentes Ax, Ay, Az se transforman entre sí y constituyen de esta manera una cierta representación del grupo de simetría que designaremos por DA (1). Los productos 1ft,,,<cx>J..tJ¡k <P> son base de una representación n<ce) x DA x x n</J); los elementos de matriz son diferentes de cero si esta representación contiene la representación unidad. Desde el punto de vista práctico, conviene más descomponer en partes irreducibles el producto directo n<rx) x DA; de esta manera se reconocen inmediatamente todos los tipos D(1) de estados para los que las transiciones (desde un estado del tipo fl(<J.)) poseen elementos de matriz diferentes de cero. Los elementos de matriz diagonales (en contraste con los elementos para transiciones entre estados diferentes de un mismo tipo) requieren un examen especial. En este caso tenemos, en total, sólo un sistema de funciones 'lfJ/rx); y no dos sistemas distintos, y sus productos a pares constituyen el producto simétrico [D<rx> 2J de la representación n<a.) por sí misma (y no el producto directo n<a.) X n<ce)). Por ello, en el caso de una magnitud vectorial, la existencia de elementos de matriz diagonales exige la existencia de la representación unidad en la descomposición del producto [n<a.) 2J x DA, o, lo que es lo mismo, la existencia de DA en [n<ce) 2J (2). De modo análogo se pueden hallar las reglas de selección para los elementos de matriz de un tensor. Ejemplo3 de aplicación de estas reglas se presentan en los prOF blemas propuestos en este párrafo. DA, en general, es diferente para los vectores polares y axiles. No hicimos esta salvedad al considerar una magnitud escalar f teniendo en cuenta que el producto simétrico [D(il:)2], al igual que el producto directo n<a> X D<ª>, conti~ne _siempre la representación ~nidad. Por consiguiente, para una magnitud escalar los elementos de matnz diagonales son, en general, siempre distintos de cero. (1) ( 2) Teoría de la simetría 418 PROBLEMAS 1. Hallar las reglas de selección para los elementos de matriz de un vector polar cuando existe la simetría O. Solución. Las componentes del vector se transforman según la representación irreducible F 1 • Las descomposiciones de los productos directos de F 1 con otras representaciones del grupo O serán: F 1 xA 1 = F 1 , F 1 XA 2 = F 2, F 1 xE = F 1 +F2 , FíXF1 = A 1+E+F1+F2 , F 1 XF2 = A 2+E+F1+F2. (1) Por lo tanto, serán distintos de cero los elementos de matriz no diagonales para las transiciones: Los productos simétricos de las representaciones irreducibles del grupo O son iguales a: F 1 no está contenida en ninguno de ellos; por consiguiente, no existen elementos de matriz diagonales. 2. El mismo problema, pero cuando existe la simetría D 3d. Solución. La componente z del vector se transforma según la representación A 2u, y las componentes x, y, según la Eu. Tenemos: Eu.XA1g = Eu.XA2g = Eu, EuXEu = A 1g+A 211 +E11 , EuXA1u = EuXA2u = Eg, (1) Eu.XEg = A 1u+A 2u+Eu. Por ello son distintos de cero los elementos de matriz no diagonales de Ax, Ay para las transiciones Eu~A 1 11,A11 ,E11 ;E11 ~A1u,A2u- De la misma manera se hallan las reglas de selección para los elementos de matriz de Az: A111 ~ A2u, A211 ~ A1u, E11 ~ Eu. Los productos simétricos de las representaciones irreducibles son iguales a: [A¡g 2] = [A 1 u.2 ] = [A 2g 2] = [A2u2] = A 1 g, [E 11 2 ] = [E,/] = (2) E 11 +A1g· Estos productos no contienen ni A 2u, ni Eu; por lo tanto, los elementos de matriz diagonales son nulos, tanto para Az como para Ax y Ay. 3. Hallar las reglas de selección para los elementos de matriz de un tensor simétrico de segundo orden Aa; (con Axx + Ayy + Azz = O) cuando existe la simetría O. Solución. Las componentes Axy, Axz, Ayz se transforman según F 2 • Descomponiendo los productos directos de F 2 por todas las representaciones del grupo O, encontramos las reglas de selección F1 ~ A2, E, F1, F 2; F2 ~ A 11 E, F 11 F 2 • Los elementos de matriz diagonales existen (conforme se vé en virtud de (2), problema 1) para los estados F 1 y F 2 • Las sumas Axx+ e:Ayy+ e: 2Azz, Axx+ e: 2Ayy+ e:Azz ( e: = e277' /3 ) se transforman según la representación E. Las reglas de selección para los elementos no diagonales son: E~ A 1 , Aa, E; F1 ~Fi, F2; F 2~ F2• Los elementos diag'males son diferentes de cero para los estados E, Fi, F 2 4. El mismo problema para la simetría D 3a. 419 Grupo.,; continuo.-. S0/11cjú11. Azz se transforma según A1<,, es decir, Azz se comporta como un escalar. Las com-, ponentes A_,.;· -- A,1,1 y A,,1 se transforman según E11 : lo mismo vale para las componentes A.,,, A.,iz· Descomponiendo los productos directos de E!, por todas las representaciones del grupo l>;¡I/, encontramos las reglas de selección para los elementos de matriz no diagonales: Eg ~ A 1 g, A 2 g, Eg; Eu ~ A 1 u, A 2 u, Eu. Los elementos diagonales son diferentes de cero (conforme se deduce de (2), problema 2) sólo para los estados E,1 y E,,. *98. Grupos continuos Además de los grupos puntuales finitos considerados en el § 93, existen los llamados grupos puntuales continuos que poseen un número infinito de elementos. Estos grupos son los de simetría axil y de simetría esférica. El grupo más simple de simetría axil es el grupo C =, que contiene las rotaciones C(</>) de ángulo arbitrario <p en torno del eje de simetría (es el llamado grupo de rotaciones bidimensional). Este grupo se puede considerar como caso límite del grupo ( \ 1 para n ~ =. Análogamente, como casos límite del grupo (; 11 1z, l\¡1¡, D 11 1i, Dn se obtienen los grupos continuos C =Ji, C =v, D =, D =h· Una molécula posee simetría axil únicamente cuando está formada por átomos situados sobre una misma recta. Si en estas condiciones no es simétrica respecto de su punto medí.o, su grupo puntual será el grupo C =v, que contiene, además de las rotaciones en torno del eje, las reflexiones av en cualquier plano que pase por el mismo. Pero si la molécula es simétrica respecto de su punto medio, su grupo puntual será el grupo D =h = o:JI/ X (1¡. En cuanto a los grupos o::i, e o::ih, D o::i, no pueden ser grupos de simetrías de una molécula. e e El grupo de simetría esférica completa contiene las rotaciones de ángulo arbitrario en torno de cualquier eje que pase por el centro y las reflexiones en cualquier plano que pase por dicho punto; este grupo (que designaremos por K1i) es el grupo de simetría de un átc.no aislado. Contiene como subgrupo el grupo K de todas las rotaciones espaciales (el llamado grupo de rotaciones tridimensional, o, simplemente, grupo de rotaciones). El grupo K1z se puede obtener a partir del grupo l( añadiendo el centro de simetría (K 11 = K x l\). Los elementos de un grupo continuo se pueden distinguir mediante uno o más parámetros cuyos valores forman sucesiones continuas. Así, en el grupo de rotaciones los parámetros pueden ser, por ejemplo, dos ángulos que determinen la dirección del eje y el ángulo de rotación en torno del mismo. Las propiedades generales de los grupos finitos descritas en el § 92 y los conceptos ligados a ellas( como los de subgrupo, de elementos conjugados, clases, etc.) se generalizan directamente a los grupos continuos. Claro está, pierden su sentido todas las proposiciones que están ligadas de modo inmediato con el concepto de 420 Tt>oría de la ..;imetría orden del grupo (por ejemplo, la proposición según la cual el orden de un subgrupo es divisor del orden del grupo). En el grupo C =v todos los planos de simetría son equivalentes, de modo que todas las reflexiones a 0 constituyen una clase formada por una sucesión continua de elementos; el eje de simetría es bilateral, de forma que se tiene una sucesión continua de clases, cada una de las cuales contiene dos elementos C(± <p). Las clases del grupo D =h se obtienen inmediatamente a partir de las clases del grupo D =h = (; =v X ( '¡. En el grupo de rotaciones K, todos los ejes son equivalentes y bilaterales; por ello las clases de este grupo son las rotaciones de ángulo dado en valor absoluto (c/>l en torno de un eje cualquiera. Las clases del grupo K 11 se obtienen directamente a partir de las clases del grupo K. Las representaciones irreducibles del grupo de rotaciones tridimensional las encontramos ya, en esencia (sin utilizar entonces la terminología de la teoría de grupos), cuando determinamos los valores propios y las funciones propias del momento cinético total. El operador momento cinético es (salvo un factor constante) el operador de una rotación infinitesimal. y sus valores propios caracterizan el comportamiento de las funciones de onda respecto de las rotaciones espaciales. Al valor .i del momento cinético corresponden 2j + 1 funciones propias diferentes 'lfJjm que difieren en los valores de la proyección m del momento y que corresponden a un nivel energético degenerado de orden ~¡ + 1. En las rotaciones del sistema de coordenadas, estas funciones se transforman entre sí, proporcionando de esta manera una representación irreducible del grupo de rotaciones. En consecuencia, desde el punto de vista de la teoría de grupos, los números j numeran las representaciones irreducibles del grupo de rotaciones, correspondiendo a cada j una representación de 2j + 1 dimensiones. El número j recorre el conjunto de los números enteros y semienteros, de modo que la dimensionalidad 2j+ 1 de ]as representaciones recorre la sucesión de los números enteros l, 2, 3, ... Las funciones de base de estas representaciones se estudiaron ya, en esencia, en el capítulo VIII. La base de la representación con un j dado está constituida por las 2j + 1 componentes independientes de un espinor simétrico de orden 2j (a las que es equivalente el conjunto de las 2j + 1 funciones "PfoJ Las representaciones irreducibles del grupo de rotaciones que corresponden a valores j semienteros se distinguen por una característica fundamental. Consiste ésta en que en una rotación de ángulo 2n sus funciones de base (componentes de un espinor de orden impar) cambian de signo. Pero dado que una rotación de ángulo 2n coincide con el elemento unidad del grupo, llegamos a la conclusión de que las representaciones con valores j semi enteros son, como se suele decir, bivalentes: a cada elemento del grupo (a cada rotación en torno de un eje de ángulo <p, O ::;;: <p ::;;: Grupo .., continuos 421 2n) corresponde en dicha representación no una, sino dos matrices cuyos carac- teres difieren en el signo (1). Un átomo aislado posee, conforme se hizo ya notar, la simetría K1i = K x C i· Por ello, desde el punto de vista de la teoría de grupos, a cada término del átomo corresponde una cierta representación irreducible del grupo de rotaciones K (que viene determinada por el valor del momento cinético total J del átomo) y una representación irreducible del grupo {1¡ (que viene determinada por la paridad del estado) (2). Si se coloca el átomo en un campo eléctrico exterior, sus niveles de energía se desdoblan. El número de niveles distintos que así aparecen y la simetría de los correspondientes estados se pueden determinar siguiendo el método descrito en el § 96. Para esto es necesario descomponer la representación reducible de 21 + 1 dimensiones del grupo de simetría del campo exterior (que proporcionan las funciones 'lj)J :u) en representaciones irreducibles del mismo grupo. Se plantea con ello la necesidad de conocer los caracteres de la representación de que son base las funcio~ nes '1.J).T.\I· En una rotación de ángulo <p en torno de un cierto eje, las funciones de onda 1Pn1 quedan multiplicadas, conforme sabemos, por eiJtr/J, donde Mes la proyección del momento cinético sobre dicho eje. Por ello la matriz de transformación de ]as funciones 'lj)J ..w será diagonal, con el carácter o bien (98.1) (') Hay que decir que las representaciones bivalentes de un grupo no son representaciones en el sentido estricto de la palabra, ya que sus funciones de base no están definidas unívocamente: véase también§ 99. (") Además, el hamiltoniano del átomo es invariante respecto de las permutaciones de los electrone~ En la aproximación no relativista. las funciones de onda de coordenadas y las de spin se separan, y cabt: hablar de representaciones del grupo de permutaciones cuyas bases son las funciones de coordenadas. Al dar la representación irreducible del grupo de las permutaciones, se determina a la vez el spin total del átomo S (§ 63). Pero si se tienen en cuenta las interacciones relativistas, la descomposición de ias funciones de onda en una parte dependiente de las coordenadas y otra dependiente del spin es imposible. La simetría respecto de las permutaciones de las coordenadas y de los spins de las partículas simultáneamente no conduce a ninguna característica del término, ya que, por el principio de PAl u son admisibles solamente las funciones de onda completas que son antisimétricas respecto de todos los electrones. Esto .:orresponde a que, al tener en cuenta las interacciones relativistas, el spin, rigurosamente hablando, no se conserva (se conserva solamente el momento cinético total J). 422 Respecto a la inversión !, en cambio, todas ias funciones 'lfJJ., 1 con valores M distintos se comportan de la misma manera - quedan multiplicadas por + 1 o por - 1 según sea par o impar el estado del átomo. El carácter es, por consiguiente, i.Jl(I) = :±: (21 + 1). (98.2) Finalmente, los caracteres que corresponden a la reflexión en un plano a y al giro reflejado de ángulo cp se calculan mediante la representación de estas transformaciones de simetría en la forma r; =-= IC'!., S(cp) = JC("+cb). Consideremos ahora las representaciones irreducibles del grupo de simetría axil ( v. Esta cuestión fue ya resuelta esencialmente cuando expusimos la clasificación de los términos electrónicos de una molécula diatómica, que precisamente posee la simetría (1c'°u (si ambos átomos son diferentes). A los términos O+ y o(términos con n = O) corresponden dos representaciones unidimensionales: la representación unidad A 1 y la representación A 2 , en la que la función de base es invariante respecto de todas las rotaciones y cambia de signo en las reflexiones en los planos Doblemente degenerados son, en cambio, los términos con U = 1, 2, ... a los que corresponden representaciones bidimensionales que designaremos por E 1 , E 2 , ••• Sus funciones de base quedan multiplicadas por e:: ¡n9 en una rotación de ángulo cp en torno del eje, mientras que en una reflexión en planos av se transforman entre sí. 1 00 ªv· Las representaciones irreducibles del grupo Dcx;h = C ::iov x ('¡ se obtienen directamente a partir de las representaciones del grupo (1=1! (y corresponden a la clasificación de los términos de una molécula diatómica con núcleos idénticos). Si se toman para n valores semienteros, las funciones e±m</, conducen a representaciones irreducibles bivalentes del grupo ( 1 e-e,, que corresponden a los términos de la molécula con spin semientero (1). *99. Representaciones bivalentes de los grupos puntuales finitos A los estados de un sistema con spin sernientero (y, por lo tanto, de momento cinético total también semientero) corresponden representaciones bivalentes del grupo puntual de simetría de dicho sistema. Es ésta una propiedad general de los espinares, y vale, por consiguiente, tanto para los grupos puntuales continuos como (') En contraste con el grupo de rotaciones en tres dimensiones. eligiendo de manera adecuada \alorcs fraccionarios de .!.2 ~cría aquí posible obtener, no solamente n:prescntacioncs univalcntcs y birnlentes, sino también representaciones trivalentes e incluso de orden superior. Sin embargo, los \alores propios del momento cinético físicamente posibles, en tanto que operador de rotación infinitesimal. se determinan precisamente por las representaciones del grupo de rotaciones tridimensionales. Por ello las rcprcscntacionc, trivalcntes (y de orden superior) del grupo de rotaciones bidimensionales (y rambién de cualquier grupo finito de simetría). aunque se pueden definir matcmúticamente. carecen de significado físico. para los finitos. Con esto se plantea el problema de hallar las representaciones irreducibles bivalentes de los grupos puntuales finitos. Conforme se hizo ya notar, las representaciones bivalentes no son, en realidad, representaciones de un grupo en sentido estricto. En particular, no valen para ellas las relaciones de las que se trató en el ~ 94, y cuando en estas relaciones ( por ejemplo, en la relación (94.15) para la suma de los cuadrados de las dimensiones de las representaciones irreducibles) se hablaba de todas las representaciones irreducibles, por todas se entendía solamente las representaciones propiamente tales, las univalentes. Para estudiar las representaciones bivalentes conviene adoptar el siguiente artificio ( H. BETHE, 1929). De manera puramente formal, introduzcamos en el grupo un nuevo elemento (que designaremos por Q) - elemento que corresponde a la rotación de ángulo 2.:-r en torno de un eje arbitrario --- que es diferente del elemento unidad, pero que coincide con E al aplicarlo dos veces: Q2 = E. De acuerdo con esto, las rotaciones C 1 en torno de un eje de simetría n-ario conducirán a las transformaciones idénticas tan sólo después de aplicarlas 211 veces (y no después de n veces): cnzn = E. (99.1) La inversión /, en tanto que elemento que conmuta con todas las rotaciones, debe dar, como antes, el elemento E después de aplicarla dos veces. Pero la doble reflexión en un plano será igual a Q, y no igual a E: a2 = Q, cr 4 = E; (99.2) (esto se sigue de que una reflexión se puede escribir en la forma ª1i = /C2 ). Obtenemos así, en definitiva, un conjunto de elementos que forman un cierto grupo puntual de simetría ficticio cuyo orden es el doble del orden del grupo de partida; llamaremos a estos grupos, grupos puntuales dobles. Las representaciones bivalentes del grupo puntual real serán, evidentemente, representaciones univalentes, es decir, representaciones fieles, del correspondiente grupo doble, de forma que para hallarlas se pueden aplicar los métodos ordinarios. El número de clases en el grupo doble es mayor que en el grupo inicial (pero, en general, no el doble). El elemento Q conmuta con todos los demás elementos del grupo (1) y, por lo tanto, constituye de suyo siempre una clase. Si el eje de simetría es bilateral, esto significa que en el grupo doble son conjugados los elementos C,/' y C,? 11 - 1.- = QC,/1-J.-. De aquí resulta que cuando existen ejes binarios, la distribución de los elementos en clases depende también de si estos ejes son o no bilaterales ·(en los 1 ( ) P:.1ra las rotaciont:s) la i,nersión. est0 .:s e'.idcnte: rara las reAexiones en planos. ello se -;igue de que una reAexión se puede representar como producto de una i,nersión y una rotación. Teoría de la simetría 4.24 grupos puntuales ordinarios esto carece de importancia, ya que C 2 coincide con Ja rotación inversa c2- 1). Así, por ejemplo, en el grupo T los ejes binarios son equivalentes, y cada uno de ellos es bilateral, mientras que los ejes ternarios son equivalentes, pero no bilaterales. Por ello los 24 elementos del grupo doble T' (1) se distribuyen en 7 clases: E, Q, la clase de las tres rotaciones C2 y de las tres C2 Q, y las clases 4C3 , 4C/, 4C3 Q, 4ClQ. Del conjunto de todas las representaciones irreducibles de un grupo puntual doble forman parte, en primer lugar, las representaciones que coinciden con las representaciones univalentes del grupo simple (en las que al elemento Q, de la misma manera que al E, corresponde la matriz unidad) y, en segundo lugar, las representaciones bivalentes del grupo simple, en las que al elemento Q corresponde la matriz unidad con signo negativo; nos interesan ahora precisamente estas últimas representaciones. Los grupos dobles (' 11 ' (n = 1, 2, 3, 4, 6) y S 4', como también los grupos simples correspondientes, son grupos cíclicos C} Todas sus representaciones irreducibles son unidimensionales y se pueden hallar sin dificultad conforme se explicó en el § 95. Las representaciones irreducibles del grupo /J,/ (o sus isomorfos ('' 1111 ) se pueden determinar siguiendo el mismo método que en el caso de los correspondientes grupos simples. Estas representaciones admiten como base funciones de la forma e±ik</>, donde cp es el ángulo de rotación en torno del eje n-ario, y para k se toma un valor semientero (los valores enteros corresponden a las representaciones univalentes ordinarias). Las rotaciones en torno de los ejes horizontales binarios transforman estas funciones entre sí, y la rotación C11 las multiplica por e±21rik¡n. Algo más difícil es hallar las representaciones de los grupos cúbicos dobles. Los 24 elementos del grupo T' se distribuyen en siete clases. Se tienen por ello en total siete representaciones irreducibles, de las cuales cuatro coinciden con las representaciones del grupo simple ''J'. La suma de los cuadrados de las dimensiones de las tres representaciones restantes debe ser igual a 12, de donde se sigue que todas ellas son bidimensionales. Dado que los elementos C 2 y C 2 Q se encuentran en una misma clase, se tendrá x( C 2 ) = x( C 2 Q) = - z( C 2), de donde se deduce que en las tres representaciones es x( C 2) = O. Además, una por lo menos de éstas debe ser real, ya que las representaciones complejas pueden aparecer solamente formando pares conjugados. Consideremos esta representación y supongamos que la matriz del ( 1 ) Distmguircmo,;; los grupos dobles por un apóstrofo en el ,;imbolo del grupo ordinario. En cambio. los grupos pero no cíclicos. ('!) S 2' = C/, Ss' = C ¡', que contienen la inversión /, son grupo-; abcliano~. 3 425 H ,•prt>.'if'll t<u·io11P.'i l,i1,alt>n t,•.'i ,/,• lo.o; l{TUpO.'i puntuale.o; finitos TABLA 8 Representaciones hirnle111e.1· de los Krllpos p111111,a/es C~(xl C\(X)Q D/ E Q E' 2 -2 D' 3 E Q C3 C3 2Q -1 -1 -1 -1 o C/Y)Q C2(zl C2<zlQ o o C/ C3Q 3U2 C2<Yl 3U2º -i E' 'l -i o E2' 2 -2 Ds' E Q E¡' 2 -2 o -1 E2' 2 -2 o -1 Ea' 2 -2 o D' 4 E Q E¡' 2 -2 o ,12 E/ 2 -2 o _ \12 T' E Q E' 2 -1 C2 C3 C2Q ClQ Co5 3U2 3U'2 C6Q 3U2Q 3U'2Q ,13 -,13 o o -y3 v'3 o o o o o o 2U2 2U2 Q 2U'2 2U'2 Q -,12 o o '\12 o o 4C/Q 3C2 3C2Q C32 C3Q -2 2 C2 C4 C/ C2Q C4 3 Q C4Q 4C/ 4C 3Q -2 -1 -1 2 -2 - €2 -E 2 -2 -e - E Q 4C 3 2 4C 3 Q 3C 4 2 O' E1' 2 -2 -1 o E/ 2 -2 -1 G' 4 -4 4Ca o Cs Cs 5 Q o €2 G' €2 4Ca 4(\2Q -1 o o c2 3Cl 3C4Q 6C2 6C2Q ,12 -,12 o o -,12 ,/2 o o o o o 3C/Q 3C4 3C4 3 Q 426 Teoría de la simetría elemento C3 se ha reducido a la forma diagonal (sean a 1 , a 2 sus elementos diagonales). Dado que ca3 = Q, se tendrá a¡3 =al= - l. Para que x(C3) = a 1 +a2 sea real hay que tomar a 1 = e'"i/3 , a2 = e-'"i/ 3• De aquí deducimos que x(C3) = 1, x(C:l) = = a¡2+al = - l. De esta manera hemos encontrado una de las representaciones buscadas. Comparando sus productos directos con las dos representaciones unidimensionales conjugadas complejas del grupo T, encontramos las dos representaciones restantes. Consideraciones análogas, que no nos detendremos en desarrollar aquí, permiten hallar las representaciones del grupo O'. En la tabla 8 adjunta se dan los caracteres de las representaciones de los grupos dobles citados (únicamente para las representaciones que corresponden a representaciones bivalentes de los grupos ordinarios). Estas mismas representaciones poseen los grupos dobles isomorfos. Los restantes grupos puntuales o son isomorfos con los ya considerados, o se obtienen como resultado de la multiplicación directa de éstos por el grupo C ¡, de modo que sus representaciones no requieren un cálculo especial. Por las mismas razones que en el caso de las representaciones ordinarias, dos representaciones bivalentes que son conjugadas complejas deben considerarse, desde el punto de vista físico, como una sola representación de dimensión doble. En cambio, las representaciones bivalentes unidimensionales deben aparearse incluso en el caso en que sus caracteres sean reales. Ello se debe (véase § 60) a que en un sistema cuyo spin es semientero las funciones de onda conjugadas complejas son linealmente independientes. Por lo tanto, si tenemos una representación unidimensional bivalente (1) con caracteres reales (cuya base es una cierta función '1./J), aunque la función conjugada compleja '1./J* se transforma de acuerdo con la misma representación, con todo cabe afirmar que '1./J y '1./J* son linealmente independientes. Dado que, por otra parte, las funciones de onda conjugadas complejas deben pertenecer a un mismo nivel de energía, vemos así que en las aplicaciones físicas dicha representación debe ser duplicada. PROBLEMA Determinar cómo se desdoblan los niveles de un átomo (con valores dados del momento cinético total J) situado en un campo que posee simetría cúbica O (1). Solución. Las funciones de onda de los estados del átomo con momento cinético J y diferentes valores lvfJ son base de una representación reducible de dimensión 2J+ 1 del grupo O, (1) Tales representaciones se encuentran en los grupos C'n con iguales a x(Cé) = ( - J)k. II impar; en ellos los caracteres son (1) Puede tratarse, por ejemplo, de un átomo en una red cristalina. Obsérvese también que la existencia o no existencia de un centro de simetría en el grupo de simetría del campo exterior carece de importancia para el problema considerado, ya que el comportamiento de la función de onda en una inversión (paridad o no paridad del nivel) nada tiene que ver con el momento cinético J. RPprP.'iPnlarionP.'i l1iralt>nt<'.'i <IP lo.,; grupo.,; puntuale.'i finito.i, 427 con caracteres determinados por la fórmula (98.1 ). Descomponiendo esta representación en partes irreducibles (univalentes para J entero o bivalentes para J semientero), se determina el desdoblamiento buscado (cf. ~ 96). He aquí las partes irreducibles de las representaciones que corresponden a los primeros valores de J: J =Ü A1 1/2 E' 1 F1 3/2 2 5/2 3 G' E+F2 E 2'+G' A 2 +F¡-t-F2 CAPÍTULO XIII MOLÉCULAS POLIATÓMICAS § 1OO. Gasificación de las vibraciones moleculares En su aplicación a las moléculas poliatómicas, la teoría de grupos ante todo resuelve directamente el problema de la clasificación de sus términos electrónicos, es decir, el de la clasificación de los niveles de energía para una distribución dada de los núcleos. Estos términos se clasifican de acuerdo con las representaciones irreducibles del grupo puntual de simetría que admite la configuración de los núcleos que se considera. Sin embargo, acerca de ello hay que subrayar el hecho evidente de que la clasificación que se obtiene de esta manera se refiere precisamente a la distribución determinada de los núcleos, de forma que cuando éstos se desplazan la simetría de la configuración, en general, queda modificada. Dicha distribución es, de ordinario, la distribución correspondiente a la posición de equilibrio de los núcleos. En este caso la clasificación sigue poseyendo un cierto sentido también para pequeñas vibraciones de los núcleos, pero pierde su significado, claro está, si las vibraciones no se pueden considerar pequeñas. En una molécula diatómica no se planteaba esta cuestión, ya que su simetría axil se conserva, evidentemente, para cualquier desplazamiento de los núcleos. Una situación análoga tiene también lugar para las moléculas triatómicas. Tres núcleos se encuentran siempre en un plano, que es plano de simetría de la molécula. Por ello es siempre posible la clasificación de los términos electrónicos de una molécula triatómica respecto de este plano (simetría o antisimetría de las funciones de onda en la reflexión en el mismo). Para los términos electrónicos normales de las moléculas poliatómicas vale una regla empírica según la cual, en la mayor parte de las moléculas, la función de onda del estado electrónico normal posee simetría completa (para las moléculas diatómicas se señaló ya esta regla en el § 78). Con otras palabras, dicha función es invariante respecto de todos los elementos del grupo de simetrías de la molécula, es decir, corresponde a la representación irreducible unidad del grupo. La aplicación de los métodos de la teoría de grupos es particularmente importante en el estudio de las vibraciones moleculares (E. WIGNER, 1930). Antes de con- Clasificación de las vibraciones moleculares 429 siderar esta cuestión desde el punto de vista mecánicocuántico, es necesario proceder a un examen puramente clásico de las vibraciones de una molécula considerada como un sistema constituido por un cierto número de partículas en interacción (los núcleos). Como es sabido (1) un sistema de N partículas (no situadas sobre una misma recta) posee 3N-6 grados de libertad vibratorios; del número total de grados de libertad 3N, tres corresponden al movimiento de translación y tres al movimiento de rotación del sistema en conjunto (2). La energía de un sistema de partículas que efectúan pequeñas vibraciones se puede escribir de la siguiente forma: (100.1) donde m¡k, k¡k son coeficientes constantes y u¡ son las componentes de los vectores desplazamiento de las partículas a partir de sus posiciones de equilibrio (los índices i, k indican tanto las componentes del vector como las partículas). Mediante una transformación lineal adecuada de las cantidades u¡, es posible eliminar en (100.1) las coordenadas que corresponden al movimiento de translación y de rotación del sistema, y elegir las coordenadas vibracionales de tal manera que las dos formas cuadráticas que aparecen en (100.1) se reduzcan a sumas de cuadrados. Normalizando estas coordenadas de manera que todos los coeficientes en la expresión de la energía cinética se reduzcan a la unidad, obtenemos la energía vibratoria en la forma: (100.2) Las coordenadas vibracionales Qa¡ se llaman normales; wa son las frecuencias de las vibraciones independientes que les corresponden. Puede ocurrir que a algunas coordenadas normales corresponda una misma frecuencia (de ella se dice entonces que es múltiple); el índice a en una coordenada normal corresponde al número de la frecuencia, y el índice i = 1, 2, ... , fa numera las coordenadas correspondientes a una misma frecuencia (fa es la multiplicidad de ésta). La expresión (100.2) para la energía de la molécula debe ser invariante respecto de las transformaciones de simetría. Esto significa que en toda transformación relativa al grupo puntual de simetría de la molécula, las coordenadas normales Qa¡, i = 1, 2, ... Ja (para cada a dado) se transforman linealmente entre sí, y precisamente de tal manera que la suma de los cuadrados ~ Q(Y.l permanece invariable. Con otras palabras, las coordenadas normales que se refieren a cada frecuencia propia dada de las vibraciones moleculares, constituyen la base de una representación Véase tomo I, M?cánica, §§ 23 y 24. Si todas las partículas están situadas sobre una misma recta, el número de grados de libertad vibratorios es 3N-5 (en este caso, a la rotación corresponden, en total, dos coordenadas, ya que hablar de la rotación de una molécula lineal en torno de su eje carece de sentido. (1) (2) 430 Moléculas poliatómicm; irreducible de su grupo de simetrías; la multiplicidad de la frecuencia determina las dimensiones de la representación. El carácter de irreducible se sigue de las mismas consideraciones que se hicieron en el§ 96 al tratar de las soluciones de la ecuación de SCHRODINGER. La coincidencia de las frecuencias que corresponden a dos representaciones irreducibles distintas sería una casualidad improbable. De nuevo constituyen una excepción las representaciones irreducibles con sistemas de caracteres conjugados complejos. Dado que las coordenadas normales, por su propia naturaleza, son cantidades reales, dos representaciones conjugadas complejas corresponden físicamente a una frecuencia propia de multiplicidad dos veces mayor. Estas consideraciones permiten llevar a cabo la clasificación de las vibraciones propias de una molécula sin necesidad de resolver el complicado problema que plantea la determinación efectiva de sus coordenadas normales. Para ello hay que hallar, primero (siguiendo el método que se indica más adelante), la representación que proporciona el conjunto de todas las coordenadas vibracionales (la llamaremos representación total); esta representación es reducible, y descomponiéndola en sus partes irreducibles determinamos precisamente la multiplicidad de las frecuencias propias y las propiedades de simetría de las correspondientes vibraciones. Al hacerlo puede ocurrir que una misma representación irreducible esté contenida en la representación total un cierto número de veces: esto significa que se tienen ciertas frecuencias distintas, de igual multiplicidad, con vi_braciones de la misma simetría. Para hallar la representación total partiremos del hecho de que los caracteres de una representación son invariantes respecto de una transformación lineal de las funciones de base. Por ello, para calcularlos podemos utilizar como funciones de base, no las coordenadas normales, sino simplemente las componentes u¡ de los vectores desplazamiento de los núcleos con relación a sus posiciones de equilibrio. Ante todo, es evidente que al calcular el carácter de un cierto elemento G del grupo puntual hay que considerar tan sólo los núcleos cuyas posiciones (más exactamente, cuyas posiciones de equilibrio) no varían al aplicar la transformación de simetría dada. En efecto, si en la rotación o en la reflexión considerada, G, el núcleo 1 pasa a ocupar un nuevo lugar en el que antes se encontraba otro núcleo 2, esto significa que en la operación G el desplazamiento del núcleo 1 se transforma en el desplazamiento del núcleo 2. Con otras palabras, en las filas de la matriz G¡k que corresponden a este núcleo (es decir, a su desplazamiento u¡) no aparecerán nunca elementos diagonales. En cambio, las componentes del vector desplazamiento de un núcleo cuya posición de equilibrio no se ve modificada por la operación G, se transforman entre sí exclusivamente, de modo que es posible considerarlas con independencia de los vectores desplazamiento de los demás núcleos. Consideremos primero la rotación C(</>) de ángulo </>entorno de un eje de simetría. Sean ux, uy, Uz las componentes del vector desplazamiento de uno de los núcleos Clasificación de la... vibraciones moleculares 431 cuya posición de equilibrio se encuentra sobre este mismo eje, por lo que no se ve afectada por la rotación. Como la de cualquier vector ordinario (polar), estas componentes se transforman en una rotación de acuerdo con las fórmulas (el eje z coincide con el eje de simetría) u' x = Uz cos<f>+u'Ysen<f,, u' v = -uxsen<f>+u 11 cos<f,, U'z = Uz. El carácter, es decir, la suma de los términos diagonales de la matriz de la transformación, es igual a 1 +2 cos cp. Si sobre el eje en cuestión se encuentran situados Ne núcleos, el carácter total es igual a: Nc(1+2 cos<f,). (100.3) Sin embargo, este carácter corresponde a la transformación de todos los 3N desplazamientos ui; debemos por ello separar la parte correspondiente a las transformaciones de translación y rotación (pequeña) de la molécula en conjunto. La translación se define por el vector desplazamiento U del centro de masas de la molécula; la parte correspondiente del carácter, por consiguiente, es igual a 1 +2 cos cp. En cambio, la rotación de la molécula en conjunto se determina mediante el vector b n del ángulo de rotación (1). El vector b n es un vector axil; pero con relación a las rotaciones del sistema de coordenadas, un vector axil se comporta de la misma manera que un vector polar. Por ello también al vector b n le corresponde un carácter igual a 1 +2 cos cp. Por consiguiente, de (100.3) debemos restar en total el valor 2(1 +2 cos cp). Encontramos así finalmente el carácter x( C) de la rotación C( cp) en la representación vibracional total: x(C) = (Nc-2)(1+2 cos<f,). (100.4) El carácter del elemento unidad E es igual, evidentemente, al número total de grados de libertad vibratorios: x(E) = 3N-6 (como se obtiene también de (100.4) para Ne= N, cp = O). De manera por completo análoga se calcula el carácter del giro reflejado S(cp) (la rotación de ángulo cp en torno del eje z y la reflexión en el plano xy). En esta transformación, un vector se transforma de acuerdo con las fórmulas u' x = Uz cos<f>+u 11 sen</>, u' v = -uxsen<f>+uv cos<f,, U'z = -Uz, (1) Como es sabido, el ángulo d~ una rotació_n in~?itesimal. se pu~de. considerar como ~n vector <~~. cuyo módulo es igual al ángulo de giro y cuya d1recc10n y sentido comc1den con los del eJe de rotac10n de acuerdo con la regla del sacacorchos. El vector <50 determinado de esta manera es, evidentemente, un vector axil. 432 Moléculas poliatómicas a lo que corresponde un carácter igual a (- 1 +2 cos </>). Por lo tanto, el carácter de la representación cuya base es el conjunto de los 3N desplazamientos ui es igual a Ns(-1+2 coscp), (100.5) donde Ns es el número de núcleos no afectados por la operación S(</>) (este número, evidentemente, puede ser o cero o la unidad). Al vector desplazamiento del centro de masas U corresponde el carácter - 1 + 2 cos <p. En lo que concierne al vector <5 n, dado que éste es un vector axil no cambia en la inversión del sistema de coordenadas; por otra parte, el giro reflejado S(</>) se puede representar en la forma: S(<fo) = C(cp)crh = C(cp)C21 = C(7T+cp)I, es decir, como rotación de ángulo n+</> seguida de la inversión. Por lo tanto, el carácter de la transformáción S(</>) aplicada al vector <50, es igual al carácter de la transformación C(n+</>) aplicada a un vector ordinario, es decir, es igual a 1 +2 cos (n+</>) = 1 - 2 cos <p. La suma (- 1 +2 cos 4,)+(1- 2 cos </>)=O, de modo que llegamos al resultado de que la expresión (100.5) es igual, sin más, al carácter buscado x(S) del giro reflejado S(</>) en la representación total: x(S) = Ns(-1+2 cos<f,). (100.6) En particular, el carácter de la reflexión en un plano (</>=O) es igual a x(a) = Na, y el carácter de la inversión (</> = n) es x(l) = - 3N1 . Una vez determinados los carácteres x de la representación total, falta tan sólo descomponerla en representaciones irreducibles, lo que se efectúa según la fórmula (94.14) con ayuda de las tablas de caracteres que se dieron en el§ 95 (véanse los problemas de este párrafo). Para clasificar las vibraciones de una molécula lineal, no hay necesidad de acudir a la teoría de grupos. El número total de grados de libertad vibratorios es igual a 3N - 5. Entre las vibraciones, hay que distinguir aquéllas en las que los átomos se mantienen sobre una misma recta y aquéllas en las que no se cumple esta condición (1). El número de grados de libertad en el movimiento de N partículas a lo largo de una recta es igual a N; de ellos, uno corresponde a la translación de la molécula como un todo. Por consiguiente, el número de coordenadas normales de las vibraciones que conservan los átomos sobre una recta es igual a N - 1 ; a ellas corresponden, en general, N - 1 frecuencias diferentes. Las restantes (3N - 5) - (N - 1) = = 2N - 4 coordenadas normales corresponden a vibraciones que no conservan el carácter lineal de la molécula; a ellas corresponden N - 2 frecuencias dobles diferentes (a cada frecuencia van ligadas dos coordenadas normales, las cuales corresponden a vibraciones idénticas en dos planos perpendiculares entre sí) (2). (1) Si la molécula es simétrica respecto de su punto medio, existe todavía una característica más de las vibraciones, de la que se trata en el problema I O de este párrafo. (2) Utilizando las notaciones de las representaciones irreducibles del grupo Coo v (véase § 98), podemos decir que se tienen N - 1 vibraciones del tipo A 1 y N - 2 vibraciones del tipo E1 • Clasificación de las vibraciones moleculares 433 PROBLEMAS 1. Clasificar las vibraciones normales de la molécula NH3 (pirámide regular con el átomo N en la cúspide y los átomos H en los vértices de la base - fig. 41 ). Solución. El grupo puntual de simetría de la molécula es el C 3 v. Las rotaciones en torno del eje de tercer orden conservan en su sitio únicamente un átomo (el N) y la reflexión en los planos dejan invariables las posiciones de dos átomos (el N y uno de los H). Aplicando las fórmulas (100.4) y (100.6) encontramos los caracteres de la representación total: N Descomponiendo esta representación en partes irreducibles, se encuentra que contiene dos veces la representación A1 y dos veces la E. Se tienen así dos frecuencias simples, que corresponden a vibraciones del tipo A1 y conservan la simetría completa de la molécula (son las llamadas vibraciones totalmente simétricas), y dos frecuencias dobles, que corresponden a las coordenadas normales que se transforman entre sí de acuerdo con la representación E. E o 6 2. 2 El mismo problema para la molécula H 20 (fig. 42). Solución. El grupo de simetría es el C 2 i·· La transformación C 2 conserva la posición del átomo O, la transformación a v (la reflexión en el plano de la molécula), las de los tres átomos, y la reflexión a\., tan sólo la de un átomo, el O. Los caracteres de la representación total serán iguales a: , E 3 (J 11 1 3 1 Esta representación se descompone en las representaciones irreducibles: 2Ai, 1B1 , es decir, se tienen dos vibraciones totalmente simétricas y una con una simetría determinada por la representación B1 ; todas las frecuencias son simples (en la fig. 42 se representan las correspondientes vibraciones normales). 3. El mismo problema para la molécula CHCL 3 (fig. 43, a). Solución. El grupo de simetrías de la molécula es el C3 v, Siguiendo el mismo método, se encuentra que existen tres vibraciones totalmente simétricas A1 y tres vibraciones dobles del tipo E. 4. El mismo problema para la molécula CH 4 (el átomo C en el centro, y los átomos H en los vértices de un tetraedro; fig. 43, b). Solución. 5. La simetría de la molécula es la Td. Las vibraciones son lAi, lE, 2F2 • El mismo problema para la molécula C 6 H6 (fig. 43, c). 434 Moléculas poliatómicas Fm. 42 Solución. La simetría de la molécula es la n 6 h. Las vibraciones son: 6. El mismo problema para la molécula OsF 8 (el átomo Os en el centro, los átomos F en los vértices de un cubo; fig. 43, d). Solución. La simetría de la molécula es oh. Las vibraciones son: 7. El mismo problema para la molécula UF6 (el átomo U en el centro, los átomos F en los vértices de un octaedro; fig. 43, e). Solución. La simetría de la molécula es Oh. Las vibraciones son: 1A1,, 1E,, 2Fiu, 1F2g, 1F,u. 8. El mismo problema para la molécula C 2 H 6 (fig. 43, f). Solución. 9. La simetría de la molécula es D 3d. Las vibraciones son: El mismo problema para la molécula C 2 H 4 (fig. 43, g; todos los átomos en un mismo plano). Solución. La simetría de la molécula es ]} 2h, Las vibraciones son: (los ejes de coordenadas se han elegido conforme se indica en la figura). 435 Clasificación de las vibracione... moleculare... H (o) ~ CL CL H H H {b ,H~ CL H H H H H F F F (f ) ( d) H H (e) F F F ~ H F F H F (g) H H Frn. 43 10. El mismo problema para una molécula lineal formada por N átomos que es simétrica respecto del punto medio. Solución. A la clasificación de las vibraciones de una molécula lineal considerada en el texto se añade la clasificación relativa al comportamiento en la inversión respecto del centro. Hay que distinguir los casos en que N es par y aquéllos en que es impar. Si N es par (N = 2p), en el centro de la molécula no hay ningún átomo. Desplazando arbitrariamente a lo largo de la recta los p átomos de una de las mitades de la molécula y atribuyendo a los p restantes átomos desplazamientos iguales y opuestos, encontramos que p de las vibraciones que conservan los átomos sobre la recta son simétricas respecto del centro y las restantes (2p - 1) - p = p - 1 vibraciones de este tipo son antisimétricas respecto del mismo. Además, p átomos poseen 2p grados de libertad para movimientos en los que los átomos no se mantienen sobre la recta. Aplicando a los átomos colocados simétricamente desplazamientos iguales y opuestos, obtendríamos 2p vibraciones simétricas; de este número hay que restar, sin embargo, las dos que corresponden a la rotación de la molécula. De esta manera se tienen p - 1 frecuencias dobles de vibraciones que separan los átomos de la recta y que son simétricas respecto del centro, y otras tantas ((2p - 2) - ( p - l) = p - 1) que son antisimétricas. Utilizando las notaciones de las representaciones irreducibles del grupo l)ooh (véase el final del § 98), podemos decir que se tienen p vibraciones del tipo A117 y p - 1 vibraciones para cada uno de los tipos A 1 u, Ew, E 1 u. Si N es impar (N ~-= 2p-L J ), consideraciones análogas prueban que se tienen p vibraciones para cada uno de los tipos A 1 y, A 111 , E 1 11 y p - 1 vibraciones del tipo E¡g. 436 Moléculas poliatómicas § 1O1. Niveles de la energía de vibración Desde el punto de vista de la mecánica cuántica, la energía de vibración de la molécula se determina por los valores propios del hamiltoniano Írx fl(v) = l. ~ ~ 2 oc i =l donde P . = p Írx .2+1. ~ w 2 ~ °'' 2 oc °' i -1 Q .2 °'' ' (101.l) o - in -son los operadores impulso que corresponden a las cooróQtti denadas normales Qtti· Dado que este hamiltoniano se descompone en suma de sumandos independientes t(Pa:?+wo:2Qa:?) , los niveles de energía son sumas de la forma <n (101.2) donde Vtt = LiVoci y ftt es la multiplicidad de la frecuencia wtt. En cuanto a las funciones de onda, son productos de las correspondientes funciones de onda de los osciladores armónicos lineales: (101.3) Hv designa el polinomio de Hermite de grado V y Ctt = v~'Y./ñ. (101.4) Si entre las frecuencias wtt existen frecuencias múltiples, los niveles vibratorios de la energía son degenerados, en general. La energía (101.2) depende solamente de la suma vtt = LiVoci· Por ello la multiplicidad de la degeneración del nivel es igual al número de maneras que permiten formar el conjunto dado de números Voc a partir de los números Voci· Para un sólo v'Y., aquel número es igual a {1): (vo:+/<X-1)!/vo:!(/°'-1)!. Por consiguiente, el grado total de degeneración es igual a: n (voc+fo:-1)! (101.5) vo.!(/°'-1)! Para frecuencias dobles, los factores de este producto son iguales a vtt+l, y para las triples, son iguales a Hvtt+I)(vtt+2). No hay que perder de vista que esta degeneración se presenta solamente en tanto (1) Éste es el número de maneras que permiten distribuir ·r-x bolas entre {'X urnas. Nivele.,; de la energía de vibración 437 que se consideren vibraciones armónicas puras. Si se tienen en cuenta en el hamiltoniano términos de grados más elevados respecto de las coordenadas normales (vibraciones anarmónicas), la degeneración, en general, desaparece, aunque no sea del todo (para más detalles acerca de esto, véase el § 104). Las funciones de onda (101.3) correspondientes a un mismo término vibracional degenerado permiten una representación (en general, reducible) del grupo de simetrías de la molécula. Pero las funciones que corresponden a frecuencias distintas se transforman con independencia las unas de las otras. Por lo tanto, la representación cuya base está constituida por todas las funciones (101.3) es el producto de las representaciones cuyas bases son las funciones (101.4), de modo que basta considerar estas últimas. El factor exponencial en (101.4) es invariante respecto de todas las transformaciones de simetría. En los polinomios de Hermite, los términos de un mismo grado se transforman entre sí únicamente (es evidente que una transformación de simetría no modifica los grados de los diferentes términos). Dado que, de otra parte, cada polinomio de Hermite queda completamente determinado por su término de mayor grado, escribiendo fa. /} 1 Hva.lccx.Qcx.i) = constante x Qcx.1 va.1Qcx. 2 va., ••• Qcx.1 /a.ia.+ + términos de grado inferior, basta considerar tan sólo el término de grado más alto. A un mismo término corresponden las funciones para las que la suma Vix = Li Vixi toma el mismo valor. Tenemos así una representación realizada por los productos de Vix cantidades Qix¡; ésta no es sino el producto simétrico (véase § 94) de Vix veces la representación irreducible de que son base las cantidades Qix¡ por sí misma. Para las representaciones unidimensionales, hallar los caracteres del producto simétrico de una de ellas v veces por sí misma es trivial (1): Xv(G) = [x(G)]V. Para las representaciones bi y tridimensionales es conveniente utilizar el siguiente artificio matemático (2). La suma de los cuadrados de las funciones de base de una representación irreducible es invariante respecto de todas las transformaciones de simetría. Por lo tanto, es posible considerarlas como componentes de un vector de dos o de tres dimensiones, y las transformaciones de simetría, como ciertas rotaciones (o reflexiones) aplicadas a estos vectores. Hay que subrayar que estas rotacio(1) e) Utilizamos aquí la notación z,,(G) en vez de la más engorrosa [7.vl(G). Aplicado con este fin por A. S. KOMPANEÍETS ( 1940). 438 Moléculas poliatómicas nes y reflexiones no tienen, en general, nada en común con las transformaciones reales de simetría y (para cada elemento dado del grupo G) dependen también de la representación particular considerada. Consideremos más detenidamente las representaciones bidimensionales. Sea x( G) el carácter de un elemento del grupo en la representación bidimensional dada, siendo x( G) -=f= O. La suma de los elementos diagonales de la matriz de transformación de las componentes x, y de un vector bidimensional en una rotación de ángulo <p en el plano es igual a 2 cos <p. Igualando estos valores 2 cos<fo = x(G), (101.6) encontramos el ángulo de rotación que corresponde formalmente al elemento G en la representación irreducible dada. El producto simétrico de la representación v veces por sí misma es la representación cuya base son las v+ 1 cantidades xv, xv-1y, ... , yv. Los caracteres de esta representación son iguales a (1): xv(G) = sen(v+ l)<fo/sen<fo. (101.7) El caso x(G) = O requiere examen aparte, dado que un carácter igual a cero corresponde tanto a la rotación de ángulo n/2, como a la reflexión. Si x( G2) = - 2, se trata de la rotación de ángulo n/2 y para Xv(G) obtenemos: (101.8) En cambio, si x( G2) = 2, hay que considerar x( G) como el carácter de la reflexión (es decir, de la transformación x---+ x, y---+ - y); entonces (101.9) De manera análoga se pueden obtener fórmulas para los productos simétricos de representaciones tridimensionales. Hallar la rotación (o la reflexión) que corresponde formalmente a un elemento del grupo en la representación dada, se consigue fácilmente con ayuda de la tabla 7. Dicha rotación (o reflexión) será la transformación que corresponde al x(G) dado en aquel de los grupos isomorfos en el que las coordenadas se transforman de acuerdo con esta representación. Así, para la representación F 1 de los grupos O y T d hay que elegir la transformación del grupo O, y para la representación F2 , la del grupo T d· No nos entretendremos aquí en deducir las fórmulas correspondientes para los caracteres xv< G). (1) Para el cálculo conviene elegir las funciones de base en la forina: la matriz de la rotación es entonces diagonal y la suma de los elementos diagonales tiene la forma: Estabilidad de las configuraciones simétricas de una molécula § 102. 439 Estabilidad de las configuraciones simétricas de una molécula Para una distribución simétrica de los núcleos, un término electrónico de la molécula puede ser degenerado si entre las representaciones irreducibles del grupo de simetría figuran representaciones cuya dimensión es mayor que la unidad. Veamos si una tal configuración simétrica es una configuración de equilibrio estable de la molécula. Prescindiremos por completo de la influencia del spin (si lo hay) dado que en las moléculas poliatómicas esta influencia es, en general, prácticamente nula. La degeneración de los términos electrónicos de que vamo.s a tratar es, por ello, tan sólo una degeneración « orbital », no ligada con el spin. Para que la configuración dada sea estable, la energía de la molécula, como función de las distancias entre los núcleos, debe presentar un mínimo para esta distribución de los mismos en el espacio. Esto significa que la variación de la energía para un pequeño desplazamiento de los núcleos no debe contener términos lineales en los desplazamientos. Sea H el hamiltoniano del estado electrónico de la molécula, hamiltoniano en el que las distancias entre los núcleos se consideran como parámetros. Designaremos por H O este hamiltoniano para la configuración simétrica dada. Como magnitudes que definen los pequeños desplazamientos de los núcleos se pueden utilizar las coordenadas vibracionales normales Qrxi· El desarrollo de H en potencias de Qrx; tiene la forma: (102.1) Los coeficientes V, W, ... del desarrollo son funciones solamente de las coordenadas de los electrones. En una transformación de simetría, las cantidades Qrxi se transforman entre sí. Las sumas en ( 102.1) pasan a ser entonces otras sumas de la misma forma. Podemos, por lo tanto, considerar formalmente una transformación de simetría como una transformación de los coeficientes que aparecen en estas sumas, conservando invariables las coordenadas Qrxi· En particular, los coeficientes Vrxi (para cada rx dado) se transformarán de acuerdo con la misma representación del grupo de simetría que las correspondientes coordenadas Qrxi· Esto se sigue inmediatamente del hecho de que, en virtud de la invariancia del hamiltoniano respecto de todas las transformaciones de simetría, la misma invariancia debe valer también para el conjunto de los términos del mismo orden en su desarrollo, en particular para los términos lineales (1). (1) Rigurosamente hablando, las cantidades Vll(i deben transformarse de acuerdo con la representación conjugada compleja de la representación según la mal se transforman las QO(i, Sin embargo, conforme se indicó si dos representaciones conjugadas complejas no coinciden entre sí, físicamente hay que considerarlas en' cualquier caso a la vez, formando una sola representación cuya dimensión es dos veces mayor. Por consiguiente, la restricción señalada carece de importancia. 440 Moléculas poliatómicas Consideremos un término electrónico degenerado (en una configuración simétrica) de energía E 0 • Un desplazamiento de los núcleos que rompa la simetría de la molécula conduce, en general, a un desdoblamiento del término. La magnitud del desdoblamiento se determina, con una precisión limitada a los términos de primer orden respecto de los desplazamientos de los núcleos, mediante la ecuación secular formada con los elementos de matriz del término lineal del desarrollo (102.1) (102.2} donde "Pp, "Pa son las funciones de onda de los estados electrónicos correspondientes al término degenerado dado (habiéndose elegido reales estas funciones). La estabilidad de la configuración simétrica exige que no exista un desdoblamiento lineal en las Q, es decir, todas las raíces de la ecuación secular deben anularse idénticamente y esto significa que también debe anularse toda la matrtz Vp:r· En todo esto, claro está, debemos considerar solamente las vibraciones normales que rompen la simetría de la molécula, es decir, hay que prescindir de las vibraciones totalmente simétricas (correspondientes a la representación unidad del grupo). Dado que las Qrxi son arbitrarias, los elementos de matriz (102.2) se anulan solamente si se anulan todas las integrales (102.3) Sea D(el) una representación irreducible según la cual se transforman las funciones de onda electrónicas "Pp, y Drx la correspondiente transformación para las cantidades V rxi; conforme se indicó ya, las representaciones Drx coinciden con aquellas de acuerdo con las cuales se transforman las correspondientes coordenadas normales Qrxi· Según los resultados del§ 97, las integrales (102.3) serán diferentes de cero si el producto [D(eZ)2 ] x Drx contiene la representación unidad, o bien, lo que es lo mismo, si [D(e0 2J contiene la representación Drx. En el caso contrario, todas las integrales se reducen a cero. Así, pues, la configuración simétrica es estable si la representación rn<eo 21 no contiene ni una tan sólo de las representaciones irreducibles Da. (excluida la representación unidad) que caracterizan las vibraciones de la molécula. Para los estados electrónicos no degenerados esta condición se cumple siempre, ya que el producto simétrico de una representación unidimensional por sí misma es la representación unidad. Consideremos, por ejemplo, una molécula del tipo CH4, en la que un átomo (el C) se encuentra en el centro y cuatro átomos (los H) en los vértices de un tetraedro. Una tal configuración tiene la simetría T d· Los términos electrónicos degenerados corresponden a las representaciones E, F 1, F 2 de e'.)te grupo. La molécula posee Cuantificación de la rotacíón de un sólido 441 una vibración normal A1 (vibración totalmente simétrica), una vibración E doble y dos F 2 triples (véase el problema 4, § 100). Los productos simétricos de las representaciones E, F 1, F2 por sí mismas son iguales a: [E2 ] = A 1 +E, Vemos, pues, que cada uno de ellos contiene por lo menos una de las representaciones E, F 2 , y, en consecuencia, la configuración tetraédrica considerada resulta ser inestable para los estados electrónicos degenerados. Este resultado constituye una regla general (H. JAHN y E. TELLER, 1937). El estudio (análogo al que acabamos de realizar) (1) de todos los tipos posibles de distribuciones simétricas de los núcleos prueba que, para un estado electrónico degenerado, toda distribución simétrica de los núcleos (con la única excepción de su distribución sobre una misma recta) es inestable. Como resultado de esta inestabilidad, los núcleos se desplazan de tal manera que la simetría de su configuración se rompe hasta el punto en que la degeneración del término desaparece por completo. En particular, se puede afirmar que el término electrónico normal de una molécula simétrica (no lineal) puede ser únicamente un término no degenerado. Conforme se señaló ya, constituyen excepción solamente las moléculas lineales. Es fácil verlo incluso sin la ayuda de la teoría de grupos. El desplazamiento de un núcleo en el que éste abandona el eje de la molécula, es un vector ordinario con componentes ~ y r¡ (el eje ( coincide con el eje de la molécula). Vimos en el § 87 que estos vectores poseen elementos de matriz tan sólo para transiciones que van acompañadas de un cambio del momento cinético A respecto del eje de una unidad. Sin embargo, a un término degenerado de una molécula lineal corresponden estados con momentos cinéticos A y - A respecto del eje (siendo A 2 1). Una transición entre ellos va acompañada de una variación del momento cinético que es, por lo menos, igual a 2 y, por consiguiente, los elementos de matriz son nulos en cualquier caso. De esta manera la distribución lineal de los núcleos en una molécula puede ser estable incluso para un estado electrónico degenerado. § 103. Cuantificación de la rotación de un sólido El estudio de los niveles de rotación de una molécula poliatómica se ve con frecuencia complicado por la necesidad de considerar a la vez la rotación y las vibraciones. Como problema preliminar, consideremos la rotación de una molécula considerada como un cuerpo sólido, es decir, con los átomos « rígidamente unidos entre sí». Sea;, r¡, ( un sistema de coordenadas cuyos ejes coinciden con los ejes de inercia (1) Véase el artículo de H. A. JAHN, E. TELLER, Proc. Roy. ~oc., A 161, 220, 1937. 442 Moléculas poliatómicas del sólido y que giran junto con él. El correspondiente hamiltoniano se obtiene substituyendo en la expresión clásica de la energía las componentes J~, lr¡, lt de su momento de rotación por los correspondientes operadores, es decir, (103.1) donde /A, In, le son los momentos de inercia principales del cuerpo. Je, J J, , que corresponden a las Las reglas de conmutación de los operadores 11 componentes del momento cinético en el sistema de coordenadas en rotación no son evidentes, ya que la manera ordinaria de deducir las reglas de conmutación se aplica a las componentes v J y, Jzen un sistema de coordenadas en reposo. Sin embargo, es fácil obtener aquéllas utilizando la fórmula J (J .a)(J .b)-(j .b)(J .a)= -ij .axb, (103.2) donde a, b son dos vectores cualesquiera que caracterizan el cuerpo dado (y que conmutan entre sí). Es fácil verificar esta fórmula calculando el primer miembro de la igualdad en el sistema de coordenadas en reposo x, y, z mediante las reglas generales de conmutación de las componentes del momento cinético entre sí y con las componentes de un vector arbitrario. Sean a y b los vectores de los ejes~ y r¡. Entonces a x b es el vector del eje Cy (103.2) nos da: (103.3) Análogamente se obtienen las otras dos relaciones. Llegamos así a la conclusión de que las reglas de conmutación de los operadores correspondientes a las componentes del momento cinético en el sistema de coordenadas en rotación, difieren de las reglas de conmutación en el sistema en reposo tan sólo en el signo del segundo miembro de la igualdad. De aquí se sigue que también los resultados que antes obtuvimos a partir de las reglas de conmutación, acerca de los valores propios y de los elementos de matriz, subsisten para los operadores J~, Ir¡, h con la única diferenci~ de que todas las expresiones se deben substituir por sus conjugadas complejas. En particular, los valores propios J~ (al igual que lz) serán números enteros, k=-1, ... , +J. La determinación de los valores propios de la energía de un cuerpo en rotación (o, como suele decirse, de un trompo) resulta particularmente simple cuando sus tres momentos principales de inercia son iguales entre sí: /.4 = In = I,c == I ( trompo esférico). Esto ocurre para una molécula en aquellos casos en q\le ésta posee la simetría de uno de los grupos puntuales cúbicos. El hamiltoniano (103.1) toma la forma: Cuantificación de la rotación de un sólido 443 y sus valores propios son iguales a E= n](J+l)/21. 2 (103.4) Cada uno de estos niveles de energía es degenerado respecto de las 21 + 1 direcciones del momento cinético referido al propio cuerpo (es decir, respecto de los valores l¡; = k) (1). Tampoco ofrece dificultad calcular los niveles de energía cuando coinciden solamente dos de los momentos de inercia del cue~po: !A= In=/=- Ir. (trompo simétrico). Esto ocurre para las moléculas que poseen un eje de simetría de orden superior al segundo. El hamiltoniano (103.1) toma la forma: fJ = = n 2(} r.2+ j 1,2)/2JA+n2j 1:,2/2/e n2J2/2JA+tn2(~-~);,2. le ]A (103.5) Vemos así que, en un estado con valores determinados de 1 y k, la energía es igual a 2 E= n -J(J+l)+!n 2JA 2( 1 1)k2, --- fe ]A (103.6) con lo que se determinan los niveles energéticos del trompo simétrico. La degeneración que encontramos en el caso del trompo esférico respecto de los valores k se rompe aquí en parte. Los valores de la energía coinciden sólo para los valores de k que difieren únicamente en el signo, lo que corresponde a sentidos opuestos del momento cinético respecto del eje del trompo. Por ello los niveles de energía del trompo simétrico son doblemente degenerados para k =/=- O. Para I A =/=- I B =/= I e ( trompo asimétrico) el cálculo de los niveles de energía es imposible en forma general. La degeneración debida a las diferentes direcciones del momento cinético referido al cuerpo se rompe ahora por completo, de modo que a un valor dado de 1 corresponden 21 + 1 diferentes niveles no degenerados. Para calcularlos hay que resolver la ecuación de SCHRODINGER en forma matricial. lo que a su vez se reduce a resolver una ecuación secular de grado 21 + 1 formada con los elementos de matriz H::Z, con los valores dados de 1 (O. KLEIN, 1929). Los elementos de matriz se determinan mediante las funciones de onda "P.Jk de los estados en los que el valor absoluto y la proyección-( del momento cinético tienen valores definidos (la energía, en cambio, no posee ningún valor determinado). Por H:Jz, (1) Aquí y en lo que sigue prescindimos de la degeneración de orden 21 + 1 correspon?!ente a la~ direcciones del momento cinético respecto del sistema de coordenadas en reposo, degenerac10n que siempre existe, pero que físicamente carece de importancia. Si la _tenemos en cuenta, la multiplicidad total de la degeneración de los niveles energéticos del trompo esfénco es (21 + 1)2 • 444 Moléculas poliatómicas el contrario, en los estados estacionarios del trompo asimétrico la proyección Je del momento cinético no tiene, claro está, valores determinados, es decir, es imposible atribuir a los niveles de energía valores determinados de k. J J.,., Los operadores g, tienen elementos de m~atriz tan sólo para las transiciones en las que k varía en una unidad, y el operador J t posee únicamente elementos diagonales (véanse las fórmulas (27.13), en las que hay que escribir J, k en vez de L, 2 , M). Por consiguiente, los operadores J l, ,;2, y con ellos también Íl, tienen elementos de matriz solamente para las transiciones con k --+ k_, k ± 2. El que no existan elementos de matriz para las transiciones entre estados con valores k pares e impares conduce a que la ecuación secular de grado 21 + 1 se descomponga automáticamente en dos ecuaciones independientes de grados J y J + l. Una de ellas está formada con elementos de matriz para las transiciones entre estados con valores pares de k, y la otra, con valores impares. Cada una de estas ecuaciones puede reducirse, a su vez, a dos ecuaciones de menor grado. Para ello hay que utilizar elementos de matriz determinados, no mediante las funciones 1fJJk, sino mediante las funciones J.,., J 1Jk+ = c1Jk+1J.-k)1v2, VJJk- = c1Jk-1J.-k)1v2 (ki=O); (103.7) (en cambio, la función 1fJJo coincide con la función 'lfJJo + ). Las funciones que difieren en los índices + y - poseen simetría diferente (respecto de la reflexión en un plano que pase por el eje (, que cambia el signo de k), y se anulan por ello los elementos de matriz para las transiciones entre dichos estados. Por consiguiente, es posible establecer ecuaciones seculares para los estados por separado. + y los estados - El hamiltoniano (103.1), junto con las reglas de conmutación (103.3), poseen una simetría peculiar: son invariantes respecto del cambio simultáneo de signo de dos cualesquiera de los operadores Jg, J.,.,, J,. Esta simetría corresponde formalmente al grupo D 2 • Por lo tanto, es posible clasificar los niveles del trompo asimétrico de acuerdo con las representaciones irreducibles de este grupo. Así, pues, se tienen cuatro tipos de niveles degenerados, correspondientes a las representaciones A, B 1, B 2 y B 3 (véase tabla 7). Es fácil establecer cuáles son precisamente los estados del trompo asimétrico que corresponden a cada uno de estos tipos. Para esto hay que determinar las propiedades de simetría de las funciones (103.7). Como funciones 1fJJk se puede entender, simplemente, las funciones conjugadas complejas de las funciones propias del momento cinético, que coinciden con aquéllas desde el punto de vista de la simetría (el paso a una expresión conjugada compleja se debe a la variación del signo en los f:uantificación de la rotación de un sólido 445 segundos miembros de las relaciones de conmutación (103.3)): lpJk,..., e-ik</JE)Jk(8), donde(), ef, son los ángulos esféricos en el espacio~, r¡, (. La rotación de ángulo :rr; en torno del eje C (es decir, la operación de simetría el:.>) multiplica esta función por l)k: C2<t.>: rpJr~{ -1 )kr/JJk· La operación C2 <1í> se puede considerar como resultado de aplicar, sucesivamente, la inversión y la reflexión en el plano la primera operación multiplica 1/)Jk por l)J, y la segunda (cambio del signo de ef,) equivale a cambiar el signo de k. Teniendo en cuenta la definición de la función 8J, -k (28.6), obtenemos por consiguiente: C2<11>: rpJ1c-+(-l)J+kr/JJ,-k· c 2 <r¡>c2<C> tenemos: Finalmente, en la transformación C/~> C2<El: rpJ1c-+(- l)JrpJ,-k• Teniendo en cuenta estas leyes de transformación, encontramos que los estados definidos por las funciones (103.7) corresponden a los siguientes tipos de simetría: rar, J par, lpJk/ k par, tipo A k impar, tipo B 3 J impar, k par, tipo B1 J impar, k impar, tipo B2 [J k tipo B1 par, ~ _ ] par, Jk par, (103.8) k impar, tipo B2 ] impar, k par, tipo A J impar, k impar, tipo B3 Mediante una simple cuenta es fácil encontrar el número de estados de cada tipo para un valor dado de J. Así, al tipo A y a cada uno de los tipos B1, B2, B3 corresponden los siguientes números de estados: A ]par, J impar, !J+l !J-t B1,B2,B3 t] !J+t (103.9) Finalmente, he aquí algunas observaciones acerca del cálculo de los elementos de matriz de diferentes magnitudes físicas que caracterizan al trompo (a la molécula). Se trata, claro está, de los elementos de matriz respecto de las puras funciones de onda de rotación de los estados estacionarios de la molécula (sin alterar ni su estado 446 .Moléculas poliatómicas electrónico ni el de vibración). Las funciones de onda del trompo simétrico coinciden, en esencia (con el correspondiente cambfo de notación de los números cuánticos), con la parte angular de la función de onda de una molécula diatómica. En efecto, si se describe la rotación mediante los ángulos de Euler (), <p, 1P (fig. 20, pág. 235), la función de onda del estado caracterizado por los números cuánticos k, J, MJ es 1PkJ1\1J = 1 (103.10) 7T eLUJt:/Jeiki/10kJMJ(O), 2 donde 0 son las funciones calculadas en el problema del § 82. La dependencia de los elementos de matriz para el trompo simétrico respecto de los números cuánticos J y M J se determina por las mismas fórmulas que se obtuvieron en el § 87 para la molécula diatómica (sin spin). En ]as fórmulas (87.1-4) hay que substituir para ello K, M K y A, respectivamente, por el momento cinético del trompo J, su proyección MJ sobre el eje en reposo z y la proyección k sobre el eje en movimiento(. El cálculo de los elementos de matriz para el trompo asimétrico es más complicado. La resolución de la ecuación secular relativa a la matriz H'!,z. determina las combinaciones lineales de las funciones 1/JJk, introducidas antes, que reducen el hamiltoniano a la forma diagonal. Substituyendo en estas combinaciones de las funciones 1/JJk las funciones de onda puras del trompo asimétrico (103.10) (con los mismos valores MJ en todas las funciones), obtenemos las funciones de onda puras de los estados estacionarios del trompo asimétrico caracterizadas por los valores de los pares de números J, MJ. En definitiva, el cálculo de los elementos de matriz de una magnitud cualquiera para el trompo asimétrico se reduce a los elementos de matriz, ya conocidos, del trompo simétrico. Para el caso del trompo asimétrico, existen reglas de selección relativas a los elementos de matriz de las transiciones entre estados de los tipos A, B 1, B 2 , B 3 , reglas que se obtienen fácilmente de la manera usual por consideraciones de simetría. Así, para las componentes de una magnitud física vectorial A valen las reglas de selección: para Ag: A~B3<íl, B1(C)~ para A 11 : A~Bt1>, BlJ~Ba<fl, para A,: A~Bl<C>, B2<TJ>~BaW, Bt1>, (para mayor claridad, como superíndice del símbolo de la representación se indica el eje en torno del cual la rotación tiene carácter +1 en la representación de que se trate). 447 Cuantificación de la rotación de un sólido PROBLEMAS Calcular los elementos de matriz H~:, para el trompo asimétrico. Mediante las fórmulas (27.13) encontramos que: Solución. {];2): = (J,,2): = i[](]+l)-k 2 ], {Jt.2) !+2 = (j t.2)1:: = - u ,,2):+2 = - u ,,2) 2 = t 2 iv'[( J-k)(]-k- l)(J +k+ l)(] +k+2)]; (para abreviar, prescindimos de los índices diagonales J, J en los elementos de matriz). A partir de aquí se obtiene para los elementos de matriz buscados de H: (1) Hk = Hk+2 = ¡1t2(~-~)v[(J-k)(j-k-l)(]+k+l)(]+k+2)]. k+2 k ]A IB Los elementos de matriz respecto de las funciones (103.7) se expresan en función de los elementos de las fórmulas (1) de acuerdo con las relaciones Hk+ = Hk- = Hk (k i= 1) k+ k- Hk+ k ' Hl+ = H1+ H1 1+ = Hk= Hk (k-¡: (k+2)+ (k+2)k+2 2. 1 H1- = H1-H1 , -1' O) ' 1- 1 Ho+ = y'2H0 • 2+ Determinar los niveles de energía del trompo asimétrico para J -1 (2) 2 = 1. Solución. La ecuación secular de tercer grado se descompone en tres ecuaciones de primero. Una de ellas es E 1 = Hgt, de donde (3) Esto permite escribir, sin más, los otros dos niveles de energía, ya que es a priori evidente que los tres momentos de inercia lA, 18 , le representan en el problema un mismo papel. Por consiguiente, basta substituir simplemente los momentos de inercia lA, lB una vez por lA, le, y la otra, por lB, le. De esta manera, (4) Los niveles E 1 , E 2 , E 3 corresponden, respectivamente, a los tipos Bi, B 2 , B 3 (si l.4, lB, le (1) son los momentos de inercia respecto de los ejes ~. r¡, O. (1) Esto resulta inmediatamente por consideraciones de simetría. Así, la energía E 1 es simétrica respecto de los momentos de inercia J.4 e IB; igual debe ocurrir para la energía del estado cuya simetría respecto de los ejes~ y r¡ es la misma (un estado del tipo B1). Moléculas poliatómicas 448 3. El mismo problema para J = 2. Solución. La ecuación secular es de quinto grado y se descompone en tres ecuaciones· de primero y una de segundo. Una de las ecuaciones de primer grado tiene la forma: E 1 = de donde H~=· E1 = 2lí2 le ( 1 1) (5) -+!lí2 -+- ' lA lB (nivel del tipo B1). De aquí deducimos, sin más, que deben haber todavía dos niveles más (de los tipos B 2 Y Ba): 1 1) . 1 1) , 2 ( -+2lí E2 = -+!lí2 lB le lA 2/i2 ( Ea = -+!lí2 -+lA lB le La ecuación de segundo grado será 1a siguiente: H.O+-E y2+ o+ H2+ o+ o+ =0. H2+-E (6) 2+ Resolviéndola, obtenemos: (7) Estos niveles corresponden al tipo A. 4. El mismo problema para J = 3. Solución. La ecuación secular es de séptimo grado y se descompone en una de primero y tres de segundo. La ecuación de primer grado tiene la forma: E 1 = Ht, de donde E1 = 21t2 1 1 1) ' (-+-+]A ]B Je (8) (nivel del tipo A). Una de las ecuaciones de segundo grado es la ecuación (6) del problema anterior (con otro valor de J). Sus raíces son: (9) (niveles del tipo B1). Los restantes niveles se obtienen a partir de aquí permutando /A, / 8 e fe. 5. Determinar el desdoblamiento de los niveles de un sistema, que posee momento cuadripolar, en un campo eléctrico exterior arbitrario. Solución. Eligiendo como ejes de coordenadas los ejes principales del tensor Ó2t/J/óxi}xk (véase Interacción de las vibraciones y de la rotación de una molécula 449 el problema 4, § 75), reducimos la parte cuadripolar del hamiltoniano del sistema a la forma: Dada la completa analogía formal de esta expresión con el hamiltoniano (103.1), el problema planteado es equivalente al problema de hallar los niveles de energía de un trompo asimétrico, con la única diferencia de que ahora la suma de los coeficientes A+ B+ C = O, y el momento cinético puede tener también valores semienteros. Para estos últimos los cálculos deben efectuarse de nuevo, siguiendo el mismo método, y para los valores J enteros se pueden utilizar los resultados de los problemas 2-4. En definitiva obtenemos los siguientes valores del desplazamiento de la energía tl.E para los primeros valores de J: J = 1: ilE = -A,-B,-C; J = 3/2: ilE = J = 2: ± y'[3(A2+B2+c2)/2]; ilE = 3A, 3B, 3C, ± y'[6(A2+B2+ C2)]. Para J = 3/2 los niveles de energía siguen siendo doblemente degenerados, de acuerdo con el teorema de KRAMERS (§ 60). § 104. Interacción de las vibraciones y de la rotación de una molécula Hasta aquí hemos considerado la rotación y las vibraciones como movimientos independientes de una molécula. Sin embargo, en realidad, la existencia simultánea de ambas conduce a una interacción característica entre ellas (E. TELLER, L. T1szA y G. PLACZEK, 1932-1933). Consideremos primero las moléculas poliatómicas lineales. Una molécula poliatómica puede efectuar vibraciones de dos tipos (véase el final del§ 100): vibraciones longitudinales, con frecuencias simples, y vibraciones transversales, con frecuencias dobles. Nos interesan ahora estas últimas. Una molécula que efectúe vibraciones transversales posee, en general, un cierto momento cinético. Esto es ya evidente por simples consideraciones mecánicas (1), pero se puede demostrar también acudiendo a la mecánica cuántica. Esta última permite determinar además los posibles valores de este momento cinético en un estado de vibración dado. Supongamos que en la molécula se ha excitado una frecuencia doble cualquiera wa.. El nivel de energía con número cuántico vibratorio Va. es degenerado de orden (va.+l). Al mismo corresponden va.+1 funciones de onda lfva. 1 va.. = constante X e-ca.ª<Qa./+Qa./>!2Hva. 1(c0t.Q0t. 1 )Hva.. (c0t.Q0t. 2), (donde Va.1 -f--va.2 =vr:x.) o cualesquiera combinaciones lineales independientes de las mismas. La mayor potencia total (respecto de Qa.1 y Qa.2) del polinomio por el que se (1) Así, dos vibraciones ·transversales perpendiculares entre sí, con una diferencia de fase de n/2, se pueden considerar como una rotación pura de la molécula curvada en torno del eje longitudinal. 450 Moléculas poliatómicas multiplica el factor exponencial es la misma para todas estas funciones e igual a Vix. Es evidente que siempre es posible elegir, como funciones fundamentales, combinaciones lineales de las funciones '1/J 'Z'oc1 Voc 2 de la forma: ,f.,'IJa.la. = constante xe-c/!Qa/+Qa.S>!2 [(Qx1+iQo:2)(va+la)/2(Qo:1-iQ<X2)<'"a-1ix>!2+ ..• ]. (104.1) Entre los paréntesis rectos aparece un cierto polinomio del cual hemos escrito solamente el término de mayor grado. El parámetro loc es un número entero que puede tomar voc+ l valores diferentes: lix = Voc, Voc - 2, Vix - 4, ... , - Voc. Las coordenadas normales Qoc1 , Qoc2 de la vibración transversal representan dos desplazamientos perpendiculares entre sí a partir del eje de la molécula. En una rotación de ángulo <p en torno de este eje, el término de mayor grado del polinomio (y con él también toda la función '1/J voc 1 Voc 2) queda multiplicado por é<fl..Va.+l/X)/2e-i<J,(VIX-la.)/2 = eila.<J,. Vemos así que las funciones (104.1) corresponden a un estado con momento cinético loc respecto del eje. De esta manera llegamos al resultado de que en el estado en el cual está excitada una frecuencia doble woc (con número cuántico vix), la molécula posee un momento cinético (respecto de su eje) que toma los valores (104.2) De este momento se dice que es el momento cinético vibratorio de la molécuh,. Si se excitan a la vez varias vibraciones transversales, el momento vibratorio total es igual a la suma '2:../oc. Al componerlo con el momento cinético orbital de los electrones a. ' se obtiene el momento cinético total, /, de la molécula respecto de su eje. El momento cinético total de la molécula J (al igual que en una molécula diatómica) no puede ser menor que el momento cinético respecto del eje, es decir, J toma los valores J = ¡z¡, 1z1+1, .... Con otras palabras, los estados con J = O, 1, ... , !l / - 1 no existen. En las vibraciones armónicas, la energía depende únicamente de los números y no de loc. La degeneración de los niveles vibracionales (respecto de los valores /oc) desaparece en el caso en que la vibración es anarmónica. Sin embargo, la desaparición no es completa: los niveles siguen siendo doblemente degenerados, poseyendo la misma energía los estados que difieren en el cambio simultáneo del signo de todos los lix y /; en la aproximación siguiente (después de la armónica), en la expresión de la energía aparece un término cuadrático respecto de los momentos loc, término que es de la forma goc15lr:1J{J (las gix{J son constantes). Esta doble degeneración <lesaVoc, 0 ~ Interacción de las vibraciones y de la rotación de una molécula 451 parece debido a un efecto análogo a la duplicación A en las moléculas diatómicas. Al pasar a las moléculas no lineales, es necesario ante to<lo hacer la siguiente observación de carácter puramente mecánico. Para un sistema de partículas arbitrario (no lineal) se plantea la cuestión de cómo es posible, en general, separar el movimiento vibratorio de la rotación, con otras palabras, la pregunta de qué hay que entender por « sistema no en rotación». A primera vista, se podría pensar que el criterio que indica la ausencia de rotación puede consistir en la anulación del momento cinético: l:mrxv =O (104.3) (la suma se extiende a las partículas del sistema). Sin embargo, la expresión que aparece en el primer miembro no es la derivada total respecto del tiempo de una función de las coordenadas. Como consecuencia, no cabe integrar la igualdad anterior respecto del tiempo de modo que se pueda formular como equivalente a la igualdad a cero de una cierta función de las coordenadas. Sin embargo, es precisamente esto último lo que es necesario para que sea posible formular de manera lógica el concepto de « vibraciones puras» y de « rotación pura». Por ello como definición de ausencia de rotación hay que tomar la condición (104.4) donde r 0 son los vectores que fijan las posiciones de equilibrio de las partículas. Haciendo r = r 0 + u, donde u es el desplazamiento para pequeñas vibraciones, tenemos v = r = ü. La ecuación (104.4) se integra respecto del tiempo, y en definitiva obtenemos: l: mr0 Xu = O. (104.5) El movimiento de una molécula lo consideramos como superposición de un movimiento puramente vibratorio, en el que se satisface la condición (104.5), y una rotación de la molécula considerada como un todo (1). Escribiendo el momento cinético en la forma: l: mrxv = l: mr0 xv+ ~ muxv, vemos que, de acuerdo con la definición (104.4) relativa a la ausencia de rotación, hay que entender por momento cinético vibratorio la suma ~mu x v. Sin embargo, es necesario no perder de vista que este momento cinético, que es sólo una parte del momento cinético total del sistema, no se conserva. Por ello a cada estado vibracional se puede atribuir solamente el valor medio del momento cinético vibratorio. (1) El movimiento de translación se supone eliminado desde un principio eligiendo como sistema de coordenadas aquél en que el centro de masas de la molécula se encuentra en reposo. 452 Moléculas poliatómicas Las moléculas que no poseen ningún eje de simetría de orden superior al segundo pertenecen al tipo del trompo asimétrico. En ellas· todas las frecuencias de vibración son simples (sus grupos de simetría poseen sólo representaciones irreducibles unidimensionales). Por lo tanto, ningún nivel vibracional es degenerado. Pero en todo estado no degenerado el momento cinético medio es nulo (véase § 26). Luego, en las moléculas del tipo del trompo asimétrico el momento cinético vibratorio medio es nulo en todos los estados. Si entre los elementos de simetría de la molécula se tiene un eje de orden superior al segundo, la molécula pertenece al tipo del trompo simétrico. Una tal molécula posee vibraciones correspondientes tanto a frecuencias simples como a frecuencias dobles. El momento cinético vibratorio medio de las primeras es de nuevo igual a cero. En cambio, a las frecuencias dobles corresponde un valor medio no nulo de la proyección del momento sobre el eje de la molécula. Es fácil hallar una expresión para la energía del movimiento de rotación de una molécula (del tipo del trompo simétrico) teniendo en cuenta el momento cinético de rotación. El operador de esta energía difiere del (103.5) en la substitución del momento cinético de rotación de) trompo por la diferencia entre el momento cinético total de la molécula J (que se conserva) y su momento vibratorio J(v): (104.6) La energía buscada es el valor medio Drot· Los términos en (104.6) que contienen los cuadrados de las componentes de J dan la energía de rotación pura, que coincide con (103.6). Los términos que contienen los cuadrados de las componentes J(v), dan valores constantes que no dependen de los números cuánticos de rotación; se puede prescindir de ellos. En cambio, los términos que contienen los productos de las componentes de J y J(v) constituyen el efecto que aquí nos interesa, el de la interacción de las vibraciones de la molécula con su rotación; a este efecto se le 1lama interacción de Coriolis (teniendo en cuenta que corresponde a las fuerzas de Coriolis de la mecánica clásica). Al promediar estos términos hay que tener presente que los valores medios de las componentes transversales(~, r¡) del momento cinético vibratorio son iguales a cero. Por ello, para la energía de la interacción de Coriolis obtenemos: Ecor = -li 2kkv/Ic, (104.7) donde k (un número entero) es, como en e] § 103, la proyección del momento cinético total sobre el eje de la molécula, y kv = 1,<v> es el valor medio de la proyección del momento cinético vibratorio que caracteriza el e3tado vibracional dado; kv, no tiene por qué ser un número entero, a diferencia de k. Interacción de las vibraciones y de la rotación de una molécula 453 Finalmente, consideremos las moléculas del tipo del trompo esférico. A este tipo pertenecen las moléculas con una simetría cualquiera de los grupos cúbicos. Tales moléculas poseen frecuencias simples, dobles y triples (de acuerdo con el hecho de que entre las representaciones irreducibles de los grupos cúbicos existen representaciones de una, dos y tres dimensiones). Como siempre, la degeneración de los niveles vibracionales desaparece en parte en la aproximación anarmónica; una vez se han tenido en cuenta estos efectos, subsisten, junto con los no degenerados, tan sólo niveles cuya degeneración es de segundo y de tercer orden. Discutiremos ahora precisamente estos niveles que se desdoblan debido al carácter anarmónico del movimiento. Es fácil ver que, en las moléculas del tipo del trompo esférico, el momento cinético vibratorio medio es nulo no solamente en los estados vibracionales no degenerados, sino también en los degenerados de orden dos. Esto se sigue ya de simples consideraciones basadas en las propiedades de· simetría. En efecto, los vectores de los momentos cinéticos medios en dos estados que corresponden a un mismo nivel degenerado de la energía deberían transformarse entre sí en todas las transformaciones de simetría de la molécula. Pero ni uno solo de los grupos cúbicos de simetría admite la existencia de dos direcciones que se transforman entre sí; esto ocurre tan sólo para el conjunto de tres direcciones por lo menos. Pero de estas mismas consideraciones se sigue que, en los estados correspondientes a niveles vibracionales triplemente degenerados, el momento cinético vibratorio medio es diferente de cero. Después de promediar respecto del estado vibracional, este momento es un operador representado por una matriz cuyos elementos corresponden a las transiciones entre tres estados mútuamente degenerados. De ªcuerdo con el número de tales estados, este operador debe ser de la forma CÍ, donde i es el operador del momento cinético igual a la unidad (para el cual 2/ + 1 = 3) y Ces una constante característica del nivel vibratorio en cuestión. EJ hamiltoniano del movimiento de rotación de la molécula firot = {lí2/2I)(J- J<vl) se transforma, después de dicho promedio, en el operador (104.8) Los valores propios del primer término definen la energía de rotación ordinaria (103.4), y el segundo término da una constante sin importancia que no depende del número cuántico de rotación En cambio, el último término en (104.8) proporciona la energía buscada del desdoblamiento de Coriolis del nivel vibratorio. Los valores propios de la magnitud J, 1 se calculan de la manera usual; dicha magnitud puede tener (para J dado) tres valores distintos (correspandientes a los valores Moléculas poliatómicas 4S4 J+l, J - 1, J del vector l+J). Finalmente, obtenemos: Ecor'J+l> = -li2,J/I, EcoP-1>= li 2 ,(J+ 1)//, Ecor'J> § 105. = li 2,/l. } (104.9) Clasificación de los términos moleculares La función de onda de una molécula es el producto de la función de onda electrónica, de la función de onda del movimiento vibratorio de los núcleos y de la función de onda de rotación. Hemos discutido ya la clasificación y los tipos de simetría de estas funciones por separado. Nos queda ahora por considerar el problema de la clasificación de los términos moleculares en conjunto, es decir, el de la posible simetría de la función de onda total. Es claro que el dar la simetría de estos tres factores respecto de una transformación cualquiera determina también la simetría del producto con relación a esta misma transformación. Para una completa caracterización de la simetría del estado hay que indicar, además, el comportamiento de la función de onda total en la inversión simultánea de las coordenadas de todas las partículas (de los electrones y de los núcleos) en la molécula. El estado se llama negativo o positivo según que la función de onda cambie de signo o lo conserve en esta transformación (1). Sin embargo, es necesario tener en cuenta que la característica de un estado respecto de la inversión tiene sentido solamente para las moléculas que no poseen estereoisómeros. La existencia de estereoisómeros significa que, en la inversión, la molécula adopta una configuración que ninguna rotación espacial puede llevar a coincidir con la de partida (moléculas de las modificaciones « dextrogira » y « levógira » de una substancia) (2). Por ello, cuando existe esteroisomería, las funciones de onda que se obtienen una de otra mediante la inversión corresponden fundamentalmente a moléculas diferentes y carece de sentido compararlas (3). Vimos en el § 86 que el spin de los núcleos determina en las moléculas diatómicas un importante efecto indirecto sobre el esquema de los términos moleculares, fijando la multiplicidad de su degeneración y prohibiendo en algunos casos niveles (1) Como se suele hacer, utilizamos aquí la misma terminología, poéo afortunada, que en el caso de las moléculas diatómicas (§ 86). (2) Para que puedan existir estereoisómeros es necesario que la molécula no posea ningún elemento de simetría ligado con una reflexión (centro de inversión, plano de simetría, o eje de giro reflejado). (ª) Rigurosamente hablando, la mecánica cuántica conduce siempre a una probabilidad no nula para la transición que lleva de una modificación a la otra. Sin embargo, esta probabilidad, vinculada al paso de los núcleos a través de una barrera, es tan pequeña que no hay necesidad de considerar dicho fenómeno. Clm,ificación de lo.i, término,., moleculare.i, 455 de una u otra simetría. Lo mismo cabe decir de las moléculas poliatómicas. Sin embargo, aquí el estudio del problema es considerablemente más complejo y exige la aplicación de métodos de la teoría de grupos a cada caso particular. La idea del método consiste en lo siguiente. La función de onda total debe contener, además de la parte dependiente de las coordenadas (que es la única que hemos considerado hasta ahora), también un factor dependiente del spin, factor que es función de las proyecciones de los spins de todos los núcleos sobre una dirección cualquiera elegida en el espacio. La proyección a del spin de un núcleo toma 2i + 1 valores (i es el spin del núcleo); dando a todos los a 1 , a 2, ••• , as (N es el número de átomos de la molécula) todos los valores posibles, obtenemos en total (2i1 + 1) (2i2 + 1) ... (2iN + 1) valores distintos del factor espinorial. En cada transformación de simetría, algunos núcleos (de la misma especie) cambian de lugar, y si imaginamos que los valores de los spins « se mantienen en los mismos lugares», la transformación será equivalente a una permutación de los valores de los spins entre los núcleos. De acuerdo con esto, los diferentes factores de spin se transformarán entre sí, realizando, de esta manera, una representación (en general reducible) del grupo de simetría de la molécula. Descomponiéndola en partes irreducibles, encontramos los tipos posibles de simetría de la función de onda de spin. Es fácil escribir una fórmula general para los caracteres Xsp( G) de la representación de la que son base los factores espinoriales. Para ello basta observar que, en una transformación, solamente no cambian los factores de spin de aquellos núcleos que sí cambian de lugar, pero que tienen el mismo valor de ªª; en el caso contrario, un factor de spin se transforma en otro factor de spin y no contribuye al valor del carácter. Teniendo en cuenta queªª toma 2ia + 1 valores, encontramos que Xsp(G) = TI (2ia+ 1), (105.1) donde el producto se extiende a los grupos de átomos que cambian entre sí sus posiciones en la transformación dada G (con un factor de cada grupo en el producto). Sin embargo, no nos interesa tanto la simetría de la función de spin como la simetría de la función de onda de las coordenadas (es decir, la simetría respecto de las permutaciones de las coordenadas de los núcleos, conservando invariables las coordenadas de los electrones). Pero estas simetrías están ligadas directamente entre sí por el hecho de que la función de onda total debe permanecer invariable o cambiar de signo en la permutación de cada par de núcleos que obedecen a la estadística de Bose o a la de Fermi, respectivamente (con otras palabras, debe quedar multiplicada por (- 1)2i, donde i es el spin de los núcleos permutados). Introduciendo el correspondiente factor en los carácteres (105.1 ), obtenemos el sistema de caracteres x( G) de la representación que contiene todas las representaciones irreducibles y de acuerdo con la cual se transforman las funciones de onda de coor- 456 Moléculas poliatómicas denadas: (105.2) (na es el número de núcleos en cada grupo de núcleos que intercambian sus posi- ciones entre sí en la transformación dada). Descomponiendo esta representación en partes irreducibles, obtenemos los tipos posibles de simetría de las funciones de onda de coordenadas de la molécula, a la vez que la multiplicidad de la degeneración de los correspondientes niveles de energía (aquí y en lo que sigue se trata de la degeneración respecto de los diferentes estados de spin del sistema de núcleos) (1). Cada tipo de simetría de los estados está ligado con valores determinados de los spins totales de los grupos de núcleos equivalentes en la molécula (es decir, de los grupos de núcleos que intercambian entre sí sus posiciones en una transformación cualquiera de simetría de la molécula). Esta relación no es biunívoca: cada tipo de simetría de los estados puede realizarse, en general, con valores diferentes de los spins de los grupos de núcleos equivalentes. En cada caso particular, es también posible establecer dicha relación mediante los métodos de la teoría de grupos. Consideremos por ejemplo una molécula del tipo del trompo asimétrico - la molécula de etileno C122 H\ (fig. 43, g, grupo de simetría Du,, ). El superíndice en un símbolo químico indica a qué isótopo pertenece el núcleo; esta indicación es necesaria, ya que los núcleos de isótopos diferentes poseen diferente spin. En el caso presente el spin del núcleo H1 es igual a ! y el núcleo C12 carece de spin. En consecuencia, sólo hay que considerar los átomos de hidrógeno. Elijamos el sistema de coordenadas como se indica en la fig. 43, g (el eje z es perpendicular al plano de la molécula, el eje x está dirigido en el sentido de su eje). La reflexión en el plano a(xy) conserva todos los átomos en sus posiciones y las demás reflexiones y rotaciones cambian de posición los átomos de hidrógeno a pares Según la fórmula (105.2) obtenemos los siguientes caracteres de la representación E a(xy) a(xz) a(yz) 1 16 16 4 4 4 4 4 4 Descomponiéndola en partes irreducibles, encontramos que en ella están contenidas las siguientes representaciones irreducibles del grupo D 2h: 7Ag, 3B¡g, 3B2 u, 3B3 u, El coeficiente indica la multiplicidad con que la representación irreducible dada aparece en la reducible; estos números son también los pesos estadísticos nucleares de los niveles con la correspondiente simetría (2). (1) La multiplicidad de la degeneración de un nivel. considerada desde este punto de vista, se suele llamar su peso estadístico nuc/P.ar (cf. la nota en la pág. 360). (2) La relación entre la simetría de los estados y los valores del spin total de los cuatro núcleos de H en la molécula de etileno se establece en el problema 1. Cla.-.if icación de los término.-. moleculare.-. 457 La clasificación que hemos obtenido de los estados de una molécula de etileno se refiere a la sinJetría de la función de onda total (de coordenadas), que incluye las partes electrónica, vibracional y de rotación. Sin embargo, de ordinario presenta interés llegar a estos resultados desde otro punto de vista. Así, conociendo las posibles simetrías de la función de onda total cabe encontrar directamente qué niveles de rotación son posibles (y con que peso estadístico) para un estado electrónico y vibracional dado, cualquiera. Consideremos, por ejemplo, la estructura de rotación del más bajo nivel vibratorio (en el que las vibraciones no están excitadas) del término electrónico normal, suponiendo que la función de onda electrónica del estado normal es completamente simétrica (lo que tiene lugar prácticamente para todas las moléculas poliatómicas). La simetría de la función de onda total respecto de las rotaciones en torno del eje de simetría coincide entonces con la simetría de la función de onda de rotación. Comparando con los resultados antes obtenidos, llegamos a la conclusión de que en la molécula de etileno los niveles de rotación de los tipos A y B1 (véase § 103) son positivos y tienen pesos estadísticos 7 y 3, mientras que los niveles de los tipos B2 y B3 son negativos y tienen peso estadístico 3. Como en el caso de las moléculas diatómicas (véase el final del § 86), a causa de la extraordinaria debilidad de la interacción de los spins nucleares con los electrones, prácticamente no se producen transiciones entre estados de la molécula de etileno con diferente simetría nuclear. Por ello las moléculas que se encuentran en estos estados se comportan como modificaciones diferentes de la materia, de modo que el etileno C 122 H\ posee cuatro modificaciones con pesos estadísticos nucleares 7, 3, 3, 3. Para esta conclusión es esencial el hecho de que los estados con diferente simetría corresponden a niveles distintos de la energía (los intervalos entre los cuales son grandes comparados con la energía de interacción de los spins nucleares). No es válida, por consiguiente, para aquellas moléculas en las que existen estados de diferente simetría nuclear y correspondientes a un mismo nivel degenerado de energía. Consideremos otro ejemplo todavía: la molécula de amoníaco N 14H\ del tipo del trompo simétrico (fig. 41, grupo de simetría C 3v). El spin del núcleo N 14 es igual a 1, el spin del H 1 es -}. Mediante la fórmula ( 105.2) encontramos los caracteres de la representación que nos interesa del grupo C 3 ": E 24 6 -lz' Esta contiene las siguientes representaciones irreducibles del mismo: 12A 2, 6E. Resultan así ser posibles dos tipos de niveles; sus pesos estadísticos son iguales 458 Moléculas poliatómicas a 12 y 6 (1). Los niveles de rotación del trompo simétrico se clasifican (para J dado) según los valores del número cuántico k. Consideremos, como en el ejemplo anterior, la estructura de rotación del estado electrónico y vibratorio normal de la molécula NH3 (es decir, supongamos que las funciones de onda electrónica y de vibración son totalmente simétricas). Al determinar la simetría de la función de onda de rotación, no hay que perder de vista que sólo tiene sentido hablar de su comportamiento respecto de las rotaciones en torno del eje. Por ello substituiremos los planos de simetría por ejes de simetría de segundo orden perpendiculares a los mismos (la reflexión en un plano es equivalente a la rotación en torno de uno de estos ejes seguida de la inversión). En el presente caso, por consiguiente, en vez del C 3u hay que considerar el grupo isomorfo D 3 . Las funciones de onda de rotación con k = ± JkJ quedan multiplicadas por en una rotación C3 en torno de un eje vertical de tercer orden, y se transforman entre sí en la rotación U2 en torno de un eje horizontal de segundo orden, realizando así una representación bidimensional del grupo D 3 . Para JkJ no múltiplo de tres, esta representación es irreducible - es la representación E. La representación del grupo C 3 /I que corresponde a la función de onda total se obtiene multiplicando el carácter x( U2 ) por + 1 o por - 1, s~gún se trate de un término positivo o negativo. Pero dado que en la representación E tenemos x( U2 ) = O, en ambos casos obtenemos de nuevo la misma representación E (pero esta vez ya como representación del grupo C 3 u, no del D 3). Teniendo en cuenta los resultados antes obtenidos, llegamos así a la conclusión de que, cuando fk[ no es múltiplo de tres, son posibles tanto los niveles positivos como los negativos, con pesos estadísticos nucleares iguales a 6 (niveles con una simetría dei tipo E de la función de onda total de coordenadas). e±2rrílkl¡a Para Jkl múltiplo de tres (pero diferente de cero), las funciones de rotación son base de una representación (del grupo D 3) con caracteres E 2 2 o Esta representación es reducible y se descompone en las representaciones A1 y A2 • Para que la función de onda total corresponda a la representación A 2 del grupo C 3 u, el nivel de rotación A1 debe ser negativo, y A2 positivo. Así, pues, para ikl múltiplo de tres y no nulo son posibles tanto los niveles positivos como los negativos, con pesos estadísticos nucleares iguales a 12 (niveles del tipo A 2). C) A los términos con la simetría A:! corresponde el spin total de los núcleos de hidrógeno igual a 3/2, y al término F, el spin ~. 459 Clasi/icación de lo.~ términos moleculares Finalmente, a la proyección del momento cinético k = O corresponde solamente una función de rotación, que es base de una representación con los caracteres (1) E 1 1 Para que la función de onda total tenga la simetría A 2 , su comportamiento respecto de la inversión debe quedar determinado, por consiguiente, por el factor (- IV. De esta manera, para k = O los niveles con J par (impar) pueden ser solamente negativos (positivos); el peso estadístico en ambos casos es igual a 6 (niveles del tipo A2). Resumiendo estos resultados, obtenemos la siguiente tabla de estados posibles para valores distintos del número cuántico k en el caso del término normal electrónico y de vibración de la molécula N 14H 13 ( + y - designan los estados po'sitivos y netivos): k 1 k 1 1 1 no múltiplo de tres múltiplo de tres k = O f J par l ] impar + 6E 6E 12A2 12A2 6A2 6A2 Para valores dados de J y k, los niveles de energía de la molécula NH3 resultan ser, en general, degenerados (véase también la tabla para la molécula ND3 en el problema 3). Esta degeneración en parte se rompe y ello debido a una efecto característico ligado con la forma aplanada de la molécula de amoníaco y a la pequeña masa de los átomos de hidrógeno. Mediante un desplazamiento vertical relativamente pequeño de los átomos de esta molécula se puede conseguir la transición entre dos configuraciones que se obtienen una de otra por reflexión en un plano paralelo a la base de la pirámide (fig. 44). Estas transiciones conducen a un desdoblamiento de los niveles en el que se separan los niveles positivos y negativos (efecto análogo al caso unidimensional considerado en el problema 3 del § 50). La magnitud del desdoblamiento es proporcional a la probabilidad del paso de los átomos por la « barrera de potencial» que separa ambas configuraciones de la molécula. Aunque, debido a las propiedades antes indicadas de la misma, en la molécula de amoníaco esta probabilidad es relativamente grande, con todo,la magnitud del desdoblamiento es pequeña (1 x 10-4 eV). Un ejemplo de molécula del tipo del trompo esférico se estudia en el problema 5 de este párrafo. (1) En la rotación de ángulo :r, la función propia del momento cinético con el valor J y proyección igual a cero queda multiplicada por (- J)-1. 460 Moléculas poliatómicas N HO~H HO~oH ~ N Fm. 44 PROBLEMAS l. Establecer la relación entre la simetría del estado de la molécula C 122 H 14 y el spin total de los núcleos de hidrógeno de la misma. El spin total de los cuatro átomos H 1 puede tener los valores 1 = 2, 1, O, y su proyección M 1 toma valores entre 2 y - 2. Consideremos las representaciones dadas por los factores de spin correspondientes a cada valor l'vf; por separado, comenzando por el mayor de ellos. Solución (1). Al valor M 1 = 2 corresponde tan sólo un factor de spin, en el que todos los núcleos tienen como proyección del spin el valor + t. Al valor M1 = 1 van asociados cuatro factores de spin distintos que difieren entre sí en que a cada uno de los cuatro núcleos se atribuye una proyección del spin igual a - t. Finalmente, el valor M 1 = O se obtiene con seis factores de spin según sea el par de núcleos al que se atribuyen las proyecciones - t del spin. Los caracteres de las tres representaciones correspondientes son: M1 = 2 M1 = 1 M1 = O E 1 4 6 a(xz) 1 4 o a(yz) 1 o o 6 2 2 2 a(xy) 1 I 1 La primera de estas representaciones es la representación unidad Au; dado que el valor M 1 = 2 se puede conseguir solamente para 1 = 2, llegamos a la conclusión de que al spin J = 2 corresponde un estado con la simetría Ag. El valor M 1 = 1 se puede conseguir tanto para 1 = 1 como para I = 2. Restando, de acuerdo con esto, de la segunda representación la primera y descomponiendo el resultado en partes irreducibles, encontramos que al spin 1 = 1 corresponden estados B 1u, B 2 u, B 3 u. Finalmente, el valor M1 =Ose puede conseguir en todos los casos en los que es posible M 1 = J, y, además, para 1 = O. Restando, de acuerdo con esto, de la tercera representación la segunda, encontramos dos estados Au que corresponden al spin I = O. 2. Determinar los tipos de simetría de las funciones de onda totales (de coordenadas) y los pesos estadísticos de los correspondientes niveles para las moléculas CL 22 H\, C 1ª2 H\, N 1\0 164 (todas estas moléculas tienen la misma forma; los spins son i(H 2) = 1, i(C 13) = t, i(N 14) = 1). 1 ( ) Un método para la resolución de problemas análogos basado en la teoría de grupos de permutaciones puede verse en E. G. KAPLAN, ZhETF, 37, 1050 (1959). Clasificación de los términos moleculares 461 Solución. Siguiendo el mismo método que se aplicó en el texto a la molécula C 1\H 14 , encontramos los siguientes estados (los ejes de coordenadas se eligen al igual que antes): + Molécula C 122H 24 C 13 2H 1 4 N14 2 Q16 4 3. 18B2u, 18Bau 12B2u, 24B:iu 3Bsu 27Ag, 18B1u 16Au, 12B1u 6Au El mismo problema para la molécula N 14H\. Solución. De manera análoga a como se procedió en el texto para la molécula N 1 4H 13 , encontramos los estados: 30A 1 , 3A 2 , 24E. Para el término electrónico y de vibración normal y diferentes valores del número cuántico k son posible~ los siguientes estados: lkl lkl k 4. = no múltiplo de tres múltiplo de tres ] par O { ] impar + 24E 30Ai, 3A2 30A1 3A2 24E 30Ai, 3A1 3A2 30A1 El mismo problema para la molécula C 12 2 H\ (véase la fig. 43, f; simetría D 3 a). Solución. Son posibles estados de los siguientes tipos: 7A 1g, 1A 1 u, 3A 2 g, 13A 2 u, 9Eu, 11 Eu. Para el término electrónico y de vibración normal se obtienen los siguientes estados: lkl !kl k = O { no múltiplo de tres múltiplo de tres par J impar J + 9Eu 7Au, 3Au 7A 1 u 3A211 11Eu 1A1u, 13A2u 1A1u 13A2u 5. El mismo problema para la molécula de metano C 12H 14 (los átomos H en los vértices, el átomo C en el centro de un tetraedro). Solución. La molécula pertenece al tipo del trompo esférico y tiene la simetría Ta. Siguiendo el mismo método, encontramos que son posibles estados de los tipos: 5A 2 , JE, 3F1 (a ellos corresponde un spin total de la molécula igual, respectivamente, a 2, O, 1). Los estados de rotación del trompo esférico se clasifican según los valores J del momento cinético total. Las 2J + 1 funciones de rotación ligadas a un valor dado de J, son base de una representación de 2J + 1 dimensiones del grupo O, isomorfo del grupo Ta, a partir del cual se obtiene substituyendo todos los planos de simetría por ejes de segundo orden perpendiculares a ellos. Los caracteres de esta representación se determinan mediante la fórmula (98.1 ). Así, por ejemplo, para J = 3 obtenemos una representación con los caracteres E 7 -1 -1 -1 En ella están contenidas las siguientes representaciones irreducibles del grupo O: A 2 , Fi, F 2 • Considerando de nuevo la estructura de rotación del término electrónico y de vibración normal, deducimos de aquí que para J = 3 los estados de la función de onda total con la simetría A 2 pueden ser solamente positivos, y los niveles del estado F 1 , tanto positivos como negativos. Para los primeros valores J se obtienen, de la misma manera, los siguientes estados (los escribimos junto con 462 Moléculas poliatómicas sus pesos estadísticos nucleares): ]=O ]=1 ]=2 ]=3 ]=4 + SA2 3F1 1E SA2 , 3F1 1E, 3F1 1E, 3F1 3F1 5A21 1E, 3F1 CAPÍTULO XIV COMPOSICIÓN DE MOMENTOS CINÉTICOS § 106. Símbolos-3j La regla obtenida en el § 31 para la composición de momentos cinéticos determina los valores posibles del momento cinético total de un sistema formado por dos partículas (o por partes más complejas) que poseen momentos cinéticos j 1 y j 2 ( 1). Esta regla, en realidad, está íntimamente ligada con las propiedades de las funciones de onda respecto de las rotaciones espaciales y se siguen directamente de las consideraciones hechas en el capítulo VIII acerca de las propiedades de los espinores. Las funciones de onda de dos partículas con momentos cinéticos j 1 y j 2 son espinores simétricos de órdenes 2j1 y 2j2 , y la función de onda del sistema viene dada por su producto (106.1) Simetrizando éste respecto de todos los índices, obtenemos un espinor simétrico de orden 2(j1 +j2) que corresponde a un estado con momento cinético totalj1 +j2 • Contraigamos ahora el producto (106.1) respecto de un par de índices, de los que uno debe pertenecer a vP>, y el otro, a 1P< 2>(de no hacerlo así, el resultado sería cero); en virtud de la simetría de cada uno de los espinores 1P(l) y 1P< 2>, es indiferente cuáles sean los índices que se eligen entre los }., µ, ... y entre los e, a, ... Después de simetrizar, obtenemos un espinor simétrico de orden 2(j1 -l-j2 - 1) que corresponde a un estado con momento cinético j 1 -l-j2 - 1 (2). Siguiendo este proceso, (I) Rigurosamente hablando, y aunque no se diga explícitamente cada vez, en todo lo que sigue consideraremos siempre un sistema constituido por partículas cuya interacción mutua es tan débil que, en primera aproximación, podemos suponer que sus momentos cinéticos se conservan. Todos los resultados que se exponen a continuación se refieren, claro está, no sólo a la composición de los momentos cinéticos totales de dos partículas (o de dos sistemas), sino también a la composición del momento cinético orbital y de spin de un mismo sistema en el supuesto de que el acoplamiento spin~ órbita es suficientemente débil. ( 2) Para evitar confusiones, conviene hacer la siguiente observación. La función de onda de un sistema de dos partículas es siempre un espinor de orden 2(j¡ + j2), en general diferente de 2j, dondej es el momento cinético total del sistema. Este espinor, sin embargo, puede ser equivalente a un espinor de orden inferior. Así, la función de onda de un sistema de dos partículas con momentos cinéticos i1 = i2 = t es un espinor de segundo orden; pero si el momento cinético total es j = O, este espinor es antisimétrico y se reduce, por consiguiente, a un escalar. En general, el momento cinético total j determin¡1 la simetría de la función de onda de spin del sistema: ésta es simétrica respecto de 2j índices y antisimétrica respecto de los demás. 464 Composición de momentos cinéticos encontramos que, de acuerdo con la regla ya conocida, j toma los valores comprendidos entrej1 +j2 y fj 1 - j 2 \ y cada uno de ellos una sola vez. Para resolver del todo el problema de la composición de momentos cinéticos, hemos de estudiar todavía el problema de cómo construir la función de onda de un sistema con un valor dado del momento cinético total a partir de las funciones de onda de las dos partículas que lo constituyen. Para empezar consideremos el caso más simple, el de la composición de dos momentos cinéticos cuya resultante es nula. En este caso, evidentemente, debe ser j 1 = j 2 y las proyecciones de los momentos cinéticos son tales que m1 = - m2 • Sean 1/)jm las funciones de onda normalizadas de los estados de una partícula con momento cinético j y proyección m (en la representación no espinorial). La función 'YO que buscamos del sistema es una suma de productos de funciones de onda de ambas partículas con valores opuestos de m, precisamente de la forma: 1 'Fo = j ~ (-l)f-m.l.(l)i ,/,(2)1. -m v(2j+l) ~~ m~ • ' (106.2) m=-J {j es el valor común de j 1 y j 2). El coeficiente de la suma resulta de la normalización. En cuanto a los coeficientes que aparece~ en la misma, todos ellos deben ser iguales en valor absoluto, ya por el simple hecho de que todos los valores de las proyecciones m de los momentos de las partículas deben ser igualmente probables. Por otra parte, es fácil determinar el orden de sucesión de los signos en (106.2) mediante la representación espinorial de las funciones de onda. De acuerdo con este simbolismo, la suma en (106.2) es un escalar (¡el momento total del sistema es igual a cero!) ¡fa(l)ltµ, ...¡fa<2\¡i ... , (106.3) formado a partir de dos espinores de orden 2j. Teniendo esto en cuenta, a partir de la fórmula (57.3) encontramos, sin más, los signos que aparecen en (106.2). Sin embargo, no hay que perder de vista que, en general, solamente están determinados unívocamente los signos relativos de los términos de la suma (106.2), mientras que el signo común puede resultar dependiente del « orden de composición » de los momentos. En efecto, si bajamos todos los signos espinoriales (entre los que hay j+m unos y j - m doses) en 1P'1) y los subimos en 1P(2), el escalar (106.3) queda multiplicado por (- 1)2j, es decir, cambia de signo sij es semientero. Consideremos ahora un sistema, cuyo momento cinético total es igual a cero, formado por tres partículas con momentos cinéticos j 1, j 2 , j 3 y proyecciones de los mismos m1 , m2 , m3 • La condición de que el momento cinético total sea igual a cero implica que m1 +m2 +m3 =· O y quej1,j2,j3 tengan valores tales que cada uno de ellos 465 Símbolos 3 j se puede obtener como resultado de la suma vectorial de los otros dos, es decir, geométricamente j 1 , j 2 , j 3 deben ser los lados de un triángulo; con otras palabras, cada uno de ellos no es menor que la diferencia ni mayor que la suma de los otros dos: li1-hl ~ h ~ ji +h, etc. Es evidente que la suma algebraicaj1 +j2 +j3 es en este caso un número entero. La función de onda del sistema considerado tiene la forma de una suma 'l"o = (106.4) que se extiende a todos los valores de cada uno de las mi entre los límites -- Ji y .ÍiLos coeficientes en esta fórmula se llaman símbolos-3j de Wigner. Por definición, son diferentes de cero tan sólo si se cumple la condición Al permutar los índices 1, 2, 3, la función de onda (106.4) puede variar solamente en un factor de fase que carece de importancia. De hecho los símbolos-3j se pueden definir como cantidades reales puras (véase más adelante), en cuyo caso la falta de univocidad de 'Y0 puede solamente consistir en la indeterminación de su signo (como ocurría también en el caso de la función (106.2)). Esto significa que la permutación de las columnas de un símbolo-3j o lo deja invariante, o cambia su signo. La manera más simétrica de determinar los coeficientes en la suma (106.4), que es la que se suele seguir para definir los símbolos-3j, consiste en lo siguiente. En el formalismo espinorial, 'f'0 es un escalar formado multiplicando tres espinores "P(I)}.p ... , 'tp< 2 )}p ... , 1P( 3)}p ... , y contrayendo a continuación respecto de todos los pares de índices, de forma que los índices de cada par se refieren a dos espinores distintos. Convengamos en que, para cada par relativo a las partículas 1 y 2, el índice de spin se escribirá como superíndice en 1P<1> y como subíndice en tp< 2); para un par correspondiente a las partículas 2 y 3, utilizamos un superíndice en tp< 2 ) y un subíndice en tp< 3); para un par correspondiente a las partículas 3 y 1, el superíndice se referirá a tp< 3) y el subíndice a tp(l) (es fácil ver que en total se tienen j 1 +j2 - j3 , .i2 +j3 - j 1 y J3 +j1 - j 2 pares de cada una de estas «clases», respectivamente). Con esta regla el signo de 'F0 queda fijado unívocamente. Es evidente que, de acuerdo con esta definición, una permutación cíclica de los índices 1, 2, 3 deja 't'0 invariable. Esto significa que un símbolo ~¡ no cambia en una permutación cíclica de sus columnas. En cambio, la permutación de dos índices (cualesquiera) obliga, como se ve fácilmente, a subir los subíndices y bajar los superíndices en todos los j 1 +j2 +J3 pares. Esto significa que 't'0 queda multiplicada por (- 1)ii+i +i,; con otras palabras, los símbolos-3} tienen la propiedad: 2 466 Composición de momentos cinéticos (106.5) es decir, cambian de signo al permutar dos columnas si j 1 +j2 +}3 es un número impar. Finalmente, es fácil ver que (106.6) En efecto, el cambio de signo de la componente z de todos los momentos cinéticos se puede considerar como el resultado de la rotación de ángulo nen torno del eje y. Pero esta transformación equivale a subir todos los subíndices y bajar todos los superíndices espinoriales (véase (58.11)). De la expresión (106.4) se puede pasar a una fórmula importante que determina la función de onda o/;m de un sistema formado por dos partículas y que posee valores dados de j y m. Consideremos para ello el conjunto de las partículas 1 y 2 como un solo sistema. En tanto que el momento cinético j de este sistema junto con el momento cinético j 3 de la partícula 3 se componen dando lugar a un momento resultante nulo, debe ser j = j 3 , m = - m 3 • Según (106.2) se puede entonces escribir 'f"o = 1 "" (- l)j-m'f". V(2j+ 1) L ,/,(3). _ • J, m }m'/' (106.7) m Hay que comparar esta fórmula con la expresión (106.4) (en la que escribimos}, - m en vez de } 3 , m3 ). Sin embargo, es necesario tener antes en cuenta que la regla de formación de la suma (106.7) de acuerdo con (106.3) no coincide con la regla de formación de la suma (106.4): para reducir (106.7) a (106.4) es necesario, como se ve fácilmente, agrupar los superíndices y los subíndices formando pares que corresponden a las partículas 1 y 3; esto conduce a la aparición de un factor adicional ( - 1)id2+is. En definitiva obtenemos: (106.8) donde la suma respecto de m 1 y m2 se efectúa teniendo en cuenta la condición m 1 +m 2 = m. La fórmula (l 06.8) da la expresión buscada de la función de onda del sistema a partir de las funciones de onda de ambas partículas para momentos cinéticos 467 Símbolos 3 j determinados } 1 y }2 de éstas. Dicha función se puede escribir en la forma: (106.9) Los coeficientes (1) (106.10) constituyen la matriz de transformación del sistema completo ortonormal de las (2j1 + 1) (2j2 + 1) funciones de onda de los estados con valores determinados m1, m2 al mismo sistema de funciones con valores determinados}, m (para valores dados j 1, j 2). Conforme sabemos (véase § 12), esta matriz es unitaria. Por consiguiente, podemos escribir sin más la transformación inversa 11+12 'P(l)j1m1'P( 2 li2m2 = 2 j=Jj2-icl Ci, mi+mz':f1'j,m1+m2, (106.11) m1m2 (se tiene aquí en cuenta también el hecho de que los coeficientes C son reales). De acuerdo con las reglas generales de la mecánica cuántica, los cuadrados de los coeficientes del desarrollo (106.11) determinan la probabilidad de que el sistema tenga un cierto valor j (para los valores dados j 1, m1 y j 2 , m2 ). El carácter unitario de Ja transformación (106.9) significa que estos coeficientes satisfacen determinadas condiciones de ortogonalidad. Según las fórmulas (I 2.5), (12.6) tenemos: ¿ c1m crm' m1m2 m1m2 m1,m2 ¿ = (2j+l) m1,m2 = el jw )2 m1 m2 -m )2 m1 m2 -~') ój5'ómm', (106.12) j,m - ~ (2j+l)(!n: :, _;,)(:, :2 -~) =ó se ó m1mi' 1n2m2' (106.13) 1 ( ) Llamados coeficientes de composición vectorial o coeficientes de Klehsch-Gordan. En la literatura utilizan para ellos también las notacionesc/1mm 1J 2m 2 , (Jii, i111 ¡ 1 j 0111,Í11J. 468 Composición de momentos cinéticos La forma general explícita de los símbolos-3j es bastante complicada. Cabe darla en la forma (1): js) jl h ( m1 m2 m3 = [(j1 +;°2-ja)!(ji-h+ja)!(-ji +J°2+ja)!Jl/ 2X (j1+h+h+l)! x [(ji +m1)!(ji-m1)!(i2+m2)!(h-m2)!(h+m3)!(ja-m3)!]112 x ( -1 )z+ii-irms ~ x 7 z!(ji +h-js-z)!(ji-m1 -z)!(h+m2-z)!(ja-h+m1 +z)!(j3-ji-m2+z)°! (106.14) La suma se extiende a todos los valores enteros z; sin embargo, dado que la factorial de un número negativo es igual a oo, el número de términos en la suma es, de hecho, finito. El coeficiente de la suma es evidentemente simétrico respecto de los índices 1, 2, 3; la simetría de la suma, en cambio, se pone de manifiesto después de cambiar la variable z respecto de la que se suma. Además de las propiedades de simetría (106,5-6) que se siguen de manera fácil a partir de la definición de los símbolos-3j, éstos poseen todavía otras cuya deducción es, sin embargo, más complicada, y que no justificaremos aquí (2). Estas propiedades se formulan de manera cómoda introduciendo una tabla cuadrada (3 x 3) de números ligados con los parámetros de un símbolo-3} de la siguiente manera: . ji )2 )3 ( m1 m2 ms ) = [}2+ja-j¡ js+j1-h j1+h-h] . . . JI -m1 J2-m2 J3-m3 ; ji +m1 h+m2 (106.15) h+m3 (la suma de los números en cada fila y en cada columna de esta tabla es igual a J1 +J2 +J3 ). Entonces: 1) la permutación de dos columnas cualesquiera de la tabla multiplica el símbolo-3j por ( - 1)ii+is+ía (esta propiedad coincide con (106.5)); 2) lo mismo vale para la permutación de dos filas cualesquiera (aplicada a las dos últimas filas, esta propiedad coincide con (106.6)); 3) un símbolo-3j no cambia cambiando filas por columnas. He aquí algunas de las fórmulas más simples para unos cuantos casos particulares. El valor 1 ( ) Los coeficientes '3el desarrollo (106.9) fueron calculados por primera vez por E. WJGNER (1931). En cuanto a las propiedades de simetría de estos coeficientes y a la expresión simétrica (106.14) de los mismos, el primero en hallarlas fue G. RACAH (1942). El método de cálculo más directo consiste, probablemente, en el paso de la representación espinorial \Fo (normalizada del modo indicado) a la representación en forma de suma ( 106.4) mediante las fórmulas de correspondencia (58.1) (obsérvese que el carácter real del coeficiente en esta fórmula conduce automáticamente al carácter real de los símbolos-3j). Otra manera de llegar a este resultado se encuentra en el libro: A. R. EDMONDS, Angular momentum in quantum mechanics, Princeton, 1957. De este mismo libro se ha tomado la tabla adjunta de símbolos-3j. O Véase T. RFGGF, N1101·0 Cimento, 10, 544, 1958. 469 Símbolos 3 j . } . O (m J ) 1 1'" ( (106.16) -m O = - p-m,/(2j+ 1) corresponde a la fórmula ( 106.2). Las fórmulas (2j1)!(2h)!(ji +jz+m1 +m2)!(j1 +h-m1 -m2)! ] 1/2 x [ (2J°1 +2h+ l)!(ji +m1)!(ji-m1)!(j2+m2)!(h-m2)! ' .}2 j3) = ( -1 )-J1+J2+m3 . . X J1 -11-m3 m3 J._1 ( (106.17) (2j1)!(-ji +iz+ja)!(j1 +jz+m3)!(ja-m3)! ]1/2 [ x (ji +h+h+ l)!(ji-jz+ja)!(j1 +iz-ja)!(-ji +iz-m3)!(ja+m3)! TABLA 9 Fórmulas para los símbolos-Jj j+m! ( j 1) 2 -m-! ! = (- l)i-m-1/2 [ j-m+1.2 ]112 (2j+ 1)(2j+2) . . 1 (- l)i-m(Jl J ) m -m-m3 m3 ~ma o }l " ' 2m j [2j(2j+ 1)(2j+2)]1!2 j+1 -[2(j+m+ l)(j-m+ 1)]1/2 (2j+ 1)(2j+2)(2j+3) 1 "'-ma ii""'- 2(j-m)(j+m+ 1)]1/2 [ 2j(2j+ 1)(2j+2) j j+l - [ (j-m)(J-m+ 1) (2j+ 1)(2j+2)(2j+3) ( - l)i-m+l/2(ji j } ) m -m-m3 m3 ]1/2 Composición de momentos cinéticos 470 .l ~ 2 - j+t j-m+.12 ·+3m+-º [ (] z) 2j(2j+1)(2j+2)(2j+3) ]112 3(j-m+f)(j-m+ i)(j+m+ i)]l/2 [ (2j+ 1)(2j+2)(2j+3)(2j+4) j+i 3 ~ 2 j+t -[3(j-m-f)(j- m+f )(j+ m+ J)]l/2 2j(2j + 1)(2j + 2)(2j + 3) j+f (j-m-f)(j-m+f)(j-m+i)]lí2 [ (2j + 1)(2j + 2)(2j + 3)(2j + 4) . . 2 (-l)i-m(Jl J ) m -m-m3 m3 o ~ 2[3m2-j(j+ 1)] J [(2j-1 )2j(2j + 1)(2j + 2)(2j + 3) ]1/2 -2m [ j+l j+2 6(j+m+ l)(j-m+ 1) ]112 2j(2j + 1)(2j + 2)(2j + 3)(2j + 4) 6(j+m+2)(j+m+ l)(j-m+2)(j-m+ 1) [ ]1/2 (2j + 1)(2j + 2)(2j + 3)(2j + 4)(2j + 5) 1 (1 +2m) [ j+l 6(j+m+ l)(j-m) ]1;2 (2}-1 )2j(2j + 1)(2j + 2)(2j + 3) . [ -2(J+2m+2) (j-m+l)(j-m) ]1;2 2j(2j+ 1)(2j+2)(2j+3)(2j+4) z[(j+m+2)(j-m+2)(j-m+ l)(j-m)]l/2 j+2 (2j+ 1)(2j+2)(2j+3)(2j+4)(2j+5) 2 6(j-m- l)(j-m)(j+m+ l)(j+m+2)11/2 [ (2j-1)2j(2j+ 1)(2j+2)(2j+3) J 471 Símbolos 3 j -z[(j-m- l)(j-m)(j-m+ l)(j+m+Z)]l/2 j+l 2j(2j + 1)(2j + 2)(2j + 3)(2:J° + 4) (j-m- l)(j-m)(j-m+ l)(j-m+Z)]l/2 [ (2j+ 1)(2j + 2)(2j + 3)(2j+4)(2j+ 5) j+2 se obtienen directamente de (106.14). En cambio, deducir la fórmula jl jz ja) = -1 p[(ji +jz-ja)!(j¡-jz+ja)!(-ji +jz+js)!ll/2 X (O O O ( ) (2p+ 1)! J p! X (p-j1)!(p-h)!(p-ja)! ,(106.18) en la que 2p = j 1 +j2 +_j3 es un número par, requiere una serie de cálculos adicionales (1) (para 2p impar, este símbolo-3j es igual a cero en virtud de la propiedad de simetría (106.6)). En la tabla 9 se dan los valores de los símbolos-3j correspondientes a / 3 =--= !, 1, 312 , 2. Para cada/ 3 se indica el número mínimo de símbolos-~¡ a partir de los cuales se pueden obtener los demás mediante las relaciones ( 106.5), ( 106.6). PROBLEMA Determinar la dependencia angular de las funciones de onda de una partícula de spin ~ en estados con valores dados del momento cinético orbital /, del momento total j, y de su proyección m. Solución. El problema se resuelve con la fórmula general (!06.8) en la que por i¡,(11 hay que entender las funciones propias del momento cinético orbital (es decir, los armónicos esféricos Y1111 1), y por "P( 2 J, la función de onda de spin 7.(a) (donde a = ± t): l 'Y1m = (-l)l+m-1/2y1(2j+l)"" ( L., O" 1 . J )Yi.m-a-x(cr). m-cr u -m 2 Substituyendo los valores de los símbolos-3j, obtenemos: 'Y1+112,m = j+m J 'Yz-112,m = - (') ~x(i)Yi,m-112+ j-m+l J Jj-m Zj+Z x(t)Yt,m-112+ Véase el libro antes citado de EDMONns. . ~x(-t)Y1,m+1¡2, Jj+m+l Zj+Z x(-t)Yi,m+1¡2. 472 § 107. Composición de momentos cinéticos Elementos de matriz de los tensores En el§ 29 se obtuvieron fórmulas que determinan la dependencia de los elementos de matriz de una magnitud física vectorial respecto del valor de la proyección del momento cinético. Estas fórmulas son, en realidad, un caso particular de fórmulas generales que resuelven el mismo problema para un tensor irreducible (véase página 231 ) de orden cualquiera (1). El conjunto de las 2k+ 1 componentes de un tensor irreducible de orden k (k es un número entero) equivale, por sus propiedades de transformación, al conjunto de los 2k+ 1 armónicos esféricos Ykq, q = - k, ... , k (véase la nota en la pág. 233). Esto significa que formando combinaciones lineales adecuadas de las componentes del tensor es posible obtener un sistema de cantidades que, en las rotaciones, se transforman de igual manera que los armónicos esféricos Ykq· El conjunto de tales cantidadés, que designaremos aquí por fkq, lo llamaremos tensor esférico de orden k. Así, a un vector corresponde el valor k = 1, y las cantidades /iq están ligadas con las componentes del mismo por las siguientes fórmulas: !10 = t iaz, /i,±1 = ::¡: ;¡¡{ªx±iay); (107.1) (cf. (58.2a)). Las fórmulas análogas para un tensor de segundo orden se escriben: Í2,±1 = (siendo au+ayy +azz = ±(ªxz ±iayz), (107.2) O). La formación de productos tensoriales de dos (o más) tensores esféricos Ík,q,, se efectúa de acuerdo con las reglas de composición de los momentos cinéticos, en las que representan formalmente el papel de « momentos cinéticos» los parámetros k 1 y k 2 correspondientes a estos tensores. De esta manera, a partir de.los tensores esféricos de órdenes k 1 y k 2 se pueden formar tensores esféricos de orden K = k 1 +k 2 , ••• , \k 1 - - k 2 l según las fórmulas: /k q 2 2 (107.3) (1) La manera de tratar los problemas considerados en los §§ 107-109, y la mayor parte de los resultados que en ellos se presentan se deben a G. RACAH (1942-1943). Elementos de matriz de lo.~ tensores 473 (cf. (106.9)). El producto escalar de dos tensores esféricos de igual orden k se suele definir, sin embargo, por la igualdad (Íkgk)oo = f (-1 )k-qfkqgk,-q, (107.4) que difiere de la definición según la fórmula (107.3), con K = Q = O, en el factor l/2k+l (cf. (106.2)) (1). Esta definición se puede presentar también en la forma si se observa que gkq* = ( - 1)k-qgk,-q (cf. (28.8)) (2). La representación de las magnitudes físicas en la forma de tensores esféricos es particularmente cómoda para el cálculo de sus elementos de matriz, ya que ello permite utilizar, sin más, los resultados de la teoría de composición de momentos cinéticos. Por la definición de los elementos de matriz tenemos: "" L., (f¡kq )n'f'm'.1. njm 'f'n'J'm', (107.5) n'j'm' donde tpnim son las funciones de onda de los estados estacionarios del sistema caracterizados por el valor de su momento cinético j, de su proyección m y por el conjunto de los demás números cuánticos n. En virtud de sus propiedades de transformación, las funciones que aparecen en uno y otro miembro de la igualdad (107.5) corresponden a las funciones en uno y otro miembro de la igualdad (106.11). De aquí se siguen desde luego las siguientes reglas de selección: paraj, m dados, los elementos de matriz son diferentes de cero tan sólo para los valores j', m' que satisfacen la « regla de composición de los momentos» j' = j+k; en todo esto es m' = m+q (3). Además, del mismo hecho de que las transformaciones son análogas se sigue que los coeficientes en la suma (107.5) deben ser proporcionales a los coeficientes en (106.11 ). De acuerdo con esto escribiremos los elementos de matriz en la forma -( )n~j'm' ( Jkq n1m = ., k . J Jk )n'i' , nj , q m .-m'( -mJ t'k(-l)i max )c-r (107.6) (1) Si A y B son dos vectores, que corresponden según las fórmulas (107.1) a los tensores esféricos f,q y K,q, se tiene (f;g,)oo = A· B. (2) Se supone que los tensores irreducibles de partida son cantidades físicas reales, de modo que el carácter complejo de las cantidades f1.q resulta solamente del paso a componentes esféricas. (ª) En particular, partiendo de aquí se obtienen directamente las reglas de selección de que se habló en el § 29 para los elementos de matriz de un vector. 474 Composición de momentos cinéticos es el mayor de los números j y j'), donde ( /k):t son cantidades que no dependen de m, m', q; estas cantidades rec·ben el nombre de elementos de matriz « reducidos » (1). Esta fórmula resuelve la cuestión planteada. En particular, para k = I se obtienen a partir de ella las fórmulas (29.7). (29.9) para los elementos de matriz de una magnitud vectorial. Umáx Los operadores Jkq están ligados entre sí por las relaciones fkq = (- l)q-k!,:,-q+, (107.7) En consecuencia, para sus elementos de matriz vale la igualdad .f. )n'j'm' ( Jkq njm _ (-J)q-k(I'. )n.im* Jk,-q n'j'm' (107.8) Substituyendo aquí (107.6) y utilizando las propiedades (106.5) y (106.6) de los símbolos-3j, obtenemos para los elementos de matriz reducidos la relación de « hermiticidad » ( I'. )n'i' _ ( -r. )nj* Jk nf - JJC n'J'' (107.9) Los elementos de matriz del escalar (107.4) son diagonales respecto de j y de m. Según la regla de multiplicación de matrices, tenemos: -1" ) 1n'jm _ [( ;kgk OOJnjm - "" L, ( - l)k-q q "" ¡ )n 1 jm ( )n"j"m" L, (Jkq n"j"m" g,:,-q njm nnj"m" Substituyendo aquí las expresione.s (107.6) y efectuando la suma respecto de q y mu mediante la relación de ortogonalidad de los símbolos-3j (106.12), se obtiene la fórmula siguiente: (107.10) De manera análoga es fácil obtener las siguientes fórmulas de sumación de los cuadrados de los elementos de matriz: (107.11) (107.12) (1) El símbolo de los elementos de matriz reducidos difiere del símbolo de los elementos de matriz de partida en que en aquéllos no aparecen los índices correspondientes a las proyecciones de los momentos. 475 Símbolo.~ 6 j En la primera de ellas la suma se efectúa respecto de q y. m' para m dado, y en la segunda, respecto de m y m' para q dado (siendo siempre m' = m+q). Como aplicación interesante, consideremos el caso en que las cantidades fkq son los propios armónicos esféricos Ykq y calculemos sus elementos de matriz para transiciones entre estados de una misma partícula con momentos cinéticos orbitales 11 y 12 (números enteros). Con otras palabras, hay que calcular las integrales (107.13) Junto con las reglas de selección correspondientes a la regla de composición de momentos (1 + 12 = 11), para estos elementos de matriz vale también la regla según la cual la suma 1+11 +12 debe ser un número par. Esta regla resulta de la conservación de la paridad, en virtud de la cual el producto ( - 1)Z1+Z2 de las paridades de ambos estados debe coincidir con la paridad (-1) 1 de la magnitud física considerada (véase § 30). De acuerdo con (107.6) tenemos: (107.14) Yz)!: Para determinar las cantidades ( basta calcular el elemento de matriz para = O. La integral ( 107.13) se reduce en este caso a la integral del producto de tres polinomios de Legendre, igual a (1): m1 = m 2 = m l / / / 2 JPt(µ)P1 (µ,)Pzh1,) dµ = 2 (; O ~) . (107.15) 1 -1 Finalmente obtenemos: ( Yiz) l . 1 l2 = ( + z)Z1+l2 - (li l l2) [(2/ + 1)(2/i + 1)(2/2 + 1)] ooo 47T 1/2 ' (107.16) donde los signos superior e inferior de i se refieren, respectivamente, a los casos /1 2 12 y /1 :s:; 12, § 108. Símbolos-6j En el § 106 hemos definido los símbolos-3j como coeficientes en la suma (106.4) ( ') Véase E. página 87. HoBSON, The theory of spherica/ al1(/ ellipsoidal lwr111011ics, Cambridge Univ. Press, 1931, 476 Composición de momentos cinético.~ que representa la función de onda de un sistema de tres partículas con momento cinético total igual a cero. Desde el punto de vista de las propiedades de transformación respecto de las rotaciones, esta suma es un escalar. De aquí se sigue que el sistema de símbolos-3j con valores dad.os j 1 , / 2 , j 3 (y todos los m1, m 2 , m3 , posibles) se puede considerar como un conjunto de cantidades que se transforman en las rotaciones según una ley contragrediente respecto de la ley de transformación 2 de los productos 1/Pj 1 1it,' j 2 2 de forma que queda garantizada la invariancia de toda la suma. m ml\ama, En relación con este punto de vista cabe plantearse el problema de cómo construir un escalar a partir tan sólo de símbolos-~¡. Un tal escalar debe depender únicamente de los números j, pero no de los números m, que cambian en las rotaciones. Con otras palabras, debe expresarse como suma respecto de todos los valores m. Cada una de estas sumas se forma por la « contracción » del producto de dos símbolos-3j de acuerdo con la regla 2(-l)i-m(j · m ·)(_j1n ·. .·); (108.1) m.. (cf. la manera de construir el escalar (106.2)). Dado que en cada « contracción » figura un par de números m, para construir el escalar total hay que considerar productos de un número par de símbolos-3j. La contracción del producto de dos símbolos-3j conduce, en virtud de la propiedad de ortogonalidad, al resultado trivial: m1,m2,ma ji ( m1 fa h m2 )2 = 1; ma (se han utilizado aquí la igualdad m1 +m2 +m3 = O y las fórmulas (106.6) y (106.12)). Por ello el número de factores mínimo necesario para obtener un escalar no trivial es igual a 4. En cada símbolo-3j los tres números j forman, geométricamente, un triángulo. Dado que cada número j debe figurar para la « contracción » en dos símbolos-3j, es claro que al formar un escalar mediante el producto de 4 símbolos-3j se tienen 6 números j, que deben representarse geométricamente por las longitudes de las aristas de un tetraedro no regular (fig. 45); a cada uno de los símbolos-3j corresponde una de sus caras. Para definir el escalar buscado se suele adoptar en la contrae- 477 .~ímbolos 6 j ción un convenio que se expresa por la siguiente fórmula: (~1 ~2 J:3¡ = ¿(_l )E;(j¡-m,) ( ]4 )5 )6 todotn ji )2 )3 ) X -m1 -m2 -m3 (108.2) FIG. 45 La suma se efectúa aquí respecto de todos los valores posibles de los números m; sin embargo, dado que la suma de tres valores m en cada símbolo-3j debe ser igual a cero, de hecho solamente dos de los seis valores m son independientes. Las cantidades definidas por la fórmula (108.2) se llaman símbolos-~¡ o coeficientes de Racah. Partiendo de la definición (108.2) y teniendo en cuenta las propiedades de simetría de los símbolos-3j, es fácil comprobar que un símbolo-6j no cambia en una permutación cualquiera de tres de sus columnas y que en cada par de columnas se pueden permutar los números superior e inferior. En virtud de estas propiedades de simetría, la sucesión de números j 1 ... j 6 en un símbolo-6j se puede presentar en 24 formas equivalentes (1). Además, los símbolos-6j poseen otra propiedad de simetría, menos evidente, que establece la igualdad entre símbolos con sistemas distintos de números j (2): ji jz ( h) = (j1 t(h+h+h-j6) t(js+j6+h-h))· i4 j5 i6 h Mh+h+j5-h) His+j6+h-h) (108.3) (1) Si imaginamos el te.raedro de la fig. 45 como tetraedro regular, las 24 permutaciones equivalentes de los números j se pueden obtener como resultado de la aplicación de las 24 transformaciones de simetría (rotaciones y reflexiones) del tetraedro. 0 Véase T. REGGE, Nuovo Cimento, 11, 116, 1959. 478 Composición de momentos cinéticos He aquí una relación útil entre símbolos-6j y 3j que se puede obtener a partir de la definición (108.2): ( ji h ja) (~1 ~2 ~3)· m1 m2 m3 (108.4) )4 )5 )6 La expresión que aparece en el primer miembro de la igualdad difiere de la suma en (108.2) en que falta uno de los factores (un símbolo-3j). Cabe decir, por consiguiente, que la suma en (108.4) se representa por un tetraedro (fig. 45) sin una de sus caras; en esto difiere de un escalar la suma considerada. Con otras palabras, por sus propiedades de transformación, dicha suma corresponde al símbolo-3j que aparece en el segundo miembro de la igualdad (108.4), símbolo al que debe ser proporcional. Pero el coeficiente de proporcionalidad (símbolo-6j del segundo miembro) se obtiene fácilmente multiplicando ambos miembros por (j¡ h h) m1m2m3 y sumando respecto de los números que quedan, m1, m2 , m3 • Los símbolos-6j aparecen de manera natural al estudiar el siguiente problema ligado con la composición de tres momentos cinéticos. Supongamos que los tres momentosj1,j2,)3 se componen dando lugar al momento cinético resultante J. Si sólo se da el momento cinético J (y su proyección M), el estado del sistema no queda aún determinado de manera unívoca; dicho estado depende también de cómo se hayan compuesto los momentos cinéticos (o, como suele decirse, del esquema de su acoplamiento). Consideremos, por ejemplo, estos dos esquemas de acoplamiento: 1) los momentos j 1 y j 2 se componen primero, dando lugar a la resultante Ji2, y luego se componenj12 y j 3 para formar el momento cinético final J; 2) se componen los momentos j 2 y j 3, formando j 23, y luego j 23 y j 1 para formar J. Al primer esquema corresponden estados en los que (junto conj1,j2,j3, J, M) la cantidadj12 tiene un valor determinado; sus funciones de onda ]as representaremos por 'Y¡ 12JM (prescindiendo, para simplificar, de los índices que se repiten j 1,j2,f3). Análogamente~ las funciones de onda del segundo esquema de acoplamiento las designaremos por 'Y¡ 23JM· En ambos casos, los valores del momento cinético « intermedio » (i12 o j 23) no están, en general, fijados unívocamente, de modo que se tienen (para valores dados J, M) dos sistemas distintos de funciones de onda que se diferencian en los valores j 12 o j 23 . De acuerdo con las reglas generales, las funciones de estos dos sistemas están ligadas entre 479 .Símbolos 6 j sí por una determinada transformación unitaria: (108.5) Es evidente por ·consideraciones físicas que los coeficientes de esta transformación no dependen del número M - no pueden depender de la orientación de todo el sistema en el espacio. Así, pues, dependen sólo de los valores de los seis momentos j 1 , j 2 , j 3 , A2 , j 23 , J, pero no de sus proyecciones, es decir, son magnitudes escalares (en el sentido antes indicado). El cálculo efectivo de estos coeficientes se efectúa fácilmente de la siguiente manera. Aplicando dos veces la fórmula (106.9), encontramos: 'P'112JM = L m1,m2,ma 12 c~~c~·":, 12 1 2 1Pi1m1tpf2m21Piams• 3 mu Según las reglas generales, los coeficientes de la transformación (108.5) son iguales a las integrales: I mi,m 2,ma C!_M cJM Cium12Cf23m2a• m3 m12 m1m2a m1m2 m 2m 3 ' m12,m23 (utilizamos aquí la ortogonalidad de las funciones '1./J;m). La suma que aparece en el segundo miembro de la igualdad se forma para el valor dado de M, pero el resultado de la misma no depende en realidad de dicho valor (por lo antes dicho). Por consiguiente, la suma se puede extender también a todos los valores de M, introduciendo delante de ella el factor 1/(21+1). Expresando luego los coeficientes C en función de símbolos-3j de acuerdo con (106.10), obtenemos en definitiva la siguiente expresión: 11 2 S112iu = (-l)ii+Mia+J v'[(2j12+ 1)(2iza+ 1)](~ )3 . 1 12 ~ ). }23 (108.6) La relación entre los símbolos-6j y los coeficientes de la transformación (108.5) permite obtener fácilmente algunas fórmulas útiles para sumar productos de símbolos-6j. 480 Composición de momentos cinéticos Ante todo observemos que, en virtud del carácter unitario de la transformación (108.5) (y del hecho de que sus coeficientes son reales), vale la relación 1 i'}(h. h. .,,}= a, . ""cz·+ L, 1 1)c2·" 1 + 1)(i. h. . J }3 )4 j J )1 )4 i i J (108.7) Consideremos ahora tres esquemas de acoplamiento de tres momentos cinéticos, con sumas intermedias j¡2, j'};J y j 31, respectivamente. Los coeficientes de las correspondientes transformaciones (108.6) están ligados entre sí, de acuerdo con la regla de multiplicación de matrices, por la relación L, S1uiuSiuia1 = Si12J31• iu Substituyendo aquí (108.6) y cambiando la notación de los índices, obtenemos: 2~4~6}(~4 ~1 ~ } (~1 ~2 ~3}· ¿( -1 )i+Ja+ie(2j + 1)(~ J = )1 )5 ) )2 )5 )3 (108.8) )4 )5 )6 Finalmente, considerando los diferentes esquemas de acoplamiento de cuatro momentos cinéticos se puede obtener (1) la siguiente fórmula de composición para los productos de tres símbolos-6j: ¿( -1 )i+f i1(2j + l) (~4 ~2 ~6 \(~2 ~1 ~3}(~4 ~3 J~5} j )9 )B. ) j )7 ) )9 = )7 )8 (~1 ~2 ~3}(~6 ~1 ~5} }4 }5 }6 (l. C. BIEDENHARN, J. P. ELLIOIT, }7 }B }9 (108.9) 1953). He aquí algunas expresiones explícitas de símbolos-6j. Un símbolo-6j se puede representar en el caso general como una suma de la siguiente forma: 2 ( j~ ~ ~ª} = ,6(j1hia)l::.(j1j5j6)6(j4hj6)l::.(Msia) x )4 )5 }6 1 (1) Véase el libro de EDMONDS citado en la pág. 468. 481 Símbolos 6 j donde L.(abc) = [ (a+b-c)!(a-b+c)!(-a+b+c)! . (a+b+c+ 1)! ]1;2, y la suma se extiende a todos los valores enteros positivos z para los que ninguna de las factoriales en el denominador tiene argumento negativo. En la tabla 10 se dan las fórmulas de los símbolos-6j para los casos en que uno de los parámetros es igual a O, t ó 1. Para terminar, haremos algunas observaciones acerca de los escalares de orden más elevado formados a partir de símbolos-3j. Después de un símbolo-6j, el escalar siguiente en complejidad es el obtenido por contracción de productos de seis símbolos-3j. Estos símbolos-3j contienen 18 números j que coinciden a pares, de forma que el escalar que resulta depende en definitiva de 9 parámetros j. Se le suele llamar símbolo-9j y definir de la siguiente manera (E. WIGNER, 1951) (1): TABLA 10 Fórmulas para símbolos-6j (-l)s a b e} (O e b = v[(2b+ 1)(2c+ 1)]' s = a+b+c e } [ (s-2b)(s-2c+ 1) a b (! e-! b+! = (-l)s (2b+ 1)(2b+2)2c(2c+ 1) ]1/2 ]1/2 a b e } [ (s+ l)(s-2a) (! e-! b-! = ( - l)s 2b(2b+ 1)2c(2c+ 1) 1 ( ) Según la regla general de contracción (108.1), habría que escribir los argumentos m e~ los tr~s últimos símbolos-3j con signo menos e introducir tras el símbolo de suma el factor ( _ 1 ) ~ (1 - m). Sm embargo, valiéndonos de la propiedad (106.6) de los símbolos-3J, y teniendo en cuenta que en el pre- • sente caso, como se ve fácilmente, la suma ~m de los nuevos números m es igual a cero, llegamos a la definición (108.11). 482 Composición de momentos cinéticos e ) [ s(s+ l)(s-2a- l)(s-2a) ]1;2 a b ( 1 c-1 b- l - (-l)S (2b-l)2b(2b+ 1)(2c-1)2c(2c+ 1) [ª e ) b ll c-1 b = (- l)S [ 2(s+ l)(s-2a)(s-2b)(s-2c+ 1) ]1;2 2b(2b+ 1)(2b+2)(2c-1)2c(2c+ 1) e ) [ (s-2b- l)(s-2b)(s-2c+ l)(s-2c+2) ]1/2 b+ 1 = ( - l)s (2b + 1)(2b+2)(2b+ 3)(2c-l)2c(2c+ 1) e ) 2[b(b+ l)+c(c+ l)-a(a+ 1)] b = (-l)s+1[2b(2b+1)(2b+2)2c(2c+1)(2c+2)]1/2 Esta magnitud se puede representar también como suma de productos de tres símbolos-6j: 11 { 2 .i~a} = )21 ) .. 2 )23 ~ ~: ia1 ia2 ha ¿ (, 1 l)2i(Z. + l)(jn h1 ia1)(fo h2 ia2)(j13 ha iaa l. (l08..1Z) J • · · • • • • · · f )32 )33 ) )21 ) )23 J )11 )12 Cabe cerciorarse de la equivalencia de (108.1 I) y (108.12) substituyendo en esta última igualdad la definición (108.2) y utilizando las propiedades de ortogonalidad de los símbolos-3j. Un símbolo-9j posee una elevada simetría, que se deduce inmediatamente de la definición (108.11) y de las propiedades de simetría de los símbolos-3j. Es fácil comprobar que si se permutan dos cualesquiera de sus filas o columnas, el símbolo-9j queda multiplicado por (- 1)1.'i_ Además, un símbolo-9j no cambia en una transposición, es decir, al substituir entre sí filas por columnas. Los escalares de órdenes aún mayores dependen de un número mayor todavía de parámetros j. Es evidente que este número debe ser siempre múltiplo de tres (símbolos-3~j). No nos detendremos aquí a considerar las propiedades de estas magnitudes. Indicaremos solamente que para cada n > 3 se tiene más de un tipo de símbolos-3nj diferentes, tipos que no se pueden reducir unos a otros. Así, se Elementos de matriz en la compo.<Jición de momentos cinéticos 483 tienen dos tipos distintos de símbolos-12j (1). § 109. Los elementos de matriz en la composición de momentos cinéticos Consideremos nuevamente un sistema constituido por dos partes (a las que llamaremos subsistemas 1 y 2), y sea fkl) un tensor esférico característico de la primera. Sus elementos ·de matriz respecto de las funciones de onda de este mismo subsistema se determinan, según (107.6), por la fórmula Se plantea la cuestión de cómo calcular los elementos de matriz de esta magnitud respecto de las funciones de onda del sistema en conjunto; demostraremos que es posible expresarlos en función de los mismos elementos de matriz reducidos que figuran en la expresión (109 .1 ). Los estados del sistema total se determinan por los números cuánticos j 1, j 2, J, M, n1, n2 (J, M son el valor absoluto y la proyección del momento cinético de todo el sistema). Dado que fkg< 1> se refiere al subsistema 1, su operador conmuta con el operador del momento cinético del subsistema 2. Por ello su matriz es diagonal respecto de j 2 ; es también diagonal con relación a los demás números cuánticos n2 de este subsistema. Prescindiremos de estos índices (j2, n2) para abreviar, y escribiremos los elementos de matriz buscados en la forma (n1'ii' J' M'lfkiUln1j1JM). Según (107.6), la dependencia de estos elementos con relación al número M está determinada por la fórmula Para establecer la relación entre los elementos de matriz reducidos que aparecen en los segundos miembros de (109.1) y (109.2) escribiremos, por la propia definición de los elementos de matriz: (1) Una exposición más detallada de la teoría de los símbolos-9j, y también de las propiedades de los símbolos-3nj, se puede ver en el libro de EDMONDS citado en la pág. 46 8 y en el libro de A. P. Iurs1s, I. B. LEVINSON y V. V. VANAGAS, Matematicheskil apparat teorii momenta R:olichestva dvizhenia, Vil'nius, 1960. Existe traducción inglesa: Mathematical apparatus of the theory of angular momentum, Oldbourne Press, Londres, 1963. 484 Composición de momentos cinJticos .' ~ .') ]' ( -1)Ji'-ii+M'-M,,/[(2J' + 1)(2]+ l)](Jl 1 J_ ,) ~ m1 m2 -M X m1,m1' X ( ji m1 J) (n1'j1'm1' l/kqmlníjim1). h -M m2 Substituyendo aquí (109.1) y (109.2) y comparando la relación obtenida con la fórmula (108.4), se ve que la razón de los elementos de matriz reducidos (en (109.1) y (109.2)) debe ser proporcional a un determinado símbolo-6j. La comparación cuidadosa de las dos relaciones indicadas conduce a la siguiente fórmula final: (nú1'J'IJ,P>lnij1J) = (-l)lr,mn+J2+Jm1n+kyl[(2J+ 1)(2]' + 1)] X e . ']'. 1 X ~}(n1)1'INllln1j1), ji (109.3) (aquí j 1máx es el mayor de los números j 1,j'1 ; lmín, es el menor de los números J, J'). La fórmula análoga para los elementos de matriz reducidos de un tensor esférico correspondiente al segundo subsistema es: (n2'Hl'lfic<2lln2j2l) = (-l)ii+h,m1n+Jmax+kyi[(2J+ 1)(21' + 1)] X e • X I ]' j, • 1 ~)(n2'.h'IN"ln2j,). (109.4) El hecho de que las expresiones (109.3) y (109.4) no sean del todo simétricas (cf. el exponente de la potencia de - 1) resulta de la dependencia de la fase de las funciones de onda respecto del orden de composición de los momento cinéticos. Hay que tener en cuenta esta diferencia si se trata de calcular elementos de matriz para ambos subsistemas a la vez. Hallaremos ahora una fórmula útil para el cálculo de los elementos de matriz, relativos a las funciones de onda de todo el sistema, que corresponden al producto escalar (véase la definición (107.4)) de dos tensores esféricos del mismo orden k asociados a los diferentes subsistemas (y que, por consiguiente, conmutan entre sí). Según (107.10), estos elementos de matriz se expresan en función de los elementos de matriz reducidos de cada uno de los tensores (correspondientes a las funciones de onda del sistema en conjunto) de la siguiente manera: Elementos de matriz en la compo.'iición de momentos cinéticos 485 (se utiliza aquí el hecho de que la matriz de una magnitud asociada a un subsistema es diagonal respecto de los números cuánticos del otro). Substituyendo (109.3-4) y teniendo en cuenta la fórmula de sumación (108.8), encontramos la fórmula buscada que expresa los elementos de matriz del producto escalar en función de los elementos de matriz reducidos de cada uno de los tensores respecto de las funciones de onda del correspondiente subsistema: (n1'nú1'h' lAfl(N 1>Ji< 2l)ooln1n2j1j2lM) = ( -1 )ii,m1n+i2,max+J( J.'., 2 1 1 1 . . k 11 12 )<n1 '.fi'l.fiP>in1ji)(nú2'IN2)¡112h). (109.s) CAPÍTULO XV MOVIMIENTO EN UN CAMPO MAGNÉTICO § 11 O. La ecuación de Schrodinger en un campo magnético En la teoría no relativista, el campo magnético se puede considerar solamente como campo exterior. La interacción magnética de las partículas entre sí es un efecto relativista y para tenerlo en cuenta es necesario aplicar una teoría relativista adecuada. El hamiltoniano de un sistema de partículas que se encuentran en un campo magnético se puede obtener a partir de la expresión clásica para la correspondiente función de Hamilton. Como es sabido por la electrodinámica, esta expresión tiene la forma: H = ~ ~ a (pa-eaAa/c) 2 2ma + U(x,y, z), donde Pa es el impulso generalizado de la partícula a-ésima, Aa es el potencial vector del campo magnético en el punto en que se encuentra ésta, U(x, y, z) es la energía potencial de interacción de las partículas ( o su energía en un campo eléctrico exterior) (1). Para abreviar, a continuación todas las fórmulas las escribiremos para una sola partícula. ·si la partícula carece de spin, el paso a la mecánica cuántica se puede efectuar de la manera habitual: hay que substituir el impulso p por el operador f, = v, con lo que obtenemos el hamiltoniano -in (f,-eA/c) 2 fJ = --+U(x,y,z). (110.1) 2m Pero si la partícula posee spin, esta operación resulta insuficiente. Ello se debe a que el spin interactúa directamente con el campo magnético. En la función de Hamilton clásica, esta interacción no aparece en absoluto, dado que el propio spin, (') Véase el tomo 11, Teoría clásica de los campos,§ 16. Designamos aquí el impulso generalizado por p, y no por P. La ecuación de Schrodinger en un campo magnético 487 que es un efecto puramente cuántico, desaparece al pasar a la mecánica clásica. A una partícula con spin se le puede atribuir también un momento magnético propio; por consideraciones de simetría, es evidente que este momento es paralelo o antiparalelo al spin. Lo escribiremos en la forma p. = µ.s/s, (110.2) donde s es el operador spin~ y µ es una constante característica de la partícula (esta forma de escribir corresponde a la terminología generalmente adoptada según la cual se entiende por valor, µ, del momento magnético de una partícula el valor máximo de su proyección, es decir, el valor µz = µa/s para a= s). La expresión correcta para el hamiltoniano de la partícula se obtiene introduciendo en (110.1) el término complementario - ¡l. :Ye, que corresponde a la energía del momento magnéticoµ en el campo :Ye. De esta manera, el hamiltoniano de una partícula que posee spin y se encuentra en un campo magnético tiene la forma: 1J = (p-eA/c)2/2m-(µ/s)s, :Ye+ U(x,y, z). (110.3) Al desarrollar el cuadrado (p-eA/c) hay que tener en cuenta que p no conmuta, en general, con el vector A, que es función de las coordenadas. Por ello es necesario escribir: 2, fJ = f,2/2m-(e/2mc)(A .f,+f, .A)+e2A2/2mc2-(µ/s)s ,.1l'+ U. (110.4) Según la regla de conmutación (16.4) del operador impulso con una función cualquiera de las coordenadas, tenemos: p.A-A.p = -iñ divA. (110.5) Así, pues, p y A conmutan si div A == O. Esto ocurre, en particular, para un campo homogéneo si se elige su potencial en la forma A = i.7t'Xr. (110.6) La ecuación flif, = Eif, que da los valores propios del operador (110.3) constituye la generaJización de la ecuación de SCHRODINGER al caso en que existe un campo magnético. Las propiedades del operador ·s se examinaron detalladamente en el capítulo VIII. Las funciones de ·onda a las que se aplica el operador (110.3) son espinores simétricos de orden 2s. Las funciones de onda de los estados estacionarios de una partícula en un campo magnético adolecen de una falta de unicidad característica vinculada a la no unicidad en la elección del potencial vector. Como es sabido, este último se define sólo salvo el gradiente de una función arbitraria/; el cambio A~ A+ Vf(x,y,z), (110.7) no se refleja en el valor de la intensidad del campo. Es claro, por esto, que la trans- 488 Movimiento de un campo magnético formación (110.7) no debe modificar esencialmente las funciones propias del operador (110.3); en partic-cilar, el cuadrado del módulo !1PJ2 debe permanecer invariable. En efecto, es fácil convencerse de que, si a la vez que se efectúa el cambio (11 O. 7), se aplica la substitución if, ~ if, exp[i(e/ñc)f(x,y, z)], (110.8) se vuelve a la ecuación de partida (1). Así,· pues, ias fases de las funciones de onda de los estados estacionarios están determinadas salvo una función arbitraria de las coordenadas. Esta falta de unicidad, sin embargo, no se manifiesta en ninguna magnitud que posea sentido físico (en su definición no aparece nunca de manera explícita el potencial vector). En la mecánica clásica, el impulso generalizado de una partícula está ligado con su velocidad por la relación mv = p-eA/c. Para hallar el operador v en la mecánica cuántica, hay que conmutar el vector r con el hamiltoniano. Un cálculo fácil conduce al resultado mv = ~-eA/c, (110.9) exactamente análogo a la expresión clásica. Para los operadores componentes de la velocidad valen las reglas de conmutación: {vx, v11} = i(eli/m2c).Jt'z, {v 11 , vz} = i(eli/m2c).Jt'x, ) (110.10) {vz, vx} = i(eli/m2c).Jt'11 , que se verifican fácilmente mediante un cálculo directo. Vemos así que en un campo magnético los operadores de las tres componentes de la velocidad de una partícula (cargada) no conmutan entre sí. Esto significa que una partícula no· puede poseer simultáneamente valores determínados de la velocidad en todas las tres direcciones. La constante µ/sli determina la razón del momento magnético propio de la partícula a su momento mecánico lis. Como es sabido (2), para el momento cinético ordinario (el orbital) esta razón es igual a e/2mc. En cambio, el coeficiente de proporcionalidad entre el momento magnético propio y el spin de la partícula resulta (1) Si se trata de un sistema de varias partículas, la transformación de la función de onda tiene la forma: if, ~ if, exp{(i/ñc) ~ ea/ (xa,Ya, za)}, (la suma se extiende a todas las partículas del sistema). 2 ( ) '/édsc el tomo U, Teoría clásica de los campos, § 44. Movimiento en un campo magnético homogéneo 489 ser otro. Para el electrón, es igual a - \el/me, es decir, dos veces mayor que el valor ordinario (1). El momento magnético propio del electrón (spin i) es igual, por consiguiente, a: µ.o = lelliJ2mc = 0·927X 10-20 erg/Gauss (110.11) Esta cantidad se llama magnetón de Bohr. El momento magnético de las partículas pesadas se suele medir en magnetones nucleares, definido éste por el valor elij2mc con m igual a la masa del protón. Los experimentos dan para el momento magnético propio del protón el valor 2,793 magnetones nucleares, estando dirigido el momento magnético en el mismo sentido que el spin. El momento magnético del neutrón es de sentido opuesto al del spin, e igual a 1,913 magnetones nucleares. En el movimiento en un campo magnético la simetría respecto de la inversión del tiempo tiene lugar solamente si a la vez se cambia el signo del campo :Ye (y del potencial vector A). Esto significa (véanse los§§ 18 y 60) que la ecuación de SCHRODINGER 11,f, = E,f, debe conservar su forma al pasar a magnitudes conjugadas complejas, cambiando a la vez el signo del/e. Para todos los términos del hamiltoniano (110.4), con excepción del término - s .l/e, esto es evidente, sin más. En cambio, el término - s .l/t ,f, de la ecuación de SCHRODINGER se convierte, en la transformación indicada, en el término ¡• .;/f',j,•, lo que a primera vista viola la invariancia exigida, ya que el operador s• no coincide con -s. Sin embargo, hay que tener en cuenta que la función de onda es, en realidad, un espinor tpJ..µ ... y que, en la inversión del tiempo, un espinor contravariante debe substituirse por otro covariante (véase § 60), de modo que en la ecuación de SCHRODINGER el término - s . ;/t'if,Aµ ... viene substituido por s•. #eif,;._µ .... Pero es fácil _ver (con ayuda de las definiciones (57.4-5)), que el resultado de aplicar el operador s• a las componentes de un espinor covariante es de signo opuesto al de la aplicación del operador Aa las componentes de un espinor contravariante. La inversión del tiempo conduce, pues, a una ecuación de ScHRODINGER para las componentes tp J.µ ... que tiene la misma forma que la ecuación de partida para las componentes 1plµ ...• § 111. Movimiento en un campo magnético homogéneo Determinemos los niveles de energía de una partícula en un campo magnético homogéneo constante (L. D. LANDAU, 1930). Conviene elegir aquí el- potencial vector del campo homogéneo no en la forma (110.6), sino en la forma siguiente: Ax = -J?y, Ay = Az = O (111.1) (el eje z se ha elegido en la dirección del campo). (1) Este valor de µ 0 se obtiene teóricamente a partir de la ecuación de onda relativista de D1 RAC. 490 Movimiento de un campo magnético El hamiltoniano (110.3) toma la forma: 11 = py2 p 2 1 (Px+eYf'y/c) 2 +-+-z -(µ/s)szYf'. 2m 2m 2m - (111.2) Observemos ante todo que el operador Sz conmuta con h, y que el coeficiente de Sz en (111.2) es una constante que no depende de las coordenadas. Del primer hecho se sigue que Sz se conserva, y del segundo, que en la ecuación de SCHRODINGER se pueden separar las variables de spin y las coordenadas. Con otras palabras, las funciones propias se pueden representar como producto de funciones de coordenadas por funciones de spin correspondientes a valores determinados de la proyección a de este último. Para la función de coordenadas tenemos la ecuación , py2 Pz2 ] 1 ,. 2 +-+--(µ/s)crYf' r/; = Erf;. [ -(Px+e.Yt'y/c) 2m 2m 2m (111.3) El operador (111.2) no contiene explícitamente las coordenadas x, z. Por ello los operadores Px y Pz conmutan con h, es decir, las componentes x y z del impulso generalizado se conservan. De acuerdo con esto buscaremos 1P en la forma: (111.4) Los valores propios Px y Pz toman todos los valores entre - oc y + oc. El impulso Pz está ligado con la velocidad por la relación Pz = mvz (véase (110.9)). Así, pues, la velocidad de la partícula en la dirección del campo puede tomar un valor arbitrario; cabe decir que el movimiento a lo largo del eje z « no se cuantifica ». El sentido físico de Px se explica más adelante. Substituyendo (111.4) en (111.3), obtenemos la siguiente ecuación para la función x(y): 2m{E+(µ/s)cr:Y't'---im Pz2 ( e.Y/') 2 x"+(y-yo) 2) x = /i2 2m me O, donde se ha introducido la notación yo = -cp:,:/e:Y't'. Esta ecuación coincide formalmente con la ecuación de ScHRODINGER (23.6) de un oscilador lineal que vibra con la frecuencia w = lel.;t"/mc en torno del punto y= y 0 • Podemos, por lo tanto, concluir, sin más, que la constante E+ µa.71'/s- Pz2 12m, que representa el papel de energía del oscilador, puede tomar los valores (n+i)liw, donde n es un número entero. Obtenemos así la siguiente expresión para ]os niveles de energía de una partícula Movimiento en un campo magnético homogéneo 491 en un campo magnético homogéneo: E = (n+!)lelnJt'/mc+pz 2 /2m-(µ,/s)a.1'e. (111.5) Las correspondientes funciones de onda son (salvo un factor de normalización constante): tp = e<t!A)(p~+PzZ)e-lel.1'e<11-110) /2cliHn[ v(lel.Te/cn)(y-yo)], (111.6) (Hn son polinomios de Hermite). La energía representada por el primer término de (111.5) corresponde al movimiento en el plano x, y. En la mecánica clásica, éste es el movimiento sobre una circunferencia de centro fijo. La magnitud conservativa Yo corresponde a la coordenada clásica y del centro de la circunferencia. Junto con ella se conserva también la cantidad x 0 = (cp 11 /e.1'e)+x (es fácil ver que su operador conmuta con el hamiltoniano (111.2)). Esta cantidad corresponde a la coordenada x del centro de la circunferencia (1). Sin embargo, los operadores .x0 y .Yo no conmutan entre sí, de modo que las coordenadas x0 y y 0 no pueden poseer simultáneamente valores determinados. Dado que (111.5) no contiene la cantidad Px, cuyos valores forman una sucesión continua, los niveles de energía son degenerados y su multiplicidad es la del continuo. Con todo, la multiplicidad de la degeneración se convierte en finita si el movimiento en el plano x, y queda limitado a un área grande, pero finita, S = LxLu. El número de valores diferentes (ahora discretos) Px en el intervalo ~Px es igual a (L 11)21Tn)tl.px. Son admisibles todos los valores Px, para los que el centro de la órbita se encuentra dentro de S (prescindimos del radio de la órbita frente al valor Ly, que es grande). De la condición 0 < Yo < Ly se sigue tl.px = eYl-7L 11 /c.Por lo tanto, el número de estados (para n y Pz dados) es eYl-7S/21rlic. Si el dominio en que se efectúa el movimiento está también limitado en el sentido del eje z (longitud Lz), el número de valores posibles Pz en el intervalo ~Pz es (L,/2'"ñ)tl.p, y el número de estados en este intervalo es igual a: e.Ye S Lz eYl-7 V ll.pz 21rlic 21rlPz = (111.7) 4,r2/i2c (1) En efecto, en el movimiento clásico a lo largo de una circunferencia de radio cmvtfe.Te (donde Vt es la proyección de la velocidad sobre el plano x, y; véa~e tomo II, Teoría clásica de los campos, § 21) tenemos: Yo = -cpx/dt' = -cmvx/dt'+y. De esta expresión resulta, evidentemente, que Yo es una coordenada del centro de la circunferencia. La otra coordenada será: xo = cmv11idt' +x = cp11 /d +x. 492 Movimiento de un campo magnético~ Para el electrón se da todavía una degeneración adicional: haciendo en (111.5) µo= - lelli/2mc, obtenemos: _donde <1 = ± E = (n+!+a) lelli.Jll'/mc+pz2 /2m, i; es evidente que los niveles con n, <1 =!y n+l, (111.8) <1 = - ! coinciden. PROBLEMA Hallar las funciones de onda de una partícula en un campo magnético homogéneo en los estados en los que la partícula posee valores determinados del impulso y del momento cinético en la dirección del campo. Solución. En coordenadas cilíndricas e, cf,, z, con el eje z dirigido en el sentido del campo, el potencial vector tiene las componentesAcf> = !-*'p, Az = Ap- = Oy la ecuación de SCHRODINGER se escribe (1): [1 1 h2 ó ( óif,) ó2if, ó2,fa] ieñ.l/e oif, e2Je2 - - P-::- + -+ - - - - - - +--p2if, 2M p op óp éJz2 p2 oq,2 2Mc oc/> 8Mc2 - - = Et/i. Busquemos una solución de la forma: con lo que para la función radial se obtiene la ecuación (eJ'e)2p2+-m-e.Ye m2] R 1 [ 1 R"+-R'+ -;:(2ME-Pz2)- p 1i2 Zen Introduciendo una nueva variable independiente la forma g= [R'+R'+(-iE+/3/3 cli p2 = O. (e.Jt'/2cñ)p2, escribiremos esta ecuación en :;)R = O, (2ME-pz2)c = 21ie~ +lm. Para;-+ oo, la función buscada se comporta como e·-;/2, y para;-+ O, como ;lmJ/ 2.De acuerdo con esto, adoptaremos para la solución la forma: R = e-t12gtmi/2w(f); y para w(;) se obtiene la ecuación de la función hipergeométrica confluente (1) Designamos aquí por M la masa de la partícula para distinguirla del momento cinético m y, para concretar, suponemos que su carga es negativa y la representamos por - e. Prescindimos del término que contiene el spin de la partícula, término no esencial para este problema. 493 Efecto Zeeman w = F{-(fi-tlml-!), lmJ + 1, f}. Para que la función de onda sea finita en todo el espacio, la cantidad P- (Jm¡ + 1)/2 debe ser un número entero no negativo ne. En estas condiciones, los. niveles de energía vienen dados por la fórmula e.Y/' Pz2 E= -ñ(np+}lml-!m+!)+ - , Me 2M equivalente a la fórmula (111.5). § 112. Efecto Zeeman Consideremos un átomo que se encuentra en un campo magnético homogéneo. Su hamiltoniano es fl 1 2m = - ¿(Pa+e.Aa/e)2+ U(x,y, z)+-.1!'. eli ~ sa, me a a donde la suma se extiende a todos los electrones, y U(x, y, z) es la energía de interac~ ción de los electrones entre sí y con el núcl~o (1). La suma ~ sa es el operador S del spin total del átomo. Designando por fi O el hamiltoniano del átomo cuando no existe campo, podemos escribir R en la forma: f1 ¿ Aa•Pa+- ¿ Aa +-.1l'.S; eli _ e me =Ho+- e2 a 2me2 2 me a (recordemos que en un campo homogéneo, con el potencial vector (110.6), p y A conmutan entre sí). Substjtuyendo aquí el valor A dado por (110.6), obtenemos: e H = Ho+-.1!'. 2me ¿ raXPa+-- ¿ (.1l'Xra)2+-.1l' eli _ .S. e2 a 8me2 me a Pero el producto vectorial ra X Pa es el operador momento orbital del electrón y la suma extendida a todos los electrones nos da el operador /iL del momento cinético orbital total del átomo. Así, pues, fl = Ho+µo{L+2S) • .1/'+(e2/8me2) ~ (.1l'Xra)2, a (112.1) (µ 0 es el magnetón de Bohr). El operador P.at = -µo(L+2S) (112.2) se puede considerar como el operador del momento magnético «propio» que el átomo posee cuando no existe campo. (1) En este párrafo designamos la carga del electrón por - e. 494 Movimiento de un campo magnético Supongamos que el campo magnético es tan débil que µ, 0.Tt' es pequeño comparado con las distancias entre los niveles energéticos del átomo, en particular comparado con los intervalos de los niveles de estructura fina. Los términos segundo y tercero de (112.1) se pueden entonces considerar como una perturbación, siendo los niveles no perturbados las componentes individuales de los multipletes. En primera aproximación se puede prescindir del tercer término, que es cuadrático respecto del campo, frente al segundo término, que es lineal. El campo magnético, que distingue entre todas una determinada dirección en el espacio, rompe la degeneración de los niveles ligada a las direcciones posibles del momento cinético total J del átomo. En virtud de la simetría axil del campo, se conserva la proyección del momento cinético total sobre la dirección de aquél y las diferentes componentes del término desdoblado se caracterizan por los valores MJ de esta proyección. La energía de desdoblamiento !!,.E viene determinada por los valores medios de la perturbación en los estados con valores dados de los números cuánticos J, L, S (1) y diferentes valores MJ: !iE = µ.o(L+2S). 3t' = µ.o (J+ S). ,t'. Si se elige la dirección del campo magnético como eje z, se tiene (112.3) Para el vector J, que se conserva (en el estado no perturbado), tenemos simplemente Jz = M. El valor medio Sz se puede encontrar fácilme!!te de la siguiente manera. Por razones de simetría, es evidente que el valor medio S es un vector dirigido a lo largo del único vector que se conserva, el J. Por ello se puede escribir S = const. J. Multiplicando ambos miembros de esta igualdad por J, obtenemos J. S =J. S = const. J2, lo que permite determinar la constante. Así, pues, (112.4) (hemos prescindido del signo de valor medio sobre el producto J · S, ya que este producto posee un valor determinado en la aproximación de Russell-Saunders). J 2 es igual aquí a su valor propio J(J + 1) y el valor propio de J. Ses igual a (véase (31.3)): J. S = !{](] + 1)-L(L+ l)+S(S+ 1)}. Reuniendo las expresiones obtenidas y substituyendo en (112.3), encontramos la siguiente expresión final para la energía de desdoblamiento: MJ = -],-]+1, ... ,j, (112.5) g = l+[](J+l)-L(L+l)+S(S+l)]/2](]+1) (112.6) donde (1) Suponemos que para los términos atómicos vale el acoplamiento Rusell-Saunders. Efecto Zeeman 495 es el llamado factor de Landé o factor giromagnético. El desdoblamiento de los niveles en un campo magnético se llama efecto Zeeman. Vemos así que el campo magnético rompe la degeneración por completo (con tal que g =/= O) y que la magnitud del desdoblamiento es proporcional al campo. El factor de Landé para las diferentes componentes de un multiplete toma valores comprendidos entre los que corresponden a J = L ± S(si L > S): > g > (L-2S+l)/(L-S+l), valores correspondientes a J = S ± L (si L < S): (L+2S)/(L+S) > g > (28+2-L)/(S-L+ 1). (L+2S)/(L+S) o entre los Si el spin es nulo (S = O, J = L), g se reduce simplemente a la unidad (1); pero si L = O, se tiene g = 2. Para J = O (lo que es posible solamente cuando S = L) la expresión (112.6) resulta indeterminada, pero el efecto, claro está, no se produce, dado que para J = O tenemos también MJ = O. Indicaremos asimismo que el desdoblamiento lineal respecto del campo puede también no existir para términos con J =I= O debido a que se anule g; por ejemplo, g = O para los términos con L = 2S- l, J = S-1 (S> 1). La derivada -o~E/o.JF es el valor medio del momento magnético del átomo (2). Vemos así que un átomo que se encuentra en un estado con valor determinado MJ de la proyección del momento cinético total sobre una cierta direcc10n posee 1u1 momento magnético medio -µ 0gMJ en esta dirección. Si el spin y el momento orbital del átomo son nulos (S = L = O), el segundo término de (112.1) no desplaza los niveles ni en la primera aproximación ni en las de orden superior (ya que se anulan todos los elementos de matriz de L y S). Por ello, todo el efecto está ligado en este caso al tercer término de ( 112.1 ), y en la primera aproximación de la teoría de perturbaciones el desplazamiento de un nivel es igual al valor medio e2 !iE = ~(~Xra) 2 • 8mc2 ~ (112.7) a Haciendo (~Xra) 2 = 22rª 2 &:,n20, donde () es el ángulo formado por fa y~' y promediando respecto de las direcciones de fa, obtenemos sen 2 0 = 1-cos20 = 2/3 (teniendo en cuenta que la función de onda de un estado con L = S == O presenta simetría esférica). De esta manera, (1) El desdoblamiento dado por la fórmula general (112.5-6) se llama a veces efecto Zeeman anómalo. Esta poco afortunada terminología surgió históricamente en relación con el hecho de que, antes de descubrirse el spin del electrón, se consideraba como efecto normal el descrito por la fórmula (112.5) con g = l. ( 2) Véase el problema del § 11. 496 Movimiento de un campo magnético e2 1 D..E = --.Jfe2 12mc2 _ ra 2 • ( 112.8) a La derivada - odE/ oJII" es el momento magnético que adquiere el átomo en el campo magnético. Escribiéndolo en la forma xJf', podemos considerar la cantidad e2 X= - - - 6mc2 ¿- Ta2 (112.9) a como susceptibilidad magnética del átomo (P. LANGEVIN, 1905). Esta es negativa, es decir, el átomo con L = S = O es diamagnético (1). En cambio, si J = O, pero S = L -=f= O, el desplazamiento del nivel, lineal respecto del campo, es también nulo, pero el efecto cuadrático de la segunda aproximación en la perturbación - IJ,at • .Y{' predomina sobre el efecto (I I 2. 7) (2). Esto se debe a que, de acuerdo con la fórmula general (38.9), la corrección al valor propio de la energía viene determinada en segunda aproximación por una suma de expresiones en cuyos denominadores aparecen las diferencias entre los niveles no perturbados de la energía - en el presente caso, los intervalos de estructura fina del nivel, que son cantidades pequeñas. En el§ 38 se hizo notar que la corrección de segund.J orden relativa al nivel normal es siempre negativa. Por consiguiente, el momento magnético en el estado normal será una cantidad positiva, es decir, un átomo que se encuentra en el estado normal con J = O y L = S -=f= O, es paramagnético. En campos magnéticos intensos, cuando µ 0 Jf' es comparable con los intervalos de estructura fina o los supera, el desdoblamiento de los niveles difiere del predicho por la fórmula (I 12.5-6); este fenómeno se llama efecto Paschen-Back. El cálculo de la energía de desdoblamiento es muy simple cuando el desdoblamiento Zeeman es grande comparado con los intervalos de estructura fina, pero, claro está, es como antes pequeño respecto de las distancias entre los distintos multipletes (de modo que en el hamiltoniano (112.1) es posible prescindir del tercer término frente al segundo) (3J. Cea otras palabras, la energía en un campo magnético es considerablemente mayor que la interacción spin-órbita. Por ello es posible (1) Indicaremos que para el cálculo del valor medio del cuadrado de la distancia de los electrones al núcleo es imposible utilizar el modelo de Thomas-Fermi. Aunque la integral Jnr 2 dr con la densidad de Thomas-Fermi n(r) también converge, su convergencia es demasiado lenta, debido a lo cual los valores que se obtienen difieren considerablemente de los valores experimentales. {2) Para S = L '4= O, los elementos de matriz no diagonales de Lz, Sz para las transiciones S, L, J-+ S, L, J :!: 1, son, en general, diferentes de cero. ( 3) En los casos intermedios, cuando el efecto del campo magnético es comparable con la interacción spin-órbita, no es posible calcular el desdoblamiento en forma general (para el caso S = ! , el cálculo se efectúa en el problema 1). Efecto Zeeman 497 prescindir, en primera aproximación, de esta última. Se conserva entonces no solamente la proyección del momento cinético total sobre el eje z, sino también las proyecciones ML y Ms del momento cinético orbital y del spin, de modo que el desdoblamiento viene determinado por la fórmula (112.10) El desdoblamiento de multiplete se superpone al desdoblamiento en el campo magnético, y viene determinado por el valor medio del operador AL . S (72.4) respecto del estado con los valores dados ML, Ms (consideramos aquí el desdoblamiento de multiplete vinculado a la interacción spin-órbita). Para un valor dado de una de las componentes del momento cinético, los valores medios de las otras dos son iguales a cero. Por lo tanto, L . S = M L M 8 , de modo que en la aproximación siguiente la energía de los niveles viene dada por la fórmula (112.11) El cálculo del desdoblamiento Zeeman en el caso general de un tipo cualquiera de acoplamiento (no ya del tipo Russell-Saunders) no es posible. Cabe solamente afirmar que el desdoblamiento (en un campo débil) es lineal respecto del campo y proporcional a la proyección M J del momento cinético total, es decir, que tiene la forma: (112.12) donde gnJ son ciertos coeficientes característicos del término dado (designamos por n el conjunto de los números cuánticos que caracterizan el término, aparte J). Aunque tampoco estos coeficientes se pueden calcular cada uno por separado, sí resulta factible obtener una fórmula, útil en las aplicaciones, que determina la suma ~ g,,,J extendida a todos los estados posibles del átomo con una configuración electró';iica dada y un momento cinético total dado. Las cantidades gnJMJ son los elementos de matriz diagonales de la magnitud Lz+2Sz calculados mediante las funciones de onda "PnJMJ· En cambio, las cantidades gsbJM.1 (donde gsLJ es el factor de Landé (112.6) en el acoplamiento Rusell-Saunders) son los elementos de matriz diagonales del mismo operador calculado mediante las funciones 1PSLJMJ· Las funciones "PnJMJ con valores dados J, M.J se pueden representar como combinaciones lineales, ortogonales entre sí, de las funciones '1/'SLJMJ con los mismos valores J, MJ. La transformación lineal de un sistema ortogonal de funciones en otro sistema asimismo ortogonal es unitaria y deja invariante la suma de los elementos diagonales de una matriz (véase § 12). De aquí deducimos que o bien, suprimiendo MJ (teniendo en cuenta que gnJ y gs,,J no dependen de MJ): 498 Movimiento de un campo magnético ""I:. gnJ n = (112.13) ""I:. gsLJ. S,L La suma se extiende a todos los estados, con el valor dado J, que son posibles para la configuración electrónica dada. Esta es precisamente la relación buscada. PROBLEMAS l. Determinar el desdoblamiento de un término con S = 1/2 en el efecto Paschen-Back. Solución. El campo magnético y la interacción spin-órbita deben tenerse en cuenta simultáneamente al aplicar la teoría de perturbaciones, es decir, el operador de perturbación es de la forma (1): P- = A L.s +µo(Lz+2Sz)~. Como funciones de onda de partida para la aproximación de orden cero eligiremos las funciones correspondientes a los estados con valores determinados L, S = t, ML, Ms (Les un valor dado, M1, = - L, ... , L; M s = ± t). En los estados excitados se conserva solamente la suma MJ = ML+Ms (V conmuta con lz), de modo que a las componentes del término desdoblado se pueden atribuir valores determinados de MJ. Los valores M J = L + ! y M J = - (L + ! ) se pueden obtener de una manera solamente, con ML = L, Ms = ! y ML = -L, Ms = - !, respectivamente. Por lo tanto, las correcciones a la energía de los estados con estos valores de MJ son iguales, simplemente, a los elementos de matriz diagon'ales (MLMs: V:lvhMs) con los valores indicados de ML y Ms. Los demás valores MJ se pueden obtener de do~ maneras: ML = MJ -!, Ms = ! y ML = MJ + !. Ms =-!.A cada MJ corresponden ahora dos valores diferentes de la energía, que se determinan a partir de la ecuación secular formada con los elementos de matriz para las transiciones entre estos dos estados. Los elementos de matriz L·S se calculan multiplicando directamente las matrices (ML!L[M'L) y (Ms!S'.M's) y son iguales a: Cuando no existe campo magnético, el término es un doblete, con una distancia entre componentes e= A(L+!) (véase (72.6)). Eligiremos el más bajo de estos niveles como origen de energía. Las fórmulas finales para los niveles EJtJ en un campo magnético tienen entonces la forma: EL+i = MJ E+µo~(L+ 1), = L-l, ... , -L+l. (1) En V no se incluye el tér~ino proporcional a (L ,_$) 2 (interacción spin-spin). Sin eTl).bargo, hay que tener presente que para el spin S = ~ la expresión (L. S) 2 se reduce a la expresión L. S, en virtud de las propi~dades específicas de las matrices de Pauli (véase § 55) y queda así incluida en la fórmula escrita para V. 499 Efecto Zeeman Para valores µ, 0 :Yt'/€ pequeños se obtiene EMJ+ = E+µ.o:Y/'MJ. 2(L+ 1)/(2L+ 1), EMJ - = µ.o:Y/'MJ. 2L/(2L+ 1), de acuerdo con las fórmulas (112.5-6) (en las que hay que hacer S grandes de µ,o.tf /E se obtiene = !, J = L ± i). Para valores de acuerdo con (112.11). 2. Determinar el desdoblamiento Zeemann de los términos de una molécula diatómica en el caso a. Solución. El momento magnético debido al movimiento de los núcleos es muy pequeño comparado con el momento magnético de los electrones. Por consiguiente, la perturbación del campo magnético debe escribirse para una molécula de la misma manera que para un sistema de electrones, es decir, como antes, en la forma P' = µ, 0.Jft'. (L+2S), donde L, S son los momentos cinéticos orbital y de spin de los electrones. Promediando la perturbación respecto del estado electrónico, obtenemos en el caso a: El valor medio de nz respecto de la rotación de la molécula es el elemento de matriz diagonal (JMJ!nz!JMJ) = 0.MJ/J(J+ 1) (según (87.1) con J, O. en vez de K, A). De esta manera el desdoblamiento buscado es igual a: 0(2Q-A) ó.E = µo 3. J(J+l) MJ:Yt'. El mismo problema en el caso b. V1~J Solución. Los elementos de matriz diagonales que determinan el desdoblamiento que se busca se podrían calcular de acuerdo con las reglas generales expuestas en el§ 87. Sin embargo, es más fácil efectuar el cálculo de una manera más intuitiva. Promediando el operador de perturbación respecto de los estados orbital y electrónico, obtenemos (el operador de spin no queda afectado por este promedio). Promediemos luego respecto de la rotación de la molécula (el valor medio de nz se determina por la fórmula (87.1)): Finalmente, promediemos respecto de la función de onda de spin; después de todo este proceso, los valores medios de los vectores pueden estar dirigidos tan sólo en el sentido del único vector que se conserva, en el del momento cinético total J. Obtenemos, por consiguiente (cf. (] 12.4)) J µo:Y/' [ A2 ](]+ 1) K(K+ 1f .J+zs .J MJ, 500 Movimiento de un campo magnético o, finalmente: t,.E = µ,o { A2 ](]+1) 2K(K+1FU+l)+K(K+l)-S(S+l)]+ +[](] + 1)-K(K+ l)+S(S+ 1)] )~MJ. 4. Un átomo diamagnético se encuentra en un campo magnético exterior .Jf'. Determinar la intensidad del campo magnético inducido en el centro del átomo. Solución. Para S = L = O la perturbación lineal respecto del campo no aparece en el hamiltoniano y, por lo tanto, en la función de onda del átomo no se presenta la corrección de primer orden de dicho campo magnético. La variación de la corriente electrónica j' inducida por el campo magnético exterior en el átomo se traduce (en la misma primera aproximación respecto de .Jf') tan sólo en la adición del término (e/me) A al operador velocidad de los electrones. Tenemos, por lo tanto (1): j' = -p(e2/mc)A= -p(e2/2mc)3t'xr, (1) donde (! es la densidad electrónica en el átomo. La intensidad del campo magnético, debido a esta corriente adicional, en el centro del átomo es (2) J't'ind f r = - -1 j'x --dV. e r3 Substituyendo aquí (1) y promediando bajo el signo de integración respecto de las direccciones de r, obtenemos: .Yeind e2 3mc2 = - --~ f p -dV T (2) donde <f,6 <0> es el potencial del campo creado por la capa electromca del átomo er, el centro del mismo. En el modelo de Thomas-Fermi c/>e(O) .'Yetnd -1 ·80Z4/3meªJñ2 (véase (70.8)) de modo que = -0·60(e2/Jic)2Z4/3;Ye = § 113. = -3·2 X 10-5Z4/3;Ye. El spin en un campo magnético variable Consideremos una partícula eléctricamente neutra que posee momento magné(') Esta expresión corresponde a la precesión de Larmor de las capas electrónicas del átomo en torno de la dirección del campo magnético exterior (véase tomo IT, Teoría clásica de los campos, § 45). ( 2) Véase la nota en la pág. 140. El spin en un campo magnético variable 501 tico y que se encuentra en un campo magnético homogéneo, pero variable (en el tiempo). Puede tratarse bien sea de una partícula elemental (por ejempio, un neutrón), o de una partícula compuesta (un átomo). El campo magnético se supone tan débil que la energía magnética de la partícula en el campo es pequeña comparada con los intervalos entre sus niveles energéticos. Cabe entonces considerar el movimiento de la partícula como un todo para un estado interno dado de la misma. Sea s el operador del momento cinético « propio » de la partícula - el operador de spin para una partícu]a elemental o el momento cinético total J en el caso de un átomo. El operador momento magnético lo representaremos en la forma (110.2). El hamiltoniano para el movimiento de una partícula neutra considerada en conjunto se escribirá en la forma (1): fJ = -(µ/s)s .l/e. (113.1) En un campo homogéneo este operador no contiene las coordenadas explícitamente (2). Por ello la función de onda de la partícula se descompone en el producto de una función de las coordenadas por una función de spin. De ellas la primera es simplemente la función de onda del movimiento libre; en lo que sigue tan sólo nos interesa así la parte que depende del spin. Demostraremos que el problema correspondiente a una partícula con momento cinético arbitrario s se puede reducir al problema más simple que plantea el movimiento de una partícula con spin l (E. MAJORANA). Para ello basta seguir el método que aplicamos en el § 57. Esto es, en vez de una partícula con spin s, se puede introducir formalmente, en efecto, un sistema de 2s « partículas » de spin 1. El operador § se representa entonces como suma :I: s0 de los operadores de spin de estas «partículas», y la función de onda, en forma de producto de 2s espinores de primer orden. En estas condiciones, el hamiltoniano (113.1) se descompone en la suma de 2s hamiltonianos independientes: fJ = Lfla, a fla = -(µ/s).Ye. Sa, (113.2) de modo que el movimiento de cada una de las 2s « partículas » se determina independientemente del de las demás. Una vez hecho esto, basta introducir de nuevo las componentes de un espinor simétrico arbitrario de orden 2s en vez de los productos de las componentes de 2s espinores de primer orden. PROBLEMAS 1. Determinar la función de onda de spin de una partícula neutra de spin l que se encuentra en un campo magnético homogéneo cuya dirección es constante, pero cuyo valor absoluto varía de acuerdo con ~~ ley arbitraria :Yt' = :Yt'(t). ( 1) Escribimos solamente aquella parte del hamiltoniano que depende del spin. Estos razonamientos se pueden aplicar también al caso en que una partícula (incluso cargada) se mueve en un campo magnético no homogéneo, con tal que quepa considerar su movimiento como cuasiclásico. El campo magnético, que cambia al moverse la partícula a lo largo de su trayectoria, se puede considerar entonces simplemente como una función del tiempo y aplicar a la variación de la función de onda de spin las mismas ecuaciones. ( 2) 502 Movimiento de un campo magnético La función de onda será un espinor "Pv que satisface la ecuación de onda Solución. (1) Eligiendo la dirección del campo como eje z, escribiremos esta ecuación en términos de componentes espinoriales: De aquí se sigue Las constantes c1, c2 deben determinarse a partir de las condiciones iniciales y de la condición de normalización ivi[ 2+ ¡1p2¡ 2 = 1. 2. El mismo problema en el caso de un campo magnético homogéneo cuyo valor absoluto es constante, pero cuya dirección gira uniformemente (con velocidad angular w) en torno del eje z formando con él el ángulo O. El campo magnético tiene las componentes Solución. .Yl7x = .Yl7 y = .Yl7 sen Bsen wt, .Yl7 sen B cos wt, .Yl7z = .Yl7 cos B, y a partir de ( 1) obtenemos el sistema de ecuaciones J1 = iwH(¡/11 cos B+¡/¡2e-iwt senB), ¡/1 2 = iwH(ip1etwt senB-¡/12 cos B), donde wH= µJ('/ñ. La substitución if,l = e-H<»tef,l, y,2 = eiiwtef,2 reduce estas ecuaciones a un sistema de ecuaciones lineales con coeficientes constantes, resolviendo el cual obtenemos: ¡/12 = 2wHeiwt/2 senB [ C¡ eiO.t/2 n+w+2wH cos B + - - - -C2- - - - iUt/2 ] , n-w-2wH cos B donde § 114. La densidad de corriente en un campo magnético Deduzcamos ahora la expresión cuántica de la densidad de corriente que corresponde al movimiento de partículas cargadas en un campo magnético. Partiremos de la fórmula SH = -(1/c) f j .oA dV, (114.1) Densidad de corriente en un campo magnético 503 (j es la densidad de corriente) que determina el cambio de la función de HAMILTON de un sistema de cargas distribuidas en el espacio debido a una variación del potencial vector (1). En mecánica cuántica esta expresión debe aplicarse al valor medio del hamiltoniano de la partícula cargada: H= f 'Y*[(f,-eA/c)2/2m-(µ./s)~. s]'Y dV. Efectuando la variación y teniendo en cuenta que S.71' que: S0 = f = (114.2) rot bA, encontramos 'Y*[-__!_(f, .8A+8A.f,)+_::_A.oAJ'Y dV-(µ,/s)f rot oA.'Y*s'YdV. 2mc mc2 (114.3) El término p . SA lo transformaremos integrando por partes: J'Y*f> .sA 'Y dV = = - in f in 'Y*v(oA. 'Y) dV JsA.'Yv'Y* dV (como de ordinario, la integral extendida a una superficie situada en el infinito es nula). La integración por partes la aplicaremos también al último término de (114.3), utilizando la conocida fórmula del análisis vectorial: a. rot b = -div(axb)+b. rot a. La integral del término en div se anula, de modo que queda: f 'Y*s'Y. rot oA dV f oA. rot ('F*s'Y) dV. = Finalmente obtenemos el resultado: 8H_ = f ien oA.('Yv'Y*-'F*v'Y) dV+e2 2mc mc2 -- -(µ./ s) f A.oA'Y'Y* dV- f oA • rot ('F*s'Y) d V. l 1 ) La función cte LAGRANGE para una carga en un campo magnético contiene el término e/e v·A o bien, representando la carga como repartida en el espacio, 1/cJj· Ad V. El cambio de la función de LAGRANGE en una variación de A es igual, por consiguiente, a: oL = (1/c) f j .oA dV. Pero la variación infinitesimal de la función de HAMIL TON es igual a la variación de la función de LAGRANGE cambiada de signo (véase tomo 1, Mecánica, § 40). 504 Movimiento de un campo magnético Comparando esta expresión con (114.1) se encuentra la siguiente expresión para la densidad de corriente: (114.4) Hay que subrayar que aunque esta expresión contiene en forma explícita el potencial vector, es con todo completamente unívoca, como era de esperar. Es fácil convencerse de ello mediante un cálculo directo, recordando que a la vez que se aplica la transformación (110.7) al potencial vector, hay que aplicar también la transformación (110.8) a la función de onda. La expresión (114.4) es el valor medio de la corriente. Cabe considerarla como elemento de matriz diagonal de un cierto operador - el operador densidad de corriente. Es entonces posible determinar también los elementos de matriz no diagonales del mismo. Dichos elementos son iguales, evidentemente, a: ieli e2 jnm = -::-('Ym'v'Yn*-'Yn"''v'Ym)--A'Ym'Yn*+ 2m me +(µ./s)c curl('Yn "'s'Ym), (114.5) CAPÍTULO XVI ESTRUCTURA DEL NÚCLEO ATÓMICO § I 15. lnvariancia isotópica No existe todavía una teoría acabada de las llamadas fuerzas nucleares, es decir, de las fuerzas que actúan entre las partículas del núcleo (los nucleones) y los mantienen juntos formando el núcleo atómico. Debido a ello, al describir las fuerzas nuclares será necesario acudir a la experiencia en mayor medida de lo que hubiera sido necesario si existiera una teoría coherente. Los dos tipos de partículas a que pertenecen los nucleones difieren, ante todo, por sus propiedades eléctricas, ya que los protones (p) tienen carg~ positiva y los neutrones (n) son eléctricamente neutros. A la vez, unos y otros, tienen el mismo spin, t, y sus masas son casi iguales (la masa del protón es igual a 1836, 1 veces la masa del electrón, y la del neutrón es 1838,6 veces dicha masa). Esta coincidencia no es puramente casual. A pesar de la diferencia en sus propiedades eléctricas, el protón y el neutrón son partículas muy parecidas entre sí y esta coincidencia posee una importancia fundamental. El hecho es que, prescindiendo de las fuerzas eléctricas relativamente débiles, las füerzas de interacción entre dos protones son muy parecidas a las fuerzas que actúan entre dos neutrones. Esta propiedad se llama simetría de carga de las fuerzas nucleares (1). En tanto se mantenga esta simetría, cabe afirmar, en particular, que los sistemas de dos protones (pp) y de dos neutrones (nn) poseen estados iguales en sus propiedades. Para ello es esencial, claro está, el que tanto los protones como los neutrones obedecen a la misma estadística (la estadística de Fermi) y que, en consecuencia, para los sistemas pp y nn son admisibles solamente los estados con igual simetría de las funciones de onda "P(r1, a 1 ; r 2, a 2) - funciones antisimétricas respecto de la permutación simultánea de las coordenadas y de los spins de las partícalas. (1) Dicha propiedad se manifiesta, en particular, en las propiedades muy parecidas (energías de enlace, espectro energético, etc.) de los llamados núcleos espejo, es decir, de los núcleos que difieren uno de otro en la substitución de todos los protones por neutrones y recíprocamente. 506 Estructura del núcleo atómico La simetría con relación a la carga resulta ser, sin embargo, tan sólo una de las manifestaciones de una semejanza física más profunda entre protones y neutrones que ha recibido el nombre de invariancia isotópica. Esta ley más profunda traduce la existencia de una analogía no sólo entre los sistemas pp y nn (que se obtienen uno de otro substituyendo todos los protones por neutrones y recíprocamente), sino también con el sistema pn, formado por partículas diferentes. Claro está que no puede aquí darse una semejanza completa, ya que los estados posibles del sistema pn, en tanto que constituido por partículas no idénticas, en ningún caso deben quedar limitados a los estados con funciones de onda antisimétricas. Sin embargo, el hecho es que entre los estados posibles del sistema pn existen estados que casi exactamente coinciden en sus propiedades con los estados de los sistemas de dos nucleones idénticos (1); estos estados se describen, naturalmente, por funciones de onda antisimétricas (los demás estados del sistema pn, en cambio, se describen mediante funciones de onda simétricas y no existen para los sistemas pp y nn). La invariancia isotópica, como la simetría de carga, es válida solamente si se prescinde de la interacción electromagnética. Otra razón de su carácter aproximado es la diferencia entre las masas del neutrón y del protón, si bien sea pequeña; que se diese la simetría exacta entre neutrones y protones supondría, claro está, la exacta coincidencia de sus masas ("l La invariancia isotópica se cumple de hecho con buena aproximación en los núcleos no demasiado pesados, pero a medida que aumenta su peso, disminuye la precisión debido a que crece en importancia el papel relativo de la interacción coulombiana de los protones en el núcleo (interacción que crece con el cuadrado del número atómico). Para describir la invariancia isotópica es posible introducir un formalismo que resulta cómodo. Se llega a él de manera natural observando que la invariancia isotópica se limita a establecer la posibilidad de clasificar los estados de un sistema de nucleones según la simetría de sus funciones de onda 1J) dependientes de las coordenadas y de los spins, con independencia de cuál sea el tipo de nucleón, de los dos posibles, a los que aquéllos pertenecen. Por consiguiente, el formalismo que buscamos debe proporcionar la posibilidad de introducir un nuevo número cuántico para caracterizar los estados del sistema de tal manera que con él quedaría determinada de manera unívoca la simetría de las funciones 1J). Pero con una situación análoga nos encontramos ya al considerar las propiedades de un sistema de partículas de spin l. Vimos, en efecto (véase§ 63), que dar el spin total S de un tal sistema determina unívocamente la simetría de su función de onda de las coordenadas, cf,, con independencia de cual sea el valor de las proyecciones a de los spins de cada una (1) Este necno fue puesto de manifiesto por primera vez por G. BREIT, E. U. CoNDON y R. D. PRESENT en 1936, basándose en un análisis de los datos experimentales relativos a la dispersión de neutrones y protones por protones. (2) Hay que pensar que, en realidad, también esta diferencia entre las masas del neutrón y del protón es de origen electromagnético. lnvariancia isotópica 507 de las partículas de entre los dos valores posibles (± !). Es natur~l, por lo tanto, que para describir formalmente la invariancia isotópica sea necesario considerar el neutrón y el protón como dos estados de carga diferentes de una misma partícula (el nucleón), estados que difieren en el valor de la proyección de un nuevo vector, r, que por sus propiedades formales es análogo al vector de spin t. Esta nueva magnitud, que se suele llamar spin isotópico (1), es un vector de un cierto espacio auxiliar llamado espacio isotópico t r¡, C (que nada tiene que ver, claro está, con el espacio real). Su significado físico sigue siendo, sin embargo, poco claro y solamente se podrá poner de manifiesto como resultado de la construcción de una teoría consecuente. La proyección del spin isotópico del nucleón sobre el eje Cpuede tener tan sólo dos valores re= ±!. El valor +~ se suele ~tribuir al protón, y el valor - ! , al neutrón. Los spins isotópicos de los nucleones se componen, para formar el spin isotópico total del sistema, de acuerdo con las reglas de composición de los spins ordinarios. En estas condiciones, la componente C del spin isotópico total del sistema es igual a la suma de los valores re de todas las partículas que lo constituyen. Para un núcleo con un número Z de protones (es decir, de número atómico Z), un número N de neutrones y un peso A = Z +N, tenemos: T¡; = ~T¡; = i(Z-N) = Z-!A, (115.1) es decir, Te determina, para un número dado de nucleones, la carga total del sistema. Es claro, por consiguiente, que la cantidad Te se conserve rigurosamente, ya que esta conservación expresa simplemente la conservación de la carga. El valor absoluto T del spin isotópico total del sistema determina, en cambio, la simetría de la « componente de carga » w de la función de onda del sistema, de manera análoga a como el spin total S determina la simetría de la función de onda de spin. Por la misma razón, dicha magnitud determina también la simetría de la función de onda '1./J de las coordenadas y del spin (es decir, de la función de onda ordinaria), ya que la función de onda total del sistema de nucleones (es decir, el producto 'I.JJW) debe poseer una determinada simetría: en efecto, como para toda asamblea de fermiones, dicha función debe ser antisimétrica con relación a la permutación simultánea de las coordenadas, de los spins y de las « variables de carga » Tt de las partículas. Por lo tanto, la existencia de una determinada simetría para las funciones de onda '1./J de un sistema cualquiera de nucleones se expresa precisamente, en el esquema expuesto, por la conservación de la cantidad T. Podemos también decir, con otras palabras, que la invariancia isotópica traduce la invariancia de las propiedades del sistema respecto de rotaciones cualesquiera (l) por B. Fue introducida por W. HEISENBERG (1932) y aplicada a la descripción de la invariancia isotópica y E. u. CONDON (1936). CASSEN Estructura del núcleo atómico 508 en el espacio isotópico. Los estados que difieren solamente en el valor de Tt (para valores dados de T y de los demás números cuánticos) coinciden en todas sus propiedades. En particular, la simetría de carga - la invariancia de las propiedades del sistema con relación al cambio de todos los neutrones por protones y recíprocamente -, que es un caso particular de la invariancia isotópica, se describe en este modelo como invariancia respecto del cambio de signo simultáneo de todos los rt, es decir, respecto de una rotación, en el espacio isotópico, de ángulo 180º en torno de un eje situado en el plano~' r¡. Observemos también que la violación evidente de la invariancia isotópica por la interacción coulombiana es clara en el esquema considerado, incluso desde un punto de vista formal: la interacción de Coulomb depende de la carga, es decir, de las componentes C del spin isotópico, componentes que no son invariantes respecto de las rotaciones en el espacio~' r¡, (. Consideremos. por ejemplo, un sistema de dos nucleones. Su spin isotópico total puede tomar los valores T = 1 y T = O. Para T = 1 son posibles los valores Tt = 1,0, - 1 de la proyección Tt;. A estos valores corresponden, según (115.1), los valores de la carga 2, 1, O, es decir, el sistema con T = 1 se puede realizar como sistema pp, pn y nn. La parte de carga w de la función de onda con T = 1 es simétrica (de manera análoga a como al valor del spin S = 1 corresponde una función de spin simétrica, cf. § 62). Por ello al valor T = 1 corresponden estados con funciones de onda ordinarias, 'l/J, antisimétricas. Para T = Oes posible solamente el valor Tt = O y la correspondiente función de onda w es anti simétrica; a este caso corresponden, por consiguiente, los estados del sistema pn con funciones de onda 'l/J simétricas. Al spin isotópico corresponde el operador r que actúa sobre la variable de carga en la función de onda de manera análoga a como el operador de spin s actúa sobre la variable de spin a. Vista la analogía formal completa entre uno y otro, los operadores T6 11 se expresan por las mismas matrices de Pauli (55.6) que los operadores sx, sy, Sz. rt ,r ,-r, He aquí algunas combinaciones de estos operadores que poseen un simple sentido intuitivo. La suma es un operador que al ser aplicado a una función de onda característica de un neutrón la transforma en una función de onda de protón, y que al aplicarlo a una función de onda de protón, da como resultado el valor cero. Análogamente, el operador lnviiriancia isotópica 509 transforma un protón en neutrón y « destruye » al neutrón. Finalmente, el operador conserva una función de protón y destruye un neutrón: multiplicado por e, cabe llamarlo operador de carga del nucleón. Veamos aun cómo .es posible expresar, en función de los operadores 'TI, 'T2 del spin isotópico de dos partículas, el operador -¡,· que representa la permutación de una por otra. Por definición, el resultado de aplicarlo a la función de onda del sistema de dos partículas 1P(r1, a1 ; r2 , a2 ) consiste en la permutación de las coordenadas y de los spins de dichas partículas, es decir, en la permutación de las variables r1, a 1 y r2 , a2 entre sí. Los valores propios de este operador son iguales a ± 1 y resultan de la aplicación a una función 1P simétrica o anti simétrica: P,J,sim = if,&,m; P,J,ant = -,J,ant• Vimos antes que a las funciones V'sim (115.2) y V'ant corresponden funciones de carga wr con valores del spin isotópico total T = O y T = 1. Por ello, si queremos representar el operador P en una forma en la cual actúa sobre las variables de carga, dicho operador debe poseer las propiedades: Pwo = wo,Pw1 = -w1, (115.3) A estas condiciones satisface el operador 1-'Í\ como es fácil ver observando que ,A wr es la función propia del opendor T2 que corresponde al valor propio T(T + 1). Finalmente, haciendo T = r 1 +r2 y teniendo en cuenta que r¡2 y rl poseen los mismos valores determinados r(r+ 1) = !, encontramos la expresión 1P final buscada (1) p = 1-T2 = -t-2't"1.'t"2. (115.4) Para los elementos de matriz de las diferentes magnitudes físicas de un sistema de nucleones valen determinadas reglas de selección relativas al spin isotópico (L. A. RADICATI, 1952). Sea F una magnitud (de cualquier carácter tensorial) que posea la propiedad aditiva, en el sentido de que ..su valor para un sistema es igual a la suma de los valores correspondientes a cada uno de los nucleones por separado. Representemos el operador de una tal magnitud en la forma donde la suma se extiende a todos los protones y neutrones del sistema. Esta expresión se puede escribir de otra forma, que equivale idénticamente a la primera: 1 ( ) Un operador de este tipo, pero formado con los spins ordinarios de las partículas, lo encontramos ya en los problemas del § 62. Estructura del núcleo atómico 510 F = ~(!++,)fp+ ~(f-f,)Ín = p:. (/p+fn)+¿¡(/p-fn)+,, (115.5) donde la suma en cada término se extiende a todos los nucleones (tanto los protones como los neutrones). El primer término en (115.5) es un escalar, el segundo es la componente ( de un vector en el espacio isotópico. A ellos se aplican, por consiguiente, las mismas reglas de selección relativas al spin isotópíco que las que valen para los escalares y los vectores en el espacio ordinario respecto del momento cinético orbital. Por ejemplo (véase el § 29), un escalar isotópico admite solamente transiciones sin cambio de T; la componente ( de un vector isotópico posee elementos de matriz únicamente para las transiciones en las que liT = O, ± 1, resultando además prohibidas las transiciones con liT = O entre estados con Tr; = O, es decir, para sistemas con números iguales de neutrones y protones (la última regla se sigue de que el elemento de matriz de una transición con liT = O es proporcional a Tt - véase (29.7)). Así, para el momento di polar del núcleo, el papel de las magnitudes /p lo representan los productos er y fn = O. El primer término en (115.5) es entonces fe¿¡r = (e/2m) ¿¡mr, es decir, resulta proporcional al vector posición del centro de masas y se puede reducir a cero mediante una elección adecuada del origen de coordenadas; con otras palabras, el momento dipoJar del núcleo se reduce a la componente ( del vector isotópico. § 116. Fuerzas nucleares Las fuerzas nucleares específicas que actúan entre los nucleones se caracterizan, ante todo, por su pequeño radio de acción; dichas fuerzas disminuyen exponencialmente a distancias que son del orden de 1,5 · 10-13 cm. En el límite no relativista, cabe afirmar que las fuerzas nucleares no dependen de las velocidades de los nucleones y que derivan de un potencial. Sin embargo, no hay que perder de vista que para los núcleos reales la exactitud de la aproximación no relativista no es muy grande, ya que las velocidades de los nucleones en el núcleo son de] orden de t de la velocidad de la luz (véase más adelante). La energía potencial U de interacción de dos nucleones depende no solamente de su distancia mutua r, sino también de sus spins, y esta dependencia con relación a los spins no es en modo alguno pequeña (1). La dependencia exacta respecto de r (') En relación con esto, la interacción de los nucleones difiere esencialmente de la interacción de los electrones, para los que la interacción spin-spin es exclusivamente de origen relativista y resulta ser pequeña (en los átomos). Fuerzas nucleare.~ 511 se podría establecer, claro está, tan sólo mediante una teoría coherente de fas fuerzas nucleares. En cambio, el carácter de la dependencia respecto de los spins puede determinarse ya mediante simples consideraciones vinculadas con las propiedades de los operadores de spin. A nuestra disposición existen en total tres vectores de los que puede depender la energía de interacción U: el vector unitario n, correspondiente al vector posición definido por dos nucleones, y sus spins s1 y s2 • En virtud de las propiedades generales del operador de spin ! , toda función del mismo se reduce a una función lineal (§ 55). Además, hay que tener en cuenta que el producto n · s no es un escalar en sentido estricto, sino un pseudoescalas (ya que n es un vector polar y s un vector axil). Dadas estas circunstancias, es evidente que a partir de los tres vectores n, s1 , s2 se pueden formar en total dos cantidades escalares independientes: s1 • s2 y (n · s1) (n · s2), lineales respecto de cada uno de los spins. Por consiguiente, en relación con su dependencia de los spins, el operador de interacción de dos nucleones puede representarse como suma de tres términos independientes: (116.1) de los cuales uno no depende de los spins, pero sí los otros dos. El tercer término se ha escrito aquí de forma tal que se reduzca a cero al promediar respecto de las direcciones n; las fuerzas caracterizadas por este término se suelen calificar de tensoriales. Hemos afectado a la interacción (116.1) del índice «ordinaria» para subrayar el hecho de que este operador no cambia el estado de carga de los nucleones. Junto a esta interacción, cabe admitir otra, como consecuencia de la cual el protón se transforma en neutrón y recíprocamente. El operador de esta interacción « de intercambio» difiere formalmente del operador (116.1) en la existencia en él del operador (115.4) de permutación de las partículas: Ü camb= {U4(r)+ U5(r)(s1.s2)+ U6(r)[3(s1.n)(s2.n)-s1.S2]}P. (116.2) El operador total de interacción viene dado por la suma Ú = Úord + Úcamb• (116.3) De esta manera la interacción entre dos nucleones viene caracterizada por seis funciones distintas de la distancia entre uno y otro. Todos estos términos son, en general, del mismo orden de magnitud. Los operadores de spin que aparecen en (116.1) y en (116.2) se pueden expresar en función del operador de spin total S. En efecto, elevando al cuadrado las igualdades = s1 + s2 y S.n =s1.n+ s2.n y teniendo en cuenta que s: = s! = !, (s1.n) 2 = (s 2.n)2 = l (véase (55.10-11)), encontramos: s 512 Estructura del núcleo atómico (116.4) El operador S2 conmuta con el operador S, por lo que las interacciones definidas por los dos primeros términos de (116.1) y (116.2) conservan el vector spin total del sistema. En cambio, la interacción tensorial conserva, conforme vemos, el operador (S.n)2, que conmuta con el cuadrado S2, pero no con el propio vector S. Resulta así que sólo se conserva el valor absoluto del spin total, pero no su dirección. El spin total S del sistema de dos nucleones puede tomar los valores O y 1. Estos mismos valores puede tener su spin isotópico total T. Por lo tanto, todos los estados posibles de este sistema se clasifican en cuatro grupos, que difieren en los valores de los pares de números S, T. Para los estados de cada uno de estos grupos se tiene su correspondiente operador de interacción, de la forma A(r) (para S = O) o A(r) + B(r) [(S.n)2-i] (para S = 1), al que se reduce, en estos casos, el operador general (116.3) (véase el problema 1) (1). Para valores dados de S y T, los estados del sistema se clasifican de acuerdo con los valores del momento cinético total J y de la paridad. Conforme sabemos, al valor T = O corresponden estados con funciones de onda '1/J simétricas, y al valor T = 1, funciones antisimétricas. Dado que, por otra parte, el valor S determina la simetría de la función de onda respecto de la variable de spin (simetría para S = 1 y antisimetría para S = O), es claro que con dar el par de números S, T se determina también el carácter de simetría de la función de onda respecto de las variables espaciales, es decir, la paridad del estado. Es evidente que los estados del sistema con spin isotópico T = O pueden ser tan sólo tripletes pares (S = 1) o singletes impares (S = O); en cambio, los estados del sistema con spin isotópico T = 1 son tripletes impares o singletes pares. Dado que el spin, en tanto que vector, no se conserva, tampoco tiene porqué conservarse, en general, el momento cinético orbital (solamente se conserva la suma J = L+S). De todas maneras, puede ocurrir que se conserve el valor absoluto L, simplemente debido a que los valores dados de J, S y de la paridad (o bien, J, S y T) pueden ser compatibles tan sólo con un determinado valor de L (recordemos que la paridad del sistema de dos partículas es (- 1)1·). Así, un estado impar con S = 1, J = 1 puede tener solamente el valor L = l. es decir, es un estado 3 P 1 • En 1 ( ) Los datos experimentales acerca de las propiedades del deuterón prueban que, para T = O y S = l, la interacción de los nucleones contiene una fuerte atracción asociada con un profundo « pozo de potencial » (la existencia de fuerzas tensoriales complica la expresión de este hecho en forma de propiedades de las funciones A(r), B(r)); además, cabe afirmar (partiendo del signo observado del momento cuadripolar del deuterón) que en este estado el coeficiente B(r) de las fuerzas tensoriales es negativo. De datos relativos a la dispersión de nucleones se deduce que también para T = 1 y S = O se tiene una atracción, pero más débil y que en particular, no conduce a un sistema estable formado por las dos partículas. Fuerzas nucleares 513 otros casos, en cambio, a los valores dados de J, S y de la paridad pueden corresponder dos valores diferentes de L, con lo cual L no se conserva. Por ejemplo, en un estado impar, con S = 1 y J = 2, puede ser L = 1 y L = 3, es decir, este estado es una superposición 3P 2 + 3 F2• Así, pues, llegamos a los siguientes estados posibles de] sistema de dos nucleones (el índice + indica la paridad): para T = 1: 3Po-, 3Pc,(3P2+ 8F2)-, 8F3-, ... ; para T = lS0+,1D2+,1G4+, ... ; O: (3S1+3D1)+, 3D2+, (3D3+ 8 G3)+, ... ; 1Pc, 1F3-, .... Las fuerzas nuc1eares son, en general, no aditivas. Esto significa que la interacción en un sistema formado por más de dos nuc1eones no se reduce a la suma de las interacciones de todos los pares de partículas entre sí. Sin embargo, parece ser que las interacciones ternarias, cuaternarias, etc., representan un papel relativamente sin importanciá comparadas con las binarias por lo que al estudiar las propiedades de los núc1eos compuestos cabe basarse, en buena medida, en las propiedades de las interacciones binarias. Los datos experimentales relativos a los núcleos indican que a medida que aumenta el número de partículas, A, e] sistema de nuc1eones comienza a comportarse como una « materia nuc1ear » macroscópica cuyo volumen y energía crecen proporcionalmente a A (salvo efectos vinculados con la interacción coulombiana de los protones y a la existencia de una superficie libre del núc1eo). La propiedad de las fuerzas nuc1eares con la que está ligado este fenómeno se llama propiedad de saturación. La existencia de esta propiedad impone ciertas limitaciones a las funciones U1, ... , U6 que determinan las interacciones binarias de los nucleones. Imaginemos que todas las partículas se concentran en un volumen cuyas dimensiones son del orden del radio de acción de las fuerzas nucleares; en tal caso todos los pares de partículas interactuarán entre sí. Si existiera entonces una configuración tal de nucleones (y una orientación tal de sus spins) en la que actuaran fuerzas atractivas entre todos los pares, la energía potencial de este sistema sería una cantidad negativa proporcional a A 2 • La energía cinética del mismo, en cambio, es una cantidad positiva proporcional a A 5 13 , es decir, de grado inferior respecto de A (1). Es claro que, en estas condiciones, el conjunto de un número suficientemente grande de nucleones se concentraría de hecho en un pequeño volumen independiente de A, es decir, (1) La densidad n a la que están concentradas las partículas en el volumen dado es proporcional a su número A, y la energía cinética de cada una de ellas es proporcional, a su vez, a n2 13 (cf. (70.1)). Por ello la energía cinética total es ,..._,A· A 2 3 • 514 Estructura del núcleo atómico no se formaría la materia nuclear. Por consiguiente, la condición de saturación de las fuerzas nucleares debe traducirse en condiciones que prohiben las configuraciones que llevan a una energía de interacción negativa proporcional a A2 (véase problema 2). La proporcionalidad del volumen de la materia nuclear al número de partículas se expresa por una relación de la forma (116.5) R = roA11a, que liga el radio del núcleo, R, con.el número de partículas en él, A. Los datos experimentales (1) conducen al valor r 0 = l,2· I0-13 cm. Determinemos el impulso límite de los nucleones en la materia nuclear (cf. § 70). El volumen del espacio de las fases correspondiente a las partículas que se encuentran en una unidad de volumen del espacio físico y que poseen impulsos p < p 0 , es igual a +rrp~/3. Dividiendo este volumen por (2TTñ)ª, obtenemos el número de «celdas» en cada una de las cuales se pueden encontrar, a la vez, dos protones y dos neutrones. Igualando el número de protones al número de neutrones, se obtiene: 4(+rr/3)(po/2Trñ)ª = A/V, (donde V es el volumen del núcleo). Substituyendo aquí (116.5), obtenemos: Po =(Jn-2A/2V)11ªñ = 1·3 x 10-14 g.cm/s. La energía correspondiente, pg/2mp, (mp es la masa de un nucleón), vale ,_, 30 Me V, y la velocidad p0 /mp ';;' c/4. PROBLEMAS 1. Hallar los operadores de interacción de dos nucleones en estados con valores determinados de S y T. Solución. Estos operadores, 6 sT, se obtienen a partir de la expresión general (116.1-3) teniendo en cuenta las relaciones (115.3) y (116.4): Üoo = U1-!U2+ U4-}U5, Úo1 = U1-!U2- U4+fU5, Ú10 = U1 +!U2+ U4+!U5+ +t(Ua+ U5)[3(S.n)2-2], Ún = U1 +iU2- U4-iU5+ +t(Ua- U5)[3(S.n)2-2]. (1) Nos referimos a datos acerca de la dispersión de electrones por núcleos. 515 El modelo de capa.~ 2. Hallar las condiciones de saturación de las fuerzas nucleares admitiendo que no existen fuerzas tensoriales; los radios de acción de los restantes tipos de fuerzas se suponen iguales. Solución. Consideremos ciertos casos límite (entre los que se encuentran todos los demás casos posibles) para el estado de un sistema de A nucleones y escribamos la condición de que la energía de interacción de un par « medio » de nucleones en este sistema sea positiva. Supongamos que el spin total y el spin isotópico del núcleo toman sus valores máximos posibles: Snuc = Tnuc = A/2 (todas las partículas del sistema son protones con spins paralelos). Para cada par de nucleones tenemos entonces S = T = 1 y obtenemos la condición: (1) Un > O. Supongamos ahora que Tnuc = A/2, O. Para cada par de nucleones es entonces T = 1, Sz. Esto último significa que un nucleón puede tener con igual probabilidad los valores Sz = ! y Sz = - ! ; en estas condiciones, las probabilidades de que un par de nucleones se encuentre en un estado con S = O o S = 1 son iguales, respectivamente, a i y ! (son proporcionales al número 2S + 1 de valores posibles de Sz). Por consiguiente, la condición de que la energía media del par sea positiva da: Snuc = y para cada nucleón es igual a cero el valor medio de ¡Uo1 + !Un>O. Análogamente, la consideración'de un estado con Tnuc = (2) O, Snuc = ¡U10+!Un>O. A/2, conduce a la condición: (3) En un estado con Tnuc = Snuc = O, la probabilidad de que un par de nucleones tenga S = T = l es igual a i · l, la probabilidad de que sea T = 1, S = O, es igual aj_· :i, etc. De aquí se deduce la condición: 9 3 1 -Un +-(U10+ Uo1)+-Uoo > O. 16 16 16 (4) Finalmente, supongamos que el sistema consta de A/2 protones y A/2 neutrones, siendo los spins de todos los protones paralelos entre sí y antiparalelos a los spins de todos los neutrones. Un nucleón puede resultar ser, con igual probabilidad, o un p o un n, es decir, puede tener TC = ¡\o r; = - J; la probabilidad de que un par de nucleones posea el valor T = O es igual a .t. En este caso, uno de los nucleones del par es un p, y el otro, un n; por lo tanto, se tendrá Sz = O. Este valor Sz puede obtenerse con igual probabilidad a partir de estados con S = O o S = l. Por consiguiente, las probabilidades de que un par de nucleones se encuentre en un estado con T = O y S = O, o T = O y S = 1 son iguales a A • 1 = A. Esta misma es la probabilidad de un estado con T = l, S = O, y los restantes -i corresponden al estado con T = S = l. Teniendo en cuenta todo esto, obtenemos la condición: i(Uoo+ Uo1 + U10)+!Un > O. (5) Las desigualdades (1) - ( 5) constituyen el sistema de condiciones buscado para la saturación de las fuerzas nucleares. § 117. El modelo de capas Muchas propiedades de los núcleos se pueden describir bien mediante el « modelo 516 Estructura del núcleo atómico de capas» que, en sus características fundamentales, es análogo a la descripción de la estructura del átomo formando capas electrónicas. En este modelo se considera que cada nucleón en el núcleo se mueve en un campo autoconsistente creado por el conjunto de todos los demás nucleones (dado el pequeño radio de acción de las fuerzas nucleares, este campo disminuye rápidamente fuera del volumen limitado por la « superficie » del núcleo). De acuerdo con esto, el estado del núcleo como un todo se describe dando los estados de los diferentes nucleones por separado. El campo autoconsistente es un campo central y el centro de simetría es, naturalmente, el centro de masas del núcleo. Sin embargo, en relación con esto surge la siguiente dificultad. En el método del campo autoconsistente, la función de onda del sistema se construye como producto de funciones de onda de las partículas individuales (o bien, cuando así deba ser, por una suma simetrizada de productos). Pero una tal función no garantiza la inmovilidad del centro de masas: aunque el valor medio de la velocidad de éste, calculado mediante aquella función, sea igual a cero, esta misma función de onda conduce a probabilidades no nulas para valores de dicha velocidad distintos de cero (1). Se puede soslayar esta dificultad eliminando previamente el mov1m1ento del centro de masas al calcular cualquier magnitud física mediante las funciones de onda 'l/J(r1, ... , rA) del método del campo autoconsistente. Sea/(r¡, p¡) una cualquiera de estas magnitudes físicas, función de las coordenadas y de los impulsos de los nucleones. Al calcular sus elementos de matriz mediante las funciones 'l/J, hay que efectuar en los argumentos de la función f, sin modificar 1p(r¡), la substitución: (117.1) donde R es el vector posición del centro de masas del núcleo, A es el número de partículas que contiene y P es el impulso de su movimiento como un todo (la segunda de las substituciones (117.1), de acuerdo con v¡ ~ v¡ - V, equivale a restar de la velocidad de los nucleones la velocidad del centro de masas V, con la que está ligado el impulso P por la relación P = Am1)V) (2). Así, el operador momento di polar del núcleo es d = e l:rp, donde la suma se extiende a todos los protones del mismo. Para calcular los elementos de matriz en el método del campo autoconsistente, este operador debe substituirse, en cambio, por el operador el:(r,) - R). Las coordenadas del centro de masas del núcleo son R 1 = -(~rp+ 1:rn), A P n 1 •• ( ) En el caso de los electrones de un átomo no se plantea en general esta dificultad. ya que la inmovilidad del centro de masas queda garantizada automáticamente por su coincidencia con la posición del núcleo pesado inmóvil. 2 ( ) Una justificación rigurosa de este método se da en el artículo de Plry. Rer., 108, 482, 1957. S. GAR IENHAUS, C. ScHWAR rz, El modelo de capas 517 (la suma se extiende a todos los protones y neutrones). Dado que el número de protones en el núcleo es Z, el operador del momento dipolar debe substituirse, en definitiva, de acuerdo con: (117.2) Los protones intervienen aquí con una « carga efectiva» e(l -- Z/ A) y los neutrones, con una «carga» - eZ/A. Obsérvese que el orden de magnitud relativo de los términos correctivos que resultan en el cáiculo del momento dipolar es del orden de ,...., 1, conforme se ve en (117.2). En cambio, las correcciones en el cálculo de los momentos magnéticos y de los siguientes momentos multipolares eléctricos resultan ser, como se ve fácilmente, de un orden relativo ,_, 1/A. En la aproximación no relativista la interacción de un nucleón con el campo autoconsistente no depende del spin del nucleón: esta dependencia podría expresarse solamente mediante un término proporcional a s. n, donde n es el vector unitario correspondiente al vector posición r del nucleón; pero este producto no es un escalar, sino un pseudoescalar. La dependencia de la energía de un nucleón respecto de su spin se manifiesta, sin embargo, al tener en cuenta los términos relativistas que dependen de la velocidad de la partícula. El mayor de ellos es un término proporcional a la primera potencia de la velocidad. A partir de los tres vectores s, n y v se puede construir un escalar en sentido estricto: (n x v) · s. Por ello, el operador del acoplamiento spin-órbita del nucleón en un núcleo tiene la forma: Vsz = -c/>(r)nxv.s, (117.3) donde cp(r) es una cierta función de r. Dado que mir x v) es el momento cinético orbital ñl2 de Ja partícula, la expresión (117.3) se puede escribir también en la forma: Vsz = - J(r)i.s, (117.4) donde f = ltcp/rmp. Hay que subrayar que esta interacción es de primer orden respecto de v/c, mientras que el acoplamiento spin-órbita del electrón en un átomo es un efecto de segundo orden (§ 72); esta diferencia procede de que las fuerzas nucleares dependen del spin ya en la aproximación no relativista, mientras que la interacción no relativista de los electrones (las fuerzas coulombianas) no depende de los spins. La energía de la interacción spin-órbita está concentrada esencialmente en la vecindad inmediata de la superficie del núcleo, es decir, la función f(r) decrece a medida que se penetra en el mismo. En efecto, en la materia nuclear ilimitada una interacción de ese tipo no podría existir, como es claro sin más que tener en cuenta 518 Estructura del núcleo atómico que, en virtud del carácter homogéneo de un tal sistema, no existe en él ninguna dirección privilegiada a la que se pudiera asociar el vector n. La interacción (117.4) conduce al desdoblamiento del nivel de un nucleón con momento cinético orbital l en dos niveles con momentos cinéticos j = l ± ! . Dado que 1.s = }l paraj = Z+t, = -!(l+l) paraj = (117.5) l-l (según la fórmula (31.2))., el valor de este desdoblamiento será b.E = Ez-1 -Ez+¡ = f(r)(l+!). (117.6) La experiencia prueba que el nivel con j = l+! (vectores I y s paralelos) resulta ser más bajo que el nivel con j = l - i; esto significa que la función f(r) > O. El promedio de la función/(r) en (117.6) se efectúa con relación a la parte radial de la función de onda del nucleón. Dado que f(r) disminuye rápidamente al penetrar en el núcleo, la contribución principal ajviene dada por la región cerca de la superficie de aquél. La cantidad f(R) es inversamente proporcional al radio del núcleo R (el factor 1/R, que aparece al pasar de (117.3) a (117.4)) y otro factor 1/R en/resulta como contribución del volumen del núcleo que se encuentra en una capa cerca de su superficie. Al mismo tiempo, el valor del desdoblamiento (117.6) crece al aumentar/, y ello no solamente debido al factor l +}, sino también debido a que aumenta la probabilidad de encontrar el nucleón cerca de la superficie del núcleo. El acoplamiento spin-órbita de un nucleón en el núcleo es relativamente débil comparado con su interacción con el campo autoconsistente. Al mismo tiempo resulta ser, en general, grande comparado con la energía de la interacción directa de dos nucleones en el núcleo, debido a que esta última decrece más rápidamente al aumentar el peso atómico. Esa relación entre las energías de las diferentes interacciones conduce a que la clasificación de los niveles nucleares debe efectuarse según el tipo de acoplamiento-jj (1): los momentos cinéticos orbitales y de spin de cada nucleón se componen para formar los momentos cinéticos totales j = l +s, que resultan ser magnitudes determinadas dado que el acoplamiento entre I y s no se' rompe por la interacción directa de las partículas entre sí. los vectores j de los nucleones individuales se combinan luego para formar el momento cinético total del núcleo J (que con fre(1) Este hecho fue establecido, basándose en el análisis de datos experimentales, por M. 1949) y O. HAXFL, J. J~:-.;srn y H. St:rss ( 1949). MAYFR ( Gi'>PPFR r- El modelo de capas 519 cuencia se llama, simplemente, spin nuclear, como si el núcleo fuera una partícula elemental). Debido a esto la clasificación de los niveles nucleares difiere esencialmente de la clasificación de ]os niveles atómicos: en una capa electrónica de un átomo e] acoplamiento relativista spin-órbita es, en general, pequeño comparado con las interacciones eléctricas directas y las interacciones de intercambio, por lo cual la clasificación de los niveles se efectúa, de ordinario, de acuerdo con un acoplamiento del tipo LS. El estado de cada nucleón en un núcleo se caracteriza por su momento cinético j y su paridad. Aunque cada uno de sus vectores l y s. no se conserva por separado, el valor absoluto del momento cinético orbital del nucleón resulta, con todo, estar determinado. En efecto, el momento cinético j puede proceder bien de un estado con l = j - ! , bien de un estado con l = j+ . Para un valor dado j (semientero) estos dos estados tienen diferente paridad, (- 1)1, y, por consiguiente, al dar j y la paridad queda determinado también el número cuántico l. Los estados de los nucleones con iguales valores de l y j se suelen numerar (en orden creciente de la energía) por un« número cuántico principal» n que toma valores enteros a partir del valor 1 (1). Los diferentes estados se designan por los símbolos Is , Ip , lp 312 , etc., donde el número delante de una letra es el número cuántico principal, las letras s, p, d, ... indican, como de ordinario, el valor del, y el subíndice en cada letra, el valor de j. En un estado con valores dados de n, l y j pueden encontrarse simultáneamente no más de ~¡ + 1 neutrones y otros tantos protones. Las características del estado de un núcleo en conjunto (para una configuración dada) se suelen representar en forma de un número, que da el valor de J, con un índice + o - que indica la paridad del estado (esta úftima se determina, en el modelo de capas, por el carácter par o impar de la suma algebraica de los valores l de todos los nucleones). Como resultado del análisis de datos experimentales acerca de las propiedades de los núcleos, es posible establecer toda una serie de leyes relativas a la distribución de los niveles nucleares. Se observa, ante todo, que la energía de los niveles de un nucleón crece al aumentar el momento cinético orbital l. Esta regla está ligada con el hecho de que, al aumentar /, crece la energía centrífuga de la partícula, con lo que disminuye su energía de enlace. (1) Lo que ct1tiere del convenio que se adopta para los niveles electrónicos en un átomo, convenio según el cual el número n toma sus valores a partir de I + 1. 520 Estructura del núcleo atómico Además, para un valor dado/, el nivel conj = l+! (es decir, el que corresponde a vectores I y s paralelos) es más bajo que el nivel conj = l - !. Esta regla se señaló ya antes al tratar de las propiedades del acoplamiento spin-órbita del nucleón en el núcleo. La siguiente regla se refiere al spin isotópico de los núcleos. Recordemos que la proyección Tt del spin isotópico queda ya determinada por el peso y el número atómicos del núcleo (véase (115.1)). Para un valor dado Tt,, el valor absoluto del spin isotópico puede tomar valores cualesquiera que satisfagan la desigualdad T > 1Tt,I· Al estado fundamental de un núcleo resulta corresponder precisamente el menor de estos valores admisibles del spin isotópico, es decir, Trun= 1 T,I =t(N-Z). (117.7) Esta regla se aplica, naturalmente, a núcleos no demasiado pesados, en !os que el papel de la interacción coulombiana no es todavía muy importante, con lo que no se viola la conservación del spin isotópico, y está ligada con la propiedad de la interacción neutrón-protón en virtud de la cual en el sistema np el estado con spin isotópico T = O (estado de deuterón) tiene una energía de enlace mayor que el estado con T = 1 (véase la nota en la pág.512). Cabe también formular algunas reglas relativas a los spins de los estados fundamentales de los núcleos. Estas reglas determinan cómo se componen los momentos cinéticos j de los nucleones individuales para formar el spin total del núc1eo. En ellas se traduce la aparición de una tendencia de los protones y de los neutrones, que se encuentran en el núcleo en estados iguales, a «aparearse» (pares pp y nn) con momentos cinéticos opuestos entre sí (la energía de enlace de estos pares es del orden de 1-2 MeV). Este fenómeno conduce, por ejemplo, a que si el núcleo contiene un número par de protones y de neutrones (núcleos « par-pares »), los momentos cinéticos de todos los nucleones se compensan dos a dos, de modo que el momento cinético total del núcleo se anula. Si, en cambio, el núcleo contiene un número impar de neutrones o de protones, encontrándose todos los nucleones, por encima de las capas completas, en los mismos estados, el momento cinético total del núcleo coincide de ordinario con el momento cinético de un nucleón; todo ocurre como si después del « apareamiento » de todos los pares posibles de neutrones y protones, quedara tan sólo un nucleón con momento cinético no compensado (los momentos cinéticos totales de las capas completas son, por el contrario, iguales a cero automáticamente. Finalmente, si tanto Z como N son impares, encontrándose como antes todos los nucleones exteriores a las capas completas en un mismo estado, de ordinario J 521 El modelo de capas es igual al doble del momento cinético de un nucleón; todo ocurre como si, después de todos los apareamientos, quedaran un protón y un neutrón cuyos momentos cinéticos fueran paralelos entre sí, de tal manera que, en virtud de las propiedades de las fuerzas nucleares (véase la nota de la pág. 512), se aumente la energía de enlace respecto del caso en que sus momentos cinéticos son antiparalelos. El estudio de la marcha concreta del proceso de formación de las capas en los núcleos exigiría un análisis detallado de los datos experimentales que se poseen, y escapa a los limites de este libro. Nos limitaremos aquí solamente a algunas indicaciones de carácter general. Al estudiar las propiedades de los átomos vimos que, en elJos, los estados electrónicos se pueden descomponer en grupos tales que cuando se llena uno de estos grupos y se pasa al siguiente, la energía de enlace del electrón disminuye. Una situación análoga se da en los núcleos, distribuyéndose los estados nucleónicos formando los siguientes grupos (1): nucleones \ ls1¡2 2 lp3¡2, lPi;2 6 lds,2, ld3¡2, 2s1;2, lj7¡2 20 2p3¡2, lfs12, 2Pi;2, lg9¡2 22 2d5¡2, lg7¡2, lh11¡2, 2d3¡2, 3s1¡2 32 2h12, lh9¡2, 2i13¡2, 2/5¡2, 3p3¡2, 3Pi;2 44 l I (117.8) 1 j Para cada grupo se da el número total de puestos de protones o de neutrones. De acuerdo con este número, uno cualquiera de los grupos queda completo cuando el número total de protones Z o de neutrones N en el núcleo es igual a uno de los siguientes números: 2. 8, 28, 50, 82,126. Estos números se suelen calificar de mágicos (2~. Los diferentes estados en cada uno de los grupos (117.8) se han ordenado siguiendo más o menos el orden en que sucesivamente se ocupan en la serie de los núcleos. En realidad, sin embargo, en la marcha de este proceso se observan grandes (1) 2 ( ) Los estadoslf7 12 , con sus 8 puestos, se separan a veces formando con ellos un grupo aparte. Los llamados núcleos doblemente mágicos, en los cuales tanto Z como N son números mágicos, poseen una particular estabilidad (por ejemplo,(1He:, aO!ª, 82 Pb:~!)Comparados con los núcleos vecinos, su afinidad para añadir un nucleón (el núcleo He 4 es completamente incapaz de capturar ni tan sólo uno) es de una pequeñez anómala, y sus primeros estados excitados se encuentran muy por encima de lo normal. S22 E.~tructura del núcleo atómico irregularidades. Además, hay que tener en cuenta que en los núcleos pesados las distancias entre los diferentes niveles pueden resultar ser comparables con la « energía de apareamiento »; en estas condiciones, el propio concepto de estados individuales de los componentes de un par pierde buena parte de su sentido. He aquí algunas observaciones acerca del cálculo del momento magnético del núcleo en el modelo de capas. Al hablar de momento magnético de un núcleo nos referimos, naturalmente, al momento magnético promediado respecto del movimiento dt! las partículas en el mismo. Este momento magnético medio µ está dirigido, evidentemente, a lo largo del spin J del núcleo, cuya dirección es la única dirección privilegiada en él; por ello su operador es ~ = µogJ, (117.9) donde µ 0 es el magnetón nuclear y g el factor giromagnético. El valor propio de la proyección de este momento p,z = µ 0 gMJ. De ordinario (cf. (110.2)) se entiende por momento magnético µ del núcleo simplemente el valor máximo de su proyección, es decir, µ = µ&J; con esta notación: ~ = µ,j/J. (117.10) El momento magnético del núcleo es el resultante de los momentos magnéticos de los nucleones que se encuentran fuera de las capas completas, ya que los momentos de los nucleones en estas últimas se compensan entre sí. Cada nucleón crea en el núcleo un momento magnético que se compone de dos partes: la de spin y (en el caso del protón) la orbital, es decir, se presenta como suma gsi+ gzi. (Aquí y en lo que sigue prescindimos del factor µ 0 , suponiendo, como se hace de ordinario, que los momentos magnéticos se miden tomando como unidad el magnetón nuclear.) Los factores giromagnéticos de spin y orbital son: g 1 = 1, gs = 5,586 para el protón y g 1 = O, gs = - 3,826 para el neutrón. Después de promediar respecto del movimiento del nucleón en el núcleo, su momento magnético resulta ser proporcional a j; escribiéndolo en la forma g;j, tenemos: gJj = gsi+gzl = !(gz+gs)J +t(gz-gs)(i-i). Multiplicando los dos miembros de esta igualdad por j medios, se obtiene: = i+ § y pasando a gJi(j+ 1) =i(gz+gs)j(j+ l)+!(gz-gs)[l(l+ l)-s(s+ 1)], valores 523 El modelo de capas y haciendo aquí s = t, j = l ± t, encontramos: (117.11) Con los valores antes indicados de los factores giromagnéticos, esta fórmula da para el momento magnético del protón µp = g¡j: µp JLp 2·29) j paraj = l-i, = ( 1- -.,+1 (117.12) paraj = l+i, paraj = 1-i, paraj = Z+t. = j+2·29 y para el momento magnético del neutrón: 1·91 /Ln =-.-j J+l JLn = -1·91 (117.13) Si fuera de las capas completas se tiene tan sólo un nucleón, las fórmulas (117.12) o (117.13) dan directamente el momento magnético del núcleo. Para dos nucleones, la composición de sus momentos magnéticos también se efectúa de manera elemental (véase problema 1). En el caso de un número mayor de nucleones, el promedio del momento magnético debe efectuarse mediante la función de onda del sistema, construida de acuerdo con las reglas a partir de las funciones de onda individuaJes de los nucleones. El dar la configuración nucleónica y el estado del núcleo como un todo, permite efectuar dicho promedio de manera unívoca en aquellos casos en los que a la configuración dada puede corresponder únicamente un estado del sistema con los valores dados de J y T (véase, por ejemplo, el problema 3); en caso contrario, el estado del núcleo es una « mezcla » de varios estados independientes (con valores iguales de J, T), y, en general, se desconocen los coeficientes de la combinación lineal que da la función de onda del núcleo. Indicaremos, finalmente, que la existencia del acoplamiento spin-órbita de los nucleones en el núcleo determina la aparición de un momento magnético adicional (respecto al (117.9)) en los protones que se encuentran en él (M. GOPPERT-MAYER, J. .TENSEN, 1952). En efecto, cuando el operador de interacción depende explícitamente de la velocidad de la partícula, la transición al caso en que existe un campo exterior se realiza substituyendo el operador de impulso por otro operador, de acuerdo con p p- ~ A. Efectuando esta substitución en (117.3) y utilizando la expresión (110.6) para el potencial vector, encontramos que en el hamiltoniano del protón aparece un término adicional 524 Estructura del núcleo atómico e e cf,(r)-n XA.s = f(r)-r X(.Ye Xr).s Zen cmp = e f(r)-r X (s X r) ..Jfl'. Zen Este término equivale a la aparición de un momento magnético adicional cuyo operador es e ílad = - -f(r)r X (s X r) Zen e = - -r2f(r){s-(i.n)n}. 2eli (117.14) PROBLEMAS l. Determinar el momento magnético de un sistema de dos nucleones (con momento cinético total J = j 1 +j 2), expresándolo en función de los momentos magnéticos µ 1 y µ 2 de cada uno de los nucleones. Solución. Análogamente a como se dedujo la fórmula (117.11), obtenemos: !:_ = 1.(µ1 + µ2) +1.(µ1 _ µ2)(ji-h)(j1 +h+ 1). 2 2 1 ji h j¡ h 1( 1 + 1) 2. Hallar los estados posibles del sistem:i de tres nucleones con momento cinético j (e iguales números cuánticos principales). = 3/2 Solución. Procederemos de manera análoga a como se hizo en el § 67 para hallar los estados posibles de un sistema de electrones equivalentes. Cada nucleón puede encontrarse en uno de ocho estados con los siguientes pares de valores de los números (mi, Te): (3/2, 1/2), (1/2, 1/2), (-1/2, 1/2), (-3/2, 1/2), (3/2, -1/2), (1/2, -1/2), ( -1/2, -1/2), (-3/2, -1/2). Combinando estos estados en ternas distintas, encontramos los siguientes pares de valores (MJ, TrJ del sistema de tres nucleones: (7/2, 1/2), 2(5/2, 1/2), (3/2, 3/2), 4(3/2, 1/2), (1/2, 3/2), 5(1/2, 1/2). (el número delante de los paréntesis indica el número de estados correspondientes; no es necesario escribir los estados con valores negativos de MJ, Te). A ellos corresponden estados del sistema con los siguientes valores de los números (J, T): (7/2, 1/2), (5/2, 1/2), (3/2, 3/2), (3/2, 1/2), (1/2, 1/2). 3. Determinar el momento magnético del estado fundamental de una configuración de dos neutrones y un protón en los estados p3, 2 (con iguales valores n) teniendo en cuenta la invariancia isotópica (1). Solución. El estado fundamental de esta configuración tiene el valor J = 3/2, y en virtud de la regla indicada en el texto su spin isotópico toma el menor de los valores posibles, T = Te = ! . (') Una tal configuración la presenta (por encima de la capa completa ( 1s,n) 4 ) el núcleo Li7. 525 El modelo de capas Determinemos la función de onda del sistema que corresponde al mayor valor posible MJ = 3/2. Este valor MJ se puede obtener (teniendo en cuenta las condiciones que impone el principio de PAuu para dos nucleones idénticos) mediante las siguientes ternas de valores m1 para los nucleones p, n, n, respectivamente: (3/2, 3/2, -3/2), (3/2, 1/2, -1/2), (1/2, 3/2, -1/2), (-1/2, 3/2, 1/2). Por ello la función de onda buscada ,¡;!¡."i_,J¡; es una combinación lineal de la forma '!"3/2,3/2 = a[ip3/2ifi3/2 ¡fi-3/2] + b[if;,312ifi1!2 .t.-1/2] + 1/2,1/2 112 -1/2 -1/2 1/2 _112'r-1/2 + c[if;3/2 if;112¡f;_-1/2] + d[,l,3/2 .1.1¡2 .t.-1/2] -1/2 1/2 -1/2 'r_112'r-112..,, 1/2' (1) donde [ ... ] significa el producto antisimétrico normalizado (es decir, un determinante de la forma (61.2)) de las funciones de onda individuales y,7:'~ de los nucleones. La función (1) debe anularse al aplicarle los operadores 3 y 1+= Ii+<il; i=l (cf. el problema del § 67). Los operadores 'T<O transforman la función de protón del i-ésimo nucleón en una función de neutrón (y reducen a cero una función de neutrón). Es fácil ver, por ello, que el operador T- reduce el primer término de (1) a un determinante con dos filas iguales, es decir, a cero, y los determinantes de los tres términos restantes pasan a ser iguales; obtenemos, por lo tanto, la condición b+c+d = O. Además, para el nucleón individual con momento cinético j (según (27 .12)): J+ifi312 = o, }+if;l/2 = y3ifi3!2, J+if;-1/2 = 3/2 y diferentes valores m1, tenemos = 2¡/il/2, J+¡fi-3/2 = y3¡fi-1/2. A partir de aquí se encuentra fácilmente que al aplicar el operador 1+ a la función (1) se obtiene: ] A 'Y3/2,3/2 = y3(a+b-c)[tf,.3!2ifi3/2 ¡f;_-1/2]+ + 1/2,1/2 1/2 -1/2 -1¡2 + 2(c- d)[·l.3/2 .1.1¡2.1.112 ] • 'r_112'r112'r -1/2 ' (el cambio de signo de algunos términos se debe a la permutación de filas del determinante). La condición de que esta expresión sea igual a cero nos da a+b-c = O, c-d = O. Junto con la condición de normalización de la función (1 ), las relaciones obtenidas conducen a a= 3/ylS, b = -2/ylS, e= d = 1/ylS. Teniendo en cuenta que el valor medio de la proyección del momento magnético del protón (o del neutrón) en un estado con valor dado de m1 es µpm1/j (o µnm¡/j), encontramos que el valor medio del momento del sistema, calculado mediante la función de onda ( 1), es igual a 526 Estructura del núcleo atómico P.= flz 9 4 1 15 15 15 = -µp+-µp+-(tµp+iµn)+ 1 4 1 +:-:{-iµp+-µn) = -(13¡Lp+2µn)15 3 15 Según las fórmulas (117.12), (117.13), vemos que para el nucleón en un estado P:i, 2 es µn = 3,79. En definitiva, pues, µ = 3,03. = - 1,91, l'P 4. Determinar el momento magnético de un núcleo en el que todos los nucleones situados fuera de las capas completas se encuentran en estados idénticos, siendo iguales los números de protones y de neutrones. Solución. Dado que para N = Z la proyección del spin isotópico es T~ parte escalar isotópica del operador n = O, solamente la P posee elementos de matriz diagonales (véase el final del § 115). Separando esta parte de acuerdo con la fórmula (115.6), encontramos que es igual a ¿J !(gn +gp) = !(gn +gp)j · n,p Por consiguiente, el momento magnético medio total del núcleo es igual a l (gn+gv)l. Calcular el momento magnético adicional de un nucleón con momento cinético j expresando aquél en función del valor del desdoblamiento spin-órbita (117.6) (M. GoPPERT-MAYER, 5. J. JENSEN, 1952). Solución. El promedio de la parte angular del operador (117.14) (la expresión entre corchetes en (117 .14); la designaremos por a) se efectúa mediante la fórmula obtenida en el problema 2, § 29, y da: a= s-(s.n)n 2 = ,. 38 - (s.i)i+i(s.i)-il(l+ l)s (21-1)(21+3) • (2) Por otra parte, después del promedio total respecto del niovim~nto del nucleón, el valor medio dea puede estar dirigido únicamente a lo largo de j, es decir, a = aJ; de aquí se sigue Q = •J /j2. Proyectando el vector (2) sobre j (teniendo en cuenta al hacerlo que el operador 1 conmuta con i), y pasando a los valores propios de las magnitudes 1 · s, 12, etc., obtenemos, después de un cálculo fácil, la siguiente expresión para el momento magnético adicional del nucleón (tomando como unidad el magnéton nuclear): a t. 2j+l +J(r)----¡¡- 2(j+ 1) _ _ mpR2 paraj = l±i, (3) Núcleos no esféricos 527 (mp es la masa del nucleón, R es el radio del núcleo; al promediar r 2f, el factor r 2 lo substituimos por R 2, teniendo en cuenta la rápida disminución de f(r) cuando disminuye r). El valor medio J en (3) se puede expresar en función del desdoblamiento spin-órbita de acuerdo con (117.6). § 118. Núcleos no esféricos Un sistema de partículas que se mueven en un campo central no puede tener un espectro energético de rotación; en mecánica cuántica, el concepto de rotación carece en absoluto de sentido para un tal sistema. Esto vale también para el modelo de capas del núcleo con un campo central autoconsistente que hemos estudiado en el párrafo anterior. La descomposición de la energía del sistema en una parte « interna » y otra de « rotación » no tiene, en general, un sentido riguroso en mecánica cuántica. Tan sólo es posible y puede tener un carácter aproximado en aquellos casos en que, por unas u otras causas físicass constituye una buena aproximación el considerar el sistema como un conjunto de partículas que se mueven en un campo dado que no posee simetría esférica. La estructura de rotación de los niveles aparece entonces como resultado de tener en cuenta la posibilidad de rotación de dicho campo respecto de un sistema de coordenadas fijo. Un caso de este tipo se consideró, por ejemplo, en las moléculas, cuyos términos electrónicos se pueden determinar como niveles de energía de un sistema de electrones que se mueven en el campo dado de los núcleos en reposo. Indica la experiencia que la mayor parte de los núcleos no poseen, de hecho, una estructura de rotación. Esto significa que una buena aproximación para ellos es el campo central autoconsistente, es decir, los núcleos presentan (salvo fluctuaciones cuánticas) una forma esférica. Sin embargo, existe también una categoría de núcleos que poseen un espectro energético del tipo de rotación (a ella corresponden núcleos cuyos pesos atómicos se encuentran en los intervalos 150 < A < 190 y A > 220). Esta propiedad suya significa que la aproximación del campo autoconsistente central es del todo inadecuada para ellos. El campo autoconsistente para estos núcleos debe buscarse, en principio, sin hacer ninguna hipótesis previa acerca del carácter de su simetría, a fin de que la forma del núcleo quede también determinada por la propia condición de autoconsistencia. La experiencia muestra que el modelo correcto para los núcleos de esta categoría resulta ser un campo autoconsistente que posee un eje de simetría y un plano de simetría perpendicular a este eje (es decir, un campo cuya simetría es la de un elipsoide de revolución) (1). El modelo de núcleos no esféricos ha sido l' J Al parecer, actualmente es todavía imposible llegar a conclusiones del todo seguras acerca de la existencia de núcleos no axiles, cuya simetría es la de un elipsoide de tres ejes (un modelo de tales núcleos ha sido desarrollado por A. S. DAvvoovl. 528 Estructura del núcleo atómico particularmente desarrollado en los trabajos de O. 1953). BoHR y B. MoTTELSON (1952, Hay que subrayar que se trata aquí de dos categorías de núcleos cualitativamente distintas. Esto se advierte, en particular, en que los núcleos o son esféricos, o son no esféricos, pero con un grado de « no esfericidad » en modo alguno pequeño. Entre estas dos categorías no existe una transición gradual. La aparición de la no esfericidad se ve favorecida por la existencia en el núcleo de capas no completas;. según parece, también el apareamiento de los nucleones representa un papel fundamental en dicho fenómeno. Por el contrario, el que las capas estén completas favorece el carácter esférico del núcleo. Es característico en este sentido el núcleo doblemente mágico 82 Pb 2º8 ; debido a que su configuración nucleónica se manifiesta fuertemente como cerrada, este núcleo (como también los núcleos vecinos del mismo) es esférico, lo que se traduce en una anomalía en la serie de núcleos pesados no esféricos. Los niveles de energía de un núcleo no esférico son suma de dos partes: de los niveles del núcleo « inmóvil » y de la energía de su rotación como un todo. En estas sumas los intervalos de la estructura de rotación de los niveles son pequeños comparados con las distancias entre los niveles del núcleo «inmóvil». La clasificación de los niveles de un núcleo no esférico es análoga, en muchos aspectos, a la clasificación de los niveles de una molécula diatómica (compuesta de átomos idénticos), dado que la simetría del campo en el que se mueven las partículas (nucleones o electrones) es la misma en ambos casos. Podemos por ello utilizar, sin más, los resultados obtenidos en el capítulo XI. Consideremos primero la clasificación de los estados del « núcleo inmóvil». En un campo con simetría axil, se conserva solamente la proyección del momento cinético sobre el eje de simetría. Por lo tanto, cada estado del núcleo se caracteriza, ante todo, por el valor n de la proyección de su momento cinético total (1), proyección que puede tener tanto valores enteros, como semienteros. Según sea el comportamiento de la función de onda respecto del cambio de signo de todas las coordenadas de los nucleones (referidas al centro del núcleo), los niveles se dividen en pares (g) e impares (u). Además, para n = O se distingue también entre estados positivos y negativos, según sea el comportamiento de la función de onda en las reflexiones en un plano 1 ( ) Por definición es Ü ;;i, O (de manera análoga al carácter positivo del número cuántico A en las moléculas diatómicas). Obsérvese que los valores negativos del número !) en el caso de las moléculas diatómicas podían aparecer tan sólo debido a que se definía como igual a la suma A+~. donde ~ podía ser tanto positivo como negativo (según sean los sentidos relativos del momento orbital y del spin). n Núcleo.-. no esféricos 529 que pase por el eje del núcleo (véase § 78). Los estados fundamentales de los núcleos no esféricos par-pares son estados número indica el valor de n), que corresponden a momento cinético nulo y a la más elevada simetría de la función de onda; esta circunstancia resulta del apareamiento de todos los neutrones y de todos los protones dos a dos. Si, en cambio, un núcleo contiene un número impar de _protones o de neutrones, se puede considerar en él el estado del nucleón « impar » en el campo autoconsistente del núcleo « residual » par-par. El valor n se determina en tal caso por la proyección w del momento cinético de dicho nudeón. Análogamente, en un núcleo impar-impar, el valor n se forma a partir de las proyecciones de los momentos cinéticos del neutrón impar y del protón impar (O= jwp - wnJ). ot (el Hay que subrayar, al mismo tiempo, que es imposible hablar de valores determinados de las proyecciones del momento cinético orbital y del spin del nucleón. Ello se debe a que, aunque el acoplamiento spin-órbita del nucleón es débil comparado con la energía de su interacción con el campo autoconsistente del núcleo residual, dicho acoplamiento, en general, no es pequeño respecto de las distancias entre los niveles energéticos vecinos del nucleón en dicho campo. Pero es precisamente esta última condición la que debería cumplirse para que fuera aplicable la teoría de perturbaciones que permitiría considerar, a su vez, con buena aproximación el momento cinético orbital y el spin del nucleón, por separado (1). Pasemos ahora a la estructura de rotación de un núcleo no esférico. Los intervalos de esta estructura son pequeños comparados con la interacción spin-órbita de los nucleones en el núcleo; esta situación corresponde al caso a de la teoría de las moléculas diatómicas (§ 83). Claro está, el momento cinético total del núcleo en rotación, J, se conserva. Para n, dado, su valor absoluto J toma valores a partir de n: J= o, 0+1,0+2, ... ; (118.1) (véase (83.2)). Una limitación adicional a los valores posibles de J se presenta para los núcleos con n = O: en los estados y o; el número J toma solamente valores valores impares (véase § 86). En particular, en los pares, y en los estados o; y niveles de rotación del término fundamental de los núcleos par-pares (Ot) e] número J toma los valores O, 2, 4, ... ot, ot La energía de rotación de un núcleo viene determinada por la fórmula /i2 Erot = -1(1+ 1), 21 (118.2) (1) En los núcleos esféricos esto resultaba posible, a pesar de todo, como consecuencia de la apli, cabilidad simultánea de la conservación de la paridad y del momento cinético. 530 Estructura del núcleo atómico donde I es el momento de inercia del núcleo (respecto de un eje perpendicular a su eje de simetría); esta fórmula corresponde a la expresión análoga en la teoría de las moléculas diatómicas (el término que depende de J en (83.6)). El nivel más bajo corresponde al más pequeño valor posible de J, es decir, a J = n. En virtud de (118.2), la estructura de rotación de los niveles se caracteriza por determinadas reglas de intervalos, reglas que no dependen (para n dado) de las demás características del nivel. Así, las componentes de la estructura de rotación del término fundamental de un núcleo par-par (con J = 2, 4, 6, 8, ... ) se encuentran a distancias del nivel más profundo (J = O) que están en las razones 1 : 3, 3 : 7 : 12 ... La fórmula (118.2), sin embargo, es insuficiente para los estados con n = t. que pueden presentarse en el caso de núcleos con un número impar de nucleones. En este caso aparece una contribución a la energía comparable con (118.2) debida a la interacción del nucleón impar con el campo centrífugo del núcleo en rotación. Su dependencia respecto de J se puede hallar de la siguiente manera. Como es sabido por la mecánica (1), la energía de una partícula en un sistema de coordenadas en rotación contiene un término adicional que es igual al producto de la velocidad angular de rotación por el momento del impulso de la partícula. El término correspondiente en el hamiltoniano de un núcleo se puede representar en la forma 2b:R.a, donde b es una constante, K es el momento de rotación del núcleo «residual» (el núcleo sin el último nucleón), y a es el momento cinético del nucleón. Hay que considerar aquí este último en un sentido puramente formal (en realidad, el vector momento cinético del nucleón no existe en el campo axil del núcleo), como un operador análogo al operador de spin l que permite las transiciones entre estados con valores de la proyección del momento ± l - en correspondencia con el valor n = l (2). Dado que únicamente nos interesa la dependencia de la energía del núcleo con relación a J, en vez de 2b:R.a podemos considerar el operador 2bj.o, - su diferencia es, simplemente, una constante aditiva que no depende de J (dado que J = K +a). Los valores propios de este operador son: 2bJ.a = b[J(J+ 1)-K(K+ l)+i]. Restando de aquí, por comodidad, la constante b/2, encontramos que esta cantidad es igual a ± b(J+O para J = K ± !. (1) Véase tomo I, Mecánica, § 39. (") La propiedad específica del caso O = ! radica precisamente en la existencia de elementos de ma· triz de la energía de perturbación para transiciones entre estados que difieren tan sólo en el signo de la proyección del momento cinético y que corresponden, por consiguiente, a un mismo valor de la energía. Esto conduce a un corrimiento de la energía que se manifiesta ya en el primer orden de aproximación de la teoría de perturbaciones. El fenómeno considerado es análogo a la duplicación.\ de los niveles de una molécula diatómica con = ~ (§ 88). n Núcleos no esféricos 531 Esta expresión se puede escribir en la forma ( -1 )J-i b(l +!)si se tiene en cuenta que el momento cinético K del «residuo» (que es un núcleo par-par) es un número par. De esta manera obtenemos finalmente la siguiente expresión para la energía de rotación de un núcleo con n = ! : /í2 Erot = -1(1+ 1)+(- l)J-1/2b(l+!) 21 (118.3) (A. BOHR, B. MoTTELSON, 1953). Obsérvese que si la constante b es positiva y suficientemente grande, el nivel con J = -i- puede resultar más bajo que el nivel con J = 1, es decir, puede quedar violado el orden normal de los niveles de rotación, orden en el que el nivel más bajo corresponde al menor valor posible de J. El momento de inercia de un núcleo no esférico no se puede calcular como momento de inercia de un sólido de forma dada. Un cálculo de este tipo sólo sería posible si se pudiera considerar que los nucleones, que se mueven en el campo autoconsistente del núcleo, no interactúan entre sí directamente. En realidad, sin embargo, el fenómeno del apareamiento conduce a que el momento de inercia disminuya (unas cuantas veces) respecto del valor que le correspondería si se tratara de un cuerpo sólido. El momento magnético p de un núcleo no esférico es la resultante del momento magnético del núcleo « inmóvil » y del momento vinculado a la rotación del núcleo. El primero (después de promediar respecto del movimiento de los nucleones en el núcleo) está dirigido a lo largo del eje del núcleo; designando el valor de este momento por µ' y el vector unitario correspondiente al eje del núcleo por n, escribiremos dicho momento en la forma 1t'n. En cambio, el momento magnético debido a la rotación está dirigido (después de efectuar el mismo promedio) a lo largo del vector J -- nn, es decir, del momento cinético total del núcleo después de restarle el momento de los nucleones en el « núcleo inmóvil» (1 ). De esta manera, µ. = µ'n+g,(J-Qn). (118.4) Aquí gr es el factor giromagnético de rotación del núcleo. Dado que, en la rotación, sólo contribuyen al momento magnético los protones, se tiene (118.5) donde / 11 e /p rnn las partes del mcmer.to de inercia del núcleo debidas a los neutrones y a ]os protones (para un sistema constituido únicamente por protones, debería ser, simplemente, gr = 1). La razón (118.5) no coincide, en general, con la razón Z / A del número de protones al peso total del núcleo. (1) Esta notación se puede aplicar solamente para O =I= 1 (véase el problema 2). 532 Estructura del núcleo atómico Después de promediar respecto de la rotación del núcleo, el momento magnético está dirigido en el sentido del vector J, que se conserva: ~ = µJ/1 = (µ' -Og,)ñ+grJ, Como de ordinario, multiplicaremos ambos miembros de esta igualdad por J y pasaremos a valores propios. En el estado fundamental del núcleo es n = J y obtenemos el resultado: (118.6) µ =(µ' +g,)1/(1+ 1). PROBLEMAS 1. Expresar el momento cuadripolar Q de un núcleo en rotación en función del momento cuadripolar Q0 respecto de ejes ligados al núcleo (A. BOHR, 1951 ). Solución. El operador del tensor momento cuadripolar del núcleo en rotación se expresa en función de Q0 mediante la fórmula es este un tensor simétrico de traza nula formado a partir de las componentes del vector unitario n asociado al eje del núcleo, siendo además Qzz = Q 0 • El promedio respecto del estado de rotación del núcleo se efectúa de manera análoga a como se procedió al resolver el problema (2) del § 29 (con la sola diferencia de que nd, = n, y no igual a cero) y conduce a una expresión de la forma (75.2) con Q= ºº 302-l(l+l) (21+3)(1+ 1)° Para el estado fundamental del núcleo con Q= ºº n J obtenemos: = (21-1)1 (21+3)(1+ 1). Cuando crece J, la razón Q/Q0 tiende a 1, pero de manera bastante lenta. 2. Determinar el momento magnético en el estado fundamental de un núcleo con n = !. Solución. En este caso, el operador del momento magnético se puede escribir en función del operador a introducido en el texto en la forma: A [A A A fJ. = 2µ a+g,K, K = J-a. - A El cálculo que sigue es análogo al efectuado en el texto. Si al nivel fundamental del núcleo corresponde el valor J = ! (siendo K = J - ! = O), se obtiene ,, = p'. Si, en cambio, en el estado fundamental es J = 3/2 (con lo que K = J +} = 2) será ,, = t g, -iit'. 3. Determinar las energías de los primeros niveles de la estructura de rotación del estado fundamental de un núcleo par-par cuya simetría es la de un elipsQide de tres ejes. 533 El corrimiento isotópico Solución. Al estado f undamenta1 de un núcleo par-par corresponde la función de onda más simétrica del núcleo «inmóvil», es decir, una función cuya simetría corresponde a la representación A del grupo D 2• Se tienen por ello en total J/2 + 1 (para J par) o (J - 1)/2 (para J impar) niveles diferentes para un valor dado de J. Para J = 2 dichos niveles vienen dados por la fórmula (7) obtenida en los problemas del § 103, y para J = 3, por la fórmula (8). § 119. El corrimiento isotópico Las propiedades específicas de un núcleo (masa finita, dimensiones, spin), que lo distinguen del centro puntual inmóvil de un campo coulombiano, son causa de una cierta influencia sobre los niveles de energía electrónicos de un átomo. Uno de estos efectos es el llamado corrimiento isotópico de los niveles - el cambio de la energía de un nivel al pasar de un isótopo de un elemento dado a otro. De hecho, claro está, interesa no el corrimiento de la energía de un nivel tan sólo, sino la variación de la diferencia entre dos niveles, diferencia que se observa en forma de raya espectral. Por esta razón, hay que considerar de hecho no la energía de toda la envoltura electrónica del átomo en conjunto, sino solamente aquella porción de la misma que está ligada con el electrón que toma parte en la transición espectral de que se trate. En los átomos ligeros, la fuente principal del corrimiento isotópico es el efecto debido al valor finito de la masa del núcleo. El tener en cuenta el movimiento de éste conduce a la aparición en el hamiltoniano del término 2~(¿),)' i donde Mes la masa del núcleo y Pi.los impulsos de los electrones (1). Por consiguiente, el corrimiento isotópico ligado con este efecto se encuentra como valor medio (119.1) calculado respecto de la función de onda del estado dado del átomo (M1, M 2 son las masas de los núcleos de los isótopos). 1 ( ) En el sistema del centro de masas del átomo, la suma de los impulsos del núcleo y de los electrones es igual a cero: Pnuc + ~Pi = O. Por lo tanto, su energía cinética total será 2 ¿Pi 2m -Pnuc - - + -12M i (IPt) +-1 Pi 2M 2m 2 2 12 =- i 2 • 534 Estructura del núcleo atómico En los átomos pesados, la contribución principal al corrimiento isotópico resulta de la extensión del núcleo. Este efecto se observa prácticamente tan sólo para el nivel de un electrón exterior que se encuentre en un estado s, ya que la función de onda de un estado de este tipo (en contraposición a las funciones de onda de los estados con l =f=- O) no se anula parar~ O y, por ello, la probabilidad de encontrar un electrón en el « volumen del núcleo» es relativamente grande. Calculemos el corrimiento isotópico para este caso (1). Sea cp(r) eJ potencial electrostático verdadero del campo del núcleo, potencial que difiere del potencial coulombiano Ze/r del campo de una carga puntual Ze. El cambio de la energía del electrón respecto de su valor en el campo puramente coulombiano Ze/r viene dado por f ó.E = -e (cf>-Ze/r)¡f;2(r)dV, (119.2) donde 1P(r) es la función de onda del electrón (en un estados esta función presenta simetría esférica y es real). Aunque la integración se extiende aquí formalmente a todo el espacio, la diferencia </>- Ze/r que aparece en el integrando es de hecho no nula tan sólo dentro del volumen del núcleo. Por otra parte, la función de onda de un estado s tiende a un límite constante para r-+ O (véase § 32), alcanzándose este valor prácticamente ya en el límite del núcleo. Por consiguiente, podemos sacar 1P2 fuera del signo de integración, substituyendo 1P(r) por su valor para r = O calculado para el campo coulombiano de una carga puntual. Para seguir reduciendo la integra) utilizaremos la identidad !J.r 2 mos (119 .2) en la forma = 6 y escribire- f ó.E = -iei/;2 (0) (<f>-Ze/r)L':,r 2 .dV = -!eif;2(0) fr21':,(cp-Ze/r)dV; (al transformar la integra) de volumen se ha tenido en cuenta que la integra), extendida a una superficie situada en el infinito, que entonces aparece es igual a cero). Pero l':,(1/r) = - 4nó(r) y r 2ó(r) = O para todo r. Por otra parte, según la ecuación de Poisson, L</> = - 4ne, donde, en el presente caso, e es la densidad de distribución de carga eléctrica en el núcleo. Obtenemos así en definitiva: (119.3) !1) El cálculo que se presenta a continuación, y en el que no se tienen en cuenta los efectos relativistas sobre el movimiento del electrón cerca del núcleo, es correcto, como se puede demostrar, si se cumple la condición Ze2/Tíc ~ 1 535 Estructura hiper/ina de los niveles atómicos donde ~ = (1/Ze) f pr2dV es el radio cuadrático medio del núcleo con relación a los protones (para una distribución homogénea de protones en el núcleo, sería ~ = 3R2/S, donde R es el radio geométrico del mismo). El corrimiento isotópico de un nivel viene determinado por la diferencia de las expresiones (119.3) para los dos isótopos. En el § 71 se estimó el valor de la cantidad 1P(O) y se probó que depende del número atómico como (supuesto Z grande). Por ello, la magnitud del desdoblamiento (119.3) resulta proporcional a Z2. VZ § 120. Estructura hiperfina de los niveles atómicos Otro efecto atómico debido a las propiedades específicas del núcleo es el desdoblamiento de ]os niveles atómicos de energía que resulta de Ja interacción de los electrones con el spin del núcleo - la llamada estructura hiperfina de los niveles. Dado que dicha interacción es débil, los intervalos de esta estructura son muy pequeños, en particular respecto de los intervalos de estructura fina. Por ello, la estructura hiperfina debe considerarse para cada una de las componentes de estructura fina por separado. Designaremos en este párrafo el spin del núcleo (de acuerdo con Jo que se suele hacer en Ja espectroscopia atómica) por i, conservando el símbolo J para e] momento cinético total de las capas electrónicas del átomo. El momento cinético total del átomo (incluido el nuclear) lo representaremos por F = J +i. Cada componente de estructura hiperfina se caracteriza por un valor determinado del módulo de este momento. De acuerdo con ]as reglas generales de composición de momentos, el número cuántico F toma los valores F = J+i, J+i-1, ... , 1 J-il, (120.1) de modo que cada nivel, con un valor dado de J, se desdobla en total en 2i + 1 (si i < J) o 21 + 1 (si i > J) componentes. Dado que las distancias medias r de los electrones en el átomo son grandes comparadas con el radio R del núcleo, el papel principal en el desdoblamiento hiperfino lo representa la interacción de los electrones con los momentos multipolares del núcleo de órdenes más bajos. Estos son el momento dipolar magnético y el momento cuadripolar eléctrico (el momento dipolar medio es igual a cero, véase § 75). El orden de magnitud del momento magnético del núcleo µnuc r-..1 e Rvnuc/ e, 536 Estructura del núcleo atómico donde Vnuc son las velocidades de los nucleones en el mismo. Su energía de interacción con el momento magnético de un electrón(µe1 ,...._, eh/mc)es del orden de magnitud de (120.2) El momento cuadripolar del núcleo es Q ,._, e R 2 ; la energía de interacción del campo creado por él con la carga del electrón es del orden de eQ /r3"' e2R2 Jr3. (120.3) Comparando (120.2) y (120.3), vemos que la interacción magnética (y, por ello, también el desdoblamiento de los niveles provocado por la misma) es (vnuc/c) (h/mcR) ,._, 15 veces mayor que la interacción cuadripolar; aunque la razón Vnuc/c es relativamente pequeña, en cambio la razón ñ/mcR es grande. El operador de interacción magnética de los electrones con el núcleo tiene la forma viJ =ai.J (120.4) (análogamente a la interacción spin-órbita de los electrones (72.4)). La dependencia, respecto de F, del desdoblamiento de los niveles determinado por la misma viene dada, por consiguiente, por la expresión !aF(F+l); (120.5) (cf. (72.5)). El operador de interacción cuadripolar de los electrones con el núcleo se forma a partir del operador Qik del tensor momento cuadripolar del núcleo y de las componentes del vector J del momento cinético de los electrones. Dicho operador es proporcional al escalar QikJ,,,Jk formado con estos operadores, es decir, tiene la forma (120.6) se ha tenido en cuenta aquí que Qik se expresa en función del operador de spin del núcleo por una fórmula del tipo (75.2). Calculando los valores propios del operador (102.6) (de manera por completo análoga a como se efectuaron los cálculos del problema 1, § 84), encontramos que el desdoblamiento hiperfino cuadripolar de los niveles depende del número cuántico F de acuerdo con la expresión: }bF2(F+ 1)2+ibF(F+ 1)(1-21(1+ 1)-2Í(i+ 1)]. (120.7) El efecto del desdoblamiento hiperfino magnético se observa sobre todo para los niveles ligadcs a un electrón exterior que se encuentra en un estado s, ya que entonces es relativamente grande la probabilidad de encontrar el electrón cerca del Estructura hiper[ina de los nivele~ atómicos 537 núcleo. Calculemos el desdoblamiento hiperfino para un átomo que contiene un electrón s exterior (E. FERMI, 1930). Este electrón se representa por una función de onda 1JJ(r) que posee simetría esférica y corresponde a su movimiento en el campo autoconsistente de los restantes electrones y del núcleo (1). El operador de interacción del electrón con el núcleo lo identificaremos con el operador en~rgía, - ~•.Jf , del momento magnético del núcleo ~ = µi/i en el campo magnético ~ creado por el electrón (en el origen de coordenadas) (2). Según una conocida fórmula de la electrodinámica (3), este campo es f A 1 ~ rxjV = 1 JA 1 :Ye=jxV-dV, e e r3 r (120.8) donde j = -2µ 0 e rot (if,2s) es el operador espinorial de la densidad de corriente creada por el spin electrónico en movimiento (véase (114.4); µ, 0 es el magnetón de Bohr). Por el momento, excluyamos del dominio de integración en (120.8) una pequeña esfera de radio r 0 y centro en el origen de coordenadas y, mediante fórmulas conocidas del análisis vectorial, transformemos la integral de la siguiente manera (introduciremos provisionalmente la notación f = - 2µ 0if,2(r)i): A ~ = = f f . rot 1 fx V-;--dV f (f.v')v'~V+ v': x(nxf)dS. La integral extendida a una superficie cerrada situada en el infinito es igual a cero, de modo que la segunda integral en el segundo miembro de la igualdad se extiende solamente a la superficie de la pequeña esfera (n es el vector unitario de la normal exterior a la misma). En cambio, la primera integral, como se comprueba fácilmente, se reduce a cero al integrar respecto de las direcciones der. En definitiva obtenemos (haciendo dS = r02 do y pasando al límite para r 0 -* O): :Ye= - Jnx(nxf(O))do = 81rf(0)/3, (1) El cálculo que se expone a continuación supone que se cumple la condición Ze9/1ic ~ 1 (cf. la nota de la pág. 534,). (2) Un camino más directo consistiría en calcular la energía de desdoblamiento como valor medio de la energía de interacción de los momentos magnéticos del electrón y del núcleo. Sin embargo, en el caso de un electrón s no conviene aplicar este método porque conduce a una suma de integrales cada una de las cuales, tomada por separado, diverge (cf. problema ]). (ª) Véase tomo II, Teoría clásica de los campos, fórmula (43.7). Hay que observar que, en esta última, el vector R tiene por origen el elemento d Vy por extremo el punto de observación, mientras que en (120.8) el vector r está orientado en el sentido opuesto (del centro al elemento d V). Estructura del núcleo atómico 538 o, finalmente, para el operador de interacción P-is = .Ye -µ. • (120.9) = (l61r/3i)µ,µ,ot/i 2(0)i.s. Si el momento cinético total del átomo es J = S = t, el desdoblamiento hiperfino conduce a la formación de un d oblete (F = i ± i); de acuerdo con (120.5) y (120.9) encontramos para la distancia entre los dos niveles del mismo: (120.10) Ei+t - Et-i = (87T/3i)µ,µ,o(2i+ l)tfi2(0). Dado que el valor 1/'(0) es proporcional a VZ (véase§ 71), la magnitud de este desdoblamiento crece proporcionalmente al número atómico. PROBLEMAS l. Calcular el desdoblamiento hiperfino (debido a la interacción magnética) para un átomo que, fuera de las capas completas, contiene un electrón con momento cinético orbital l (E. FERMI, 1930). Solución. El potencial vector y la intensidad del campo magnético creado por el momento magnético del núcleo µ son iguales a: µ. x n 3n(µ..n)- µ. A = ~ , Je= r3 (div A = O). Mediante estas expresiones, escribiremos el operador de interacción en la forma e eli me me A -A.p+-Je.s = 2µ,o -µ..~+3(s.n)n-s]. r3 A Después de promediar respecto de un estado con un valor dado de j, la expresión entre paréntesis rectos tendrá la dirección de j. Por ello podemos escribir: p-ij = 2µ,oP,.J[i.¡ + 3(s.n)(n..f)- s.j]r-3. El valor medio nink se calcuió en. el problema 2, § 29. Substituyéndolo en la fórmula anterior y pasando a valores propios, obtenemos: i.·[i.. +21(1+ l)s.j-6(s.l)(j.l)Jr-a 2µ, 0 µ, i J J (2/-1)(21+3) de donde, después de un cálculo simple, se encuentra en definitiva: µ,oµ, l(l+l) _ ---F(F+l)r-3 i j(j+ 1) ' ' Estructura hiper/ina de los niveles moleculares donde F = j +i, y j del electrón. = l ± ! . El promedio de 539 ,-a se refiere a la parte radial de la función de onda 2. Determinar el desdoblamiento Zeemann de las componentes de estructura hiperfina de un nivel atómico (S. GouosMIT, R. BACHER, 1930). Solución. En la fórmula (112.3) (suponemos que el campo es tan débil que el desdoblamiento que provoca es pequeño comparado con los intervalos de estructura hiperfina) el promedio debe efectuarse ahora no solamente respecto del estado electrónico, sino también respecto de las direcciones del spin nuclear. Como resultado del primer promedio se obtiene ll.E = µ.ogJJ11;(1, con el valor anterior de gJ (112.6). El segundo promedio da, análogamente a (112.4), De esta manera obtenemos, en definitiva, ll.E = µ.ogp ;eMF, donde F(F + l)+J(J+ 1)-i(i+ 1) gp - g J - - - - - - - - - - 2F(F + 1) § 121. Estructura hiperfina de los niveles moleculares La naturaleza de la estructura hiperfina de los niveles energéticos de una molécula es análoga a la de la estructura hiperfina de los niveles atómicos. En la inmensa mayoría de las moléculas el spin total electrónico es igual a cero. El principal origen del desdoblamiento hiperfino de los niveles es para ellas la interacción cuadripolar de los núcleos con los electrones; desde este punto de vista, ciaro está, toman parte en la interacción solamente aquellos núcleos cuyos spins i son diferentes de cero o de f, ya que en el caso contrario su momento cuadripolar es igual a cero. Teniendo en cuenta que el movimiento de los núcleos en una molécula es relativamente lento, el promedio del operador de interacción cuadripolar respecto del estado de la misma se efectúa en dos etapas: primero hay que promediar respecto del estado electrónico para núcleos fijos, y, luego, debe promediarse respecto de la rotación de la molécula. Consideremos, en primer lugar, una molécula diatómica. Como resultado de la primera etapa del promedio, la interacción de cada uno de los núcleos con los electrones se expresa mediante un operador que es proporcional al escalar Qiknink formado a partir del operador del tensor momento cuadripolar del núcleo y del vector unitario n correspondiente al eje de la molécula - que es la única magnitud que determina la orientación de la misma respecto de la dirección del spin del núcleo. Teniendo en cuenta que Qu = O, este operador se puede representar en la forma (121.1) S40 Estructura del núcleo atómico para un valor dado de la proyección i( del spin nuclear sobre el eje de la molécula, esta cantidad es igual a b [i 2; - ti(i+I)J. El resultado del promedio del operador (121.1) respecto de la rotación de la molécula, en cambio, viene dado en función del operador K del momento de rotación, momento que se conserva. El promedio del producto nink se efectúa según la fórmula obtenida en el problema 2, § 29 (con el vector K en vez de 1) y conduce a b (ZK- l )(ZK + )ídk[í<./(_k + f?d<-i-iDtkK(K + 1) ]. 3 (121.2) Los valores propios de este operador se encuentran de la misma manera que para el operador (120.6). En el caso de una molécula poliatómica, en vez de (121.1) se obtiene, en general, un operador de la forma (121.3) donde bik es un tensor de traza nula característico del estado electrónico de la molécula. Después de promediar respecto de la rotación de ésta, dicho operador se expresa en función del momento total de rotación J por una fórmula del tipo (121.4) El coeficiente b puede darse, en principio, en función de las componentes del tensor b;k respecto de los ejes principales de inercia de la molécula ~' r¡, C; dado que estos ejes están rígidamente ligados -a la misma, las componentes b~~' ... constituyen una característica de la molécula no afectada por el promedio. Consideremos para ello el escalar bikldk. Un cálculo que se apoya en (121.4) nos da: btkli]k = bl(J+ l)[t](J+ 1)+ 1]; (121.5) (el cálculo es análogo al efectuado en el problema 2, § 29). De otra parte, expresando el producto tensorial con relación a los ejes t r¡, C, tenemos: (121.6) donde se ha tenido en cuenta que los valores medios de los productos J~Jc, ... son iguales a cero (1). Los valores medios de los cuadrados J~ 2 , ••• se calculan, en principio, a partir de las funciones de onda de los correspondientes estados de rotación del trompo. En particular, para el trompo asimétrico tenemos simplemente: 11 = k2; 1¡, 1; = Hl(J+ t)-k2]. (1) En efecto, en una representación en la que la matriz de una de las componentes de J (digamos la Je) es diagonal, las matrices de los productos J~ Je. Jr1l!:; tienen solamente elementos que conrresponden a una variación del número cuántico k igual a la unidad; pero las funciones de onda de los estados estacionarios del trompo asimétrico contienen funciones '1/-'Jk con valores de k que difieren en un número par (véase § 103). Estructura hiperfina de los niveles moleculares 541 Si los spins nucleares son iguales a i, la interacción cuadripolar no existe. En este caso, una de las causas principales del desdoblamiento hiperfino es la interacción magnética directa de los momentos magnéticos nucleares entre sL El operador de interacción de dos momentos magnéticos fLi = µ 1iJi1, µ 2 = µ 2i 2/i2 viene dado por la fórmula: Para calcular la energía de desdoblamiento, este operador debe promediarse respecto del estado de la molécula de manera análoga a la antes descrita. Cuando en la molécula existen átomos pesados, una contribución al desdoblamiento hiperfino comparable a la debida a la interacción directa, procede de la interacción indirecta de los momentos nucleares por mediación de la nube electrónica. Desde un punto de vista formal, esta interacción es un efecto de segundo orden de la teoría de perturbaciones respecto de la interacción del spin nuclear con los electrones. Los resultados del § 120 permiten hallar fácilmente que la razón de la magnitud de este efecto al efecto de interacción directa de los momentos nucleares es del orden de (Ze 2/lic) 2 ; para grandes valores de Z, esta razón es comparable con la unidad. Finalmente, una cierta contribución al desdoblamiento hiperfino de los niveles moleculares se debe al efecto de interacción del momento nuclear con la rotación de la molécula. Una molécula en rotación, en tanto que sistema de cargas en movimiento, crea un determinado campo magnético; este campo se puede calcular mediante conocidas fórmulas de electrodinámica cuando se da la densidad de corriente j = en x r, donde e es la densidad de carga (de los electrones y de los núcleos) en la molécula en reposo y n es su velocidad angular de rotación. La magnitud del desdoblamiento de los niveles se obtiene como energía del momento magnético del núcleo en este campo, debiéndose expresar las componentes de la velocidad angular de la molécula en función de las componentes de su momento cinético (cf. § 103). CAPÍTULO XVII TEORÍA DE LAS COLISIONES ELÁSTICAS § 122. Teoría general de la dispersión En la mecánica clásica, la colisión de dos partículas está del todo determinada por sus velocidades y por el « parámetro de impacto» (es decir, la distancia a que pasarían una de otra si no existiera interacción). En la mecánica cuántica, cambia el propio planteo del problema, ya que en el movimiento con velocidades determinadas deja de tener sentido el concepto de trayectoria, y con él también el de « parámetro de impacto ». El objeto de la teoría es ahora tan sólo calcular la probabilidad de que, como resultado de la colisión, las partículas se separen (o, como suele decirse, se dispersen) formando tal o cual ángulo. Se trata aquí de las llamadas colisiones elásticas, en las que ni se produce transmutación ninguna de las partículas, ni (si se trata de partículas complejas) varía su estado interno. El problema que plantea el choque elástico, como cualquier problema de dos cuerpos, se reduce al problema de la dispersión de una partícula, con la masa reducida, en el campo U(r) de un centro de fuerzas fijo (1). La reducción se efectúa pasando a un sistema de coordenadas en el que el centro de masas de ambas partículas se encuentra en reposo. El ángulo de dispersión en este sistema lo designaremos por O. Este ángulo está ligado por fórmulas sencillas con los ángulos ~1 y ~2 de desviación de ambas partículas en el sistema de coordenadas en el que una de ellas (la segunda) se encontraba en reposo antes de la colisión (2): (122.1) donde m1, m 2 son las masas de las partículas. En particular, si las masas de ambas son iguales (m1 = m 2 ), se obtiene simplemente: -&1= la suma ~1 +~2 = n/2, ¡O, (122.2) es decir, las partículas se separan formando un ángulo recto. (1) Prescindimos aquí de la interacción spin-órbita de las partículas (si es que poseen spin). Al suponer que el campo es central, excluimos del análisis también aquellos procesos tales como, por ejemplo, la dispersión de los electrones por las moléculas. (2) Véase tomo I, Mecánica, § 17. Teoría general de la dispersión 543 En lo que sigue utilizamos constantemente (salvo indicación explícita en contra) un sistema de coordenadas ligado con el centro de masas. Representaremos una partícula libre que se mueve en el sentido pos1t1vo del eje z por una onda plana que escribiremos en la forma '1/J = eikz, es decir, elegimos la normalización en la que la densidad de corriente en la onda es igual a la velocidad de la partícula, v. Las partículas dispersadas han de representarse, lejos del centro del campo, por una onda esférica divergente de la forma f(O)eikr/r, donde f(O) es una cierta función del ángulo de dispersión() (ángulo formado por el eje z y la dirección de la partícula dispersada); esta función se llama amplitud de dispersión. De esta manera la función de onda exacta, que es solución de la ecuación de ScHRODINGER con la energía potencial U(r ), debe tener a grandes distancias la forma asintótica if, ~ etkz +¡ (8)etkr/r. (122.3) La probabilidad de que la partícula dispersada atraviese en la unidad de tiempo el elemento de superficie dS = r2do (do es el elemento de ángulo sólido) es igual a vr-2 /J( 2dS = v!f j 2 do (1). La razón de esta probabilidad a la densidad de corriente en la onda incidente es igual a: dcr = 1/(8)1 2 do. (122 4) Esta magnitud tiene las dimensiones de una área y se llama sección eficaz de dispersión dentro del ángulo sólido do. Si se hace do = 2n sen OdO, obtenemos la sección eficaz (122.5) dcr = 21r sen 8 lf(8)12 d8 para la dispersión en el intervalo angular (8, O+dO). Toda solución de la ecuación de ScHRODINGER en un campo central se puede escribir como suma de productos de armónicos esféricos por funciones radiales R1(r) que satisfacen las ecuaciones J l(l+l) 2m - 1 -d ( r2 -dRz) + [ k2-----U(r) Rz = O. r2 dr dr ,2 ñ2 (122.6) La forma asintótica de la función R1 es la onda estacionaria Rz ~ azsen(kr-}l1T+8z) , (122.7) r (1) En este razonamiento se supone, implícitamente, que el haz de partículas incidente está limitado por un diafragma que es grande (para evitar efectos de difracción), pero de dimensiones finitas, como de hecho ocurre en los experimentos reales de dispersión. Por esta causa no existe 'interferencia entre ambos términos de la expresión (122.3); el cuadrado :1p' 2 se toma en puntos en los que no existe la onda incidente. 544 Teoría de las colisiones elásticas (véase (33.18)). Veamos cómo es posible expresar la amplitud de dispersión en función de las fases ó1 de estas funciones. La forma general de una solución de la ecuación de ScHRODINGER que presente simetría axil (respecto del eje z), cual debe ser la solución que describe la dispersión, es una suma de productos R 1(r )P1( cos O). De acuerdo con esto, escribiremos la forma asintótica general de una tal solución en la forma 00 t/J ¿ (2l+l)AzPz(cos8)----- ~ sen(kr-ilrr+Sz) kr l=O 00 = • ""(21 + l)AzPz(cosO)-'-{exp[ -i(kr-ihr+8z)]-exp[i(kr-fl1r+8z)]}. L 2kr l=O Los coeficientes A 1 deben elegirse de manera que esta función tenga la forma (122.3). Para ello utilicemos el desarrollo de la onda plana en ondas esféricas obtenido en el § 34. La forma asintótica de este desarrollo es la (34.2): <X) eikz • ~ ""il(2l+ l)Pz(cos8)-'-{exp[-i(kr-il1r)]-exp[i(kr-fl1r)]}. L 2kr l=O La diferencia 1P - eikz debe representar una onda divergente, es decir, de ella deben desaparecer todos los términos que contienen e-ikr. Para ello es necesario hacer De esta manera la función de onda se escribe • 00 tp ~ _,._ "" (21 + 1)Pz(cos 8)[( -1 )le-ikr - Szeikr], 2krL (122.8) l=O donde hemos introducido la notación Si = Para el coeficiente de eikr/r en la diferencia 1P de dispersión, obtenemos, en cambio: 1 f(O) = ik 2 (122.9) e2ia1. eikz, es decir, para la amplitud ¿ (2l+l)[Sz-l]Pz(cos8). 00 (122.10) l=O Esta fórmula resuelve el problema de expresar la amplitud de dispersión en función Teoría general de la dispersión de las fases b¡ (H. FAXÉN, J. HOLTSMARK, 545 1927) (1). Integrando da respecto del ángulo sólido, obtenemos la secc10n eficaz total de dispersión a, que es la razón de la probabilidad total de dispersión de la partícula (por unidad de tiempo) a la densidad de flujo de probabilidad de la onda incidente. Substituyendo (122.10) en la integral 7T cr = 27T Jlf(B)l 2 sene dB, o y recordando que los polinomios de Legendre con valores diferentes de l son ortogonales entre sí y que 7T JPl2(cos B)senB dB = 2/(21+1), o obtenemos la siguiente expresión para la sección eficaz total: 477 00 ""(2l+l)sen2 Sz. k2 ~ cr = - (122.11) z-o Cada uno de los términos de esta suma es una sección eficaz « parcial » a1 correspondiente a la dispersión de las partículas con momento orbital dado l. Obsérvese que el máximo valor posible de esta sección eficaz es crz,max = (4'1T/k 2 )(2Z+ 1). (122.12) Comparándolo con la fórmula (34.4), vemos que el número de partículas dispersadas con momento cinético l puede resultar cuatro veces mayor que el número de dichas partículas en el flujo incidente. Esta circunstancia es un efecto puramente cuántico debido a la interferencia entre las partículas dispersadas y las no dispersadas. En lo que sigue convendrá utilizar también las « amplitudes parciales de dispersión » Ji, que definiremos como coeficientes del desarrollo f (8) = I: (2/ + 1)fzPz( cos 8). l (122.13) (1) El problema de reconstruir la forma del potencial, causa de la dispersión, a partir de 1 las fases Oz, supuestas conocidas, tiene un interés fundamental. Esta cuestión ha sido resuelta por l. M. GEL'FAND, B. M. LEVITAN, V. A. MARCHENKO. De este análisis resulta que para determinar U(r) basta, en principio, conocer ,5o(k) como función del número de onda en todo el intervalo desde k = O a k = oo y también los coeficientes a 11 en las expresiones asintóticas (para r-¿,- oo) de las funciones de onda de los estados que corresponden a los niveles discretos (negativos) Eu de la energía: Rno ~ (an/r)e-Knr (Kn = v(2mlEnl)/li) cuando estos existen. La determinación de U(r) a partir de estos datos se reduce a la resolución de una ecuación integral lineal (véase V. A. MARCHENKO, DAN SSSR 104, 695, 1955). 546 Teoría de las colisiones elá.o;ticas De acuerdo con ( 122.1 O), dichas amplitudes están ligadas con las fases ~, por la re)ación 1 1 fz = --'Sz-1) = -(e2iBi-1) (122.14) 7Jii 2ik ' y las secciones eficaces parciales vienen dadas por az § 123. = 47r(2l+ 1)11z¡2. (122.15) Estudio de la fórmula general Las fórmulas obtenidas son aplicables, en principio, a la dispersión en un campo cualquiera U(r) que tiende a cero en el infinito. El estudio de estas fórmulas se reduce al estudio de las propiedades de las fases IJ 1 que aparecen en ellas. Para estimar el orden de magnitud de las fases /J 1 con grandes valores de !, nos apoyaremos en el hecho de que para valores l grandes el movimiento es cuasiclásico (véase § 49). Por ello, la fase de la función de onda viene determinada por la integral r f J[ (l+t)2 2mU(r)J k2- - - - - - dr+Lrr fi2 ,2 "'" ' r, donde r0 es una raíz del radicando (r > r0 es la región clásicamente accesible del movimiento). Restando de aquí la fase J[ J k2-+ f ([+.l.)2 r dr+b de la función de onda del movimiento libre y haciendo que r-+ oo, obtenemos, por definición, el valor de IJL. Para grandes valores de !, el valor rO es también grande; por ello U(r) es pequeño en todo el dominio de integración y obtenemos aproximadamente CX) S¡ = - fmU(r) dr/li" J[k•-(l~!)] (123.1) r. Esta integral (si converge) es del orden de magnitud de Sz ,..., mU(ro)ro/kli.2. El orden de magnitud de r0 es r0 {"-.., (123.2) 1/k. Si U(r) tiende a cero en el infinito como ,-n, con n > 1, la integral (123.1) con- Estudio de la /órmula general 547 verge y las fases b1 son finitas. Por el contrario para n .;;;; 1 la integral diverge, de modo que las fases ó1 resultan ser iguales a infinito. Esto vale cualquiera que sea /, ya que la convergencia o la divergencia de la integral (123.1) depende del comportamiento de U(r) para grandes valores de r, y a grandes distancias (donde el campo U(r) es ya débil) el movimiento radial es cuasiclásico para cualquier l. Cómo hay que entender las fórmulas (122.10-11) cuando las fases b1 son infinitas,_ se indicará más adelante. Consideremos primero la convergencia de la serie (122.11 ), que representa la sección eficaz total. Para valores grandes de l, las fases b1 ~ 1, conforme se ve a partir de (123.1) si se tiene en cuenta que U(r) disminuye más rápidamente que 1/r. Por ello podemos hacer sen2b1 ';;; bz2, y así la suma de los términos residuales de la serie (122.11) será del orden de ~ Mz2. De acuerdo con un conocido criterio integral l~ 1 de convergencia de las series, de aquí se deduce que la serie considerada converge si converge la integral f Mz2 di. Substituyendo en ella ( 123.2) y cambiando l por kr 0 , obtenemos la integral 00 J U (ro)ro 2 3 dro. ,-n Si U(r) disminuye en el infinito como con n > 2, esta integral converge y la sección eficaz total es finita. Por el contrario, si el campo U(r) disminuye como I/r 2 o aun más lentamente, la sección eficaz total resulta infinita. Físicamente, esto se debe al hecho de que cuando el campo disminuye lentamente con la distancia, la probabilidad de la dispersión en ángulos pequeños es muy grande. Obsérvese, en relación con esto, que en la mecánica clásica y para todo campo que se anula sólo para r -+ =, una partícula cuyo parámetro de impacto es tan grande cuanto se quiera, pero finito, experimenta siempre una desviación, ciertamente de ángulo pequeño, pero no nulo; como consecuencia, la sección eficaz total de dispersión resulta ser infinita cualquiera que sea la ley de disminución de U(r) (1). Este razonamiento no es aplicable en la mecánica cuántica, puesto que hablar de dispersión en un cierto ángulo sólido es sólo posible si se cumple la condición de que éste sea grande comparado con la indeterminación en la dirección del movimiento de la partícula. Pero si se conoce el « parámetro de impacto» con una precisión ~(!, por ello mismo se produce una indeterminación h/ ~(! en la componente transversal del impulso, es decir, una indeterminación ""'ñ/mv~e en el ángulo. Visto el importante papel que la dispersión representa en el caso de ángulos pequeños y cuando la ley de disminución de U(r) es lenta, surge naturalmente la cuestión de si no divergirá la amplitud de dispersión/(6) para 6 = O incluso cuando U(r) disminuye más rápidamente que 1/r 2 • Haciendo en (122. 10) 6 = O obtenemos 1 ( ) Este hecho se manifiesta en la divergencia de la integral J2JT(2 de, que determina la sección eficaz total en la mecánica clásica. 548 Teoría de las colisiones elásticas t/º para los términos residuales de la suma una expresión que es proporcional a I z· Razonando como en el caso anterior, al determinar el criterio de convergencia de la suma llegamos a una integral a:, JU(ro)ro 2 dro, que diverge ya para U(r) ,_, ,-n, n < 3. Así, pues, la amplitud de dispersión tiende a infinito para fJ = O en los campos que disminuyen como 1/r3 o más lentamente. Examinemos finalmente el caso en que la propia fase c)z es infinita, lo que ocurre para U(r) ,_, ,-n, n < J. En virtud de los resultados antes obtenidos, es desde Juego evidente que para una disminución tan lenta del campo serán iguales a infinito tanto la sección eficaz total como la amplitud de dispersión para fJ = O. Sin embargo, queda todavía por resolver la cuestión de cómo calcular f(fJ) para fJ =/= O. Observemos ante todo que vale la fórmula (1) a:, ¿ (2l+l)Pz(cos8) = 4ó(l-cos8) (123.3) l=O Con otras palabras, para todos los fJ =/= O esta suma es igual a cero. Por lo tanto, en la expresión (122~10) para la amplitud de dispersión se puede prescindir de la unidad en los paréntesis S 1 -- 1 de cada término de la suma para fJ =/= O, con lo que queda 1 f(8) = Zik a:, ¿ (2l+l)Pz(cos8)e2i8z. (123.4) l-0 Si se multiplica el segundo miembro de esta igualdad por el factor constante e- 2 i 0o, esto no se refleja en la sección eficaz, determinada por el cuadrado del módulo [f(fJ)f 2, y la fase de la función compleja/(fJ) cambia solamente en una constante que carece de importancia. Por otra parte, al formar la diferencia ~z - ~o de las expresiones (123.1) la integral de U(r), que diverge, se reduce y queda una cantidad finita. De esta manera, para el cálculo de la amplitud de dispersión se puede utilizar, en el caso considerado, la fórmula f(8) = 1 ik 2 ¿ co (2l+l)Pz(cosO)e2iC8i-8o>. (123.5) l-0 (1) Esta fórmula es el desarrollo de la función ,5 en polinomios de Legendre y su validez se verifica directamente multiplicando ambos miembros por sen0P1(cos0) e integrando respecto de O. Al hacerlo, la integral a:, JS(x) dx o de la función par r)(x) se toma igual a t. Condición de unitariedad en la dispersión § 124. 549 La condición de unitariedad en la dispersión La amplitud de dispersión en un campo arbitrario (no necesariamente central) satisface determinadas relaciones que son consecuencia de condiciones físicas muy generales. La forma asintótica de la función de onda, a grandes distancias, para la dispersión elástica en un campo arbitrario es 'P ~ eikrn.n' 1 + _¡ (n,n')etkr. r (124.1) Esta expresión difiere de (122.3) en que la amplitud de dispersión depende de las direcciones de dos vectores unitarios - uno, en la dirección de la partícula incidente (n), y el otro, en la dirección de dispersión (n') - y no solamente del ángulo que forman. Una combinación lineal cualquiera de funciones de la forma (124.1) con diferentes direcciones de incidencia n representa también un posible proceso de dispersión. Multiplicando las funciones (124.1) por coeficientes arbitrarios F(n) e integrando respecto de todas las direcciones n (elemento de ángulo sólido do), escribiremos dicha combinación lineal en forma de integral: eikrf F(n)f(n,n') do. f F(n)eikm,n' do+-;- (124.2) Dado que la distancia r es tan grande cuanto se quiera, el factor eikrn.n' en la primera integral es una función rápidamente oscilante de la dirección del vector variable n. Por lo tanto, el valor de la integral viene determinado fundamentalmente por las regiones próximas a aquellos valores n para los que el exponente posee un extremo (n = ± n'). En cada una de ellas el factor F(n) ~ F(± n') se puede sacar fuera del signo de integral, con lo que la integración da (1): e-ikr eikr etkr 2mF( - n ' ) - -2mF(n')- + kr kr r f /(n,n')F(n) do. Escribamos esta expresión en la forma compacta de un operador, prescindiendo del factor común 2nilk: e-ikr eikr - F ( - n')- -SF(n'), r r (124.3) (1) Para el cálculo de la integral, desplazaremos el camino de integración respecto de la variable µ = cos () (0 es el ángulo entre n y n') en el plano complejo ¡t de modo que se «incurve» hacia el semiplano superior, dejando fijos los extremos ¡t = ± 1. Entonces, al alejarse de cada uno de estos puntos, la función eikr¡1 disminuye rápidamente. 550 Teoría de las colisiones elásticas donde S = 1+2ikj y (124.4) J es el operador integral: / F( n') = ~ f f( n,n')F( n) do, (124.5) El operador & se llama operador (o matriz) de dispersión, o simplemente, matriz S; fue introducido por primera vez por W. HEISENBERG (1943). El primer término (124.3) representa una onda que converge hacia el centro del campo, y el segundo, una onda que diverge del mismo. La conservación del número de partículas en la dispersión elástica se expresa igualando los flujos totales de partículas en las ondas convergente y divergente. Con otras palabras, estas dos ondas deben tener la misma normalización. Para ello el operador de dispersión S ha de ser unitario (§ 12), es decir, debe tenerse Ss+ = 1, (124.6) o bien, substituyendo (124.4) y efectuando el producto: /-/+ = 2ikjj+. (124.7) Finalmente, teniendo en cuenta la definición (124.5), escribiremos la condición de unitariedad para la dispersión en la forma ºk /(n,n') - /*(n',n) = ; 77 f /(n,n")/*(n',n") do". (124.8) Para n = n', la integral en el segundo miembro de la igualdad no es sino la sección eficaz de dispersión total a = flf(n, n")l 2 do". La diferencia que aparece en el primer miembro de la misma se reduce, en este caso, a la parte imaginaria de la amplitud f(n, n). De esta manera obtenemos la siguiente relación general entre la sección eficaz total de dispersión elástica y la parte imaginaria de la amplitud de la dispersión para ángulo cero: im/(n,n) = kcr/417. (124.9) (éste es el llamado teorema óptico de la dispersión). Otra propiedad general de la amplitud de dispersión se puede obtener todavía partiendo de la condición de simetría respecto de la inversión del tiempo. En la mecánica cuántica, esta simetría se expresa en el hecho de que si la función 1P representa un estado posible cualquiera, también la función conjugada compleja 't/J* corresponde a un cierto estado posible (§ 18). Por ello, la función de onda Condición de unitariedad en la dispersión eikr 551 eikr -F*( - n')- -S*F*(n'), r r conjugada compleja de la función (124.3), describe también un posible proceso de dispersión. Introduzcamos una nueva función arbitraria, haciendo - S* F*(n') = <D(- n'). Teniendo en cuenta el carácter unitario del operador S, resulta entonces F*(n') = -(S*)-1<1>(-n') = -S<l>(-n'); introduciendo el operador Í de inversión de las coordenadas, que cambia el signo de los vectores n y n', escribiremos: F*(-n') = ÍF*(n') = -!Sl<l>(n'). Obtenemos de esta manera la función de onda, invertida respecto del tiempo, en la forma e-ikr eikr _ -<I>( - n')- -1S1<l>(n'). r r Esta función debe coincidir en esencia con la función de onda de partida (124.3). La comparación prueba que para ello debe cumplirse la condición !Si= s; (124.10) ambas funciones difieren entonces tan sólo en la manera de representar la función arbitraria. La relación correspondiente para la amplitud de dispersión se obtiene pasando de la igualdad entre operadores (124.10) a la forma matricial. La transposición cambia entre sí las posiciones de los vectores inicial y final, n y n', y la inversión cambia sus signos. Tenemos por ello: S(n,n') = S(-n', -n), (124.11) /(n,n') = /(-n', -n). (124.12) o bien, lo que es lo mismo: Esta relación (llamada teorema de reciprocidad) expresa un resultado natural: la coincidencia de las amplitudes de dos procesos de dispersión que resultan ser inver.., sos en el tiempo el uno del otro. La inversión del tiempo permuta los estados inicial y final y cambia los sentidos del movimiento de las partículas en sus opuestos. Para la dispersión de un campo central, se simplifican las relaciones generales que hemos obtenido. En este caso, la amplitud f(n, n') depende solamente del ángulo () entre n y n'. La igualdad (124.12) se transforma entonces en una identidad. 552 Teoría de las colisiones elásticas La condición de unitariedad (124.8), en cambio, toma la forma Imf(U) = ~ ff (y)/•(y') do; (124.13) y, y' son los ángulos entre n, n' y una dirección cualquiera fija en el espacio. Si se representaf(O) en la forma (122.13), mediante el teorema de adición de los armónicos esféricos (c. 8) se deduce de (124.13) la siguiente relación para las amplitudes parciales: (124.14) Esta fórmula se puede obtener también directamente a partir de la expresión (122.14), según la cual l2ik.fi+ 112 = l. El teorema óptico (124.9), en el caso de dispersión por. un campo central, se obtiene también de manera fácil directamente de las fórmulas (122.10) y (122.11). Escribiendo (124.14) en la forma Im(l/.fi) = - k, vemos que la amplitud debe tener la forma fz = 1/(gz-ik), Ji (124.15) donde g 1 = g¡(k) es una cantidad real (1). En lo que sigue utilizaremos más de una vez esta representación de la amplitud. Para la dispersión en un campo central, veamos qué relación existe entre el concepto de operador de dispersión, que acabamos de introducir, y las magnitudes que aparecen en la teoría desarrollada en el § 122. Dado que el momento cinético orbital se conserva en un campo central, el operador de dispersión S conmuta con el operador l. Con otras palabras, la matriz S es diagonal en la representación /. En virtud del carácter unitario del operador S, sus valores propios deben ser iguales a la unidad en módulo, es decir, deben tener la forma e2ici, con las cantidades b1 reales. Es fácil ver que éstas coinciden con los corrimientos de fase de las funciones de onda, de modo que los valores propios de la matriz S coinciden con las. magnitudes S 1 (122.9) introducidas en el § 122; los valores propios del operador / = (S-1)/2ik coinciden, según esto, con las amplitudes parciales (122.14). En efecto, si como función F(n) se elige P 1(cos O) (con lo que F(- n) = Pi(- cos O) = (- 1)1P1(cos O)), la función de onda (124.3) debe coincidir con la solución de la ecuación de SCHRODINGER representada por un término de la suma en (122.8) ~ pero esto significa que SPz( cos 8) = SzPz( cos 8). <1) Esta cantidad está ligada con la fase Oz por la relación g, = k cot8z. (124.15a) Fórmula de Born 553 Para una onda plana que incide en la dirección del eje z, la función F(n) en (124.2) es la función F =,= 415( 1 - cos 8), donde 8 es el ángulo que forma n con el eje z, la función ó se define aquí conforme se indica en la nota de la pág. 548, y el coeficiente de la misma se elige de manera que al substituir en el segundo miembro de la definición (124.5) se obtenga simplemente f(O) (donde ahora 8 es el ángulo entre n' y el eje z). Representando la función ó en la forma (123.3) 00 F = 4S(l - cos O) = ¿ (2l + 1)P1( cos O), (124.16) l=O y aplicándole el operador en la forma (122.13). J, obtenemos, cual debe ser, la amplitud de dispersión Finalmente, hagamos todavía la siguiente observación. Desde el punto de vista matemático, la condición de unitariedad (124.8) indica que no toda función dada a priori f(n, n') puede ser la amplitud de dispersión en un cierto campo. En particular, no toda función f(O) puede ser la amplitud en un ca~po central. En virtud de (124.13), su parte real y su parte imaginaria deben cumplir una determinada condición. Si se escribe f(O) = lf leirx, dar el módulo lfl para todos los ángulos reduce la relación (124.13) a una ecuación integral mediante la que es posible, en principio, determinar la fase incógnita :x(O). Con otras palabras, si se conoce la sección eficaz de dispersión para todos los ángulos (el cuadrado !fl 2), es posible, en principio, reconstruir también la amplitud. Esta reconstrucción, sin embargo, no es del todo unívoca y la amplitud queda determinada tan sólo salvo el cambio f (O) -+ - f *(O), {124.17) que deja invariante la ecuación (124.13) (y que, claro está, no modifica la sección eficaz l/12) (1). Esta falta de unicidad, sin embargo, desaparece si la amplitud de dispersión se considera no sólo como función del ángulo, sino también como función de la energía. Veremos más adelante (§§ 128-129), que las propiedades analíticas de la amplitud como función de la energía no son invariantes respecto de la transformación (124.17). § 125. Fórmula de Born La sección eficaz de dispersión se puede calcular de forma general en un caso muy importante - cuando el campo dispersor puede considerarse como una perturbación (2). En el § 45 se demostró que ello es posible con sólo que se cumpla una de las dos condiciones: (125.1) IU/ ~ ft2/ma2 (1) La transformación ( 124.17) equivale a cambiar simultáneamente los signos de todas las fases <5i en (122.10). (2) En la teoría general desarrollada en el§ 122, esta aproximación corresponde al caso en que las fases 1)1 son pequeñas; además, es necesario que estas fases se puedan calcular a partir de una ecuación de ScHR6DJNGER en la que la energía potencial se considera como una perturbación (véase el problema 4). 554 Teoría de las colisiones elásticas o bien 1 u¡ ~ liv/a = (tz2/ma2)ka, (125.2) donde a es el radio de acción del campo U(r) y U es su orden de magnitud en el dominio fundamental de existencia del mismo. Si se cumple la primera condición, la aproximación considerada es aplicable cualquiera que sea la velocidad. En cambio, la segunda condición pone de manifiesto que es siempre aplicable para velocidades suficientemente grandes. De acuerdo con el§ 45, busquemos la función de onda en la forma ifi = ifi<0 >+efi<1 >, donde rp<0 > = eik.r corresponde a la partícula incidente con vector de onda k = p/li. La fórmula (45.3) nos da: m if,Cll(x,y,z) = - 7Tñ 2 2 I dV' U(x',y',z')ei<k,r'+kR> --¡¡_· (125.3) Eligiendo el centro dispersor como origen de coordenadas, introduzcamos el vector posición R0 del punto de observación de 'f/J(I) y designemos por n' el versor del vector R 0 . Sea r' el vector posición del elemento de volumen dV', con lo que R = R 0 - r'. A grandes distancias del centro se tiene R 0 ~ r', de modo que R = IRo-r'j,...., Ro-r' .n'. Substituyendo en (125.3), obtenemos 1~ siguiente expresión asintótica para if,m ~ - -m- -eikRo -2TTñ 2 I Ro tp< 1): U(r')ei(k-k').r' d V' (donde k' = kn' es el vector de onda de la partícula después de la dispersión). Comparando con la definición (122.3) de la amplitud de dispersión, obtenemos para ésta la expresión f = _ _!!:_ 27rn,2 f Ue-iq.r d V , (125.4) en la que hemos cambiado la notación correspondiente a las variables de integración y se ha introducido el vector = k'-k, (125.5) = 2k sinfO, (125.6) q cuyo módulo es q donde O es el ángulo formado por k y k', es decir, el ángulo de dispersión. Fórmula de Born 555 Finalmente, elevando al cuadrado el módulo de la amplitud de dispersión, obtenemos la siguiente fórmula para la sección eficaz de dispersión en el elemento de ángulo sólido do: dcr f = -m2- 1 Ue-iq.r¿ V 12 do. 41r2/l4 (125.7) Vemos así que la dispersión acompañada de una variación del impulso igual a ñq viene determinada por el cuadrado del módulo de la correspondiente componente de Fourier del campo U. La fórmula (125.7) fue obtenida por primera vez por M. BORN (1926); la correspondiente aproximación en la teoría de colisiones se llama, frecuentemente, aproximación de Born. Obsérvese que, en esta aproximación, se cumple la relación f(k,k') =f*(k',k) (125.8) entre las amplitudes de los procesos de dispersión directo e inverso (en el sentido literal de la palabra), es decir, de los procesos que difieren uno del otro en la permutación de los impulsos inicial y final, sin cambiar sus signos como ocurría en la inversión del tiempo. Se manifiesta así en la dispersión una propiedad de simetría adicional (que se añade al teorema de reciprocidad (124.12)). Esta propiedad está íntimamente vinculada con el hecho de que el valor de la amplitud de dispersión es pequeño en la teoría de perturbaciones, y se sigue directamente de la condición de unitariedad (124.8) si se prescinde en ella del término integral cuadrático respecto de f (1). La fórmula (125.7) puede obtenerse también de otra manera (que, sin embargo, deja indeterminada la fase de la amplitud de dispersión). En efecto, podemos partir de la fórmula (43.1) de la teoría de perturbaciones, según la cual la probabilidad de la transición entre estados del espectro continuo viene dada por la fórmula En el presente caso hemos- de aplicar esta fórmula a la transición desde el estado de la partícula incidente, con impulso inicial dado p, al estado de la partícula con impulso p', dispersada en el eJemento de ángulo sólido do'. Como « intervalo » de estados dv se puede tomar el elemento de volumen dpx' dp' y dpz' del espacio de impulsos. Substituyendo en vez de E0 - Evo la diferencia (p' 2 - p 2)/2m de las energías de dos partículas libres con impulsos p' y p, tenemos: dwpp' = (41rm/ñ)I Upp·l 28(p' 2-p 2) dp'x dp' y dp'z. (125.9) (1) Es claro, por ello, que esta propiedad desaparezca ya al pasar a la segunda aproximación. A primera vi;;ta puede parecer que la fórmula de segunda aproximación (véase problema 6) es también simétrica respecto de la permutación de los estados inícial y final. En realidad, una tal simetría no existe, debido a que al pasar a la fórmula conjugada varía el camino de integración (es decir, el sentido en que se evita el punto singular). 556 Teoría de las colisiones elásticas Las funciones de onda de las partículas incidente y dispersada son funciones de onda del movimiento libre, es decir, ondas planas: VJp = constantex eip.rf1t, IPp' = constante x eip'.rf1t. Dado que se ha elegido como « intervalo » dv' el elemento del espacio de impulsos, la función de onda %' debe normalizarse según la función o en dicho espacio: IPp' = e<i/ll.)p'.r/(217fi)3/2. (125.10) La función '1/'p, en cambio, la normalizaremos de modo que corresponda a una densidad de flujo igual a la unidad: 'Pp = y'(m/p)e<i/11.)p.r. (125.11) Entonces la probabilidad (125.9) tendrá las dimensiones de un área y representará la sección eficaz diferencial de dispersión. La presencia de la función oen la fórmula (125.9) significa que p' = p, es decir, el valor absoluto del impulso no cambia, conforme debe ocurrir en una dispersión elástica. Cabe eliminar la función opasando a « coordenadas esféricas» en el espacio de impulsos (es decir, substituyendo dp'x dp'u dp'z por p' 2 dp' do'= l p'd(p' 2 ) do') e integrando respecto de p' 2• La integración se reduce a cambiar el valor absoluto p' por p en el integrando. y obtenemos: Substituyendo aquí las funciones (125.10) y (125.11), volvemos de nuevo a la fórmula (125.7). En la forma (125.7), esta fórmula es aplicable a la dispersión en un campo U(x, y, z) que es función de las coordenadas en cualquiera de sus combinaciones, y no sólo der. Pero en el caso U= U(r) puede ser sometida a ulterior transformación. En la integral J U(r)e-iq.r dV utilicemos coordenadas espaciales esféricas r, &, <f, con el eje polar elegido en la dirección del vector q (representamos por & el ángulo polar, para distinguirlo del ángulo de dispersión O). La integración respecto de & y <f, puede efectuarse fácilmente, y obtenemos en definitiva: ooh~ fff ooo oo U(r)e1•• = llr2 sen~ d&d</>dr = 4,, f o U(r,8°:qr r dr. 557 Fórmztla de Born Substituyendo esta expres10n en (125.4), se obtiene la siguiente fórmula para la amplitud de dispersión en un campo central: f 00 2m f = - - ñ2 o senqr U(r)--r dr. q (125.12) Para O = O (es decir, q = O) la integral que aquí aparece es divergente si U(r) tiende a cero en el infinito como I/r 3 o más lentamente (de acuerdo con los resultados generales del § I 23). Conviene llamar la atención acerca de la siguiente circunstancia interesante. El impulso p de la partícula y el ángulo de dispersión () intervienen en ( I 25. I 2) únicamente a través de q. De esta manera, en la aproximación de Born la sección eficaz depende de p y() tan sólo en la combinación p sen (0/2). Volviendo al caso general de campos arbitrarios U(x, y, z), consideremos los casos límite correspondientes a velocidades pequeñas (ka ~ I) y grandes (ka ~ 1). Para velocidades pequeñas, en la integral (125.4) se puede hacer modo que la amplitud de dispersión será f =_ _!!:_f UdV 21Tn2 ' e-iq.r ~ I, de (125.13) y si U= U(r), f 2m = - h2 foo U(r)r2 dr. (125.14) o La dispersión resulta aquí isótropa e independiente de la velocidad, lo que está de acuerdo con los resultados generales del § 130. En el caso límite opuesto de grandes velocidades, la dispersión es fuertemente anisótropa y dirigida hacia adelante en un cono estrecho de ángulo !).() '""'"' I / ka. En efecto, fuera de este cono la cantidad q es grande, el factor e-iq.r es una función rápidamente oscilante y la integral de su producto por la función lentamente variabJe U es prácticamente cero. La ley de decrecimiento de la sección eficaz para grandes valores de q no es universal y depende de la forma concreta del campo. Si el campo U = U(r) posee una singularidad en r = O o para cualquier otro valor real de r, el papel determinante en la integral de (125.12) lo representa la vecindad de este punto, y la disminución de la sección eficaz sigue una ley potencial. Lo mismo vale también para el caso 558 Teoría de la.~ colisiones elásticas en que la función U(r) carece de singularidades, pero no es una función par - el papel fundamental en la integral lo representa entonces la vecindad del origen r = O. Si, en cambio, U(r) es una función par de r, la integración se puede extender formalmente también a valores negativos de r, es decir, la integración puede efectuarse a lo largo de todo el eje real de la variable r, con lo que (si U(r) no tiene puntos singulares sobre dicho eje) es posible desplazar el camino de integración al campo complejo hasta « tropezar » con el punto singular más próximo. En estas condiciones, para grandes valores de q, la integral resulta ser una función que decrece exponencialme!lte. Sin embargo, hay que tener en cuenta que para el cálculo de esta cantidad exponencialmente pequeña, la aproximación de Born, es, en general, inadecuada (véase también § 127). Aunque el valor de la sección eficaz de dispersión diferencial dentro del cono A() ~ I/ka no depende, esencialmente, de la velocidad, sin embargo, gracias a la disminución del ángulo de apertura del cono, la sección eficaz total (si es que la integral f da converge) disminuye para grandes valores de la energía. En efecto, la sección eficaz total disminuye junto con la amplitud del ángulo sólido, subtendido por el cono, proporcionalmente a ( A()) 2 ~ I/k 2a2 , es decir, en razón inversa de la energía. En muchas aplicaciones físicas de la teoría de colisiones, se adopta como magnitud característica de la dispersión la integral crtr = J(1- cos B) dcr, (125.15) llamada frecuentemente sección eficaz de transporte. Consideraciones análogas a las hechas anteriormente prueban que, para grandes velocidades, esta cantidad es inversamente proporcional al cuadrado de la energía. PROBLEMAS 1. Determinar, en la aproximación de Born, la sección eficaz de dispersión de un pozo esférico de potencial: U= - U0 para r < a, U= O para r > a. Solución. El cálculo de la integral en (125.12) conduce al resultado da mUoa2)2 (senqa-qa cosqa)2 = 4a2 ( - - - (qa)6 /i2 do. La integración respecto de todos los ángulos (que conviene efectuar pasando a la variable q ·sen (0/2) y substituyendo do por 2'7q dq/k 2) da la sección eficaz total de dispersión: a= 27T(mUoa k2 h2 2 2 ) [i- _1_ + sen4ka _sen22ka]· (2ka)2 (2ka)3 (2ka)4 = 2k. 559 Fórmula de Born En los casos límite esta fórmula da: 2. cr = 16rra2(mU0a2)2 9 /¡,2 para ka~ 1, cr = 21r(mUoa2)2 k2 li2 para ka~ 1. El mismo problema en el campo U= U0 e-r"la". Solución. El cálculo conviene efectuarlo mediante la fórmula (125.7), eligiendo la dirección de q como uno de los ejes de coordenadas. En definitiva se obtiene mUoa2)2 dcr = 1.1ra2 ( - - - e-q 2 a 2 /2 do 4 h2 ' y la sección eficaz total Las condiciones de aplicabilidad de estas fórmulas vienen dadas por las desigualdades (125.1-2), con U0 en vez de U. Además, la fórmula para da no es aplicable si el exponente es grande en valor absoluto (1). 3. El mismo problema en el campo U= (rx./r)e-rfa. Solución. El cálculo de la integral (125.12) da: dcr = 4a2(_c,,.m_a)2__d_º__ 1i2 (q2a2 + 1)2 La sección eficaz total es: cr = l61ra2(_r:t.m_._ª)2_ _1__ h2 4k 2a2+ 1 · La condición de aplicabilidad de estas fórmulas se obtiene a partir de (125.1-2) con r.x./a en vez de U: a.ma/ñ2 ~ 1 o a./ñv ~ 1. 4. Determinar las fases ,5z para la dispersión en un campo central en el caso correspondiente a la aproximación de Born. Solución. Para la función de onda radial x = rR del movimiento en el campo U(r) y para la función x( 0 l del movimiento libre, tenemos las ecuaciones (véase (32.10)): (1) Es fácil comprobar que, en este caso, no es aplicable la teoría de perturbaciones calculando la amplitud de la dispersión en segunda aproximación (véase problema 5): aunque el coeficiente de la exponencial es pequeño comparado con el del término de primera aproximación, el exponente de la exponencial negativa resulta ser dos veces menor. 560 Teoría de las colisiones elásticas l(l+l) x" + [ k2- -r2- - 2m J -¡¡;-U X= O, /(l+l)J r2 x<º>" + [ k2- - - - x<º> = o. Multiplicando la primera ecuación por x( 0l, la segunda por X, restando miembro a miembro una de otra e integrando luego respecto de r (teniendo en cuenta la condición de contorno x = O para r = O), obtenemos: 2m x'(r)x<º'(r)-x(r)x< 0>'(r) = n,2 Ir Uxx< >dr. 0 o Considerando U como una perturbación, podemos hacer en el segundo miembro de la igualdad x ,....., x(O). Para r----* =, utilizaremos en el primer miembro de la misma las expresiones asintóticas (33.10), (33.18); en la integral, en cambio, substituiremos la expresión exacta (33.9 a). Obtenemos así: 00 sen81 ~ 81 = - :: . J U(r)[Jz+1;2(kr)] 2r dr. o Esta fórmula se podría obtener también desarrollando directamente la amplitud de dispersión de Bom (125.4) en polinomios de Legendre, de acuerdo con (122.10) (para valores '5z pequeños). 5. Determinar la amplitud de dispersión en la segunda aproximación de la teoría de perturbaciones. Solución. Comparando las fórmulas (43.1) y (43.5), concluimos que el paso de las fórmulas de primera aproximación a las fórmulas de segundo orden se efectúa substituyendo la integral Uk'--k = JUe-i<k'-k>.r dV por 2m (2n)ª li2 uk'-k+ - - f Uk,-k"Uk"-k k2 - k"2 + iS d3k" (1) (después de la integración se hace que <5----* +O). Obsérvese que, debido a este procedimiento de integración, e] segundo término no posee ya ]a propiedad (125.8). 6. Determinar, en segunda aproximación, ]a amplitud de dispersión en el caso límite de pequeñas energías (l. IA. POMERANCHUK, 1948). Solución. Para k----* O la integral que aparece en el segundo término de la fórmula (I) toma la forma - f U-k"Uk" ---d3k" k"2 El caso cua.'iiclá.<iico - JJJ JJ lr-r'I 561 d3k" U(r)U(r')eik'.(r-r'>-- dV dV' k"2 U(r)U(r') -21r2 dV dV'; hemos aplicado aquí la fórmula (1) eik,(r-r'> d3k J = __1__ lr-r'I 27T2k2 La amplitud de dispersión es así f = - _!!:_ 21rli2 J U dV+ (_!!:_) JJU(r)U(r') dV dV'. 21rli2 lr-r'I 2 (2) En el caso de un campo central, esta fórmula nos da: f = - -2m ñ2 J 8m2J JU(r)U(r')r2 dr. r' dr'. ñ4 Ur2 dr+- r'>r El segundo término de la fórmula (2) es siempre positivo (como es claro teniendo en cuenta la expresión de partida de la integral en el espacio-k). De aquí se sigue que, para pequeñas energías, la primera aproximación de Born da siempre valores de la sección eficaz que son por exceso en un campo repulsivo ( U > O) y por defecto en un campo atractivo ( U < O). § 126. El caso cuasiclásico Es interesante investigar cómo se efectúa el paso al límite que lleva de la teoría cuántica de la dispersión a la clásica. Dejando de lado el ángulo de dispersión e igual a cero, podemos escribir la amplitud de dispersión a que conduce la teoría cuántica exacta en la forma (123.4): CX) f(O) = (1/2ik)}; (21+1)Pz(cos8)e2i8i. l=<l {126.1) Sabemos que las funciones de onda cuasiclásicas se caracterizan por el gran valor de su fase. Es natural, por lo tanto, suponer desde un buen principio que al paso al límite en la teoría de la dispersión corresponden fases '51 que son grandes. El valor de Ja suma (126.1) viene determinado esencialmente por los términos con valores grandes de l. Por ello podemos substituir Pz(cos O) por la expresión asintótica (49.7), (1) Véase tomo II, Teoría clásica de los campos, § 51. Teorfo de lqs colisiones elásticqs 562 que escribiremos en la forma: Pz(cos8) t ~ -----[efü+l/2)0+fo/4_e-fü+l/2)8-t11/4]. v(2TilSen8) Substituyendo esta expresión en (126.1), obtenemos: J(O) = ~~ k~ J z l (et[26z-<i+l!2)8-1T/41_et[261+Cl+l/2)8+1T/41}. 211senO (126.2) Los factores exponenciales, considerados como funciones de l, son funciones rápidamente oscilantes (dado que sus fases son grandes). Debido a ello, la mayor parte de los términos de la suma (126.2) se reducen entre sí. La suma vendrá determinada, en esencia, por el intervalo de valores de l próximos al valor para el que uno de los exponentes presenta un extremo, es decir, próximos a una raíz de la ecuación 2 doz/dl±O = O. (126.3) En este intervalo se encuentran un gran número de términos de la serie para los que los factores exponenciales conservan valores casi constantes (los exponentes varían lentamente cerca del punto en que se alcanza el valor extremo) y que, por ello, no se reducirán entre sí. Las fases ~1 en el caso cuasiclásico se pueden escribir (véase § 123) como límite al que tiende, para r-+ oo, la diferencia entre la fase r V'+~ f y'{Zm[E-U(r)]-li'(l+i)'Jr'} dr de la función de onda cuasiclásica en el campo U(r) y la fase de la función de onda del movimiento libre, igual a (véase § 33). De esta manera 00 S, = f ¡~v'[2m(E-U)-li (1H) /r ]-k} drH,r(IH)-kro. 2 2 2 (126.4) Esta expresión debe substituirse en la ecuación (126.3). Al determinar la derivada de la integral, hay que recordar que el límite de integración r O depende también de l; pero el término que así se obtiene, k dr 0/dl, se reduce con la derivada del término kr 0 en ~1• El producto h(l+!) es el momento cinético de la partícula. En la mecánica clásica podemos escribirlo en Ja forma mpv, donde e es el « parámetro de impacto », y v la velocidad de la partícula en el infinito. 563 El caso cuasiclásico Efectuando esta substitución, la ecuación (126.3) toma en definitiva la forma: 00 f mvpdr ------- = r2y1[2m(E- U)-(mvp/r)2] !(11::¡:B). (126.5) ro En un campo repulsivo esta ecuación tiene una raíz (para e) solamente para el signo menos delante de () en el segundo miembro, y en un campo atractivo, para el signo más. La ecuación (126.5) coincide exactamente con la ecuación clásica que determina el ángulo de dispersión en función del parámetro de impacto (1). Es fácil cerciorarse también de que para la sección eficaz se obtiene asimismo la expresión clásica (2). El razonamiento que hemos desarrollado prueba que la condición característica de la dispersión clásica para un ángulo dado () se reduce a que sea grande el valor de l para el que se cumple (126.3), y que también sea grande ~1 para este valor de /. Esta condición admite una interpretación física sencilla. Para que sea posible hablar de dispersión clásica en el ángulo () para una partícula incidente con parámetro de impacto e, es necesario que las indeterminaciones mecánico-cuánticas en los valores de uno y de otro sean relativamente pequeñas: Ap ~ p, A8 ~ 8. La indeterminación en el ángulo de dispersión es del orden de A(J "' Ap/p , donde p es el impulso de la partícula y tl.p la indeterminación en el valor de su componente transversal. Dado que Ap "' li/ Ap ~ li/ p, será A8 ~ li/pp, y por ello, en cualquier caso, también B ~ li/pmv. (126.6) Substituyendo el momento cinético mpv por lit, obtenemos ()[ ~ 1, que coincide con la condición ~L ~ 1 (ya que b1 ,_, UJ, conforme se ve teniendo en cuenta (126.3)). El ángulo clásico de desviación de una partícula se puede estimar como razón del incremento transversal del impulso, tl.p, durante el « tiempo de colisión », T ,_, e/v, al valor inicial del impulso mv. La fuerza que actúa sobre la partícula a la distancia e es U' (e); por lo tanto Ap "' lU'(p)/p/v, de modo que 8 ,..., lU'(p)/p/mv 2 • 1 ( ) 2 ( ) Véase tomo I, Mecánica, § 18. El cálculo se efectúa substituyendo la suma respecto del en (126.2) por una integral en un entorno del punto en que el exponente alcanza el extremo. 564 Teoría de las colisiones elásticas Esta estimación es rigurosamente válida tan sólo si el ángulo () ~ 1, pero en orden de magnitud se puede aplicar también hasta () ,-.,.; 1. Substituyendo esta expresión en (126.6), obtenemos la condición para la dispersión clásica en la forma: 1U'(p )Jp 2 ~ ñv. (126.7) Esta desigualdad debe quedar satisfecha para todos los valores además, es IU(e)/ ~ E. e para los que, De la condición obtenida se pueden deducir una serie de consecuencias. Si el campo U(r) disminuye más rápidamente que 1/r, la condición (126.7) deja de cumplirse en cualquier caso para valores e suficientemente grandes. Pero a un valor e grande corresponden· pequeños valores de (); así, pu~s, la dispersión en ángulos suficientemente pequeños no será nunca clásica. Pero si el campo disminuye más lentamente que 1/r, la dispersión en ángulos pequeños será clásica; si en este caso la dispersión es o no clásica para ángulos grandes, depende del carácter de la marcha del campo a distancias pequeñas. Para el campo de Coulomb U= a./r se cumple la condición (126.7) si oc ~ ltv. Esta es la condición contraria a la que permite considerar el campo de Coulomb como una perturbación. Veremos, de todas formas, que por razones puramente casuales la teoría cuántica de la dispersión en un campo coulombiano conduce a un resultado que coincide con el clásico en todos los casos. PROBLEMA Hallar la sección eficaz total de dispersión cuasiclásica en un campo que, a distancias suficientemente grandes, tiene la forma U= a./rn (donde n > 2). Solución. Teniendo en cuenta que el papel principal lo representan las fases '5z correspondientes a grandes valores de /, calculémoslas según la fórmula (123.1): f 00 moc Sz = - /t2 dr ~ny(k2-l2/r2)° (1) l/k Efectuando la substitución 12/k2r 2 obtenemos: 81 = ~. la integral se reduce a la conocida integral de EuLER y mock,n-2 I'(l)r(in-i) =--2/t2Zn-I r(tn) . Substituyendo la suma en (122.11) por una integral, escribiremos: f Q) a = k2 417' o 2lsen281 dl. (2) 565 Dispersión para grandes energías Para efectuar la integración hagamos <5i = u, integremos una vez respecto de u por partes, con lo que la integral se reduce a la función r. Obtenemos así: n-3] a= 21rn/cn-Usen [ f1T.-n-1 r (n-3) -- [r(tn-!)]2/(n-l>(oc ---- )2/(n-u r(tn) n-1 hv (3) La condición de aplicabilidad de esta fórmula es, ante todo, la de que para <5i ,-...., 1 sea / ;$> 1 ; de aquí resulta la desigualdad El campo U(r) debe presentar la forma considerada ya a distancias r ,.._, 1/k ,..., (oc/liv)l/(n-1) (donde les tal que se cumple la condición <5i ,-...., 1), que representan el papel principal en la integral (1). § 127. Dispersión para grandes energías Si Iu¡ no es pequeño comparado con ñ.2jma 2 , es posible una situación en la que la energía de las partículas dispersadas es tan grande que 1U/ ~ E ,. _, (h2/ma2)(ka)2, (127.1) a la vez que, sin embargo, se tiene todavía 1U{ ~ (Ji2/ma2)ka = liv/a Se trata en este caso de un tipo de dispersión de partículas rápidas a la que, con todo, no es aplicable la aproximación de Born (no se cumple ninguna de las condiciones (125.1-2)). Para estudiar este caso cabe utilizar la expresión de la función de onda que encontramos en el § 45 en la forma • z .¡. = elkz exp( - :J U dz) (127.2) -00 (véase (45.9)). Conforme se hizo observar en el § 45, esta expresión es aplicable sólo si z ~ ka 2 ; por lo tanto, no es posible extender, sin más, su validez hasta distancias del centro de dispersión tales que sea ya lícito aplicar la expresión asintótica (122.3). Sin embargo, no hay necesidad de ello: para el cálculo de la sección eficaz de dispersión basta conocer la función de onda a distancias z tales que a ~ ~ z ~ ka 2 ; la integral en el exponente de (127.2) se puede entonces extender hasta oo. Consideremos la dispersión para ángulos pequeños, con una pequeña variación /iq del impulso; debido a que el módulo del vector q(q ~ k) es pequeño, cabe supo- Teoría de las colisione., elásticas 566 nerlo perpendicular al vector de onda de la partícula incidente k, es decir, situado en el plano x, y. La onda dispersada cuyo vector de onda es k' = k+q se obtiene formando la correspondiente componente de Fourier de la función de onda 'lfJ, y la amplitud de dispersión es proporcional a la amplitud de esta componente (1)~ f f,..., ipe-tk'.r dV. En el presente caso, la integración respecto de V se reduce a la integración en el plano x, y: f exp(-:J • f = e 00 (127.3) Udz-iq.p) dxdy, -00 (p es el vector posición en dicho plano). El coeficiente de proporcionalidad se puede obtener pasando al límite para energías tan grandes que se tenga f 00 -1 ñv -oo Ua Udz,..., ~1, ñv de modo que sea aplicable la aproximación de Boro. Efectuando el correspondiente desarrollo del integrando en (127.3), obtenemos f = -C_!_ ñv f e-'Q·PU dV. Comparando con la expresión (125.4), encontramos que (2): e= (127.4) -ik/21r. (1) Esta manera de determinar la amplitud de dispersión es análoga al método aplicado al estudiar la difracción de Fraunhofer, véase tomo 11, Teoría clásica de los campos, § 61. (2) La fórmula (127.3-4) se puede obtener también directamente a partir de la fórmula general (122.10) si se tiene en cuenta que, en el caso considerado, es --f 1 28i = 00 liv Udz -00 (conforme se ve, por ejemplo, partiendo de la expresión (123.1) en la que hacemos r 0 ""' l/k, r""' Vz~+(Jik) 2), y utilizando para grandes valores l y ángulos Opequeños la fórmula (49.6) para los polinomios de Legendre. Mediante la conocida expresión de la función de Bessel, dicha fórmula se escribirá f 2,r Pl( cos 8) = 2_ 21r eHt+lf2>0cos<b o y en (122.10) se pasará de la suma respecto de l a la integración. d</> Dispersión para grandes energías 567 En et§ 125 se indicó ya que la aproximación de Born no es aplicable a la dispersión de partículas rápidas para grandes ángulos si la sección eficaz resulta entonces exponencialmente pequeña. En estas condiciones es inadecuado también el método que hemos expuesro aquí. En realidad, se trata en tales casos oe una situación cuasiclásica a la que no cabe aplicar la teoría de perturbaciones. De acuerdo con las reglas generales de la aproximación cuasiclásica (cf. §§ 52, 53), el exponente en la ley exponencial de decrecimiento de las secciones eficaces de dispersión se puede determinar mediante el estudio de « trayectorias complejas» en el dominio clásicamente inaccesible del movimiento (1). En el problema clásico de la dispersión, la dependencia entre el ángulo de desviación O de la partícula en el campo U(r) y el parámetro de impacto e se determina por la fórmula c:o !(7T+O) = f p dr ' r2,v(l-p2/r2- U/E) (127.5) f"o donde r O es la mínima distancia al centro, raíz de la ecuación 1-p2/r2- U/E= O; (127.6) (véase (126.5)). El caso que nos interesa corresponde al intervalo angular hacia el . que ·una partícula clásica no podría ser desviada (.2). A estos ángulos corresponden, por ello, soluciones complejas e(O) de la ecuación (127.5) (con valores complejos de r 0). Partiendo de la función e((}) obtenida de esta manera y del momento cinético orbital clásico de la partícula, mve, se calcula la acción de acuerdo con S(O) = mv Jp(O) dO, (127.7) (donde v es la velocidad de la partícula en el infinito). La amplitud de dispersión es (127.8) La ecuación (127.6) posee, en general, mas de una raíz compleja. Como valor de r 0 en (127.5) debe tomarse la raíz que conduce al menor valor absoluto de la parte Im S. Además, si la función U(r) presenta singularidades complejas, también éstas deben tenerse en cuenta como posibles valores de rO (3). (1) Para un estudio del coeficiente de la exponencial en esta ley, véase A. Z. PATASHINSKII, V. L. PoKRovsKII, l. M. JALATNIKOV, ZhETF, 45, n.º 10, 1963. (2) El método expuesto es aplicable no sólo para grandes valores de E, sino en general en todos los casos de dispersión exponencialmente pequeña. (") Obsérvese (véase § 125) que si U(r) presenta una singularidad para r real, la disminución de la sección eficaz no se produce, en general, siguiendo una ley exponencial. Teoría de las colisiones elásticas 568 El papel principal en la integral (127.5) lo representa el dominio r ,_, r0 • En estas condiciones, para energías E grandes se puede prescindir del término U/ E del radicando; efectuando la integración, obtenemos entonces: p = To C0St8. (127.9) Si r O es un punto singular de la función U(r ), dicho valor depende solamente de las propiedades del campo, pero no depende ni de e ni de E_. Calculando S de acuerdo con (127.7), encontramos en este caso que la amplitud de la dispersión es 2mv ) f"' exp ( - -li-sen!Ol'mTo . (127.10) En cambio, si para r0 hay que tomar una raíz de la ecuación (127.6), la forma del exponente depende de las propiedades concretas del campo. Así, para la función U = Uoe-(r/a)t (que carece de puntos singulares a distancia finita), de la ecuación U/E= l-p2/T2 ~ sen2!8 se deduce To = iav log([E/Uo]sen2 l8). (127.11) Teniendo en cuenta la débil dependencia con relación a O, r 0 se puede considerar constante en la integral (127.7) y para la amplitud de dispersión obtenemos la fórmula (127.10), con r0 dado por (127.11). § 128. Propiedades analíticas de la amplitud de dispersión Toda una serie de importantes propiedades de la amplitud de dispersión se pueden establecer estudiándola como función de la energía E de la partícula dispersada, considerando formalmente dicha energía como una variable compleja. Consideremos el movimiento de una partícula ~n un campo U(r) que tiende a cero con rapidez suficiente en el infinito -+ el grado exigido de rapidez en la disminución se indicará más adelante. Para simplificar los razonamientos que siguen supondremos primero que el momento cinético orbital de la partícula es l = O. Escribamos la forma asintótica de la función de onda - solución de la ecuación de ScHRODINGER con l = O para un valor E arbitrariamente dado - en la forma x =np = A(E) exp ( - y'(-2mE)) (v'(-2mE)) li r +B(E) exp li r , y consideremos E como una variable compleja; definiremos V- E (128.1) en este caso Propiedades analíticas de la amplitud de dispersión 569 como cantidad positiva para valores reales negativos de E. La función de onda se supone normalizada mediante una determinada condición, cualquiera, por ejemplo por la condición v-i(O) = 1. En el semieje real negativo (E < O), íos factores exponenciales en los dos términos de (128.1) son reales; uno de ellos disminuye parar-+ =, el otro, crece. De la condición de que x sea real se sigue que las funciones A(E) y B(E) son reales para E < O; a su vez, de aquí se sigue que estas funciones toman valores conjugados complejos en dos puntos cualesquiera simétricos respecto del eje real: A(E*) = A*(E), (128.2) B(E*) = B*(E). Pasando del semieje real negativo al semieje real positivo por un camino situado en el semiplano superior, obtenemos una expresión asintótica para la función de onda con E> O en la forma X= A(E)eikr+B(E)e-ikr, k = (128.3) y'(2mE)/li. Si, en cambio, el paso se efectúa en el semiplano inferior, obtendríamos x Dado que x debe A*(E)e--ikr + B*(E)etkr. ser función uniforme de E, esto significa que A(E) = B*(E) para (128.4) E> O; (esta relación se deduce también directamente de la condición de que x sea real para E> O). Sin embargo, debido a la no uniformidad de la raíz E en (128.1), los propios coeficientes A(E) y B(E) son no uniformes. Para evitar esta no uniformidad, cortaremos el plano complejo a lo largo del semieje real positivo. La exisE una función uniforme y garantiza así la uniformidad tencia del corte hace de de la definición de las funciones A(E) y B(E). En estas condiciones, en los bordes superior e inferior del corte estas funciones toman valores que son conjugados complejos (en la expresión (128.3), A(E) y B(E) se toman en el borde superior del corte). V- V Llamaremos hoja física de la superficie de Riemann al plano complejo cortado de la manera indicada. De acuerdo con la definición adoptada, sobre esta hoja tenemos Re y' -E > O. En particular, en el borde superior del corte la función con i VE(1). (128.5) V E así definida coincide (1) A continuación, en todo este párrafo estudiamos las propiedades de la amplitud de dispersión sobre la hoja física. Más adelante, sin embargo, tendremos que considerar en algunos casos también la segunda hoja, « no física », de la superficie de Riemann (véase § 132). Sobre esta hoja Rev'-E < O.. (128.Sa) El paso a la hoja no física a partir del semieje real positivo tiene lugar directamente hacia abajo, « a través del corte». 570 Teoría de las colisiones elásticas En (128.3) los factores eikr y e-ikr, y con ellos también los dos términos en X, son del mismo orden de magnitud; la expresión asintótica de la forma (128.3) es, por lo tanto, siempre válida. En todo el resto de la hoja física, en cambio, el primer término en ( 128.1) disminuye exponencialmente, y el segundo crece, para r -+ oo (en virtud de (128.5)). Por consiguiente, los dos términos de (128.1) resultan ser de diferente orden de magnitud y esta expresión, como forma asintótica de la función de onda, puede resultar no válida - el pequeño término en ella, sobre el fondo del término mayor, puede representar una exageración no justificada de la precisión. Para que la expresión (128.1) sea válida, la razón del término menor al mayor no debe ser menor que el orden de magnitud relativo de la energía potencial (U/E), de la que se prescinde en la ecuación de ScHRODINGER al pasar a la región asintótica. Con otras palabras, el campo U(r) debe satisfacer la condición: U(r) disminuye para r _,,.. oo más rápidamente que (- 2y'(2m) ) li rRey'-E (128.6) Si se cumple esta condición, la expresión asintótica de la forma (128.1) es válida sobre toda la hoja física. Dado que es solución de una ecuación con coeficientes finitos, dicha expresión no presenta singularidades respecto de E. Esto significa que las funciones A(E) y B(E) son regulares sobre toda la hoja física, con excepción del punto E = O; este último, que es el origen del corte, es un punto de ramificación de dichas funciones. A los estados ligados de la partícula en el campo U(r) corresponden funciones de onda que tienden a cero para r-+ oo. Esto significa que debe faltar el segundo término en (128.1); es decir, a los niveles discretos de energía corresponden ceros de la función B(E). Dado que la ecuación de ScHRODINGER posee solamente valores propios reales, todos los ceros de B(E) sobre la hoja física son reales (y situados sobre el semieje real negativo). Las funciones A(E) y B(E) para E> O están ligadas directamente con la amplitud de dispersión en el campo U(r). En efecto, comparando (128.3) con la expresión asintótica de X, escrita en la forma (122. 7), X = constante x [ei(kr+oo> - e-i(kr+oo>], (128.7) vemos que -A(E)/B(E) = La amplitud de dispersión con momento l 1 fo= -.-(e2ioo-l) 2ik = = e2ioo(E>. (128.8) Oes, en cambio, de acuerdo con (122.14), (A + 1 ); li _ 2y'(-2mE) B (128.9) 571 Propiedades analíticas de la amplitud de dispersión A y B se toman aquí sobre el borde superior del corte. Considerando ahora la amplitud de dispersión como función de E en toda la hoja física, vemos que los niveles discretos de la energía no son sino polos simples de esta función. Si el campo U(r) satisface la condición (128.6), la amplitud de dispersión no poseerá entonces, por lo antes dicho, ningún otro punto singular (1). Calculemos el residuo de la amplitud de dispersión en el polo que presenta en un nivel discreto cualquiera E= E 0 < O. Para ello escribamos las ecuaciones a que satisfacen la función x y su derivada respecto de la energía: 2m x"+-(E-V)x=O, óx " 2m óx ) +-(E-U)(cE t,,2 óE t,,2 2m = - -x. n2 Multiplicando la primera por ox/oE, la segunda por X, restando miembro a miembro una de otra e integrando respecto de r, obtenemos: x' :~ -x(:1) ' 2 fx r n7 2 dr. o Apliquemos esta relación para E = E 0 y r -+ oo. La integral del segundo miembro de la igualdad tiende a la unidad para r _,... oo, si la función de onda del estado ligado está normalizada por la condición ordinaria f x2 dr = 1. En el primer miembro, en cambio, substituimos en vez de x la expresión (128.1), teniendo en cuenta al hacerlo que cerca del punto E = E 0 se tiene: A(E) ~ A(Eo) = Ao, = B(E) ~ (E+IEol)[dB/dEJE=Eo = ,B(E+IEol). Obtenemos así: 1 ,B = - J2IEol· m Aoli Mediante estas expresiones encontramos que, cerca del punto E= E 0 , el término principal de la amplitud de dispersión (que coincide con la amplitud para l = O) toma la forma siguiente: != fi2Ao2 1 (128.10) 2m E+IEol (1) Exluido el punto E= O, que es singular en virtud de la singularidad antes indicada de las funciones A(E) y B(E). La amplitud de dispersión, sin embargo, se conserva finita para E-+ O (véase§ 130). En lo que sigue, y para abreviar, no haremos cada vez esta salvedad. 572 Teoría de las colisiones elásticas De esta manera el residuo de la amplitud de dispersión en un nivel discreto viene determinado por el coeficiente A0 en la expresión asintótica (128.11) de la función de onda normalizada del correspondiente estado estacionario. Volviendo al estudio de las propiedades analíticas de ia amplitud de dispersión, consideremos casos en los que la condición ( 128.6) no se cumple. En tales campos, en la expresión ( 128.1) tan sólo el término creciente es la parte correcta de la forma asintótica de la solución de la ecuación de ScHRODINGER sobre toda la hoja física. De acuerdo con esto, se puede afirmar, como antes, que la función B(E) carece de singularidades. En cambio, la función A(E) puede, en estas condiciones, determinarse en el plano complejo solamente como prolongación analítica de la función definida por el coeficiente, en la expresión asintótica de X, sobre el semieje real positivo, donde ambos términos de x son válidos. Dicha prolongación, sin embargo, da ahora, en general, resultados diversos según se efectúe a partir del borde superior o del borde inferior del corte. Para conseguir la uniformidad convendremos en definir A(E) en los semiplanos superior e inferior como prolongación analítica a partir del lado superior y del lado inferior del semieje real positivo, respectivamente; el corte, en estas condiciones, debe prolongarse, en general, a todo el eje real. La función así definida posee, como antes, la propiedad A(E*) = A*(E), pero, en general, no es real ni sobre el semieje real positivo ni sobre el negativo. En principio, dicha función puede también poseer singularidades. Veamos, sin embargo, que, a pesar de todo, existe una categoría de campos para los que la función A(E) carece de singularidades en la hoja física, a pesar de no cumplirse la condición (128.6). Consideraremos para ello x como función de la variable compleja r para un valor dado (complejo) de E. Basta limitarse a valores E en el semiplano superior, ya que los valores de la función A(E) en ambos semiplanos son conjugados complejos entre sí. Para aquellos valores de r para los que Er 2 es un número real positivo, los dos términos de la función de onda (128.1) son del mismo orden, es decir, volvemos a la situación que encontramos para E> O y valores reales de r y en la que ambos términos de la expresión asintótica x son válidos para cualquier campo U(r) que tiende a cero en el infinito. Podemos por ello afirmar que A(E) no puede tener puntos singulares para aquellos valores E para los que U(r) ---+ O, cuando r tiende a oo a lo largo de un rayo sobre el que es Er 2 > O. Cuando E toma todos los valores en el semiplano superior, la condición Er 2 > O aisla el cuadrante inferior derecho Propiedades analíticas de la amplitud de dispersión 573 del plano complejo r. Llegamos así a la conclusión de que A(E) carece también de singularidades en la hoja física cuando U(r) satisface la condición (1): U(r) ~ O, cuando r ~ oo en el semiplano a la derecha. (128.12) Las condiciones (128.6), (128.12) abarcan una categoría muy amplia de campos. Cabe por ello decir que la amplitud de dispersión, por regla general, carece de singularidades en el interior de ambos semiplanos. Con todo, sobre el propio semieje real negativo (que pertenece a la hoja física cuando el corte no pasa por él) la amplitud de dispersión tiene polos que corresponden a las energías de los estados ligados; cuando existe el corte, pueden presentarse. aquí también otras singularidades. Esto último ocurre, en particular, para campos de la forma U = constante X rne-r/a (128.13) (con n cualquiera). En el segmento O < -E < ñ2/8ma2 del semteJe negativo se cumple la condición (128.6), de modo que por él no puede pasar el corte y la amplitud de dispersión tiene aquí únicamente polos, que corresponden a los estados de enlace. Sobre el resto del semieje negativo pueden presentarse también polos « redundantes» y otras singularidades {2). Su aparición está ligada con el hecho de que la función (128.13) deja de tender a cero, cuando r ~ oo a lo largo de un rayo sobre el que Er 2 > O, no bien E cae por debajo del semieje negativo (es decir, dicho rayo pasa a la izquierda de] eje imaginario del plano complejo r). Consideremos ahora las propiedades analíticas de ]a amplitud de dispersión para IEI ~ oo. Cuando E~+ oo a lo largo del eje real, es válida la aproximación de Born y la amplitud de dispersión tiende a cero. De acuerdo con lo antes dicho, esta misma situación se presenta cuando E tiende a infinito en el plano complejo a lo largo de una recta cualquiera arg E= const., si se consideran aquellos valores complejos de r para los que Er 2 > O. Si U----+ O cuando r ~ oo a lo largo de la recta arg r = - t arg E y si U(r) carece de singularidades sobre esta recta, se cumple la condición de aplicabilidad de la aproximación de Born y la amplitud de dispersión tiende a cero, como antes. Cuando arg E toma todos los valores entre cero y n, arg r varía entre O y - tn. Llegamos asi a ]a conclusión de que la amplitud de dispersión tiende a cero en el infinito en todas las direcciones del plano E si la función U(r) carece de singularidades en el semiplano r a la derecha y tiende a cero en el infinito. (1) Dado el carácter real de U(r) sobre el eje real, se tiene U(r*) = U*(r): por ello, el que se cumpla la condición (128. l O) en el cuadrante inferior derecho significa automáticamente que dicha condición se cumple en todo el semiplano a la derecha del eje imaginario. (2) La posibilidad de que existan tales polos « redundantes » para E < O fue puesta de manifiesto por primera vez por S. T. MA (1946). 574 Teoría de las colisiones elásticas Aunque en todo lo que precede hemos hablado siempre de dispersión con momento cinético l = O, en realidad todos los resultados expuestos son válidos también para las amplitudes parciales de dispersión con momento cinético éualquiera no nulo. La diferencia en las conclusiones consiste solamente en que en vez de los factores e± ikr en las expresiones asintóticas de x deberían escribirse las funciones de onda radiales exactas del movimiento libre (33.14) (1). Para l =f= O, hay que introducir algunas modificaciones en las fórmulas (128.9) y (128.10). En vez de(128.7) tenemos ahora: xi= rRi = constante x {exp[i(kr-!l1r+8i)]-exp[-i(kr-!l1r+Sz)]}, y para la amplitud parcial .fi (determinada de acuerdo con (122.14)) obtenemos: f¡, = li ((-l)ZA + 2y'(-2mE) B 1). El término principal en la amplitud de dispersión cerca del nivel E cinético l viene dado, en cambio, por la fórmula f ~ (128.14) (128.15) = E 0 con momento (2l + 1)fiP1(cos 8) = ( -1 )Z+l 1 li 2Ao2 2m E+IEol (2/ + 1)Pz(cos 8) (128.16) en vez de la (128. 10). § 129. Relaciones de dispersión En el párrafo que precede hemos estudiado las propiedades analíticas de las amplitudes parciales de dispersión con valores dados de l. Vimos que estas propiedades se complican por la posibilidad de la aparición de singularidades redundantes y de una irregularidad en el infinito. Las mismas propiedades posee también, evidentemente, la amplitud total considerada como función de la energía para valores dados del ángulo de dispersión. Sin embargo, constituye excepción la amplitud de dispersión correspondiente a ángulo nulo. Conforme demostraremos inmediatamente, sus propiedades analíticas son considerablemente más simples. Escribiendo la ecuación de dispersada en la forma: ScHRODINGER 6t/;+k2tf; = para la función de onda de la partícula (2mU/ft2)tf;, (129.1) (1) Utilizar la forma límite (33.15) de estas funciones es admisible solamente para E> O; en el resto del plano E, donde los dos términos de x son de órdenes de magnitud diferentes, la utilización de estas formas límite introduciría en X un error que, en general, es mayor que el error correspondiente a prescindir de U en la ecuación de ScHRODINGER. 575 Relaciones de dispersión consideraremos dicha ecuación, de manera formal, como una ecuac10n de onda con segundo miembro, es decir, como si se tratase de la ecuación de los« potenciales retardados » conocida por la electrodinámica. La solución de esta ecuación que representa la « radiación » en cierta dirección k' a gran distancia R 0 del centro emisor, tiene, como es sabido, la siguiente forma (1): 1 eikRo tfdisp= - - - - f 47r Ro 2mU ---:;:-t/ie-ik .r dV. lt2 En el presente caso esta expresión representa la función de onda de la partícula dispersada, y el coeficiente de eikR 0 /R 0 es la amplitud de dispersión/(&, E). En particular, haciendo k' = k (k es el vector de onda de la partícula incidente), obtenemos la amplitud de dispersión para el ángulo O: f(O,E) = - _!!:_ 27Th2 f (129.2) Utfie-ikz d V (el eje z está dirigido en el sentido de k). Esta expresión posee, claro está, tan sólo un sentido formal, ya que en el integrando aparece de nuevo la función de onda incógnita. Sin embargo, dicha expresión permite llegar a determinadas conclusiones acerca de las propiedades analíticas de la magnitudf(O, E) como función de la energía E (2). La función 1P que aparece en el integrando se compone, para grandes valores de r, de dos partes: una onda incidente y otra divergente. Esta última es proporcional a eikr, de modo que la parte correspondiente de la integral contiene en el integrando la expresión eik(r-z). Por otro lado, al pasar al plano complejo (a partir del borde superior del corte a lo largo del semieje positivo) ik se substituye por (-2mE)/ñ, siendo en toda la hoja física Re E> O. Dado que r > z, se tendrá Re(ik(r - z)) < O y la integral converge para E complejo cualquiera. En lo que concierne a la onda incidente contenida en '1/J, que es proporcional a eikz, en la parte correspondiente de la integral los factores exponenciales se reducen entre sí de modo que también esta parte converge. V- V La función 1P en la integral (129.2) está determinada unívocamente para E complejo cualquiera como solución de la ecuación de SCHRODINGER que contiene, junto a una onda plana, solamente una parte que se amortigua (para r ~ oo). Por ello, está también determinada unívocamente la integral convergente (129.2), de modo (1) Véase tomo II, Teoría clásica de los campos, § 66. Se supone, claro está, que el campo U(r) tiende a cero parar~ oo con rapidez suficiente para que (cuando E > O) exista f(O, E) (véase § 123). (2) Teoría de las colisiones elásticas 576 que sus singularidades pueden resultar tan sólo como consecuencia de que 1P tienda a infinito. Esto último ocurre en los niveles discretos de energía (1). Es fácil ver también que /(O, E) se conserva finita para !El-+=. Para valores grandes, en la ecuación de ScHRODINGER (129.1) se puede prescindir del término en U, de modo que en 1P queda únicamente la onda plana: 'I.JJ ,..._, eikz. En consecuencia, la integral ( 129 .2) pasa a ser JEJ +,(O oo) = - _!!:_ 1 J 2TTn2 , f U dV ' que coincide, cual debe ser, con la amplitud de dispersión de Born (125.4) para el ángulo O (q = O); designémosla por f n(O). Llegamos así a la conclusión de que la amplitud de dispersión correspondiente al ángulo O es regular en toda la hoja física (incluido el infinito), con la única excepción de los polos forzosos situados sobre el semieje real negativo en los niveles discretos de energía (2), Consideremos la integral 1 2TTi f e f(O,E')-}B dE' E'-E ' (129.3) a lo largo del contorno representado en la fig. 46 y que está formado por una circunferencia de radio infinito, siguiendo luego los bordes del corte a lo largo del semieje positivo. La integral sobre la circunferencia tiende a cero, ya que /(O, =) - f 8 = O; la integración, en cambio, a lo largo de ambos bordes del corte nos da f 00 1 7T o Imf(O,E') ----dE'; E'-E (1) Para evitar posibles confusiones, subrayaremos que se trata aquí de la función de onda total del sistema tp normalizada por la condición de que el coeficiente de la onda plana en su expresión asintótica (cf. 122.3) sea igual a la unidad. En el párrafo anterior, en cambio, se consideraron las partes (tpz) de la función de onda que corresponden a determinados valores de /, suponiendo que las tpz están normalizadas de acuerdo con una condición arbitraria. Si se desarrolla la función total tp en funciones tpl, éstas intervienen en tp con coeficientes que son proporcionales a 1/Bz; así, la función (128.3) con l = O debe aparecer en tp en la forma constante 1 - - - . -[(A+B)etkr_2iBsenkr]. r B Por ello 2 ( ) tp tiende a infinito en los ceros de las funciones Bi(E), es decir, en los niveles discretos de energía. La idea de la demostración expuesta se debe a L. D. FADDEEV (1958). 577 Relaciones de dispersión se ha tenido aquí en cuenta que, en virtud de la definición adoptada en el § 128, la amplitud física de dispersión para valores reales positivos de E se da para el borde superior del corte, mientras que sobre el borde inferior toma el valor conjugado complejo. Por otra parte, según el teorema de CAUCHY, la integral (129.3) es igual a la suma FIG. 46 de f(O, E) - f B y los residuos Rn del integrando en todos los polos E' = En de la función f(O, E'), donde En son los niveles discretos de energía. Estos residuos se determinan mediante la fórmula (128.16) y son iguales a: dn E,.,-R li 2Aon 2 dn = -(-1)ln(2ln+ 1)--, Rn=--, On ?m (129.4) es el momento cinético del estado con energía E 11 ). Obtenemos así 1 foo Im -fi(O E') /(0,E) ~~~E =/B+-;, O """ dE'+ ~ dn E-En. (129.5) n Esta es la llamada relación de dispersión y determina f(O, E) en un punto cualquiera de la hoja física en función de los valores de su parte imaginaria para E> O (O. WONG. 1957; N. KHURI, 1957). Cuando el punto E tiende al borde superior del corte, la integral a lo largo del eje real en (129.5) debe tomarse evitando el polo E' = E por debajo; si esto se hace mediante una semicircunferencia infinitamente pequeña (fig. 47), la correspondiente parte de la integral da, en el segundo miembro de la ecuación (129.5), el valor ilmf(O, E), y la integral que queda desde cero hasta oo debe entenderse en el sentido de valor principal. En definitiva se obtiene la fórmula: f =/B+-P 00 Re/(0,E) 1 7T o lm f(O,E') dE'+ E'-E ¿ --, n dn E-En (129.6) 578 Teoría de las colisiones elásticas que determina para E> O la parte real de la amplitud de dispersión correspondiente al ángulo O en función de su parte imaginaria. Recuérdese que esta última, de acuerdo con ( 124.9), está directamente ligada con la sección eficaz total de dispersión. E -·~~••--~-\.!)--~••--~- º FIG. 47 .§ 130. Dispersión de partículas lentas Consideremos las propiedades de la sección eficaz de dispersión en el caso límite en que las velocidades de las partículas dispersadas son pequeñas. La velocidad se supone tan pequeña, que la longitud de onda de la partícula es grande comparada con el radio de acción a del campo U(r) (es decir, ka ~ 1) y, además, su energía es pequeña respecto de la magnitud del campo dentro de este radio. La resolución de este problema exige determinar la ley límite de dependencia de las fases <5 1 respecto del número de onda k para valores pequeños de este último. Para r :S a, en la ecuación exacta de solamente del término en k 2 : ScHRODINGER ( 122.6) Ri" +2Ri' /r-l(l+ l)Rz/r2 En cambio, en la región en que a ~ r mino en U(r), de modo que queda ~ = 2mU(r)Rz/1i2. se puede prescindir (130.1) 1/k se puede prescindir también del tér- Ri"+2Rz'/r-l(l+l)Rz!r2 = O. (130.2) La solución general de esta ecuación es: (130.3) Los valores de las constantes c1 y c2 se pueden determinar, en principio, tan sólo resolviendo la ecuación (130.1) para la función U(r) de que se trate; dichas constantes, claro está, son diferentes para valores de l distintos. A distancias todavía mayores, r ,._, I/k, en la ecuación de ScHRODINGER se puede prescindir del término en U(r), pero es imposible dejar de tener en cuenta k2, de forma que 2 [ l(l+l)] Rz"+-Ri'+ k2 - - - - Rz = O, r r2 (130.4) es decir, se tiene la ecuación del movimiento libre. La solución de esta ecuación es (véase § 33): 579 Dispersión de partículas lentas Rz (2l+l)!! ( d )lsenkr c1(-l)Z rl --+ k2 l+1 rdr r = +c2(-l)Z ( d )z coskr rl --. (2!-1) !! r dr r (130.5) Los coeficientes constantes se han elegido aquí de tal manera que para kr ~ I esta solución pase a ser la (130.3); con ello se consigue el «empalme» de la solución (130.3) en el dominio kr ~ l con la solución (130.5) en el dominio kr ~ l. Finalmente, para kr Rz ~ ~ l la solución (130.5) toma la forma asintótica (§ 33): sen(kr-!l1r) c1(2l+l)!! + rkl+l c2kl (2!-1)!! r cos(kr-!l1r). Esta suma se puede representar en la forma Rz donde la fase <5 1 se ~ constante x sen(kr-}l1r+81) , (130.6) r determina por la igualdad tan8z l"'-J 81 = c2k2Z+l/c1(2l-1)!! (2l+ 1)!! (debido a que k es pequeño, todas las fases <5 1 (130.7) resultan pequeñas). Según (122.14), las amplitudes de dispersión parciales son 1 fz = 2ik (e2i81- l) ~ Sz/k, y 1legamos a la conclusión de que, en el caso límite de energías pequeñas, se tiene (130.8) Así, pues, todas las amplitudes parciales con l =/= O resultan ser pequeñas comparadas con la amplitud de dispersión con l = O (o, como suele decirse, de la dispersión s). Prescindiendo de ellas, tenemos para la amplitud total f(O) ~ fo = So/k = c2/c1 = -oc, (130.9) de modo que da = ~2 do, y la sección eficaz total vale a = 4rroc2. (130.10) Para velocidades pequeñas la dispersión es isótropa y su sección eficaz no depende 580 Teoría de las colisiones elásticas de la energía de las partículas (1). La amplitud de dispersión puede ser tanto positiva como negativa (2 ). En los razonamientos que preceden se ha supuesto implícitamente que el campo V(r) tiende a cero a grandes distancias (r ~ a) con rapidez suficiente como para que sea lícito prescindir de los términos de que de hecho se ha prescindido. Es fácil determinar cuál debe ser precisamente la rapidez con que ha de disminuir V(r). Para grandes valores de r, el segundo término en la función R1 (130.3) es pequeño comparado con el primero. Para que, a pesar de ello, sea lícito conservarlo, los términos pequeños conservados en la ecuación (130.2) ,..._, c2/r 1+1r 2 deben ser, no obstante, grandes respecto del término UR 1 ,..._, Vc 1r1, del que se ha prescindido al pasar de ( 130.1) a ( 130.2). De aquí se sigue que V(r) debe disminuir más rápidamente que I/r 2l+a para que sea válida la ley (130.8) relativa a la amplitud parcial f1, En parÜcular, el cálculo de f 0 , y, por consiguiente, también el resultado (130.9) acerca de la dispersión isótropa independiente de la energía, valen tan sólo para una disminución de U(r) a grandes distancias más rápida que la de 1/r3 • Si a distancias grandes el campo U(r) disminuye exponencialmente, es posible llegar a determinadas conclusiones acerca del carácter de los demás términos del desarrollo de la amplitud Ji, en potencias de k. Vimos en el § 128 que, en este caso, la amplitud Ji, considerada como función de la variable compleja E, es real para valores negativos reales de E (3). Lo mismo vale, por lo tanto, para la función g 1(E) en la expresión (124.15): fz = 1/(gz-ik) (para E < O, ik es real). Por otro lado, la función gt(E) es real (por definición) para E> O. De esta manera, la función g1(E) resulta real para todos los valores reales de E y, por consiguiente, debe poderse desarrollar en potencias enteras de E, es decir, en potencias pares de k. En cuanto a la propia amplitud .li(k), cabe decir, por lo tanto, que se desarrolla en potencias enteras de ik; todos los términos con potencias pares de k son reales, y los términos con potencias impares de k son imaginarios. De acuerdo con (I 30.8) el desarrollo de fi(k) comienza con un término ,....., <3,/k ,....., k 21 ; por consiguiente, el desarrollo de g 1(k) comienza con un término que es proporcional a k-21 • (l) En la dispersión de electrones por átomos, el papel de la longitud a,.con la que debe compararse 1/k (la condición ka ~ 1), lo representa el radio atómico, que para los átomos complejos alcanza un valor igual a varias veces el radio de Bohr (varias veces el valor n2 /me 2 ). Debido al valor grande de este radio, la sección eficaz es de hecho constante, en este caso, únicamente hasta energías que son del orden de una fracción de electrón-voltio. Para mayores energías de los electrones, en cambio, se manifiesta una fuerte dependencia de la sección eficaz con relación a la energía (el llamado efecto Ramsauer). (2) La cantidad r:,. se suele llamar longitud de dispersión. En la dispersión provocada por una esfera impenetrable (véase problema 1) r:,. coincide con el radio de la esfera. (ª) Para valores E pequeños, la condición (128.6) se cumple ya cuando U disminuye según la ley e-r :a. 581 Dispersión de partículas lentas Si el campo disminuye a grandes distancias según una ley potencial U ~ ¡3,-n con n < 3, el resultado (130.9), que hace de la amplitud una constante, no es válido, conforme ya se indicó. Consideremos la situación que se plantea para diferentes valores de n. Para n < I y velocidades suficientemente pequeñas, para prácticamente todos los valores del parámetro de impacto e se cumple la condición PI U(p)I ~ liv (130.11) y, en consecuencia, la dispersión viene dada por las fórmulas clásicas (cf. la condición (126. 7)). Para 1 < n < 2, la desigualdad ( 130.11) se cumple para valores de e no demasiado grandes; de acuerdo con esto, la dispersión es clásica para ángulos no demasiado pequeños. A la vez existe un intervalo de valores de g para los que PI U(p)I ~ liv, (130.12) es decir, se cumple la condición de aplicabilidad de la teoría de perturbaciones (cf. (125.2)). Para n > 2, a grandes distancias se satisface la desigualdad u¡ 1 ~ fi2/mr2 (130.13) por lo que la contribución a la dispersión resultante de la interacción a estas distancias se puede calcular mediante la teoría de perturbaciones (mientras que a distancias más próximas la condición de aplicabilidad de dicha teoría puede muy bien no quedar satisfecha) (1). Sea r0 un valor de r tal que parar ~ r0 se cumpla la desigualdad (130.13) a la vez que es rO ~ 1/ k. La contribución a la amplitud de dispersión debida al dominio de distancias r ~ r0 viene dada, según (125.12), por la integral: f ñ,2 ro f ~ 00 _ 2mf3 ~ senqr r2 dr = _ rn qr ~ n -3 n2 sent dg. gn-1 (130.14) qro Para 2 < n < 3 esta integral converge en el límite inferior y para velocidades pequeñas (kr 0 ~ I) se puede substituir este límite por cero, con lo que la integral resulta proporcional a q-< 3-·n), es decir, a una potenciá negativa de la velocidad. Esta contribución a la amplitud, por consiguiente, es en este caso la contribución principal, de modo que J ,. ., q-(3-n>, 2 < n < 3. (130.15) (1) En este caso, la dispersión para pequeñas velocidades no es nunca cuasiclásica, ya que la desigualdad (I 30.11) es entonces incompatible con la condición l U(g)¡ ~ E que se exige a la vez. 582 Teoría de las colisiones elásticas Con esto se determina al mismo tiempo la dependencia de la sección eficaz de dispersión respecto de la velocidad de las partículas y del ángulo de dispersión. Paran= 3 la integral (130.14) diverge logarítmicamente en el límite inferior. Con todo, sigue siendo la parte principal de la amplitud de dispersión, de modo que f "' (130.16) n = 3. log(constante/q), Para n > 3 la contribución del dominio r ~ r O disminuye para k -+ O y la dispersión viene determinada por la amplitud constante_· (130.9). Sin embargo, la contribución (130.14) a la amplitud de dispersión, a pesar de su relativa pequeñez, también en este caso presenta un cierto interés en virtud de su carácter «anómalo». La situación «normal», para una disminución suficientemente rápida de U(r), es la posibilidad de desarrollar f(k) en potencias enteras de k. siendo todos los términos reales del desarrollo proporcionales a potencias pares de k. En cambio, integrando (130.14) por partes (disminuyendo así el grado de~ en el denominador) separamos de la integral una parte que contiene potencias pares de k, quedando luego una integral que converge para qr O -+ O, integral que es proporcional a la potencia kn-3 que, en general, no es par (1). PROBLEMAS 1. Determinar la sección eficaz de dispersión de partículas lentas por un pozo de potencial esférico de profundidad U0 y radio a U(r) = - Uopara r< a, U(r) = Opara r Solución. > a. Se supone que el número de onda de la partícula satisface las condiciones ka ~ l = O en la y k ~ x, donde x = V<2mU0 )/ñ. Nos interesa solamente la fase 00 • Haremos por ello l ecuación (130.1) y para la función = rR0 (r) se obtendrá la ecuación x x"+K2x = O parar = a. La solución de esta ecuación que se anula oara r = O (x/r debe ser finito en r X= A senKr Parar> a la función x satisface la ecuación x" +k x = x = B-sen(kr+8o) La condición de continuidad de x' /x en r = O), es: < a). (r 2 = O (la ecuación (130.4) con/= O), de donde (r > a). a nos da: K cot Ka = k cot(ka+8o) ~ k/(ka+8o), (1) Si n es un número impar (n = 2p+ 1), n - 3 = 2p - 2 será un número par. Sin embargo, la integral (130.14) también en este caso contiene una parte« anómala» que da una contribución a la amplitud de dispersión proporcional a q 2P-2 /n q. Dispersión de partículas lentas 583 lo que permite determinar c5 0 • Finalmente, para la amplitud de dispersión obtenemos (1): tan Ka-Ka !=--K Para xa ~ 1 (es decir, U0 ~ h /ma 2 2 esta fórmula nos da ) <1 = ;na2 • (xa)4, de acuerdo con el re- sultado de la aproximación de Born (véase el problema 1, § 125). Si se cambia el signo de U0 (con lo cual hay que cambiar x por ix), obtenemos la amplitud de díspersión por una « colina de potencial »: tanhKa-Ka !=--K En el caso límite xa ~ 1 se tiene: f = - a, cr = 47Ta2 ~ este resultado corresponde a la dispersión por una esfera impenetrable de radio a; obsérvese que la mecánica clásica daría un valor cuatro veces menor (<1 = na2). 2. U = Determinar la sección eficaz de dispersión de las partículas de pequeña energía en el campo > O, n > 3. fY..jrn, fY.. Solución. La ecuación (130.1) con l = O se escribe: x" -y2x/rn = o, y = v(2mC1-)/ñ. Mediante las substituciones X= r = [2y/(n-2)x]2/(n-2> </>vr, dicha ecuación se reduce a la forma d2<f> +~ d</>-(1+ dx 2 xdx l )<1> (n-2)2x2 = o, es decir, a la ecuación de Jas funciones de Bessel de orden 1/(n - 2) y argumento imaginario ix. La solución que se anula en r = O (es decir, para x = oo), es, salvo un factor constante: X = yrH1¡(n-2)<1l(2iyr-Cn-2l/2/(n-2)). Mediante las conocidas fórmulas Hpm(z) = i[e-iPTTj p(z)-]-p(z)]/sinp7T, Jp(z) "'zP/2PI'(p+ 1) (z ~ 1), (1) Esta fórmula deja de ser aplicable si la amplitud y la profundidad del pozo son tales que xa es próximo a un múltiplo impar de n/2. Para tales valores de xa, en el espectro discreto de niveles negativos de la energía se tiene un nivel próximo a cero (véase problema J, § 33), y la dispersión viene descrita por fórmulas que se obtendrán en el párrafo siguiente. 584 Teoría de las colisiones elá.~ticas obtenemos para la función x a grandes distancias (y ~ r ~ 1/k) una expresión de la forma x = const.(c1r+c2), y de la razón c2/c1 deducimos para la amplitud de dispersión: f -(_2'.__)2/(n-2lr((n-3)/(n-2)]_ n-2 I'[(n-1)/(n-2)] = 3. Determinar la amplitud de dispersión de las partículas lentas en un campo que disminuye a grandes distancias según la ley U~ f],-n, 2 < n < 3. Solución. El término principal en la amplitud de dispersión viene dado por la expresión (130.14), en la que el límite inferior de la integral se puede substituir por el valor cero. El cálculo de la misma conduce ai resultado: TTm/3 != t,,2 qn-3 I'(n-1) cos }TTn' 2 < n < 3, (1) yparan=3 f= 2mf3 constante --log--. t,,2 q (2) Desarrollando (1) en polinomios de Legendre se pueden obtener las amplitudes parciales de dispersión (definidas por (122.12)): fz = - yTTm/3 I'(!n-l)I'(l-!n+l) 2/i2 I'(!n)I'(!n+i+l) kn-3. (3) Paran> 3 la misma fórmula (1) determina la parte «anómala» de la amplitud de dispersión. En las amplitudes parciales, en cambio, la cantidad (3) es siempre la parte principal para aquellos valores de l para los que 2/ > n - 3; en vez de (130.8) tenemos entonces !, (X kn-a. § 131. Dispersión de resonancia para pequeñas energías La dispersión de partículas lentas (ka ~ 1) en un campo atractivo requiere consideración aparte cuando en el espectro discreto de niveles negativos de energía se tiene un estados cuya energía es pequeña comparada con la magnitud del campo dentro de los límites de su radio de acción a. Designaremos este nivel por e(s < O). Dado que la energía E de la partícula dispersada es una cantidad pequeña, su energía es próxima al nivel e, es decir, se encuentra, como suele decirse, casi en resonancia con el mismo. Esto conduce, como veremos, a un considerable aumento de la sección eficaz de dispersión. La existencia de un nivel poco profundo se puede tener en cuenta en la teoría de la dispersión mediante un método formal que se basa en las siguientes consi- Dispersión de resonancia para pequeñas energías 585 derac10nes. En la ecuación de SCHRODINGER x" +(2m/h2 )[E-U(r)]x = O (x = rR 0) se puede prescindir de E (en virtud de la condición ka ~ 1) en la región r ,.._,a: r,..., a. x"-(2m/h2 )U(r)x = O, Por el contrario, en el dominio «exterior» (r de U: ~ a) x" +(2m/h2)Ex = O, r (131.1) se puede prescindir, en cambio, ~ a. (131.2) La solución de la ecuación (131.2) debería «empalmarse» para un cierto valor r1 (tal que 1/k ~ r 1 ~ a) con la solución de la ecuación (131.1) que satisfa~e la condición de contorno x(O) = O; la condición de empalme se traduce en la continuidad de la razón x' /X, que no depende del factor de normalización general de la función de onda. Sin embargo, en vez de estudiar el movimiento en el dominio r ,.._, a, imponemos a la solución en el dominio exterior una condición de contorno, elegida de manera adecuada, relativa a x' /x y para valores de r pequeños; dado que la solución exterior varía lentamente para r -+ O, esta condición puede referirse formalmente al punto r = O. La ecuación (131.1) en el dominio r ,_, a no contiene E; por consiguiente, la condición de contorno que la substituye tampoco debe depender de la energía de la partícula. Con otras palabras, debe ser de la forma [x' /x]r""'a = - K, (131.3) donde x es una cierta constante. Pero ya que x no depende de E, esta misma condición (131.3) debe valer para la solución de la ecuación de ScHRODINGER correspondiente a una pequeña energía negativa E= - ls!,.es decir, a la función de onda del correspondiente estado estacionario de la partícula. Para E= - Is! se deduce de (131.2): X = constante x e-rv(2mlell/1í, y la substitución de esta función en (131.3) prueba que " es una cantidad positiva, igual a (131.4) Apliquemos ahora la condición de contorno (131.3) a la función de onda del movimient_o libre: x= constante xsen(kr+8o), 586 Teoría de las colisiones elásticas que es la solución general exacta de la ecuación ( 131.2) para E> O. Como resultado obtenemos para la fase buscada, '50 , cotSo = -K/k (131.5) Dado que la energía E está limitada aquí exclusivamente por la condición ka ~ 1, pero no tiene por qué ser pequeña comparada con s, la fase '50 puede resultar ser una cantidad no pequeña. En cambio, las fases <5 1 con l-=/=- 1 siguen siendo pequeñas, como antes. Por consiguiente, en la amplitud de dispersión se puede prescindir, como se hizo anteriormente, de todos los términos con l-=/=- O, de modo que la dispersión resulta isótropa. Substituyendo (131.5) en la fórmula 1 -(e2i8o-l) f ~ - 2ik = 1/k(cotSo-t), obtenemos para la amplitud de dispersión la expresión f = (131.6) -1/(K+ik) y para la sección eficaz total: (J 4-rr 27Tlí2 1 K2+k2 m E+IEI = --- = -----. (131.7) Así, pues, la sección eficaz de dispersión elástica depende de la energía, y en el dominio de una resonancia (E ,...., !.si) es grande comparada con el cuadrado del radio de acción del campo, a2 , (ya que ka ~ 1). La fórmula (131. 7) fue obtenida por E. WIGNER (1933); la idea del razonamiento expuesto aquí se debe a H. BETHE y R. PEIERLS (1935). La fórmula obtenida posee un carácter algo más general que el correspondiente a la hipótesis hecha para deducirla. Sometamos la función U(r) a una variación pequeña; con ello varía también el valor de la constante x en la condición de contorno (131.3). Mediante un cambio adecuado de U(r) puede lograrse anular x, transformándola luego en una pequeña cantidad negativa. En estas condiciones, obtenemos la misma fórmula (131.6) para la amplitud de dispersión y la misma fórmula (131. 7) para la sección eficaz. Sin embargo, en esta última la cantidad 1€1 = n2K2/2m es ahora simplemente una constante característica del campo U(r), Dispersión de resonancia para pequeñas energías 587 pero en modo alguno un nivel de energía en dicho campo. En tales casos se dice que en el campo se tiene un nivel virtual, considerando que aunque en realidad no existe· ningún nivel próximo a cero, con todo, una pequeña variación del campo sería suficiente para que apareciera un tal nivel. Mediante la prolongación analítica de la función (131.6) en el plano complejo E, sobre el semieje real negativo ik se transforma en 2mEYh (véase § 128), y vemos así que la amplitud de dispersión tiene un polo en E= - \si, de acuerdo con los· resultados generales del § 128. Por el contrario, cual debe ser, a un nivel virtual no corresponde sobre la hoja física ninguna singularidad de la amplitud de dispersión (sin embargo, la amplitud de disper~ión tiene un polo E = - !si en la hoja no física: véase la nota de la pág. 569). ve- Desde un punto de vista formal, la fórmula (131.6) corresponde al caso en que en la expresión (124.15) /o= 1 go(k)-ik' el primer término del desarrollo de la función g 0(k) es negativo y excepcionalmente pequeño. Para hacer la fórmula más precisa puede tenerse en cuenta el término siguiente del desarrollo, escribiendo: 1 /o=----Ko+!rok2-ik (131.8) (L. LANDAU, IA. SMORODINSKII, 1944); recordemos que para una disminución del campo suficientemente rápida, las funciones gi(k) se desarrollan en serie de potencias pares de k - véase § 130. Designamos aquí por - K 0 la cantidad g0(0) a fin de conservar la notación K para la cantidad (131.4), ligada con el nivel de energía s. De acuerdo con lo antes dicho, K se define como el valor - ik = K que anula el denominador de (131.8), es decir, como igual a la raíz de la ecuación (131.9) El término correctivo ro/(2/2 en el denominador de (131.8) es pequeño comparado con K 0 en virtud de la hipótesis de que k es pequeño, pero posee de suyo un orden de magnitud « normal »: el coeficiente r O ,...._, a (este coeficiente es siempre positivo - véase problema 1). Hay que subrayar que tener en cuenta este término constituye una mejora válida de la fórmula para la amplitud de dispersión cuando se prescinde de las contribuciones debidas a los momentos l =/= O: da en f una corrección cuyo orden relativo es ak, mientras que la contribución de la dispersión con l = 1 588 Teoría de las colisiones elásticas es del orden relativo de (ak) 3 ( 1). Para la sección eficaz de dispersión tenemos, en virtud de (131.8): a= ~~~-~~- o- ! ro k 2) 2 + k 2 • Si se prescinde en el denominador del término ,._, k 4 (aunque puede conservarse), cabe escribir esta fórmula (teniendo en cuenta (131.9)) en la forma (K O' 47r(l +roK) 41rli 2 1+roK = -k-2+-K2-- = -;;;- E+ 1€1 · (131.10) Consideremos brevemente la resonancia en la dispersión con momentos cinéticos orbitales diferentes de cero. El desarrollo de la función g 1(k) empieza con un término ,_, k-21 ; conservando los dos primeros términos del desarrollo, escribiremos la amplitud parcial de dispersión en la forma 1 (131.11) fz = - bE-E(-E+E)+ik' donde by s son dos constantes y b > O (véase más adelante). Al caso de resonancia corresponde un valor anómalamente pequeño del coeficiente de E- 1 es decir, un valor s excepcionalmente pequeño. Sin embargo, debido a que E es pequeño, el término bsE-1 puede, de todas maneras, resultar a la vez grande comparado con k. Si E < O, el denominador de la expresión (131.11) posee una raíz real E,;;;;; - \si, de modo que s es un nivel discreto de energía (con momento cinético l) (2). Sin em(1) Para k-+ O la amplitud fo-+ - 1/Ko, es decir, 1/,co coincide con la longitud de dispersión ex introducida en ~l párrafo anterior. El coeficiente de r 0 en la fórmula go(k) =k cotoo = -1/ex+!rok2 (131.8a) se llama radio efectivo de la interacción. Daremos los valores de las constantes ex y r,, para el caso importante de la interacción de dos nucleones. Para un neutrón y un protón con spins paralelos (estado isotópico T = O) es ex = 5,39-10-13 cm, r0 = 1,70· 10-13 cm; a estos valores corresponde un nivel real con energía lcl = 2,23 Me V - el estado fundamental del deuterón. En cambio, para un neutrón y un protón, con spins antiparalelos (estado isotópico T = 1) es ix = - 23,7· 10-13 , r0 = 2,67· 10-11 cm; a este valor corresponde un nivel virtual /e/ = 0,067 Me V. En virtud de la invariancia isotópica, estos últimos valores deben corresponder también al sistema de dos neutrones con spins antiparalelos (el sistema nn en un estado s no puede, en modo alguno, poseer spins paralelos, en virtud del principio de PAULI). (2) Para e< O y E próximo a e: La comparación con (128.16) prueba que b > O. Dispersión de resonancia para pequeñas energías bargo, en contraposición a la resonancia no es nunca grande comparado con a; la con momento cinético l + 1 resulta ser tan la amplitud de la dispersión sin resonancia 589 en la dispersión-s, la amplitud (131.11) amplitud de la dispersión de resonancia sólo del mismo orden de magnitud que y con momento cinético /. En cambio, si e > O, la amplitud ( 131.11) alcanza en el dominio E ""' e el orden de magnitud de 1/k, es decir, llega a ser grande comparada con a. La anchura relativa de este dominio es pequeña: b..E/e ""'(ak) 21- 1 . Se presenta en este caso, por consiguiente, una resonancia muy acentuada. Este comportamiento de la dispersión de resonancia está ligado con el hecho de que un nivel positivo con 1-=/=- O, si bien no es un nivel discreto real, representa sin embargo un nivel « cuasi discreto »: gracias a la existencia de la barrera de potencial centrífuga, la probabilidad de que una partícula con energía pequeña escape de este estado al infinito es pequeña, de modo que la «vida» del mismo es grande (véase § 132) (1 ). Es ésta precisamente la causa de la diferencia entre el carácter de la dispersión de resonancia para ! -=/=- O y el de la dispersión de resonancia en un estado-s, en el que no existe barrera centrífuga. Finalmente, he aquí una interesante propiedad de las fases IJ 1 que se puede establecer fácilmente a partir de los resultados antes expuestos. Consideremos las fases IJ 1(E) como funciones continuas de la energía, sin limitarlas al intervalo entre O y n (cf. la nota de la pág. 127). Demostraremos que entonces se cumple la igualdad oz(O)-Sz(oo) = (131.12) n1r, donde n es el número de niveles discretos con momento cinético len el campo de atracción U(r ). Observemos para ello que en un campo que satisface la condición Iu¡ ~ li 2/ma 2, la aproximación de Born es aplicable para todas las energías, de modo que IJ 1(E) ~ 1 cualquiera que sea E. En estas condiciones, /J¡( =) = O, ya que, para E-+ = la amplitud de disp:;!rsión tiende a cero; por otra parte, se tiene /Ji(O) = O, de acuerdo con los resultados generales del § 130. A la vez, en un campo de estas características no existen niveles discretos (véase § 45), de modo que n = O. Veamos ahora cómo varía la diferencia /J 1(b..) -IJ¡( =) (donde b.. es una cantidad pequeña dada) al «ahondarse» gradualmente el pozo de potencial U(r). A medida que aumenta la profundidad, aparecen sucesivamente en el límite superior del mismo los niveles l.º, (1) Si E > O, el denominador en (131.1 l) se anula para E = E 0 r = 2y(2m) el+l/2. bñ - iff/3), donde (131.lla) Este polo de la amplitud de dispersión se encuentra, sin embargo, sobre la hoja « no física ». La pequeña cantidad r es la anchura del nivel cuasidiscreto (véase§ l 32). 590 Teoría de las colisiones elásticas 2.º, etc. La fase <51(~) experimenta entonces cada vez un aumento den (1). Una vez alcanzado el U(r) dado, y haciendo luego que ~-+ O, obtenemos la fórmula (131.12). PROBLEMAS l. Expresar el coeficiente , 0 en la fórmula (131.8) mediante la función de onda del estado estacionario E = e en la región en que r ,..._, a (IA. A. SMORODINSKII, 1948). Solución. Determinando el residuo de la función (131.8) en el polo E= e y comparando con la fórmula (138.10), encontramos que: 1 - Ao 2 = 1 --lro, 2K donde A 0 es el coeficiente en la función x = A 0e-Kr en el dominio r ~ a. Sea Xo la función de onda en la región r ,..._, a, normalizada por la condición xo-+ 1 para r-+ oo. El cuadrado de la función de onda se puede entonces escribir, en todo el espacio, en la forma X2 = Ao2(e-2Kr + A02e-2Kr (esta expresión se reduce a para normalizar mediante la condición: f x• KT ~ 1 y a A02xu2 para f 00 xo2-1) Kr ~ 1). Este cuadrado se debe 00 dr = Ao•(z~ - o (1-xo•) dr) 1, o y la comparación con la expresión antes escrita para A0 2 nos da: f 00 ro = 2 (1-x02) dr. o De la ecuación (131.1) con U(r) < O, cuya solución es la función Xo, se sigue que xo(r)<xo(oo)= l. Por ello, siempre es r0 > O. 2. Determinar el cambio de las fases <5z en una variación del campo U(r). Solución. Variando U(r) en la ecuación de 2m[ SCHRODINGER J l(l+l) xz"+-¡¡;: E- _r_2_ -U obtenemos 2m[ l(l+l) J Xl = o, 2m 8xz"+- E----U 8xz = -xzSU. fi2 y2 fi2 (1) En la fórmula (l 31.5) corresponde a ello la variación de ó0 desde O a n, cuando, para un valor dado de k pequeño, la cantidad K pasa del valor negativo - K ~ k al valor positivo K ~ k. En el caso I =l= O, lo mismo se sigue de la fórmula k ctg ói = - bE-l(E- E), cuando, para un valor dado E= ~. e varía de e ~ ~ a - e ~ ~- Resonancia en un nivel cuasidiscreto 591 Multiplicando la primera ecuación por ox1., la segunda por Xi, restando los resultados miembro a miembro e integrando respecto de r, se encuentra: [xi8xz'-xz'8xi]r-+00 -J 2m = 00 l;,2 xi28U dr. o Substituyendo en el primer miembro de la igualdad las expresiones asintóticas xz = sen(kr-!i7T-8z), 8xz = 8(8z)cos(kr-!Z1r+8z) (eligiendo igual a 1 el coeficiente en esta expresión se consigue la normalización que hemos adoptado aquí para xz), obtenemos 8(8z) = - 2 f 00 m kñ2 xi28U dr. o Basándose en esta fórmula es posible llegar a determinadas conclusiones acerca del signo de las fases <5i consideradas como funciones continuas de 13: energía. Para evitar la indeterminación en la definición de estas funciones (una constante aditiva múltiplo de n) las normalizaremos mediante la condición '5z(=) = O. Partiendo de U= O, cuando todas las Oz = O, y aumentando progresivamente IU!, encontramos que en un campo repulsivo ( U > O) todas las Oz < O, y que en un campo atractivo ( U < O) es <5, > O. En un campo repulsivo <5z (O)= O, por lo que, para pequeñas energías, las o, son pequeñas; por consiguiente, la amplitud de dispersión es negativa: f ~ 00 /k < O. En un campo de atracción, cabe llegar a la misma consecuencia acerca del carácter negativo de f únicamente en el caso en que no existen niveles; en el caso contrario, para valores E pequeños las fases o, no son próximas a cero, sino a nn (véase (131.12)) y nada puede deducirse acerca del signo de f. § 132. Resonancia en un nivel cuasidiscreto Un sistema que es suceptible de desintegrarse no posee, estrictamente hablando, un espectro discreto de energías. La partícula que escapa del mismo en la desintegración escapa al infinito; en este sentido, el movimiento del sistema es infinito, por lo que el espectro energético es continuo. Sin embargo, puede ocurrir que la probabilidad de desintegración del sistema sea muy pequeña. El ejemplo más simple de ese tipo de movimiento lo ofrece una partícula rodeada de una barrera de potencial suficientemente alta y ancha. Otra causa de metaestabilidad de los estados puede serlo la necesidad de que el spin del sistema cambie en la desintegración, cambio que resulta de una débil interacción spin-órbita. Para estos sistemas, cuya probabilidad de desintegración es pequeña, se puede 592 Teoría de las colisiones elásticas introducir el concepto de estados cuasiestacionarios en los que las partículas se mueven durante largo tiempo « dentro del sistema », abandonándolo tan sólo después de transcurrido un considerable intervalo r, que se puede llamar «vida» del estado dado casi estacionario (r ,.._, I/w, donde w es la probabilidad de desintegración por unidad de tiempo). El espectro energético de estos estados será « cuasidiscreto »; está constituido por una serie de niveles difuminados, cuya « anchura » r está Jigada con la vida por la relación r ,.._,/i/r (véase (44.7)). Las anchuras de los niveles cuasidiscretos son pequeñas comparadas con las distancias que los separan. Al estudiar los estados cuasiestacionarios se puede aplicar el siguiente método formal. Hasta aquí hemos considerado siempre soluciones de la ecuación de SCHRODINGER con la condición de contorno de que la función de onda sea finita en el infinito. En vez de esto buscaremos ahora soluciones que representan en el infinito una onda esférica divergente; ésta corresponde a una partícula que escapa finalmente del sistema en la desintegración del mismo. Dado que una tal condición de contorno es compleja, no es posible ya afirmar que los valores propios de la energía deben ser reales. Por el contrario, como resultado de la resolución de la ecuación de SCHRODINGER obtenemos un conjunto de valores complejos que escribiremos en la forma: E= Eo-!ir, (132.1) donde E 0 y r son dos cantidades positivas (véase más abajo). Es fácil ver en qué consiste el sentido físico de los valores complejos de la energía. El factor temporal de la función de onda de un estado cuasiestacionario tiene Ja forma: e-<i!li)Et = e-<iflilEate-(I' /li)t/2, Por ello, todas las probabilidades, que vienen determinadas por los cuadrados del módulo de la función de onda, disminuyen con el tiempo según la ley e-<rr11,)t (1). En particular, de acuerdo con esta ley disminuye también la probabilidad de encontrar la partícula « dentro del sistema». Así, pues, r determina la duración de la vida del estado; la probabilidad de desintegración por unidad de tiempo es igual a w = r;n. (132.2) A grandes distancias, la función de onda de un estado cuasiestacionario (onda divergente) contiene el factor exp [iry {2m( Eo -iir) }/li], (1) Observemos que de aquí resulta patente la necesidad física de que I' sea positiva. Por lo demás, positiva resulta ser automáticamente (como es posible demostrar a partir de la ecuación de onda) en virtud de la condición impuesta en el infinito. 593 Resonanda en un nivel cua.~idiscreto que crece exponencialmente para r-+ 1 .'-E ( O - 2/·1') < O\I· = (la parte imaginaria de la raíz es lm l Por ello la integral de normalización Ji tpj 2 d V para estas funciones es divergente. Observemos, sin embargo, que esta circunstancia resuelve la aparente contradicción entre la disminución del cuadrado \1pj 2 con el tiempo y el hecho de que la integral de normalización debe ser una cantidad constante, conforme se sigue de la ecuación de onda. Veamos cuál es la forma de la función de onda que describe el movimiento de una partícula cuya energía es próxima a uno de los niveles cuasidiscretos del sistema. Como en el § 128, escribiremos la forma asintótica (a grandes distancias) de la parte radial de la función de onda en la forma ( 128.1) Rz 1[ = ; ( Az(E)exp - v(-2mE) ) (v(-2mE) )] li r +Bz(E)exp li r , (132.3) y consideraremos E como una variable compleja. Para valores reales positivos de E, es: 1 Rz = -[ Az(E)efkr + Bz(E)e-ikr], r k = y(2mE)/li, (132.4) donde A 1(E) = B1*(E) (véase ( 128.3-4)); la función Bi(E) se toma aquí en el borde superior del corte, practicado a lo largo del semieje real positivo. La condición que determina los valores propios complejos de la energía se traduce en que en la expresión asintótica (132.3) no exista la onda convergente. Esto significa que para E = E 0 - VI' debe anularse el coeficiente B¡(E): Bz(Eo-lif) = O. (132.5) De esta manera los niveles cuasidiscretos de energía, como los niveles realmente discretos, son ceros de la función B1(E). Sin embargo, a diferencia de los ceros que correspondan a niveles reales, dichos ceros no se encuentran sobre la hoja física. En efecto, al escribir la condición ( 132.5) hemos supuesto que la función de onda buscada del estado cuasiestacionario procede del mismo término de ( 132.3) que representa la onda divergente ( ,...,_, eikr) también para E> O ( 132.4). Pero el punto E = E 0 - vr está situado por·debajo del semieje real positivo. Llegar a este punto a partir del borde superior del corte (sobre el que están definidos los coeficientes en I 32.4)), sin salir por ello de la hoja física, es sólo posible rodeando el punto E = O. Sin embargo, entonces V- E cambia de signo, de modo que la onda divergente se transforma en la convergente. Por consiguiente, para que se conserve el carácter divergente de la onda el paso debe efectuarse directamente hacia abajo, 594 Teoría de las colisiones elásticas atravesando el corte, de forma que vamos a parar a la otra hoja, la « no física ». Consideremos ahora los valores positivos reales de la energía próximos a un nivel cuasidiscreto (con ello, claro está, se supone que r es pequeña; en el caso contrario, esta proximidad sería totalmente imposible). Desarrollando la función Bi(E) en potencias de la diferencia E - (E0 - HI') y limitándonos al término de primer orden, haremos (132.6) Bz(E) = (E-Eo+tir)bz, donde b1 es una constante. Substituyendo este resultado en (132.4), obtenemos la siguiente expresión para la función de onda de un estado próximo a un estado cuasiestacionario (1): La fase <'5 1 1 -[(E-Eo-tir)bi*eikr + (E-Eo+iir)bze-ikr]. r de esta función viene dada por la fórmula Rz = (132.7) E-Eo-iir e2io, = e2io,< 0 J_ _ __ E-Eo+iir r (1- E-Eo+izT ' = e2io/ 0 > i (132.8) ) donde (132.9) (cf. (132.7) con (122.8~9)). Para jE - E 0 f ~ r la fase <51 coincide con que <5/0 > es el valor de la fase « lejos de la resonancia». <5/0), de modo En el dominio de la resonancia <51 depende fuertemente de la energía. Si se escribe la fórmula (132.8) en la forma (2): Sz = Sz<0> + arctg (1) Para E= Eo - Hr r 2(E-Eo) , (132.10) la función (132.7) se reduce a lbzl 2 = 1/ñvr. Si se normaliza la función de onda por la condición de que sea igual a la unidad la integral de /tp/ 2 extendida al dominio « interior al sistema», la corriente total en esta onda divergente, igual a vlirh*i/2, debe coincidir con la probabilidad de desintegración ( 132.2). De aquí se sigue: 2 ( ) Utilizamos la fórmula e2ítan- 1 A eitan- 1 A 1 + i'A ritan-1 A 1-iA = ___ = - - . Resonancia en un nivel cuasidiscreto 595 se ve desde luego que al atravesar el dominio de la resonancia (de E~ E 0 a E~ E 0) la fase varía en n. Los resultados obtenidos permiten determinar la amplitud de la dispersión elástica de una partícula cuya energía E es próxima a un nivel cuasidiscreto E 0 del sistema compuesto formado por el sistema dispersor y la partícula dispersada. En la fórmula general (122.10), hay que substituir la expresión (132.8) en el término con el valor de l al que corresponde el nivel E 0 • Obtenemos entonces: 21+ 1 tr . e2io1< lPz(cosB), E-Eo+tzr 0 f(B) = J<O>(B)- - - • k (132.11) donde ¡<0 >(()) es la amplitud de dispersión lejos de la resonancia, amplitud que no depende de las propiedades del estado cuasiestacionario (viene determinada por la fórmula (122.10) con /J 1 = /JzC0 > en todos los términos de la suma) (1). La amplitud ¡<0>(()) se suele llamar amplitud de la dispersión potencial, y el seguhdo término en la fórmula (132.11), amplitud de la dispersión resonante. Esta última posee un polo para E= E 0 - ! iI' que, de acuerdo con lo dicho antes, no se encuentra sobre la hoja física (2). La fórmula (132.11) determina la dispersión elástica en el dominio de la resonancia correspondiente a un nivel cuasidiscreto del « sistema compuesto». El intervalo en que es aplicable viene determinado por la condición -de que la diferencia jE - E 0 \ sea pequeña respecto de la distancia D entre niveles cuasidiscretos vecinos: IE-Eol ~ D. (132.12) Esta fórmula se simplifica algo si se trata de la dispersión de partículas lentas, es decir, si la longitud de onda de las partículas en el dominio de la resonancia es grande comparada con las dimensiones del sistema dispersor. Desde este punto de vista, importa tan sólo la dispersión s; supondremos que el nivel E 0 corresponde precisamente a un movimiento con l = O. La amplitud de la dispersión potencial se reduce ahora a una constante real ex. (véase § 130) (3). En cambio, en la amplitud de la dispersión resonante supondremos l = O y substituiremos e2i 0/ 0 ' por la unidad, ya que 80 <o> = - ock ~ 1. Obtenemos así: tr f(B) = -oc- k(E-Eo+iir) (132.13) Si se trata de la dispersión de una partícula cargada por un sistema que posee carga, para.las fases hay que utilizar la expresión (133.11 ). · (2) Obsérvese que la fórmula (131.11) para la dispersión resonante de partículas lenta_s en un nivel O, cuando E es próximo a E, corresponde exactamente al término de resonancia en ( 132.1_1 ). positivo con l Los valores E 0 y I' vienen entonces dados por las fórmulas ( 131.11 a), y teniendo en cuenta que E es pequena, la fase S1<0J es pequeña, de modo que e2íB¡(O) ~ 1. 1 ( ) Ó¡(º) * (ª) Se supone que el campo dispersor disminuye con rapidez suficiente con la distancia. Los resultados expuestos se aplicarán en el § 142 a la dispersión de los neutrones lentos por núcleos. 596 Teoría de las colisiones elásticas En un estrecho intervalo \E - E 0 \ ,..._, r, el segundo término es grande comparado con la amplitud x y debe prescindirse de ésta. Sin embargo, al alejarse del punto de resonancia, ambos términos pueden llegar a ser comparables. Al deducir estas conclusiones se supuso implícitamente que el propio valor del nivel E 0 no es demasiado pequeño y que la región de resonancia no se encuentra en la vecindad del punto E = O. Pero si se trata de la resonancia en el primer nivel cuasidiscreto del sistema compuesto, nivel que se encuentra a una distancia del punto E= O que es pequeña comparada con la distancia al nivel siguiente (E0 ~ D), el desarrollo ( 132.6) puede no ser válido; esto se manifiesta ya en que la amplitud (132.13) no tiende a un límite constante para E-+ O, como exige la teoría general en el caso de la dispersión-s. Consideremos el caso de un nivel cuasidiscreto próximo a cero, suponiendo de nuevo que en el dominio de resonancia las partículas dispersadas son tan lentas que únicamente importa la dispersión-s. El desarrollo de los coeficientes B1(E) de la función de onda debe efectuarse ahora en serie de potencias de la propia energía E. El punto E = O es un punto de ramificación de las funciones Bl(E), y al rodearlo, pasando del borde superior al inferior del corte, B1(E) se transforma en B 1*(E). Esto significa que el desarrollo se efectúa t;n serie de potencias de V- E, que cambia de signo al rodear dicho punto. Representemos los primeros términos del desarrollo de la función Bo(E) para valores reales positivos de E en la forma: Bo(E) = (E-Eo+in!E)bo(E), (132.14) donde E0 y y son constantes reales y bo(E) es una función de la energía que se puede también desarrollar en serie de potencias de V E, pero que carece de ceros en qn entorno del punto E= O (1). Al nivel cuasidiscreto E= E 0 - ! iI' corresponde la anulación del factor E - E0 +iy V E prolongado al semiplano inferior de la hoja no física; por consiguiente, para determinar E 0 y r tenemos la ecuación (132.15) (las constantes E0 y y deben ser positivas para que resulten positivas E 0 y r). Así, a un nivel de anchura r ~ E 0 corresponde la relación E0 ~ y 2 entre las constantes E0 y y'. De (132.15) se sigue entonces que E O = E0 , r = 2y VE • 0 La expresión (132.14) substituye en el caso considerado a la fórmula (132.6); de acuerdo con ello deben modificarse las demás fórmulas (hay que substituir en todas ellas E0 por E0 y r por 2y VE). Por consiguiente, para la amplitud de dispersión obtenemos, en vez de ( 132.13), la expresión siguiente: (1) La función bo(E) determina, según ( 132.9), la fase de la dispersión potencial. Para la dispersión de partículas lentas, los primeros términos de su desarrollo son bo(E) = const· i(l +hk). Fórmula de Ruther/ord != liy -CJ.- 597 (132.16) v'(2m)(E-Eo+iyy'E) (hemos substituido aquí k = V<2mE//üdonde m es la masa reducida de la partícula del sistema dispersor). Para E..- O esta amplitud tiende, como debe ser, a un límite constante (se justifica así la forma del desarrollo (132.14)). Obsérvese que una expresión de la forma (132.16) incluye también el caso de un nivel realmente discreto, próximo a cero, del sistema compuesto, expresión que se obtiene de acuerdo con la correspondiente relación entre las constantes c0 y y. Si !Eol ~ y 2 , para las energías E ~ y 2 se puede prescindir del primer término (E) en el denominador del término de resonancia. Prescindiendo también de la amplitud de dispersión potencial oc, obtenemos la fórmula 1 f = - -ik---V-(-2m-)-Eo-/fi-y' que coincide con la fórmula (131.6) (con K = -V(2mc0 /liy). Esta fórmula corresponde a la resonancia en el nivel E= cl/y2 , que es un nivel discreto real o virtual según sea positiva o negativa la constante K. § 133. Fórmula de Rutherford La dispersión en un campo coulombiano posee particular interés desde el punto de vista de las aplicaciones físicas. Es también interesante debido al hecho de que, para este caso, el problema de las colisiones se puede resolver en la mecánica cuántica hasta el final exactamente. Cuando existe una dirección privilegiada (en el presente caso, la dirección de la partícula incidente), la ecuación de SCHRODINGER para un campo coulombiano conviene resolverla en coordenadas parabólicas t t¡, cf, (§ 37). El problema de la dispersión de una partícula en un campo central presenta simetría axil. Por ello la función de onda 1P no depende del ángulo cf,. Una solución particular de la ecuación de ScHRODINGER (37.6) puede ser de la forma: (133.1) {(37.7) con m = O), y de acuerdo con esto, después de separar las variables, obtenemos las ecuaciones (37.8) con m = O (1): (1) En este párrafo utilizamos unidades coulombianas (véase pág. 135). 598 Teoría de las colisiones elásticas (133.2) La energía de la partícula dispersada es, claro está, positiva; hemos hecho E= k 2 /2. Los signos en las ecuaciones ( 133.2) corresponden al caso de un campo repulsivo; para la sección eficaz de dispersión en un campo atractivo se obtiene exactamente el mismo resultado final. Hemos de hallar una solución de la ecuación de SCHRODINGER que para valores z negativos y grandes valores de r tenga la forma de una onda plana: if, ,..., eflcz para - oo < z < O, r -+ oo, lo que corresponde a una partícula que incide en el sentido positivo del eje z. Veremos en lo que sigue que la condición impuesta se puede satisfacer por una sola integral particular de la forma ( 133.1) (y no por una suma de integrales con valores diferentes /J1, /32). En coordenadas parabólicas esta condición tiene la forma: if, ,..., eik<E-r¡l/2 para 'TJ-+ oo y todo g. Esta condición puede cumplirse tan sólo si Ji(t) = eikE/2 (133.3) paraTJ-+ oo. (133.4) y f 2 (1¡) se somete a la condición h('YJ) ,..., e-ikr¡/2 Substituyendo (133.3) en la primera de las ecuaciones (133.2), vemos que esta función satisface efectivamente la ecuación si /31 = ik/2. La segunda de las ecuaciones ( 133.2) con /32 =--= 1 - /J1 toma entonces la forma: Busquemos una solución de la forma: h(TJ) = e-ikr¡/2w(TJ), donde la función w(YJ) tiende a un límite constante cuando r¡ nemos la ecuación (133.5) --+ =. Para w(17) obte- 599 F Órmula de Rutherford r¡w" +(1-ikr¡)w' -w = O, (133.6) que, mediante la introducdón de una nueva variable ,11 = ik 1¡, se reduce a la ecuación de la función hipergeométrica confluente con parámetros oc = - i/k, y = l. Entre las soluciones de la ecuación ( 133.6) debemos elegir la que multiplicada por j~(~) contiene solamente una onda esférica divergente (es decir, dispersa), pero no una onda convergente. Una tal solución viene dada por la función w = constante x F( -i/k, 1, ikr¡). Así, pues, reuniendo las expresiones obtenidas, encontramos la siguiente solución exacta de la ecuación de ScHRODINGER, solución que describe la dispersión: y¡ = e-1r /2kf(l +i/k)eik(E-1J)l2F(-i/k, 1, ikr¡). (133.7) La constante de normalización se ha elegido en 1P de manera que la onda plana incidente sea de amplitud unidad (véase más adelante). Para separar en esta función las ondas 'incidente y dispersada, hay que estudiar la forma que adopta a grandes distancias del centro de dispersión. Utilizando los dos primeros términos del desarrollo asintótico ((d. 14) del apéndice matemático) de la función hipergeométrica confluente, obtenemos para grandes valores ,7: . . 1 F(-i/k, ' ikr¡) = 1 ) (-ikr¡)ifk( ~ r(l +i/k) 1 + ikªr¡ e1r /2k f(l+i/k) ( 1 (ikr¡)-ifk eik1J + r(-i/k) ikr¡ 1 ) +-e<ifk) log(k'T]) 3 ik r¡ (i/k)e1r /2k eik1J --e-<i!k) log(k'IJ), f(l-i/k) ikr¡ Substituyendo esta expresión en (133. 7) y pasando a coordenadas esféricas (~ -17 = = 2z, 1J = r - z = r( l -- cos O)), obtenemos la siguiente expresión asintótica final de la función de onda: Y1 = [1 + l ]eikz+(i/k) log(kr-kr ikªr(l-cosO) cos8)+ f(O) eikr-(i/k> log{2kr) r (133.8) ' donde (1) f(O) 1 r(l+i/k) 2k2sen2!8 f(l-i/k) · - - - - e - < 2 i /k) log seno /2 - - - - (133.9) (1) Los signos en la amplitud de dispersión (133.9) corresponden a un campo deCoulomb repulsivo. Para un campo de atracción, la expresión (133.9) se debe substituir por la conjugada compleja. En este último caso, ((0) tiende a infinito en los polos de la función I'(I - i/k), es decir, en los puntos en los que el argumento de la función I' es un número entero negativo o cero (en todo esto es Im k > O y la función np tiende a cero en el infinito). Los correspondientes valores de la energía son !k2 = -1/2n2 (n = 1, 2, 3, ... ), y coinciden con los niveles discretos en un campo de Coulomb atractivo (cf. § 128). 600 Teoría de las colisiones elásticas El primer término en (133.8) representa la onda incidente. Vemos así que, debido a la lenta disminución del campo coulombiano, la onda plana incidente se deforma incluso a grandes distancias del centro, como demuestra la existencia del término logarítmico en la fase y también de un término del orden de 1/ r en la amplitud de onda (1). Un término logarítmico de deformación en 1a fase se encuentra también en la onda esférica dispersa, que viene representada por el segundo término en (133.8). Estas diferencias con relación a la forma asintótica ordinaria de la función de onda (122.3), no son esenciales, sin embargo, ya que dan para la densidad de corriente una corrección que tiende a cero para r ~ oo. Obtenemos asi para la sección eficaz de dispersión da dcr Jf(0)\ 2 do la fórmula = do/4k4 sen4!9, .o bien, en unidades ordinarias, da = (r1./2mv2)2 do/sen4}9, (133.10) (hemos introducido la velocidad de la partícula v = kli/m . Esta fórmula coincide con la conocida fórmula de Rutherford a la que lleva la mecánica clásica. Así, pues, para la dispersión en un campo de Coulomb la mecánica cuántica y la clásica dan el mismo resultado (N. MOTT, W. GORDON, 1928). Es natural que también la fórmula de Born (125.12) conduzca a la misma expresión (133.10). Finalmente, para completar, daremos la expresión de la amplitud de dispersión (133. 9) escrita en forma de suma de armónicos esféricos. Esta expresión se obtiene substituyendo en (123.5) las fases (51 dadas por (36.28), es decir (2), e2ia, Obtenemos de esta manera: = rc1+1+i/k}/r(1+t-i/k). 1 r(Z+l+i/k) f(8) = - "'(21+1) Pi(cos8). Zik L, r(1+ t-i/k) (133.11) (133.12) l § 134. El sistema de las funciones de onda del espectro continuo Vimos en el § 122 que una función de la forma 1 ( ) El origen de esta deformación se puede explicar ya en el modelo clásico. Si consideramos una familia de trayectorias hiperbólicas clásicas en un campo de Coulomb, trayectorias cuya dirección inicial es la misma (paralelas al eje z), la ecuación de la superficie normal a aquéllas a grandes distancias del centro dispersor (z~ oo) tiende, como es fácil demostrar, no a z = const, sino a z+k-2In k(r - z) = const. Esta superficie coincide precisamente con la superficie de fase constante de la onda incidente en (133.8). 2 ( ) La cantidad ói en esta fórmula difiere de la verdadera fase coulombiana (divergente) en un valor que es el mismo para todos los /. Sistema de las funciones de onda del espectro continuo 601 00 if, = Ck ¿i (21+1)e' iPz(cosB)Rkz(r), 1 8 (134.1) l=O (ck es una constante) describe el estado estacionario de una partícula en un campo central en el que, en el infinito, se tiene una onda plana que se propaga en el sen.. tido positivo del eje z y una onda esférica divergente. En esta fórmula, (} es el ángulo formado por el vector posición r y el eje z, que coincide con el vector de onda de la onda incidente. Si se substituye(}= k·r/kr, la expresión (134.1) será por completo independiente de la elección de los ejes de coordenadas. Atribuyendo al vector k todos los valores posibles, obtenemos, conforme se demostrará inmediatamente, un conjunto completo de funciones de onda del espectro continuo ortogonales dos a dos. Estas funciones las designaremos por 'f/J-i-k: 1 00 if,+k = 'il(2l+l)eMiRkz(r)Pi(k.r/kr). 4-n-k~ (134.2) l=O Hemos elegido la constante ck de (134.1) de modo que las funciones resulten normalizadas, como suele hacerse en el caso de espectro continuo, respecto de la función-b en el espacio-k (1 ): (134.3) (esto se verá confirmado por el cálculo que sigue). De esta manera, junto con el sistema ordinario de funciones de onda rf, = Rk 1(r) Y 1m (8, cf,) (que corresponden a los estados estacionarios con valores determinados de la energía ñ2k2/2µ, del momento cinético l y de su proyección m) tenemos también, para el espectro continuo, otro sistema de funciones que describen estados con valor determinado de la energía (pero no del momento cinético ni de su proyección) en los que en el infinito, junto con la onda divergente, se tiene una onda incidente plana caracterizada por el vector k. Este sistema de funciones es muy conveniente para resolver toda una serie de problemas que plantean las colisiones. Pasando a la demostración de (134.3), designemos por(} y(}' los ángulos formados por el vector posición y los vectores k y k', respectivamente, y por oc el ángulo entre k y k'. El producto .fa+k' •if,+k se expresa como suma doble respecto de l y l' de términos que contienen los productos Pt(cos 8')P,(cos 8). Observando que cos (J' (1) = cos (J cos oc+sen(Jsenoc cose/,, En esta normalización, la onda plana incidente tiene (en el infinito) la forma (21r)-3/2eik. r. Teoría de las colisiones elásticas 602 (ef, es el ángulo formado por los planos (r, k) y (k, k')) y utilizando el teorema de adición de los armónicos esféricos (fórmula (c. 8) del apéndice matemático), tenemos: Pz,(cos 8')Pz(cos 8) = Pz(cos 8)Pz ,(cos 8)Pz,(cos oc)+ 00 +2Pz(cos8)"" (l'-m')! (134.4) pm'(cos(J)pm'(cosoc)cosm'<f,. ~ (l'+m' f m'=l Z' Z' Multipliquemos primero rf,+Jt•rf,+ k por do = sen OdO def, e integremos respecto de todos los ángulos. La integración respecto de ef, anula todos los términos en (134.4), salvo el primero. Este último da, al integrar respecto de O, el valor cero si l -=fo= l' (en virtud de la ortogonalidad de los polinomios de Legendre), y para l = l' 1T f Pz (cosO)sen8d(J 2 = 2/(21+1). o Obtenemos así: f if,+~•.¡,+k d V = 1 +rrkk' 2 (21+ )e'rct,Ckl-ct,<k'llpz( f Rk,z(r)Rkz(r)r2 CX) CX) 1 cos oc) l=O dr. O Pero las funciones radiales Rk1 son ortogonales entre sí y están normalizadas de acuerdo con CX) f Rk,zRkz r dr = 8(k'-k). 2 o Por ello, en los coeficientes de las integrales se puede hacer k = k' ;utilizando también la relación (123.3), tenemos: 1 == -8(k'-k)S(1-cos oc). '1rk2 La expresión que aparece en el segundo miembro, una vez multiplicada por 2nk 2 sen oc dk doc e integrada en todo el espacio k, da el valor 1; con otras palabras, coincide con la función-6 en el espacio-k, lo que demuestra la fórmula (134.3). Además del sistema de funciones 1P-t-k, se puede introducir también un sistema que corresponde a los estados en los que se tiene, en el infinito, una onda plana Sistema de las /unciones de onda del espectro continuo 603 y, junto con ella, una onda esférica convergente. Estas funciones, que designaremos por 1P-k, se obtienen inmeciatamente a partir de las tp+k. Ante todo, pasemos a la expresión conjugada compleja; con ello, a partir de una onda divergente obtenemos una onda convergente ( ,-....; e-ikrjr), y la onda plana toma la forma: ,-....; eik.r. Para que se conserve la primitiva definición de k ( onda plana ,-....; eik.r) es necesario cambiar todavía el sentido de k por el sentido opuesto, es decir, cambiar k por - k. Observando que P¡(- cos O) = (- I)l P 1(cos O), de (134.2) deducimos: ¿il(2l+ CX) ef,-k = - .1 +n-k (las funciones Rkt 1)e-18iR1ci(r)Pz(k. r/kr); (134.5) 1=0 se suponen reales). El caso de un campo coulombiano es muy importante. Las funciones tp+ k (y "P-k) pueden escribirse entonces en forma finita directamente a partir de la fórmula (133.7), que hay que multiplicar por (2n)-3 ' 2 (véase la nota en la pág. 601). Expresaremos las coordenadas parabólicas mediante las relaciones k71 !k(f-71) = kz = k • r, = k(r-z) = kr-k .r. De esta manera obtenemos para un campo de Coulomb repulsivo (1): 1 .t.+k = - - e-1r 121cr(t+i/k)e'k.rF(-i/k 1 ikr-ik .r) 'f' (211)3/2 ' ' ' 1 if,-k = (Z1r) 312 e-1r121cr(I-i/k)e'k.rF(i/k, 1, -ikr.-ik .r). (134.6) (134.9) Las funciones de onda para un campo de Coulomb atractivo se obtienen a partir de éstas cambiando a la vez el signo de k y de r: if,+k 1 = -- (21r)3/2 1 .¡,-k = - - (21r)3/2 e1r121cr(l-i/k)e'k.rF(i/k, 1, ikr-ik .r), (134.8) e1r121cr(l+i/k)e'k.rF(-i/k, 1, -ikr-ik .r). (134.9) Como característica de la acción del campo coulombiano sobre el movimiento de una partícula cerca del origen de coordenadas se puede utilizar la razón del cuadrado del módulo de 1/-'+k o 1/-'-k en el punto r = O al cuadrado del módulo de la función de onda 1/-'k = (2n)-3 ' 2eik.r del movimiento libre. Mediante la fórmula r(l + i/k) r(l - i/k) = (i/k) r(i/k) r(l - i/k) = (1) Utilizamos unidades coulombianas. 1r/k senh(1r/k), 604 Teoría de las colisione.~ elásticas obtenemos fácilmente para un campo repulsivo: lt/J+k(O)l 2 lt/Jk\2 jtf,-k(O)l 2 lt/Jkl2 k(e21rfk-l)' \tf,-k(O)l 2 21r 21r (134.10) y para un campo atractivo: lt/J+k(O)l 2 lt/Jkl 2 lt/Jkl 2 (134.11) k(l-e-2" fk)° Las funciones "P-k representan un importante papel en toda una serie de problemas vinculados con la aplicación de la teoría de perturbaciones en el espectro continuo. Supongamos que, como resultado de una perturbación, una partícula pasa a un estado del espectro continuo (pudiendo pertenecer el estado inicial tanto al espectro discreto como al espectro continuo) (1). Se plantea entonces la cuestión de cómo calcular la probabilidad de que la partícula en movimiento libre que se obtiene como resultado de la transición posea una determinada dirección del movimiento en el espacio. Se puede demostrar que para ello hay que adoptar como función de onda del estado final de la partícula la función "P-k, donde k es el vector de onda de la partícula en el infinito (A. SoMMERFELD). En efecto, consideremos la función Esta función es la (43.3) en la que como funciones "P<º\ se han tomado las "P-k y en vez de dv se ha escrito k 2 dk do = (V2m 3 3) VE dE do. Dicha función describe el estado de una partícula que se produce como resultado de una perturbación que actúa de manera constante, siendo las funciones de onda no perturbadas las funciones "P-k- La integración respecto de E se efectúa a lo largo de un camino que contornea (en el plano de la variable compleja E) el punto E = E 0 por debajo. Veamos cómo para grandes valores de r los términos en "P-k que contienen la onda convergente se anulan al integrar respecto de E. Para ello basta desplazar ligeramente el contorno de integración hacia el semiplano inferior. Sobre él tenemos entonces E< O y, por consiguiente, también k < O (la raíz k = V2mE/h se define de tal manera que sobre el semieje real positivo E sea positiva). La onda convergente contiene el factor e-ikr, que para Im k < O y grandes valores de r se puede hacer tan pequeño cuanto se quiera, lo que demuestra la afirmación anterior. De esta manera, como resultado de la integración, respecto de E, de las funciones "P-k ih 1 ( ) Por ejemplo, un electrón, chocando con un átomo, provoca la emisión de un fotón X a la vez que con ello cambia su energía y la dirección del movimiento. Colisiones entre partículas idénticas 605 queda (en el infinito) tan sólo una onda plana que corresponde a una partícula que se mueve en determinada dirección. § 135. Colisiones entre partículas idénticas El caso de la colisión de dos partículas idénticas exige un estudio aparte. La identidad de las partículas, conforme sabemos, conduce en mecánica cuántica a la aparición de una peculiar interacción de intercambio entre ellas. Dicha interacción se manifiesta notablemente también en la dispersión (N. MoTT, 1930) (1). La función de onda orbital del sistema de dos partículas debe ser simétrica o antisimétrica respecto de las mismas según sea par o impar el spin total de éstas (véase § 62). Por ello, la función de onda que describe la dispersión, obtenida resolviendo la ecuación ordinaria de SCHRODINGER, debe ser simetrizada o antisimetrizada respecto de las partículas. Una permutación de éstas equivale a invertir el sentido del radio vector que determinan. En el sistema de coordenadas en el que el centro de masas se encuentra en reposo, esto significa que r no varía y que el ángulo() se substituye por n-0 (debido a lo cual z = r cos () se transforma en - z). Por lo tanto, en vez de la expresión asintótica (122.3) de la función de onda debemos escribir: (135.1) En virtud de la identidad de las partículas, es imposible, claro está, señalar cuál de ellas es la partícula dispersada y cuál la partícula dispersante. En el sistema del centro de masas tenemos dos ondas planas incidentes iguales entre sí y que se propagan en sentidos opuestos (eikz y e-ikz en (135.1 )). En cambio, la onda esférica divergente en (135.1) tiene en cuenta la dispersión de ambas partículas, y la corriente de probabilidad calculada mediante ella determina la probabilidad de que una cualquiera de las dos partículas sea dispersada en un elemento dado do de ángulo sólido. La sección eficaz es la razón de esta corriente a la densidad de corriente en cada una de las ondas incidentes planas, es decir, viene determinada, como antes, por el cuadrado del módulo del coeficiente de eikr/r en la función de onda (135.1). Así, pues, si el spin total de las partículas que chocan es par, la sección eficaz de dispersión tiene la forma: dcrs = lf(B)+ f(1r-O)l 2 do, (135.2) dcra = 1/(8)- f(1r-B)l 2 do. (135.3) y si es impar, se tendrá: (Obsérvese que daª (1) = O si f = const.). Es característico de la interacción de ínter- Como antes, no consideramos aquí la interacción spin-órbita directa. 606 Teoría de las colisiones elásticas cambio la aparición del término de « interferencia » f(8)f*(n - 8)+ f*(8)f(n - 8). Si las partículas fueran distintas, como en la mecánica clásica, la probabilidad de dispersión de una cualquiera de ellas en el elemento dado de ángulo sólido do sería igual, simplemente, a la suma de las probabilidades de la desviación de una de las partículas en un ángulo 8, y de la que se mueve a su encuentro, en un ángulo n - 8; con otras palabras, la sección eficaz sería igual a {l/(8)j2+j/(1r-8)12} do. En las fórmulas (135.2-3) se supone que el spin total de las partículas que chocan posee un valor determinado. Sin embargo, por lo general hay que considerar el choque de partículas que no se encuentran en determinados estados de spin. Para definir la sección eficaz en este caso hay que promediar respecto de todos los estados de spin posibles, considerándolos todos equiprobables. En el§ 62 se demostró que del nú_mero total (2s + 1)2 de estados de spin diferentes de un sistema de dos partículas con spin s, s(2s + 1) estados corresponden a valores pares del spin total, y (s + 1) (2s+l), a valores impares (sises semientero), o bien recíprocamente (sises entero). Supongamos primero que ·el spin s de las partículas es semientero. Entonces la probabilidad de que el sistema de dos partículas que chocan posea un valor S par es . 1a s(2s+I) . . s+I 1gua - - - = -s- Y Ia pro ba b'l'd 1 1 ad de que S sea impar, es igual a _ _ . (2s+ 1)2 2s+ 1 2s+ 1 Por consiguiente, la sección eficaz es igual a: s s+l da= - - d a8 +--daa, 2s+1 2s+1 Substituyendo aquí (135.2-3), obtenemos: (135.4) 1 da= {l/(8)1 2+1/(.,,,-8)1 2- 2s+l [!(8)f*(1r-8)+ f*(8)f(1r-8)]} do. (135.5) De manera análoga se obtiene para s entero: 1 da = {l/(8)l 2+1/(1r-8)1 2+-[!(8)/*(1r-8)+ f*(8)f(1r-8)]} do. 2s+l (135.6) Como ejemplo escribamos las fórmulas para la colisi_ón de dos electrones que interactúan según la ley de Coulomb (U= e2/r). La substitución de la expresión (133.9) en la fórmula (135.5) con s = ! da (en unidades ordinarias) después de un cálculo simple: 2 2 1 1 da= ( ~ ) r__l_ + cos(e log tan2!8)] do (135.7) mov2 l;en418 cos4l8 sen2¡0 cos2!8 ñv ' (hemos introducido la masa m0 del electrón en vez de la masa reducida m = m0 /2). Colisiones entre partículas idénticas 607 Esta fórmula se simplifica considerablemente. si la velocidad es tan grande que e2 ~ vli ;( observemos que ésta es precisamente la condición de aplicabilidad de la teoría de perturbaciones al campo coulombiano). El coseno en el tercer término se puede entonces substituir por la unidad y se obtiene: 2e2 )2 4-3 sen28 da= ( - mov2 sen48 do. (135.8) El caso límite opuesto, e2 }>vli, corresponde al paso a la mecánica clásica (véase el final del § 126). En la fórmula (135.7) esta transición se efectúa de manera muy particular. Para e2 }> vli, el coseno en el tercer término dentro del paréntesis recto es una función rápidamente oscilante. Para cada(} dado, la fórmula (135. 7) conduce a un valor de la sección eficaz que, en general, difiere notablemente del que nos da la fórmula de Rutherford. Sin embargo, ya al promediar en un pequeño intervalo de valores de O, el término oscilante en (135.7) desaparece y llegamos a la fórmula clásica. Todas las fórmulas escritas se refieren al sistema de coordenadas en el que el centro de masas se encuentra en reposo. El paso a un sistema respecto del cual una de las partículas estaba en reposo antes del choque, se efectúa (de acuerdo con (122.2)) simplemente cambiando (} por 2&. Así para la colisión de electrones obtenemos, a partir de (135. 7): 2 2 2 1 1 1 dcr = ( Ze ) __ os(e log tan2&)] cos & do (135.9) m 0v2 ~en4& cos4& sen2& cos2& liv ' r.__+_ donde do es el elemento de ángulo sólido en el nuevo sistema de coordenadas (al cambiar (} por 2.S-, el elemento de ángulo sólido do debe substituirse por 4 cos S-do, ya que sen(} d(} d</> = 4 cos S-, sen S- d.S-dcp ). PROBLEMA Determinar la sección eficaz de dispersión de dos partículas idénticas, de spin t, que poseen valores determinados a = i de la proyección del spin sobre ejes que forman entre sí un ángulo a.. Solución. Sean "// y ;µ los espinores que constituyen las funciones de onda espinoriales de las partículas. La función de onda del sistema formado por las partículas que chocan será el producto xµ;v. Escribámoslo en la forma: El primer término es un espínor simétrico de segundo orden y corresponde a un estado del sistema con spin total S = 1 ; el segundo término, en cambio, es un espinor antisimétrico, que se reduce a un escalar, y corresponde al estado con S = O. Por ello, las probabilidades de que el 608 Teoría de las colisiones elásticas sistema tenga spin igual a 1 o a O son, respectivamente, tlXPf"+X 11f Pl 2 t(l+lx 11*f 11 2), wo = ilx"f "-x"f"1 2 = !(l- lx 11*f 11l 2); W1 = = 1 (1) (cuando un índice de spin se repite dos veces, esto significa que se suma respecto de él; hay que recordar que /xµ/ 2 = /~µ¡ 2 = 1). La sección eficaz buscada es igual a: (2) Elijamos el sistema de coordenadas de forma que el eje z sea aquél respecto del cual la proyección del spin de la primera partícula posee el valor dado (a = + i); entonces será x1 = 1, x2 = O. Las componentes del espinor ~µ. en cambio, son iguales a ~1 = cos r:x./2, ~2 = i sen r:x./2 (véanse las fórmulas de transformación (58.10); en un sistema de coordenadas tal que la proyección del spin de la segunda partícula sobre el eje z tuviera un valor determinado, se tendría ~1 = l, ~2 = O). Substituyendo estos valores en (1), encontramos la sección eficaz (2) en la forma (3) § 136. Dispersión de resonancia de partículas cargadas En la dispersión de partículas nucleares cargadas (por ejemplo, de protones por protones), además de las fuerzas nucleares de corto alcance se tiene también la interacción de Coulomb, que decrece lentamente. La teoría de la dispersión de resonancia se construye en este caso siguiendo el mismo método que se expuso en el § 131. La diferencia consiste solamente en que como funciones de onda en el dominio exterior al radio de acción de las fuerzas nucleares (r ~ a) hay que utilizar, en vez de la solución de la ecuación del movimiento libre (131.2), la solución general exacta de la ecuación de SCHRODINGER en un· campo coulombiano. Como antes, la velocidad de las partículas se considera pequeña tan sólo en el sentido de que sea ka ~ I ; en cambio, la razón de I / k a la unidad coulombiana de longitud ac = li 2/mZ1Z2e2 (m es la masa reducida de las partículas que chocan) puede ser arbitraria (1). de Para el movimiento con l = O en un campo coulombiano repulsivo, Ja ecuación para la función radial x = r R 0 es: ScHRODINGER x"+ (k"- ;)x = O; (136.1) (utilizamos aquí unidades coulombianas). En el § 36 se halló la solución de esta ecuación que satisface la condición de que x!r sea finita en r = O. Esta solución, que designaremos aquí por K, tiene la forma (véase (36.27-28)): (1) La teoría que se expone a continuación fue desarrollada por R. LANDA U y IA. SMORODINSKII (1944). 609 Dispersión. de re... onan.cia de partículas cargadas K = AeikrkrF,(i/k+ 1, 2, -2ikr), A2= 21r/k e211'fk-l (136.2) . La expresión asintótica de esta función a grandes distancias es K kr-i "'sen( log2kr+&,couI ), (136.3) 80,coul = arg r(l +i/k), y los primeros términos del desarrollo para valores pequeños de r(kr son: K = Akr(l +r+ ... ). ~ 1, r ~ 1) (1 ~fí.+) Sin embargo, al haber cambiado ahora una condición de contorno, el comportamiento de la función en el origen deja de ser esencial y necesitamos la solución general de la ecuación ( 136. l ), solución que es combinación lineal de dos integrales independientes de la misma. Los parámetros de la función hipergeométrica confluente en (136.2) son tales (valor entero del parámetro y : y = 2) que nos encontramos precisamente en el caso mencionado al final del § d de los apéndices matemáticos. De acuerdo con lo demostrado allí, se obtiene una segunda integral de la ecuación ( 136.1) substituyendo la función F de ( 136.2) por otra combinación lineal de dos términos cuya suma da, según (d, 14), la función hipergeométrica confluente. Eligiendo como a tal combinación la diferencia de estos términos, obtenemos una segunda solución independiente de la ecuación ( 136.1) (la designaremos por L) en la forma: Ae-ikrkr L = 2 lm r(l+i/k) (-2ikr)-l+i/kG(l-i/k -i/k -2ikr)· ' ' ' (136.5) (la función K, en cambio, es la parte real de la expresión que aquí aparece). Su forma asintótica a grandes distancias es: L"' cos( kr-i log2kr+óo,cou1), (136.6) y los primeros términos del desarrollo para valores pequeños de r se escriben: 1 L = -{l+2r[log2r+2y-1+h(k)]+ ...}, A (136.7) Teoría de las colisiones elástica.~ donde y = 0,577 ... es la constante de Euler y h(k) representa la función (136.8) h(k) =Retp(-i/k)+logk, ('1p(z) = I''(z)/I'(z) es la derivada logarítmica de la función I') (1). Escribiremos la integral general de la ecuación (136.1) en forma de suma (136.9) X= constante X (K cot8o+L), donde ctg <50 es una constante. La definición de la constante se ha elegido de manera ·que la forma asintótica de aquella solución sea (136.10) es así el corrimiento de fase adicional de la función de onda determinado por las fuerzas de corto alcance. Hay que ligarlo con la constante que figura en la condición de contorno (x' / x)/r-+o = const, condición que substituye al análisis de la función de onda dentro del radio de acción de las fuerzas nucleares. Sin embargo, teniendo en cuenta la divergencia (como In r) de la derivada logarítmica x' / x para r -- O, esta condición debe referirse ahora, no al valor cero, sino a un valor tan pequeño cuanto se quiera, pero en cualquier caso no nulo de r, r = (!. Calculando (mediante las fórmulas (136.4) y (136.7)) la derivada x'(e)/x(e) e igualándola a una constante, obtenemos una condición de contorno de la forma: <50 kA2 cot So + 2[1og 2p + 2y + h(k)] = constante. La expresión que aparece en el primer miembro de la igualdad contiene la constante 2 ln 2e+4e, que no depende de k; incluyámosla en la expresión const, designando luego ésta por - K. Como resultado se obtiene finalmente una expresión para <50 que escribimos aquí en unidades ordinarias: 1 cot8o = --(e217 /kac-l)[h(kac)+}1<ac]; (136.11) 7T (en el límite 1/ac-+ O, es decir, al pasar a partículas sin carga, la fórmula (136.11) se transforma en la relación ctg 00 = - 1</k, que coincide con (131.5)). (1) El desarrollo (136.7) se obtiene a partir de (136.5) mediante el desarrollo (d, 17) de la función G. Se ha utilizado además la conocida relación: tp{l +z) (que es fácil obtener a partir de I'(z+ I) = zI'(z)) = tp(z)+ 1/z y del valor tp(l) = -y, tp(2) = -y+ I. Dispersión de resonancia de partículas cargadas 611 En la fig. 48 se presenta el gráfico de la función h(k) (1). 1,1 / 1,0 Ir 0,9 o.a I / 0,7 :5 0,5 / 0,4 0,1 o V '{ 0,3 0,2 V I 0,6 ,e: I I / I V 1 3 2 4 5 X FIG. 48 (1) Para calcular la función h(k) puede utilizarse la fórmula co 1 h(k) = k-2"" ¿ n(n2+k-2) -y+ log k, n=l que se obtiene fáciimente mediante la fórmula 00 1 ,/¡(z) = 1 -y-; +z ¿ n(n+z); n=l (véase WHITTAKER-WATSON, Course of modern analysis, Cambridge, 1944, § 12.16). Las expresiones límite de la función h(k) son: h(k) ~ k2/12 for k ~ h(k) = -y+ Iogk+ 1·2/k2 1, para k ~ 1; (la última fórmula da valores correctos de h(k), con un error < 4 /~, ya para k > 2,5). 612 Teoría de las colisiones elásticas Así, pues, cuando existe interacción coulombiana resulta « constante » la siguiente cantidad: 27T cotSo 2 - - - - + -h(kac) ac(e21Tkac - 1) ac = - (136.12) K, Hemos escrito la palabra «constante» entre comillas porque K es, en realidad, el primer término del desarrollo, en serie de potencias de la pequeña cantidad ka, de una cierta función que depende de las propiedades de las fuerzas de corto alcance. A la resonancia para valores pequeños de la energía corresponde, como se demostró en el§ 131, el caso de un valor anómalamente pequeño de la constante K. Debido a esto, para mejorar la precisión hay que tener en cuenta también el término siguiente (,...., k 2) del desarrollo en el que figura un coeficiente cuyo orden de magnitud es «normal», es decir, hay que substituir en (136.12)- K por (1) - 1<0 + }rok2• La existencia de una resonancia puede deberse, conforme se señaló en el § 131, a la existencia de un estado ligado discreto del sistema, tanto real como virtual. Se puede demostrar (2), que el criterio de realidad o de virtualidad de un nivel viene dado, como antes, por el signo de la constante 1e. Los corrimientos de fase totales de las funciones de onda son iguales, según (136.10), a las sumas <51,coui+<51 de las fases puramente coulombianas y de las fases <51 vinculadas a las fuerzas de corto alcance. Las primeras contribuyen a la amplitud de dispersión con valores que son del mismo orden de magnitud, cualquiera que sea el valor de /. Las segundas, en cambio, son pequeñas (para energías pequeñas) cuando l -=/=- O y por ello se puede prescindir de todas las <5 1 con excepción de <50 ( 3). La amplitud de dispersión es entonces: (1) Indicaremos los valores de las constantes IX = 1/xo y r0 para la dispersión de un protón por un protón: IX= - 7,77 x 10-13 cm, r 0 = 2,77· I0-13 cm (la unidad coulombiana de longitud es 2ñ•/mpeª = = 57· 6 X t0-18 cm). Estos valores se refieren a un par de protones con spins anti paralelos (para spins paralelos, un sistema de dos protones no puede encontrarse nunca en un estado s, en virtud del principio de PAULI). (2) (") Véase R. LANDA U, IA. SMORODINSKII, ZhETF, 14, 269, 1944. Para completar, he aquí la expresión de (5z para l =t= O: l z z cotSz = - -(e2 17 /kac-l)(h(kac) +"" 7T s + rxzfl [l+p2(kac)2J-1), Lt s2 + (kac)-2 s=l donde las IXz son constantes. p=l Colisiones elásticas de electrones rápidos con átomos f(B) = 1 Zik 613 <X) _'¿ (21+ l)[e2iCct,,cou1H,>_ l]Pt(cos8) l=O 1 ¿ (21+ l)(e2ict1,cau1 - l)Pz(cosU)+ 00 ,....., Zik l=O 1 + -e2i80,cou1(e2i8o_ l). 2ik (136.13) El primer término es la amplitud de dispersión en un campo puramente coulombiano y viene dada por la fórmula (133.9): 2i 1 /cou1(8) = - exp (- - log sen!B+2i8o,coul)· 2k2sen2tB kac El segundo término de ( 136.13), en cambio, se puede llamar amplitud de dispersión determinada por las fuerzas de corto alcance. Sin embargo, hay que subrayar que esta distinción es un puro convenio; la existencia de la interacción coulombiana se manifiesta también de modo esencial en el primer término, que resulta ser completamente distinto del que sería en el caso de las mismas fuerzas de corto alcance para partículas no cargadas. En la sección eficaz de dispersión, ambas componentes de ]a amplitud interfieren entre sí : dcr = do - lf(8)l 2 = 2)2C (Z1Z.)e _-_ 2mv2 1 + en4i8 -- (kac)2 ( 2 ) ] + --sen80 cos - logsen!B+80 +4(kac)2sen280 • (136.14) sen2t8 kac (se supone aquí que las partículas que chocan son distintas; en la dispersión de partículas idénticas, la amplitud de dispersión debe ser simetrizada previamente, antes de elevar el cuadrado - véase § 135). § 137. Colisiones elásticas de electrones rápidos con átomos Las colisiones elásticas de los electrones rápidos con los átomos se pueden estudiar mediante la aproximación de Born si la velocidad del electrón incidente es grande comparada con la velocidad de los electrones atómicos. 614 Teoría de las colisiones elásticas Teniendo en cuenta la gran diferencia de masas entre un electrón y un átomo, se puede considerar que éste se encuentra en reposo antes del choque y que el sistema de coordenadas ligado al centro de masas coincide con el sistema en el que el átomo está inmóvil. En la fórmula (125.7) p y p' designan entonces los impulsos del electrón antes y después del choque, m es la masa del electrón y el ángulo (} coincide con el ángulo -& de desviación de este último. En cambio. la energía potencial U(r) en la fórmula (125.7) exige la debida definición. En el§ 125 hemos calculado los elementos de matriz Up'p de la energía de interacción respecto de las funciones de onda de una partícula libre antes y después del choque. En la colisión con un átomo hay que tener en cuenta también las funciones de onda que describen el estado interno del mismo. En una colisión elástica el estado del átomo no cambia. Por ello Up'p debe definirse como elemento de matriz respecto de las funciones de onda % y 1/-',' del electrón, elemento que es diagonal respecto de la función de onda del átomo. Con otras palabras, en la fórmula (125. 7) hay que entender por U la energía potencial de interacción del electrón con el átomo promediada respecto de la función de onda de este último. Dicha función es igual a ecf,(r), donde cf,(r) es el potencial del campo creado en el punto r por la distribución media de cargas en el átomo. Designando por e(r) la densidad de distribución de las cargas en el átomo, tenemos para el potencial cf, la ecuación de Poisson: t:i<f, = -+rrp(r). El elemento de matriz buscado Up'p es, en esencia, la componente de Fourier de U (es decir, de cf,) que corresponde· al vector de onda q = k' - k. Aplicando la ecuación de Poisson a cada una de las componentes de Fourier por separado, tenemos: D (<pqeiq. r) = -q2<f,qeiq. r = -hpqeiq. r, de donde es decir, J<f,e-tq.r dV = (4rr/q2) Jpe-iq.r dV. (137.1) La densidad de carga e(r) se compone de las cargas electrónicas y de la carga del núcleo: p = -en(r)+ Ze8(r), donde en(r) es la densidad de carga electrónica en el átomo. Multiplicando por e integrando, tenemos: e-iq.r Colisiones elásticas de electrones rápidos con átomos 615 Jpe-iq.rdV = -e Jne-iq.rdV+Ze. De esta manera se obtiene para la integral que nos interesa la expresión J 41re2 Ue-tq.r dV = - -[Z-F(q)], q2 (137.2) donde la cantidad F(q) viene determinada por la fórmula F(q) = Jne-iq.rdV (137.3) y se llama factor de forma atómico. Este factor es una función del ángulo de dispersión y también de la velocidad del electrón incidente. Finalmente, substituyendo (137.2) en (125.7), obtenemos la siguiente expresión para la sección eficaz de dispersión elástica de electrones rápidos por un átomo (1): 4m2e4 dcr = --[Z-F(q)]2 do h4q4 2 2 = ( ~ ) [z-F(Zmvsent&)J 2mv2 }¡ ~ sen4.¡& · (137.4) Consideremos el caso límite de valores q pequeños; se trata, esto es, de valores q que son pequeños comparados con « el inverso del radio atómico », es decir, comparados con 1/a0, donde a 0 es el orden de magnitud de las dimensiones del átomo (qa 0 ~ ]). A un valor de q pequeño corresponden ángulos de dispersión pequeños; en efecto, .& ~ v 0 /v, donde v 0 ,-...,}ijma0 es el orden de magnitud de las velocidades de los electrones atómicos. Desarrollemos F(q) en serie de potencias de q. El término de orden cero es igual a Jn d V, es decir, al número total Z de electrones en el átomo. El término de primer orden es proporcional a f rn(r) d V, es decir, al valor medio del momento dipolar del mismo; este valor se anula idénticamente (véase § 75). Por lo tanto, es necesario llevar el desarrollo hasta el término de segundo orden, y tenemos así: Z-F(q) = 1 -¡l J nr2 dV; ( 1) Prescindimos de los efectos de intercambio entre el electrón rápido dispersado y los electrones atómicos, es decir, no se simetriza la función de onda del sistema. Es desde luego evidente que esta aproximación está justificada: la interferencia entre la función de onda rápidamente oscilante de la partícula libre Y la función de onda de los electrones atómicos en la « integral de intercambio » conduce a que la contribución ligada con ella a la amplitud de dispersión sea pequeña. 616. Teoría de las colisiones elásticas substituyendo en (13 7.4), se obtiene: dcr me2 = li2 3 f nr2 12 (137.5) d V do. Así, pues, en el dominio de los ángulos pequeños la sección eficaz resulta ser independiente del ángulo de dispersión' y viene determinada por el valor medio del cuadrado de la distancia del núcleo a los electrones atómicos. En el caso límite opuesto de grandes valores q(qa0 ~ 1, es decir, & ~ v 0 /v) el factor e-i<1.r en el integrando de la expresión (137.3) es una función rápidamente oscilante y, por consiguiente, toda la integral es casi cero. Podemos, por lo tanto, prescindir de F(q) frente a Z, de modo que )2 Ze2 do d cr = ( 2mv2 sen4!&. (137.6) Con otras palabras, obtenemos la dispersión de Rutherford por el núcleo del átomo. Calculemos también la sección eficaz de transporte crtr En la región angular & da v0/v ~ = = f (1-cos &) dcr. tenemos, según (137.5), const X sen &d.& = const x & d&. donde const no depende de.&. Por ello, el integrando de la integral considerada es proporcional en esta región a &3 d&, de modo que en el límite inferior la integral converge rápidamente. En cambio, en la región 1 ~ .& ~ v0/v tenernos da~ const x d&/&3 ; el integrando es proporcional a d.&/.&, es decir, la integral diverge logarítmicamente. Vernos así que el papel principal en la integral lo representa precisamente esta región angular y que, por lo tanto, cabe limitarse tan sólo a la integración en la misma. El límite inferior de integración debe tomarse tal que sea del orden de v0 /v; escribárnoslo en la forma e2/yñv, donde y es una constante sin dimensiones. Corno resultado se obtiene la siguiente fórrnula: crtr = 41T(Ze2/mv2)2 log(yñv/e2). (137. 7) El cálculo exacto de la constante y exige estudiar la dispersión para ángulos & > v0/v y no se puede efectuar de manera general; O'tr depende poco del valor de la misma, Colisiones elásticas de electrones rápidos con átomos 617 ya que ésta aparece después del signo de logaritmo multiplicada por la cantidad ñv/e2 , que es grande. Para la determinación numenca del factor de forma de los átomos pesados podemos utilizar la distribución de Thomas-Fermi de la densidad n(r). Vimos que en el modelo de Thomas-Fermi n(r) tiene la forma: n(r) = Z2f(rZI!3/b); (todas las cantidades en esta fórmula y en las que siguen se miden en unidades atómicas). Es fácil ver que la integral (137.3), calculada precisamente con esta función n(r), contendrá q tan sólo en una determinada combinación con Z: F(q) = Z<f,(bqZ-113). (137.8) En la tabla 11 se dan los valores de la función universal cp(x), válida para todos los átomos (1). TABLA 11 Factor atómico en el modelo Thomas-Fermi 1 X <f,(x) o 1,000 1,08 0,422 2,17 0,224 0,15 0,922 1,24 0,378 2,32 0,205 0,31 0,796 1,39 0,342 2,48 0,189 0,46 0,684 1,55 0,309 2,64 0,175 0,62 0,589 1,70 0,284 2,79 0,167 0,77 0,522 1,86 0,264 2,94 0,156 0,93 0,469 2,02 0,240 X <f,(x) X <f,(x) Con el factor atómico ( 137.8) la sección eficaz ( 137.4) tendrá la forma: dcr = (4Z2/q4)[1-cp(bqZ-l/3)]2 do = Z2/3<f>(Z-1/3vsen}&) do, (137.9) donde <t>(x) es una nueva función universal. Por integración se puede obtener la sección eficaz total. El papel principal en la integración lo representa la región de ( 1) No hay que perder de vista que para valores q pequeños esta fórmula es inaplicable debido a que la integral de nrt no se puede de hecho calcular siguiendo el método de Thomas-Fermi (véase la nota en la pág. 496). Hay que recordar también que el modelo de Thomas-Fermi no refleja aquellas propiedades individuales de los átomos que perturban su variación sistemática con el número atómico. 618 Teoría de las colisiones elásticas pequeños valores de.&. Por ello se puede escribir: dcr ~ Z2/3<I>(Z-1/3v,&/2)21r-& d-&, y extender la integración respecto de .& hasta el infinito: f f cr = 21rZ2/3 <l>(Z-I/3i:-&/2)-& d-& = (81r/v2)Z4/3 <l>(x) dx. o o De esta manera, a tiene la forma: cr = constante x Z4/3/v2. (137.10) De modo análogo es fácil comprobar que la constante y de la fórmula (137. 7) será proporcional a z-113• PROBLEMA Calcular la sección eficaz de dispersión elástica de los electrones rápidos por un átomo de hidrógeno en el estado fundamental. Solución. La función de onda del estado normal del átomo de hidrógeno es VJ = e-r¡V n de modo que n = (l/n)e-2r (utilizamos unidades atómicas). La integración en (137.3) respecto de los ángulos se efectúa de la misma manera que al deducir la fórmula (125.12); tenemos: f n(r)senqr.rdr= 00 41r F=- 1 . (l+!q2)2 q O Substituyendo en (137.4) se obtiene: dcr = 4(8+q2)2 (4+q2)4 do ' donde q = 2vsen &/2. La sección eficaz total se calcula con facilidad haciendo do= 2n sen &d& = (2n/v2)qdq e integrando respecto de q; claro está, hay que conservar solamente el término que contiene la menor potencia de 1/v; Como resultado obtenemos: cr = 71r/3v2. § 138. La dispersión con interacción spin-órbita Hasta aquí hemos considerado sólo los choques de p-artículas cuya interacción no depende de sus spins. En ..estas condiciones, los spins o bien no influyen en absoluto en el proceso de dispersión, o bien determinan una influencia indirecta ligada con los efectos de intercambio (§ 135). Pasemos ahora a la generalización de la teoría de la dispersión desarrollada en el § 122 al caso en que la interacción de las partículas depende esencialmente de sus 619 Dispersión con interacción spin-órbita spins, cual ocurre en las colisiones de las partículas nucleares. Consideremos con detenimiento el caso más simple, en el que una de las partículas que chocan (para concretar, supondremos que ésta es una partícula del haz incidente) tiene spin i y que la otra (la partícula blanco) spin O. Para un valor dado (semientero) del momento cinético total j del sistema, el momento cinético orbital puede tener solamente dos valores l = j± i a los que corresponden estados de diferente paridad. Por ello, de la conservación de j y de la paridad se sigue, en este caso, que también se conserva el valor absoluto del momento cinético orbital. El operador / (§ 124) actúa ahora no sólo sobre las variables orbitales de la función de onda del sistema, sino también sobre las variables de spin. Dicho operador debe conmutar con el operador de la magnitud conservativa 12. La forma más general de un tal operador es: j donde á, b son = á +hi. s, (138.1) operadores orbitales que dependen únicamente de 12• La matriz S, y con ella también la matriz del operador J, es diagonal respecto de las funciones de onda de los estadós con valores determinados de las cantidades l y j, que se conservan (y de la proyección m del momento cinético total), expresándose los elementos diagonales en función de las fases <5 de las funciones de onda mediante la fórmula (122.14). Para valores dados de l y del momento total, j = I + ! y j = /-!,los valores propios de l-s son iguales, respectivamente, a //2 y - (l+ 1)/2 (véase (117.5)). Por consiguiente, para determinar los elementos de matriz diagonales de los operadores á y b (los designaremos por a1 y b1) tenemos las relaciones: az+Mbz ~ 1 = -(e2ta,+ -1) 2ik ' (138.2) az-·Hl+ l)bz = donde fas fases <5 1+ 1 2ik (e2i8,- -1), y <5 1- corresponden a los estados con j = l+k y j = 1- t. Sin embargo, no nos interesan propiamente los elementos diagonales del operador /respecto de estados con valores del y j dados, sino la amplitud de dispersión como función de las direcciones de las ondas incidente y dispersada. Esta amplitud será todavía un operador, pero solamente respecto de las variables de spin - un operador que es no diagonal respecto de la proyección del spin a. En este párrafo, en lo que sigue designaremos por precisamente este operador. J Teoría J.e las colisione.s elásticas 620 Para hallarlo hay que aplicar el operador (138.1) a ]a función (124.16), que corresponde a la onda plana incidente (a lo largo del eje z). De esta manera: 00 J = ¿ (21+ l)(az+hzi. s)Pz(cos8). (138.3) l=O Hay que calcular aún el resultado de aplicar el operador J. s a la función P 1 ( cos O). Esto puede hacerse escribiendo i . s = !(l+L + Ls+) + lzsz (véase (29.11)) y utilizando las fórmulas (27.12) para los elementos de matriz de los operadores /±; más fácil todavía es utilizar directamente las expresiones entre operadores (26.14-15). Un cálculo sencillo da: i . sPz(cos 8) = iv . sPzl( cos 8), donde P 11 es un polinomio asociado de Legendre y v el vector unitario correspondiente al vector n x n' perpendicular al plano de dispersión (n es el versor de incidencia, correspondiente al eje z; n' es el versor de dispersión, definido por los ángulos esféricos O, </>). Determinando a1, b1 a partir de (138.2) y substituyendo en (138.3), obtenemos ahora finalmente: f 1 A= Zik L = (138.4) A+2Bv.s, 00 [(l+l)(e2i 0 ,+-l)+l(e2io1--l)]Pz(cos8), Z=O (138.5) 1 B 00 = _""' 2kL (e2io/ -e2io,-)Pzl(cos8). l=l Los elementos de matriz de este operador dan la amplitud de dispersión con valores determinados de la proyección del spin en el estado inicial (a) y en el estado final (a'). Sin embargo, con frecuencia interesa, desde el punto de vista físico, la sección eficaz sumada respecto de todos los valores posibles a' y promediada de acuerdo con las probabilidades de los diferentes valores a en el estado inicial (en el haz de partículas incidente). Esta sección eficaz se calcula de acuerdo con (138.6) da = (J+J)uu do; J formando los elementos de matriz diagonales del producto +/ se obtiene la suma extendida a los estados finales y el trazo significa el promedio respecto del estado Dispersión con interacción spin-órbita 621 inicial (1). Si en éste todas las direcciones del spin son equiprobables, este promedio se reduce a calcular la traza de la matriz (dividida por el número de valores posibles de la proyección del spin a): dO' = ! tr (!+!) do. Al substituir (138.4) en (138.6), el valor medio del cuadrado (v.s)2 se calcula mediante la fórmula v 2 ·s 2/3 = s(s+I)/3 = t. Como resultado obtenemos: dG/do = IAl2+jB[2+2Re(AB*)v. P, (138.7) donde P = 2§ es la polarización inicial del haz, definida como razón del valor medio del spin en el estado inicial a su valor máximo posible ( fl. Recuérdese que, en el caso de spin t, el vector s caracteriza por completo el estado espinorial (§ 59). Hay que llamar la atención sobre el hecho de que la polarización del haz incidente conduce a la asimetría acimutal de la dispersión: debido al factor v. P en el último término, la sección eficaz (138. 7) depende no solamente del ángulo polar O, sino también del acimut cf, del vector n' respecto del n ( con tal que la polarización no sea perpendicular a v~ de forma que se tenga v.P =/=- O). La polarización de las partículas dispersadas se puede calcular mediante la fórmula (138.8) Así, si el estado inicial no está polarizado (P = O), un cálculo simple da P' = 2Re(AB*) v. IAl 2+IBl 2 (138.9) De esta manera la dispersión conduce, en general, a la aparición de una polarización perpendicular al plano de dispersión. Obsérvese, sin embargo, que este efecto no aparece en la aproximadón de Born: si todas las fases e) son pequeñas, en primera aproximación respecto de ellas el coeficiente A es real y B es imaginario puro, de modo que Re(AB*) = O. (') Si el cuadrado del módulo lfonl 2 del elemento de matriz de un operador para la transición 0-+ n se suma respecto de los estados finales n, se obtiene: L n l/onl 2 = Lfon(/on)* = "1:./on(!+)no n n = (!/+)oo, Para evitar confusiones, subrayaremos que el signo de conjugación + en <1~~.6) Y en to?o lo que sigue se refiere a f como operador de spin y, en particular, no supone la transpos1c10n den Y n · 622 Teoría de las colisiones elásticas El hecho de que la polarización P' (138. 9) esté dirigida a lo largo de v era de prever: P' es un vector axil y v es el único vector axil unitario que se puede formar a partir de los vectores polares n y n' de que disponemos. Es evidente, por ello, que también tendrá esta propiedad la polarización que se produce en la dispersión de un haz no polarizado de partículas de spin l al incidir sobre un blanco no polarizado de núcleos de spin cualquiera (y no solamente de spin nulo) (1). En la formulación del teorema de reciprocidad en la dispersión cuando los spins no son nulos, hay que tener en cuenta que la inversión del tiempo cambia los signos no sólo de los impulsos, sino también de los momentos cinéticos. Por ello, la simetría de la dispersión respecto de la inversión del tiempo debe expresarse en este caso por la igualdad de las amplitudes de los procesos que difieren uno de otro no solamente en la permutación de los estados inicial y final y en el cambio de los sentidos del movimiento en los sentidos opuestos, sino también en el cambio de los signos de las proyecciones de los spins de las partículas en ambos estados. Sin embargo, los signos de estas amplitudes pueden resultar entonces diferentes debido a que la inversión del tiempo conduce, según (60.2), a introducir en la función de onda de spin un factor (- I)s-a. Esta circunstancia conduce a que el teorema de reciprocidad deba formularse de la siguiente manera (2): .f(cr1, cr2, n; cr1', cr2', n') = (-1):E(s-crj(-cri', -cr2', -n'; -cr1, -cr2,-n). (138.10) f(a1, a 2, n; a' 1, a' 2, n') es aquí la amplitud de dispersión con cambio de las proyecciones de los spins de las partículas que chocan, pasando de los valores a 1, a 2 a los valores a'1 ~ a' 2 ; la suma en el exponente se refiere a ambas partículas antes y después de la dispersión. En la aproximación de Born, la dispersión posee una simetría adicional que se traduce en la igual probabilidad de los procesos que difieren entre sí en la permutación de los estados inicial y final, sin cambio ni de los signos de los impulsos ni , de las proyecciones de los spins de las partículas, como ocurría en la inversión del tiempo (véase § 125). Combinando esta propiedad con el teorema de reciprocidad, llegamos a la conclusión de que la dispersión es simétrica respecto del cambio de signo de todos los impulsos y proyecciones de los spins, sin su permutación. De aquí se deduce fácilmente que en la aproximación de Born es imposible que surja la polarización como consecuencia de la dispersión de un haz cualquiera no polarizado por un blanco asimismo no polarizado. En efecto, al aplicar la transformación t 1) Imaginamos aquí un blanco constituido por núcleos cuyos spins están dirigidos por completo al azar. Obsérvese que paras > t el valor medio del vector de spin no determina por completo el estado espinorial y que, por consiguiente, el hecho de que sea igual a cero no significa, sin más, la ausencia completa de ordenación de los spins. (2) Esta relación se deduce de manera análoga a como se dedujo la fórmula (124.12). En el presente caso, deben introducirse los factores de spin en las amplitudes de las ondas convergentes y divergentes en la función de onda, y en vez de (124.10) se obtiene la condición k- 1 §K = S, donde K es un operador que no sólo determina la inversión, sino que también transforma el estado de spin de acuerdo con (60.2). Disper.~ión con interacción spin-órbita 623 indicada, el vector de polarización P cambia de signo y el vector unitario k x k', a lo largo del cual puede estar dirigido P, se conserva invariable. De esta manera, la propiedad que hemos hecho notar más arriba acerca de la dispersión de las partículas con spin J por partículas de spin O, posee en realidad un carácter general. En el caso de spins arbitrarios de las partículas que chocan, las fórmulas generales que dan las distribuciones angulares son muy engorrosas y no nos detendremos aquí en deducirlas. Calculemos solamente el número de parámetros por los que deben venir determinadas estas distribuciones. El caso antes considerado de la colisión de partículas con spin J y cero se caracteriza, en particular, por el hecho de que a valores dados de i y de la paridad corresponde solamente un estado del sistema formado por las dos partículas (prescindiendo de la orientación del momento cinético total en el espacio, que carece de importancia). Asociado con cada uno de tales estados aparece en la amplitud de dispersión un parámetro real (la fase r>). En cambio, en el caso de otros spins, existe, en general, más de un estado diferente con iguales valores del momento cinético total J y de la paridad; estos estados se distinguen por los valores del spin total de las partículas, S, y del momento cinético orbital I en el movimiento relativo. Sea n el número de tales estados. Es fácil ver que cada uno de estos grupos de estados interviene en la amplitud de dispersión mediante n(n~ I) 2 parámetros reales independiente5. En efecto, respecto de estos estados, la matriz Ses una matriz unitaria simétrica (en virtud del teorema de reciprocidad) con n · n elementos complejos. Es cómodo efectuar el cálculo del número de cantidades independientes de esta matriz observando que, si representamos el operador S en la forma: s = l+i~' 1-iR (138.11) la condición de que S sea unitario queda satisfecha automáticamente cuando R. en un operador hermítico cualquiera. Si la matriz S es simétrica, también es simétrica la matriz R. y, siendo hermítica, es real. Pero una matriz simétrica real tiene n(n _¡_ 1) 2 componentes independientes. Como ejemplo veamos que para dos partículas de spin J el número n = 2. En efecto, dado J, se tienen en total cuatro estados: dos estados con I = J y spin total S = O ó 1, y dos estados con / == J ~: ~ 1, S = l. Es evidente que dos de estos estados son pares (/ par), y dos impares (/ impar). La forma general de la amplitud de dispersión de las partículas de spin ~. en Linto que operador relativo a las variables de spin de ambas partículas, se puede escribir fácilmente partiendo de las condiciones necesarias de invariancia: debe ser Teoría de lm, coU..,ione.<t elá.<ttira.<t 624 un escalar, invariante respecto de la inversión del tiempo. Para construir esta expresión disponemos de los dos vectores axiles de spin de las partículas, s 1 y s 2 , y de dos vectores ordinarios (polares), n y n'. Cada uno de los operadores 1 y 2 debe aparecer en la amplitud linealmente, puesto que cualquier función del operador de spin 1 se reduce a una función lineal. La forma más general de un operador que satisfaga a estas condiciones se puede escribir como sigue: s s j =A + B(s1 . A)(s2 . A)+ C(s1 . µ)(s2. µ) + (138.12) +D(s1 .v)(s2 .v)+E(s1 +s2) .v+F(s1-s2 ) .v. Los coeficientes A, B, ... son cantidades escalares que pueden depender solamente del escalar n · n', es decir, del ángulo de dispersión O (y de la energía); A, µ, v son tres vectores unitarios, perpendiculares dos a dos, dirigidos, respectivamente, a lo largo de n~n', n - n' y n x n'. A la operación de inversión del tiempo corresponde la substitución n ~ -n', n ' ~-n, En estas condiciones, A-~ -A, µ -~ µ, V-~ -V y la invariancia del operador ( 138.12) es evidente. En el caso de la dispersión mútua de nucleones (protones y neutrones), no aparece el último término en (I 38.12). Esto se sigue ya del hecho de que las fuerzas nucleares que actúan entre los nucleones conservan el valor absoluto del spin total S del sistema; en cambio, el operador s1 - s2 , no conmuta con el operador § 2 (los demás términos en (138.12) se expresan, de acuerdo con (116.4), en función del operador de spin total S y conmutan, por ello, con S2 ). En la dispersión de nucleones idénticos (pp o nn), los coeficientes A, B .... , como funciones del ángulo de dispersión, satisfacen también determinadas condiciones de simetría que son consecuencia de la identidad de ambas partículas (véase problema 2). PROBLEMAS 1. Para la dispersión de partículas de spin ~ por partículas de spin cero, determinar la polarización después de la dispersión si antes de ésta también la polarización era diferente de cero. Solución. Es cómodo efectuar el cálculo de acuerdo con las fórmulas (138.8), (138.4) pasando a componentes y eligiendo el eje z en la dirección de v. Se obtiene así el resultado: P' = (IAl2-IBl 2)P+2JBl 2v(v.P)+2 1n(AB*)v x P+2vRe(AB*) IAl2+¡s¡2+2 re(AB*)v. p . 2. Hallar las condiciones de simetría a las que satisfacen, como funciones del ángulo O, los coeficientes en la amplitud de dispersión de dos nucleones idénticos (R. ÜEHME, J 955). Dit,persión con interacción spin-órbita 625 Solución. Agrupemos los términos de (138.12) de tal manera que cada uno de ellos sea diferente de cero tan sólo para los estados singletes (S = O) o tripletes (S = 1) del sistema de dos nucleones: / = a(s1. s2-l)+b(s1. s2+!)+c(±+(s1 .v)(s2 .v)]+ + d[(s1 • n)(s2 . n') + (s1 . n')(s2 • n)] + e(s1 + s2) . v. (1) Mediante las fórmulas ( I 16.4) es fácil comprobar que el primer término es diferente de cero tan sólo para S = O, y los restantes, para S = 1. En virtud de la identidad de las partículas, la amplitud de dispersión debe ser simétrica respecto de la permutación de las coordenadas de las partículas cuando S = O, y antisimétrica para S = 1; esta transformación equivale a substituir O~ :r -0, o lo que es lo mismo, a cambiar el signo de uno de los vectores n y n' (cf. ~ 135). De estas condiciones se deducen las relaciones siguientes: a(1r-fJ) = a(B), b(1r-fJ) = -b(fJ), d(1r-fJ) = d(B), c(1r-6) = -c(fJ), (2) e(1r- fJ) = e(6). En virtud de la invariancia isotópica, la amplitud de dispersión es la misma para las dbpersiones nn y pp y también para la dispersión np en el estado isotópico con T = 1. Para el sistema np es también posible, sin embargo, el estado con T = O; la amplitud de dispersión np se caracteriza entonces por otros coeficientes a, b, ... en ( 1) que no poseen las propiedades de simetría (2). CAPÍTULO XVIII TEORíA DE LAS COLISIONES INELÁSTICAS § 139. La colisión elástica cuando son posibles los procesos inelásticos Una colisión se llama ine/ástica cuando va acompañada de un cambio del estado interno de las partículas que chocan. Estos cambios los entendemos aquí en el sentido más amplio, en particular puede cambiar incluso la propia especie de las partículas. Así, puede tratarse de la excitación o ionización de los átomos, de la excitación o desintegración de los núcleos, etc. En estos casos, cuando la colisión (por ejemplo, una reacción nuclear) puede verse acompañada de diferentes procesos físicos, se habla de diferentes canales de .reacción. La existencia de canales inelásticos influye también en las propiedades de la dispersión elástica. En el caso general en que existen diferentes canales de reacc10n, la expresión asintótica de la función de onda del sistema formado por las partículas que chocan es una suma en la que a cada canal posible corresponde un término. Entre ellos figura también, en particular, un término que describe las partículas en el estado inicial no modificado (como suele decirse, en el canal de entrada). Dicho término es el producto de las funciones de onda del estado interno de las partículas y de la función que corresponde a su movimiento relativo (en el sistema de coordenadas en el que se encuentra en reposo el centro de masas). Es precisamente esta última función la que aquí nos interesa; designémosla por 1P y veamos cuál es su forma asintótica. La función de onda 1P en el canal de entrada se compone de la onda plana incidente y de una onda esférica divergente que corresponde a la dispersión elástica. Es posible representarla también como suma de ondas convergentes y divergentes, conforme se hizo en el § 122. La diferencia consiste en que la expresión asintótica de las funciones radiales R1(r) no se puede tomar en la forma de una onda estacionaria del tipo (122. 7). Una onda estacionaria es suma de una onda convergente y otra divergente con iguales amplitudes. En una colisión puramente elástica, esto corresponde al sentido físico del problema; pero cuando existen canales inelásticos, la amplitud de la onda divergente debe ser menor que la amplitud de la onda con- 626 Colisión elástica cuando son posibles los procesos inelásticoJ 627 vergente. Por ello la expresión asintótica de 'f/J vendrá dada por la fórmula (122.8): • if; = 2 e.o :r °¿(2l + 1)Pl(cos 8)[( -1 )le-fkr - Szeikr], (139.l) l=O con la diferencia de que las S1 no vienen ahora determinadas por la expresión (122.9), sino que son ciertas cantidades (en general, conplejas) cuyos módulos son menores que la unidad. La amplitud de la dispersión elástica se expresa en función de estas cantidades por la fórmula (122. 10): f(B) = 1 e.o ik °¿(2l+ l)(Sz- l)Pz{cos8). 2 (139.2) l=O Para la sección eficaz total de dispersión elástica obtenemos, en vez de (122.11), la fórmula 00 cre = !!._""(21 + 1)11- Szj2. k2~ (139.3) l=O También la sección eficaz total de dispersión inelástica, llamada asimismo sección eficaz de reacción ar para todos los canales posibles, se puede expresar en fun- ción de las cantidades S 1• Basta para ello observar que para cada valor l la intensidad de la onda divergente queda disminuida respecto de la intensidad de la onda convergente en la razón \S1j2• Esta disminución debe quedar compensada enteramente por la dispersión inelástica. Es claro, por lo tanto, que 00 ar= ~""(2l+ 1)(1-!Szl 2), k2k (139.4) l=O y la sección eficaz total será 21T ¿00 crt = cre+ ar= - - k2 (2l+ 1)(1-ReSz). (139.5) l=O La amplitud parcial de dispersión elástica con momento cínético l, definida de acuerdo con (122.13), es: fi = (Sz- l)/2ik, (139.6) y cada uno de los términos de la suma en (139.3) y (139.4) representa una sección eficaz parcial de dispersión elástica e inelástica de las partículas con momento cinético /: 628 Teoría de las colisiones inelásticas G~l) = (1r/k2)(2l+ l)ll -S1l2, G~l) = (1r/k2)(2l+ l)(l-lS1l2), a~zl = ) (139.7) (21r/k2)(2l+ 1)(1-ReSz). El valor S1 = 1 corresponde a la ausencia total de dispersión (con el valor dado de/). En cambio, el caso S 1 = O corresponde a la «absorción» total de las partículas con el valor dado de l; se tiene entonces G~l) = G~l) = (Tr/k 2 )(2I+ 1), {139.8) es decir, las secciones eficaces se dispersión elástica e inelástica son iguales entre sí. Para un valor dado de a/l) la sección eficaz parcial de dispersión elástica puede tomar valores comprendidos en el intervalo yao-y(ao-a~>) ~ya~>::::;; yao+_v'(ao-a~l>), (139.9) donde a0 = (21+ l)n/k2 • Es interesante que cuando a/O es diferente de cero, debe ser también diferente de cero a/ 1), es decir, que la existencia de canales inelásticos de reacción conduce necesariamente a la existencia simultánea de la dispersión elástica. Tomando en (139.2) el valor de /(O) para (} = O y comparando con la expresión (139.5), obtenemos la relación lm/(0) = kae/4Tr, (139.10) que generaliza el teorema óptico (124.9) obtenido anteriormente. Como antes, /(O) es aquí la amplitud de dispersión elástica para ángulo cero, pero la sección eficaz total a1 incluye también la parte inelástica. A su vez, las partes imaginarias de las amplitudes parciales Ji. están ligadas con las secciones eficaces parciales a/O por la relación k G(l) Imfz=--t4-rr 21+1' (139.11) que se sigue sin más de (139.6) y (139.7). El hecho de que los coeficientes S 1 en la expresión asintótica de la función de onda no sean iguales en módulo a la unidad, en modo alguno repercute en las conclusiones a que se llegó en el § 128 acerca de los puntos singulares de la amplitud de dispersión elástica, considerada como función de la variable compleja E; estas conclusiones conservan su validez aun cuando existen procesos ine]ásticos. Sin embargo, las propiedades analíticas de la amplitud cambian, en el sentido de que Colisión elástica cuando son posibles los procesos inelástiCQf 629 ahora no es ya real sobre el semieje real negativo (E < O) y de que sus valores en los bordes superior e inferior del corte para E> O no son ya valores conjugados complejos (con lo que tampoco son conjugados complejos sus valores en puntos de los semiplanos superior e inferior simétricos respecto del eje real). Al pasar del borde superior del corte al inferior rodeando el punto E = O, la raíz VE cambia de signo, es decir, como resultado de esta operación cambia el signo de la cantidad real k (para E > O). Las ondas convergente y divergente en (139 .1) cambian entre sí sus papeles y, por lo tanto, el papel de nuevo coeficiente S1 lo representará la cantidad I/S1, inversa de su valor anterior (que en modo alguno coincide con S 1*). Es natural designar los valores de las amplitudes Ji. en los bordes superior e inferior del corte por fi(k) y Ji.(- k) (¡amplitud física lo es, claro está, solamente fi.(k)!). De acuerdo con (139.6) tenemos: fz(k) = Si- l -;¡;¡;-, fz( - k) = - l/Si- l -;¡;¡;- . Eliminando S 1 entre estas dos igualdades, obtenemos la siguiente relación fi(k)-!1(-k) = 2ikfi(k)fi(-k); (139.12) (si no existen procesos inelásticos, se tendría!(- k) = f*(k) y las relaciones (139. 12) y ( 139.11) coincidirían). Escribiendo (I 39.12) en Ja forma 1 1 fz(k) Ji( -k) - - - - - - = -2ik, vemos que la suma 1/fi(k)+ik debe ser función par de k. Designando esta función por g1(k 2), se tiene: 1 fz(k) =g-z(-k2-)--ik. (139.13) La función par g1(k 2), sin embargo, no es ahora real, como ocurría en (124.15) (1). Cuando un haz de partículas atraviesa un medio dispersor constituido por un gran número de centros de dispersión, se debilita gradualmente debido a que desaparecen de él las partículas que experimentan los diferentes procesos de colisión (1) Los razonamientos expuestos, y con ellos también la conclusión a que conducen acerca de la paridad de la función g 1, suponen una disminución suficientemente rápida de la interacción para r--+ =, disminución que garantice la ausencia de cortes en el semiplano izquierdo de E y haga con ello posible rodear por completo el punto E = O. 630 Teoría de las colisiones inelásticas elástica e inelástica. Esta atenuación viene determinada completamente por la amplitud de dispersión elástica para ángulo cero, y si se cumplen determinadas condiciones (véase más adelante) es posible describirla acudiendo al siguiente método formal (1). Seaf{O, E) la amplitud de dispersión para ángulo cero correspondiente a cada una de las partículas del medio. Supondremos que fes pequeña comparada con la distancia media d ,...., ( V/ N)1 13 entre partículas; se puede entonces considerar la dispersión por cada una de ellas separadamente. Introduzcamos como cantidad auxiliar un cierto « campo efectivo » Uet de un centro inmóvil, determinándolo de tal manera que la amplitud de dispersión de Born para ángulo cero calculada mediante el mismo sea precisamente igual a la amplitud verdadera f(O, E) (¡en modo alguno se supone con esto que la aproximación de Born sea aplicable al cálculo de f(O, E) de acuerdo con la interacción real de las partículas!). Tenemos así, por definición (véase (125.4)): f 2TTn2 Ver d V= - --;;¡-f(O,E), (139.14) donde m es la masa de la partícula dispersada. Al igual que la amplitud f, el campo así determinado es complejo. La relación entre su radio de acción a y la cantidad Ue/ se obtiene estimando ambos miembros de la igualdad (139.14): a3 Uef "' li2:f/m. (139.15) La definición (139.14) no es, claro está, unívoca. lmpongámosle todavía la condición suplementaria de que el campo Uet satisfaga la condición de aplicabilidad de la teoría de perturbaciones: (139.16) (con lfl ~ a). Es fácil ver que, en este caso, la atenuación del haz disperso se puede representar como propagación de una onda plana en un medio homogéneo en el que la partícula posee una energía potencial constante, igual a - Nf UerdV Uet = V N2TTh2 = - V-;;¡- f(O,E), (139.17) (1) Las ideas que se exponen a continuación se aplican, en particular, para describir la dispersión nuclear de neutrones rápidos (con energías del orden de centenares de Me V) cuyas longitudes de onda son tan pequeñas que, comparadas con ellas, un núcleo se puede considerar como un medio macroscópico heterogéneo. Colisión elástica cuando son posibles los procesos inelástico¡ 631 es decir, igual a la que se obtiene promediando los campos efectivos de todas las N partículas del medio respecto de su volumen V. Esto resulta evidente si se considera primero la dispersión en una porción del medio tal que, si bien se encuentran en ella todavía muchos centros de dispersión, el efecto de ésta es aún pequeño (la posibilidad de considerar tales regiones parciales viene garantizada por la condición ( 139.16)). La atenuación del haz al atravesar dicha porción viene determinada por la amplitud de dispersión para ángulo nulo, que, a su vez, se determina en la aproximación de Born mediante la integral del campo dispersor en todo el volumen de la porción considerada. Esto significa también que las propiedades dispersoras del medio que nos interesan quedan por completo determinadas por el campo promediado en volumen (139.17). De esta manera el haz de partículas que atraviesa el medio se puede describir mediante una onda plana ~ eikz con número de onda 1 k = -y'[2m(E- Uer)]. li ln'troduciendo el número de onda k 0 = biremos k en la forma nk0 ; la cantidad V2mE/li de las partículas incidentes, escri- Uer n=y'(l--) E N2Trh2 = y'(l + V mE f(O,E)) (139.18) representa el papel de « índice de refracción» del medio para el haz de partículas que lo atraviesa. Este índice, en general, es complejo {¡la amplitud f es compleja!) y su parte imaginaria determina la disminución de intensidad del haz. Si E ~ 1Uet 1, (139.18) nos da, como debe ser: NTrh2 Im n = --Imf(O,E) V mE donde a1 es la sección eficaz total de dispersión (hemos utilizado aquí el teorema óptico (139.10)); esta expresión corresponde a un resultado evidente: la intensiC'ad de la onda disminuye según la ley leikz¡2 ,..., e-NU',z/V, A la vez que la absorción, el índice de refracción complejo (139.18) determina 632 Teoría de las colisione.¡ inelásticas también (mediante su parte real) la ley de refracción del haz a la entrada y a la salida del medio dispersor. PROBLEMA Un haz de neutrones es dispersado por un núcleo pesado, siendo la longitud de onda de los neutrones pequeña comparada con el radio a del núcleo (ka~ 1). Se supone que todos los neutrones que inciden con momento cinético orbital l < ka== 10 (es decir, con un « parámetro de impacto» ,i = hl/mv = 1/k < a) son absorbidos por el núcleo y que para l > 10 dichos neutrones no interactúan en absoluto con él. Determinar la sección eficaz de dispersión elástica para ángulos pequeños. Solución. En las condiciones indicadas, el movimiento de los neutrones se comporta en esencia como cuasiclásico y la dispersión elástica es el resultado de una débil desviación, por completo análoga a la difracción de Fraunhofer de la luz por una esfera negra. Por ello la sección eficaz buscada se puede escribir directamente ¡lplicando la conocida solución del problema de difracción (1): dae = '1Ta 2 J~(ka8) '17'(}2 do. Este mismo resultado se puede obtener también a partir de la fórmula general (139.3). De acuerdo con la condición del problema, tenemos Si = O para l < 10 y Si = 1 para l > 10 • La amplitud de Ja dispersión elástica es, por ello, l /(8) = - Zik lo 2 (21+ l)Pz(cos8). l=O El principal papel en la suma lo representan los términos con grandes valores de l. De acuerdo con esto, escribiremos 21 en vez de 21 + 1 y para valores pequeños de O utilizaremos para Pi(cos O) la expresión aproximada (49.6), pasando de la suma a una integración: lo f(O) = : JUo(Ol)dl o i = -loli(Blo) k(J = (ia/8)l1(ka8), como se quería demostrar (2). (1) Véase tomo Il, Teoría clásica de los campos, problema 3 del§ 61 (el problema que plantea la difracción por una esfera negra es equivalente al problema de la difracción por una abertura circular practicada en una pantalla opaca). La sección eficaz se obtiene dividiendo la intensidad de las ondas difractadas por el flujo incidente. (2) De manera análoga se puede considerar el problema de la difracción, por un núcleo «negro», de partículas rápidas cargadas (A. l. AJIEZER, l. IA. POMERANCHUK, 1945). En este caso, el valor límite /0 debe determinarse a partir de la condición de que la distancia mínima entre el núcleo y la partícula, que se mueve a lo largo de la trayectoria clásica en el campo coulombiano, sea nrecisamente igual al rarlio del núcleo. Para l < lo hay que hacer, como antes Si = O, y para l > /0 , S, = é2«15i, donde Oz son las fases coulombianas dadas por (133.11). Véase A. AJIEZER, l. POMERANCHUK, Nekotorye voprosy teorii aidra ( Algunos problemas de la teoría del núcleo), Gostejizdat, 1950, § 22. Dispersión inelástica de partículas lentas 633 La sección eficaz total de dispersión elástica es co lf(ka8) <:ie f = TTa 2 ---2TT8 d8 7rfl2 o = TTa2; (dada la rápida convergencia, la integración puede extenderse hasta =): como debía ser en las condiciones dadas (cf. (139.8)), esta sección eficaz coincide con la sección eficaz de absorción, que es igual simplemente al área de la sección geométrica de la esfera. La sección eficaz total escrt = 2na2• &140. Dispersión inelástica de partículas lentas El razonamiento que condujo en el § 130 a la ley límite de dispersión elástica en el caso de pequeñas energías, se generaliza fácilmente al caso en que existen procesos inelásticos. Como antes, el papel principal, para pequeñas energías, lo representa la dispersión con l = O. Recordemos que, de acuerdo con los resultados obtenidos en el § 130, el elemento correspondiente de la matriz S era igual a: S0 = e2ioo ~ 1 + 2i8o = 1 - 2ika. Las propiedades de la función de onda utilizadas en el § 130 cambian tan sólo en el sentido de que la condición que se le impone en el infinito (forma asintótica (139.1)) es ahora compleja, en vez de la condición de onda estacionaria real impuesta en el caso de la dispersión puramente elástica. Debido a ello resulta también compleja la constante °' = - c2 /c1 • El módulo ¡s0 no es ya igual a la unidad; la condición ¡s0 \ < 1 significa que la parte imaginaria °' = ot' +iot" debe ser negativa (rx." < O). J Substituyendo S 0 en (139.7), encontramos las secciones eficaces de dispersión elástica e inelástica: cre = 4TTIIXl 2, crr = 4-TT)!X")/k. (140.1) (140.2) Así, pues, la sección eficaz de dispersión elástica es, como antes, independiente de la velocidad. En cambio, la sección eficaz de los procesos inelásticos resulta ser inversamente proporcional a la velocidad de las partículas, es decir, obedece a la llamada « ley 1/v » (H. A. BETHE, 1935). Por consiguiente, al disminuir la velocidad crece en importancia el papel de los procesos inelásticos frente a la dispersión elástica (1). (1) De manera análoga se puede determinar la dependencia, respecto de la velocidad, de las secciones eficaces parciales de reacción para momentos cinéticos orbitales diferentes de cero. Dichas secciones resultan proporcionales a k 2i- 1 : u,m,..., k2&-l. Las secciones eficaces de dispersión elástica O'e(l), en cambio, son como antes proporcionales a k 41 , es decir, disminuyen para k-+ O más rápidamente que las O',(Z) con iguales valores de /. 634 Teoría de las colisiones inelásticas Las leyes límite (140.1) y (140.2) son, claro está, tan sólo los primeros términos del desarrollo de las secciones eficaces en potencias de k. Es interesante que el término siguiente del desarrollo de ambas secciones eficaces no contiene ninguna nueva constante aparte de las que figuran en (140.1-2) (F. L. SHAPIRO, 1958). Esta circunstancia es consecuencia de que la función g 0 (k 2) en la expresión (139.13) fo(k) go(k 2)-ik de la amplitud parcial de dispersión (/=O) es par. Para valores pequeños de k, esta función se desarrolla, por consiguiente, en potencias pares de k, de forma que k 2 • Prescindiendo de este el término que sigue a g 0 ~ - 1/a será un término término, podemos escribir aún en fo(k) dos términos del desarrollo: t'J f 0(k) ~ -a(l -ika). De manera análoga se pueden conservar también los términos que siguen en el desarrollo de las secciones eficaces, para los que e-s fácil obtener las siguientes expresiones: 4n-lal 2(1-2kla"I), (140.3) = 4n-la"l(l -2kla"l)/k. (140.4) Ge= <Jr Los resultados obtenidos presuponen una disminución suficientemente rápida de la interacción a grandes distancias. Vimos en el § 130 que la amplitud de dispersión elástica tiende a un límite constante para k ~ O si el campo U(r) disminuye más rápidamente que ,-a. Esta condición se exige también para que valga la fórmula análoga a (140.1) cuando existen canales inelásticos (1). La ley 1/v para la sección eficaz de reacción supone, en cambio, que se cumpla una condición más débil: el campo debe disminuir más rápidamente que ,-2, lo que es claro en virtud de la siguiente justificación intuitiva de esta ley. La probabilidad de que ocurra una reacción como consecuencia del choque, es proporcional al cuadrado del módulo de la función de onda de la partícula incidente en la« zona de reacción» (en el dominio r a). Físicamente, esta proposición traduce el hecho ·de que, por ejemplo, un neutrón lento que choca con un núcleo puede provocar una reacción tan sólo « penetrando » en el mismo. Si la interacción a disminuye más rápidamente que r-2, al pasar de grandes valores de r a valores r dicha interacción no cambia el orden de magnitud de la función de onda; con otras palabras, la razón l11-,(a)/1P( =)¡ 2 tiende a un límite finito para k ~ O (es fácil verlo observando que en la ecuación de SCHRODINGER el término U1JJ resulta pequeño t'J t'J 1 ( ) La fórmula (140.3), en cambio, que tiene en cuenta el término siguiente en el desarrollo en potencias de k, exige que U disminuya más rápidamente que r- 4 • 635 Dispersión inelástica de partículas lentas comparado con L 'lj)). La sección eficaz se obtiene dividiendo 11Pl 2 por la densidad de corriente. Tomando 1P en la forma de onda plana, normalizada a la unidad de densidad de corriente, tenemos l1Pl 2 ,..., I/v, es decir, el resultado buscado. En la colisión de partículas cargadas, junto a las fuerzas nucleares de corto alcance encontramos también el campo coulombiano, que disminuye lentamente. Este campo puede modificar de modo fundamental la magnitud de la onda incidente en la zona de reacción. La sección eficaz de reacción se obtiene multiplicando I/v por la razón de los cuadrados de los módulos de las funciones de onda coulombiana y libre (parar~ O); esta razón viene dada por las fórmulas (134.10-11). Obtenemos así (en unidades coulombianas): 21rA crr el signo + = ------; k2je±21rfk- lj (140.5) en el exponente corresponde a repulsión, y el signo -, a atracción. Si la velocidad es grande comparada con la unidad coulombiana (k ~ 1), la interacción de Coulomb no representa papel ninguno y volvemos de nuevo a la ley ar = A/k. Si, en cambio, la velocidad es pequeña respecto de la unidad coulombiana (k ~ 1, es decir, en unidades ordinarias, Z 1Z 2e2 /nv ~ 1, donde Z1e, Z 2e son las cargas de las parficufos que chocan), la interacción de Coulomb representa el papel dominante en la determinación de la magnitud de la función de onda en la zona de resonancia. Con esto obtenemos: (140.6) para la colisión de partículas que se repelen, y 21rAliZ1Z2e2 crr=------ (140.7) v2 en el caso de partículas que se atraen (1). El factor exponencial en que difiere (140.6) (1) Obsérvese que las leyes límite (140.6-7) para la dependencia respecto de la velocidad se refieren no solamente a las secciones eficaces totales, sino también a las secciones eficaces parciales para todos los momentos cinéticos /. Esto resulta ya del hecho de que en el desarrollo (l,34.2) de las funciones 1P{ (que aparecen en las fórmulas que hemos utilizado, (134.10-11)), en todos los términos de la suma las funciones Rkz tienen la misma dependencia límite respecto de k; así, en el caso de atracción, según (36.25), li;i.s funciones coulombianas son tales que Rkl ,_, Vk/r J 2 1+lY8r), y parar..-.+ O: Rkz ,_, Vkrl:Las contribuciones, de cada uno de los momentos al cuadrado 11J'{(a)l2 son (en unidades ordinarias) del orden de (a/ac) 2Zk-1 es decir, dependen de k de la misma manera, si bien se ven reducidos por el pequeño factor (a/ac) 2Z (ac = lt 2 /mZ1 Z 2 e2 es la unidad coulombiana de longitud). = 636 Teoría de las colisiones inelásticas de (140.7) representa la pequeña probabilidad de que la partícula atraviese la barrera potencial de Coulomb. § 141. La matriz de dispersión en las reacciones La sección eficaz ar estudiada en los §§ 139,140 era la sección eficaz suma de todos los posibles canales inelásticos de dispersión. Veamos ahora cómo es posible construir una teoría general de las colisiones inelásticas en la que cada canal puede considerarse por separado. Supondremos que como resultado de la colisión de dos partículas aparecen de nuevo dos partículas (las originales u otras) (1). Numeremos todos los canales de reacción posibles (para la energía dada) y designemos las cantidades que les corresponden mediante los correspondientes índices. Sea· a el canal de entrada. La función de onda del movimiento relativo de las partículas que chocan (en el sistema del centro de masas) viene representada en este canal por la suma, que hemos escrito ya más de una vez, de una onda plana incidente y una onda divergente dispersada elásticamente: eik,,r lfa = eikaz +/aa( 8)--. r (141.1) El cuadrado de la amplitudfaa da la sección eficaz de dispersión elástica en el canal a: dcraa = //aa) 2do. (141.2) En otros canales (índice b), las funciones de onda del movimiento relativo de las partículas que se forman en ellos se representan por ondas divergentes. Por una razón que se expondrá más adelante, conviene escribir estas ondas en la forma: (141.3) donde kb es el vector de onda del movimiento relativo de los productos de reacción (en el canal b), () su ángulo con el eje z, y ma y mb las masas reducidas de las dos partículas iniciales y de las dos partículas finales. El flujo dispersado en el ángulo sólido do se obtiene multiplicando el cuadrado IV'bj 2 por vbr 2dr, y la sección eficaz de la correspondiente reacción se obtiene dividiendo este flujo por la densidad de la corriente incidente, igual a va- De esta manera: (1) No habrá necesidad de considerar en este libro de manera explícita las reacciones que conducen a la formación de más de dos partículas (con excepción de las colisiones en las que se produce la ionización de los átomos(§ 145)). Por ello, no vamos a determinar aquí la matriz de dispersión para el caso general de las reacciones en las que toman parte un número arbitrario de partículas. La matriz de dispersión en las reacciones 637 (141.4) En el § 124 se introdujo el operador de dispersión S que transforma la onda convergente en una divergente. Cuando existen varios canales, este operador tiene elementos de matriz para las transiciones entre canales diferentes. Los elementos de matriz « diagonales » respecto de los canales corresponden a la dispersión elástica, y los no diagonales, a los diferente procesos inelásticos; claro está, todos estos elementos siguen siendo operadores respecto de las demás variables. Su determinación se efectúa como sigue. De manera semejante a como se procedió en el § 124, introduzcamos los operadores laa, lab ligados a las amplitudes fam Íab· Definiremos los elementos diagonales de la matriz S por la fórmula Saa = 1 + 2ika/aa, análoga a la ( 124.4). Los elementos no diagonales, en cambio, los definiremos por Sab = 2iy(kakb)/ab, a =f:. b. Estas dos expresiones se pueden reunir en una fórmula única (141.5) Es fácil ver que precisamente esta definición conduce a una matriz S que deberá satisfacer la condición de ser unitaria. En efecto, escribamos la función de onda en el canal de entrada como sistema de ondas convergentes y divergentes, conforme se hizo en el ~ 124: e-ikar eikar fa= F(-n')--- (1 + 2ika/aa)F(n')ryva ryva e-ikar = F(-n') - ryva eikar - SaaF(n') - . ryva (141.6) (por conveniencia, hemos introducido aquí en la expresión (124.3) el factor adicional vu-~). En estas condiciones, de acuerdo con las definiciones que hemos adoptado para las amplitudes, la función de onda en el canal b se escribirá en la forma (141.7) Teoría de las colisiones inelásticas 638 El flujo en las ondas convergentes debe igualarse a la suma de los flujos en las ondas divergentes para todos los canales; esta condición no hace sino expresar la condición evidente de que la suma de las probabilidades de todos los procesos posibles (elásticos e inelásticos) que pueden resultar de la colisión, debe ser igual a la unidad. Gracias a haber introducido en el denominador de las ondas esféricas el factor Vv, la velocidad desaparece en la expresión de las densidades de corriente en dichas ondas. Por ello, la condición impuesta significa simplemente que deben coincidir las normalizaciones de la onda convergente y del conjunto de ondas divergentes. Esta condición se expresa, por consiguiente, al igual que antes, por la condición de que el operador de dispersión sea unitario, entendido como matriz, en particular con relación a los números de los diferentes canales. Para los operadores esta condición se expresa por la igualdad iab fab-//a = 2i¿ Aclacltc, (141.8) e análoga a (124.7); el íno1ce + significa aquí el paso al complejo conjugado y la transposición respecto de todos los demás índices matriciales (aparte el número del canal). La matriz Ses diagonal con relación a los estados en los que el momento cinético orbital l tiene valores determinados; distinguiremos los correspondientes elementos de matriz por el índice (/). Aplicando los operadores y fab a la función ( 124.16), obtenemos las amplitudes de los procesos elásticos e inelásticos de dispersión en la forma: laa 1 00 /aa = ik ¿ {2/ + 1)( Saa<i> -1 )Pl(cos 8), 2 ªz=o (141.9) 1 /ab = 00 2iv'(kakb)¿(2l+ l)Sab<l>P¡(cosB). l=O Las correspondientes secciones eficaces integrales son: 00 Gaa = ; ¿{2/+ l)jl-Saa<llj2, a l=O (141.10) 00 Gab = ; ¿{2/+ l)ISab<t>¡ 2• a l=O La matriz de dispersión en las reacciones 639 La primera de estas fórmulas coincide con (I 39.3). La sección eficaz total de reacción ar (partiendo de] canal de entrada a) es, en cambio, igual a la suma crr = .L'Gab b extendida a todos los b =p a. En virtud del carácter unitario de la matriz S tenemos: ¿',sabl 2 = 1-ISaa\ 2, b con lo que se vuelve a la fórmula (139.4) para ªr· La simt:tría del proceso de dispersión respecto a la inversión del tiempo (teorema de reciprocidad) se expresa por la igualdad (141.11) o, lo que es lo mismo: /ab = fb*a*• (141.12) a* y b* representan aquí los estados que difieren de los estados a y b en el cambio de los signos de las velocidades y de las proyecciones de los momentos cinéticos de las partículas. Estas relaciones generalizan las fórmulas ( 124.11-12) relativas a la dispersión elástica (1). Para un proceso con direcciones determinadas (inicial y final) del movimiento, ( 141.12) conduce a la misma igualdad para las amplitudes de dispersión que aparecen en la fórmula (141.4). Por ello, las secciones eficaces del proceso directo y del proceso inverso respecto del tiempo están ligadas entre sí por la igualdad (2): (141.13) Como se demostró en el § 125, cuando la teoría de perturbaciones es aplicable en primera aproximación, además del teorema de reciprocidad vale también. otra relación entre las amplitudes de los procesos directo e inverso (en el sentido literal de la palabra): a-+ b y b-+ a. Esta propiedad, que se expresa por la igualdad lab =Iba*, se tiene también (y en el mismo orden de aproximación) en el caso de procesos inelásticos. Las correspondientes secciones eficaces están ligadas entonces por la igualdad (1) Prescindimos aquí del factor - l, que puede resultar en la colisión de partículas que poseen spin (cf. (138.10)). Esta circunstancia no se refleja, claro está, en la relación (141.13) para las secciones eficaces. (2) Esta igualdad traduce el llamado principio del equilibrio detallado. 640 Teoría de las colisiones inelásticas (141.14) Pb2 dob Pa 2doa La diferencia entre las transiciones a --+ b y a* --+ b* desaparece si se considera la sección eficaz integral (es decir, la sección eficaz integrada respecto de todas las direcciones Pb), sumada, además, respecto de todas las direcciones de los momentos j¡b, j 2 b de las partículas que se forman y promediada respecto de las direcciones de los impulsos Pa y de los momentos ita, j 2a de las partículas incidentes. Designemos esta sección eficaz por <1ab: 1 (Jab = 4rr(2jia + 1)(2ha + 1) 2 m1a,m2a Escribiendo (141.14) en la forma y efectuando la integración y la suma, obtenemos la relación (2ha + 1)(2jza + 1)Pa 2 aab = (2jib + 1)(2jzb + 1)Pb 2 aba• (141.15) Finalmente, observemos la siguiente propiedad de la amplitud f~b· Vimos en el párrafo anterior que, cuando Pa--+ O, la sección eficaz de reacción varía de acuerdo con la ley <1ab ,__, 11Pa (para una disminución suficientemente rápida de la interacción a grandes distancias). De acuerdo con la fórmula (141.4), esto significa que !ab--+ --+ const cuando Pa --+ O. En virtud de la simetría (141.12), de aquí se sigue que fa 6 tiende a un límite constante también cuando p 1, ·-+ O. Consideraremos de nuevo esta propiedad en el § 144. § 142. Fórmulas de Breit y Wigner En el § 132 se introdujo el concepto de estados cuasiestacionarios como estados que poseen una vida de duración finita, pero relativamente larga. Una amplia categoría de tales estados la encontramos en el dominio de las reacciones nucleares para energías no demasiado grandes, reacciones que pasan por el estado de formación del núcleo compuesto (1). La imagen física intuitiva de los procesos que ocurren de esta manera consiste en suponer que la partícula que incide sobre el núcleo, al interactuar con los nucleones del mismo, se « fusiona » con él formando un sistema compuesto en el que la energía aportada por la partícula se distribuye entre varios nucleones. Las energías de resonancia corresponden a niveles cuasidiscretos de este sistema compuesto. La larga duración de la vida de los estados cuasiestacionarios (comparada con los (1) El concepto de « núcleo compuesto » fue introducido por N. BoHR (1936). Fórmulas de Breit y Wigner 641 « períodos » de movimiento de los nucleones en el núcleo) está ligada con el hecho de que, durante la mayor parte del tiempo, la energía está distribuida entre muchas partículas, de modo que cada una de ellas posee una energía que es insuficiente para que escape del núcleo venciendo la atracción de las restantes partículas. Tan sólo rara vez, relativamente, se concentra sobre una partícula una energía suficientemente grande para que así ocurra. En estas condiciones, la desintegración del núcleo compuesto puede tener lugar de diferentes maneras, que corresponden a los diferentes canales de reacción posibles (1). El carácter de tales colisiones permite afirmar que la posibilidad de que se produzcan en ellas procesos inelásticos no se hace notar en la parte potencial de la amplitud de la dispersión elástica, que no está ligada con las propiedades del núcleo compuesto (véase § 132); dichos procesos modifican tan sólo la magnitud de la parte resonante de la amplitud de dispersión elástica. Por la misma razón, las amplitudes de los procesos de dispersión inelástica, que ocurren pasando por el estadio de formación del núcleo compuesto, poseen un carácter de resonancia puro. Los denominadores de resonancia de todas las amplitudes, que están vinculados con la anulación del coeficiente de la onda convergente para E= E 0 - }ff, conservan entonces su forma primitiva (E- E 0 +!ff), donde r determina, como antes, la probabilidad total de desintegración (cualquiera) del estado cuasiestacionario dado del núcleo compuesto. Estas razones, junto con la condición de unitariedad, a la que deben satisfacer las amplitudes de dispersión, bastan para establecer su forma. El cálculo conviene efectuarlo de forma simétrica, numerando todos los posibles canales de desintegración del núcleo compuesto y sin fijar de antemano cuál de ellos será el canal de entrada para la reacción dada (los índices que indican el número del canal los representaremos por las letras a, b, e, ... ). Además, consideraremos también las amplitudes parciales de dispersión que corresponden al valor de l asociado con el estado cuasiestacionario dado (2). De acuerdo con lo dicho antes buscaremos para estas amplitudes expresiones de la forma: (142.1) (Para simplificar la escritura, prescindimos del índice l en las constantes <5a y Mab). El primer término existe sólo para a = b y representa la amplitud de la dispersión (1) Entre los procesos que entran en competencia figura también la captura radiativa de la partícula incidente, proceso en el que el núcleo compuesto excitado pasa a su estado fundamental emitiendo un fotón y. Este proceso es también« lento» debido a la relativamente pequeña probabilidad de la transición acompañada de radiación. ( 2) Prescindiremos por el momento de la influencia de los spins de las partículas que toman parte en el proceso, influencia que complica el problema. Teoría de las colisiones inelásticas 642 elástica potencial en el canal a (las constantes Óa coinciden con las que figuran en la fórmula (132.11) para las fases b/0)). El segundo término en (142.1) corresponde, en cambio, a procesos resonantes. La forma de escribir el coeficiente del factor de resonancia en este término se ha elegido de manera que se simplifique el resultado de aplicar las condiciones de unitariedad (véase más adelante). Dado que consideramos la dispersión para un valor dado del módulo del momento cinético orbital, es decir, de una cantidad que no cambia de signo en una inversión del tiempo, el teorema de reciprocidad (simetría respecto de dicha inversión) se expresa simplemente por el carácter simétricos de las amplitudes !ab(l) respecto de los índices a, b. De aquí se sigue que deben ser también simétricos los coeficientes Mab(Mab = M ba)• Las condiciones de unitariedad para las amplitudes !ab< 1> son: lm /ab<ll = Lkc/a/l>Jbc<l>«<; (142.2) e (cf. (141.8)). Substituyendo aquí las expresiones (142.1), obtenemos, después de un cálculo sencillo: E-Eo-!ir Mab irfMacMbc* E-Eo+!ir (E-Eo)2+!r 2 Para que esta igualdad se cumpla idénticamente cualquiera que sea ei valor de la energía E, ante todo debe ser Mab = Mab*, es decir, las cantidades Mab son reales. Obtenemos luego la siguiente relación: (142.3) es decir, la matriz de los coeficientes Mab debe coincidir con su cuadrado. La matriz real simétrica M ab se puede reducir a la forma diagonal mediante una transformación lineal ortogonal adecuada Ú. Designando los elementos diagonales (valores propios) de la matriz por M(r:t.), escribiremos esta transformación en la forma L UaaUpbMab = Af(a>Sap, a,b donde los coeficientes de la misma satisfacen las relaciones de ortogonalidad (142.4) Recíprocamente (142.5) Mab = LUaaUabM(a>. a Las relaciones ( I 42.3) conducen a las condiciones M(r:t.) = (M(r:t.)) 2 para los val o- 643 Fórmulas de Breit y Wigner res propios Ml!Y..), de donde se sigue que estos valores sólo pueden ser iguales a cero o a l. Si todos los M(!Y..) son distintos de cero salvo uno (sea éste el MÜ) = 1), en virtud de (142.5) tenemos: (142.6) es decir, todos los elementos de matriz Mab se expresan en función del conjunto de cantidades U1a, a = 1, 2, ... En cambio, si son diferentes de cero algunos valores M<(J.), los elementos Mab son sumas de términos que se expresan en función de diferentes sistemas de cantidades U1a, U2a, .•• ligadas entre sí tan sólo por las relaciones de ortogonalidad, siendo por lo demás independientes. Este caso correspondería a una degeneración accidental debida a que a un mismo nivel cuasidiscreto de la energía corresponden varios estados cuasiestacionarios del núcleo compuesto (1). Por lo tanto, prescindiendo de estos casos, que carecen de interés, es decir, considerando los niveles como no degenerados, llegamos a la conclusión de que los elementos de matriz lvfab son productos de cantidades cada una de las cuales depende del número de uno sólo de los canales. Introduciendo la notación escribiremos la fórmula (142.6) en la forma: Mab = ± ,v(rarb)/r; (142.7) (el signo de Mab depende de los signos de U1a y U1 b y queda indeterminado). En virtud de la igualdad LiU1cU1c = 1, las cantidades rª introducidas de esta manera satisfacen la condición ~ra = r. a (142.8) Estas cantidades reciben el nombre de anchuras parciales de los diferentes canales. Las fórmulas (142.1), (142.7-8), proporcionan la forma general buscada de las amplitudes de resonancia. Escribamos ahora las fórmulas finales fijando uno de los canales como canal de entrada (2). Designaremos la anchura parcial de este canal por re (anchura elástica), y las anchuras correspondientes a las diferentes reacciones, por rri, rr2 , ••• La amplitud total de dispersión elástica es (1) Esto resulta particularmente claro en el caso en que todos los M(r:t.) = l. De (142.4-5) se si~ue que entonces también Mab = ,5ab, es decir, las transiciones entre canales diferentes son por completo imposibles. Con otras palabras, este caso correspondería a un cierto número de estados cuasidiscretos independientes, cada uno de los cuales resultaría de la dispersión elástica en uno de los canales. (é) Estas fórmulas fueron obtenidas por primera vez por H. BREIT y E. WIGNER (1936). 644 Teoría de las colisiones inelásticas fe( O) = j(O>( 0)- re 21+ 1 - - - - e2i 81 <O> Pz( cos O) E-Eo+iiI' ' 2k (142.9) donde k es el número de onda de la partícula incidente, y ¡<o) es la amplitud de la dispersión potencial. Esta fórmula difiere de la expresión (132.11) en la substitución de r por la cantidad más pequeña re en el numerador del término de resonancia. Las amplitudes de los procesos inelásticos poseen, conforme se indicó ya, un carácter puramente de resonancia. Las secciones eficaces diferenciales son: dO'ra = (21+ 1) 2 I'eI'ra 4k2 (E-E0)2+!-I'2 [Pz(cos 0)] 2 ' (142.10) y las secciones eficaces integrales valen: 1T O'ra = (21+ 1) k2 (E-Eo)2+!r2 (142.11) La sección eficaz total de todos los procesos inelásticos posibles es: I'eI'r 1T O'r = (21 + 1) - k2 (E-Eo)2+fr2 donde r r = r - re es la , (142.12) anchura inelástica total del nivel. Interesa también el valor de la sección eficaz de reacción integrada en un dominio energético en torno del valor de resonancia E= E 0 • Dado que ar disminuye rápidamente al apartarnos de la resonancia, la integración respecto de E- E 0 se puede extender desde -- oo a e:o, con lo que obtenemos: f 21r 2 I'eI'r O'rdE= ( 2 l + l ) - - . k2 r (142.13) En la dispersión de neutrones lentos (longitud de onda grande comparada con las dimensiones del núcleo) cuenta esencialmente tan sólo la dispersión s, y la amplitud de dispersión potencial se reduce a la constante real - ce. En vez de (132.13) tenemos ahora: fe= I'e -rt- • 2k(E-Eo+iiI') (142.14) La sección eficaz total de dispersión elástica es igual a (142.15) F Órmulas de Breit y JP igner 645 El término 4noc2 puede llamarse sección eficaz de dispersión potencial. Vemos así que en el dominio de resonancia se produce interferencia entre las dispersiones potencial y de resonancia. Tan sólo en la inmediata vecindad del nivel (E - E 0 ,._ I') puede resultar posible prescindir de la amplitud oc (recordemos que Jockj ~ I) en cuyo caso la fórmula para la sección eficaz de dispersión elástica de los neutrones lentos toma la forma: 71" <Je.= re 2 k2 (E-E0)2+fr2 (142.16) La sección eficaz total de dispersión, tanto elástica como inelástica, es entonces igual a (142.17) En aquellas condiciones en que es posible prescindir de la dispersión potencial, las secciones eficaces ªª' ara se pueden escribir en la forma <Je = crtre/r' <Jra = crtrra/r. La cantidad a1 - suma de las secciones eficaces de todos los procesos de resonancia posibles - se puede considerar en tal caso como sección eficaz de formación del núcleo compuesto. En cambio, las secciones eficaces de los diferentes procesos elástico e inelásticos se obtienen multiplicando a1 por las probabilidades relativas de la correspondiente desintegración del núcleo compuesto, probabilidades que vienen dadas por las razones de las correspondientes anchuras parciales a la anchura total del nivel. La posibilidad de representar las secciones eficaces de esta manera resulta como consecuencia de la factorización (descomposición en factores) de los coeficientes Mab en los numeradores de las amplitudes de dispersión. Ello corresponde a la imagen física que ve en el proceso de colisión un proceso en dos estadios: formación del núcleo compuesto en un determinado estado estacionario y ulterior desintegración en uno u otro canal (1). Conforme se indicó ya en el § 132, el dominio de aplicabilidad de las fórmulas consideradas viene limitado solamente por la condición de que la diferencia IE - E 0 sea pequeña comparada con la distancia D entre niveles vecinos cuasidiscretos del núcleo compuesto (con iguales valores del momento cinético). Sin embargo, también allí se indicó que, en esta forma, dichas fórmulas no admiten el paso al límite E ~ O, J l'J En lo que precede hemos efectuado todos los cálculos pensando en reacciones de la forma a+X = + partícula incidente) se forman de nuevo dos partículas. Esta hipótesis, sin embargo, no tiene un carácter fundamental, como es claro en virtud del carácter físico de los resultados obtenidos. Las fórmulas de la forma (142.11) para las secciones eficaces integrales son válidas también para las reacciones en las que escapan del núcleo más de una partícula. = b+ Y, en las que a partir de las dos partículas iniciales (núcleo 646 Teoría de las colisiones inelásticas cuestión ésta que se plantea si el valor E = Ose encuentra en el dominio de resonancia. En este caso hay que cambiar la estructura de las mismas mediante la substitución de la energía E 0 por una cierta constante e0 ligada con ella, y la de la anchura elástica re, por Ye VE; la anchura inelástica, I'r, en cambio, debe considerarse, como antes, constante (1). Como resultado de esta substitución, la sección eficaz inelástica (142.12) crecerá, cuando E-+ O, como 1/V E, de acuerdo con la teoría general de la dispersión inelástica de partículas lentas (§ 140). El tener en cuenta los spins de las partículas que chocan conduce, en el caso general, a fórmulas bastante complicadas. Nos limitaremos al caso más simple, si bien importante, de la dispersión de neutrones lentos, cuando en la dispersión intervienen solamente momentos cinéticos orbitales l = O. El spin del núcleo compuesto se obtiene en tal caso por composición del spin i del núcleo blanco con el spin s = t del neutrón, es decir, puede tener los valores j = i ± i (suponemos que i-=/=- O; en el caso contrario, no tiene lugar modificación ninguna en las fórmulas). Cada nivel cuasidiscreto del núcleo compuesto corresponde a un valor determinado de j. La sección eficaz de reacción se obtiene, por lo tanto, multiplicando la expresión (142.12) (con l = O) por la probabilidad g(j) de que el sistema núcleo + neutrón tenga el valor de j necesario - aquél para el que se tiene un nivel de resonancia. Supondremos que los spins de los neutrones y de los núcleos blanco están orientados por completo al azar. En total se tienen (2i + 1) (2s + 1) = 2(2i + 1) orientaciones posibles del par de spins i y s. De éstas, al valor dado j del momento total corresponden (2j+ 1) orientaciones. Teniendo cuenta que en todas las orientadones son igual.mente probables,se encuentra que la probabilidad del valor dadoj es igual a . Zj+l g(J) = 2(2i+ 1) (142.18) De manera análoga debe modificarse la fórmula que da la sección eficaz de dispersión elástica. En este caso hay que tener en cuenta que en la dispersión potencial intervienen ambos valores de j. Por ello el factor g(j) (conj correspondiente al nivel de resonancia) debe introducirse en el segundo término de (142.15) y el término 4mx2 debe substituirse por la suma fg(j), 4rr[(X(i>]2. El hecho de que las reacciones de resonancia se producen pasando por el estadio de formación de un núcleo compuesto, núcleo que se encuentra en un determinado (1) Es importante el que, para los procesos inelásticos que son posibles para pequeñas energías (por ejemplo, la captura radiativa), el valor E = O no sea un valor umbral. Para las anchuras parciales I' ra se requeriría una substitución, análoga a la indicada para I'e, cuando las energías son próximas al umbral de la reacción dada, umbral por debajo del cual dicha reacción es totalmente imposible. La necesidad de cambiar de la manera indicada la estructura de las fórmulas para pequeñas energías, fue puesta de manifiesto por H. BETHE y H. PLACZEK (1937}. Fórmulas de Breit y Wigner 647 estado cuasiestacionario, permite formular algunas consideraciones generales acerca de las distribuciones angulares de los productos de estas reacciones. Cada estado cuasiestacionario posee, aparte de sus demás características, una determinada paridad. La misma paridad poseerá, por consiguiente, el sistema (b+ Y) de las partículas que se forman al descomponerse el núcleo compuesto. Esto significa que la función de onda de este sistema, y por ello también las amplitudes de reacción, tan sólo puede quedar multiplicada por ± 1 en una inversión del sistema de coordenadas; por consiguiente, los cuadrados de las amplitudes, es decir, las secciones eficaces, no experimentan, en cambio, variación alguna. La inversión de las coordenadas equivale (en el sistema del centro de masas de las partículas) a la substitución()~ n - (), </>-+ n+</> para el ángulo polar y el acimut que determinan la dirección de dispersión. La distribución angular de los productos de la reacción debe ser, por lo tanto, invariante con relación a este cambio. En particular, después de promediar respecto de las direcciones de los spins de todas las partículas que intervienen en la reacción, la sección eficaz depende solamente del ángulo de dispersión O. La distribución respecto de este ángulo debe ser simétrica respecto de la substitución ()-+ -+ n - (), es decir, la distribución angular (en el sistema del centro de masas) es simétrica con relación a un plano perpendicular a la dirección de colisión de las partículas (1). Como consecuencia del gran número de niveles densamente distribuidos del núcleo compuesto, el comportamiento detallado de las secciones eficaces de los diferentes procesos de dispersión respecto de la energía es muy complicado. Esta complicación hace difícil, en particular, el poner de manifiesto cambios sistemáticos en las propiedades de las secciones eficaces al pasar de unos núcleos a otros. Tiene sentido, por consiguiente, estudiar la marcha de las secciones eficaces sin tener en cuenta los detalles de la estructura de resonancia, sino promediadas en intervalos energéticos grandes en comparación con las distancias entre niveles. En un análisis de esta naturaleza renunciamos también a considerar la diferencia entre los distintos tipos de procesos inelásticos, y dividimos la dispersión - en el sentido que se indicará - únicamente en « elástica » e « inelástica » (2). Para aclarar el sentido de los promedios que efectuaremos, se prescindirá de nuevo de las complicaciones ligadas con los spins y consideraremos las secciones eficaces parciales de dispersión con l = O. Según las fórmulas (139.7): ( 1) Para partículas sin spin, la sección eficaz diferencial de reacción sería, simplemente, proporcional a (Pz(cos 0))2, en cuyo caso la simetría indicada es evidente. (2) El método de promedio que exponemos a continuación (para pasar al llamado modelo óptico de la dispersión nuclear) ha sido propuesto por V. F.W EISSKOPF, C. E. PoRTER y H. FESHBACH (1954). 648 Teoría de las colisiones inelásticas 11' ª e = -1s-1¡2 k2 , 11' ae = - . 2(1-ReS), k2 (142.19) las secciones eficaces de dispersión elástica e inelástica, y con ellas también la sección eficaz total, se expresan en función de una sola cantidad S (prescindimos del índice (O) para abreviar). Al promediar en un intervalo energético, la sección eficaz total, que depende linealmente de S, se expresa en función del valor medio de S de acuerdo con (142.20) áe = (i/k2). 2(1-ReS); (suponemos que el factor lentamente variable k-2 no se ve alterado por el promedio). En cambio, como sección eficaz «elástica» introducimos en este modelo la cantidad (142.21) que no coincide, en general, con el valor medio ªe· Con otras palabras, determinamos la dispersión elástica efectuando previamente el promedio de la amplitud en la onda divergente Seikr/r. De acuerdo con esta definición, la dispersión elástica de un paquete de ondas conserva invariable su forma; cabe decir que la sección eficaz (142-21) se refiere a la parte « coherente » de la dispersión. Esto significa que de la dispersión elástica se excluye la parte que resulta del paso por el estadio de formación del núcleo compuesto: cuando se produce un núcleo compuesto que existe durante un cierto tiempo para desintegrarse después, se pierden, claro está, las características específicas del paquete de onda incidente. La sección eficaz « inelástica », en cambio, la definiremos ahora en el modelo de promedios, naturalmente, como igual a la diferencia aaopt = <1t - cre0 Pt, es decir, (142.22) De esta manera, corresponden a ella no sólo los diferentes procesos inelásticos, sino también aquella parte de la dispersión elástica que ocurre con formación del núcleo compuesto intermedio. Es fácil ver que esta interpretación refleja correctamente la situación que se produce en los casos límite y posee por ello el carácter de una interpolación razonable. En el dominio de bajas energías, en el que nos encontramos con resonancias bien separadas (r ~ D), S viene dada, cerca de cada nivel, por la fórmula S= e2i8(ºl r (1- E-Eo+!iI' t e )• Interacción en el estado final en el caso de reacciones 649 Promediando esta expresión, obtenemos: S = e2iS<º>(1-1rI'e/D), (142.23) re donde y D son los valores medios (respecto de los niveles contenidos en el intervalo de energías dado) de la anchura elástica y de la distancia entre niveles; la función lentamente variable (5<º)(E) se puede considerar constante al efectuar el promedio. De aquí resulta: 1r 21rl\ (142.24) Üaopt=--- k2 D' donde se ha prescindido de términos pequeños (I'/D) (1). Esta expresión coincide, en efecto, con el valor medio de la sección eficaz (142.17), que corresponde, conforme se indicó, a la formación del núcleo compuesto. r--..1 A medida que aumenta la energía de excitación del núcleo compuesto, las distancias entre sus niveles disminuyen y las probabilidades de desintegración ( y con ellas las anchuras totales de los niveles) crecen, de modo que los niveles comienzan a «solaparse» (el propio concepto de niveles cuasidiscretos pierde entonces su sentido en buena medida). Como resultado de ello, las irregularidades en la marcha de la función S(E) se alisan, de modo que la diferencia entre las funciones exacta y promedia pasa a ser pequeña y la sección eficaz (142.2) coincide con la ar dada por (142.19). Esto está de acuerdo con el hecho de que, para grandes energías, la desintegración del núcleo compuesto por el canal de entrada no representa ningún papel comparada con todos los otros posibles modos de desintegración para tales energías; por ello, en este dominio todos los procesos en que interviene la formación del núcleo compuesto se pueden considerar inelásticos. Así, pues en el modelo de promedios la dispersión viene de nuevo determinada por una sola cantidad (S), que es ahora una función lisa de la energía. En el llamado modelo óptico, para el cálculo de esta función, las propiedades dispersoras del núcleo se aproximan mediante un campo de fuerzas que deriva de un potencial complejo. La existencia en el potencial de una parte imaginaria conduce a que, junto a la dispersión elástica, se tenga también una absorción de las partículas. Esta absorción, cuya sección eficaz viene dada por la e.xpresión (142.22), se identifica también con la dispersión « inelástica » en el modelo de promedios. § 143. Interacción en el estado final en el caso de reacciones La interacción entre las partículas que resultan de una reacción cualquiera puede ejercer una gran influencia sobre sus distribuciones energética y angular. Es natural ( 1) De este mismo orden serían también los términos que aparecerían al tener en cuenta, en el dominio próximo a un nivel, la influencia de los demás niveles. 650 Teoría de las colisiones inelásticas que esta influencia sea particularmente notable en aquellos casos en los que la velocidad de las partículas que interactúan es relativamente pequeña. Nos encontramos con un fenómeno de este tipo, por ejemplo, en las reacciones nucleares que van acompañadas de la emisión de dos o más nucleones, estando ligado entonces este efecto con las fuerzas nucleares que actúan entre nucleones libres (1). Sea p0 el impulso del centro de masas del par de nucleones emitidos y p el impulso de su movimiento relativo. Supondremos que p ~ p0 , y por ello también la energía relativa E= p 2/m (m es la masa del nucleón) es pequeña comparada con la energía del movimiento del centro de masas E 0 = p 02/4m. Admitiremos también que la energía E 0 es grande respecto de la energía s del nivel (real o virtual) en que se encuentra el sistema de los dos nucleones. Con otras palabras, « lento » se supone tan sólo el movimiento relativo de los nucleones, siendo éstos, en cambio, «rápidos». La probabilidad de la reacción es proporcional al cuadrado del módulo de la función de onda de las partículas que se forman cuando se encuentran en la « zona de reacción », es decir, a una distancia una de otra que es del orden de magnitud del radio de acción a de las fuerzas nucleares (cf. las consideraciones análogas hechas en el§ 140 al tratar de las partículas primarias). En el presente caso, nuestro objeto consiste en determinar cómo depende la probabilidad de reacción en relación tan sólo con las características del movimiento relativo de un par de nucleones. Basta por ello considerar únicamente la función de onda 'IJ'p(r) de este movimiento, de modo que la probabilidad de la formación del par de nucleones con un impulso relativo en el intervalo d 3p es: dwp = constante x li/,p(a)l2d3p. (143.1) Como se demostró en el § I 34, para hallar la probabilidad de transición del sistema, en la dispersión, a un estado con dirección determinada del movimiento, hay que utilizar como funciones de onda del estado final las funciones %- que contienen (en el infinito) junto con una onda plana tan sólo una onda convergente; estas funciones deben estar normalizadas respecto de la función - ¿j del impulso. Por otra parte, las funciones ' PP + se obtienen directamente (pasando a la expresión conjugada compleja y cambiando el signo de p) a partir de las funciones '!J'p-\ que contienen en el infinito ondas esféricas divergentes, es decir, correspondientes al problema de la dispersión mutua de dos partículas. Al substituir en ( 143. l ), esta diferencia carece de importancia, de modo que podemos suponer que las funciones '!J'p en (143.1) son las funciones % + y, de esta manera, el problema se reduce al problema que hemos estudiado ya de la dispersión de resonancia de partículas lentas. Aunque se desconoce la verdadera forma de las funciones % en el dominio r ,_,, a, sin embargo, para determinar la dependencia de la probabilidad con relación (1) Los resultados que se exponen a continuación fueron obtenidos por primera vez por A. B. (1950) y luego, independientemente, por K. M. WATSON (1952). M1GDAL Interacción en el estado final en el caso de reacciones 651 ·> a la energía E basta considerar esta función a distancias r 1/k ~ /a (donde k = p//i se supone que ak ~ 1), extendiéndola luego, en orden de magnitud, a distancias; r "" a (1). En este caso, la contribución principal a tpp se debe a la onda esférica (que contiene el factor 1/r). Esta onda representa el conjunto de las ondas parciales con diferentes valores de l, ondas cuyas amplitudes son las correspondientes amplitudes de dispersión. Para determinar el cuadrado l"Pp(a)l 2 basta, sin embargo, limitarse tan sólo a la ondas, ya que para energías pequeñas las amplitudes de dispersión con l -=/=- O son a su vez relativamente pequeñas. De acuerdo con la fórmula ( 131.6), tenemos. por lo tanto: 1 eikr ipp---x+ik r ' (143.2) donde x = t(2mlil)//i y e es la energía del estado ligado (o virtual) del sistema constituido por los dos nucleones (2). Substituyendo esta expresión en ( 143.1 ), obtenemos: d3p dwp = constante x - - - . E+l€1 (143.3) Por consiguiente, la distribución del impulso en las diferentes direcciones (en el sistema del centro de masas de los dos nucleones) es isótropa. En cambio, la distribución del movimiento relativo en energías viene dada por la fórmula y'EdE <lWE = constante X - - - . E+l€1 (143.4) Vemos así que la interacción de los nucleones conduce a que aparezca un máximo de la distribución en el dominio de pequeños valores de E (para E"" kl) (3). A los valores pequeños del impulso relativo (p ~ p 0 ) corresponden en el sistema del laboratorio ángulos 8 pequeños entre los impulsos de ambos nucleones. Por consiguiente, a la existencia de un máximo en la distribución respecto de E corresponde en el sistema del laboratorio una correlación angular entre las direcciones (1) El que este procedimiento sea admisible está ligado con el hecho de que, en la región r ~ l/k, se puede prescindir de la energía E en la ecuación de ScHRODINGER que determina a la función 11'1>: Por ello la dependencia de la función 1PP respecto de E en dicha región viene determinada completamente por su «empalme» con la función en el dominio r ,_, 1/k. (2) Nos referimos aquí al par np con spins paralelos o antiparalelos o al par nn con spins antiparalelos. En el caso del par pp, la situación se complica debido a la repulsión coulombiana; este caso debe considerarse basándose en la teoría expuesta en el § 136. 3 ( ) Rigurosamente hablando, de E pueden depender también (a través de las restantes partes de la función de onda de todo el sistema de productos de reacción) los coeficientes constantes en las fórmulas (143.3-4). Esta dependencia, sin embargo, es débil - como función de E, este coeficiente cambia de manera apreciable tan sólo en el intervalo de energías (,_, E0) del que puede disponer, en la reacción dada, el par de nucleones. Por ello, para la distribución en la región E~ E 11 , se puede prescindir de esta dependencia frente a la fuerte dependencia caracterizada por la fórmula (143.4). 652 Teoría de las colisiones inelásticas de emisión de los nucleones que se traduce en un aumento de la probabilidad de los valores pequeños de O. Sean p 1 y p2 los impulsos de los nucleones en el sistema del laboratorio. Entonces Po= P1 +p2, P = i(p2-p1) (recordemos que la masa reducida de dos partículas idénticas es m/2). Multiplicando vectorial mente estas dos igualdades, obtenemos Po X p = p 1 X p2 ; para p ~ Po se sigue de aquí: PoPJ_ = PiP2sen8 ~ !Po28, o () = 4p_!p0 , donde p_._ es la componente transversal (respecto de la dirección de p0) del vector p, y () es el pequeño ángulo formado por las direcciones de p 1 y p 2 • Escribiendo la fórmula (143.3) en la forma e integrando respecto de dp¡¡, hallamos la distribución de probabilidades para el ángulo O. Teniendo en cuenta la rápida convergencia de la integral, la integración se puede extender desde a cx:i y se encuentra así finalmente: = dwo = constante x 8d8 . v'(8 2 + 41€1/Eo) (143.5) Referida al elemento de ángulo sólido do';" 2n0 dO, la distribución angular presenta un máximo para () ,_ l'\i/ E 0 • § 144. Comportamiento de las secciones eficaces cerca del umbral de reacción Si la suma de las energías internas de los productos de reacción es mayor que la de las partículas iniciales, la reacción posee un umbral: sólo es posible cuando la energía cinética E de las partículas que chocan (en el sistema del centro de masas) supera un determinado valor «umbral» E11 • Examinemos el c~rácter de la dependencia energética de la sección eficaz de reacción cerca de su umbral. Al hacerlo, supondremos de nuevo que como resultado de la reacción se forman en total dos partículas (reacción del tipo A +B = A' +B'). Cerca del umbral, la velocidad relativa v' de las partículas que se forman es pequeña. Una tal reacción es inversa de la reacción en la que es pequeña la velocidad de las partículas que chocan. La dependencia de su sección eficaz respecto de v' se puede, por ello, encontrar fácilmente mediante el principio de equilibrio detallado (141.13) y de acuerdo con la dependencia energética conocida de la reacción en la Comportamiento de las secciones eficaces cerca del umbral de reacción 653 que v' sería la velocidad en el canal de entrada (§ 140). Encontramos así en una amplia categoría de reacciones, para las que entre las partículas A' y B' no existe interacción coulombiana (por ejemplo, las reacciones nucleares con formación de un neutrón lento), que la sección eficaz de reacción es proporcional av' 2(1/v'), es decir (1) <:Jr "' v'. (144.1) De la misma manera hallamos también la dependencia de la sección eficaz respecto de la energía de las partículas que chocan: la velocidad v', y con ella la sección eficaz de dispersión, son proporcionales a la raíz cuadrada de la diferencia E - Eu: crr = Ay'(E-Eu). (144.2) Las amplitudes de dispersión para los diferentes canales están ligadas entre si por las condiciones de unitariedad. Debido a esto, el hecho de que se abra un nuevo canal conduce a la aparición de determinadas singularidades en las dependencias energéticas de las secciones eficaces de otros procesos, entre ellos la dispersión elástica (E. WIGNER, 1948; A. l. BAz', 1957). Para poner en claro el origen y el carácter de este fenómeno, consideremos el caso más simple, aquél en que por debajo del umbral de reacción es sólo posible la reacción elástica. Cerca del umbral, las partículas A' y B' se forman en estados con momentos cinéticos orbitales l = O (a esta situación precisamente corresponde la ley (144.2)). Si las partículas que toman parte en la reacción carecen de spin, el momento orbital se conserva, y por ello el sistema de partículas A+ B se encuentra también en un estado s. Según (139.7), la sección eficaz parcial de reacción para l = O está ligada con el elemento de matriz S correspondiente a la dispersión elástica por la fórmula 7T cr,(O> = -(1!Sol 2), k2 (144.3) donde k es el número de onda de las partículas que chocan. Igualando (144.2) y (144.3), encontramos que por encima del umbral de reacción, pero cerca de él, el módulo JS0 \ es igual, salvo cantidades del orden de l(E - Eu) a: kt2 !Sol= 1 ---Ay'(E-Eu) 2TT (E> Eu), (144.4) donde k u =v(2mEu)/li (m es la masa reducida de las partículas A y B). En la región por debajo del umbral se tiene tan sólo la dispersión elástica, de modo que !Sol = 1 (E< Eu)· (144.5) 1 ( ) La constancia del límite a que tiende la amplitud !ab para Pb~ O, constancia que se hizo notar al final del§ 141, corresponde precisamente a este resultado - la sección eficaz .(141.4) es proporcional a Pb· 654 Teoría de las colisiones inelásticas Pero la amplitud de dispersión, y con ella también S0 , deben ser funciones analíticas en todo el dominio de variación de la energía. Una tal función, que toma los valores (144.4) y (144.5) por encima y por debajo del umbral, viene dada con la misma precisión por la fórmula: k~Ay'(E-Eu)] , So= e2i8o [ 1- Z1r (144.6) donde ó0 es una constante (para E < Eu, la raíz J/ti' - EU) pasa a ser imaginaria y el módulo de la expresión entre paréntesis difiere de la unidad tan sólo en una pequeña cantidad de orden superior). En cambio, para todos los valores / que * O, no existe dispersión inelástica, de forma (144.7) donde, en el dominio próximo al umbral, las fases dz deben tomarse iguales a su valor para E = Eu (1). Substituyendo los valores obtenidos S 1 en la fórmula (139.2), se encuentra la siguiente expresión para la amplitud de dispersión cerca del umbral de reacción: kt /(8,E) = fu(8)- 4-TTi Ay(E-E,¡)e2ito, (144.8) donde fu(O) es la amplitud de dispersión para E= Eu, Representando esta última en la forma fu = l!uleioc(6>, obtenemos finalmente la sección eficaz de dispersión diferencial : doku sen(2So-:x.) (E > Eu) 2 -d = lfi,(8)l - -A/fe(8)lv(IE-E~,I) (Z(;' ) (''' E' 2 o 1r cos oo-lJ. r., < uJ (144.9) Según que el ángulo 2<50 - oc se encuentre en el 1º, 2º, 3º ó 4º cuadrante, la dependencia energética de la sección eficaz dada por esta fórmula tiene la forma representada en la fig. 49 a, h, e o d. En todos los casos tenemos dos ramas situadas a uno y otro lado de una tangente vertical común. La existencia de un umbral de reacción conduce así a la aparición de una singularidad característica en la dependencia energética de la sección eficaz de dispersión elástica. El hecho de que las partículas posean spin modifica, naturalmente, las 1 ( ) Dado que las funciones '5i(E) son reales tanto para E > Eu como para E < Eu, dichas funciones se desarrollan en potencias enteras de la diferencia E - Eu. Comportamiento de las secciones eficaces cerca del umbral de reacción 655 fórmulas cuantitativas, pero el carácter general del fenómeno sigue siendo el mismo. Si por debajo del umbral son también posibles, junto a la dispersión elástica, otras reacciones, singularidades análogas se manifiestan en sus correspondientes secciones eficaces. Todas elJas presentan una singularidad para E= Eu, cerca de la cual son funciones lineales de la raíz l('IE - EuD con diferentes pendientes por encima y por debajo del umbral. Las reacciones nucleares de las que resulta una partícula cargada positivamente plantean el caso en que entre los productos de reacción (las partículas A' y B') actúan fuerzas de repulsión coulombiana. La sección eficaz de reacción, para v' ~ O (es decir, para E--+ Eu), tiende entonces exponencialmente a cero a la vez que todas sus derivadas respecto de la energía y no aparece singularidad alguna en las secciones eficaces de los demás procesos. dcrlt dcrlL ~1 To"" 1 Á\ 1 E (a) E (b) (d) FIG. 49 Finalménte, consideremos las reacciones con formación de dos partículas lentas de cargas distintas, entre las que actúan fuerzas de atracción coulombiana. La sec- 656 Teoría de las colisiones inelásticas ción eficaz de una tal reacción está ligada por el principio de equilibrio detallado con la sección eficaz (140.7) de la reacción inversa entre dos partículas lentas que se atraen. De esta manera encontramos que, cuando v' ~ O, la sección eficaz tiende a un límite constante ar= constante para v' -+0, (144.10) es decir, al atravesar el umbral, la reacción se produce súbitamente con sección eficaz no nula. Veamos cuál es el carácter de la singularidad que presenta cerca del umbral de dicha reacción la sección efiéaz de dispersión elástica (A. l. BAz', 1959). Para ello no cabe, sin embargo, acudir a la ley ya conocida (144.10) que vale por debajo del umbral y aplicar el procedimiento simple que utilizamos antes en el caso de partículas no cargadas. Comparada con este último caso, la situación se complica ahora debido a que el sistema de partículas A' +B' posee, en el dominio del umbra] (para E < Eu), estados ligados que corresponden a niveles discretos de la energía en el campo de Coulomb atractivo. Estos estados pueden formarse, desde el punto de vista energético, en la colisión de las partículas A y B, pero teniendo en cuenta la posibilidad de dispersión elástica, serán tan sólo cuasiestacionarios. Sin embargo, su existencia debe conducir a la aparición de efectos de resonancia en la dispersión elástica (por debajo del umbral) análogos a las resonancias del tipo Breit-Wigner. Para resolver el problema planteado, consideremos la estructura de las funciones de onda que describen el proceso de colisión. Debido a la existencia de dos canales, la ecuación de ScHRODINGER del sistema de partículas en interacción posee dos soluciones independientes, finitas en todo el espacio de configuraciones; designemos por 'f/Ji y 1J)2 dos de tales soluciones arbitrariamente elegidas (y arbitrariamente normalizadas). A partir de estas funciones se pueden formar combinaciones lineales que describen la dispersión cuando uno u otro de los canales es el de entrada. Designemos los canales que corresponden a los pares de partículas A, B y A', B' por a y by supongamos que la suma 1P = rx1 1jJ1 +oc 2 'f/J2 corresponde al canal de entrada a; dicha suma describe la dispersión elástica de las partículas A y B y la reacción A+B ~ A' +B'. Cerca del umbral de reacción, los coeficientes exi, rx 2 dependen esencialmente del pequeño impulso kb mientras que las funciones arbitrariamente elegidas 'f/Ji, 1J)2 no poseen ninguna singularidad para k b = O. A grandes distancias, la función 1P debe representar la suma de dos términos que corresponden al movimiento de los pares de partículas en los canales a y b. Cada uno de ellos es el producto de funciones « internas » de las partículas por la función de onda de su movimiento relativo (1). En el canal a, esta última tiene la (1) La ley (144.10) se cumple no solamente para la sección eficaz total, sino también para las secciones eficaces parciales con diferentes valores del momento cinético l (cf. la nota de la pág. 633). Por ello, también la singularidad que se considera más adelante se presenta en todas las secciones eficaces parciales de dispersión. Su carácter queda por completo de manifiesto ya en el caso l = O, que es precisamente el que consideramos a continuación. Para simplificar la notación prescindimos del índice O en las correspondientes amplitudes parciales. Comportamiento de las secciones eficaces cerca del umbral de reacción 657 forma Ra- - SaaRa +, y en el canal b, - SabRb +, donde. R+, R- son ondas divergentes y convergentes en los respectivos canales. A distancias rO grandes comparadas con el radio de las fuerzas de corto alcance y pequeñas respecto de 1/kb, estas funciones (y sus derivadas) deben «empalmarse» con los valores calculados mediante la función de onda 1fJ en la « zona de reacción». Estas condiciones se expresan por igualdades de la forma: + ix2a2 = [Ra- - SaaRa+]r0 , ix1b1 + ix2a2' = [Ra-- - SaaRa+]'r0 , ix1b1' ix1a1 ix1ai' + ix2b2 = [-Sao-Rb+]r0 , + ix2b2' = [ - Sao-Rb+]'r0 , donde a 1, a¡', b1, b1 ', .. • son cantidades caiculadas a partir de las funciones '!/Ji y 1fJ2 ; de acuerdo con lo antes dicho, cerca del umbral se pueden considerar constantes independientes de k b· Dividiendo miembro a miembro el primero y el segundo par dé igualdades, obtenemos un sistema de dos ecuaciones lineales -para las dos incógnitas (a.1/r:1. 2 y Saa), figurando en los coeficientes de estas ecuaciones tan sólo una cantidad que depende «críticamente» de kb - la derivada logarítmica de la onda divergente en el canal b; definamos esta cantidad por No hay necesidad de resolver efectivamente estas ecuaciones. Basta observar que la cantidad que nos interesa, Saa (que determina la amplitud de dispersión elástica), resulta con ello ser función racional lineal de}•. Por debajo del umbral, la cantidad Á. es real, puesto que la función de onda Rb + es real, en tanto que solución de una ecuación real de ScHRODINGER con condición de contorno real en el infinito (la de disminución como e-,<br, donde ub =l/L2mb(Eu - E)] ñ). Al mismo tiempo, por debajo del umbral debe ser !Saal = l. De áquí se sigue que la función lineal racional SaaCA) debe tener la forma: (144.11) donde r/0 ) es una constante real y f3 una constante compleja. Determinemos la cantidad Á. como función del impulso kh. Dado que entre las partículas A y B actúan fuerzas de atracción coulombiana,. rRb + · coincide con la función de onda de Coulomb que en el infinito es asintóticamente proporcional a eikbr. En un campo coulombiano repulsivo, esta función viene dada por la suma L + iK, con K y L definidas por (136.4) y (136.7). El paso a un campo de atracción se efectúa cambiando simultáneamente los signos de k y r (1). Realizando este carne) En lo que sigue utilizamos unidades coulombianas. El cambio de los signos de k y r se lleva a cabo formalmente cambiando de signo la unidad coulombiana de longitud. 658 Teorí~ de las colisiones inelásticas bio y calculando la derivada logarítmica (véase § 136), obtenemos: (144.12) Aquí kb se supone real, ya que esta fórmula se refiere al dominio por encima def umbral. Para kb -+O, el primer término de (144.12) se reduce a i y el segundo tiende a cero (véase la nota de la pág. 608). De esta manera, por encima del umbral tenemos: (144.13) El paso a la región por debajo del umbral se efectúa substituyendo k por be. Con esto obtenemos, a partir de (144.12) y para x ~ O (1): A= - ctg(1r/Kb) (E< Eu)• (144.14) Las fórmulas obtenidas resuelven la cuestión planteada. La sección eficaz de dispersión elástica es <:Je= 1rka-2 ISaa-11 2• Por encima del umbral tenemos: 1 +i,8 Saa = e2i11<0) (144.15) (E> Eu); l+i~ al igual que la sección eficaz de reacción, la sección eficaz de dispersión resulta constante en este dominio. Obsérvese que la condición ISaal < 1 significa que debe tenerse fJ" > O, donde fJ" es la parte imaginaria de fJ(fJ = fJ' +ifJ"). Por debajo del umbral encontramos: - 2i«J(O) ,8- tg (1r/Kb) S aa- e ~- tg (1r/Kb) 0 >[1 2i,8" J (144.16) tg .(1r/Kb)-,8' +i,8" .Esta expresión posee un número infinito de resonancias que se acumulan hacia el punto E = Eu. Las energías de resonancia son los ceros de la expresión tg(n/x6) - fJ'; estos ceros se encuentran ligeramente desplazados respecto de los niveles puramente coulombianos (ceros de tg(n/xb)) debido a la existencia de las fuerzas de corto al= e2i8< (1) El primer término en (144.12) da -!ctg(n/xb)+il y la expresión que aparece entre corc-hetes .1l :rr. se reduce a 2 ctg(.1t/Xb) + i 2 . Hemos utilizado la fórmula tp(x)-tp(-x) = -nctgnx- 1/x (que ~e puede obtener, derivando lo.garítmicamente la conocida relación I'(x)I'(- x) = - n/x sen nx) y la expresión límite tp(x) ~.In x - l/2x para x~ CX). Colisiones inelásticas de electrones rápidos con átomos 659 canee. Cerca de cada resonancia el desarrollo del denominador de (144.16) conduce a una expresión que corresponde exactamente a la fórmula de BREIT-WIGNER (132.11). La anchura de la región subumbral en la que se manifiesta la estructura de resonancia se determina por el valór de la energía del primer nivel coulombiano. Mencionaremos todavía, para terminar, un caso interesante de reacciones en torno de un umbral - la ionización de un átomo por un electrón cuya energía supera tan sólo ligeramente la energía del primer nivel de ionización del átomo. En estas condiciones, el proceso de colisión puede considerarse como cuasiclásico, pero el problema se complica considerablemente debido a la existencia de tres partículas cargadas en el estado final. La solución general de este difícil problema ha sido dado por G. WANNIER (1). La probabilidad de ionización del átomo neutro resulta proporcional a (E-1)''-, 1(J3-1 91 )= 1·125, (X=¡ donde E - I es el exceso de energía del electrón por encima del umbral de ionización. § 145. Colisiones inelásticas de electrones rápidos con átomos Las colisiones inelásticas de electrones rápidos con átomos se pueden estudiar mediante la aproximación de Born de manera análoga a como se hizo en el § 137 para las colisiones elásticas (2). La condición de aplicabilidad de dicha aproximación exige, como antes, que la velocidad del electrón incidente· sea grande comparada con las velocidades de los electrones atómicos. En lo que concierne a la pérdida de energía en la colisión, esta pérdida puede ser cualquiera. Si el electrón pierde una parte considerable de su energía, ello conduce a la ionización del átomo, cediéndose Ja energía a uno de sus electrones. Pero podemos siempre considerar que, de los dos, el electrón dispersado es el que tiene mayor velocidad después del choque, con lo cual, cuando la velocidad del electrón incidente es grande, será ~ambién grande la velocidad del electrón dispersado. En las colisiones de un electrón con un átomo, el sistema de coordenadas en el que se encuentra en reposo el centro de masas se puede considerar que coincide, conforme se indicó ya (véase pág. 613), con el sistema en el que el átomo se encuentra en reposo; en lo que sigue nos referimos precisamente a este último sistema. 1 ( ) (2) BETHF Véase G. H. WANNIER, Phys. Rev., 90, 817, 1953. La mayor parte de los resultados que se exponen en los§§ 145-147 fueron obtenidos por H. A. (1930). Teoría de las colisiones inelásticas 660 Una colisión inelástica va acompañada de una variación del estado interno del átomo. El átomo puede pasar del estado normal a un estado excitado del espectro discreto o del espectro continuo; en este último caso, ello significa la ionización del átomo. Al deducir las fórmulas generales, estos dos casos se pueden considerar a la vez. Partamos (como en el § 125) de la fórmula general que da la probabilidad de transición entre estados del espectro continuo, aplicándola al sistema constituido por el electrón incidente y el átomo. Sean p, p' los impulsos del electrón incidente y E 0, En las energías del átomo, respectivamente, antes y después del choque. Para la probabilidad de transición, en vez de (125.9) tenemos la expresión dwn = 21T li ¡UEoP 12 0 EnP' 1 (p'2-p2 ) - - .-+En-Eo dp':edp'ydp'z, 2m (145.1) donde uf;~:, es el elemento de matriz de la energía de interacción del electrón incidente con el átomo z U = Ze 2 /r- ~ e2/lr-ral; a=l (r es el vector posición del electrón incidente, ra los vectores posición de los electrones atómicos, habiendo elegido como origen de coordenadas el núcleo del átomo, y m es la masa del electrón). Las funciones de onda 1JJ1., 1/Jp' del electrón vienen determinadas por las fórmulas anteriores (125.10-1 I); dw es entonces la sección eficaz de colisión da. Designaremos las funciones de onda del átomo en los estados inicial y final por "Po, %· Si eJ estado final del átomo corresponde al espectro discreto, 1Pn (como también "Po) está normalizada a la unidad como de ordinario. Pero si el átomo pasa a un estado del espectro continuo, la función de onda se normaliza respecto de la función - ó de los parámetros,, que determinan estos estados (estos parámetros pueden ser, por ejemplo, la energía de) átomo o las componentes del impulso del electrón que escapa del átomo en la ionización). Las secciones eficaces que en definitiva se obtienen determinan la probabilidad de la colisión acompañada de la transición del átomo a un estado del espectro continuo que pertenece al intervalo de valores de los parámetros comprendidos entre v y v+dv. La integración de {145.1) respecto del módulo p' nos da: 21Tfflp' dan= --IUOp l2 do', li np' Colisiones inelásticas de electrones rápidos con átomos 661 donde p' se determina a partir de la ley de conservación de la energía: (P 2 -P'2 )/2m = En-Eo. (145.2) Substituyendo en el elemento de matriz U~, las funciones de onda del electrón dadas por (125.10-1 I ), obtenemos: dan = -m2 - -p' 1 47T2/i4 p ff Ue-tq.rtpn*tpo drdVI2do, (145.3) ( dr = d V1 d V2 ••• d V z es el elemento del espacio de configuraciones de los Z electrones del átomo, y se ha prescindido del apóstrofo er1 do). En esta forma, es ésta una fórmula general de la teoría de perturbaciones, aplicable no solamente a la colisión de los electrones con un átomo, sino a colisiones inelásticas cualesquiera de dos partículas, que determina la sección eficaz de dispersión en el sistema de coordenadas en el que se encuentra en reposo el centro de masas de aquéllas (m es entonces la masa reducida de ambas partículas). Para n = O y p = p', ( 145.3) se convierte en la fórmula que da la sección eficaz de dispersión elástica. En virtud de la ortogonalidad de las funciones 1Pn y ip0 , el término en V que contiene la interacción Ze 21 r con el núcleo desaparece al integrar respecto de dr, y tenemos así para las colisiones inelásticas: dan = -m2- p' - ~1 477"2/i4 p ~ a f f ---e-tq e2 · rtfan*tpo drd V 12 do. lr-ral (145.4) La integración respecto de V se efectúa de manera análoga a como se procedió en el 137. La integral * coincide formalmente con la componente de Fourier del potencial creado en el punto r por las cargas distribuidas en el espacio con densidad p = S(r-ra). Por ello, según la fórmula (137.1), se encuentra: cpq(ra) = {47T/q2)e-tq.ra. (145.5) Substituyendo esta expresión en (145.4), llegamos finalmente a la siguiente expresión general para la sección eficaz de colisión inelástica: 662 Teoría de las colisiones inelásticas (145.6) (en vez de los impulsos p, p' hemos introducido los vectores de onda k = p/1;,, k' = p' /li). Esta fórmula determina la probabilidad de la colisión en la que el electrón es dispersado en el elemento de ángulo sólido do y el átomo pasa al n-ésimo estado excitado. El vector /iq representa el impulso cedido por el electrón al átomo en la colisión. En los cálculos suele resultar más cómodo referir la sección eficaz no al elemento de ángulo sólido, sino al elemento dq de valores absolutos del vector q. El vector q se define por q = k' - k; para su valor absoluto tenemos: q2 = k2+k'2-2kk' cos.&. (145.7) De aquí se sigue, para valores dados k, k', es decir, para una pérdida dada de energía del electrón, que: qdq = kk' sen ,& d.& = ( kk' /2TT) do. (145.8) La fórmula (145.6) puede, por consiguiente, escribirse en la forma: (145.9) El vector q representa un importante papel en todos los cálculos que siguen. Examinemos con mayor detenimiento la relación que lo liga al ángulo de dispersión & y a la energía En - E 0 cedida en el choque. Veremos más adelante que las colisiones que determinan la dispersión para ángulos pequeños {& ~ 1) con una cesión de energía que es pequeña comparada con la energía E= mv 2/2 del electrón incidente, En - E 0 ~ E, son las que representan el papel principal. La diferencia k - k' es entonces también pequeña (k - k' ~ k) y, por lo tanto, En-Eo = Ji2(k2-k'2)/2m Dado que & ~ ñ,2k(k-k')/m = liv(k-k'). es pequeño, en virtud de (145.7) tenemos: q2 rv (k-k'}2+(k,&)2, y, finalmente, q = V[{(En-Eo)/liv}2+(k.&)2]. (145.10) qmin = (En-Eo)/liv. (145.11) El valor mínimo de q es Para ángulos pequeños, cabe todavía distinguir diferentes casos según sea el valor de la razón entre las pequeñas cantidades & y v0 /v (v 0 es del orden de magnitud 663 Colisiones inclásticas de electrones rápidos con átomos de la velocidad de los electrones atómicos). Si se consideran cesiones de energía del orden de la energía éo de los electrones atómicos (En- Eo EO mv~), para (vo/v)2 <( & <( 1 se tiene: l'tJ q = k& = (mv/ñ)&; l'tJ (145.12) (el primer término del radicando en (145.10) se puede suprimir frente aJ segundo); por consiguiente, en este dominio angular, q no depende del valor de la energía cedida. Para -& ~ 1, el valor de q puede ser lo mismo grande que pequeño comparado con 1/a0 (donde a 0 es el orden de magnitud de las dimensiones atómicas), Manteniendo la misma hipótesis acerca de la magnitud de la energía cedida, tenemos: qao l'tJ 1para& - v0 /v. (145.13) Volvamos ahora al estudio de la fórmula general (145.9) y consideremos el caso en que los valores de q son pequeños (qa 0 ~ 1, es decir, -& ~ v0/v). En este caso se pueden desarrollar los factores exponenciales en series de potencias de q: (hemos elegido el eje x en el sentido del vector q). Substituyendo este desarrollo en (145.9), los términos que contienen el término 1 dan el valor cero en virtud de la ortogonalidad de las funciones de onda "Po y 1/-'m con lo que obtenemos 2e) ( 2 2 do e ) 2 dq dcrn = 81r ( --l(dx)onl 2 = l(dx)onl -, ñv q ñv .s,2 (145.14) donde dx = e~xª es la componente-X del momento dipolar del átomo. Vemos así que la sección eficaz (para valores q pequeños) viene determinada por el cuadrado del módulo del elemento de matriz del momento dipolar para la transición que corresponde al cambio del estado del átomo (1). Sin embargo, puede ocurrir que el elemento de matriz del momento dipolar para la transición dada se anule idénticamente en virtud de las reglas de selección (transición prohibida). Entonces hay que prolongar el desarrollo de e-i•i.ra hasta el término siguiente, y obtenemos así: e2)2 dcrn = 21r ( - ñv I(~ Xa2)onl2q dq. a (145.15) (') Con frecuencia interesa, desde el punto de vista físico, la sección eficaz dan sumada para. tod~s las direcciones del momento cinético del átomo en el estado fl-nal y promediada respecto de las d1recc1ones del momento cinético en el estado inicial. Una vez efectuados la suma y el promedio, el cuadrado l(dx)onl 2 no depende ya de la dirección del eie x. 664 Teoría de las colisiones inelásticas Consideremos ahora el caso límite opuesto, el de grandes valores de q(qa 0 ~ 1). Que los valores de q sean grandes significa que al átomo se le cede un impulso grande comparado con el impulso propio inicial de los electrones atómicos. Es físicamente evidente que, en este caso, se pueden considerar los electrones atómicos como electrones libres, y el choque con el átomo, como choque elástico del electrón incidente con los electrones atómicos inicialmente en reposo. Esto resulta también claramente de la fórmula general (145.9). Para grandes valores q, el integrando contiene el factor rápidamente oscilante e-i•t·ra y la integral no es prácticamente cero tan sólo si 1Pn contiene este mismo factor. Una tal función 1Pn corresponde al átomo ionizado con un electrón que escapa de él con un impulso - ltq = p - p', es decir, con un impulso que viene determinado simplemente por la ley de conservación del impulso, como ocurriría en la colisión de dos electrones libres. Cuando el impulso cedido en la colisión es grande, ambos electrones (el incidente y el atómico) pueden adquirir, como resultado de ella, velocidades que son compara- bles en magnitud. Cobran entonces importancia los efectos de intercambio que no se han tenido en cuenta en la fórmula general (145.9), efectos debidos a la identidad de las partículas que chocan. La sección eficaz de dispersión de electrones rápidos, teniendo en cuenta el intercambio, viene determinada por la fórmula ( 135.9); esta fórmula está referida al sistema de coordenadas en el que uno de los electrones se encontraba en reposo antes del choque. Para electrones rápidos, el coseno que aparece en el último término de (135.9) se puede substituir por la unidad. Multiplicando también por el número Z de electrones del átomo, obtenemos la sección eficaz de colisión del electrón con el átomo en la forma: 1 1 ( e2 )2,~--+ da = 4Z - mv2 en4& 1 ] cos4& sen2& cos2& cos & do. (145.16) En esta fórmula conviene expresar el ángulo de dispersión en función de la energía cedida a los electrones después del choque. Como es sabido, en la colisión de una partícula de energía E= mv2/2 con una partícula en reposo de igual masa, la energía de las partículas después del choque es igual a: E:= Esen2&, E-E: = E cos2&. Para obtener la secc10n eficaz correspondiente al intervalo ds, expresaremos do en función de ds de acuerdo con la relación cos .& do = 2n cos .& sen &d& = (n/ E) ds. La substitución en (145.16) conduce a la fórmula final (145.17) Si una de las energías e o E - e es pequeña comparada con la otra, de los tres términos que aparecen en esta fórmula cuenta sólo uno (el primero o el segundo). 665 Colisiones inelásticas de electrones -rápidos con átomos Esto concuerda con el hecho de que, para una gran diferencia en las energías de los dos electrones, el efecto de intercambio deja de tener importancia y hemos de volver a la fórmula ordinaria de Rutherford (1). La integración de la sección eficaz diferencial respecto del ángulo (o lo que es lo mismo, respecto de q) da la sección eficaz total <1n de colisión acompañada de excitación del estado dado del átomo. La manera cómo <Jn depende de la velocidad del electrón incidente está íntimamente ligada con el hecho de que sea o no diferente de cero el elemento de matriz del momento dipolar del átomo para la correspondiente transición. Supongamos primero que este elemento de matriz es diferente de cero. Entonces, para valores q pequeños, d<111 viene determinada por la fórmula (145.14) y vemos así que, al disminuir q, la integral respecto-de q diverge logaritmicamente. En cambio, en la región de grandes valores oe q, la sección eficaz (para una cesión de energía dada En - E 0 ) disminuye exponencialmente al aumentar q debido a la existencia, ya señalada, de un factor rápidamente oscilante en el integrando de la expresión (145.9). De esta manera, el papel fundamental en la integral respecto de q lo representa el dominio de valores q pequeños y cabe limitarnos a la integración desde el valor mínimo qmín (145.11) hasta un cierto valor,..._, 1/a0• Como resultado obtenemos O'n = 81r(e/ñv)2 l(dx)on\ 2 Iog(finvli/e2 ), (145.18) donde fln es una constante sin dimensiones que no se puede calcular en su forma general (2). En cambio, si el elemento de matriz del momento dipolar se anula para la transición dada, la integral respecto de q converge rápidamente, tanto para valores pequeños de q (como se ve teniendo en c:uenta (145.15)), como para valores grandes. En este caso, el intervalo que más cuenta para la integral es aquél en que q ,..._, 1/a0 • No se puede obtener aquí una fórmula cuantitativa general y tan sólo cabe concluir que <1n será inversamente proporcional al cuadrado de la velocidad: (145.19) O'-n = constante/v2. Esto se sigue directamente de la fórmula general (145.9), según la cual porcional a v-2 para q ,..._, 1/a0 • d<1n es pro- ( 1) Para la colisión de un positón con un átomo, no existe el efecto de intercambio y la fórmula de Rutherford vale para todo q ~ 1/ap. (2) Suponemos que En - E 0 es del mismo orden ~ue la energía de los electrones atómicos Eo._CuaI_1do la energía cedida es grande (En - E 0 ,__,E~ eo), las formulas (145.l~), (145.l~ son e~ todo. caso_ m_aphcables, ya que el elemento de matriz del elemento dipolar pasa a ser muy pequeno Y es 1mpos1ble hm1tarnos al primer término del desarrollo respecto de q. Teoría de las colisiones inelásticas Determinemos la sección eficaz da¡ 11 de dispersión inelástica en un elemento dado de ángulo sólido prescindiendo de cual sea el estado a que pasa el átomo. Para ello hay que sumar la expresión (145.9) respecto de todos los n =f= O, es decir, respecto de todos los estados (tanto del espectro discreto, como del espectro continuo) excepto el normal. No se considerará ni la región en que los ángulos son grandes ni aquélla en la que son muy pequeños y supondremos l ~ .ft ~ (v0/v) 2 • Entonces, de acuerdo con ( 145.12), q no depende del valor de la energía transferida (1). Esta última circunstancia permite calcular fácilmente la sección eficaz total de colisión inelástica, es decir, la suma do-1n = e2 )2 = 811 (- L dan n:;tO 2e2 = (mv2 liv )2 dq L !(Le-'q.ra)on\2.....: n:¡t:O tf a do ' L., 1( I:a e-íq.ra)onj2-. ,&4 (145.20) n:¡i!:O Observemos para ello que, cualquiera que sea la magnitud f y de acuerdo con la regla de multiplicación de matrices, se tiene: l:: l/onl 2 n = Lfon/on* n = Lfon(J+)no n (Jf+)oo, La suma se extiende aquí a todos los valores n, incluido n L n:;t=O l/0nl 2 = L Aplicando esta relación a f n l/0nl2 -l/ool 2 :Ee-ic1,ra, = = O. Por lo tanto (//+)oo-!/001 2• (145.21) obtenemos (145.22) donde el trazo designa el promedio respecto del estado normal del átomo (es decir, significa que se toma el elemento de matriz diagonal 00). El valor medio ( :Ee-iq.r") es, por definición, el factor de forma atómico F(q) en el estado normal. En el primer término entre paréntesis, en cambio-, podernos escribir: Encontramos así la fórmula general .(1) La suma en (145.9) se extiende también a los estados con En - Eo ~ e0 , para los cuales no vale (145.12). Sin embargo, para las transiciones con gran transferencia de energla, la sección eficaz es relativamente pequeña y estos términos representan en la suma un papel del todo secundario. La condición O l permite no tener en cuenta los efectos de intercambio. < Coli.<,iones inelá.dica.,; ,le electrones rápitlos con átomos 667 (145.23) Esta fórmula se simplifica mucho en el caso en que los valores de q son pequeños, de modo que es posible desarrollar en serie de potencias de q (v0 /v ~ qa 0 ~ 1, lo que corresponde a ángulos (v0 1v)2 ~ & ~ v 0,1v). En vez de efectuar el desarrollo en la fórmula ( 145.23), conviene más calcular de nuevo la suma respecto de 11 utilizando para da 11 la expresión (145.14). Sumando mediante la relación (145.21) con f = d.r y recordando que dx = O, obtenemos: (145.24) Es interesante comparar esta expresión con la sección eficaz ( 137.5) de dispersión elástica para ángulos pequeños; mientras que esta última no depende de n-, la sección eficaz de dispersión inelástica en el elemento de ángulo sólido do crece al disminuir & como I n-2 • Para ángulos I ~ f)- ~ v 0 v (de modo que qa 0 ~ I ), los términos segundo y tercero entre corchetes en ( 145.23) son pequeños, y se tiene simplemente (145.25) Como debía ser, hemos obtenido así la dispersión de Rutherford por Z electrones atómicos (sin tener en cuenta el intercambio). Recordemos que la sección eficaz diferencial de dispersión elástica ( 137.6) es proporcional a Z 2 , y no a Z. Finalmente, integrando respecto del ángulo sólido obtenemos la sección eficaz total <r; 11 de dispersión inelástica para cualquier ángulo de dispersión y para todos los estados excitados del átomo. De manera exactamente igual a como se calculó <r 11 (145.18), obtenemos: Gin = 81T(e/nv)%:2 Iog(f3vli/e2). (145.26) PROBLEMAS ( 1) 1. Determinar la distribución angular (cuando 1 ~ f)- ~ v-~) de la dispersión inelástica de electrones rápidos por un átomo de hidrógeno (en el estado normal). S0/11ci1í11. Para un átomo de hidrógeno no existe el tercer término entre corchetes de (145.23) y el factor de forma F(q) se calculó en el problema del I 37. Substituyéndolo, obtenemos: * ') Determinar la sección eficaz diferencial para las colisiones de electrones con un átomo de hidrógeno en el estado normal acompañadas de la excitación del 11-ésimo ni\'el del espectro discreto (') En todos los rroblernas u1ili7arnos unidadi:s a!ómicas. 668 Teoría de las colisiones inelásticas (n es el número cuántico principal). Solución. El cálculo de los elementos de matriz se efectúa con facilidad en coordenadas parabólicas. Elijamos el eje z en la dirección del vector q, con lo que e-iq.r = e-tqz = e-Hq<E-11>. La función de onda del estado normal tiene la forma Los elementos de matriz son diferentes de cero tan sólo para las transiciones a estados con m Las funciones de onda de estos estados son (n = O. = n1 +n2 + 1). Los elementos de matriz que interesan vienen dados por las integrales ff CX)CX) (e-iq,r)OOO nln.o = eHq<E-11lif,ooot1'n n 1 a /+'YJ 2 4 17 d[d'Y). oo La integración se efectúa mediante las fórmulas dadas en el § f del apéndice matemático. Como resultado del cálculo se obtiene: Todos los estados con valores iguales de n1 +n2 = n -1 poseen la misma energía. Sumando respecto de todos los valores posibles de n1 - n2 para un n dado y substituyendo el resultado en (145.9), obtenemos la sección eficaz buscada: 3. Determinar la sección eficaz total de excitación del primer estado excitado del átomo de hidrógeno (1). Solución. Hay que integrar (1) También es posible calcularla para n arbitrario. Mediante el cálculo numérico cabe también obtener la sección eficaz total de dispersión inelástica del átomo de hidrógeno: cr¡n = 41r log(v2/0,160). A las colisiones acompañadas de excitación de estados del espectro discreto y a las acompañadas de ionización corresponden, respectivamente, crex = hX0,715 log(v2/0,45), crio = 41rX0,285 log(v2/Q,012). 669 l:oli.,;ione.,; inelástica.,; <le electrones rápfrlos con átomos respecto de todos los valores de q desde qmin = (E 2 - E 1)/v = 3/8v a qmax = 2v, conservando solamente aquellos términos que contienen la máxima ootencia de v. La integración es elemental v da: 25 z!Rrr 0-2 = -(log(4v)--]. 31ov2 24 4. Determinar la sección eficaz de ionización del átomo de hidrógeno (en el estado normal) cuando el electrón secundario se emite en determinada dirección; la energía del electrón secundario es pequeña comparada con la energía del electrón primario, por lo que no existen efectos de intercambio (MASSEY y MOHR, 1933). Solución. La función de onda del átomo en el estadio inicial es 1/'o = :i-· 112e-r. En el estado final el átomo está ionizado, y el electrón secundario que ha escapado de él posee un vector de onda que designaremos por >< (y una energía ;.//2). Este estado viene representado por la función 1/1><(134.9), en la que la parte de «salida» contiene (en el infinito) solamente una onda plana que se propaga en la dirección de x. La función de '/J"'- está normalizada según la función ,5 del espacio-x; en consecuencia, la sección eficaz calculada a partir de ella se referirá al elemento dxx dx 11 <lxz o al x~ w. do%, donde do" es el elemento de ángulo sólido para la dirección del electrón secundario. De esta manera 4k'K2 dcr = --l(e-iq.r) 0 ¡2 <lodo dK kq4 K K 1 (do es el elemento de ángulo sólido para el electrón dispersado), donde = (e-iq.r)o K 1 8 = [-- J J .t.- *e-iq.r.t.o dV = 't' K 't' e7T/ 2Kf(l-i/K) 23 /27r2 I , dV e-iq.r-i'-<.r-ArF(i/K,1,i(Kr+x.r))-] 8,\ r . A=l Efectuaremos la integración en coordenadas parabólicas con el eje z en la dirección de ángulo </> contado a partir del plano (q, x): ;sf % y con el 0000211' -1 I=[ Jexp( -Yq{f-,¡)cosy+iqV{f,¡)scnycos,f>-!A(f+,¡)-!i<(f-n)} x ooo (:· es el ángulo que forman x y q). La integración respecto de </> y 11 se efectúa fácilmente mediante la substitución ¡ ,, cos </> = u, sen</> = r, hecho lo cual se obtiene: V,, I F(i/K, 1,iKfldt] 2rr i(K + q cosy)-,\ La integral que aquí aparece se calcula aplicando la fórmula . ;1._-1 Teoría de las colisiones inelásticas 670 f e->ttF((X, 1, kt) dt = ;\cx-1(,\-k)-cx; ti (véase § f del apéndice matemático). Los cálculos subsiguientes son largos, pero elementales, y dan como resultado la siguiente expresión para la sección eficaz: dcr = 2Bk' K[q2+ 2qK cosy+(K2+ 1) cos2y] 1rkq2[q2+ 2qK cosy+ 1+ K2]4[(q+ K)2+ 1][(q-K)2+ l](l-e-2 11 /K) X e-{2 / K) arctg [2K /(q2 -K 2+1)1 do do K <lK, X La integración respecto del ángulo de emisión del electrón secundario es elemental y da la distribución angular de dispersión para un valor dado de la energía ;/·/2 del electrón emitido: Para q ~ l esta expresión presenta un máximo pronunciado para dcr 25 = -- dKdo 31rK4 [l+(q-K)2]3 ;e~ q; cerca del máximo . Integrando respecto del ángulo sólido do = 2:1q dq/k 2 ,....._, (2"lx/k 2 )d(q - ;e), obtenemos la expresión 8n d%/k 2;,é\ que coincide, como debía ser, con el primer término de la fórmula (145.17). § 146. Frenado eficaz En las aplicaciones de la teoría de colisiones tiene gran importancia el cálclllo de la pérdida media de energía de las partículas que chocan. Resulta conveniente caracterizar esta pérdida por la cantidad (146.1) que llamaremos frenado eficaz (diferencial); la suma se extiende, naturalmente, a todos los estados, tanto del espectro discreto como del continuo. d% corresponde a la dispersión en un elemento dado de ángulo sólido (1). La fórmula general para el frenado eficaz de electrones rápidos tiene la forma: e2 <lK = 81r ( - ñv )2 ~ n dq (En-Eo)I(~ e-tq.ra)onl2a q3' (146.2) (1) Si el electrón atraviesa un gas, la dispersión por los diferentes átomos ocurre de manera independiente y la cantidad Ndx (N es el número de átomos por unidad de volumen del gas) es la energía perdida por el electrón, por unidad de camino recorrido, en las colisiones que lo desvían hacia el elemento dado de ángulo sólido. 671 f'renado eficaz (d<r 11 viene dada por ( 145.9)). Excluiremos del análisis, como al deducir (145.23), el dominio de ángulos muy pequeños y supondremos de nuevo que 1 ~ ,9- ~ (v0 /v)2; q no depende entonces del valor de la energía transferida y la suma respecto de 11 se puede calcular en su forma general. El cálculo se efectúa mediante un teorema de sumación que se deduce de la siguiente manera. Los elementos de matriz de una magnitud f (función de las coordenadas) y de su derivada respecto del tiempo j están ligados entre sí por la fórmula (146.3) (Í)on = -(i/li)(En-Eo)fon, Tenemos, por consiguiente, ~ (En-Eo)l/onl 2 n = ~ (En-Eo)fonfon* n = ~ (En-Eo)fon(í+)no = ili L (Í)on(J+)no = iñ(/J+)oo, n n Las funciones de onda de los estados estacionarios del átomo se pueden elegir reales. Los elementos de matriz de la función de las coordenadas f están ligados entonces por las relaciones _/;111 = f, 10 y para los elementos de matriz (146.3) tenemos, ~egún esto, (Í)on = - (Í) 11 o. Por ello la suma considerada se puede escribir también en la forma -ili 1: (J+)on(/)no = -ifi(f+/)oo, n La semisuma de ambas expresiones nos conduce al teorema en cuestión: ~ (En-Eo)lfonl 2 = Yli(/¡+-¡+/)oo. (146.4) Apliquémoslo a la magnitud f = ~ a e-iq,ra. Según ( 19.2), la derivada de ésta respecto del tiempo viene representada por el operador (li/2m) ~ [e-iq.ra(q. va)+(q. va)e-iq.ra]. j =- a Es füciJ calcular directamente el resultado de la conmutación de j y / j/+-f+j = -(i!t/m)q 2 Z. Substituyendo en ( 146.4), obtenemos la fórmula 2m 2 h2q2 -_-(En-Eo)J(:E e-iq.ra)onJ 2 n a = Z, (146.5) 672 Teoría de las colisiones inelásticas que nos proporciona la fórmula de sumación que necesitábamos (1). Para el frenado eficaz diferencia] encontramos así la fórmula Ze4 dq 2Ze4 do dK = 4-rr-- = - - - . mv2 q (146.6) mv2 ,3-2 El dominio de aplicabilidad de la misma viene dado por la desigualdad {flo/fl)2 ~ & ~ 1, es decir,,fJo/fJ ~ aoq ~ fl/flo. Determinemos ahora el frenado eficaz total x(q1) para todas las colisiones acompañadas de una transferencia de impulso que no supera un cierto valor q1 tal que v0/v ~ a0 q1 ~ v/v0 : ql K(q1) =f J(En-Eo) dan; (146. 7) El valor qmín viene dado por la fórmula (145.11). El símbolo de integración no se puede permutar con el de suma, ya que qmín depende de n. Dividamos el intervalo de integración en dos partes, de qmín a q 0 y de % a q1, donde % es un cierto valor de q tal que v0 /v ~ %ªo ~ 1. En todo e] dominio de integración desde qmín a % es posible entonces utilizar para dna la expresión (145.14): e K(qo) = 81r ( liv )2 ~ l(dx)onl (En-Eo) fq. dq q' 2 qmin de donde e K(qo) = 81r ( liv )2"' l(dx)onl 2 ~ n qo/iv (En-Eo) log--. En-Eo (146.8) En el intervalo desde % a q1 podemos, en cambio, efectuar primero la suma respecto den, lo que conduce para dx a la expresión (146.6), que una vez integrada respecto de q da: K(q1)- K(qo) = 4-rr( Ze4/mv2 ) log(q1/qo). (146.9) (1) Al deducir esta relación, en ningún momento hemos utilizado el hecho de que el estado caracterizado por el índice cero sea el estado normal del átomo. Por consiguiente, vale para cualquier estado inicial. 673 Frenado eficaz Para transformar las expresiones obtenidas utilizaremos el teorema de sumación que se deduce de la fórmula (146.4), haciendo en ella J = (1/m) ~a Pxa, / = dx/e = ~a Xa, La conmutación de /+ y J (/+coincide en este caso con/) nos da }/+-/+/ = -inZ/m, de modo que (1): ~Non= L (2m/e 2n2 )(En-Eo)l(dx)onl 2 = Z. n n (146.10) Hemos introducido la notación especial N 0 n para las cantidades a las que afecta el signo de suma; las llamaremos intensidades de los osciladores para las correspondientes transiciones. Introduzcamos un valor medio de la energía I del átomo, valor definido por la fórmula log/ = ~ Non log(En-Eo)/L Non n n = (1/ Z) L Non log(En-Eo). n (146.11) Utilizando entonces el teorema de sumación (146.10), la fórmula (146.8) se puede escribir en la forma: K(qo) = (477 Ze4/mv2) log(qoh-v/1). Sumándola con (146.9), obtenemos finalmente: K(q1) = (hZe4/mv 2) log(q1h-v/J). (146.12) En esta fórmula interviene tan sólo una constante característica del átomo en cuestión (2). Expresando q1 en función del ángulo de dispersión &1 de acuerdo con q1 = mv&1/n, obtenemos el frenado eficaz en la dispersión para todos los ángulos & < &1 : (146.13) Si q1a0 ~ 1 (es decir, &1 ~ v0/v), se puede expresar x en función de la máxima energía cedida al átomo por el electrón incidente. En el párrafo anterior se demostró que para qa0 ~ 1 se produce la ionización del átomo, en la que prácticamente todo el impulso, nq, y la energía se ceden a un sólo electrón atómico. Por ello ·Aq y s están ligados entre sí como el impulso y la energía de un electrón, es decir, s = h 2q2/2m. (1) Para esta relación vale la misma observación que se hizo acerca de (146.5). (2) Para el hidrógeno es I = 0,55 me 4 /h 2 = 14,9 eV. 674 Teoría de las colisiones inelásticas Substituyendo en (146.12) q¡2 = 2ms1/lt2 , obtenemos el frenado eficaz en las colisiones acompañadas de una cesión de energía E < s1 : (146.14) Para los átomos pesados cabe esperar que la precisión será buena si se calcula la constante I mediante el método de Thomas-Fermi. Es fácil establecer cómo dependerán respecto de Z los valores I calculados de esta manera. En el caso cuasiclásico, a las diferencias entre niveles de energía corresponden las frecuencias propias del sistema de partículas. La frecuencia propia media del átomo es del orden de v0/a0 ; de aquí podemos deducir que I ,._,lzv0/a 0 • Las velocidades de los electrones atómicos en el modelo de Thomas-Fermi dependen de Z como z 2 13 , y las dimensiones del átomo, como z-1 13 , Encontramos así que I debe ser proporcional a Z (1): I = constante x Z. Para terminar haremos la siguiente observación. Los niveles de energía del espectro discreto de un átomo están ligados fundamentalmente con las posibles excitaciones de un sólo electrón (exterior); ya la excitación de dos electrones implica de ordinario una energía que es suficiente para la ionización del átomo. Por ello, en la suma de las intensidades de los osciladores, las transiciones a estados del espectro discreto representan solamente una fracción del orden de la unidad; en cambio, las transiciones acompañadas de ionización, contribuyen con términos del orden de Z. De aquí se sigue que el papel fundamental en el frenado (por átomos pesados) lo representan las colisiones acompañadas de ionización. PROBLEMA Determinar el frenado eficaz total de un electrón por un átomo de hidrógeno(/= 0,55 unidades atómicas); para grandes transferencias de energía, se considera como electrón primario el más rápido de los dos electrones que chocan. Solución. Cuando los electrones primario y secundario tienen después del choque energías comparables, hay que tener en cuenta el efecto de intercambio. Por ello, en el frenado con cesión de energía desde un valor e1(1 ~ c1 ~ v 2) al valor máximo Emax = E/2 = v 2/4 (¡de acuerdo con la definición adoptada de electrón primario!) hay que utilizar la sección eficaz (145.17): 7T = - [log(E/8E1)+ 1]. E 1 ( ) De los datos experimentales se deduce que la constante es del orden de 10 eV. Choques inelásticos de partículas pesadas con átomos 675 Sumando con (146.14), obtenemos (1): 41r K [v2 = - log -v'(!e) v2 2/ ] = -41r logv2 v2 1·3 (en unidades atómicas). § 14 7. Choques inelásticos de partículas pesadas con átomos La condición de aplicabilidad de la aproximación de Born a las colisiones de partículas pesadas con átomos, expresada en función de la velocidad de la partícula, sigue siendo la misma que en el caso de los electrones: v ~ i• 0 • Esto se sigue desde luego de la condición general (125.2) de aplicabilidad de la teoría de perturbaciones, Ua 0 /ñv ~ 1, si se observa que la masa de la partícula no aparece en ella en absoluto y que Ua 0 /li es una magnitud del orden de la velocidad de los electrones atómicos. En el sistema de coordenadas en el que el centro de masas del átomo y de la partícula se encuentra en reposo, la sección eficaz viene determinada por la fórmula general (145.3) (en la que por m hay que entender ahora la masa reducida de la partícula y del átomo). Es más conveniente, sin embargo, considerar la colisión en el sistema de coordenadas en el que se encuentra en reposo (antes del choque) el átomo dispersor. Para esto partiremos de la fórmula (145.1); en el sistema de coordenadas en el que, antes del choque, el átomo se encuentra en reposo, el argumento de la función - ó que expresa la ley de conservación de la energía tiene la forma: !P'2/M-}p2/M+i(p' -p) 2/Ma+En-Eo, (147.1) donde M es la masa de la partícula incidente y Ma es la masa del átomo; el tercer término representa la energía cinética de « retroceso » del átomo (energía de la que se pudo prescindir por completo en el choque con un electrón). En la colisión de una partícula pesada rápida con un átomo, la variación del impulso de la partícula es casi siempre pequeña comparada con su impulso inicial. Si se cumple esta condición, en el argumento de la función - ó cabe prescindir de la energía cedida al átomo, con lo cual volvemos exactamente a la fórmula (145.3), en la que sólo hay que substituir m por la masa M de la partícula incidente (¡no por la masa reducida de la partícula y del átomo!). Teniendo en cuenta que la transferencia de impulso se supone pequeña frente al impulso inicial, haremos p ':;;; p'; de esta manera, para la sección eficaz referida al sistema de coordenadas en el que, antes del choque, el átomo se encuentra en reposo, obtenemos la fórmula do-n = (M2/h2fí4)1 ff Ue-íq.rtf;n*t/;o dTd v¡2 do. (147.2) (1) En las colisiones de un positón con un átomo de hidrógeno no existe efecto de intercambio y el frenado total se obtiene, simplemente, substituyendo en ( 146.14) Emáx = E = -i v 2 en vez de 1: 1 : K = (47T/v2) log(v2/0·55). 676 Teoría de las colisiones inelásticas Teniendo en cuenta que la carga de la partícula puede ser diferente de la carga del electrón, escribiremos ze 2 en vez de e2 , donde ze es la carga de la partícula incidente. La fórmula general para la dispersión inelástica, escrita en la forma (145.9): dcrn = s1T(ze2 )21( ~ e-lq.ra)onl2dq, liv a q3 (147.3) no contiene la masa de la partícula. De aquí se sigue que también todas las fórmulas que se obtienen a partir de ella serán aplicables al choque de partículas pesadas, con tal que estas fórmulas se expresen en función de v y q. Es fácil ver cómo deben modificarse las fórmulas cuando se dan en función del ángulo de dispersión -& (ángulo de desviación de la partícula pesada que choca con el átomo). Para ello observemos, ante todo, que el ángulo -& es siempre pequeño en la colisión inelástica de una partícula pesada. En efecto, cuando el impulso cedido es grande (comparado con los impulsos de los electrones atómicos), se puede considerar la colisión inelástica con el átomo como una colisión elástica con los electrones libres; pero en el choque de una partícula pesada con una partícula ligera (un electrón) la partícula pesada casi no se desvía. Con otras palabras, la transferencia de impulso de la partícula pesada al átomo es pequeña comparada con el impulso inicial de la partícula (constituye excepción la dispersión elástica para grandes ángulos, dispersión que, sin embargo, es extremadamente poco probable). De esta manera, en todo el intervalo angular se puede hacer: q = v'{[(En-Eo)/v]2+(Mv&)2}/li, (147.4) (relación que de hecho se reduce a qli,....., Mv& (147.5) en todo aquel intervalo, con la única excepción de los ángulos más pequeños). Por otra parte, al considerar el choque de electrones con un átomo, escribíamos (para ángulos pequeños): q = v'{[(En-Eo)/v]2+(mv&)2}/h. La comparación de ambas expresiones permite concluir que las fórmulas que hemos obtenido para las colisiones de electrones con átomos, fórmulas expresadas en función de la velocidad y de los ángulos de desviación, se traducen en las fórmulas para la colisión de partículas pesadas substituyendo en todas partes (en particular, en el elemento de ángulo sólido do = 2n sen -& d.& = 2n-& d: &-+M&/m (147.6) con precisamente la misma velocidad v de la partícula que incide. Esto significa, cualitativamente, que toda la gráfica de dispersión para ángulos pequeños resulta 677 Choques inelásticos de partículas pesadas con átomos contraida lpara una velocidad dada) en la razón m/M. Las reglas obtenidas se aplican también a la dispersión elástica para ángulos pequeños. Efectuando la transformación (147.6) en la fórmula (137.4) con .& ~ 1, obtenemos la sección eficaz dcre = 81r(ze2/Mv2)2[Z-F(Mv-3·/h)]2 d&/&ª. En cuanto a la dispersión elástica de partículas pesadas para ángulos .& se reduce a la dispersión de Rutherford por el núcleo del átomo. (147.7) l"-.J 1, ésta La dispersión inelástica con ionización del átomo requiere un estudio aparte cuando el impulso cedido es grande. En contraposición al caso de la ionización por un electrón, no existen ahora, claro está, efectos de intercambio. Para las partículas pesadas es característico que una gran transferencia de impulso (qa 0 ~ 1) no significa en modo alguno una fuerte desviación; el ángulo.& sigue siendo siempre pequeño. La sección eficaz de ionización acompañada de emisión de un electrón con energía entre s y s+ds se obtiene directamente de la fórmula (145.25), que escribiremos en la forma: dcr1n = 81r(ze2Jhv)2Z dq/qª, haciendo ñ q /2m = s (todo el impulso ñq se cede a un sólo electrón atómico). Esto nos dará: 2 2 (147.8) En las colisiones de partículas pesadas con átomos, presentan particular interés las secciones eficaces y los coeficientes de frenado integrales. La sección eficaz total de dispersión inelástica viene determinada por la fórmula anterior (145.26). El frenado eficaz total se obtiene substituyendo en (146.12), en vez de q1, el máximo valor posible de transferencia de impulso, qmáx· Este último se expresa fácilmente en función de la velocidad de la partícula de la siguiente manera. Dado que hqmáx es en todo caso pequeño comparado con el impulso inicial Mv de la partícula, la variación de su energía está ligada con la variación del impulso por la relación AE = v ·ñq. Por otra parte, cuando el impulso transferido es grande, toda esta energía se cede esencialmente a un solo electrón atómico, de modo que podemos escribir: € De aquí se deduce ñq ~ = lz2q2/2m = ñv. q < ñvq. 2mv, es decir, nqmax = 2mv, €max = 2mv2. (147.9) Observemos que el ángulo de desviación máximo de la partícula en la dispersión inelástica es igual a &max = liqmax/Mv = 2m/M. 678 Teoría de las colisiones inelásticas Substituyendo (147.9) en (146.12), obtenemos el frenado eficaz total de una partícula cargada: K = (4TTZz2e4/mv2) Iog(2mv2/J). (147.10) § 148. Dispersión por moléculas La teoría general de la dispersión de partículas cargadas rápidas por moléculas viene dada, en esencia, por las mismas fórmulas que la dispersión por átomos. En algunos casos, este problema se puede reducir a un problema de dispersión por los átomos individuales que constituyen la molécula. Consideremos las colisiones de electrones rápidos con una molécula acompañadas de la excitación de los niveles de rotación y de vibración, sin que varíe el estado electrónico de la misma. Debido a que la energía de excitación de estos niveles es pequeña, se puede suponer que no varía el valor absoluto del impulso. Sea U la energía de interacción del electrón incidente con la molécula, promediada respecto de la función de onda electrónica de esta última; U es función de las coordenadas de la partícula incidente y de los núcleos de la molécula. Sean, además, "Po y "Pn las funciones de onda inicial y final del movimiento nuclear (vibratorio y de rotación). Tenemos entonces, de manera por completo análoga a la fórmula (145.3): (148.1) d-r es aquí el elemento del espacio de configuraciones de los núcleos y mes la masa del electrón. Esta fórmula se aplica tanto a la dispersión inelástica como a la elástica (n = O). Si todos los átomos de la molécula son suficientemente pesados, la mayor parte de los electrones dispersados pertenecen a las capas internas de los átomos. Por otro lado, el movimiento de los electrones interiores varía poco al unirse los átomos en la molécula (no cabe decir lo mismo, en general, acerca de los electrones exteriores). Por ello el « campo dispersor» U se puede escribir, con precisión suficiente, en forma de suma, U= 'J:..Ua, donde Ua es la energía de interacción de la partícula incidente con el a-ésimo átomo (promediada respecto de su estado electrónico); Ua es función de las coordenadas relativas de la partícula y del a-ésimo núcleo. Substituyendo en (148.1) u= ~ a Ua = ~ a Uae-'q.Raeiq.Ra, (Ra son los vectores posición de los núcleos), podemos representar la sección eficaz en la forma: Dispersión por moléculas dcrn = 1 ~fa( q)(e-iq.Ra)onl 2 do, a 679 (148.2) donde el elemento de matriz de la expresión entre paréntesis se forma mediante las funciones de onda nucleares "Po, 1Pn y las cantidades/a{q)vienen determinadas por la fórmula fa( q) = ( - m/2nlz2) J Uae-iq · Cr-Ra> d V. (148.3) Estas últimas poseen un sentido físico sencillo: representan las amplitudes de dispersión por los átomos individuales, ya que <lera.e = lfa{q)l 2 do (148.4) es la sección eficaz de dispersión elástica de un átomo individual (libre). La fórmula obtenida resuelve en principio la cuestión planteada. Consideremos ahora la dispersión de los neutrones por moléculas que no poseen momento magnético (1). Los electrones prácticamente no dispersan a los neutrones, de modo que toda la dispersión se debe, de hecho, a los núcleos. Supondremos que la dispersión es débil, en el sentido de que la amplitud de la onda dispersada por uno de los núcleos de la molécula es ya pequeña en los puntos en que se encuentran los demás núcleos; esta condición equivale a exigir que las amplitudes de dispersión por los núcleos individuales sean pequeñas comparadas con las distancias interatómicas. Cuando se cumple esta condición, la amplitud de dispersión por la molécula viene determinada por la suma de las amplitudes de dispersión por los diferentes núcleos. Al choque de un neutrón con un núcleo no es aplicable, en general, la teoría de perturbaciones; aunque el radio de acción de las fuerzas nucleares es pequeño, dentro de los límites de este radio las fuerzas son muy grandes. Por consiguiente, la teoría de perturbaciones es también inaplicable en general a la dispersión de los neutrones por moléculas. Sin embargo, en el caso de neutrones lentos, se puede aplicar al problema de la dispersión por un sistema de núcleos (por la molécula) una particular teoría formal de perturbaciones que reduce este problema al de determinar la amplitud de dispersión del neutrón por núcleos libres (E. FERMI, 1936). El fundamento físico de este método consiste en que la amplitud de dispersión de un neutrón lento (longitud de onda del neutrón grande comparada con las dimensiones del núcleo) por un núcleo libre es una cierta cantidad constante que no depende de la velocidad. Sea fa la amplitud de dispersión por el a-ésimo núcleo; lfa] 2 do es la sección eficaz diferencial de dispersión elástica del neutrón por un núcleo libre (en el sistema del centro de masas de ambos). (1) En el caso contrario se tiene, además, un efecto de dispersión específico que se debe a la interacción de los ·momentos magnéticos del neutrón y de la molécula. 680 Teoría de las colisione.i inelásticas La amplitud constante se puede obtener de manera formal a partir de la teoría de perturbaciones si se representa la interacción del neutrón con el núcleo por una energía potencial « puntual » 2TTh2 U(r) = - -/S(r), µ, (148.5) donde fl = A/(A + 1) es la masa reducida del neutrón y el núcleo de peso atómico A; al substituir esta expresión en la fórmula de Born (125.4), la función - t5 reduce la integral a una cantidad constante, independiente de q (1). Subrayemos que la posibilidad de introducir el « cuasipotencial » (148.5) está ligada precisamente con el carácter constante de f En el caso genera) de una energía arbitraria del neutrón, la amplitud de dispersión depende de cada uno de los impulsos p y p' por separado, y no tan sólo de su diferencia q; en cambio, la amplitud calculada en la aproximación de Born puede depender tan sólo de q. Si el núcleo dispersor efectúa un movimiento dado {por ejemplo, vibraciones en una molécula), al promediar respecto de este movimiento la interacción (148.5) « se difumina» en un dominio cuyas dimensiones, en general, son grandes comparadas con la amplitud de dispersión f Para esta interacción «difuminada» se cumple la condición (125.1) de aplicabilidad de la aproximación de Born. Así, pues, describiremos la interacción del neutrón con la molécula por una energía potencial (148.6) donde la suma se extiende a todos los núcleos que la constituyen; Ra son sus vectores posición; r es el vector posición del neutrón. Substituyendo esta expresión en la fórmula (143.3) (con µM en vez de m, donde µM es la masa reducida de la molécula y del neutrón). obtenemos la siguiente fórmula para la sección eficaz de dispersión del neutrón por la molécula en el sistema del centro de masas: dcrn 1 = µ, 2P'l¿ -¡ -fa(e-iQ.Ra)on,2do; M p a /J,a 1 (148.7) 1 los elementos de matriz se toman con relación a las funciones de onda del movimiento (1) Aunque el potencial (148.5) da el valor correcto de la amplitud de dispersión en la aplicación formal de la teoría de perturbaciones, esto no significa, en absoluto, que la teoría de perturbaciones sea efectivamente aplicable a este campo. Por el contrario, para un pozo de potencial de profundidad U0 que tiende a infinito de tal manera que Uoa3 = const (a es el radio del pozo, que tiende a cero), las condiciones (l 25.1-2) no se cumplen, evidentemente. Dispersión por moléculas 681 de los núcleos, y los impulsos p y p' están ligados entre sí por la ley de conservación de la energía (p2 -p' 2)/2µ,M = En - Eo. La fórmula (148.7) determina la dispersión de los neutrones por la molécula teniendo en cuenta la influencia del movimiento propio de los núcleos en aquélla y los efectos de interferencia entre las dispersiones por los diferentes núcleos en función de las amplitudes de dispersión (supuestas conocidas) de los neutrones por los núcleos libres (1). Si los núcleos poseen un spin diferente de cero, en las fórmulas obtenidas debe tenerse todavía en cuenta la circunstancia de que las amplitudes de dispersión fa dependen del spin total del núcleo dispersor y del neutrón. Esta corrección se puede efectuar de la siguiente manera. El spin total del núcleo y del neutrón puede tomar dos valores: Ía = Ía ± ! ; los valores correspondientes de la amplitud de dispersión los designaremos por fa+ y fa-· Construyamos el operador de spin cuyos valores propios, para valores determinados del spin total Ía = Ía ± !, sean iguales a fa+ y fa-, respectivamente. Este operador es la= aa+bas.ia, (148.8) donde ia y s son los operadores de spin de los núcleos y del neutrón y los coeficientes ªª y ba vienen dados por las fórmulas: (148.9) Es fácil comprobarlo observando que, para un valor dado de j, el valor propio del operador s. i es s.i = ![j(j + 1) - i(i + 1) - !]. Los operadores (148.8) deben substituirse en la fórmula (148.7) en vez de fa, formando los elementos de matriz que se deducen de ellos y correspondientes a la transición considerada. Si, como suele ocurrir, el haz incidente de neutrones no está polarizado (o si, en el blanco irradiado, los núcleos poseen spins con diferentes orientaciones), la sección eficaz de dispersión debe promediarse de acuerdo con ello (véanse los problemas). (1) Hay que subrayar que sería inadmisible, claro está, utilizar la interacción (148.6) para hallar las aproximaciones siguientes de la teoría de perturbaciones. Teoría de las colisiones inelásticas 682 PROBLEMAS 1. Promediar la fórmula (148.7) suponiendo que la dirección de los spins de los neutrones y de los núcleos están distribuidas por completo al azar. Todos los núcleos en la molécula son diferentes. Solución. Los promedios respecto de las direcciones de los spins de los neutrones y de los núcleos son independientes y cada uno de ellos da el valor cero como resultado del promedio; por ello s · i 11 = O. Si la molécula no contiene átomos iguales, no existe interacción de intercambio entre los spins nucleares y, en virtud de la anulación de su interacción directa, las direcciones de los spins de los diferentes núcleos de la molécula pueden considerarse independientes; por consiguiente, al efectuar el promedio se anulan también los productos de la forma (s· i 1) (s· i 2). En cambio, para los cuadrados (s· i) 2 tenemos: (s.i)2 = }s2i2 = ls(s+ l)i(i+ 1) = ¡i(i+ 1). Como resultado se obtiene la siguiente expresión para la sección eficaz promedia: + 1~ ia(ia+ 1) ba2l(e-iq.Ra)onl2] a 2. (J. do. /La2 Aplicar la fórmula (148.7) a la dispersión de neutrones lentos por el para- y el ortohidrógeno E. TELLER, ]937). SCHWINGER, Solución. Antes de formar los elementos de matriz de los operadores de spin, la expresión (148.7) para la dispersión por la molécula H2 tiene la forma: l6p' . dcrn = --la[(e-iq.r /2)on + (eiq.r /2)on] + 9 p +bs .[ii(e-iq.r /2)on + i2(eiq.r /2)on]l2do, a= !(3f++J-), b = f+-J-, (1) ( ± r/2 son los vectores posición de los dos núcleos de la molécula respecto de su centro de masas). Los estados de rotación y vibración de la molécula se determinan por los números cuánticos K, M K, z· (que hay que incluir en el significado den en Ú)). En el estado electrónico fundamental de la molécula H 2 , los valores K pares son sólo posibles para un spin nuclear I = O (parahidrógeno), y los valores K impares, para I = J (ortohidrógeno) (véase § 86). Por ello hay que distinguir dos casos: 1) transiciones entre estados de rotación con valores de K de igual paridad, sólo posibles sin variación de I (transiciones orto-orto y para-para), 2) transiciones entre estados con valores de K de distinta paridad, sólo posibles con variación de I (transiciones orto-para y para-orto). En el primer caso tenemos: (e-iq.r /2)on = ( eiq.r /2)on = (cos¡q.r)on; (hay que recordar que la función de onda de rotación queda multiplicada por (- J)K al cambiar Dispersión por moléculas 683 de signo r). El operador de spin en (1) se transforma entonces en 2a+bs.i,donde i = ii+is. Este operador es diagonal respecto de I por lo dicho antes. El cuadrado (2a+bs· 1)2 se promedia como en el problema 1 y da: 4a2 + }b2J(I + 1). El resultado que se obtiene es dan = 4 p' --1( cos}p.r)onl 2 [(3f+ +J-)2 + I(I + 1)(j+ - J-)2]do. 9 p (2) En el segundo caso ( eiq.r /2)on = _ ( e-iq.r )2)on = i(sen!q.r)on, y el oper::i.dor de spin en (1) se reduce a é.(i1 --i2); este operador posee únicamente elementos de matriz no diagonales respecto de J. El cuadrado del módulo de estos elementos, sumado respecto de todos los valore~ posibles de la proyección del spin total /' en el estado final, se calcula como valor medio (elemento diagonal) del cuadrado [s· (i1 - i 2)]2 (véase la nota de la pá~. 620 y es igual a [s.(h-i2)] 2 =i,!(h-i2) 2 = !(2h2 + 2i22-i2) = ![3-I(I + 1)]. Como resultado obtenemos: 4 p' dan= (1 )(3)--j(sentq.r)onl 2(J+-/-)do, 9 p (3) donde el coeficiente (1) se refiere a las transiciones orto-para, y el coeficiente (3), a las transiciones para-orto. Si los neutrones son tan lentos que su longitud de onda es también grande comparada con las dimensiones de la molécula, en los elementos de matriz que aparecen en (2) y en (3) se puede hacer cos (q·r/2) = 1, sen tq,r/2) = O, como resultado de lo cual todos ellos se anulan salvo el elemento diagonal 00 en (2); es natural que, en estas condiciones, sea posible sólo la dispersión elástica. La sección eficaz de dispersión elástica es en este caso: dae 4 = -[(3f++J-)2+1(1 + l)(f+-J-)2]do. 9 3. Determinar la sección eficaz de dispersión de los neutrones por un protón ligado que se considera como un oscilador espacial isótropo de frecuencia w (E. FERMI, 1936). Solución. Considerando el protón como un punto que vibra en torno de un punto fijo del espacio, debemos hacer en la fórmula (148.7), en virtud del razonamiento que condujo a ella, µM = M y µª = M/2 (M es la masa del protón). Entonces Teoría de las colisiones inelásticas 684 donde a 0 4n:f 12 es la sección eficaz de dispersión por un protón libre y tpn,n 2 n 3 las funciones propias del oscilador espacial que corresponden a los niveles de energía En = hw(n+3/2); la suma se extiende a todos los valores de n1, n 2, n3 con valor dado de la suma n1 +n2 +n3 = n. Las funciones ipn,11 211 3 representan productos de funciones de onda de tres osciladores Jineales (véase problema 4, § 33). La integral que necesitamos se descompone, por consiguiente, en producto de tres integrales de la forma: VMm/h), que se calculan substituyendo Hn 1(x) por la expresión (a, 4) e integrando por partes n 1 veces. Como resultado se obtiene: (~ = La suma se calcula mediante la fórmula del binomio y se encuentra finalmente: dcrn = -ero- 7T1l! JE'( q2 )ne-q E - -- 2a.2 En particular, la sección eficaz de dispersión elástica (n dae ªº = -e-q 2 / 2a: 2do, '1T Cuando E/hm-'i>- O, se tiene ae-,,,. 4a0 • = 2 /2a: 2do. O, E= E') es: APÉNDICES MATEMÁTICOS § a. Polinomios de Hermite La ecuación y"-2xy'+2ny =O (a.1) pertenece a un tipo de ecuaciones que se pueden resolver mediante el llamado método de Laplace. El método de Laplace (1) es aplicable en general a las ecuaciones lineales de la forma cuyos coeficientes son de grado no superior al primero en x y consiste en lo que sigue. Construyamos los polinomios n P(t) = ~ amtm, m-0 Q(t) = n ~ m-0 bmtm, y, a partir de ellos, la función Z(t) = (1/Q)efCP/Q)dt, definida salvo un factor constante. La solución de la ecuación considerada puede entonces expresarse en la forma de una integral compleja y = J Z(t)ext dt, e en la que el camino de integración C se elige de manera que la integral sea finita y distinta de cero y que la función (') Véase, por ejemplo, E. GouRSAT, Cours d'Analyse Mathématique, vol. 11; V. l. of Higher Mathematics, vol. 111, part. 2., Pergamon, Oxford, 1964. SMIRNOV, Course 686 Apénclice." matemático.'! vuelva a su valor inicial cuando t describe C por completo (el contorno C puede ser cerrado o abierto). En el caso de la ecuación (a, I) tenemos: P = t2+2n, z= Q = -2t, - 1 --e-t2 /4 2tn+l ' V= 1 -ext-tz/4 tn ' de modo que su solución es de la forma: y = f e:vt-t2¡4 dt/tn+I. (a.2) Para las aplicaciones físicas basta limitarse a considerar los valores n > - L Para tales valores de n cabe elegir como camino de integración los contornos C 1 o C 2 (fig. 50), que satisfacen las condiciones necesarias, ya que en sus extremos (t = oo o t = - oo) la función V se anula (1). + 4 e, C2 $ FIG. 50 Veamos para qué valores del parámetro n la ecuac1on (a, 1) tiene soluciones que son finitas para todos los valores finitos de x y que para x---+ = tienden a infinito no más rápidamente que una potencia finita de x. Consideremos primero valores enteros de n. Las integrales (a, 2) a lo largo de C 1 y C.2 proporcionan dos soluciones independientes de la ecuación (a, 1). Transformemos la integral a lo largo de C 1 introduciendo la variable u mediante t = 2(x ~~ u). Prescindiendo de un factor constante, encontramos: y = ex' fe-u' du/(u-x)n+l, (a.3) C/ donde la integración se efectúa a lo largo del contorno Ci' en el plano de la variable compleja u y representado en la fig. 51. <') Estos caminos no valen para valores enteros negativos de idénticamente la integral (a, 2) a lo largo de los mismos. 11, dado que para tales valores se anula Polinomio." de Hermite 687 e; u e e· 1 X FIG. 51 + Cuando x ->oo todo el camino de integración se desplaza hacia el infinito y la integral de la fórmula (a, 3) tiende a cero como e- r'. Pero para x--+ dicho camino se extiende a lo largo de todo el eje real y la integral (a, 3) no tiende a cero exponencialmente, de modo que la función _r(x) tiende a infinito esencialmente como ex". Análogamente es fácil comprobar que la integral (a. 2) a lo largo de C/ diverge exponencialmente cuando x-+ =. = + Para valores enteros positivos de 11, en cambio (incluido el valor cero). las integrales a lo largo de las secciones rectilíneas del camino de integración se reducen entre sí y ambas integrales (a, 3) - a lo largo de C¡' y de Cz.' - se reducen a una integral a lo largo de un camino cerrado en torno del punto u ---= x. Obtenemos así la solución 0 y(x) = ex '1j e-u 1 du/(u-x)n+I, que satisface las condiciones impuestas. Según la conocida fórmula de Cauchy que da las derivadas de una función analítica 11! pn)(x) = -2r.i f. f (t) (t-x)n+I . dt, aquella solución coincide, salvo un factor constante, con uno de los llamados polinomios de Hermite (a.4) En forma explícita, el polinomio Hn, ordenado según las potencias decrecientes de x, se escribe: Hn(x) = (2x)n n(n-1) 11(n-l)(n-2)(n-3) ---(Zx)n-2+ (2x)n-4_ .... 1 1.2 (a.5) Contiene sólo potencias de x de la misma paridad que n. He aquí los primeros 688 Apéndices matemático.<; polinomios de Hermite: Ho = 1, H 1 = 2x, 4x2 -2, H2 Hs = 8x3-12x, ll4 = lfo4 -48x2+ 12. (a.6) 2 Para calcular la integral de normalización, substituyamos e-x Hn por la expresión que resulta de (a, 4) e, integrando n veces por partes, obtendremos: f s (f.) Iro (-l)nHn(x)-e-x ¿n dx s e-x Hn2(x) dx = dxn --co -«> oo = dn f e-x=-Hn dx. dxn -00 d 11 H 11 Pero es una constante, igual a 2n,n!; por consiguiente, d./l f ro = znn,y1T. e-:,lHn2 (x) dx (a.7) -0:, § b. La función de Airy También 1a ecuación y"-xy (b.l) O = pertenece al tipo de Laplace. Siguiendo el método general, introduzcamos las funciones p t2 ' Q = -1, de modo que la solución puede representarse en la forma y(x) = constante x f ext-t /3 dt. 3 (b.2) e donde el camino de integración C debe elegirse de manera que en sus dos extremos se anule la función V. Para ello estos extremos tienen que ir al infinito en dominios del plano complejo t en los que Re(t 3) > O (estos dominios aparecen rayados en Ja fig. 52). Obtenemos una. solución finita para todo x eligiendo el camino C conforme se representa en la figura. Este camino puede desplazarse de manera arbitraria con la única condición que sus extremos vayan a infinito en los dos mismos sectores La función de Air;r 689 FIG. 52 rayados (1 y 111 en la fig. 52). Obsérvese que si se elige un camino que se encuentre, por ejemplo, en los sectore? 11 I y 11, obtendríamos una solución que tiende a infinito cuando x _.,.. =. Desplazando el camino C de modo que coincida con el eje imaginario, obtenemos la función (b, 2) en la forma (hacemos la substitución t = iu): f 00 <t>(x) = ;;; cos(ux+}uª) du. (b.3) o La constante const en (b, 2) la hemos igualado a - i 2r';i y la función así definida se ha representado por <l>(x); se llama función de Airy (1 ). La expresión asintótica de <t>(x) para grandes valores de x puede obtenerse calculando la integral (b, 2) por el « método del puerto». Para x > O el exponente 1 del integrando presenta un extremo en t = -: 1 x y la dirección de « máxima pendiente» es paralela al eje imaginario. De acuerdo con esto, para obtener la expresión asintótica correspondiente a grandes valores positivos de x, desarrollemos el exponente en potencias de t ~ 1 x e integremos a lo largo de la recta C 1 (fig. 52), paralela al eje imaginario (distancia OA =--= 1'x). Haciendo la substitución t = - i'x+iu, obtenemos: Hemos adoptado la dellnición propuesta por Y. A. FoK: véase el apéndice a su libro Difrakt.1ia 1·ok.r11i: ::e111noi 1w1·erino.,ri 1 /)ifi·acciún de las ondas de radio en torno de la .rnper(icie terrestre), 1,d-vo AN sss·R. 1946. que con1iene una colección de fórmulas y tablas numéricas (la función<!>(.\·) es una de las dos funcione~ introducidas por FoK, que la llama 1·(x). ( 1) ,-111 /ioroln 690 Apéndices matemáticos z:,, f et) 4>(x) :::, - ,,-(2/3)•"'--«'V• du, -00 de donde (b.4) Así, pues, para grandes valores positivos de x la función <I>(x) decrece exponencialmente. Para hallar la expresión asintótica que corresponde a grandes valores negativos de x. observemos que cuando es x < O el exponente presenta un extremo en t = ivlxl t= -ivlxl, y la dirección de « máxima pendiente » en estos puntos coincide con la de rectas que forman ángulos - !!_ y ~ con el eje real, respectivamente. Eligiendo como ca- 4 4 mino de integración la quebrada C3 (distancia OB = de sencillas transformaciones Jllx!), obtenemos después <I>(x) = lxl-114 sen(ilxl 3 12+!77"). (b.5) Resulta así que en la región donde x es negativa y grande en valor absoluto, la función <I>(x) tiene carácter oscilante. Señalaremos que el primer (y mayor) máximo de la función 4>(x) es 4>(- 1,02) = 0,95. La función de Airy puede expresarse mediante funciones de Bessel de orden i. Es fácil comprobar que la ecuación (b, 1) tiene la solución donde Z1 1aCx) es una solución cualquiera de la ecuación de Bessel de orden t. La solución que coincide con (b, 3) es: <!>(x) = tV(77"x){/-1¡a(fx3 12)-fi;a(-fx312)} <I>(x) = t para X> vHxl){J-1¡a(ilxl 312)+li;a(ilxl 3 12)} para Ü, X < O, (b.6) donde ln(x) = ¡-n¡n(ix). La manera más fácil de obtener el coeficiente que aqui aparece consiste en comparar la expresión asintótica (b, 5) con la conocida expresión asintótica de las funciones de Bessel 691 Polinomios de Legendre § c. Polinomios de Legendre Los polinomios de Legendre Pn ( cos O) se definen por la fórmula dn 1 Pn(cos8) = - (cos28-1)", znn! (d cos O)n (c.1) o en forma explícita: n(n-l) n(n-l)(n-2)(n-3) ] (2n)! [ cosn-48- .... (c.2) Pn(cos8) = - - cosn(J - - - cosn-20+ 2n(n!)2 . 2(2n-1) 2. 4. (2n-l)(2n-3) Dichos polinomios satisfacen la ecuación diferencial lineal dPn) -1- -d ( sen O- +n(n+ l)Pn = O. sen8 d8 d8 (c.3) Los polinomios asociados de Legendre se definen mediante la fórmula dmPn(cosO) Pnm(cos8) =senmO - - - (d cosO)m 1 dm+n = -senmB (cos28-1)" znn! (d cos (J)m+n ' (c.4) (m = 0,1, ... , n). A esta definición equivale la expresión (n+m)! dn-m sen-m(J (cos28-1)", Pnm(cos8) = (-l)m (n-m)!2nn! (d cosO)n-m (c.5) o en forma explícita Pnm( cos 8) = (2n)! ( (n-m)(n-m-1) senm(J cosn-m(J . cosn-m-20+ znn! (n-m)! 2(2n-1) + (n-m)(n-m-l)(n-m-2)(n-m-3) 2. 4. (2n-1)(2n-3) } cosn-m-4(J- .... (c.6) Los polinomios asociados de Legendre satisfacen la ecuación m2] d ( sen8-dPnm) + [ n(n+l)--- Pnm = O. -1- seno dO dO sen20 (c.7) Apéndices matematicos 692 Para los polinomios de Legendre vale el siguiente << teorema de adición » (1). Sea y el ángulo entre dos direcciones definidas por los ángulos esféricos (), <f, y()', <f, '. cos y = cos 8 cos 8' +sen8 sen8' cos(</,-</,'). Entonces Pn(cosy) = Pn(cos8)Pn(cos8')+ n + 2 m=l 2 (n-m)! , (c.8) Pnm(cos8)Pnm(cos8')cosm(</,-cf, ). (n+m)! Para calcular la integral de normalización de los polinomios de Legendre n f 1 f [Pn(cos8)]2 senO dO = O [Pn(¡,)J" d¡, , (µ = cos 8) -1 substituyamos la expresión (e, 1) e integremos por partes n veces: -f 1 I 1 [Pn(µ)]2 dµ = _ l 22n(n!)2 -1 ~(µ2-l)n ~(µ2-l)n dµ dµn dµn -1 I 1 (-l)n = __ 22ncn!)2 ¿2n (µ2-1 )n -(µ2-1 )n dµ dµ2n -1 I 1 (2n)l = -- (l-µ2)n dµ z2n(n!)2 -1 I 1 (2n)l = 2-(n!)2 un(l-u)n du o (u= (1 - µ)/2), de donde 1 J[Pn(µ)]2 dµ = 2/(2n+ 1). (c.9) -1 1 ( ) En la literatura matemática existen muchas exposiciones buenas de la teoría de las funciones esféricas. Como referencia, presentamos aquí sólo algunas relaciones fundamentales, sin ocuparnos, en absoluto, de exponer sistemáticamente la teoría de estas funciones. Polinomios de Legendre 693 De manera análoga es fácil comprobar que las funciones Pn(µ) con valores de n diferentes son ortogonales entre sí:· 1 JPn(µ)Pm(µ) dµ = O (n i=- m). (c.10) -1 El cálculo de la integral de normalización para los polinomios asociados de Legendre se efectúa fácilmente de manera análoga escribiendo [Pn m(µ)] 2 en forma de producto de las expresiones (c, 4) y (c, 5) e integrando n - m veces por partes; como resultado se obtiene: 1 2 (n+m)! [Pnm(µ)]2 dµ = 2n+ 1 (n-m)!. J (c.11) -1 Es fácil también ver que las funciones de m) son ortogonales entre sí: pnm con valores den diferentes (e igual valor 1 JPnm(µ)Pkm(µ,) dµ (n i=- k). = O (c.12) -1 El cálculo de integrales de productos de tres polinomios de Legendre se discute en el§ 107. Finalmente, como referencia, damos a continuación las expresiones de los primeros armónicos esféricos Y1m: Yoo = 1/y(+n-); Y10 = iy(3/+n-)cos 8, Y20 Y1,±1 = :¡: iy(3/81r)sen8. e±iq¡; = y(S/l61r)(l-3 cos28), Y2,±1 = ±v(lS/81r) cosfJsen8. e±iq¡, Y2,±2 = -y(15/321r)sen2fJ. Y30 = -iy(7/167r) cosO(S cos28-3), Y3,±1 = ± iy(21/64n-)sen8(5 cos28- l)e±i~\ e±2iif>; Ya,±2 = -iy(l05/321r) cosfJsen2fJ. e±21~\ Ya,±3 = ± iy(35/64n-)senª8. e±3iq¡. 694 .Apéndices matemáticos § d. La función hipergeométrica confluente La función hipergeométrica confluente se define por la serie (X z F((X,y,z) = 1+--+ yl! (X((X+ 1) z2 - + ... , (d.1) y(y+l) 2! que converge para cualquier valor finito de z; el parámetro a es arbitrario, y se supone que el parámetro y no es ni cero ni un número entero negativo. Si a es un número entero negativo (o nulo), la función F(rx, y, z) se reduce a un polinomio de grado lrxl, La función F(rx, y, z) satisface la ecuación diferencial zu" +(y-z)u' -(XU = O, (d.2) como es fácil ver por comprobación directa (1). La substitución u = z -Yu1 transforma esta ecuación en una ecuación del mismo tipo: 1 (d.3) De aquí resulta que para y no entero la ecuación (d, 2) tiene también la integral particular z1-y F(rx -y+l, 2-y, z), linealmente independiente de (d, I) de modo que la solución general de la ecuación (d, 2) tiene la forma: (d.4) El segundo término, a diferencia del primero, presenta una singularidad en z = O. La ecuación (d, 2) pertenece al tipo de Laplace y sus soluciones pueden escribirse en forma de integrales de contorno. Siguiendo el método general, introduzcamos las funciones P(t) = yt-(X, Q(t) = t(t-1), Z(t) = tet.-l(t-l)r-et.-1, de modo que u = J etztet.-l(t-I)r-et.-1 dt. (d.5) El camino de integración debe elegirse de manera que, después de recorrerlo, la función V(t) = e 1z1rx(t - l)Y-rx vuelva a su valor inicial. Aplicando el mismo método a la ecuación (d, 3), se puede obtener para u una integral de contorno de otra forma: u= zl-y J etztet.-r(t-1)-et.dt. (1) La ecuación (d, 2) con valor entero y negativo de y no merece consideración particular, ya que puede reducirse (mediante el paso a la ecuación (d, 3)) al caso de valores de y enteros positivos. La /unción hipergeométrica confluente 695 En esta integral conviene hacer la substitución tz -+ t que la lleva a la forma u(z) = f et(t-z)-a1a-r dt, (d.6) con V(t) = etta-r+I(t-1)1-a. El integrando en (d, 6) tiene, en general, dos puntos singulares - para t = z y para t = O. Eligiremos el contorno de integración C que viene del infinito (Re t -+-(X)), rodea a ambos puntos singulares en sentido positivo y vuelve luego al infinito (fig. 53). Este contorno satisface las condiciones exigidas, ya que en sus extremos se anula la función V(t). La integral (d, 6), tomada a lo largo del contorno C, no es singular en el punto z = O; por ello debe coincidir, salvo un factor constante, ..' .. FIG. 53 con la función F(r:1., y, z), que carece también de singularidades. Para z = O los dos puntos singulares del integrando coinciden; en virtud de la conocida fórmula de la teoría de la función r (1) ~ 2m Dado que F( r:1., y, O) = f ett-r dt = 11r(y). (d.7) e l, es evidente que r(y) F(~, y, z) = - - . 2m I. et(t-z)-ata-r dt. (d.8) e En (d, 5) el integrando tiene puntos singulares en t = O y t = l. Si Re(y- a)> O, y y no es un entero positivo, como camino de integración se puede elegir el contorno C' que parte del punto t = 1, rodea en sentido positivo el punto t = O y vuelve a t = 1 (fig. 54); para Re(y - r:1.) > O, como resultado de recorrer este contorno la función V(t) vuelve al valor de partida (2). Tampoco la integral así definida es (1) Véase, por ejemplo, WHITTAKER y WATSON, Course o/ Modern Analysis, Cambridge, 1944, § 12.22. Si y es un entero positivo, como contorno C' puede elegirse cualquier contorno que rodee a los dos puntos t = O y t = l. (2) 696 Apéndices matemáticos singular en z = O y está ligada con F(oc, y, z) por la relación 1 r(l-oc)r(y) F(oc,y,z) = - - . 2m r(y-oc) f etz(-t)ª-l(l-t)'r-a-1 dt. (d.9) C' Acerca de las integrales (d, 8-9) hay que hacer la siguiente observación. Para valores no enteros de oc y de y los integrandos son funciones multiformes. Suponemos que sus valores en cada punto se eligen de manera que la cantidad compleja que se eleva a una potencia se toma con el argumento de menor valor absoluto. Haremos notar la útil relación F(oc,y,z) = eZF(y-oc,y, -z), (d.10) que se obtiene sin más que efectuar en la integral (d, 8) la substitución t---+ t+z. Hicimos ya observar que si oc = - n, donde n es un entero positivo, la función F(oc, y, z) se reduce a un polinomio. Para estos polinomios se puede obtener una fórmula breve. Efectuando en la integral (d, 9) la substitución t---+ 1 - (t/z) y aplicando a la integral que así se obtiene la fórmula de Cauchy, se encuentra la fórmula siguiente: F(-n,y,z) = Si además es y = 1 dn zl-r&-(e-zzr+n-1). r(r+ 1) ... (y+n-1) dzn (d.11) m, con m entero positivo, vale también la fórmula (-l)m-1 F(-n,m,z) = m(m+ 1) ... (m+n-1) dm+n-1 eZ dzm+n-1 (e-zzn). (d.12) Esta fórmula se obtiene aplicando la fórmula de Cauchy a la integral que resulta de (d.8) mediante la substitución t---+ z - t. Los polinomios F(- n, m, z), O ~ m ~ n coinciden, salvo un factor constante, con los llamados polinomios de Laguerre generalizados, definidos por La función hipergeométrica confluente 697 (n!)2 Lnm(z) = (-t)m F(-[n-m],m+l,z) m!(n-m)I = ni dn eZ-(e-Zzn-m) (n-m)! dzn = (-l}ffl n! ¿n-m eZz-m --(e-zzn). (n-m)! dzn-m Los po]inomios Lnm se representan por Ln(z) cuando m mente, polinomios de Laguerre; según (d, 13) tenemos (d.13) = O y se llaman, simple- La representación integral (d, 8) es cómoda para obtener un desarrollo asintótico de la función hipergeométrica confluente para grandes valores de z. Deformemos el contorno de manera que se convierta en los dos contornos C1 y C2 (fig. 53) que rodean, respectivamente, los puntos t = O y t = z; hay que imaginar que ]a rama inferior C2 y la rama superior C1 del camino empalman en el infinito. Dado que se pretende hallar un desarrollo en potencias negativas de z, saquemos fuera del paréntesis en e] integrando la expresión (- z)-o:. En la integral a lo largo del contorno C2 efectuemos la substitución t-+ t+z; con esto transformamos el contorno C2 en el contorno C1• La fórmula (d, 8) se representa así en la forma: F(1X,y,z) = r(r) r(r-lX) (-z)-ªG(1X,1X-y+l, -z)+ r(r) 1-o: z) +--eZza-rG(y-lX r(1X) , , , donde hemos introducido la notación G(1X,/3,z) = r(l-/3) . 2m f (1+-t)-ª z tP-Ietdt. (d.14) (d.15) C1 Al elevarlas a una potencia en Ja fórmula (d, 14), las cantidades - z y z deben tomarse con el argumento de menor valor absoluto. Finalmente, desarrollando en el integrando la expresión (1 +t/z)-o: en potencias de t/z y aplicando la fórmula (d, 7), obtenemos en definitiva para G(rx, (J, z) la serie asintótica G(1X,/3,z) = IX/3 1X(1X+ l)/3(,8+ 1) l!z 2!z2 1+-+ + .... (d.16) 698 Apéndices matemáticos Mediante las fórmulas (d, 14) y (d, 16) se determina el desarrollo asintótico de la función F(rx., y, z). Cuando y es entero y positivo, el segundo término en la solución general (d, 4) de la ecuación (d, 2) o coincide con el primero (si y = 1) o pierde todo sentido (si y> 1). En este caso, cabe elegir como sistema de soluciones linealmente independientes los dos términos de la fórmula (d, 14), es decir, las integrales (d, 8) tomadas a lo largo de los contornos C1 y C2 (estos contornos, como el contorno C, satisfacen las condiciones impuestas, de modo que las integraJes a lo largo de los mismos son también soluciones de la ecuación (d, 2)). La forma asintótica de estas soluciones viene dada por las fórmulas ya obtenidas; falta hallar su desarrollo en potencias crecientes de z. Para ello partiremos de la igualdad (d, 14) y de la igualdad análoga relativa a la función z 1-YF(rx.-y+I, 2-y, z). De estas dos igualdades se deduce la expresión de G(rx., rx. -y+I, -z) en función de F(rx., y, z) y F(rx.-y+l, 2-y, z); se hace luego y= p+s (p es un número entero positivo) y se pasa al límite para E-')- O resolviendo la indeterminación mediante la regla de L' HóPITAL. Como resultado de un cálculo bastante largo se obtiene el desarrollo siguiente: G(rx, oc-p+ 1, -z) sen'TT'rx. r(p-rx) = 'TT'r(p) 00 X ( Iogz.F(rx,p,z)+ 2 r(p)r(rx+s)[ip(cx+s)-ip(p+s)-ip(s+ 1)] r(rx)r(s+p)r(s+ 1) s=O p-1 + 2 s=l zªX zs+ r(s)r(rx-s)r(p) ) z-s , r(cx)r(p-s) (-1)&+1 (d.17) en el que 'Y designa la derivada logarítmica de la función r : 'Y(rx.) § e. La función hipergeométrica La función hipergeométrica se define dentro del circulo \z\ F(oc,{3,y,z) = r'(rx.)/r(rx.). = < 1 por la serie rx/3 z rx(rx+ 1)/3(/3+ 1) z2 1+--+ + ... , y 1! y(y+ 1) 2! (e.l) y para izl > 1 se obtiene por prolongación analítica de esta serie. La función hipergeométrica es una integral particular de la ecuación diferencial z(l-z)u" +[y-(cx+f3+ 1)z]u' -r:,.f3u = O. (e.2) 699 La función hipergeométrica Los parámetros y f3 son arbitrarios y y=/=- O, - 1, - 2, ... La función F(IX, es simétrica, evidentemente, respecto de los parámetros IX y f3 (1). (X fJ, y, z) Una segunda solución de la ecuación (e, 2), independiente de la primera, es: zl-1F(fJ-y+l, (t.-y+l, 2-y, z); esta solución tiene un punto singular en z = O. Como referencia, presentaremos aquí algunas relaciones a las que satisface la función hipergeométrica. La función F(IX, fJ, y, z) puede representarse para todo z, si Re(y - IX)> O (2), en forma de integral 1 r(l-cx)r(y) F(cx,{3,y,z) = - - . 2m r(y-cx) f (-t)cx-I(l-t)r-a-1(1-tz)-Pdt, (e.3) C' extendida a lo largo del contorno C', representado en Ja fig. 54. Es fácil comprobar por substitución directa que esta integral satisface, en efecto, la ecuación (e, 2); el factor constante se elige de manera que la función se reduzca a la unidad para z = O. La substitución u = (l -z)Y-rx-/Ju1 aplicada a la-ecuación (e, 2) conduce a una ecuación del mismo tipo con parámetros y - IX, y -/3 y y en vez de IX, f3 y y, respectivamente. De aquí se sigue la igualdad F(cx,{3, y, z) = (1-z)r-a-PF(y-cx, y-fJ, y, z); (e.4) (ambos miembros de Ja igualdad satisfacen precisamente la misma ecuación y sus valores coinciden para z = O). La substitución t ~ t/(1-z+zt) en la integral (e, 3) conduce a la siguiente relación entre las funciones hipergeométricas de las variables z y z/(1 - z): F(cx,{3,y,z) = (l-z)-ªF(cx,y-fJ,y,z/(z-1)). (1) La función hipergeométrica confluente se obtiene a partir de F(oc, fJ, y, z) mediante el paso al límite: F(cx,y,z) ( 2) (e.5) = IimF(cx,fJ,y,z/fJ). p---+00 Esta desigualdad se cumple en todos los casos que se encuentran en las aplicaciones físicas. Apéndices matemáticos 700 El valor de la expresión multiforme (1 - z)-oc en esta fórmula (y en las expresiones análogas que se encuentran en las fórmulas que siguen a continuación) se define por la condición de que la cantidad compleja que se eleva a um, potencia se toma con un argumento igual al menor en valor absoluto. Sin deducirla, daremos también la importante fórmula que liga las funciones hipergeométricas de las variables z y 1/z: F{cx,,8,y,z) = r(y)r(,8-cx) r(,8)r(y-cx) (-z)-a:F(cx,cx+l-y,cx+l-,8, 1/z)+ + r(y)r(cc-,8) (-z)-flF(,8,,8+ l-r,,8+ 1-cx, 1/z). r(cc)f(y-,8) Esta fórmula expresa F(oc, /3, y, z) en forma de serie convergente para decir, representa la prolongación analítica de la serie de partida. (e, 1). (e.6) lzl > 1, es La fórmula F(cx,,B,y,z) r(y)r(y-cx-,8) = r(y-cx)r(y-,8) F(cc,,8,cx+,B+l-y, 1-z)+ r(y)r(cc+,8-y) r(cc)r(,8) (l-z)1-a:-PF(y-cx,y-,8,y+l-cx-/3, 1-z) (e.7) + liga las funciones hipergeométricas de z y de 1 - z (se deduce de manera análoga a como se deduce (e, 6)). Combinando (e, 7) y (e, 5) con (e, 6), obtenemos las relaciones F(cc,,B,y,z) = r(y)r(,B-cx) r(,8)r(y-cx) (1-z)-a:F(cx,y-,B,cx+l-,B, 1/(1-z))+ r(y)r(cx-,8) + r(cx)r(y-,8) (l-z)-PF(,8, y-cx,,8+ 1-cc, 1/(1-z) ), F(cc,,8,y,z) = (e.8) r(y)r(y-cc-,8) ( z-1) z-a:F cx,cx+l-y,cc+,8+1-y,- + r~-mrfy-~ z ( z-1) + r(y)r(cx+,8-y) (l-z)r-a:-/lza-rF 1-,B y-,B r+1-oc-,B r(cc)r(,8) ' , , z . (e.9) Cada uno de los términos de la suma en los segundos miembros de las igualdades (e, 6-9) representa por sí solo una solución de la ecuación hipergeométrica. Si oc (o {1) es un número entero negativo (o nulo), oc = - n, la función hiper- Integrales que contienen funciones hipergeométricas confluentes 701 geométrica se reduce a un polinomio de grado n y puede representarse en la forma F(-n,{1,y,z) = zl-Y(l-z)'r+n-P dn -[z1+n-l(l-z)P-1]. y(y+ 1) ... (y+n-1) dzn (e.10) F(r:1., {3, y, z) se reduce a un polinomio también cuando oc = y+n y cuando oc= n, y = m + 1 (n, m son enteros positivos y n < m). Expresiones explícitas para estos polinomios se pueden obtener, en el primer caso, combinando (e, 10) con (e, 5), y en el segundo, con (e, 9). § f. Cálculo de integrales que contienen funciones Consideremos una integral de la forma f 00 la./ = e-AZzvF(a., y, kz) dz. (f.1) o Supongamos que esta integral converge. Para ello debe ser Re v > - 1 y Re;.> jRejk; si ex es un entero negativo, en vez de la segunda condición basta exigir que sea Re ). > O. > Es fácil calcular la integral (f, 1) utilizando para F(rx, y, kz) la representación integral (d, 9) y efectuando la integración respecto de z antes que la integración de contorno: ff 00 la.yv = 1 r(l-oc)r(y) --. 2m r(y-a.) e--<A-kt)zzv(-t)a.-l(l-t}r-a-1 dtdz C' O 1 r(l-oc)r(y) = -- 21ri X f r(y-oc) ,\-v-1 r(v+ l)x (-t)a.-1 (1-t)r-a.-1(1-kt/,\)-v-1 dt. C' Teniendo en cuenta (e, 3), encontramos finalmente: la./= r(v+l),\-v-IF(oc,v+l,y,k/.\). (f.2) En los casos en que la función F(oc, v+l, y, k/A) se reduce a un polinomio, para la integral J r:1.l se obtienen expresiones en términos de funciones elementales: dn la.../y+n-1 = (-1 )nr(y) d,\n [,\ª-'Y(,\-k)-ª], (f.3) 702 Apéndices matemáticos r(v+ 1)(.\-k)r+n-v-1 dn ]-n,,,V = (-t)n r(r+ 1) ... (y+n-1) d,\n [,\-v-1(.\-k)v-y+l], +ni (m-n-1) ... (m- l).\«-n-1(.\-k)-l+m-n-« dm-n-2 d,\m-n-2 (m, n son números enteros, O < n < m- (f.4) } [,\m-«-1(.\-k)«-1] ; (f.S) 2). Calculemos ahora la integral f 00 ],, = e-kzzv-l[F(-n,y,kz)]2 dz, (f.6) o i, > O). Para ello partiremos de una integral más general que contiene en el integrando e-J.z en vez de e-kz. (n, entero positivo, Re Escribamos una de las funciones F(- n, y, kz) en forma de integral de contorno y efectuemos luego la integración respecto de z mediante la fórmula (f, 3): 00 f o 1 r(l+n)r(y) e-Azzv-l[F(-n,y,kz)]2 dz = - - . X 2m r(y+n) ff 00 X (-t)-n-l(l-t)r+n-le-U.-kt>zzv-lF(-n,y,kz) dtdz OC' 1 r(l+n)r2(y)r(v) =-27Ti(-t)n r2(y+n) X X f dn (.\-kt-k)r+n-v(-t)-n-1(1-t)r+n-l_[(.\-kt)-v(.\-kt-k)v-r] dt. d,\n C' Es evidente que la derivada n-ésima respecto de). se puede substituir por una derivada de igual orden respecto de t; una vez hecho esto, hagamos ). = k, volviendo con ello a la integral lv: 1 r(n+ l)r(v)r2(y) ]v = - X 2Tri r2(y+n)kv f C' dn (-t)r-v-l(l-t)r+n-1-[(l-t)-v(-t)v-r] dt. dtn 703 Integrales que contienen /unciones hipergeométricas confluentes 11 Integrando n veces por partes, transferimos el operador d 11 a Ja expresión (- t)y-v-1 dt (1 - t)Y+ 11- 1 ; desarrollemos luego la derivada según la fórmula de LEIBNITZ. Como resultado se obtiene una suma de integrales cada una de las cuales se reduce a la conocida integral de EuLER. Se llega así finalmente a la siguiente expresión para la integral buscada: ]v= r(v)nl ( kvy(r+ 1) ... (r+n-1) 1+ n(y-v-l)(y-v) + 12y n(n- l)(y-v-Z)(y-v-l)(y-v)(r-v+ 1) + t2z2r(r+ 1) + ... + n(n-1) ... l(y-v-n) ... (r-v+n-1)) + 1222 ... n2,,(y+ 1) ... (r+n-1) · (f.7) Es fácil ver que entre las integrales lv existe la siguiente relación: (y-p-l)(y-p) ... (y+p-1) k2P+l l,y-1-p, ]-y+P = (f.8) (p es un número entero). De manera análoga se calcula la integral J = J e-Azz1-lF(r.1.,y,kz)F(r.1.',y,k'z) dz. (f.9) o Representemos la función F(rx.', y, k'z) como integral de contorno e integremos respecto de z mediante la fórmula (f, 3) (con n = O): !J C() J= 1 rct-r.x')r(y) -Z1ri r(y-r.x') j (-t)a'-l(l-t)1-a'-lzr-le-zU-k'tlF(cx, y, kz) dzdt C' O 1 r(l-cx')r2(y) = --. 2m , f r(y-r.,.) (-t)a'-1(1-t)r-a'-l(,\-k't)ª-1(.\-k't-k)-a dt. C' La substitución t--+ conduce al resultado At k't+1. - k' lleva esta integral a la forma (e, 3), lo que 704 Apéndices matemáticos J = kk' r(y);\a+a'-y(>..-k)-ª(>..-k')-<1.'F ( a rx' y ) . , ' , (>..-k)(>..-k') Si IX (o IX') es un entero negativo, expresión en la forma: J = ix = - (f.10) n, la relación (e, 7) permite escribir esta r2(y)r(y+n-a') ),._-n+a'-'Y(;\-k)n(;\-k')-a'x r(y+n)r(y-rx') ~;\-k-k1) xF ( -n,rx',-n+rx'+1-y,(;\-k)(;\-k') . (f.11) Finalmente, consideremos las integrales del tipo f 00 = ]y8P(rx,rx') e-<k+k,z/2zy-l+sF(rx,y,kz)F(rx',y-p,k'z) dz. (f.12) o Se supone que los valores de los parámetros son tales que la integral es absolutamente convergente; s, p son enteros positivos. La más simple de estas integrales J y°º( IX, ex') es, según (f, 1O), igual a ],'"'(oc, o.') = 2rr(r)(k+k')"+•' -Y(k' -k)-•(k-k')-•'F(... o.', r, 4kk' ) (k' -k)" ; (f, 13) y si IX (o IX') es un número entero negativo, ex= - n, de acuerdo con (f, 11) se puede escribir también J/º(-n, a.') r(y)(y-rx')(y-cx' + 1) ... (y-rx' +n-1) = 2'Y y(y+ 1) ... (y+n-1) X X(-1)n(k+k')-n+<1.'-Y(k-k')n-a'F [ -n, a', cx' + 1-n-y, ( k+k')2] k-k' . (f.14) Se puede deducir una fórmula general para Jy5P(a., a.'), pero es tan complicada, que resulta incómodo utilizarla. Es más conveniente emplear fórmulas de recurrencia que permiten reducir las integrales Jy5P(oc, a.') a la integral con s = p = O. Las reproducimos aquí sin demostrarlas (1). La fórmula (f.15) 1 ( ) 1929. La demostración puede encontrarse. en un trabajo de W. GoRDON, Annalen der Physik, 2, I03J, Integrales que contienen /unciones hipergeométricas confluentes hace posible la reducción de Jy8P(r:x., tX') a la integral con p ] ./+1,0(rJ.., il. 4 1 ) 705 = O. La fórmula = k2-k'2 fü·y(k-k')-ki!.+ k'il. -k'S]j ./º(il., i!.')+ 1 1 +s(y-l+s-2rJ..')J'>'s-1.0(rJ.., rJ..')+2e1. s]r3-LO(rJ.., il. permite luego efectuar la reducción definitiva a la integral con s 1 + 1)} = p = O. (f.16) INDICE ALFABtTICO Acoplamiento es, 290 jj, 290 - Russell-Saunders, 494 - spin-órbita, 517 Airy (Función), 87, 688, 383 Alternación, 251 Amplitud de dispersión, 543 - - (Propiedades analiticas), 568 - de onda, 24 - de probabilidad, 7 - parcial de dispersión, 545 Anchura elástica, 643 - inelástica, 644 Anchuras parciales, 643 Anticonmutación, 113 Antihermítico (Operadores), 18 Aparato, 3 - (Carácter clásico), 27 - (Indicacion~). 26 Aproximación de Bdm, 555 - de Russell-Saunders, 290 Área de impacto, 132, 382 Armónicos esféric06, 232 Atómicas (Unidades), 136 Átomo residual, 273 Átomos, 267 - (Capacidad de combinarse), 333 - (Estado de los electrones), 269 - (Términos espectrales), 268 Auger (Efecto), 301 Autoconjugados (Operadores), 14 - Barrera de potencial, 198 Bessel (Funciones), 124 Bohr (Magnetón), 489 - (Teoría del sistema periódico), 291 - -Somrnerfeld (Regla de cuantificación), 188 Bom (Aproximación), 555 - (Fórmula), 553 Bose (Estadística), 256 - -Einstein (Estadística) 243 Bosones, 243 Breit y Wigner (Fórmulas), 640 «Caída» de una partícula hacia un centro de fuerzas, 132 Caja de potencial, 76 Cálculo de integrales que contienen funciones hipergeométricas confluentes, 701 Caminos de transición, 216 Campo autoconsistente, 269, 274 - central (Movimiento), 118 - - (Movimiento cuasiclásico), 193 - coulombiano (Movimiento), 135, 146 - de Coulomb repulsivo, 143 - homogéneo (Movimiento), 87 - magnético, 486 - - (Densidad de corriente), 502 - - (Ecuación de Schrodinger), 486 - - hornogéneo, 489 - - - (Movimiento), 489 Canal de entrada, 626 Canales de reacción, 626 Capa cerrada, 270 Carácter de la matriz, 402 Caso cuasiclásico, 183, 561 - - (Condiciones en los límites), 186 - - (Función de onda), 183 - - (P:robabilidad de transici0n), 209 Oayley-Klein (Parámetros), 224 Celda, 190 Centro de simetría, 386 Coeficiente de reflexión, 89 - de transmisión, 88 - - de la barrera de potencial, 200 Coeficientes de composición vectorial, 467 - de Klebsch-Gordan, 467 - de Racah, 477 Colisión de· segunda especie, 373 - elástica cuando son posibles los procesos - inelástioos, 626 Colisiones elásticas, 542 - - de electrones rápidos con átomos, 613 - entre partículas idénticas, 605 - inelásticas de electrones rápidos con átomos, 659 Composición de momentos cinéticos (Element06 de matriz), 483 708 Indice alfabético Composición de paridades, 116 Compuestos complejos, 337 Condición de normalización, 8 - de unitariedad en la dispersión, 549 Conexión brusca, 165 Configuración electrónica, 269 Configuraciones (Espacio), 7 - simétricas de una molécula (Estabilidad), 439 Conjugado (Operador), 14 Conmutabilidad (Operadores), 17 Conmutador de dos operadores, 19 Conservativas (Funciones), 33 Constante de Planck, 25 - de rotación, 342 Contravariante de un es-pinor, 224 Coordenada múltiple, 429 Coordenadas parabólicas, 146 - vibracionales (Representación total), 430 - - normales, 429 Coriolis (Interacción), 452 Corrección de Rydberg, 274 Corrimiento de fase, 127 - isotópico, 533 Coulombianas (Unidades), 136 Covariantes, 224 Cuantificación (Grado), 25 - (Segunda), 256, 263 - de la rotación de un sólido, 441 Cuasiclásico (Caso), 561 O.oques inelásticos de partículas pesadas con átomos, 67 5 De Broglie (Longitud de onda), 61 Degeneración accidental, 101, 138, 273 Densidad de corriente, 66 - - de probabilidad, 67 - - en un campo magnético, 502 Derivada (Concepto respecto del tiempo), 31 Desarrollo de uµa onda plana, 130 Desdoblamiento multiplete, 268 - en multipletes, 350 Desintegración prohibida, 117 Diagonales (Elementos de matriz), 38 Diagrama de Y oung, 252 Difracción de electrones, 1 Dispersión (Amplitud), 543 - (Amplitud parcial) 545 - (Condición de unitariedad), 549 - (Longitud), 580 - (Operador), 550 Dispersión (Relaciones), 574 - (Sección eficaz), 543 - (Teorema óptico), 550 - (Teoría general), 542 - con interacción spin-órbita, 618 - de partículas lentas, 578 - de resonancia de partículas cargadas, 608 - - para pequeñas energías, 584 - inelástica de partículas lentas, 633 - nuclear (Modelo óptico), 647 - para grandes energías, 565 - por moléculas, 678 - potencial, 595 - - (Sección eficaz), 645 - resonante, 595 Dobletes apantallados, 300 - irregulares, 300 - regulares, 300 - .relativistas, 300 Duplicación A, 366 Ecuación de onda, 31 - - relativista de Dirac, 489 - de Schrodinger, 59, 246 - - (Propiedades fundamentales), 62 - - en un campo magnético, 486 - de Thomas-Fermi, 279 - secular, 154 Efecto Auger, 301 - Paschen-Back, 496 - Ramsauer, 580 - Stark, 306 - - en el hidrógeno, 311 - - lineal, 311 - Zeeman, 493 - - anómalo, 495 Eje bilateral, 392 - de giro reflejado, 385 - de simetría n-aria, 384 Ejes equivalentes, 392 Electrón (Grado de polarización), 238 - (Medición de las coordenadas), 4 - completamente polarizado, 236 - parcialmente polarizado, 236 Electrones (Difracción), 1 - en un. átomo (Estados), 269 Elemento del grupo, 388 - de matriz, 37 - inverso del grupo, 388 - unidad del grupo, 388 Elementos (Potenciales de ionización), 292 Indice al/abé&ico Elementos conjugados, 390 -- de los grupos de transición, 294 - - principales, 294 - - - (Configuraciones electrónicas), 295 - de matriz (Reglas de selección), 108, 415 - - cuasiclásicos (Cálculo), 204 - - de los tensores, 472 - - de vectores, 107 -- - diagonales, 637 - - para una molécula diatómica, 361 - - reducidos, 109, 474 - diagonales, 38 Energía, 33 - (Niveles atómicos), 267 - centrífuga, 120 - de rotación, 342 - de vibración (Niveles), 436 - potencial como perturbación, 178 - rotatoria, 342 Enlace del tipo ;;, 290 - - LS. 290. - heteropolar, 335 - homopolar, 335 - tipo a, 347 Escala de energía, 123 Escalares en sentido estricto, 11?. Espacio de configuraciones, 7 - isotópico, 507 Espectro continuo, 10, 19 - - (Sistema de las funciones de onda), 600 - de valores propios, 1O - discreto, 10 Espinor unidad, 227 Espinores, 221 - antisimétricos, 228 - de orden superior, 227 - simétricos, 227 Estadística de Bose, 256 - de Hose-Einstein, 243 - de Fermi-Dirac, 243 Estado (Paridad), 111 - cuasiestacionario, 177 - fundamental, 34 - ligado, 36 - normal, 34 Estados cuasiestaéionarios, 592 - de carga, 507 - de ortohelio, 275 - de parahelio, 275 - equivalentes (Electrones), 270 - estacionarios, 33 709 Estados intermedios, 174 - mezclados, 47 - puros, 47 Estructura fina, 348 - - del nivel, 268 - - de niveles atómicos, 286 - hiperfina de los niveles atómicos, 535 - - - moleculares, 539 - - de los térmicos, 360 Estructuras de vibración y rotación en una molécula diatómica, 339 Fase (Corrimiento), 127 - (Factor constante), 8 - de onda, 24 Factor atómico en el modelo Thomas-Fermi, 617 - de fase, 8 - de forma atómico, 615 - de Landé, 495 - giromagnético, 495 Fermat (P.rincipio), 25 Fermi-Dirac (Estadistica), 243 Fcrmiones, 243 Fórmula de Bohr, 273 - de Boro, ~53 - de Rutherford, 597 Fórmulas de Breit y Wigner, 640 Fok (Método), 275 Franke-Condon (Principio), 375 Frecuencia de transición, 37 Frenado eficaz, 670 Fuerzas de van der Waals, 370 - nucleares, 505, 510 - - (Propiedad de saturación), 513 - - (Simetría de carga), 505 - tensoriales, 511 Función de Airy, 87, 383, 688 - de Hankel, 126 - delta, 21 - de onda, 7, 26 - - antisimétrica, 243 - - casi clásica, 25 - - cuasiclásica, 25 - - de coordenadas, 245 - - de spin, 246 - - en el caso cuasiclásico, 183 - - impar, 112 - - par, 112 - - simétrica, 243 - - y medición, 28 - hipergeométrica, 698 - - confluente, 85, 137, 694 710 Indice alfabético Función propia del operador, 232 - radial, 119 Funciones (Sistema cerrado), 10 - (Sistema completo), 1O - conservativas, 33 - de Bessel, 124 - de Legendre asociadas, 86 - de onda (Propiedades espinoriales), 223 - - cerca del núcleo, 285 - - de las partículas de spin arbitrario, 228 - propias, 1O - - del momento cinético, 104 Grado de cuantificación, 25 Grupo (Elemento), 388 - (Elemento inverso), 388 - (Elemento unidad), 388 - (Orden), 389 - abeliano, 389 - del hierro, 295 - - (Configuraciones electrónicas), 296 - del paladio, 295 - - (Configuraciones electrónicas), 296 - de los actínidos (Configuraciones electrónicas), 297 - del ,platino, 295 - - (Configuraciones electrónicas), 2% - de permutactones, 388 - de rotaciones, 419 - - bidimensional, 419 - de simetrías, 388 Grupos (Representaciones), 400 - (Teoría), 3,88 - ciclkos, 389 - continuos, 419 - de simetría axil, 419 - - esférica, 419 - de transformaciones, 388 - de transición (Elementos), 294 - finitos, 388 - isomorfos, 391 - principales (Elementos), 294 - puntuales, 391 - - (Representaciones irreducibles), 408 - - continuos, 400, 419 - - dobles, 423 - - finitos (Representaciones bivalentes), 422 Hamilton (Operador), 30 - (Principio), 25 Hamiltoniano del sistema, 31 Hankel (Función), 126 Heisenberg (Representación), 44 Hermite (Polinomios), 82, 685 Hermítico (Operador), 14 Hidrógeno (Efecto Stark), 311 Hoja física de la superficie de Riemann, 569 - no física de la superficie de Riemann, 569 Hund (Regla), 270 Iconal, 24 Impacto (Parámetro), 132 Impulso, 49 Indeterminación (Principio), - (Relaciones), 54 Indicaciones del aparato, 26 índice de spin, 218 índices mudos, 97 Indistinguibilidad (Principio), 242 Instante de transición, 213 Integral de intercambio, 249 Intensidades de. los osciladores, 673 Interacción (Radio efectivo), 588 - de átomos a grandes distancias, 369 - de Coriolis, 452 - de intercambio, 245 - de las vibraciones y de la rotación de una molécula, 449 - en el estado final en el caso de reacciones, 649 - spin-eje, 347 - - -órbita, 286 - - -spin, 286 Intercambio (Integral), 249 Intersección de términos electrónicos, 323 Invariancia ~otópica, 505 Inversión del tiempo, 238 Inversos (Operadores), 17 Isomorfismo, 391 Isotropía, 95 Klebsch-Gordan (Coeficientes), 467 Kramers (Teorema), 240 Laguerre {Polinomios generalizados), 138 Landé (Factor), 495 - (Regla de intervalos), 28,8 Laplace (Método), 685 Legendre (Polinomios), 105, 691 - (Polinomios asociados), 105 Ley de composición de momentos cinéticos, 114 - de conservación de la paridad, 112 Indice al/abético Longitud de dispersión, 580 - de onda de De Broglie, 61, 194 Magnetón de Bohr, 489 Magnetones nucleares, 489 Magnitudes físicas, 6 Masa de la partícula, 59 - reducida, 118 Matriz (Carácter), 402 - (Elementos), 108 - (Elementos reducidos), 109 - de dispersión en las reacciones, 636 - de la transformación, 400 - densidad, 45 - - (Elementos diagonales), 47 - - de spin, 237 - de una magnitud física, 40 - reducida a la forma diagonal, 40 - S, 550 Matrices, 36 - (Regla de multiplicación), 39 - {Transformación), 42 - de Pauli, 222 - hermíticas, 38 Mecánica cuá,ntica, 2 - ondulatoria, 2 Medición, 3 - (Proceso), 4 - de las coordenadas del electrón, 4 Mediciones predecibles, 6 Mendeleev (Sistema periódico), 291 Método de Laplace, 685 Modelo de capas, 515 - óptico, 649 - - de dispersión nuclear, 647 - Thomas-Fermi (Factor atómico), 617 - vectorial, 116 Molécula (Función de onda), 360 - diatómica, 320 - - (Elementos de matriz), 361 - - (Perturbaciones en el espectro), 381 - - (Términos electrónicos), 320 Moléculas poliatómicas, 428 Momento cinético, 95, 121 - - (Funciones propias), 104 - - (Valores propios), 100 - - orbital, 217 - - - total, 220 -- - propio, 217 - - vibratorio, 450 - cuadripolar, 302 - dipolar, 302 711 Momentos (Suma), 114 - cinéticos (Elementos de matriz en la composición), 483 - - (Ley de composición), 114 - multipolares, 302 Movimiento cuasiclásico en un campo central, 193 - cuasiperiódico, 192 - del núcleo, 217 - de un campo coulombiano, 135 - en una dimensión (Propiedades generales), 71 - en un campo central, 118 - - - coulombiano (Coordenadas parabólicas), 146 - -- - homogéneo, 86 - libre, 122 M ultiplete invertido, 289 Multipletes normales, 289 Multiplicación de espinores, 227 Multiplicidad del término, 268, 321 Muro de potencial, 88 Nivel cuasidiscreto, 589 - - (Resonancia), 591 - virtual, 587 Niveles atómicos (Estructura fina), 286 - - (Estructura hiperfina), 535 - - de energía, 267 - de energía degenerados, 34 - - de vibración, 436 - - hidrogenoides, 273 - energéticos, 34 - moleculares (Estructura hiperfina), 539 Nodos, 70 Normalización (Condición), 8 Núcleo compuesto, 640 - del operador, 13 - inmóvil, 528 - residual, 530 Nucleón (Operador de carga), 509 Nucleones, 505 Núcleos doblemente mágicos, 521 - espejos, 505 - no esféricos, 527 Número cuántico acimutal, 121 - - magnético, 121 - - parabólico, 148 - - principal, 138, 148, 269 - - radial, 121 - - vibratorio, 342 - de onda, 122, 190 712 Indice alfabético Números de ocupación, 257 - mágicos, 521 Onda (Amplitud), 24 - (Ecuación), 31 - (Pase), 24 - (Función), 7, 26 - (Número), 190 - esférica convergente, 126 - - divergente, 125 - - estacionaria, 125 - plana (Desarrollo), 130 Ondas planas estacionarias, 72 Operador (Núcleo), 13 - antihermHico, 18 - conjugado, 14 - de carga del. nucleón, 509 - de creación, 259 - de destrucción, 258 - de dispersión, 550 - de Hamilton, 30 - de wtación, 95 - - infinitesimal, 95 - hamiltoniano, 31 -- hermítico, 14 - impulso, 50 - matemático, 12 - transpuesto, 14 Operadores, 9 - (Derivación respecto del tiempo), 31 - (Potencia), 17 · - (Producto}, 16 - (Suma), 15 - autoconjugados, 14 - de spin, 218 - del momerito cinético total, 220 - en la representación de Heisenberg, 44 - inversos, 17 - que conmutan, 17 Orbital, 246 Orden del grupo, 389 Ortogonalidad de las funciones, 12 Ortohelio (Estados), 275 Ortohidrógeno, 361 Ortonormal (Sistema), 12 Oscilación (Teorema), 72 Oscilador lineal, 79 - - (Hamiltoniano), 79 Osciladores ('Intensidades), 673 Paquete de ondas, 25 Parahelio (Estados), 275 Parahidrógeno, 361 Parámetro de impacto, 132, 382, 542 Parámetros (Separación), 147 - de Cayley-Klein, 224 Paréntesis de Poisson, 32 Paridad (Ley de conservación), 112 - de un estado, 111 Partícula cuasiclásica, 185 - de medida, 176 Partículas cargadas (Dispersión de resonancia), 608 - idénticas, 242 - - (Colisiones), 605 - lentas (Dispersión), 578 - - (Dispersión inelástica), 633 Paschen-iBack (Efec:Jo), 496 Paso al límite, 24 - a través de una barrera de potencial, 198 Pauli (Matrices), 222 - (Principio), 243 Permutación impar, 251 - par, 251 Permutaciones (Simetría}, 250 Perturbación periódica (Transiciones provocadas), 170 Perturbaciones, 151 - (Teoría), 150 - adiabáticas, 213 - dependientes del tiempo, 159 - en el espectro de moléculas, 381 - independientes del tiempo, 150 Peso estadístico, 360 - - nuclear, 456 Planck (Constante)_. 25 Plano de simetría, 385 Poisson (Paréntesis}, 32 Polarización parcial de las partículas, 236 Polinomios asociados de Legendre, 105, 691 - de Hermite, 82, 685 - de Legendre, 105, 691 - generalizados de Laguerre, 696 Polos redundantes, 573 Potencia de operadores, 17 Potencial (Pozo), 75 Potenciales retardados, 178 Pozo de potencial, 75 Principio de Fermat, 25 - de Frank-Condon, 375 - de Hamilton, 25 - de indeterminación, 1 - de indistinguibilidad, 242 - de la mínima acción, 25 - del equilibrio detallado, 639 Indice al/abético Principio de Pauli, 244 - de relatividad de Galileo, 59 - de superposición, 7 - - de los estados, 9 - variacional, 68 Predisociación, 373 Probabilidad de transición en el caso cuasiclásico, 209 Producto antisimétrico, 406 - de operadores, 16 - simétrico, 406 Productos simetrizados, 18 P·ropiedad de saturación de las fuerzas nucleares, 513 Pseudoescalares, 112 Punto de transición, 209 Puntos de retroceso, 185 Racah (Coeficientes), 477 Radio de Bohr, 136 efectivo de la interacción, 588 Ramsauer (Efecto), 580 Reflexión (Coeficiente), 89 - por encima de la barrera, 209 - total, 89 Regiones clásicamente inaccesibles, 185 Regla de cuantificación de Bohr-Sommerfeld, 188 - de intervalos de Landé, 288 - de Hund, 270 Reglas de selección para los elementos de matriz, 4IS Relación de indeterminación para la energía, 175 - entre espinores y tensores, 231 - entre términos moleculares y atómicos 327 ' Relaciones de dispersión, 574 - de indeterminación, 54 Representaciones bivalentes de los grupos puntuales finitos, 422 - de grupos, 400 (Base), 401 - (Dimensión), 401 equivalentes, 402 - irreducibles, 403 - - de los grupos puntuales, 408 - reducibles, 403 - regulares, 405 - unidad, 406 Resonancia en un nivel cuasidiscreto, 591 Rotación (Constante), 342 713 Rotación (Energía), 342 - de un sólido (Cuantificación), 441 Rotador (Sistemas), 342 Russell-Saunders (Aproximación), 290 Rutherf ord (Fórmula), 597 Schrodinger (Ecuación), 246 Sección eficaz de dispersión, 543 - potencial, 645 - - de reacción, 627 - de transporte, 558 - - parcial, 545 Secciones eficaces cerca del umbral de reacción (Comportamiento), 652 Secular (Ecuación), 154 Segunda cuantificación, 256, 263 Simbolismo, 121 Simbolo-9 j, 481 Símboios-3 nj, 482 -3 ;. 463 - -6j, 475 Simetría (Centro , 386 - (Plano), 385 - (Teoría), 3,84 (Transformaciones), 384 - de carga, 505 de los términos moleculares, 358 - respecto de las permutaciones, 250 Simetrías {Grupos), 388 Sistema cerrado de funciones, 1O - completo de funciones, 1O - cuasiclásico, 25 de las funciones de onda del espectro continuo, 600 - físico, 5 - ortonormal, 12 - periódico de los elementos, 291 Sistemas completos, 6 Simetrización, 251 Simetrizados (Productos), 18 Spin, 217 (índice), 218 - (Operadores), 218 - (Variable), 218 - en un campo magnético variable, 500 - isotópico, 507 - nuclear, 519 - -órbita (Acoplamiento), 517 - total, 220 Stark (Efecto), 306 Subgrupo, 389 Subsistemas, 483 714 Indice alfabético Suma de momentos, 114 - de operadores, 15 Superposición (Principio), 7 Tensor axil unidad, 97 - esférico, 472 - irreducible, 233 - métrico, 224 - unidad anti.simétrico, 97 Tensores (Elementos de matriz), 472 Teorema de Kramers, 240 - de oscilación, 71 - de reciprocidad, 551 óptico de la dispersión, 550 Teoría de grupos, 388 - de la simetria, 384 de perturbaciones, 150 Término antisimétrico, 360 - simétrico, 360 Términos de rayos X, 299 - electrónicos (Intersección), 323 - - de la molécula, 320 - espectrales de átomos, 268 - moleculares (Clasificación), 454 - - (Simetría), 358 - - y átomos (Relación), 327 - multiplete, 347 - - Caso a., 347 - Caso b, 347, 351 - - Casos e y d, 3SS - negativos, 353 - positivos, 3'58 Thomas-Fermi (Ecuación), 279 Tierras raras, 298 - - (Configuraciones elect'l'ónicas), 297 Tipo jj (Enlace), 290 - LS (Enlace), 290 Transformación (Matriz), 400 - de inversión, 111 de matrices, 42 - idéntica, 384 Transformaciones (Grupos), 388 - binarias, 224 - de simetría, 384 Transición, 37 prohibida, 663 Transiciones debidas a perturbaciones adiabáticas, 213 - debidas a una perturbación, 164 en el es,PeC:tro continuo, 172 - provocadas por una perturbación periódica, 170 Transmisión (Coeficiente). 88 Transpuesto (Operador), 14 Trayectoria de la transición, 209 Trayectorias complejas, 567 Traza de las matrices, 43 Trompo, 442 - asimétrico, 443 - esférico, 442 simétrico, 443 Umbral de reacción, 652 Unidad atómica de carga, 136 - - de energía, 136 - - de longitud, 136 Unidades atómicas, 136 - coulombianas, 136 Valencia, 331 Valor medio, 12 Valores propios, 10 - del momento cinético, 100 Van der Waals (Fuerzas), 370 Variable de spin, 218 Variación adiabática, 165 Vibraciones moleculares (Clasificación), 428 Wigner (Símholos-3 j), 465 Young (Diagrama}, 252 Zeeman (Efecto), 493