Kitabı oku: «La teoría de la relatividad y los orígenes del positivismo lógico», sayfa 2
Capítulo 1
LA TEORÍA DE LA RELATIVIDAD
Un escéptico Einstein reflexionaba que quizás se hubiera evitado malentendidos entre los legos y cientos de explicaciones si hubiera llamado a su teoría la de las igualdades en vez de relatividad, pues el público había creído que bajo la palabra relatividad la teoría proponía un confuso relativismo en el que todo valía y todo era posible en vez de un principio de relatividad, un principio esencial para poder establecer leyes físicas válidas para la totalidad de la Naturaleza, un principio con el que había conseguido integrar bajo una única pauta todos los campos de la física.
La física ha de garantizar la objetividad de la descripción de los fenómenos. Sólo sobre rasgos físicos permanentes puede obtenerse la base suficiente para el establecimiento de leyes que sean las mismas para cualquier observador y válidas en toda la Naturaleza. Un rasgo físico que no resulta alterado para distintos observadores se denomina invariante y todo principio que señale cuáles son los invariantes es un «principio de relatividad». La formulación de un principio de relatividad constituye la tarea esencial de la física, el principio al que todas las leyes deben ajustarse.
Dado que para la física un observador es equivalente a un sistema de referencia, es decir, a un eje de referencia espacial y temporal respecto a los que describir un fenómeno, un principio de relatividad equivale a un conjunto de transformaciones que hacen que una propiedad invariante lo sea en todos los sistemas de referencia y, por tanto, que una ley física aparezca como invariante para cualquier sistema de referencia. Un principio de relatividad garantiza, en último término, que no existe ningún sistema privilegiado para la observación de la Naturaleza y que desde todos los sistemas podemos alcanzar leyes equivalentes. La historia de la física será la historia de la extensión del principio de relatividad a medida que un conocimiento más profundo de la Naturaleza hacía cada vez más compleja la transformación entre sistemas.
Existen diferentes casos a los que aplicar un principio de relatividad entre los sistemas de referencia. El caso más elemental sería aquel en que los observadores se encuentran en reposo frente a una Naturaleza estática. El principio de relatividad indicaría las propiedades geométricas de los fenómenos que se mantienen en los diferentes puntos de vista posibles. Si el fenómeno observado no fuera estático y sufriera cambios o estuviera en movimiento, deberíamos contar en su descripción con el tiempo para lo cual los distintos observadores sincronizarían sus instrumentos de medición del tiempo.
La segunda posibilidad es que los observadores estén en movimiento. Este era el caso fundamental en la mecánica newtoniana al que aplicar un principio de relatividad. El principio estaba restringido al caso en que los observadores se encontraran entre sí en movimiento uniforme, pues sólo para un sistema en movimiento uniforme o sistema inercial es posible referir todas las invariantes fundamentales de la física clásica. Así, la fórmula fundamental de la mecánica newtoniana (F = m dv/dt) es idéntica en todos los sistemas inerciales, proporcionando los mismos valores a las invariantes «masa» y «fuerza». Precisamente por ser ésta la condición, el principio de relatividad de la física clásica es conocido como principio de relatividad de Galileo por ser él quien formuló el principio de inercia en el que se basa la definición de sistema inercial. Las ecuaciones de transformación entre sistemas se conocen por tanto como galileanas.
Para su funcionamiento, las transformaciones galileanas necesitan que se cumplan dos condiciones: la validez de la geometría euclidiana y la existencia de una simultaneidad absoluta entre dos sistemas cualesquiera. La validez de la geometría euclidiana garantizaba la invariabilidad de las longitudes y la indeformabilidad de las varas de medir sin importar la velocidad del movimiento al que se encuentran sometidas. Todos los cuerpos son, en la mecánica clásica, rígidos a cualquier velocidad. La congruencia entre dos longitudes en dos puntos cualesquiera del espacio es total y éste se considera que es homogéneo e isotrópico. La coincidencia en las experiencias realizadas en un contexto de bajas velocidades y débiles campos gravitatorios convirtió este supuesto en un principio a priori por encima de cualquier comprobación experimental.
En cuanto a la simultaneidad absoluta entre dos sistemas inerciales, no importa su situación o velocidad, permite establecer un tiempo común y sincronizar sus relojes para equiparar sus descripciones temporales del fenómeno observado. Esta simultaneidad absoluta quedó entronizada en el concepto de tiempo absoluto newtoniano: un reloj definitivo con respecto al que establecer la sincronía entre todos los sistemas.1
Para dos sistemas próximos la simultaneidad es indudable. Cuando su separación se incrementa, la forma de sincronizarlos implica la transmisión de una señal de una posición a la otra, descontando el tiempo tardado por la señal en ir del sistema S al S’ y viceversa. Dada la isotropía del espacio euclidiano, la señal tardará lo mismo en ambos recorridos. Así, siendo tA1 el instante en que se transmite la señal desde S y tA2 en el que regresa de S’, el tiempo del sistema S’ (tB) será el tiempo medio de tA1 + tA2. No obstante, la sincronía entre los dos sistemas desaparecerá en el caso que la velocidad de estos sea tal que, cuando la señal alcanza a S’ desde S, éste ya se ha desplazado en el intervalo que ha costado a la señal marchar de S a S’: en un caso, a la velocidad de la señal se le suma la del sistema que avanza en su misma dirección y en el otro se le restará. Por tanto, cuanto más se incremente la velocidad de un sistema, tanto más debería hacerlo la velocidad de la señal para mantener la simultaneidad absoluta. Aunque se utilizaba en la física clásica la velocidad de la luz como señal, la única forma de mantener la simultaneidad absoluta para cualquier velocidad de un sistema inercial era en realidad que la señal tuviera una velocidad infinita que la transmitiera instantáneamente.2 En las bajas velocidades de la mecánica clásica la velocidad de la luz cumplía adecuadamente este papel pero no ocurrirá lo mismo cuando se tengan en cuenta las enormes velocidades de los fenómenos electromagnéticos.
Bastaba el cumplimiento de estas dos condiciones para que los conceptos centrales de la mecánica newtoniana (espacio, tiempo, masa y aceleración) fuesen invariantes en las transformaciones galileanas y las leyes de la mecánica que relacionan estos conceptos actuarán por igual en todos los sistemas inerciales. Así, la mecánica quedó definitivamente sometida a un principio de relatividad.
De la igualdad de las leyes de la mecánica para los sistemas inerciales de la física clásica surge la que se denomina «relatividad newtoniana». No es posible, por ningún experimento mecánico realizado en un sistema inercial, obtener el estado de movimiento del sistema con respecto a otro. Así, un observador no puede determinar con un experimento mecánico interno si es la Tierra o el tren donde se encuentra quien se mueve. Esa posibilidad, sin embargo, le era ofrecida a Newton por el espacio absoluto transformado en un sistema inercial privilegiado que infringía su propio principio de relatividad y en el que se consideraba que las leyes actuaban en forma perfecta.3 El espacio absoluto, además de ser un sistema inercial privilegiado, ofrecía otra ventaja a la física: constituirse en una estructura que daba una posibilidad permanente de ordenación.
La aparición del electromagnetismo a finales del siglo XIX con su aceptación de velocidades inconmensurablemente superiores a las de la física clásica planteó el reto de extender el principio de relatividad a ese nuevo campo. Fueron precisamente los problemas que generará este intento el preludio de la teoría de la relatividad. La gran tarea de Einstein será extender el principio de relatividad a este nuevo campo y posteriormente generalizar el principio de relatividad a todos los sistemas posibles en física culminando así la tarea histórica de la ciencia de la búsqueda de invariantes universalmente válidos para todas las circunstancias y todo tipo de sistemas.
1. La hipótesis del éter
La admisión de la existencia del éter fue resultado del intento de extender la mecánica newtoniana al electromagnetismo. El electromagnetismo era el campo fundamental de investigación de los físicos en el siglo XIX. El concepto de campo electromagnético sirvió a la física a finales de ese siglo para completar una tarea de unificación con la que consiguió organizar a la electricidad, el magnetismo, la gravedad y la luz en un marco común, demostrando la unidad de unos fenómenos que inicialmente se habían pensado diferentes. La unión posterior del concepto de campo electromagnético al concepto de energía lo transformó en el concepto unificador por excelencia de la física. El electromagnetismo era, además, una vía de repercusiones tecnológicas de gran importancia al facilitar la creación de electricidad en forma masiva y barata, la energía sustituta del vapor en la nueva etapa de la industrialización.
La tarea de unificación conseguida con el concepto de campo electromagnético comenzó en 1820 cuando Hans Christian Oersted demostró la vinculación entre los fenómenos eléctricos y magnéticos al desviar una aguja imantada por el paso de una corriente eléctrica. Michael Faraday (1821) concluyó que la fuerza ejercida por la corriente sobre la aguja era de naturaleza circular, creando una serie de líneas de fuerza a la que denominó campo magnético. Fue el mismo Faraday quien descubrió (1831) la inducción electromagnética o producción de corriente eléctrica por la variación del campo magnético. Aparecía así constituido el campo electromagnético.
James Clerk Maxwell dio un nuevo paso durante los años 1880-1890 al conseguir justificar que la luz era un fenómeno electromagnético. Maxwell calculó que las ondas electromagnéticas irradiadas por el campo tenían la misma velocidad que la de la luz en el vacío. Por último, Heinrich Hertz (1887) señaló que las ondas electromagnéticas irradiadas por una corriente eléctrica oscilante tenían las mismas características que la luz (reflexión, refracción, interferencia, velocidad, polarización, etc.) aunque no la de visibilidad por estar muy por debajo de la frecuencia necesaria.4
Cuando se aplicó la mecánica newtoniana al electromagnetismo, resultaba más conveniente para los físicos suponer un medio material en el que las ondas electromagnéticas se propagasen que aceptar que, a diferencia de todas las ondas conocidas, su propagación no se realizase en medio alguno. Este fue el origen de la hipótesis del éter, hipótesis que adquirió una gran importancia cuando se comprobó que no era posible aplicar las transformaciones galileanas a los fenómenos electromagnéticos, es decir, que en el electromagnetismo no se mantenían las invariantes de la mecánica newtoniana. Se pensó conservar los postulados esenciales de la mecánica newtoniana mediante la transformando el éter en un sistema inercial privilegiado en reposo absoluto respecto del cual todos los sistemas se mueven. El éter pasaría a ser así el sustituto del espacio absoluto newtoniano, el único sistema donde la luz tiene velocidad c5 y, por tanto, el sistema de referencia respecto del que medir la velocidad absoluta de un sistema inercial.
Inicialmente, se mantuvo la existencia de distintos éteres encargados unos de la transmisión de la luz y otros de las ondas electromagnéticas. El éter lumínico había sido originariamente formulado por Newton, que le concedió unas propiedades mecánicas perfectas destinadas a justificar en su teoría corpuscular la reflexión y refracción de la luz.6 El éter lumínico explicaba con su extraordinaria elasticidad la fuerza gravitatoria. Sus propiedades eran incomparables: su capacidad de vibración hacía avanzar a la luz a su enorme velocidad gracias a la posesión de una fuerza elástica 490 millones de veces superior a la del aire, al mismo tiempo su resistencia a ser atravesado era nula al ser 700 mil veces menos denso que el aire. Todos los cuerpos se encuentran sumergidos en él, incluidos nuestros nervios que, por su mediación, reciben las sensaciones. La aparición de la teoría ondulatoria de la luz de Young y Fresnel (1800-1820) no modificó las características del éter lumínico.
Fue Maxwell quien unificó todos los éteres al demostrar la naturaleza electromagnética de la luz. El éter pasó a ser un único medio propagador de todos los fenómenos electromagnéticos. El éter se extiende por el universo entero, en él se encuentran sumergidos todos los cuerpos y sus propiedades mecánicas le hacen capaz de transmitir la luz a la velocidad c. La inmovilidad del éter parecía confirmarse por el hecho de la aberración de la luz estelar.7 Era, por tanto, lógico tratar de detectar el movimiento de la Tierra a través de él: el viento del éter tendría una velocidad respecto de la Tierra igual a la velocidad orbital de la Tierra alrededor del Sol. Este experimento confirmaría definitivamente su existencia material y consolidaría las características que se le otorgaban como sustrato del campo electromagnético. Era, de alguna forma, su localización.
El experimento destinado a completar la localización del éter fue el experimento de Michelson-Morley. Un resultado positivo del experimento significaría la culminación de la física clásica, una situación muy próxima a una explicación total de la Naturaleza a través del concepto central de campo electromagnético del que el éter era su base material. En un principio, se esperó obtener resultados de primer orden del movimiento de la Tierra, pero no fueron detectados. La utilización del interferómetro, descubierto por Michelson, permitía registrar efectos de segundo orden (una desviación de una parte entre cien millones) en la velocidad de la luz a favor y en contra del movimiento terrestre en el éter. Sin embargo, la velocidad de la Tierra no restaba ni sumaba nada a la velocidad de la luz. El experimento se repitió en 1881 y 1887 y el resultado fue nulo más allá de toda duda razonable,8 debido a la precisión incomparablemente superior a la de los experimentos mecánicos con que pueden realizarse los experimentos electromagnéticos.
2. La relatividad especial: las transformaciones de Lorentz
No fue, sin embargo, el resultado del experimento de Michelson-Morley lo que llevó a Einstein a la formulación de la relatividad especial en 1905, sino más bien una reflexión sobre la teoría electromagnética de Maxwell y la necesidad de que las leyes del electromagnetismo, y no sólo las de la mecánica, fuesen invariantes para todos los sistemas inerciales.9
La búsqueda de Einstein iba más allá de la justificación del experimento nulo de Michelson-Morley, era la búsqueda de un principio de relatividad más amplio que el de la física clásica. Este principio de relatividad se presenta como una generalización del existente en la mecánica newtoniana al exigir que todas las leyes de la física, y no sólo las de la mecánica, sean invariantes para los sistemas inerciales. Del principio se deduce, como consecuencia inmediata, la constancia de la velocidad de la luz en el vacío.10
Si supusiéramos un sistema inercial con velocidad c, un observador situado en él registraría la velocidad de la luz como cero, apareciendo ésta como un campo electromagnético oscilatorio en reposo, lo cual es contradictorio con las leyes de Maxwell. Si queremos mantener un principio de relatividad que englobe las leyes del electromagnetismo de Maxwell y Faraday, la luz no puede estar sometida a la suma de velocidades de la mecánica clásica: su velocidad en el vacío debe ser constante para todos los sistemas inerciales. La constancia de c y la validez de todas las leyes físicas universales para los sistemas inerciales son los dos postulados que constituyen el principio de relatividad restringida.11
La constancia de la velocidad de la luz explica el resultado nulo del experimento de Michelson-Morley y permite la eliminación del éter: no es necesario ningún sistema inercial privilegiado en reposo para conseguir mantener la validez de las leyes de la física. La eliminación del éter será uno de los pasos en el proceso de simplificación que genera el principio de relatividad de Einstein.
La simultaneidad absoluta será el segundo de los elementos a simplificar. Por simultaneidad entiende Einstein la posibilidad de señalar la coincidencia entre dos acontecimientos. Cuando Einstein discute la situación del tiempo absoluto a la luz del principio de relatividad restringida, no discute el estatus metafísico del tiempo sino su utilización en las mediciones que realiza la física para señalar la simultaneidad entre los acontecimientos físicos. Esto supone el uso de relojes, es decir, de dispositivos físicos que registran el paso del tiempo. Cuando afirmamos: «este tren llega a las siete en punto», queremos decir algo semejante a: «la posición de las manecillas del reloj exactamente en las siete y la llegada del tren son acontecimientos simultáneos». La simultaneidad entre dos puntos depende de nuestra capacidad de establecer una escala de tiempo en común, de sincronizar los relojes de manera que un acontecimiento coincida simultáneamente con la misma posición de los indicadores de dos relojes distintos.12
Si dispusiéramos de una señal con velocidad infinita, conseguiríamos fácilmente la sincronización entre relojes situados en distintos sistemas inerciales de referencia. El principio de relatividad restringida convierte a la luz y su velocidad en el vacío en velocidad límite: al ser su velocidad en el vacío una constante, no puede existir ningún sistema inercial que sume (o reste) su velocidad a la de la luz. Cualquier método de sincronización está limitado a la velocidad de la señal más rápida posible. En consecuencia, a pesar de la enorme velocidad de la luz, las velocidades contempladas en el electromagnetismo son de tal magnitud que justifican la pérdida de sincronía entre dos sistemas en movimiento uniforme que recurren a ella para su sincronización. La simultaneidad será relativa al sistema y ya no podrá hablarse de una simultaneidad absoluta entre todos los sistemas.
Dado que la simultaneidad es relativa, también lo serán las medidas de longitud de los distintos sistemas. Medir la longitud de un objeto supone señalar simultáneamente sus extremos. La invariabilidad de las longitudes en la física clásica estaba respaldada por la simultaneidad absoluta; su desaparición supone que no podemos tampoco hablar de coincidencia entre las diversas unidades de longitud de los sistemas.
Einstein buscó las ecuaciones que le permitirían transformar las coordenadas de un fenómeno físico de un sistema inercial S a S’ y viceversa. La condición a mantener era la homogeneidad (isotropismo) del espacio y del tiempo, que garantiza que los resultados de la medición de una longitud o de un intervalo de tiempo entre dos acontecimientos es siempre el mismo dentro de un sistema de referencia. La homogeneidad garantiza la unicidad de los resultados del sistema y, en consecuencia, su transformación a otro sistema. El resultado del cumplimiento de esta condición de homogeneidad supone la deducción, a partir del principio de relatividad restringida, de las ecuaciones de transformación. Estas resultaron ser las que Lorentz definió para el campo electromagnético. Tras definir las ecuaciones de transformación de Lorentz, se demuestra que las leyes de la mecánica y las del electromagnetismo son invariantes. Será, en el curso de esta revisión de la mecánica, cuando la necesidad de redefinición de la ley del impulso newtoniana para que sea invariante llevará a una nueva definición de masa. En la mecánica clásica la masa de un cuerpo se mantenía constante a cualquier velocidad. Sin embargo, hemos visto que sólo en condiciones de reposo podemos garantizar la invariancia en la longitud o en el tiempo pues estos conceptos varían según la velocidad. Habrá que suponer que, como aquellos, la masa también varía en función de la velocidad del cuerpo. La redefinición de masa arrastra la de los conceptos de fuerza, trabajo y energía. Es este el camino que conduce a la equivalencia entre masa y energía expresada en la fórmula E = mc2. De hecho, y como ocurre con el espacio y el tiempo, la masa y la energía forman una sola invariante: la masa-energía. Los principios de conservación de la masa y la energía se funden en el único principio de conservación de la masa-energía. Este mismo proceso de simplificación le lleva a enlazar la densidad de corriente y de carga.13
Pero la unión del espacio y el tiempo fue la simplificación más espectacular de la nueva teoría. En la física clásica, la coordenada de tiempo no era afectada por la transformación de un sistema inercial a otro. Sin embargo, en la transformación de Lorentz, el espacio y el tiempo son interdependientes. En la relatividad especial (y en la general) el espacio y el tiempo aparecen conjunta e indisolublemente tratados como espacio-tiempo. El primero que fue capaz de demostrar geométricamente esta unión fué Hermann Minkowski en 1908.
Minkowski se refiere al espacio-tiempo como «el mundo». Lo llama así para no utilizar en su geometría el nombre matemático más vago de variedad y diferenciar con claridad la geometría resultante de los elementos geométricos propios del espacio euclidiano. En el mundo de Minkowski no hay objetos, sólo acontecimientos. Un punto del mundo es un acontecimiento. Una partícula será una sucesión de acontecimientos o línea-mundo. Las leyes de la física expresan la relaciones entre partículas como relaciones geométricas entre líneas-mundo. El concepto de «acontecimiento» se incorporará a todas las construcciones fenomenalistas de la realidad, una señal inequívoca de la aceptación de las condiciones relativistas como las condiciones imprescindibles en cualquier intento de construir lógicamente el mundo que nos rodea desde la percepción.
El aspecto más sobresaliente del espacio Minkowski es que es un espacio cuatridimensional, al unir indisolublemente las tres coordenadas del espacio euclideano y la coordenada de tiempo. Esta cuatridimensionalidad dificulta su significación psicológica por nuestra incapacidad de representación mental, pero no su significación física. De hecho, el número de coordenadas no puede aumentarse arbitrariamente, pues son las coordenadas necesarias para representar el entramado relativista de las leyes de la física. La geometría del espacio Minkowski tiene como objetivo representar adecuadamente una determinada situación física puesta de relieve por la teoría de la relatividad
En el espacio-tiempo, existe una unidad que mantiene su invariancia entre los sistemas y que viene a sustituir al espacio y al tiempo absoluto de la mecánica clásica. Esta unidad es el intervalo espacio-temporal: las unidades de longitud y los intervalos de tiempo sufren deformación al pasar de S a S’ y viceversa, pero el intervalo espaciotemporal señalado en S valdrá para S’ y al contrario. Aunque la distancia que separa los dos puntos en que se producen dos acontecimientos y su diferencia temporal depende del sistema inercial del observador, no ocurre lo mismo con el intervalo espacio-temporal entre los dos acontecimientos. El mantenimiento de una estructura espacio-temporal de la realidad era la garantía de medidas objetivas en física. Así, el espacio-tiempo mantenía la homogeneidad característica de la geometría euclidiana aunque perdía la ortogonalidad. La perdida de la ortogonalidad infringiría los postulados III y IV de Euclides, que mantienen respectivamente la invariabilidad de la dimensión de un segmento cuando es trasladado en el espacio y la igualdad de los ángulos rectos adyacentes producidos por el corte de dos líneas rectas. La métrica del espacio Minkowski por tanto no es euclidiana y sus elementos geométricos básicos tampoco al infringir los axiomas euclídeos.14