instituto heisenberg anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf ·...

115
Instituto Heisenberg Anuario 2005

Upload: haminh

Post on 03-Mar-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg

Anuario 2005

Page 2: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

UNIVERSIDAD DE COLIMA

MC. Miguel Angel Aguayo Lopez, Rector / Dr. Ramon Cedillo Nakay, Secreta-rio General / Lic. Juan Diego Suarez Davila, Coordinador General de ExtensionCultural / Licda. Guillermina Araiza Torres, Directora General de Publicaciones

Page 3: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

instituto ~ eisenberg

ANUARIO 2005

Alfredo Aranda FernandezEditor

Page 4: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

iv

c© 2005 Derechos ReservadosUNIVERSIDAD DE COLIMAAvenida Universidad 333Colima, Col., CP 28040

ISBN:

Impreso y hecho en Mexico/Printed and made in Mexico

Page 5: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Indice general

Introduccion XI

1. ¿Por que generacion Albert Einstein? 1

2. Curso de Fısica 5

2.1. Introducion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72.2. Efecto fotoelectrico . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2.2.1. La solucion de Einstein . . . . . . . . . . . . . . . . . . . . 82.3. Relatividad especial . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.3.1. Tranformaciones de Lorentz . . . . . . . . . . . . . . . . . . 102.3.2. Contraccion de la longitud . . . . . . . . . . . . . . . . . . . 132.3.3. Dilatacion del tiempo . . . . . . . . . . . . . . . . . . . . . 152.3.4. Confirmacion experimental de la relatividad especial . . . . 15

3. Curso de Matematicas 17

3.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193.2. Grupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

3.2.1. Ecuaciones algebraicas . . . . . . . . . . . . . . . . . . . . . 213.2.2. Definicion de grupo . . . . . . . . . . . . . . . . . . . . . . 233.2.3. Grupos finitos . . . . . . . . . . . . . . . . . . . . . . . . . . 24

3.3. Permutaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283.3.1. Rotaciones del cubo . . . . . . . . . . . . . . . . . . . . . . 283.3.2. Permutaciones . . . . . . . . . . . . . . . . . . . . . . . . . 323.3.3. Subgrupos normales . . . . . . . . . . . . . . . . . . . . . . 33

3.4. Transformaciones del plano . . . . . . . . . . . . . . . . . . . . . . 343.4.1. Transformaciones lineales . . . . . . . . . . . . . . . . . . . 343.4.2. El determinante . . . . . . . . . . . . . . . . . . . . . . . . 383.4.3. El grupo GL2 . . . . . . . . . . . . . . . . . . . . . . . . . . 403.4.4. Subgrupos de GL2 . . . . . . . . . . . . . . . . . . . . . . . 41

3.5. Grupos de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433.5.1. Los numeros reales . . . . . . . . . . . . . . . . . . . . . . . 433.5.2. S1 y SO2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

v

Page 6: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

vi

3.5.3. SL2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 473.6. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

4. Platicas de Fısica 51

4.1. Los errores de Einstein . . . . . . . . . . . . . . . . . . . . . . . . . 534.1.1. El cientıfico del siglo . . . . . . . . . . . . . . . . . . . . . . 534.1.2. Su error mas grande . . . . . . . . . . . . . . . . . . . . . . 534.1.3. Y entonces llego la fama . . . . . . . . . . . . . . . . . . . . 544.1.4. La gran explosion . . . . . . . . . . . . . . . . . . . . . . . . 554.1.5. ¿Que podemos pensar de Einstein? . . . . . . . . . . . . . . 56

4.2. Analisis de superficies . . . . . . . . . . . . . . . . . . . . . . . . . 574.3. El experimento de Buffon . . . . . . . . . . . . . . . . . . . . . . . 65

4.3.1. El experimento . . . . . . . . . . . . . . . . . . . . . . . . . 654.4. La fısica teorica aplicada a problemas de bioquımica y medicina . . 70

5. Platicas de Matematicas 75

5.1. Conjuntos, cardinalidades y la Hipotesis del Continuum . . . . . . 775.2. Los objetos mas importantes: Las funciones. . . . . . . . . . . . . . 835.3. Jugando con el caos . . . . . . . . . . . . . . . . . . . . . . . . . . 92

5.3.1. La dimension desconocida . . . . . . . . . . . . . . . . . . . 925.3.2. Juego caotico . . . . . . . . . . . . . . . . . . . . . . . . . . 925.3.3. Cuando todo parece ser lo mismo . . . . . . . . . . . . . . . 945.3.4. Calculando dimensiones . . . . . . . . . . . . . . . . . . . . 955.3.5. Otros ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . 965.3.6. Bibliografıa . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

6. Participantes 99

Page 7: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Indice de figuras

2.1. Dos marcos de referencia inerciales S y S ′ en movimiento relativocon velocidad constante v. . . . . . . . . . . . . . . . . . . . . . . . 10

2.2. Coordenadas de un objeto en los dos marcos de referencia . . . . . 112.3. γ en funcion de la velocidad v. Podemos ver que existe una singu-

laridad en v = c y que γ ≥ 1. . . . . . . . . . . . . . . . . . . . . . 132.4. Longitud L′ de un objeto en reposo en el marco de referencia S ′. . 14

3.1. El grupo Z4, representado como un ciclo. . . . . . . . . . . . . . . 273.2. El reloj es una representacion cıclica del grupo Z12. Nota que, las

caratulas del reloj suelen indicar ”12” en lugar de ”0”. . . . . . . . 283.3. Un cubo es un solido perfecto de seis caras. . . . . . . . . . . . . . 283.4. El resultado de rotar al cubo 90o a traves de uno de sus ejes es

indistinguible. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293.5. Numeramos los 8 vertices del cubo. . . . . . . . . . . . . . . . . . . 293.6. El resultado de aplicar la rotacion R al cubo. . . . . . . . . . . . . 303.7. Las diagonales D1 y D2 del cubo. . . . . . . . . . . . . . . . . . . . 333.8. El vector v, identificado geometricamente en el plano. . . . . . . . 353.9. La suma de dos vectores. . . . . . . . . . . . . . . . . . . . . . . . 363.10. La multiplicacion escalar. En esta figura suponemos que λ > 1. . . 373.11. El paralelogramo formado por dos vectores. . . . . . . . . . . . . . 393.12. La aplicacion de una transformacion ortogonal no modifica el angulo

entre los vectores. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433.13. La traslacion de la funcion f . . . . . . . . . . . . . . . . . . . . . . 443.14. El cırculo unitario S1 en el plano. . . . . . . . . . . . . . . . . . . . 45

4.1. Experimento de Buffon . . . . . . . . . . . . . . . . . . . . . . . . . 674.2. Los 41 elementos de estructura secundaria para la estructura 1cmk

de la proteına cAPK segun el programa Molscript. . . . . . . . . . 724.3. Factores de temperatura para la proteına cAPK. Las tres graficas se

refieren a tres variantes cristalograficas de la misma proteına cAPK:i) estructura 1cmk, ii) estructura 1atp, iii) estructura 1stc. . . . . 74

5.1. Siguiendo las flechas se puede contar a los numeros racionales . . . 80

vii

Page 8: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

viii

5.2. Los conjuntos T0, T1, T2, T3 y T4 en la construccion del triangulo deSierpinski . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94

5.3. La construccion de la carpeta de Sierpinski. . . . . . . . . . . . . . 965.4. La esponja Menger . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

Page 9: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Indice de cuadros

Page 10: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

x

Page 11: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Introduccion

xi

Page 12: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

xii

Page 13: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 xiii

El 2005 ha sido denominado como el ano internacional de la fısica en honora Albert Einstein y sus trabajos publicados hace un siglo en 1905. El InstitutoHeisenberg participo de esta celebracion al nombrar su tercer generacion AlbertEinstein.

El Instituto Heisenberg, fundado en la Facultad de Ciencias de la Universidadde Colima a principios del 2003, pretende fomentar el interes cientıfico entre losjovenes de Colima. Cada ano se realiza una seleccion de entre 20 y 30 estudiantesdel estado y se les presentan cursos especiales de fısica y matematicas en sesionessabatinas. Ademas, se prepara una serie de conferencias impartidas por cientıficostanto locales como extranjeros que se presentan a los seleccionados con el afande mostrarles la actividad cientıfica de una manera directa. Este Anuario 2005,segundo en la serie, recaba la informacion presentada tanto en los cursos como enlas exposiciones.

En esta ocasion, el curso de fısica estuvo enfocado a discutir algunos de losresultados obtenidos por Albert Einstein en 1905. En particular, se discutio sobreel problema conocido como el efecto fotoelectrico, problema resuelto por Eisteiny cuya solucion lo hzo acreedor de el premio Nobel de Fısica en 1922. Tambiense presento un curso sobre la relatividad especial. El curso de matematicas es-tuvo enfocado a presentar los ingredientes basicos e ideas fundamentales de lasmatematicas modernas. En particular se hizo incapie en la idea de grupo y de laimportancia y utilidad de ver un problema como una parte de algo mucho masgeneral.

El programa de conferencias que se presento conto con la participacion de nuevecientıficos y abarco temas de diversa naturaleza. Benjamın Itza, de la Universi-dad de Ottawa (Canada), impartio una charla titulada Conjuntos, funciones, y

la hipotesis del contınuo; Carlos Moises Hernandez, de la Universidad de Coli-ma participo con una exposicion titulada Probabilidad y apuestas. Se conto conla participacion de Pibero Djawotho de la Universidad de Indiana (EU) quienpresento el tema de la Fısica de iones pesados; Fernando Hernandez del IMATE-Morelia hablo sobre Los objetos mas importantes: las funciones. Otro miembro denuestra comunidad universitara, Andres Pedroza, presento una exposicion sobre El

grupo fundamental; Monica Moreno de la Universidad de Tufts (EU) hablo sobreMatematicas y computadoras: el juego caotico. Jorge Lopez de la Universidad deTexas en El Paso (EU) presento una charla titulada Los errores de Einstein; PaoloAmore de la Universidad de Colima realizo una charla-taller titulada El experimen-

to de Buffon. Tambien de nuestra universidad, Christoph Hofmann hablo sobre la

fısica teorica aplicada a problemas de bioquımica y medicina; Rafael Baquero delCINVESTAV dio una charla sobre La superconductividad y finalmente, Juan Reyesde la Universidad de Colima hablo sobre Tecnicas de analisis de superficies. Loscursos de fısica y matematicas fueron impartidos por Alfredo Aranda y RicardoSaenz, respectivamente, ambos de la Universidad de Colima.

Page 14: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

xiv

Page 15: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Capıtulo 1

¿Por que generacion Albert

Einstein?

1

Page 16: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

2

Page 17: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 3

En 1905 Albert Einstein cambio el mundo. Sus trabajos publicados en ese anorevolucionaron el entendimiento de la naturaleza y han influenciado todo el cono-cimiento y la tecnologıa adquiridos desde entonces. Es por esto que en este primercentenario de su Annus Mirabilis el Instituto Heisenberg ha decidido nombrar asu tercer generacion como Generacion Albert Einstein, decision que era imposibleevitar.

Existe un gran numero de biografıas y escritos sobre la vida y obra de estehombre y nosostros no intentaremos hacer otra mas. En lugar de eso, haremos unlistado (parcial) de referencias sobre Einstein y su trabajo:

Goldenstern, Joyce. Albert Einstein: Physicist and Genius. Springfield, NJ:Enslow Publishers, 1995.

Macdonald, Fiona. Albert Einstein: Genius behind the Theory of Relativity.Woodbridge, Conn.: Blackbirch Press, 2000.

Parker, Steve. Albert Einstein and Relativity. New York: Chelsea HousePublishers, 1995.

Brian, Denis. Einstein: A Life. New York: John Wiley, 1996.

Pais, Abraham. Einstein Lived Here: Essays for the Layman. New York :Oxford University Press, 1994.

Bernstein, Jeremy. Albert Einstein and the Frontiers of Physics. New York:Oxford University Press, 1996.

Albert Einstein: The Human Side. New Glimpses from His Archives. HelenDukas and Banesh Hoffmann, eds. Princeton: Princeton University Press,1979.

The Expanded Quotable Einstein. Alice Calaprice and Freeman J. Dyson,eds. Princeton: Princeton University Press, 2000.

Page 18: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

4

Page 19: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Capıtulo 2

Curso de Fısica

5

Page 20: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

6

Page 21: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 7

1905, el ano de Albert Einstein

Alfredo Aranda Fernandez 1

Instituto Heisenberg y Facultad de Ciencias, Universidad de ColimaAv. Bernal Dıaz del Castillo # 340

Colima, Colima, Mexico, 28045

2.1. Introducion

Este ano se celebra el annus mirabilis de Albert Einstein quien en 1905 pu-blico varios artıculos que revolucionaron al mundo cientıfico 2. En marzo de 1905Einstein envio a la revista Annalen der Physik un artıculo en el que presentabauna nueva descripcion de la luz. Einstein argumento que la luz podıa actuar comosi estuviese compuesta de pedazos discretos de energıa. Esta propuesta parecıacontradecir la teorıa aceptada universalmente de que la luz esta compuesta porondas electromagneticas. Einstein utilizo a los pedazos o cuantos de energıa parapoder explicar un fenomeno experimental que era estudiado en ese tiempo y quese relaciona a la forma en que la luz interactua con los metales, el llamado efecto

fotoelectrico.En mayo del mismo ano, Annalen der Physik recibio otra contribucion de Eins-

tein. Es esta ocasion se explicaba al calor como el efecto del movimiento incesantede los atomos. En este artıculo, Einstein propuso un experimento para poner lateorıa a prueba. Este consistıa en la idea de que si partıculas pequena pero visiblesse suspendieran en un lıquido, el bombardeo irregular de los atomos que formanal lıquido (invisibles al ojo humano) causaran en la partıcula un movimiento aza-roso. Este movimiento azaroso habıa sido ya observado en muchas ocasiones porbiologos, se le conocıa como movimiento Browniano y no era entendido. Eins-tein logro entonces explicarlo en detalle, reenforzo la teorıa cinetica, y creo unapoderosa herramienta en el estudio del movimiento de los atomos.

Annalen der Physik recibio un trabajo sobre movimiento y electromagnetismoen junio de 1905. En este trabajo Einstein presento un nuevo analisis de los concep-tos de espacio y tiempo que mas tarde se llamo la teorıa de la relatividad especial.Una cosa interesante es que su presentacion es tan clara y concisa que puede sercomprendida por estudiantes de ciencias sin mayor esfuerzo.

En septiembre se publico el resultado de que is un cuerpo emite una ciertacantidad de energıa entonces su masa tiene que decrecer una cantidad proporcionala la emergıa emitida. Esta relacion es la que se expresa con la ya famosa formulaE = mc2.

Durante el curso impartido en el Instituto Heisenberg cubrimos algunos de es-tos temas con la intencion de que los estudiantes se percataran de que, a pesar

[email protected] informacion puede ser obtenida en la pagina web del American Institute of Physics.

Aquı solo presente un resumen breve.

Page 22: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

8

de que las ideas presentadas revolucionaron todo el ambito cientıfico, pueden serentendidas con cierta profundidad con conocimientos basicos. En este anuario pre-sentamos el contenido del curso que se enfoco primordialmente en los temas delefecto fotoelectrico y una introduccion de las ideas fundamentales de la relatividadespecial.

2.2. Efecto fotoelectrico

El efecto fotoelectrico consiste en lo siguiente: Cuando incide luz en un metalesta produce una corriente electrica (emite electrones en el metal) con las siguientespropiedades:

Los electrones son emitidos inmediatamente, es decir, no hay una cantidadde tiempo medible entre la incidencia de la luz y la generacion de corriente.

La luz incidente incrementa el numero de fotoelectrones pero no el maximode su energıa cinetica.

Luz roja no produce corriente, no importa que tan intensa sea.

Una luz violeta debil solo emitira unos pocos fotoelectrones, pero su energıacinetica maxima sera mayor que los producidos por luz mas intensa y demayor longitud de onda.

El problema consiste en que estas propiedades estan en contradiccion con loesperado a partir de la fısica clasica. Concretamente, la teorıa claasica requiere queel campo electrico oscilante de la onda de luz incremente en amplitud conforme laintensidad de la luz se incremente. Esto deberıa entonces incrementar la energıacinetica de los fotoelectrones. Sin embargo lo que se observa es que la energıacinetica maxima es independiente de la intensidad de la luz.

Otra prediccion de la teorıa clasica es de que el efecto fotoelectrico debe de ocu-rrir con luz de cualquier frecuencia, siempre y cuando se logre obtener la suficienteintensidad para proveer a los fotoelectrones con la suficiente energıa. Sin embargo,como mencionamos arriba, la luz roja no produce fotoelectrones! Ademas, clasi-camente uno espera que para porducir fotoelectrones la luz necesita una cantidadde tiempo medible entre la incidencia de la luz y la generacion de la corriente.

2.2.1. La solucion de Einstein

Einstein propuso, extendiendo las ideas propuestas por Max Planck poco tiempoantes, que la luz esta cuantizada en pedazos concentrados que mas tarde fueronllamados fotones. Estos fotones chocan con los electrones en el metal y si tienensuficiente enrgıa para desprenderlos lo hacen, si no simplemente rebotan y se van,es decir, no pueden ser absorbidos y retenidos por el electron. Si la energıa que

Page 23: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 9

contiene un cierto foton es igual o mayor a la energıa que liga el electron al atomo,este se desprendera inmediatamente.

Einstein ademas supuso que estos fotones al formarse estan localizados en unpequeno volumen de espacio y que se mantienen localizados al alejarse de la fuenteque los produjo. Supuso tambien que la cantidad de energıa de un foton esta rela-cionada a su frecuencia, ν, a traves de la expresion

E = hν . (2.1)

Con estas ideas ahora podemos explicar que es lo que sucede. Cuando el electrones emitido del metal, su energıa cinetica es

K = hν − W , (2.2)

donde W es el trabajo requerido para separar al electron del metal. En el caso de unelectron con el ligamento mas debil posible, sin perdidas internas por colisiones conotros electrones, el fotoelectron saldra con la energıa cinetica maxima y entonces

Kmax = hν − W0 , (2.3)

donde W0 es una energıa caracterıstica para cada metal y se le llama la funcion

de trabajo.Veamos ahora como con estas ideas podemos resolver los problemas que no tie-

nen solucion con la teorıa clasica. En la teorıa de Einstein, si doblamos la intensidadlo unico que hemos hecho es doblar el numero de fotones y por lo tanto doblaremosla corriente; no cambia para nada la energıa hν de cada foton individual.

Por otro lado vemos que si Kmax = 0 entonces tenemos

hν0 = W0 , (2.4)

lo cual nos dice que un foton de frecuencia ν0 tiene la energıa justa para eyectarfotoelectrones y nada extra para energıa cinetica. Si la frecuencia se reduce pordebajo de ν0, no importa cuantos fotones incidan, no podra ninguno de ellos eyectara ningun electron.

Por ultimo, ya que los fotones estan localizados, la transmision de la energıaa los electrones sucede rapidamente y no es necesario esperar una cantidad detiempo sustancial (medible) para que el electron sea eyectado.

2.3. Relatividad especial

La relatividad especial esta basada en dos postulados que pueden ser presenta-dos de la siguiente manera:

(i) Las leyes de la fısica son independientes del marco de referencia inercial.

(ii) La velocidad de la luz en el vacıo es constante y es la misma para cualquierobservador en un marco de referencia inercial, independientemente de sumovimiento.

Page 24: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

10

2.3.1. Tranformaciones de Lorentz

Veamos cuales son las consecuencias fısicas de estos postulados. Consideremosdos marcos de referencia inerciales S y S ′ que se mueven uno con respecto al otrocon una velocidad constante v, como se muestra en la figura 2.1.

x x’

S S’

v

Figura 2.1: Dos marcos de referencia inerciales S y S ′ en movimiento relativo convelocidad constante v.

Por simplicidad analizaremos el movimiento en una sola direccion a la quellamaremos x. De acuerdo con la relatividad de Galileo, la relatividad clasica,la descripcion del movimiento de un objeto que harıan dos observadores, unosituado en el marco S y el otro en el marco S ′ estarıa relacionada a traves delas tranformaciones:

x′ = x − vt

y′ = y

z′ = z

t′ = t (2.5)

en donde x, y y z son las coordenadas obtenidas por el observador en S y x′, y′ yz′ las obtenidas por el observador en S ′ (ver figura 2.2).

Observemos que al trabajar en una sola dimension, las coordenadas en y y z sonlas mismas para ambos observadores. Tambien algo importante en estas ecuacioneses que el tiempo es el mismo para ambos observadores.

Bien, ahora consideremos el siguiente experimento. Tenemos dos marcos de re-ferencia como en la figura 2.1. Esperamos a que el marco S ′ avance y llegue acoincidir exactamente con el marco S. En ese instante, producimos un chispazo deluz y nos esperamos un tiempo t. En ese tiempo el marco S ′ sigue avanzando haciala derecha. Ahora, le preguntamos al observador en el marco S que nos diga cualesson las coordenadas de la luz. El nos va a decir que el chispazo genero una esferaque se aleja de el a la velocidad de la luz, y por lo tanto la esfera, en el tiempo ttiene un radio de ct, donde c es la velocidad de la luz. Ası pues, el observador enS nos dira que

x2 + y2 + z2 = (ct)2 . (2.6)

Page 25: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 11

S’ S

v

x’

x

Figura 2.2: Coordenadas de un objeto en los dos marcos de referencia

Bien, ahora le preguntamos lo mismo al observador en S ′. Ella nos dira quetambien observa una esfera de radio ct, ya que la velocidad de la luz es la mismapara ambos observadores (de acuerdo con el postulado (ii)), y el tiempo es el mismopara ambos (de acuerdo con la relatividad galileana). Entonces, tenemos que

x′2 + y′2 + z′2 = (ct)2 . (2.7)

Si sustituimos las expresiones dadas en la ecuacion (2.5) en esta ultima ecuacionobtenemos

(x − vt)2 + y2 + z2 = (ct)2 . (2.8)

Si ahora comparamos esta ecuacion con la ecuacion (2.6) vemos que la unica mane-ra de que esto sea consistente es que v = 0, o sea de que los dos observadores estenen el mismo marco de referencia. Entonces concluımos que si los postulados de larelatividad especial son correctos y en efecto describen a la naturaleza, entoncesla relatividad galileana no funciona!

Bueno, no funciona cuando analizamos a la luz, pero sabemos que para veloci-dades pequenas las tranformaciones galileanas funcionan muy bien. Entonces, loque tenemos que hacer es encontrar una manera de modificar estas transforma-ciones para que funcionen tambien cuando las velocidades son muy grandes. Paralograr esto vamos a empezar por modificar las tranformaciones galileanas de lasiguiente manera:

x′ = A(v) (x − vt)

y′ = y

z′ = z

t′ = A(t) (B(v)x + t) . (2.9)

Veamos cuales han sido los cambios

y y z permancen como antes. Esto simplemente indica que seguimos traba-jando en una sola dimension.

Page 26: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

12

la transformacion para x ha sido multiplicada por una funcion de la velocidada la que por el momento hemos llamado A(v). Esta funcion representa la mo-dificacion mınima que podemos hacer para ver si podemos lograr satisfacerlos postulados. Ya que deseamos recuperar las transformaciones galileanas avelocidades pequenas, deducimos que lımv→0 A(v) = 1.

Hemos introducido un tiempo diferente para cada observador!!! Quiza estasea la modificacion mas exotica, sin embargo, si vemos las ecuaciones (2.9),observaremos que ahora existe una simetrıa entre las tranformaciones parax y t, es decir ambas dependen de ambas. En este caso hemos tambienintroducido la misma funcion A(v) y ademas, para poder tener consistenciaen unidades, necesitamos introducir otra funcion multiplicando a x paraobtener tiempo. La hemos llamado B(v) y requerimos que lımv→0 B(v) = 0para poder obtener las transformaciones de Galileo a velocidades pequenas.

Ahora utilizemos estas nuevas transformaciones para ver si son consistentes connuestro experimento. En nuestro caso la ecuacion (2.7) se convierte a:

x′2 + y′2 + z′2 − (ct′)2 = 0

A(v)2 (x − vt)2

+ y2 + z2 − c2A(v)2(B(v)x + t)2 = 0 . (2.10)

Esta solucion tiene que ser compatible con la ecuacion (2.6), y entonces, compa-rando ambas ecuaciones obtenemos las siguientes condiciones:

A(v)2(1 − c2B(v)2

)= 1

A(v)2(v2 − c2

)= c2

A(v)2(−2v − 2c2B(v)

)= 0 . (2.11)

Estas condiciones han sido obtenidas comparando los terminos proporcionalesa x2, a t2 y a xt entre las ecuaciones (2.6) y (2.10).

Finalmente podemos ahora determinar las funciones A(v) y B(v). De la segundaecuacion en (2.11) obtenemos

A(v) =1√

1 − v2

c2

≡ γ , (2.12)

y de la tercera ecuacion

B(v) =v

c2≡

β

v, (2.13)

donde hemos definido γ y β. Entonces vemos que dadas las tranformaciones en laecuacion (2.9) podemos obtener el resultado deseado. Estas nuevas tranformaciones

Page 27: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 13

se llaman de Lorentz, y en su forma final son

x′ = γ (x − vt) (2.14)

y′ = y

z′ = z

t′ = γ

vx + t

). (2.15)

Antes de continuar analizemos las funciones γ y β. Primero vemos que en efectoambas funciones satisfacen los lımites requeridos para obtener las transformacionesgalileanas cuando v → 0.

Notemos que la ecuacion para γ tiene una singularidad (es decir, explota a infi-nito) cuando v = c, y ademas para v > c, tenemos una expresion imaginaria. Dadoque los observables fısicos son necesariamente cantidades reales, concluımos quevelocidades mayores a la de la luz no son posibles fısicamente. Otra caracterısticaimportante de γ es que siempre es mayor a uno, como se muestra en la figura 2.3.Esto tendra relevancia cuando analizemos algunas de las implicaciones fısicas delas transformaciones de Lorentz.

0.0e+00 1.0e+08 2.0e+08 3.0e+08v

0

1

2

3

4

5

6

7

8

9

10

γ

Figura 2.3: γ en funcion de la velocidad v. Podemos ver que existe una singularidaden v = c y que γ ≥ 1.

2.3.2. Contraccion de la longitud

Imaginemos que tenemos un objeto en reposo en el marco de referencia S ′.Un observador en ese mismo marco de referencia quiere determinar la longituddel objeto y por lo tanto nos dice cuales son las coordenadas inicial y final delobjeto, ası, si la primer coordenada es x′

1 y la segunda coordenada es x′2, entonces

Page 28: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

14

la longitud del objeto, determinada por este observador sera L′ = x′2 − x′

1 comose muestra en la figura 2.4. Estamos suponiendo que las dos coordenadas fuerondeterminadas al mismo tiempo t′.

S’

x’ x’1 2

L’

Figura 2.4: Longitud L′ de un objeto en reposo en el marco de referencia S ′.

De la misma manera, un observador en el marco de referencia S determinara quela longitud de este objeto que se mueve con una velocidad relativa v esta dada porL = x2 −x1, donde ahora las coordenadas son con respecto al marco de referenciaS, las cuales, otra vez, suponemos que se determinaron al mismo tiempo t. Peronosotros ya sabemos cual es la relacion entre las coordenadas de ambos marcos, esdecir, cuales son las transformaciones. Utilizando las transformaciones de Lorentz,ecuacion (2.14), obtenemos que

L0 ≡ L′ = x′2 − x′

1

= γ(x2 − vt) − γ(x1 − vt)

= γ(x2 − x1)

= γL , (2.16)

donde hemos definido L0 como la longitud medida en el estado de reposo. A L0

se le llama Longitud propia.Ahora recordemos que el factor γ es siempre mayor o igual a uno, γ ≥ 1.

Tomando esto en consideracion, vemos que la ecuacion (2.16) nos dice que L0

siempre sera mayor o igual a L, es decir, que la longitud determinada en el estadode reposo es siempre la mas grande, o dicho de otra manera, que la longitud de unobjeto, determinada por un observador con respecto al cual el objeto se mueve,siempre sera menor que la determinada por un observador que se encuentre enreposo con respecto al objeto. Entonces decimos que la longitud se contrae con el

movimiento.

Page 29: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 15

2.3.3. Dilatacion del tiempo

Consideremos ahora la siguiente situacion. Tenemos una lampara en reposo enel marco de referencia S ′. Su posicion es x′. En un tiempo t′1 dispara un flashazo.Despues, en un tiempo t′2 dispara un segundo flashazo. Un observador en el marcoS′ determina que el intervalo entre los flashzos fue de ∆t′ = t′2 − t′1.

Ahora, la misma situacion la estuvo registrando un observador en el marco dereferencia S y determino que el intervalo fue ∆t = t2 − t1. Consideremos ahora larelacion entre ambos

∆t = t2 − t1

= γ

(−

β

vx′ + t′2

)− γ

(−

β

vx′ + t′1

)

= γ (t′2 − t′1)

= γ∆t′ ≡ γτ , (2.17)

donde hemos definido el tiempo propio τ como el tiempo medido en el estado de re-poso del objeto. Las transformaciones utilizadas en esta ecuacion fueron obtenidasinvirtiendo las relaciones en la ecuacion (2.14).

Ahora vemos que el tiempo propio τ es siempre mas pequeno que el tiempomedido por un observador en movimiento. Ası pues decimos que el tiempo se

contrae.

2.3.4. Confirmacion experimental de la relatividad especial

La teorıa especial de la relatividad represento un cambio abrupto y de dimensio-nes inimaginables para el mundo de la ciencia. En su momento, al ser introducidapor primera vez, rompıa con todos los esquemas existentes y sus predicciones eransimplemente sensacionales. Para que se tomara en serio, la teorıa especial de larelatividad tenıa que pasar por pruebas minuciosas que demostraran la necesidadde esta teorıa.

Una de las aplicaciones de la relatividad especial, que consistio a su vez en unaconfirmacion de la misma, tiene que ver con una partıcula fundamental llamadamuon, µ. Esta partıcula tiene las mismas propiedades que un electron, la unicadiferencia es que es mucho mas masiva (Su masa es 200 veces mayor a la delelectron). Al ser tan masivo, el muon es una partıcula inestable, es decir, despuesde un tiempo, llamado vida media, decae en un electron y un par de neutrinos. 3

La vida media del muon es de 2·2 × 10−6 segundos. La vida media representa eltiempo promedio en el que dada una cantidad inicial de muones, la mitad hayadecaido.

3Los neutrinos son otras partıculas elementales. Como su nombre lo indica, tienen cargaelectrica neutra y hace un par de anos se descubrio que tienen una masa muy pequena (antes sepensaba que no tenıan masa).

Page 30: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

16

Bien, la situacion que nos interesa consiste en lo siguiente. La Tierra esta siendoconstantemente bombardeada por rayos cosmicos, nombre que se le dio historica-mente a las partıculas elementales que aun no se conocıan. Una de estas partıculases el proton, que se encuentra en los nucleos de cualquier atomo. Ahora, los pro-tones al entrar en la atmosfera terrestre colisionan con las partıculas que formanlos gases atmosfericos. Estas colisiones ocurren a una altura aproximada de 10 kmsobre la superficie de la tierra y generan la produccion de partıculas fundamenta-les, entre ellas el muon. Los muones salen disparados en todas direcciones y convelocidades cercanas a la de la luz. Al poner detectores de muones en la superfi-cie de la tierra, nosotros podemos determinar si llegan o no a la superficie de latierra. La respuesta es que si llegan. Sin embargo, recordemos que el muon tansolo vive 2·2 × 10−6 segundos antes de decaer y viaja a una velocidad cercanaa la de la luz, digamos 0·99 c. Entonces, utilizando las simples relaciones gali-leanas podemos determinar la distancia que el muon avanzara antes de decaer,dG = 0·99× (3× 108)× (2·2× 10−6) metros= 653·4 m. Esta distancia es bastantepequena como para que un numero considerable de muones pudiesen sobrevivir yllegar a ser observados, sin embargo, si los observamos. ¿Como podemos resolvereste dilema?

La solucion la encontramos cuando aplicamos los resultados de la relatividadespecial. El problema es que la vida media que hemos utilizado es en realidad eltiempo medido en el marco de referencia del muon, o sea el tiempo propio τ . Paraobtener el tiempo en el sistema de referencia de la superficie de la tierra tenemosque multiplicar por γ = 1/

√1 − v2/c2, que en este caso sustituyendo el valor de

v = 0·99 c nos da γ = 7·1. Si hacemos esto obtenemos el resultado de que ladistancia que el muon recorre registrada por un observador en la superficie de latierra es de 4631·8 m. Esta nueva distancia es suficiente para que un buen numerode muones lleguen a la tierra!

Page 31: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Capıtulo 3

Curso de Matematicas

17

Page 32: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

18

Page 33: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 19

Introduccion a las ideas modernas en las matematicas

Ricardo A. Saenz 1

Instituto Heisenberg y Facultad de Ciencias, Universidad de ColimaAv. Bernal Dıaz del Castillo # 340

Colima, Colima, Mexico, 28045

3.1. Introduccion

El proposito de este curso es mostrar algunas de las ideas fundamentales enlas matematicas modernas. Las matematicas forman una disciplina que estudia,de manera precisa y sistematica, las relaciones entre distintos objetos abstrac-tos. Estos objetos pueden ser numeros, formas geometricas, polinomios, etc., ylas relaciones pueden ser desde operaciones entre objetos del mismo tipo, hastacorrespondencias entre distintas clases de objetos. La idea de estas notas, y delcurso en el Instituto Heisenberg, es mostrar algunos ejemplos de estas relaciones,y como los matematicos buscamos dichas relaciones.

Como primer y mas sencillo ejemplo, consideremos los numeros enteros:

. . . ,−2,−1, 0, 1, 2, 3, . . . .

Los numeros enteros se representan por la letra Z, y se relacionan entre sı pormedio, al menos, de dos operaciones: suma (+) y multiplicacion (×). Ambas ope-raciones satisfacen las siguientes propiedades:

Asociatividad La suma como la multiplicacion son operaciones binarias; es decir,podemos calcular la suma de dos numeros o la multiplicacion de dos numeros.Sin embargo, la expresion, por ejemplo,

2 + 3 + 1

no esta en sı definida, porque no tenemos reglas (definiciones) para la sumade tres numeros. Sin embargo, eso no es problema ya que, simplemente,sumamos primero dos de ellos, y al resultado le sumamos el tercero. Peroexisten dos formas de hacerlo:

(2 + 3) + 1; 2 + (3 + 1),

donde los parentesis indican que la operacion dentro de ellos es la que debede realizarse primero. Asociatividad es la propiedad de la suma que nosgarantiza que ambas ”asociaciones” nos llevaran al mismo resultado:

(2 + 3) + 1 = 5 + 1 = 6

2 + (3 + 1) = 2 + 4 = 6.

[email protected]

Page 34: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

20

Esto se cumple para cualquier trıo de numeros. De la misma forma, la mul-tiplicaicon es asociativa:

(3 × 2) × (−1) = 3 × (2 ×−1) = −6.

Es facil ver que asociatividad nos permite calcular tanto sumas como multi-plicaciones de un numero arbitrario de numeros.

En general, expresamos la asociatividad de estas operaciones como

(m + n) + p = m + (n + p) para todos m, n, p ∈ Z;

(m × n) × p = m × (n × p) para todos m, n, p ∈ Z.

Conmutatividad Tanto la suma como la multiplicacion son conmutativas, esdecir, no importa el orden en que realizamos las operaciones. Por ejemplo:

−1 + 3 = 3 + (−1)

4 × 7 = 7× 4.

Esta propiedad de no requiere de mayor explicacion. En general, tenemos

m + n = n + m para todos m, n ∈ Z;

m × n = n × m para todos m, n ∈ Z.

Distributividad La suma y la multiplicacion ”se llevan bien entre ellas”. Conesto quiero decir que interactuan de manera consistente, y lo hacen de lasiguiente forma:

m × (n + p) = m × n + m × p para todos m, n, p ∈ Z.

Es decir, la multiplicacion de un numero por una suma de dos numeros, esla suma de las multiplicaciones. Ası que, de cierta forma, la suma y la mul-tiplicacion conmutan entre sı. A esta propiedad se le llama distributividad.

Elemento identidad Cuando a un numero n le sumamos 0, o lo multiplicamospor 1, obtenemos el mismo numero n. A los numeros 0 y 1 les llamamos iden-tidad aditiva y multiplicativa, respectivamente. Tenemos entonces la propie-dad

n + 0 = n para todo n ∈ Z;

n × 1 = n para todo n ∈ Z.

La suma, sin embargo, satisface una propiedad extra que la multiplicacion nosatisface: existencia de inversos. Dado un numero n, su inverso aditivo es elnumero, denotado por −n, tal que al sumarlo a n nos da 0:

n + (−n) = 0.

Page 35: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 21

Por ejemplo, el inverso de 3 es −3, o el inverso de −1 es 1. Escribimos esta pro-piedad de la forma

Para todo n ∈ Z existe −n tal que n + (−n) = 0.

La multiplicacion no satisface tal propiedad porque, dado un entero n, en generalno podemos encontrar un numero tal que al multiplicarlo por n nos de 1 (elelemento identidad de la multiplicacion). Por ejemplo, no existe ningun numeroque al multiplicarlo por 2 nos de 1.

La importancia de la existencia de inversos aditivos, junto con la asociatividadde la suma, radica en la capacidad de resolver ecuaciones de la forma

m + x = n (3.1)

con m, n enteros. Es decir, en la capacidad de encontrar un numero ”x” que satis-faga (3.1). Por ejemplo, la solucion de la ecuacion

3 + x = 2

es x = −1. Ademas, podemos observar que la solucion a esta ecuacion es unica: esdecir, solo x = −1 satisface la ecuacion anterior. En general, existe un unico x quesatisface la ecuacion (3.1). ¿Como encontramos tal solucion? F’acil: solo ”restamosm de ambos lados” de la ecuacion. Ası que la solucion (unica) es x = n − m.

Lo que nos permite llegar a tal resultado son las propiedades de la suma. Ası que,podemos esperar, si tenemos una operacion en un conjunto de objetos que satisfagalas propiedades que satisfaga la suma, entonces seremos capaces de resolver ecua-ciones como la ecuacion (3.1). En la siguiente seccion discutiremos el significadodel enunciado anterior.

3.2. Grupos

3.2.1. Ecuaciones algebraicas

Empezaremos por repasar, detenidamente, una ecuacion de la forma m+x = ny su solucion. Por ejemplo, consideramos la ecuacion

3 + x = 2.

Para obtener su solucion, sabemos que solo es necesario ”restar 3 de los dos lados”.Sin embargo, esto se puede hacer de dos formas, por la izquierda o por la derecha:

−3 + (3 + x) = −3 + 2;

(3 + x) + (−3) = 2 + (−3).

Page 36: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

22

Aunque el lector ya sabe que ambas formas nos llevaran al mismo resultado, porla conmutatividad de la suma, en la primera no necesitamos hacer uso de talpropiedad para llegar a la solucion:

−3 + (3 + x) = −3 + 2;

(−3 + 3) + x = −1; por asociatividad

0 + x = −1; −3 es el inverso de 3

x = −1. 0 es la identidad aditiva

Si sumaramos por la derecha, sin embargo, necesitamos de un paso extra:

(3 + x) + (−3) = 2 + (−3);

(x + 3) + (−3) = −1; por conmutatividad

y luego continuamos de la forma anterior. Entonces, preferimos la suma por laizquierda, por que de tal forma solo utilizamos las propiedades de la suma asocia-tividad, exitencia de identidad y existencia de inversos.

Supongamos entonces que tenemos un conjunto de objetos, que llamaremos G, yuna operacion entre ellos, que llamaremos ◦. Con operacion nos referimos al hechoque, dados dos objetos g, h ∈ G, podemos ”calcular” el objeto g ◦ h, y tambienesta contenido en G.

En el transcurso de este curso veremos muchos ejemplos de operaciones enconjuntos distintos. Por el momento, supongamos que tenemos un conjunto G yuna operacion ◦, y consideremos la ecuacion

g ◦ x = h, (3.2)

con g, h elementos de G, y queremos resolver para x. Nuestra es la siguiente: ¿bajoque condiciones podemos garantizar que la ecuacion (3.2) tiene una unica solucionpara g, h ∈ G?

Tratemos de reproducir los pasos que nos llevaron a resolver tal ecuacion en elcaso en que G era el conjunto de los numeros enteros y ◦ era la suma. Para esto,necesitamos de un elemento, que llamaremos g−1, tal que, al operarlo2 con g, nos deuno tal que opere como ”identidad” en G. Llamemosle i. Entonces, multiplicancoambos lados de (3.2) por g−1, obtenemos

g−1 ◦ (g ◦ x) = g−1 ◦ h.

Si la operacion ◦ es asociativa, tenemos

(g−1 ◦ g) ◦ x = g−1 ◦ h.

Entonces, por la manera en que hemos escogido g−1,

i ◦ x = g−1 ◦ h,

y por lo tantox = g−1 ◦ h.

2Comunmente diremos ”multiplicarlo”, aunque la operacion ◦ no sea la multiplicacion.

Page 37: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 23

3.2.2. Definicion de grupo

A un par (G, ◦) formado por un conjunto G y una operacion ◦ en el cual laecuacion (3.2) siempre tiene una unica solucion, le llama un grupo. Hemos visto quelos ingredientes necesarios para resolver tal ecuacion son asociatividad, identidade inversos, por lo que entonces tenemos la siguiente definicion formal de grupo.

Definicion. Decimos que el par (G, ◦) es un grupo si la operacion ◦ satisface lassiguientes propiedades:

1. Asociatividad: (g ◦ h) ◦ k = g ◦ (h ◦ k) para todos g, h, k ∈ G;

2. Identidad: Existe un i ∈ G tal que i ◦ g = g ◦ i para todo g ∈ G; e

3. Inverso: Para todo g ∈ G existe g−1 ∈ G tal que g ◦ g−1 = g−1 ◦ g = i.

Solemos identificar la operacion de un grupo con ”multiplicacion”, por lo quees comun decir ”g multiplicado por h” para decir g ◦ h, escribir gh por g ◦ h yrepresentar la identidad i por ”1”, quedando en claro que no debemos confundirese 1 (elemento identidad de G) con el numero 1.

Veamos algunos ejemplos de conjuntos y operaciones en ellos, y determinaremossi son grupos.

Ejemplo 3.2.1. (Z, +). Como hemos visto en la introduccion a este curso, y al iniciode esta seccion, la suma + en el conjunto Z de los numeros enteros es asociativa,tiene identidad (0) y cada entero tiene un inverso. Por lo tanto el par (Z, +) formaun grupo.

Ejemplo 3.2.2. (N, +). El conjunto de numeros naturales N esta dado por el con-junto de enteros positivos

1, 2, 3, . . . .

(N, +) no forma un grupo porque no tenemos elemento identidad.

Ejemplo 3.2.3. (Q, +). El conjunto Q de los numeros racionales es el conjuntoformado por todas las ”fracciones” de enteros. Es decir, es el conjunto

Q ={p

q: p, q ∈ Z, q 6= 0

}.

Observemos la condicon necesaria que el denominador q no sea 0. El lector sabela definicion de la suma de dos racionales:

m

n+

p

q=

mq + np

nq.

Es facil ver que la suma + satisface las propiedades de un grupo. De hecho, 0,quien era el elemento identidad en Z, sigue siendo la identidad en Q, y el inverso

dep

qesta dado por

−p

q.

Page 38: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

24

Ejemplo 3.2.4. (Q,×). Aunque la multiplicacion en Q, definida por

m

p

q=

mp

nq

es claramente asociativa y tiene identidad (1, de nuevo), no todos los racionalestienen inverso multiplicativo, ya que 0 no lo tiene. Esto repercute, por ejemplo, enel hecho de que la ecuacion

0 × x =3

4

no tiene solucion, o la ecuacion

0 × x = 0

tiene mas de una solucion (de hecho cualquier numero racional es solucion de laecuacion anterior).

Ejemplo 3.2.5. (Q∗,×). Sin embargo, si tomamos el conjunto Q∗ = Q \ {0} de losnumeros racionales distintos de cero, entonces el par (Q∗,×) sı forma un grupo,llamado el grupo multiplicativo de Q. Ahora, todos los numeros en Q∗ tieneninverso, y la solucion de la ecuacion

m

n× x =

p

q

esta dada por x =np

mq.

En analogıa con el ejemplo anterior, podemos observar que, en Z, solo dosnumeros poseen inversos: el 1 y el -1, los cuales son sus mismos inversos. De hecho,el par ({1,−1},×) sı forma un grupo, y podemos observar que este grupo tienesolo dos elementos. Ası, es un ejemplo de un grupo finito, de los cuales hablaremoscontinuacion.

3.2.3. Grupos finitos

Decimos que (G, ◦) es un grupo finito si G es un conjunto finito. Por ejemplo,conjunto {1,−1} junto con la multiplicacion × forma un grupo, y es finito porque{1,−1} es finito (tiene dos elementos).

Otro ejemplo de un grupo finito es el par ({0}, +). Como solo tenemos el 0, y0+0 = 0, todas las propiedades que definen a un grupo se satisfacen trivialmente,y tal grupo es llamado un grupo trivial. Otros ejemplos de grupos triviales son({1},×) o el mismo {0} con la operacion × ya que, de nuevo 0 × 0 = 0 y laspropiedades de grupo se satisfacen.

Todos los grupos triviales, entonces, son de la forma ({a}, ◦) con a◦a = a. Comoa es la identidad de tal grupo, podemos entonces escribir simplemente ({i}, ◦).Concluımos entonces que todos los grupos de un solo elemento, escencialmente,son el mismo grupo, solo el ”nombre” de su unico elemento es distinto.

Page 39: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 25

Ya hemos visto un ejemplo de un grupo de dos elementos: ({1,−1},×). Ahoraveremos si podemos encontrar otros. Si nuestro grupo es (G, ◦), digamos con G ={a, b}, entonces tratemos de calcular la ”tabla de multiplicacion” de la operacion◦:

◦ a ba ? ?b ? ?

Primero, como (G, ◦) es un grupo, uno de sus elementos a o b tiene que ser laidentidad. Digamos, a. Entonces la tabla es de la forma

◦ a ba a bb b ?

ası que solo nos queda por conocer el valor de b◦b. Para esto, recordemos que debeexistir un elemento b−1 de G tal que b ◦ a−1 = a, la identidad. Entonces, comob ◦ a = b necesariamente b ◦ b = a, y la tabla esta dada por

◦ a ba a bb b a

No podemos dejar de notar la similitud entre esta tabla y la tabla de multiplicacionde ({1,−1},×):

◦ a ba a bb b a

× 1 −11 1 −1

−1 −1 1

Podemos observar que, a traves de la correspondencia a ↔ 1 y b ↔ −1, ambastablas son las mismas, por lo que podemos concluır que, esencialemente, existe ununico grupo con dos elementos.

Repitamos el ejercicio anterior, pero ahora en la busqueda de un grupo (G, ◦)con tres elementos, G = {a, b, c}. De nuevo, uno de ellos tiene que ser la identidad,y suponemos que es a. La tabla de (G, ◦) es entonces de la forma

◦ a b ca a b cb b ? ?c c ? ?

Ahora bien, uno de b ◦ b o b ◦ c tiene que ser igual a a y el otro a c; lo primeroporque b tiene inverso, y lo segundo porque la ecuacion

b ◦ x = c

Page 40: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

26

tiene una unica solucion x. Intentemos primero b ◦ b = a y b ◦ c = c. Tenemosentonces

◦ a b ca a b cb b a? c?c c ? ?

Hemos dejado el signo de interrogacion en estos valores porque aun no sabemos sison los correctos. De hecho, no pueden serlo, porque por asociatividad y el hechoque c tiene inverso c−1,

a = c ◦ c−1 = (b ◦ c) ◦ c−1 = b ◦ (c ◦ c−1) = b,

lo cual es imposible. Entonces tenemos b ◦ b = c y b ◦ c = a, y la tabla es de laforma

◦ a b ca a b cb b c ac c ? ?

Ahora bien, como b ◦ c = a, el inverso de b es c, por lo que entonces el inverso dec es b, ası que c ◦ b = a, y tenemos

◦ a b ca a b cb b c ac c a b

(3.3)

Ya solo queda por mostrar que la propiedad asociativa se satisface, lo cual se debeverificar con todos los 27 posibles triples productos de a, b y c (o al menos con losde b y c, puesto que a es la identidad). Sin embargo, serıa mas facil ”reconocer” latabla (3.3) con una operacion conocida por nosotros, y que sepamos que satisfaceasociatividad.

Tal operacion esta dada por la suma de residuos modulo 3, es decir, los residuosde dividir entre 3. Dado un entero n ∈ Z, al dividir entre 3,

n = 3q + r,

los valores posibles para el residuo r son 0 (si n es multiplo de 3), 1 o 2. Ahora bien,si sumamos dos numeros n y m, ambos con residuo 1, la suma n+m tendra residuo2 al dividirlo entre 3:

n + m = (3q + 1) + (3q′ + 1) = 3(q + q′) + 2.

De manera similar, si sumamos dos numeros con residuo 2, el resultado tendra re-siduo 1, porque

n + m = (3q + 2) + (3q′ + 2) = 3(q + q′) + 4 = 3(q + q′ + 1) + 1.

Page 41: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 27

Si calculamos la tabla de suma de residuos modulo 3, obtenemos

+ 0 1 20 0 1 21 1 2 02 2 0 1

Podemos ahora observar la similitud entre esta tabla y la tabla (3.3). La corres-pondencia a ↔ 0, b ↔ 1 y c ↔ 2 nos permite concluır que, esencialmente, la sumade residuos modulo 3 es el unico grupo de tres elementos. Dicho grupo se denotapor Z3.

En general, el grupo de residuos modulo n se denota por (Zn, +). Este es ungrupo finito y Zn tiene n elementos, por lo que concluımos que, para cada enteropositivo n, existe un grupo finito con n elementos. Por ejemplo, la tabla de Z2

esta dada por+ 0 10 0 11 1 0

la cual es esencialmente la misma que la de {1,−1} con la identificacion 0 ↔ 1y 1 ↔ −1. Esto ya no es ninguna sorpresa, ya que habıamos conluıdo antes queexiste un unico grupo con dos elementos.

Por ejemplo, la tabla de Z4 es de la forma

+ 0 1 2 30 0 1 2 31 1 2 3 02 2 3 0 13 3 0 1 2

Problema 1. ¿Es este el unico grupo con cuatro elementos?

En la figura 3.1, podemos ver como representar el grupo Z4 como los cuartos

2

3 1

0

Figura 3.1: El grupo Z4, representado como un ciclo.

de un reloj, donde la suma representa el numero de rotaciones de 90◦ en el sentidode las manecillas del reloj. A los grupos Zn se les llama cıclicos, por el hecho depoder ser representados como un ciclo.

Desde luego, el grupo cıclico mas familiar esta dando entonces por las horas delreloj, Z12, como en la figura 3.2.

Page 42: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

28

0 123

6

9

54

78

1011

Figura 3.2: El reloj es una representacion cıclica del grupo Z12. Nota que, lascaratulas del reloj suelen indicar ”12” en lugar de ”0”.

3.3. Permutaciones

3.3.1. Rotaciones del cubo

En esta seccion estudiaramos una clase de grupos finitos llamados de permuta-

cion, los cuales definiremos mas adelante. Empezaremos con un ejemplo de estosgrupos que aparece de manera natural en geometrıa, el grupo de las rotaciones delcubo.

Recordemos primero que el cubo es un polihedro regular de seis caras, cada unade ellas un cuadrado, tales que todas las caras son cuadrados iguales, sus carasadyacentes forman angulos iguales con las aristas (90o), y dichas aristas se unenen vertices de tales que, en cada vertice se une el mismo numero de aristas (3).Vease la Figura 3.3.

Figura 3.3: Un cubo es un solido perfecto de seis caras.

El cubo tambien llamado un solido perfecto, o platonico, y es uno de los cincosolidos perfectos que existen: el tetrahedro (4 caras), el cubo (6 caras), el octahedro(8 caras), el dodecahedro (12 caras) y el icosahedro (20 caras). Estos polihedrostienen las mismas propiedades simetricas del cubo: todas sus caras son polıgonosregulares iguales, sus caras adyacentes forman angulos iguales con las aristas y encada vertice se une el mismo numero de aristas. No es muy difıcil ver que soloexisten cinco de dichos polihedros. Una demostracion basada en la formula deEuler puede ser encontrada en Courant & Robbins, What is Mathematics.

Las propiedades simetricas del cubo nos permiten concluır que, si rotamos el

Page 43: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 29

cubo 90o a traves de cualquiera de sus ejes, obtenemos una copia de el mismo; esdecir, no notamos la diferencia al realizar cualquiera de tales rotaciones. Decimosentonces que el cubo es simetrico respecto a las rotaciones de 90o a traves de susejes. Vease la figura 3.4.

Figura 3.4: El resultado de rotar al cubo 90o a traves de uno de sus ejes es indis-tinguible.

El conjunto de todas las posibles rotaciones forma un grupo, llamado el grupode rotaciones o simtras del cubo. Esto nos permite estudiar las simetrıas del cubode manera sistematica. Para iniciar nuestro estudio, numeramos los vertices del 1al 8 como en la figura 3.5. Una vez que hemos hecho esto, podemos identificar cada

1 2

8

3 4

5 6

7

Figura 3.5: Numeramos los 8 vertices del cubo.

rotacion del cubo con el resultado de aplicar la misma rotacion al cubo con susvertices numerados. Por ejemplo, el resultado de aplicar la rotacion de la figura3.4 (hacia atras) es el cubo de la figura 3.6. A esta rotacion le llamaremos R.

Podemos entonces identificar a la rotacion R como una funcion del conjunto{1, 2, 3, 4, 5, 6, 7, 8} en sı mismo, donde R(k) es la “nueva” posicion que tiene elvertice k despues de aplicar R con respecto a la posicion original. Por ejemplo, elvertice 1, despues de aplicar R, ahora esta en la posicion del 5, por lo que escribimosR(1) = 5. De la misma forma, R(2) = 6, R(3) = 1, etc. Esto lo podemos escribirde manera mas compacta, usando la notacion

R =

(1 2 3 4 5 6 7 85 6 1 2 7 8 3 4

), (3.4)

Page 44: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

30

1 2

3 4

5 6

7 8

12

3 4

5 6

7 8

Figura 3.6: El resultado de aplicar la rotacion R al cubo.

donde cada entrada en el segundo renglon de la arreglo en la ecuacion (3.4) es elresultado en cada vertice despues de aplicar la rotacion R.

Por ejemplo, si S representa la rotacion de 90o hacia la derecha, entonces tene-mos

S =

(1 2 3 4 5 6 7 82 4 1 3 6 8 5 7

).

Invitamos al lector a representar la rotacion S graficamente.3

Si aplicamos la rotacion R dos veces (equivalente a una rotacion de 180o),obtenemos una nueva posicion del cubo dada por

R2 =

(1 2 3 4 5 6 7 87 8 5 6 3 4 1 2

).

La notacion R2 significa aplicar R dos veces, tambien denotada como RR. Siaplicamos la rotacion R, y al resultado le aplicamos la rotacion S, obtenemos

SR =

(1 2 3 4 5 6 7 86 8 2 4 5 7 1 3

).

Notese que hemos esctrito SR y no RS para el resultado de aplicar R y luego S.Esto debe a la interpretacion como funciones a las rotaciones R y S. Si aplicamosR a k obtenemos R(k), y despues aplicamos S para obtener S(R(k)). Es por esoque escribimos

SR(k) = S(R(k)).

Por ejemplo, el vertice 3 va a R(3) = 1 depues de aplicar R, y luego a S(1) = 2despues de aplicar S. Es decir,

SR(3) = S(R(3)) = S(1) = 2.

Notamos tambien que, si primero aplicamos S y luego R obtenemos

RS =

(1 2 3 4 5 6 7 86 2 5 1 8 4 7 3

),

3Incluso, recomendamos construır un cubo con carton o algun material semejante. Esto ayu-dara a comprender mas facilmente las operaciones de esta seccion.

Page 45: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 31

por lo que conluımos que SR 6= RS. Es decir, la operacion dada por composicion

de rotaciones no es conmutativa.El numero de posiciones simetricas del cubo es igual a 24. Esto es porque el

cubo tiene 6 caras, y cada una tiene 4 lados. Es decir, hay cuatro formas de ponerel cubo sobre cada cara. Si llamamos “rotacion” a cada una de las posicionessimetricas del cubo, entonces tenemos que hay 24 rotaciones. El resultado de estaseccion es que el conjunto de estas rotaciones es un grupo.

Teorema 3.3.1. El conjunto de rotaciones del cubo forma un grupo de 24 elementos,con la operacion composicion dada por

RS(k) = R(S(k)).

Demostracion. Recordemos que para verificar que un conjunto con una operaciones un grupo, tenemos que verificar tres cosas:

1. La operacion es asociativa;

2. Existencia de un elemento identidad; y

3. Existencia de inversos.

La asociatividad es una propiedad de la composicion de funciones. Por un ladotenemos que

(RS)T (k) = RS(T (k)) = R(S(T (k)),

mientras queR(ST )(k) = R((ST )(k)) = R(S(T (k))),

por lo que entonces (RS)T = R(ST ). Ası que asociatividad se satisface.No es muy difıcil averiguar que la identidad debe ser la posicion “original”

del cubo, es decir, aquella dada por la figura 3.5. Esta la representamos por I , yentonces

I =

(1 2 3 4 5 6 7 81 2 3 4 5 6 7 8

).

Es facil ver que aplicar I no produce ningun cambio en las posiciones de los vertices,por lo que entonces RI = IR = R para cualquier rotacion R.

La inversa de una rotacion R es aquella en la que cada vertice regresa al lugarde origen. Es decir, si R(k) = l, entonces

R−1(l) = k.

Por ejemplo, la inversa de

R =

(1 2 3 4 5 6 7 85 6 1 2 7 8 3 4

)

esta dada por

R−1 =

(1 2 3 4 5 6 7 83 4 7 8 1 2 5 6

).

Page 46: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

32

Es decir, simplemente intercambiamos los renglones del arreglo que representa Ry luego escribimos sus columnas en orden ascendente respecto del primer renglon.

Hemos entonces verificado las tres propiedades requeridas. Por lo tanto, yahemos demostrado que el conjunto de rotaciones forma un grupo.

3.3.2. Permutaciones

El grupo de rotaciones del cubo es un subgrupo de lo que llamamos un grupode permutaciones. En esta seccion estudiaremos las permutaciones de un conjuntofinito y el grupo que forman.

Consideremos los numeros 1, 2, 3. Estos tres numeros de pueden ordenar en seisformas distintas:

1, 2, 3; 1, 3, 2; 2, 1, 3; 2, 3, 1; 3, 1, 2; y 3, 2, 1.

Cada uno de estos ordenes es llamado una permutacion del conjunto {1, 2, 3}.Cada permutacion puede ser identificada con una funcion biyectiva (es decir, unacorrespondencia unıvoca) del conjunto {1, 2, 3} en sı mismo. Por ejemplo, la tercerade las permutaciones anteriores puede ser identificada con la funcion

f =

(1 2 32 1 3

),

donde hemos utilizado la notacion de la seccion anterior. Es decir, la funcionf : {1, 2, 3} → {1, 2, 3} esta definida por f(1) = 2, f(2) = 1 y f(3) = 3.

En general, el grupo de permutaciones de n objetos, denotado por Sn, es elconjunto de biyecciones σ : {1, 2, . . . , n} → {1, 2, . . . , n} junto con la operacioncomposicion, es decir,

f ◦ g(k) = f(g(k)).

No es muy difıcil verificar las propiedades de grupo para Sn. Asociatividad esverificada de la misma forma que en la seccion anterior, y la identidad esta dadapor la funcion

id =

(1 2 . . . n1 2 . . . n

).

Es decir, la funcion id(k) = k. Dada σ ∈ Sn, su inverso σ−1 es simplemente lafuncion inversa de σ, la cual existe porque σ es una biyeccion.

Los grupos de permutaciones Sn tienen muchas propiedades, algunas de ellafaciles de verificar. Por ejemplo, cada grupo Sn puede ser identificado con unsubgrupo de Sn+1, a saber

H = {σ ∈ Sn+1 : σ(n + 1) = n + 1},

es decir el subgrupo de permutaciones que dejan fijo el objeto n + 1.

Page 47: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 33

De hecho, es posible demostrar que cualquier grupo finito G es un subgrupo deSn, donde n = |G|. Es suficiente con identificar cada g ∈ G con la permutacion

x 7→ gx,

para x ∈ G. Los detalles pueden ser consultados en cualquier texto de algebra.En particular, el grupo de rotaciones del cubo es un subgrupo S24, ya que tal

grupo tiene 24 elementos. Sin embargo, como el numero de vertices es 8, entoncesno es difıcil de ver que en realidad es un subgrupo de S8, ya que cada rotacion delcubo corresponde a alguna permutacion de sus vertices.

Sin embargo, aun es posible ser mas especıficos en este caso. Cada rotacion delcubo corresponde a una permutacion de sus diagonales, las cuales son cuatro: laprimera, a la que llamaremos D1, y que va desde el vertice 1 al 8; la segunda, D2,del 2 al 7; D3, del 3 al 6; y D4, del 4 al 5. En la figura 3.7 hemos marcado lasdiagonales D1 y D2.

3 4

5 6

1

87

2

Figura 3.7: Las diagonales D1 y D2 del cubo.

No es muy difıcil de verificar que a cada permutacion de las cuatro diagonalescorresponde una unica rotacion del cubo. Esto nos permite concluır que el grupode rotaciones del cubo es un subgrupo de S4. Sin embargo, S4 tiene exactamente24 elementos. Ası que podemos concluır el siguiente resultado, que enunciamoscomo teorema.

Teorema 3.3.2. El grupo de rotaciones del cubo es isomorfo a S4.

El lector esta invitado a describir los grupos de rotaciones de otras figurasgeometricas simples, como el tetrahedro o el octahedro. Ası mismo, es facil des-cribir el grupo de transformaciones de, por ejemplo, un cuadrado, donde talestransformaciones incluyen a las reflexiones, ademas de las rotaciones. Tal grupo esllamado el grupo dihedrico, y es de suma importancia en el estudio de ecuacionespolinomiales de grado 4. Vease por ejemplo [7].

3.3.3. Subgrupos normales

Cada rotacion del cubo, ademas, define una permutacion de sus tres ejes (rectasperpendiculares a sus caras). Ahora bien, como las permutaciones de sus tres ejes

Page 48: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

34

son solo 6, es claro que a cada permutacion de estas no le corresponden una unicarotacion del cubo.

Sin embargo, nos muy difıcil ver que a cada permutacion de los ejes le co-rresponden exactamente a cuatro rotaciones, a saber por el resultado de rotar elcubo alrededor de tales ejes, precisamente, 1800. De hecho, tal observacion permitedefinir una funcion del grupo de permutaciones de las diagonales al de los ejes,

φ : S4 → S3,

tal que “respeta” las operaciones de grupo, es decir,

φ(σ ◦ τ) = φ(σ) ◦ φ(τ)

para σ, τ ∈ S4. Tal funcion entre grupos es llamado un homeomorfismo.Uno puede verificar que el conjunto preimagen de la identidad en S3 bajo φ, es

decir el conjunto

{k ∈ S4 : φ(k) = id},

el cual es llamado el nucleo de φ y es denotado por kerφ, es de hecho un subgrupode S4. Este subgrupo, ademas, tiene la propiedad que, si k ∈ kerφ y σ ∈ S4,entonces

σ−1 ◦ k ◦ σ ∈ kerφ.

Un subgrupo con esta propiedad es llamado subgrupo normal, y tales grupos sonmuy importantes para estudiar la estructura del grupo origen. Vease, por ejemplo,[4].

En nuestro ejemplo φ : S4 → S3, kerφ esta dado por el subgrupo formado porlas permutaciones

id,

(1 2 3 42 1 4 3

),

(1 2 3 44 3 2 1

), y

(1 2 3 43 4 1 2

). (3.5)

Este grupo tiene cuatro elementos, pero no es isomorfo a Z4. De hecho, cualquierotro grupo de cuatro elementos es isomorfo a uno de estos dos.

El grupo formado por las permutaciones (3.5) es conocido como el grupo de

Klein. Felix Klein fue un matematico aleman de finales del siglo XIX, y a sutrabajo se le debe la importante relacion entre el algebra y la geometrıa, de la cualseguiremos hablando en esta notas.

3.4. Transformaciones del plano

3.4.1. Transformaciones lineales

En esta seccion estudiaremos algunas de las transformaciones geometricas delplano, al cual desde ahora denotaremos como R2, conocidas por transformaciones

Page 49: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 35

lineales. Estas incluyen las rotaciones alrededor del origen, y las reflexiones conrespecto a rectas, tambien pasando por el origen.

La mejor manera de describir estas transformaciones es la siguiente. Identifica-mos cada punto (x, y) ∈ R2 en el plano con un vector, el cual denotaremos de laforma

v =

(xy

). (3.6)

Geometricamente, el vector (3.6) se puede interpretar con el segmento dirigidodesde el origen (0, 0) hasta el punto (x, y), como en la figura 3.8.

( yx)

x

y

Figura 3.8: El vector v, identificado geometricamente en el plano.

Tenemos dos operaciones basicas en el plano: suma de vectores y multiplicacion

escalar. La primera se define mediante sumar cada una de las coordenadas de dosvectores: (

xy

)+

(uv

)=

(x + uy + v

); (3.7)

mientras que, para cualquier numero real λ ∈ R, llamados escalares, la multipli-cacion por el escalar λ se define como

λ

(xy

)=

(λxλy

). (3.8)

La suma se puede interpretar geometricamente como el resultado de sobreponerun vector sobre el extremo de otro, como se aprecia en la figura 3.9. Ademas, estasuma satisface las siguientes propiedades.

Proposicion 3.4.1. Si u, v, w son vectores en R2, entonces

1. (u + v) + w = u + (v + w) (propiedad asociativa);

2. u + v = v + u (propiedad conmutativia);

3. u + 0 = v, donde

0 =

(00

)

(elemento neutro);

Page 50: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

36

( )uv

yx( )

( )uv

( )x+uy+v

Figura 3.9: La suma de dos vectores.

4. u + (−u) = 0, donde, si u =

(u1

u2

), entonces

−u =

(−u1

−u2

)

(elemento inverso).

Es decir, la suma de vectores forma un grupo abeliano. La demostracion detodas las propiedades anteriores es un muy simple y la dejamos al lector.

Por otro lado, la multiplicacion escalar forma lo que es llamado una accion sobreel grupo de aditivo de vectores. Es decir, satisface las siguientes propiedades.

Proposicion 3.4.2. Si u y v son vectores en R2 y λ y µ son escalares, entonces

1. 1u = u;

2. λ(µv) = (λµ)v;

3. λ(u + v) = λu + λv;

4. (λ + µ)u = λu + µu.

Igual que en el caso anterior, la verificacion de todas estas propiedades es muysencilla y de nuevo la dejamos al lector. La multiplicacion escalar se puede in-terpretar geometricamente como un “cambiuo de escala”, como se muestra en lafigura 3.10.

Ahora sı estamos listos para definir las transformaciones lineales del plano.

Definicion. Decimos que la funcion T : R2 → R2 es una transformacion lineal si ,para u, v ∈ R2 y λ ∈ R,

T (u + v) = T (u) + T (v)

T (λu) = λT (u).

Page 51: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 37

( yx)

( yx)λ

Figura 3.10: La multiplicacion escalar. En esta figura suponemos que λ > 1.

Es decir, las transformaciones lineales preservan las operaciones de suma ymultiplacion escalar de R2, llamadas, de hecho, operaciones lineales.

El ejemmplo mas simple es la transformacion cero, denotada por O, dada por

O(u) = 0

para todo vector u ∈ R2. Esta transformacion tambien es llamada trivial.Otro ejemplo simple de una transfomacion lineal es la transformacion identidad,

definida porT (u) = u

para todo vector u.Las dos transformacion anteriores son casos particulares de las transformaciones

escalares, dadas simplemente por una multiplicacion escalar. Es decir,

T (u) = λu

para todo u, donde λ es un escalar. La verificacion de que esta es una transfor-macion lineal se sigue directamente de las propiedades de multiplicacion escalarenumeradas en la proposicion 3.4.2.

Otro ejemplo de una transformacion lineal es la funcion T : R2 → R2 dada por

T

(u1

u2

)=

(u1 + u2

2u1 − u2

).

Para verificar que T es una transformacion lineal, tomamos otro vector v =

(v1

v2

)

y verificamos

T (u + v) = T((

u1

u2

)+

(v1

v2

) )= T

(u1 + v1

u2 + v2

)=

((u1 + v1) + (u2 + v2)2(u1 + v1) − (u2 + v2)

)

=

(u1 + u2 + v1 + v2

2u1 − u2 + 2v1 − v2

)=

(u1 + u2

2u1 − u2

)+

(v1 + v2

2v1 − v2

)

= T

(u1

u2

)+ T

(v1

v2

)= T (u) + T (v).

Page 52: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

38

En general, cualquier transformacion lineal T : R2 → R2 esta definida de laforma

T

(u1

u2

)=

(au1 + bu2

cu1 + du2

).

Esto se puede concluır de la siguiente manera. Si T : R2 → R2 es lineal, y enlos vectores

e1 =

(10

)y e2 =

(01

)

esta dada por

T (e1) =

(ac

)y T (e2) =

(bd

),

respectivamente, entonces, para cualquier vector

u =

(u1

u2

),

la linealidad de T y la observacion u = u1e1 + u2e2 implican que

T (u) = T (u1e1 + u2e2) = u1T (e1) + u2T (e2) = u1

(ac

)+ u2

(bd

)=

(au1 + bu2

cu1 + du2

),

como querıamos demostrar.Tenemos entonces que la transformacion T esta completamente determinada

por el arreglo de cuatro numeros

A =

(a bc d

),

el cual es llamado la matriz inducida por la transformacion T . Como la matrix Aesta determinada por la transformacion T tanto como T esta determinada por A,solemos representar T por la matriz A, y escribimos simplemente

Au =

(a bc d

) (u1

u2

)=

(au1 + bu2

cu1 + du2

).

A la expresion Au se le llama la multiplicacion del vector u por la matriz A.La representacion de una transformacion por medio de su matriz inducida tiene

muchas ventajas, las cuales seran explotadas en el resto de estas notas.

3.4.2. El determinante

Dos vectores en R2, si no son paralelos, forman un paralelogramo al extendersus extremos con copias paralelas entre sı, como se muestra en la figura 3.11. Enla figura se observa que los vectores

u =

(ac

)y v =

(bd

)

Page 53: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 39

b a a+b

d

c+d

c

Figura 3.11: El paralelogramo formado por dos vectores.

forman el paralelogramo con vertices en los puntos (0, 0), (a, c), (b, d) y (a+b, c+d).El area de dicho paralelogramo esta dado por el valor absoluto de la diferencia entreel area del rectangulo que cubre al paralelogramo (con lados [0, a + b] y [0, c + d])y las areas de los triangulos y trapecios a su alrededor, es decir, el area esta dadapor el valor absoluto de

(a + b)(c + d) −1

2ac −

1

2

(c + (c + d)

)b −

1

2bd −

1

2

(b + (a + b))c = ad − bc.

Ahora bien, si los vectores u y v son el resultado de aplicar la transformacion Ta los vectores e1 y e2, quienes forman el cuadrado Q = [0, 1] × [0, 1], entoncesobservamos que el area de la imagen de Q bajo T , T (Q), es igual al area delparalelogramo de la figura 3.11, |ad − bc|. Es decir,

Area(T (Q)

)= |ad − bc|Area(Q) = |ad − bc|, (3.9)

porque el area de Q es igual a 1.A la expresion ad − bc se le denomina el determinante de T , y se denota por

det(T ). Por la observacion al final de la seccion anterior, T esta determinada porla matriz

A =

(a bc d

),

por lo que simplemente escribimos

det(A) = det

(a bc d

)= ad − bc. (3.10)

Es facil observar que la transformacion T tiene el mismo efecto sobre el area decualquier paralelogramo P . Es decir, si P es un paralelogramo, entonces

Area(T (P )

)= | det(T )|Area(P ).

Page 54: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

40

Esto implica (aunque debemos verificar que los signos terminen correctamente, locual no es difıcil) que, si T : R2 → R2 y S : R2 → R2 son trasformaciones linealesentonces

det(T ◦ S) = det(T ) det(S). (3.11)

Si T y S inducen la matrices A y B respectivamente, donde

A =

(a bc d

)y B =

(p qr s

).

Uno puede verificar que la transformacion T ◦ S induce la matriz(

ap + br aq + bscp + dr cq + ds

). (3.12)

La matriz (3.12) es llamada la multiplicacion de A y B, y se denota por AB. Sicombinamos (3.11) y (3.12) obtenemos el siguiente teorema.

Teorema 3.4.3. Si A y B son matrices, entonces

det(AB) = det(A) det(B).

El teorema 3.4.3 es muy importante para estudiar la matrices de transforma-ciones en R2 (llamadas comunmente matrices de 2× 2, refiriendose al tamano delarreglo que las representa). Haremos uso de este teorema mas adelante.

3.4.3. El grupo GL2

La multiplicacion de matrices es asociativa, es decir

A(BC) = (AB)C

para cualquiera tres matrices A, B y C. Esto se sigue por el hecho que la multi-plicacion de matrices es inducida por la composicion de transformaciones, la cualhemos visto que es asociativa en las secciones anteriores.

La matriz inducida por la transformacion identidad u 7→ u es llamada la matriz

identidad, y esta dada por

I =

(1 00 1

).

Desde luego, esta matriz actua como identidad en la multiplicacion de matrices,es decir

AI = IA = A

para cualquier matriz A.Por lo tanto, solo se requiere la existencia de matrices inversas, es decir, para

cada A una matriz B tal que AB = BA = I , para cumplir con la definicion de ungrupo. Sin embargo, esto no se cumple. Por ejemplo, si

A =

(1 00 0

),

Page 55: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 41

entonces, para cualquier matriz B =

(a bc d

),

AB =

(1 00 0

) (a bc d

)=

(a b0 0

),

por lo que nunca obtenemos la identidad. Es decir, la matriz no tiene inversa.

Dada una matriz, decimos que A es invertible si tiene inversa, es decir, si existeuna matriz B tal que

AB = BA = I.

A la matriz B se le llama la inversa de A y se denota por A−1. Si A no es invertible,decimos que es singular.

El conjunto de las matrices invertibles forma entonces un grupo, y es denotadopor GL2. Este es llamado el grupo lineal general. Estudiaremos a continuacion estegrupo con mas detenimiento.

El determinante nos ofrece un criterio para determinar si una matriz es invertibleo no. De hecho, es facil ver que si A es invertible entonces det A 6= 0 porque, delteorema 3.4.3,

1 = det I = det(AA−1) = det A det A−1,

de lo cual se concluye que det A 6= 0 y

det A−1 =1

det A.

Mas aun, tenemos el siguiente resultado.

Proposicion 3.4.4. Sea A una matriz de 2×2. Si det A 6= 0, entonces A es invertible.

La demostracion de esta proposicion se sigue solo con verificar que, si

A =

(a bc d

)

la inversa de A esta dada por

A−1 =1

det A

(d −b−c a

).

3.4.4. Subgrupos de GL2

El grupo GL2 contiene muchos subgrupos importantes. En esta seccion descri-biremos a algunos de ellos. Empezamos por el grupo SL2, llamado el grupo lineal

especial, que esta dado por

SL2 = {A ∈ GL2 : det A = 1},

Page 56: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

42

es decir, las matrices con determinante igual a 1. La razon por la cual SL2 es unsubgrupo de GL2 esta garantizada por el teorema 3.4.3, ya que si det A = det B =1, entonces

det(AB) = det A det B = 1,

por lo que si A, B ∈ SL2 entonces AB ∈ SL2. Mas aun, SL2 es un subgruponormal, es decir, es la preimagen de la identidad bajo un homomorfismo. En estecaso, el teorema 3.4.3 establece que el determinante define un homomorfismo entreGL2 y el grupo multiplicativo de los numeros reales positivos. La identidad de estegrupo multiplicativo es 1, por lo que entonces

SL2 = kerdet .

Por lo tanto SL2 es un subgrupo normal de GL2.Otro subgrupo importante es el de las matrices ortogonales. Decimos que una

matriz invertible A es ortogonal si A−1 = At, donde At es la transpuesta de A. SiA esta dada por

A =

(a bc d

),

entonces su transpuesta esta dada por

At =

(a cb d

).

No es muy difıcil demostrar que

(AB)t = BtAt,

lo cual se puede verificar calculando explicitamente las multiplicaciones. Entonces,si A y B son ortogonales,

(AB)−1 = B−1A−1 = BtAt = (AB)t,

por lo que AB es tambien ortogonal. El grupo de matrices ortogonales se denotapor O2.

Las matrices ortogonales preservan los angulos entre los vectores. Es decir, si elangulo entre los vectores u y v es θ, entonces el angulo entre Au y Av, si A ∈ O2,es tambien θ, como se ve en la figura 3.12.

Para cualquier matriz A, det At = det A, por lo que, si A es ortogonal, entonces

1 = det I = det(AA−1) = det A det A−1 = det A det At = (det A)2.

Entonces, si A es ortogonal, su determinante es 1 o −1.Podemos conluır que el determinante nos da un homomorfismo de O2 al grupo

con dos elementos {1,−1}, el cual, como ya habıamos visto, es isomorfo a Z2.

Page 57: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 43

θ

Au

Avθ u

v

Figura 3.12: La aplicacion de una transformacion ortogonal no modifica el anguloentre los vectores.

El nucleo de det en O2, dado por las matrices ortogonales con determinanteigual a 1, es llamado el grupo ortogonal especial, y lo denotamos por SO2. Lasmatrices en SO2 son inducidas por las rotaciones, y todas son de la forma

A =

(cos θ − sen θsen θ cos θ

).

Hablaremos con mas detalle de estos subgrupos de GL2 mas adelante en es-tas notas. Sin embargo, debemos de hacer notar que solo hemos considerado lastransformaciones del plano, y que uno puede estudiar las transformaciones linealesde espacios de dimension mayor. El lector puede indagar en cualquier texto dealgebra lineal, como por ejemplo [1].

3.5. Grupos de Lie

3.5.1. Los numeros reales

Los numeros reales forman un grupo bajo la operacion suma

(x, y) 7→ x + y.

Es facil verificar la definicion de grupo de esta operacion, y es facil identificar a laidentidad: el numero 0. Sin embargo, lo que discutiremos aquı es su fina estructuraque nos permite calcular lımites y, por ende, derivadas.

Si f : R → R es una funcion en los numeros reales, y x0 ∈ R, definimos suderivada en x0 como

f ′(x0) = lımh→0

f(x0 + h) − f(x0)

h, (3.13)

si el lımite existe. En tal caso, decimos que f es diferenciable en x0. Lo que nosinteresa observa ovservar en este momento es la invariabilidad de la derivada de fbajo la operacion del grupo, es decir, bajo la suma.

Page 58: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

44

Dada una funcion f : R → R y a ∈ R, definimos la traslacion de f en a comola funcion

g(x) = f(x − a).

Esta nueva funcion es llamada traslacion, porque la grafica de la funcion g esprecisamente la traslacion la grafica de f por a unidades, como en la figura 3.13.

f(x)

a

g(x) = f(x−a)

Figura 3.13: La traslacion de la funcion f .

La principal observacion que haremos es la siguiente.

Proposicion 3.5.1. La derivada es invariante bajo traslaciones. Es decir, si f esdiferenciable en x0 y g(x) = f(x − a), entonces g es diferenciable en g(x0 + a) y

g′(x0 + a) = f ′(x0).

Esta proposicion se sigue facilmente de la identidad

g(x0 + a + h) − g(x0 + a)

h=

f(x0 + h) − f(x0)

h,

y suele escribirse (informalmente) como

d

dxf(x − a) =

df

dx(x − a).

Es decir, el efecto de tomar traslaciones, o equivalentemente, de aplicar la ope-racion del grupo en R (suma) en el argumento de la funcion de f no modifica ladiferenciabilidad ni en el valor de la derivada de f en cualquier punto dado.

Los grupos que poseen una estructura suficientemente fina como para poderdefinir derivadas, y relacionar estas derivadas con la operacion del grupo, sonllamados grupos de Lie. Abundan los textos sobre grupos de Lie, por ejemplo[3]. Discutiremos otros ejemplos de grupos de Lie a continuacion, principalmentegrupos de matrices.

Page 59: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 45

3.5.2. S1 y SO2

El cırculo unitario, denotado por S1, esta definido como el conjunto de puntosen el plano que se encuntran a distancia 1 del origen, es decir

S1 = {(x, y) ∈ R2 :√

x2 + y2 = 1}.

Vease la figura 3.14. Los puntos en el cırculo pueden parametrizarse, es decir

1

θ

Figura 3.14: El cırculo unitario S1 en el plano.

describirse, por medio del angulo θ que forma este punto con respecto al eje x.Si los puntos x y y corresponden a angulos θ y τ , respectivamente, entonces

definimos la suma de x y y como el punto que forma el angulo

θ + τ,

es decir, simplemente sumamos los angulos de los puntos. Como podemos identi-ficar los angulos con un unico numero entre 0 y 2π, es decir, 0 ≤ θ < 2π, entoncespodemos asumir que

0 ≤ θ + τ < 2π,

aun cuando la suma real de los numeros θ y τ sea mayor o igual a 2π. Con estodecimos que estamos operando modulo 2π.

Es claro que con esta operacion, el cırculo S1 forma un grupo. Su identidadesta dada por el punto (1, 0) en el eje x, el cual forma un angulo θ = 0, y queel inverso de cada punto (a, b) con angulo θ es el punto (a,−b), el cual forma unangulo de 2π − θ (el cual podemos identificar simplemente con −θ) con el eje x.

Este grupo tambien posee una estructura diferenciable compatible con su ope-racion. De hecho, localmente, la estructura diferencial de S1 es esencialmente lamisma que la de R1, en el siguiente sentido.

Supongamos que x ∈ S1 con angulo θ0 6= 0. Entonces θ0 ∈ (0, 2π) ⊂ R, por loque, si f : S1 → R es una funcion en el cırculo, la podemos restringir e identificarcon la funcion f : (0, 2π) → R sobre R. Ası que podemos definir su derivada en xcomo

Df(x) = f ′(θ0),

Page 60: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

46

es decir, como la derivada de f en θ0.Si θ0 = 0, entonces podemos identificar a f con una funcion en (−π, π), y proce-

der como antes. Podemos observar que esto implica que las funciones diferenciablesen S1 pueden ser vistas como funciones periodicas diferenciables en R, con perıodo2π, es decir, con las funciones que satisfacen

f(x) = f(x + 2π)

para todo x ∈ R.S1 tambien lo podemos identificar como un grupo de matrices. De hecho, es

isomorfo a SO2, el grupo de matrices ortogonales con determinante igual a 1. SiA ∈ SO2, entonces

AtA = I y det A = 1.

Si

A =

(a bc d

),

entonces las ecuaciones anteriores implican que

a2 + c2 = 1

b2 + d2 = 1

ab + cd = 0

ad − bc = 1.

La primera de las ecuaciones implica que existe un θ tal que

a = cos θ y c = sen θ,

mientras que la segunda y tercera implican que

b = ± sen θ y d = ∓ cos θ.

Como, ademas, ad − bc = 1, tenemos que

b = − sen θ y d = cos θ,

ası que la matriz A es de la forma

A =

(cos θ − sen θsen θ cos θ

),

como lo habıamos mencionado en la seccion anterior.Si identificamos el punto x ∈ S1 con angulo θ con la matriz

(cos θ − sen θsen θ cos θ

),

Page 61: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 47

tenemos entonces una funcion Ψ : S1 → SO2 que respeta las operaciones delgrupo, es decir,

Ψ(x + y) = Ψ(x)Ψ(y)

para todo x, y ∈ S1. Esto se debe a que

(cos θ − sen θsen θ cos θ

) (cos τ − sen τsen τ cos τ

)

=

(cos θ cos τ − sen θ sen τ − cos θ sen τ − sen θ cos τsen θ cos τ + cos θ sen τ − sen θ sen τ + cos θ cos τ

)

=

(cos(θ + τ) − sen(θ + τ)sen(θ + τ) cos(θ + τ)

),

por las identidades trigonometricas usuales.

Es claro que esta identificacion induce una identificacion local de SO2 con R, porlo que el grupo SO2 posee a su vez la estructura inducida por dicha identificacion.

Mas aun, SO2 y su estructura diferenciable nos ayuda a entender mas la estruc-tura de las funciones en el plano R2. Como SO2 es el grupo de rotaciones, juegaun rol clave en el llamado analisis armonico. El lector puede leer sobre la relacionentre SO2 y la transformada de Fourier, por ejemplo, en [6].

3.5.3. SL2

SO2 no es el unico grupo de matrices que posee una estructura diferencial. Dehecho, GL2 y el resto de los grupos vistos en la seccion anterior poseen estructurasdiferenciables. Nos limitaremos aquı a observar ecplıcitamente dicha estructura enel caso de SL2.

Si A ∈ SL2, digamos

A =

(a bc d

),

entonces ad − bc = 1. Si a 6= 0, entonces

d =bc + 1

a,

y podemos descomponer A de la forma

A =

(1 0

c/a 1

) (1 ab0 1

) (a 00 1/a

).

Podemos ver que, localmente, podemos generar a SL2 por medio de las matrices

(1 0t 1

),

(1 s0 1

), y

(r 00 1/r

),

Page 62: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

48

con r 6= 0. Es decir, podemos idenficar la tercia (t, s, r), r 6= 0, con una matriz enSL2 e, inversamente, cada matriz en SL2 con la tercia

(c/a, ab, a), a 6= 0.

Es claro que el conjunto de las tercias (t, s, r), r 6= 0, tiene una estructura diferen-ciable, simplemente tomando la derivada de una funcion f(t, s, r) en cada una delas variables t, s y r. Dichas derivadas son denominadas derivadas parciales, y sontan utiles para entender las funciones de tres variables como la derivada de unafuncion en R. Vease, por ejemplo, [5].

Si a = 0, entonces como ad − bc = −bc = 1, b 6= 0 y A es de la forma

A =

(0 b

−1/b d

)=

(0 1−1 d/b

) (1/b 00 b

),

por lo que podemos generar SL2 localmente por medio de las matrices(

0 1−1 t

)y

(t 00 1/t

),

y proceder como antes.Mientras que el grupo SO2 es muy util en el estudio de las propiedades del plano

R2, el grupo SL2, junto con su estructura diferenciable, nos ayuda a entender laestructura de otro objeto geometrico, el plano hiperbolico. El plano hiperbolicoposee una estructura geometrica en la cual por un punto exterior a una rectaexiste mas de una recta paralela, y los angulos interiores de un triangulo sumanmenos que 180 grados. El lector esta cordialemente invitado a indagar mas sobreel plano hiperbolico y la accion de SL2. Vease, por ejemplo, [2].

3.6. Conclusiones

Podemos observar que la idea de grupo es basica en las matematicas modernas,desde el estudio de las operaciones mas simples donde los grupos finitos aparecende manera natural, hasta en el estudio de la geometrıa o el calculo en una o masvariables.

Sin embargo, mas que el concepto de grupo en sı, lo importante es el hecho deque podemos entender mucho mejor un problema matematico si lo vemos desdeun punto de vista mas general, como miembro de una estructura mas amplia.Esta vison nos ofrece la capacidad de identificar las propiedades esenciales de unaestructura particular, resaltandolas de aquellas que no son relevantes en el estudiode un problema dado.

Esta idea es clave en el desarrollo de las matematicas, y ha llevado al descubri-miento de muchos conceptos generales y que aparecen inevitablemente en muchasareas de las matematicas: la teorıa de conjuntos, la topologıa o el analisis funcionalson algunos ejemplos, cuyo descubrimiento ha permitido gran parte del desarrollode las matematicas del siglo XX.

Page 63: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Bibliografıa

[1] Axler, Sheldon, Linear Algebra Done Right, 2nd edition, Springer, 1997

[2] Helgason, Sigurdur, Topics in Harmonic Analysis on Homogeneous Spaces,Birkhauser, 1981

[3] Knapp, Anthony W., Lie Groups Beyond an Introduction, Birkhauser, 1996

[4] Rotman, Joseph J., The Theory of Groups: An Introduction, 2nd edition, AllynAnd Bacon, 1973

[5] Spivak, Michael, Calculus on Manifolds, Addison-Wesley, 1965

[6] Stein, Elias M. and Weiss, Guido, Introduction to Fourier Analysis on Eucli-

dean Spaces, Princeton University Press, 1971

[7] Stewart, Ian, Galois Theory, 2nd edition, Chapman & Hall, 1989

49

Page 64: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

50

Page 65: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Capıtulo 4

Platicas de Fısica

51

Page 66: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

52

Page 67: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 53

4.1. Los errores de Einstein

Jorge Alberto Lopez Gallardo1

Physics Department, University of Texas at El Paso500 W. University Ave, El Paso, TX 79968, US

4.1.1. El cientıfico del siglo

Albert Einstein, nombrado el cientıfico del siglo XX por la prensa mundial,tuvo muchos aciertos. Explico el movimiento Browniano, el efecto fotoelectrico,descubrio el principio que permite el efecto de amplificacion de luz en laseres,gano el premio Nobel en 1925, y -por supuesto- creo la teorıa de la relatividad,pero -aunque es desconocido por la mayorıa de la gente- tambien tuvo su serie dedesatinos.

En 1911 uso sus ecuaciones mal para calcular la deflexion de la luz por el sol.No acepto la expansion del universo que implicaba su relatividad general (la quisosuprimir con su “constante universal”). En los 1920s produjo teorıas de campounificados equivocadas a una velocidad prodigiosa (¡la de 1929 incluıa antigrave-dad!). Nunca acepto la falta de determinismo de la mecanica cuantica (hizo sufamoso enunciado de que Dios no jugo a los dados con el universo, y erroneamentele invento variables escondidas a la teorıa cuantica).

Ahora, al cumplirse 100 anos del “Annus mirabilis” (ano milagroso) de Einstein,cuando publico las explicaciones del movimiento Browniano, del efecto fotoelectri-co, y propuso la teorıa especial de la relatividad, la comunidad cientıfica interna-cional vuelve a la carga asignandole credito por las observaciones recientes de laaceleracion del universo. En vista de los (sonados) exitos y (olvidados) fracasos deeste popular cientıfico, vale la pena revisar este ultimo fenomeno para decidir si elcredito postumo es merecido o no.

4.1.2. Su error mas grande

El credito en disputa esta relacionado con lo que Einstein llamo “su error masgrande”. Einstein postulo la teorıa general de la relatividad en 1915. Sus calculossobre el universo completo lo llevaron a la conclusion de que el universo se tenıaque expandir o contraer. Como esto no le gusto, posiblemente por sus implicacionesreligiosas, Einstein postulo la existencia de una “energıa del vacıo”.

La idea era que, al considerar al universo como una esfera de materia, esta masatendrıa una energıa total igual a la suma de la energıa cinetica mas la gravitacionalE = mv2/2−GmM/r. Para que el universo estuviera estatico, la energıa cineticatendrıa que ser cero, y pero como la atraccion gravitacional harıa que el universose contrajera, entonces se necesitarıa otra fuerza “misteriosa” que impidiera esta

[email protected]

Page 68: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

54

contraccion. Para evitar esta inestabilidad, Einstein “corrigio” el problema into-duciendo una “constante universal” equivalente a una fuerza aun no detectada.

4.1.3. Y entonces llego la fama

El momento era propicio para creer todo lo que Einstein afirmaba. En 1919,Eddington, al observar un eclipse solar en Africa, confirmo la existencia de ladeflexion de la luz por la masa del sol como habıa sido predicho por la teorıa de larelatividad. Esta confirmacion le trajo fama y fortuna a Einstein; el periodico inglesLondon Times cabeceo estos logros como “La revolucion de la ciencia, Einstein

versus Newton”.

Pero pronto llego la afrenta. El 29 de junio de 1922, el matematico ruso Alek-sandr Aleksandrovich Friedmann encontro soluciones a las ecuaciones de Einsteinen las que el radio de un universo estable (es decir, que no se colapsarıa) podrıacrecer sin lımite u oscilar periodicamente. Esto asesto una punalada (que termi-narıa siendo mortal) a la constante universal de Einstein. Como respuesta unica(debido a un viaje a Japon), 18 de septiembre de 1922 Einstein se limito a decir queel estudio de Friedmann “esta sospechoso para mı, las soluciones no parecen sercompatibles”. Al regreso de su viaje, y en parte por la intervencion de Ehrenfest,el 31 de mayo de 1923 Einstein se retracto de su crıtica afirmando “Mi objecionestaba basada en un error de calculo”. Sin embargo, al aceptar la existencia deotras soluciones a sus ecuaciones, Einstein no aceptaba de facto la expansion deluniverso que implicaban los resultados de Friedmann.

Y a la afrenta le siguio la derrota. En 1929, el astronomo estadunidense, EdwinHubble, detecto la expansion del universo por medio del efecto Doppler en elespectro de hidrogeno galactico. Al descubrir que galaxias remotas se alejan denosotros a velocidades proporcionales a las distancias que nos separan, Hubblededujo que el universo estaba en expansion constante. Inmediatamente esto diolugar a la teorıa de la gran explosion que explica exitosamente el origen del universoa partir de una explosion inicial.

Confrontado con explicaciones teoricas y observaciones experimentales, en 1933Einstein acepto la expansion, diciendo que la gran explosion es la explicacion de lacreacion mas bella y satisfactoria que jamas haya escuchado, y catalogo a su ideade la “constante universal” como “su error mas grande”. Sin mas argumentos, elcientıfico se olvido del tema para dedicarse a disfrutar la fama.

A partir de ese momento, Einstein se dedicarıa los 20 anos restantes de suvida a inventar teorıas de campo unificado, que -a pesar de proveer un formatointeresante para futuro desarrollo del campo- nunca llegaron a ningun lado. Pauli,hablando de estos intentos, dijo: “La energıa tenaz de Einstein nos garantiza enpromedio una teorıa por ano, cada una de las cuales es usualmente consideradapor el autor como la solucion definitiva”.

Page 69: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 55

4.1.4. La gran explosion

La argumentacion reciente que pretende revivir la desinflada constante univer-sal de Einstein, tienen que ver con mediciones mas exactas de la expansion deluniverso.

La expansion del universo ha sido confirmada tanto por el corrimiento del rojo,es decir por el efecto Doppler en el espectro de hidrogeno descubierto por Hubble,como por la radiacion del fondo. Al crearse el universo en una gran explosion, lamateria estuvo compuesta no de atomos y moleculas como la conocemos hoy, sinode quarks, gluones, y fotones, partıculas componentes de los protones y neutrones.Muy pronto despues de la explosion inicial (pronto respecto a la velocidad a la quecorre el tiempo en nuestro parte del universo, i.e. algunos segundos), los quarks secoagularon formando protones y neutrones y, en algun momento, dejaron suficienteespacio libre para que los fotones pudieran escapar agrandando ası el tamano deluniverso a una velocidad mayor.

La luz remanente, que no fue capturada por las particulas que existıan en aquelentonces y que prosiguieron su camino cruzando el universo por millones de anos,fue detectada primero, en los 70s, por Wilson y Penzias, y despues, en los 90s,por la colaboracion COBE. Esta radiacion de fondo, como es conocida, es pruebadirecta de la expansion del universo.

Hoy en dıa la expansion del universo se toma con un hecho. Se sabe, por ejemplo,que esta expansion hace que las galaxias se separen entre sı como las pasas en unpan al ser horneado. Esta separacion es mayor para objetos mas distantes; lasgalaxias mas lejanas se mueven mas rapido. La relacion entre la velocidad deseparacion y la distancia que hay entre dos objetos se conoce como la constante

de Hubble: H = v/r ≈ 70 km/s/Mpc. Asimismo si tomamos la velocidad maximade spearacion como la velocidad de la luz, c, el radio maximo del universo esRmax = vmax/H ≈ 6000 Mpc ≈ 2 × 1023 Km = 2 × 1010 anos-luz.

Sin embargo, el futuro del universo aun no esta bien determinado. El hecho deque el universo se este expandiendo no significa que lo vaya a hacer por siempre.dependiendo de la cantidad de masa que exista en el universo, este puede llegar auna expansion maxima, detenerse, para despues empezar a contraerse hasta llegara un gran apreton. Este futuro esta determinado por la densidad de la materia. Siesta tiene un valor crıtico el universo llegara a un tamao y lo mantendra eterna-mente; si la densidad es menor a la crıtica, se volvera a colapsar, y si es mayor,seguira expandiendose eternamente.

Esta densidad depende de la composicion del universo, es decir de los com-ponentes de la materia. La materia conocida hasta ahora no es suficiente paradetener la expansion, para llegar a valores super-crıticos de la densidad se necesitaque exista otro tipo de materia aun no conocida.

Pero hay nuevos resultados, recientemente se puso en funcionamiento un meca-nismo espacial que permite la deteccion de luz proveniente de zonas remotas deluniverso, es decir, luz que salio de su origen muchos miles de millones de anos yque nos puede dar informacion sobre como era la expansion del universo en aquel

Page 70: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

56

entonces.Dado que la intensidad de la luz que recibimos se reduce en proporcion inversa

la cuadrado de la distancia a la fuente, ∝ r−2, para detectar luz de fuentes remotases necesario que esta fuente sea suficientemente potente. Una tipo de fuente posibleson las supernovas que al explotar emiten energı millones de veces superior a lasde las estrellas. Desgraciadamente, este fenomeno es imposible de predecir conexactitud y es muy difıcil observar estas explosiones estelares.

Recientemente, este problema se ha resuelto parcialmente con el uso de satelitestrabajando en conjunto con telescopis terrestres. Haciendo mapeos computarizadosdel universo, los telescopis terrestres logran detectar explosiones supernovas, lasque son comunicadas instantaneamente a telescopios espaciales (Hubble) y a losgrandes telescopis terrestres (Cerro Tololo, WIYN, etc.). Esto permite la capturade informacion de cientos ed supernovas que antes pasaban desapercibidas.

Y son los resultados de estos estudios los que han aportado varias sorpresasal estudio de la cosmologıa. Datos de supernovas muy lejanas han llegado concorrimientos distinto al esperado. Lo cual implica que la velocidad de expansiondel universo, cuando las supernovas ocurrieron, era menor a la actual. Esto implicaque la expansion del universo no ha sido constante, y que era mas lenta al principio.Lo cual nos presenta ahora con la posibilidad de que el universo se este acelerando.

¿Que podrıa estar causando esta aceleracion? Debido a que la gravedad essiempre atractiva, si acaso, el universo se deberia de estar frenando. Entonces,¿de que manera se podrıa estar acelerando? ¿Existira materia con antigravedad?¿Energıa oscura?

Y ahı es donde entran en accion los adoradores de los iconos, que es en lo quese ha convertido nuestro controversial cientifico Einstein. Algunos investigadoreshan postulado la existencia –a la Einstein– de una nueva “constante universal”como la que el postulo, y con esto tratan de reivindicar al cientıfico mas grandedel siglo pasado. ¿Acaso el error mas grande de Einstein fue en realidad su mayortriunfo postumo? Quedan muchas preguntas sin respuesta

Entre estas preguntas hay algunas demasiado profundas para ser resueltas deinmediato: ¿Que es la energıa oscura? ¿Como se relaciona esta nueva forma demateria con el resto de la fısica? ¿Sera observable? ¿Que significa para el futurode la ciencia?

4.1.5. ¿Que podemos pensar de Einstein?

Finalmente, haciendo un balance sobre el hombre del siglo, ¿habra tenido tantosaciertos como errores? ¿Habra sido en realidad un prodigio de la naturaleza, osera ahora tan solo un producto de la publicidad? Preguntas sin respuesta.

Page 71: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 57

4.2. Analisis de superficies

Juan Reyes Gomez1

Facultad de Ciencias, Universidad de ColimaAv. Bernal Dıaz del Castillo # 340

Colima, Colima, Mexico, 28045

Vivimos en un mundo de 3 dimensiones espaciales, y sabemos que un objetotiene una parte interna y una parte externa, ademas reconocemos que parte deluniverso pertenece al objeto y cual no. De esta manera podemos identificar lasuperficie de un objeto y podemos decir cual es el lımite entre lo que es parte deun objeto y lo que no lo es. Desde el punto de vista matematico una superficiees el lugar geometrico de puntos en el espacio que representan una frontera. Unpunto matematicamente no tiene espesor y una superficie por lo tanto tampocotiene espesor. ¿Pero una superficie fısica que nos representa?

El estudio de una superficie en el mundo fısico, se centra a una descripcion de lasuperficie con referencia a la escala a la cual se observa. Por ejemplo si observamosa simple vista un objeto, digamos la superficie de una mesa cualquiera, en estecaso, podemos notar su color y quizas su textura (suave o rugosa) y es posibleinferir de que material esta hecha en base a la apariencia superficial observada.Pero puede ser que emito un mal juicio: decir que es de madera cuando en rea-lidad es un cubierta plastica la que observamos. Para poder dar una respuestacorrecta es necesario analizar mas detalladamente el objeto a una escala diferente.Mediante su estudio se pueden usar diversas tecnicas experimentales como la mi-croscopıa electronica de barrido (SEM) y microscopıa electronica de transmision(TEM), microscopıa de tunel (STM), espectroscopıa de rayos X por dispersion deenergıa (EDS), difraccion de electrones de baja energıa (LEED), espectroscopıaAuger (AES); igualmente utiles son las simulaciones mediante metodos numeri-cos representando una herramienta complementaria en el estudio de la materiacondensada, ya sea con calculos de principios basicos o avanzados o con metodossemiempıricos.

La fısica de superficies es considerada una rama de la fısica de estado solido peroen muchas de las aplicaciones de la fısica de estado solido se ignora la superficie.La razon es que la densidad de los solidos es del orden de 1023 atomos/cm3 porlo que el numero de atomos en la superficie es pequeno y por lo tanto puede serconsiderado como despreciable. El problema de estudio de una superficie radica enla sensibilidad y limites de deteccion de las tecnicas de espectroscopıa empleadas,es decir una tecnica puede ser mejor que otras a este respecto.

Consideremos por ejemplo una superficie de 1 cm2 la cual contenga aproxima-damente 1015 atomos en la capa superficial. El orden de magnitud para poderdetectar atomos que se encuentren como una impureza en una concentracion del

[email protected]

Page 72: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

58

1 por ciento es de 1013 atomos, lo que representa una parte por billon de sensibili-dad. Algunas de las tecnicas espectroscopicas usadas para analisis requieren de almenos 1022 atomos como mınimo para poder detectar una sustancia.

En la fısica de estado solido se trata de explicar las propiedades de la materiacomun, tal y como la conocemos en nuestro universo. Generalmente se dice quela mayorıa de los solidos son cristalinos, en el sentido de la clasificacion tradicio-nal esto es cierto. Pero muchos de los solidos mas comunes por ejemplo el vidrio,plastico, madera, hueso no son tan intensamente ordenados y no son cristalinos.Las propiedades fundamentales de un cristal es su triple periodicidad y un cristalpuede ser generado por la repeticion de una cierta unidad patron a traves de tras-laciones de una cierta red llamada direccion de la red. Las propiedades geometricasmacroscopicas de un cristal son una consecuencia directa de la existencia de estared a un nivel microscopico. En un solido cristalino ideal, perfecto, la periodicidadse extiende a traves del solido hasta la superficie.

Dentro del solido, los atomos son comprimidos por los enlaces vecinos, pero enla superficie, los atomos no se comprimen de igual manera. Se encuentran masrelajados. Cualquier enlace de los atomos superficiales esta entonces disponible,por ejemplo para posibles reacciones quımicas con otras entidades fuera del solido.De esta manera se establece la base para la rama de la quımica conocida comoquımica superficial. Algunos de los temas de investigacion actual de las superficiesrealizado por diferentes grupos de investigadores en el mundo son: caracteriza-cion estructural de partıculas pequenas con propiedades catalıticas, defectos enpartıculas pequenas, materiales superconductores y semiconductores, aleacionesmetalicas, etc.

Ahora podemos tener dos definiciones de superficie fısica, las cuales pueden serde utilidad: De acuerdo a su morfologıa podemos decir que es una propiedad de losmateriales que representan la forma o la estructura de la superficie, y de acuerdo asu estructura el poder describir los materiales a nivel atomico en los terminos delarreglo de atomos en el espacio. El uso de esta terminologıa es claro cuando unoesta trabajando en el nivel atomico o cuando uno esta trabajando a gran escala,pero menos claro en una escala intermedia. En este campo, nos enfrentamos aelegir la escala de trabajo de acuerdo a la tecnica en el rango comprendido entre0.1 nm a 0.1 mm.

Los problemas de la sensibilidad y los lımites de deteccion son comunes a todaslas tecnicas de espectroscopia. De una forma mas simple, el reducir la sensibilidadhace posible detectar la senal deseada sobre el nivel de ruido existente. Si conside-ramos una tecnica con una sensibilidad adecuada, otro problema importante quese presenta en la espectroscopia es el distinguir entre la senal de la superficie y lasenal del resto de la muestra. El problema lo podemos ver de dos maneras

1 asegurarse de que la senal superficial sea distinguible (desplazada), de lassenales provenientes del resto de la muestra y ademas de que el sistema dedeteccion presente una gama dinamica suficientemente amplia para detectarsenales muy pequenas, en presencia de senales vecinas grandes.

Page 73: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 59

2 asegurarse de que las senales proveniente del resto de la muestra, no de lasuperficie, sea pequena comparada con la senal superficial.

Para ilustrar esto, observemos un ejemplo en la cual la sensibilidad superficialpueda ser alcanzada, consideremos una tecnica en la cual se empleen electrones debaja energıa, del orden de 20 a 200 eV, como es el caso de tecnicas espectroscopi-cas superficiales comunes tales como XPS o AES. En primer lugar tenemos quecontestar la siguiente pregunta ¿Cual es la sensibilidad superficial en la tecnicaXPS? El poder contestar a esta pregunta, nos lleva a la formulacion de nuevaspreguntas y dar respuesta a ellas:

¿Como podemos demostrar que XPS es una tecnica sensible al analisis de lasuperficie? ¿Por que la tecnica de XPS es sensible al analisis la superficie? ¿Comopodemos cambiar el grado de la sensibilidad superficial?

Muchas de las tecnicas analıticas empleadas son tecnicas generales en el sentidoque miden todos los atomos de que se compone la muestra (sea una muestra solida,lıquida o gaseosa), por ejemplo, si se realiza un analisis de una muestra que consistede una capa de material A de un espesor de 10 nm la cual fue depositada sobre unsubstrato de material B de 1 milımetro de grosor, cabe preguntarse ¿Cual sera laconcentracin de A en partes por millon (ppm) que puede ser detectada medianteun analisis de XPS de esta muestra?

. . . se obtendrıa el mismo resultado si tuvieramos una muestra en donde elcomponente A se encontrara a una concentracion de 10 ppm distribuido unifor-memente a traves de toda la muestra B. En contraste, una tecnica sensible a lasuperficie es mas sensible a los atomos que se encuentren situados en la superficie ocerca de ella, que los atomos mas alejados de la superficie en el resto de la muestra,(es decir, una parte de la senal principal viene de la region superficial) en el casode la primera muestra una tecnica sensible a la superficie producirıa un espectrocon las senales provenientes del componente A, es decir

IA

IB� 10−5

(en donde la senal IA es debida a la componente A y IB al resto de la muestra).Una tecnica especıfica de la superficie debe proporcionar informacion unicamentede las senales debidas a los atomos en la region superficial, lo cual depende decomo se define la region superficial.

Las tecnicas espectroscopicas de electrones tales como XPS no son especıficasni totalmente de la superficie, debido a que la mayor parte de la senal viene de losatomos que se encuentran en las capas atomicas superficiales y una parte pequenade la senal proviene de capas atomicas mas profundas del solido.

¿De que manera podemos demostrar que XPS es una tecnica sensible al analisisde la superficie? Considere las dos muestras anteriores, tales muestras a menudoson preparadas facilmente mediante la evaporacion del material A sobre el substra-to de material B. Se observa experimental, que en tal situacion la senal obtenidade XPS debido al substrato, material B, se atenua rapidamente, mientras que la

Page 74: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

60

senal de material A aumenta simultaneamente a un valor lımite. Conjuntamenteen combinacion con una balanzas de cuarzo es posible medir el espesor del depositotal como se hizo y realizar de esta manera la verificacion del grosor de la pelıculadepositada de manera independiente. Un analisis detallado de la variacion de lassenales debido a A y a B es tambien capaz de proporcionar la informacion sobreel mecanismo de crecimiento de la pelıcula.

¿Por que la tecnica de XPS es sensible al analisis de la superficie? Las rayosX empleados en XPS penetran una distancia substancial en la muestra (mm).Ası este metodo de excitacion no imparte ninguna sensibilidad superficial en laescala atomica requerida. La sensibilidad superficial debe por lo tanto presentarsede la emision y la deteccion de los fotoelectrones emitidos. Considere, por lo tanto,un experimento hipotetico en el cual los electrones de una energıa dada, E0, seemitan de los atomos en un solido a las diferentes profundidades, d, debajo de unasuperficie plana.

Asumiremos que solamente los electrones que alcanzan la superficie, en el mo-mento de dejar el solido, aun tienen la energıa inicial E0 y son los unicos detectadosen este experimento. Esto no es verdad literalmente, en un experimento de XPS,lo que ocurre es que solamente los fotoelectrones que poseen las energıas carc-terısticas de la emision son las que contribuyen a los picos de deteccion y no seranconsiderados los fotoelectrones que han perdido una cierta energıa.

Existen diferentes razones por las cuales un electron emitido no fuera detectado:¡Si fue capturado antes de alcanzar la superficie, emitido en la direccion incorrectao nunca alcanzar la superficie! Si perdio energıa antes de alcanzar la superficie,el electron puede escapar del solido y alcanzar el detector, pero no con la energıarequerida, en este caso E < E0.

El proceso por el cual un electron puede perder energıa mientras viaja a travesdel solido se conoce como dispersion inelastica . Cada acontecimiento inelasticode la dispersion conduce a: (i) una reduccion en la energıa del electron (ii) a uncambio en la direccion del recorrido.

En este caso, por lo tanto, solamente una fraccion pequena de electrones emiti-dos habrıa sido detectada. Si el atomo de la fuente hubiera estado mas cercano ala superficie, un fraccion mayor de los electrones emitidos habrıa sido detectada.

El detector subtiende un mayor angulo (solido) al del atomo emitido (esto noes realmente un factor significativo en experimentos reales). Para que un electronemitido desde la superficie, existe una menor probabilidad de dispersion inelasticaantes de que escapara del solido.

¿Cual es la probabilidad de deteccion de un atomo emitido desde la superficie dela muestra con respecto a la distancia de separacion entre el detector y la superficiede la muestra?

Primero simplifiquemos el problema considerando unicamente los electronesemitidos normalmente a la superficie, en nuestro experimento hipotetico podemosrepresentar esto con un detector mas pequeno al tamao de la muestra, situadodirectamente sobre los atomos que se emiten.

Page 75: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 61

La probabilidad de escape a una profundidad dada, P(d), es determinada por laprobabilidad de dispersion inelastica del electron durante su viaje a la superficie.Para cuantificar esta probabilidad necesitamos saber cual es la trayectoria libremedia inelastica (IMFP) de los electrones. La IMFP es una medida de la distanciamedia que viajo un electron a traves de un solido antes de que inelasticamente sedisperse, es dependiente sobre todo de la energıa cinetica inicial del electron y de lanaturaleza del solido(pero muchos elementos muestran una realacion muy similarentre IMFP vs energıa. La IMFP es determinada por la ecuacion siguiente quepermite calcular la probabilidad de que un electron pueda viajar una distancia, d,a traves del solido sin experimentar la dispersion.

P (d) = e−d

λ

en donde λ es la IMFP de los electrones con una energıa E. (note que: λ = f(E),y la IMFP se relaciona con la trayectoria de los electrones dentro del solido, perono esta relacionada con la trayectoria libre media inelastica en la fase gaseosa unavez que sale del solido). Si d2 > d1 la P (d2) < P (d1), es claro que la probabilidadde escape decae rapidamente y es esencialmente cero para una distancia d > 5λ.

Los valores promedio de la IMFP en metales son tıpicamente los siguientes:

1 nm para electrones con energıas en el rango de 15 < E/eV < 350

2 nm para electrones con energıas en el rango de 10 < E/eV < 1400

Por ejemplo la IMFP de electrones de baja energıa les corresponde un despla-zamiento de unas cuantas capas atomicas. Lo que significa que cualquier tecnicaexperimental como XPS, la cual involucra la generacion y deteccion de electronesde baja energıa puede ser una tecnica sensible a la superficie.

Ademas de los aspectos resaltados, podemos establecer que: a) Las tecnicas deanalisis de superficies en general son tecnicas de informacion complementaria, loque permite utilizar mas de una tecnica para obtener una determinada informa-cion acerca de una superficie, y, b) Algunas veces, la tecnologıa desarrollada alrespecto permite utilizar el mismo instrumento con diferentes tecnicas para reali-zar diferentes mediciones .

La aparicion de estas tecnicas como entidad propia ha surgido gracias a doshechos importantes: 1) El desarrollo de tecnologıas cada vez mas complejas loque ha permitido el diseno y utilizacion de instrumentos sofisticados que puedenrevelar la estructura atomica y la composicion quımica de las superficies; y 2)la informacion obtenida a partir de los analisis de superficies e interfases se haconstituido como una base potente para conocer procesos quımicos fundamentalesde gran importancia tales como corrosion, adsorcion, quimisorcion, reactividad,oxidacion, pasivacion, o difusion entre otros, lo que ha permitido avanzar enorme-mente en el desarrollo de otras ramas de la Ciencia y la Tecnologıa (produccionde catalizadores, semiconductores, circuitos microelectronicos, polımeros, etc.).

Page 76: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

62

Page 77: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Bibliografıa

[1] Vickerman J.C. (ed.), Surface Analysis - The Principal Techniques, John Wi-lley and Sons, Chichester, 1997.

[2] Briggs, D. and Seah, M.P. (eds.) Practical Surface Analysis, Vol. 1 y 2, JohnWilley and Sons, Chichester, 1990.

[3] Kellner, R., Mermet, M., Otto, M. and Widmer, H.M. (eds.), Analytical Che-

mistry, Willey VCH, Weinheim, 1998.

[4] Skoog D.A., HOLLER F.J. y Nieman T. A., Analisis Instrumental, 5a edicion,Ed. McGraw Hill Interamericana, Madrid, 2000.

[5] David Bodanis, The Secret House. New York, NY: Simon and Shuster Inc.(1986) ISBN 0 671 60032-X.

[6] John B. Hudson, Surface Science, Stoneham, MA: Butterworth Heinemann(1992) ISBN 0 7506 9159-X.

[7] Hans Luth, Surfaces and Interfaces of Solids, Berlin: Springer-Verlag (1993)ISBN 3 540 52681 1.

[8] Robert C. Cammarata, Surface and Interface Stress Effects in Thin Films,Progress in Surface Science 46, 1 (1994).

[9] J. Tersoff and N. D. Lang. Theory of Scanning Tunneling Microscopy, in

Scanning Tunneling Microscopy, ed. Joseph A. Stroscio and William J. Kai-ser, Methods of Experimental Physics, Vol. 27, Academic Press, Boston, MA(1993), ISBN 0 12 475972 6.

[10] Robert Eisberg and Robert Resnick. Quantum Physics of Atoms, Molecules,

Solids, Nuclei, and Particles, 2e. John Wiley and Sons, New York, 1985, ISBN0 471 87373 X.

[11] H. Kumar Wickramasinghe. Extensions of STM, in Scanning Tunneling Mi-

croscopy, ed. Joseph A. Stroscio and William J. Kaiser Methods of Expe-rimental Physics, Vol. 27, Academic Press, Boston, MA (1993) ISBN 0 12475972 6.

63

Page 78: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

64

[12] Peter J. Blau. Friction Science and Technology, Boston, MA: Marcel Dekker,Inc. (1996), ISBN 0 8247 9576 8.

Page 79: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 65

4.3. El experimento de Buffon

Paolo Amore1

Facultad de Ciencias, Universidad de ColimaAv. Bernal Dıaz del Castillo # 340

Colima, Colima, Mexico, 28045

4.3.1. El experimento

Describiremos ahora el metodo de Buffon para el calculo de π, un metodo de-sarrollado por la primera vez por el cientifico frances Buffon en el 1733 [1, 2]. Elexperimento de Buffon es particularmente simple y se puede hacer con materialmuy comun, cual una hoja de paper y palitos. Aprenderemos como utilizar estematerial muy simple para determinar π, idealmente con precision arbitraria.

El metodo que Buffon ideo es fundamentado en la pregunta: “cual es la proba-bilidad que lanzando un palito de longitud L sobre una hoja de papel con rayashorizontales paralelas separadas por una distancia d, el palito cruze una de larayas?”

Podemos calcular la probabilidad teoricamente y despues compararla con laobservacion “experimental”: de hecho si lograramos lanzar el palito un numero Nde veces, con N → ∞, la frecuencia observada de eventos positivos, osea el numerode veces que el palito cruza una de las rayas divido por el numero de lanzamientostotal, tenderia exactamente a la probabilidad calculada teoricamente:

Pteo = lımN→∞

Pexp = lımN→∞

N+

N(4.1)

Esta ecuacion, como veremos muy pronto, nos permitira aproximar π: la pre-cision de nuestra aproximacion dependera unicamente de cuantos lanzamientos seharan.

Necesitamos ahora calcular la probabilidad teorica, que hemos llamado Pteo.Claramente esta probabilidad ha de tener una interpretacion geometrica, ya que siutilizamos palitos muy pequeno esperamos tener un numero de cruzes menores deque si utilizamos palitos muy largos. Por simplicidad, vamos a considerar unica-mente el caso de palitos que tengan una longitud menor o igual al espaciamientoentre las rayas horizontales, osea

L ≤ d (4.2)

Es tambien claro que la probabilidad de que un palito cruze una raya, no sola-mente dependera de su longitud, si no tambien de su orientacion, osea del angulo

[email protected]

Page 80: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

66

que forma con respecto a las rayas horizontales: un palito que caiga casi paraleloa las raya tiene muy poca probabilidad de cruzarlas, mientras que un palito quecaiga perpendicular tiene el maximo de probabilidad de que esto occurra.

Si estuvieramos lanzando los palitos siempre con la misma orientacion entoncesla probabilidad de cruze seria dada por

Pteo =L cos θ

d(4.3)

siendo θ el angulo entre el palito y las rayas horizontales y L cos θ la componen-te del palito perpendicular a las rayas. Desafortunadamente cuando lanzamos elpalito no es posible controlar su orientacion asi que podemos asumir que el palitoformara cualquier angulo con las rayas. Idealmente podemos pensar que todos losangulos tienen las misma probabilidad de occurrir y entonces podemos cambiar laecuacion (4.3) por

Pteo =L〈cos θ〉

d(4.4)

donde 〈A〉 se utiliza para el valor promedio de A. Como calculamos 〈cos θ〉? Anosotros nos interesa solamente el valor absoluto del angulo θ, y no su signo, yaque un palito que caiga con angulos −θ tiene exactamente la misma probabilidadde cruzar las rayas. Por esta razon vamos a promediar el coseno en la region0 ≤ θ ≤ π/2, lo cual es equivalente a promediar el valor absoluto del coseno en0 ≤ θ ≤ 2π:

〈cos θ〉 =1

π/2

∫ π/2

0

cos θ dθ =2

π(4.5)

Este ultimo resultado nos permite escribir la ecuacion (4.1) como

2L

πd=

N+

N(4.6)

o

π =2LN

dN+

(4.7)

que es la formula que queriamos encontrar.Esta formula puede ahora ser utilizada para obtener una “determinacion experi-

mental” de π . . . Solamente se necesitan N palitos, una hoja de papel y muchissimapaciencia en el lanzar los palitos y luego en el contarlos. Las personas interesa-das en conocer mas sobre este problema y versiones mas complicadas del mismopueden consultar el sitio de MathWorld [2].

Page 81: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 67

Figura 4.1: Experimento de Buffon

Page 82: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

68

Page 83: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Bibliografıa

[1] http://www-groups.dcs.st-and.ac.uk/ history/Mathematicians/Buffon.html

[2] Eric W. Weisstein. ”Buffon’s Needle Problem.”From MathWorld–A WolframWeb Resource. http://mathworld.wolfram.com/BuffonsNeedleProblem.html

69

Page 84: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

70

4.4. La fısica teorica aplicada a problemas de bio-

quımica y medicina

Christoph Hofmann1

Facultad de Ciencias, Universidad de ColimaAv. Bernal Dıaz del Castillo # 340

Colima, Colima, Mexico, 28045

Las proteınas tienen un papel muy importante en la estructura y en la funcionde todas las formas de vida. Las proteınas catalizan reacciones quımicas dentro desistemas biologicos y son responsables para la comunicacion entre celulas.

Las proteınas son moleculas largas que son compuestas de componentes maspequenos: estos componentes se llaman aminoacidos – una proteına contiene 50hasta unos cientos de aminoacidos. Los aminoacidos que se encuentran en lasproteınas biologicas se clasifican segun la estructura quımica y por lo tanto segunsus propiedades fısicas, ej. la polaridad, la carga electrica, etc. De hecho, solo20 aminoacidos diferentes son importantes en la formacion de las proteınas queencontramos en plantas, animales y seres humanos.

Como las 26 letras del alfabeto estan creando millones y millones de palabras, los20 aminoacidos pueden combinarse de varias maneras y crear un numero enormede proteınas diferentes. De hecho, el cuerpo humano contiene alrededor de 100’000proteınas diferentes.

Sin embargo, la cadena larga de aminoacidos – es decir, la estructura unidimen-sional o estructura primaria de la proteına – no va a funcionar inmediatamentecomo proteına: falta mas que solamente tener los aminoacidos en el orden correctoen la cadena. Lo que importa es la formacion de la estructura tridimensional querepresenta la estructura biologia. Entonces, unas preguntas fundamentales son:¿Como se dobla la cadena unidimensional en una estructura tridimensional es-pecıfica, es decir en la estructura que es responsable para la funcion biologica dela proteına? ¿Cuales son las fuerzas entre los aminoacidos diferentes en la cadenaque son responsables para formacion de la estructura especıfica de cada proteına?¿Y como es posible que este proceso de doblamiento de proteınas pasa en tan pocotiempo, en unos microsegundos solo?

Estas preguntas son estimulantes y – en mi opinion – muy fascinantes porqueinterrelacionan varias areas de la investigacion cientıfica: se trata de un problemainterdisciplinario y por lo tanto de un problema complejo. Con algunos metodosmatematicos que se desarollaban en la fısica teorica es posible resolver (parcialmen-te) el problema del doblamiento y desdoblamiento de proteınas, que basicamentees un problema bioquımico. Ademas, hay aplicaciones importantes en medicina,en el tratamiento de enfermedades. Ya se sabe que algunas enfermedades son cau-

[email protected]

Page 85: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 71

sadas por proteınas mal dobladas, es decir, proteınas que no se encuentran en suestructura biologica y por eso no pueden ’funcionar’. Por ejemplo, la enfermedadde la ’vaca loca’ o la enfermedad ’Alzheimer’ son causadas por proteınas mal do-bladas. Entonces, el estudio del proceso del doblamiento de proteınas es muy utilporque – en el futuro – podrıa servir para curar estas enfermedades en el nivelmolecular.

Como he expuesto en mi platica, un concepto importante en el analisis deldoblamiento de proteınas es la idea del paisaje de energıa libre. La energıa librees una cantidad fısica-quımica que nos permite caracterizar la estabilidad de unamolecula en condiciones externas, por ejemplo la estabilidad de una proteına comofuncion de temperatura, presion, pH, etc. Para analisar el proceso de doblamien-to entonces hay que calcular la energıa libre. Ademas, se pueden calcular otrascantidades fısica-quımicas que caracterizan las proteınas: entre ellas la entropıaque caracteriza el grado del orden – o desorden – en la proteına o la entalpıa quecaracteriza la estabilidad energetica de la proteına.

El metodo que presente en mi charla fue un metodo variacional: Para calcularuna cantidad fısica (ej. la energıa libre) con el metodo variacional, se introducenalgunos parametros en el problema – los parametros variacionales Ci, donde elindice i = 1 . . .N se refiere a los aminoacidos que tenemos en la cadena de proteına.La cantidad que queremos calcular entonces depende de estos parametros, es decirla energıa libre se convierte en una funcion de los parametros variacionales. Sitendriamos solo dos parametros variacionales serıa facil graficar la energıa librecomo funcion de C1 y C2: el parametro C1 representa el eje x mientras que elparametro C2 representa el eje y – el valor de la energıa libre coresponde al ejez y la energıa libre entonces representa una superficie (de dos dimensiones) eneste sistema de referencia. Ahora, lo que hacemos en el calculo variacional esanalizar la forma de esta superficie. Nos podemos imaginar que en esta superficiese encuentran montanas, canones, etc. – por eso el nombre paisaje de energıa libre.Los puntos que representan maximos y minimos en la superficie corresponden apuntos inestables y estables, respectivamente. Por ejemplo, un punto muy bajocorresponde a una estructura estable de la proteına mientras que si estamos en unpunto muy alto – es decir en el cumbre de la montana – nos encontramos en unpunto inestable.

Sin embargo, resulta que el problema del doblamiento de proteınas es mas com-plejo: tenemos mas que dos parametros variacionales en nuestro calculo: de hecho,para cada aminoacido i tenemos que introducir un parametro Ci – es decir te-nemos hasta 500 o mas parametros diferentes en el problema y ya no podemosgraficar la energıa libre en un diagrama tridimensional – ahora tenemos un proble-ma multidimensional ası que la energıa libre representa una superficie en 500 o masdimensiones. Pero el hecho que ya no podemos graficar esta superficie no significaque no podemos analizarla: al contrario, el metodo variacional es una herramientaperfecta para atacar problemas multidimensionales.

¿En el caso del doblamiento, cual es el significado de estos parametros variacio-nales? Como he expuesto en mi charla, ellos nos permiten caracterizar la estructura

Page 86: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

72

Figura 4.2: Los 41 elementos de estructura secundaria para la estructura 1cmk dela proteına cAPK segun el programa Molscript.

de la proteına: un valor de Ci cerca de cero significa que la proteına se encuentraen su estructura no-doblada (en su estructura unidimensional), mientras que unvalor de Ci diferente de cero, tipicamente Ci = 2 . . . 5, nos dice que la proteına seencuentra en su estructura doblada (en su estructura biologica tridimensional).

Estas dos estructuras – proteına no-doblada y proteına doblada – correspondena minimos en la superficie de la energıa libre y lo que hace el calculo variacional esencontrar un camino, o varios caminos, en el paisaje de energıa libre que conectalos dos minimos, es decir que conecta la estructura doblada y la estructura no-doblada. Analisando este camino en nuestro paisaje multidimensional, nos permitecaracterizar como se dobla o desdobla la proteına: ej., si en el camino hay que subiruna montana alta, sabemos que en el proceso del doblamiento (o desdoblamiento)existe una estructura intermedia inestable de la proteına.

Pero vamos a discutir ahora un ejemplo concreto: quiero ilustrar las ideas an-teriores con una proteına larga que se llama cAPK (’cAMP-dependent proteinkinase’) que contiene 350 aminoacidos. La figura 1 nos da una idea de su estruc-tura biologica tridimensional.

Se pueden identificar los dos elementos de la estructura secundaria: el α-helix(las estructuras helicales) y el β-sheet (las estructuras caracterizados por las flechasen la figura 1).

Ahora, unas de las cantidades importantes que se pueden extraer del calculo de

Page 87: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 73

la energıa libre, son los factores de temperatura (’temperature factors’) – ¿que sony para que sirven? Ellos nos dan una idea de la magnitud del movimiento (de lasoscilaciones) de cada aminoacido en la proteına: un factor de temperatura muyalto significa que el aminoacido correspondiente esta oscilando fuerte y por esola proteına se encuentra en una estructura no-doblada, un factor de temperaturamuy baja significa que el aminoacido casi no esta oscilando y por eso el aminoacidose encuentra en una posicion fija dentro de la estructura doblada. Entonces, en laestructura no-doblada, cada aminoacido tiene un factor de temperatura muy altamientras que, en la estructura biologica tridimensional, cada aminoacido tiene unfactor de temperatura muy baja, cerca de cero.

El calculo variacional nos da una idea precisa del proceso de doblamiento de laproteına – consideremos la figura 2 sobre el doblamiento de la proteına cAPK.

El eje x corresponde al numero del aminoacido (tenemos 350 en total) en la ca-dena de proteına, el eje y representa el factor de temperatura. La curva mas alta serefiere a la estructura no-doblada: los factores de temperatura tienen valores altasası que los aminoacidos estan oscilando fuerte – sin embargo, ya en esta estructurano-doblada, hay regiones donde las oscilaciones no son tan fuertes, ej. alrededor delos aminoacidos 120 y 180: ası vemos que la estructura no-doblada ya exhibe unorden parcial. Por otro lado, la curva mas baja se refiere a la estructura doblada:los factores de temperatura tienen valores cerca de cero ası que los aminoacidoscası no estan oscilando – su posicion dentro de la proteına esta bien fija.

Entre estos dos extremos de la estructura de la proteına (estructura no-dobalday doblada) encontramos varias estructuras intermedias: cada curva en la figura2 representa una de estas estructuras intermedias. Entonces, con la informacionsobre los factores de temperatura se puede analizar el proceso del doblamiento odesdoblamiento de la proteına. Por ejemplo, algo muy importante que se puedeextraer de la figura 2 es que hay dos regiones en la proteına cAPK que se formanprimero en el proceso del doblamiento: estas regiones incluyen los aminoacidos200-225 y los aminoacidos 125-150.

¿Para que sirven estas informaciones sobre el doblamiento de las proteınas, paraque analisamos el proceso del doblamiento? Una aplicacion importante se refiere ala cura de enfermedades en la medicina: si conocemos el mecanismo molecular deldoblamiento, sera posible entender porque unas proteınas se doblan mal y comose pueden evitar estos caminos en el paisaje de energıa libre que corresponden aestructuras mal-dobladas, para finalmente curar la enfermedad.

Page 88: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

74

0 25 50 75 100 125 150 175 200 225 250 275 300 325 350Residue number

0

10

20

30

40

50

Tem

pera

ture

fact

ors

0 25 50 75 100 125 150 175 200 225 250 275 300 325Residue number − 14

0

10

20

30

40

50

0 25 50 75 100 125 150 175 200 225 250 275 300 325Residue number − 14

0

10

20

30

40

50

Figura 4.3: Factores de temperatura para la proteına cAPK. Las tres graficas serefieren a tres variantes cristalograficas de la misma proteına cAPK: i) estructura1cmk, ii) estructura 1atp, iii) estructura 1stc.

Page 89: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Capıtulo 5

Platicas de Matematicas

75

Page 90: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

76

Page 91: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 77

5.1. Conjuntos, cardinalidades y la Hipotesis del

Continuum

Benjamın Itza Ortiz1

Department of Mathematics, University of OttawaOttawa, ON, KIN-6A3, Canada

Una de las nociones matematicas mas importantes en la educacion secundariaes aquella de conjunto. Un conjunto es simplemente algo que consiste de elementosque pueden ser listados o descritos por sus propiedades. Por ejemplo,

A1 = {1, 2, 3}

es el conjunto que consiste de los numeros 1, 2 y 3. El conjunto

A2 = {Juan, Alicia, Fernando}

es el conjunto formado por Juan, Alicia y Fernando. Otro conjunto es por ejemplo

A3 = {x : x es un osito panda}

(lease “el conjunto de todas las x tal que x es un osito panda”) que consiste detodos los ositos pandas. Los tres conjuntos anteriores tienen en comun la siguientepropiedad: son conjuntos finitos. Al ir avanzando en nuestra educacion escolar, esinevitable considerar conjuntos que no son finitos. Uno entonces aprende acercadel conjunto de los numeros naturales

N = {1, 2, 3, 4, · · · },

del conjunto de los numeros enteros

Z = {· · · ,−2−, 1, 0, 1, 2, · · · } ,

del conjunto de los numeros racionales

Q ={

pq : p y q son numeros enteros y q 6= 0

},

y del conjunto R que consiste de los numeros reales. Los numeros reales tambienpueden ser descrito como el conjunto que “llena”la recta donde se encuentran losnumeros enteros (aquella recta en la cual, segun aprendimos en la primaria, saltauna ranita de un numero a otro).

En terminos matematicos, decimos que la cardinalidad de un conjunto A, de-notada por |A|, es el numero de elementos contenidos en A.

[email protected]

Page 92: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

78

Ahora bien, es natural que queramos comparar las cardinalidades entre conjun-tos. Por ejemplo, es claro que las cardinalidades de los conjuntos A1 y A2 definidosantes son iguales, pues |A1| = 3 = |A2|. Si consideramos el conjunto B1 que consis-te de los habitantes en Estados Unidos, B2 el conjunto de habitantes en Canada yB3 el conjunto de habitantes en Mexico, una checada a la informacion sobre censosnos permite corroborar que |B1| > |B3| > |B2|, es decir, hay mas gente viviendoen Estados Unidos que en Mexico y hay mas gente viviendo en Mexico que enCanada.

Los problemas en comparar cardinalidades comienzan cuando consideramosconjuntos de cardinalidad infinita. ¿Como medir si hay mas elementos en un con-junto infinito que en otro? Hasta hace algun tiempo, los matematicos simplementeoptaban por no intentar comparar las cardinalidades de conjuntos infinitos. Sinembargo, aquı presentamos la siguiente idea usando la nocion de funcion. Recuer-de que una funcion f : A → B con dominio el conjunto A y codominio el conjuntoB, es una regla que asocia a cada elemento de A un unico elemento de B. Porejemplo, podemos definir las siguientes funciones:

Sea f1 : {1, 2} → A2 la funcion definida por

f(1) = Juan y f(2) = Alicia.

Sea f2 : {1, 2, 3, 4} → A2 la funcion definida por

f(1) = Juan, f(2) = Juan, f(3) = Fernando y f(4) = Alicia.

Sea f3 : A1 → A2 la funcion definida por

f(1) = Juan, f(2) = Alicia y f(3) = Fernando.

Podemos pensar que estas funciones describen la situacion en que Juan, Aliciay Fernando acuden a la taquilla de un teatro a compar boletos. En el primercaso, solo los asientos 1 y 2 estaban disponibles y solo Juan y Alicia alcanzarona comprar boletos: Juan compro el asiento numero 1 y Alicia el asiento numero2. En el segundo caso, hubo 4 asientos disponible: Juan compro los asientos 1 y2, Fernando el asiento 3 y Alicia el asiento 4. En el ultimo caso Juan, Alicia yFernando consigueron los asientos 1, 2 y 3, respectivamente.

Se dice que una funcion es uno a uno siempre y cuando las imagenes de cadados elementos distintos en el dominio son distintas. Decimos que una funcion essobre si cada elemento en el codominio es la imagen de algun elemento del dominio.Funciones que son al mismo tiempo uno a uno y sobre se llaman bijectivas. De estemodo, la funcion f1 es uno a uno pero no es sobre. La funcion f2 es sobre pero noes uno a uno y la funcion f3 es bijectiva.

En este momento, podemos hacer la siguientes dos observaciones que son rele-vantes a nuestro problema de usar funciones para comparar las cardinalidades dedos conjuntos:

Si f : A → B es una funcion y A tiene menos elementos que B entonces esimposible que f sea sobre. (Vease el ejemplo f1.)

Page 93: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 79

Si f : A → B es una funcion y A tiene mas elementos que B entonces esimposible que f sea uno a uno. (Vease el ejemplo f2.)

Estas observaciones y ejemplos nos indican que la siguiente definicion tiene sen-tido.

Definicion. Dos conjuntos A y B tienen la misma cardinalidad si existe una fun-cion bijectiva f : A → B.

Es claro que tanto el conjunto de los numeros naturales N como el de los nume-ros enteros Z tienen cardinalidad infinita, uno entonces pudiera pensar que suscardinalidades son iguales (infinito es igual a infinito, ¿no?). Si este es el caso,entonces, de acuerdo a nuestra definicion anterior, debemos poder construir unafuncion bijectiva f : N → Z. Efectivamente, definamos

f(2) = 1 f(4) = 2 · · · f(2n) = n · · ·f(1) = 0

f(3) = −1 f(5) = −2 · · · f(2n + 1) = −n · · ·

Por razones obvias, diremos que un conjunto es contable cuando este tenga lamisma cardinalidad que el conjunto N de los numeros naturales. Por lo tanto,el conjunto Z de los numeros enteros es contable. Ahora bien, ¿que pasa con elconjunto Q de los numeros racionales?, ¿tambien el es contable?. La respuestaes ¡sı!. Consideremos el diagrama en la Figura 1. Uno puede ver que, siguiendolas flechas de este diagrama, se pueden enumerar a todos los numeros racionalespositivos. Uno puede incluir el cero y a los numeros racionales negativos de manerasimilar a como lo que hicimos para los numeros enteros.

La siguiente pregunta es acerca de los numeros reales. ¿Es el conjunto R de losnumeros reales contable? La respuesta es ¡no!. El siguiente argumento, llamado ElArgumento de la Diagonalizacion de Cantor, nos da una demostracion.

El Argumento de la Diagonalizacion de Cantor. Supongamos por contra-diccion que los numeros reales son contables. Entonces, el intervalo abierto (0, 1)es tambien contable (porque subconjuntos de conjuntos contables tienen que sercontables). Vamos a escribir a cada numero x en (0, 1) en su expansion decimaltal que no hay un numero infinito de decimales repetidos (por ejemplo, escribi-mos 0,49999 · · · en vez de 0,5). Debido a que estamos asumiendo que el conjunto(0, 1) es contable, podemos enumerar todos sus elementos en una lista como acontinuacion:

0.d11d12d13d14 · · ·

0.d21d22d23d24 · · ·

0.d31d32d33d34 · · ·

.... . .

Page 94: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

80

1

1

��

1

2// 1

3

�����������

1

4// 1

5

�����������

1

6// · · ·

2

1

@@�

��

��

��

2

2

����������

2

3

??�

��

��

��

��

2

4

�����������

2

5

??�

��

��

��

��

· · ·

3

1

��

3

2

??�

��

��

��

��

3

3

�����������

3

4

??�

��

��

��

��

· · ·

4

1

@@�

��

��

��

4

2

����������

4

3

??�

��

��

��

��

· · ·

5

1

��

5

2

??�

��

��

��

��

· · ·

6

1

@@�

��

��

��

· · ·

...

Figura 5.1: Siguiendo las flechas se puede contar a los numeros racionales

Para cada numero natural n = 1, 2, . . ., escoja un numero cn que sea differentede dnn, 0 y 9. Forme ahora el numero c cuya expansion decimal es

c = 0.c1c2c3c4 · · ·

Es obvio que c es un numero en (0, 1). Pero al mismo tiempo, c no esta en (0, 1),pues si estuviera, c serıa uno de los numeros en la lista anterior, es decir, paraalguna n, c = 0.dn1dn2dn3dn4 · · · . Por tanto el n-esima decimal de c, cn, es igualal n-esimo decimal de 0.dn1dn2dn3dn4 · · · , dnn, lo cual no es cierto, puesto que pordefinicion de c, cn 6= dnn. Esto nos da una contradiccion y completa la prueba. �

Esto quiere decir que si bien el conjunto de los numeros reales tiene cardinalidadinfinita, debido a que no es contable, entonces su cardinalidad es mayor que lacardinalidad de N, osea,

|R| es un infinito estrictamente mas grande que |N|.

Page 95: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 81

Esto motiva la siguiente definicion.

Definicion. Decimos que ℵ (lease “alef”) es un numero cardinal si ℵ es la car-dinalidad de algun conjunto.

Por ejemplo, 0, 1, 2, 3, 4, · · · son numeros cardinales debido a que |∅| = 0 y|{1, 2, 3, · · · , n}| = n. Es costumbre denotar por ℵ0 al numero cardinal ℵ0 = |N|que representa la cardinalidad del conjunto de los numeros naturales.

Decimos que un numero cardinal |M | = M es menor o igual que otro numerocardinal |N | = N, lo que denotamos por M ≤ N, si existe una funcion uno auno f : M → N . Los numeros cardinales satisfacen muchas de las propiedadesusuales de inegualdades. Por ejemplo, el Teorema de Schroeder-Bernstein (llamadoası en honor de los matematicos Felix Bernstein (1878-1956) y Ernst Schroeder(1841-1902) quienes demostraron este resultado sin usar el Axioma de la Eleccion)dice que “Si M y N son numeros cardinales con M ≤ N y N ≤ M entoncesM = N”. Mas aun, uno puede demostrar, usando el Axioma de la Eleccion, quecada numero cardinal tiene un numero cardinal mayor consecutivo, y que ℵ0 esel numero cardinal mas pequno correspondiente a un conjunto de cardinalidadinfinita. (Los numeros cardinales correspondientes a conjuntos infinitos se conocencomo numeros cardinales transfinitos. Entonces, ℵ0 es el cardinalidad transfinitomas pequeno.). De este modo, tenemos la siguiente lista de numeros cardinales:

0, 1, 2, 3, · · · ,ℵ0,ℵ1,ℵ2,ℵ3, · · ·

Esto fue demostrado por el matematico Georg Cantor (1845-1918), quien tambienes reconocido como el padre de la Teorıa de Conjuntos.

Ya vimos que ℵ0 = |Q| = |Z| y que ℵ0 � |R|. En 1874, Cantor conjeturo, sinpoder demostralo, que no existe conjunto cuya cardinalidad sea estrictamente ma-yor que |N| ni estrictamente menor que |R|. Esto es lo que hoy en dıa se conocecomo:

La Hipotesis del Continuum: |R| = ℵ1.

La importancia del problema de que si la Hipotesis del Continuum es cierta ofalsa fue reconocida por ni mas ni menos que por el gran matematico David Hilbert(1862-1943). De hecho, la Hipotesis del Continuum figura como el primer problemadentro de la famosa lista de 23 Problemas Abiertos que Hilbert propuso duranteel Congreso Internacional de Matematicas celebrado en Paris en 1900. Kurt Godel(1906-1978) y Paul Cohen (1934- ) demostraron que la Hipotesis del Continuumes independiente del sistema de axiomas de Zermelo-Fraenkel y del Axioma de laEleccion. Lo que esto significa es que uno no puede demostrar la Hipotesis delContinuum ni encontrar un contraejemplo. Esta conclusion fue bastante sorpren-dente, pues fue el primer ejemplo concreto de un problema interesante en el quepuede demostrarse que no es posible decidir si la proposicion es verdadera o fal-

Page 96: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

82

sa usando el sistema de axiomas que rige a todas nuestras Matematicas. (En sufamoso Teorema de la Incompletez, Godel demostro en 1931 que tales ejemplosexisten.) En 1966, Cohen recibio la medalla Fields, el maximo reconocimiento queun matematico puede recibir, por su trabajo en la Teorıa de Conjuntos y sus con-clusiones sobre la Hipotesis del Continuum. Aunque los trabajos de Cohen y Godelde alguna manera resolvieron el primero en la lista de los Problemas Abiertos deHilbert, es posible que anadiendo algunos axiomas a los axiomas basicos de laTeorıa de Conjuntos, uno pueda probar que la Hipotesis del Continuum es ciertao falsa. En la actualidad, la mayoria de los matematicos son neutrales o piensanque la Hipotesis del Continuum es falsa. En terminos generales, aquellos que estana favor de un universo “enorme” y “rico” rechazan la Hipotesis del Continuum,mientras que los que estan a favor de un universo “ordenado” y “controlable”toman por verdadera la Hipotesis del Continuum.

Page 97: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 83

5.2. Los objetos mas importantes: Las funciones.

Fernando Hernandez-Hernandez1

Instituto de Matematicas, UNAM (Morelia)Apartado postal 61-3 (Xangari), Morelia Michoacan, Mexico, 58089

La palabra funcion fue introducida a las matematicas por Gottfried WilhelmLeibniz. La idea de Leibniz estaba muy limitada pues el usaba el termino parareferirse a una cierta clase de formulas matematicas. La idea moderna de funciones esencialmente la siguiente:

Dados dos conjuntos A y B, una funcion de A en B es una correspondencia queasocia con cada elemento de A un elemento de B.

Ahora nuestra pregunta sera: ¿Como puede formalizarse el concepto de funcionsin tener una definicion circular? Pues es claro que la idea que arriba expresamosdista mucho de ser una definicion formal. Note por ejemplo que es circular en elsentido de que para decir que es una funcion usamos el concepto de correspondencia

y uno entonces debe preguntarse ¿que es una correspondencia?Otras palabras que cotidianamente se usan para describir que es una funcion son

asociacion y relacion. Pero, realmente no hay una diferencia en lo que por estaspalabras entendemos y lo que entendemos por funcion. Es por eso que podrıamossugerir que:

funcion ∼= correspondencia ∼= asociacion ∼= relacion;

es decir, estas palabras estan ıntimamente relacionadas con lo que entendemos porfuncion. Para el desarrollo de las matematicas, necesitamos de una definicion solidade lo que es una funcion. Despues del tiempo de Leibniz, el uso de “funciones”sefue haciendo cada vez mas comun. Sin embargo, se requirio de mucho tiempopara que el concepto moderno de funcion se pudiera desarrollar y la manera deabordarlo estuviera a nuestro alcance.

La definicion de funcion esta fuertemente basada en el concepto de par ordenado.Historicamente tambien hubo muchos problemas e intentos fallidos hasta llegar ala definicion correcta de par ordenado.

Definicion 5.2.1. El par ordenado de primera coordenada a y segunda coorde-

nada b es el conjunto

〈a, b〉 = {{a} , {a, b}} .

La propiedad fundamental de los pares ordenados es:

〈a, b〉 = 〈c, d〉 si, y solamente si, a = c y b = d. (5.1)

[email protected]?

Page 98: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

84

Incluso esta propiedad se usa para definir lo que se entiende por par ordenado enalgunos libros que no pretenden abundar en su formalismo. Aquı conviene notarque la antisimetrıa entre {a} y {a, b} en la definicion hace posible desarrollar unademostracion rigurosa de la propiedad (1).

El concepto de par ordenado nos posibilita para definir otro de los conceptospopulares en matematicas, el producto cartesiano:

Definicion 5.2.2. El producto cartesiano de conjuntos A y B es el conjunto

A × B = {〈a, b〉 : a ∈ A y b ∈ B} .

Con el concepto de producto cartesiano podemos definir de una manera rigurosalo que debemos entender por “una funcion entre los conjuntos A y B”. Creemosque vale la pena remarcar aquı que a este concepto moderno de funcion se llegasolo despues de desarrollar los conceptos conjuntistas que permiten sacar provechode las ideas intuitivas de funcion para plasmarlas de manera muy abstracta y, porlo tanto, general. Invitamos al lector a consultar [1] para mas informacion sobrelos conceptos conjuntistas de par ordenado, producto cartesiano, funcion, etc.

La definicion moderna de funcion es:

Definicion 5.2.3. Sean A y B dos conjuntos. Una funcion f de A en B es un

subconjunto f de A × B tal que

si 〈a, b〉 ∈ f y 〈a, c〉 ∈ f , entonces b = c, y

para todo a ∈ A existe algun b ∈ B tal que 〈a, b〉 ∈ f .

La primera parte de la definicion nos dice que bajo la funcion, a cada elementodel conjunto A solo le corresponde un elemento del conjunto B. La segunda partenos dice que cada elemento de A es asociado por la funcion con algun elementode B. La notacion usual para denotar a una funcion f de A en B es f : A → B.Al conjunto A se le llama dominio de la funcion f y realmente A puede pensarsecomo el conjunto de puntos a los cuales se puede aplicar la funcion f.

Pero... ¿para que tanta sofisticacion, quizas podrıamos ser felices con nuestraidea de que las funciones son algo ası como formulas?

No, en verdad, las matematicas modernas se benefician mucho del hecho de teneruna definicion amplia para el concepto de funcion. Parte de la actividad actual enmatematicas se centra en determinar hasta que punto dos diferentes estructurasson equivalentes. Sin un concepto de funcion capaz de englobar tanta generalidadeso serıa completamente imposible. Por otra parte, cuando se trata de aplicar meto-dos matematicos a procesos del mundo real lo que generalmente se hace es describirdicho proceso mediante alguna funcion que interprete los diferentes estados delproceso.

Pero las funciones en matematicas van mucho mas alla que servir como simplesobjetos traductores entre diferentes estructuras matematicas o entre el mundo realy conceptos numericos. No ha faltado el matematico que ha llegado a comentar

Page 99: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 85

que “las matematicas son el estudio de las funciones”. Puede parecer inadecua-do el comentario; sin embargo, cuando uno empieza a reflexionar un poco se dacuenta que las funciones estan en todas las ramas de las matematicas y que ellasjuegan un papel importante. Por ejemplo, es evidente que el calculo no es otracosa que estudiar el comportamiento cuantitativo de las funciones, el algebra noes mas que el estudio del comportamiento de las funciones que habitualmente lla-mamos operaciones, la probabilidad es el estudio de una funcion llamada medidaprobabilıstica que asigna valores numericos a los eventos en se esten analizando.Le dejamos al lector la tarea de descubrir el tipo de funciones que aparecen en laliteratura que este estudiando cotidianamente o que por alguna razon llegue a susmanos.

Para ejemplificar lo complicado que tambien pueden llegar a ser las funciones, enesta platica mostraremos algunas funciones que de un modo u otro estan alejadasde nuestras ideas intuitivas. Para ello vamos a recordar lo que se entiende por unafuncion continua de numeros reales.

Sea A ⊆ R. Una funcion f : A → R es una funcion continua en un punto x ∈ Asi para cualquier ε > 0 es posible hallar un δ > 0 tal que

si |x − y| < δ y y ∈ A, entonces |f (x) − f (y)| < ε.

Intuitivamente una funcion continua es aquella que manda puntos cercanos de sudominio a puntos cercanos.

Como primer ejemplo veamos la funcion f : R → R definida por

f (x) =

{1 si x es racional,

−1 si x es irracional.

Esta funcion es discontinua en cualquier punto de R pero la funcion g : R → R

dada por g (x) = |f (x)| es continua en cualquier punto de R. En efecto, para verque f es discontinua en cualquier x ∈ R, basta tomar ε = 1. Entonces no importaque tan pequeno tomemos a δ, siempre sera posible hallar un numero racional y,si x es irracional, o hallar un numero irracional y, si x es racional, de modo que|x − y| < δ, pero que por la definicion de la funcion 2 = |f (x) − f (y)|, y ası no escierto que |f (x) − f (y)| < 1.

La segunda parte de la afirmacion —que g es continua— se deduce facilmenteobservando que g es de hecho una funcion constante. La misma idea puede aplicarsepara conseguir una funcion h : R → R que es continua unicamente en un solo punto:

h (x) =

{x si x es racional,

−x si x es irracional.

Esta funcion solo es continua en 0. Para ver que h no es continua en ningunx ∈ R\ {0} se hace algo muy similar a lo que hicimos en nuestro primer ejemplotomando ε = |x|. Para ver que la funcion sı es continua en 0 se toma δ = ε.

La mayorıa de las funciones reales que presentan en sus ejemplos los librosintroductorios de calculo son continuas en algun punto. Cuando una funcion es

Page 100: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

86

continua en un punto x de su dominio, se puede demostrar entonces que la funciones acotada2 en algun intervalo alrededor de ese punto. ¿Podra existir una funcionque no este acotada en ningun intervalo abierto?

Para definir dicha funcion primero recordemos que si x es un numero racionaligual a m

n , donde m y n son enteros tales que la fraccion mn usa los mınimos

terminos con n > 0, entonces m y n estan unıvocamente determinados.Por lo tanto, la siguiente funcion esta bien definida:

f (x) =

{n si x es racional, x = m

n con mınimos terminos y n > 0,0 si x es irracional.

Si f fuera acotada en un intervalo (a, b) entonces para todo mn ∈ (a, b), los

denominadores n estarıan acotados, y por lo tanto los numeradores m tambien.Pero esto implicarıa que hay solamente una cantidad finita de racionales en elintervalo (a, b); una contradiccion.

Esta misma idea puede usarse para construir una funcion que es continua exacta-mente en los numeros irracionales (y, por tanto, discontinua en los racionales).Basta definir

h (x) =

{1

n si x es racional, x = mn con mınimos terminos y n > 0,

0 si x es irracional.

No vamos a exponer los detalles de por que la funcion es como decimos, mejor ledejamos los detalles al lector interesado. Es un buen ejercicio. Aprovechamos tam-bien la ocasion para comentar que aunque pudiera parecer natural no es posibledefinir una funcion que sea continua exactamente sobre los racionales (y disconti-nua sobre los irracionales).

Veamos un ejemplo mas. En la funcion anterior f vemos un ejemplo de una fun-cion que toma valores tan grandes como queramos en cualquier intervalo. ¿Que tan-to podremos controlar los valores que toma una funcion? ¿Podremos hacer quetome todos los valores posibles? La respuesta es que sı. Mostraremos ahora uncaso particular de esto: Una funcion definida sobre [0, 1] y que su rango3 es [0, 1]sobre cada intervalo (no degenerado) del [0, 1] .

Necesitamos un poco de preparacion para esto. Si x es un elemento arbitrariode [0, 1], escribamos a x en su expansion decimal

x = 0.a1a2a3 · · ·

Los unicos casos en que esta expresion no es unica es cuando x puede expresarseo bien con un decimal que termina o uno con infinitos 9’s repetidos. Podemossuponer, por ejemplo, que no permitimos lo segundo y entonces suponer que ca-da x ∈ [0, 1] tiene una unica expansion decimal. Recordemos tambien que x es

2Una funcion f : A → R es acotada en un intervalo (a, b) si existe un K > 0 tal que |f (x)| ≤ K

siempre que x ∈ (a, b) ∩ A.3“Rango”es el conjunto de todos los valores que toma una funcion.

Page 101: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 87

racional solamente en caso que los dıgitos ai eventualmente tengan un patron derepetimiento.

Para cada x ∈ [0, 1], definamos x como el numero que usa los dıgitos imparesde x; es decir,

x = 0.a1a3a5 · · ·

Y ahora, para cada x ∈ [0, 1] , sea

f (x) =

0.a2na2n+2a2n+4 · · · si x es racional con su primer segmentoque se repite empezando con a2n−1,

0 si x es irracional.

Para aclarar un poco consideremos x = 0·1234567890012012012012 · · · y evalue-mos f en x. Para este x tenemos que x = 0,13579021021021 · · · que es racional ycuyos dıgitos se empiezan a repetir con a11 = 0, luego

f (0,123456789001001001001 · · ·) = 0,102102102 · · ·

Veamos que la funcion ası definida sirve. Sea I cualquier subintervalo de [0, 1]y elija los dıgitos a1, a2, a3, . . . , a2n−2 de manera que

0.a1a2 · · · a2n−10 y 0.a1a2 · · ·a2n−21 sean ambos elementos de I y

a2n−3 no es ni 0 ni tampoco 1.

Si y = 0.b1b2b3 · · · es cualquier elemento de [0, 1], entonces podemos definir:

a2n−1 = a2n = a2n+1 = · · · = a4n−5 = 0 y a4n−3 = 1

y los subsecuentes ai’s para impares i definidos por repeticion cıclica en gruposde n en n para obtener el numero

x = 0.a1a2 · · · a2n−1b1a2n+1b2a2n+3b3a2n+5b4a2n+7b5a2n+9 · · ·

que pertenece a I y tal que la expresion

0.a1a3a5 · · ·a2n−3a2n−1a2n+1 · · ·

tiene un decimal periodico cuyo primer perıodo empieza con a2n−1 y consecuente-mente

f (x) = 0.b1b2b3 · · ·

Hay muchos otros ejemplos de funciones complicadas que no podrıan siquieraser imaginadas en el tiempo de G. W. Leibniz. Por ejemplo:

Una funcion continua definida en [0, 1] y cuya imagen es todo el cuadrado[0, 1]× [0, 1] .

Page 102: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

88

Una funcion que es continua en todo punto de R pero que no es diferenciableni siquiera en un solo punto.

Una funcion de R en R que es continua y sobreyectiva pero que es constanteen casi todo punto de R.

Una funcion de R en R que no puede ser continua cuando se restringe acualquier subconjunto de cardinalidad c.

Para ejemplificar esa otra parte de que las funciones son empleadas para iden-tificar estructuras veamos como usar una funcion para establecer la unicidad denuestro sistema numerico R, los numeros reales.

Recordemos que nuestro sistema numerico es lo que se conoce como completo.

Definicion 5.2.4. Un sistema numerico ordenado F se llama completo si siempre

que A ⊆ F es no vacıo y existe una cota superior para A, entonces existe una

mınima cota superior. A esa se le llama supremo de A y se denota por sup A.

Ahora que debemos entender por el hecho de que dos sistemas numericos orde-nados sean equivalentes.

Definicion 5.2.5. Si F1 y F2 son dos sistemas numericos ordenados, un isomor-fismo de F1 en F2 es una funcion f : F1 → F2 con las siguientes propiedades:

1. Si x 6= y, entonces f (x) 6= f (y) .

2. Si z ∈ F2, entonces z = f (x) para algun x ∈ F1.

3. Si x, y ∈ F1, entonces

f (x + y) = f (x) ⊕ f (x) y f (x · y) = f (x) � f (y) .

4. Si x, y ∈ F1 y x ≤ y, entonces f (x) E f (y) .

Intuitivamente, la funcion f traduce informacion entre los dos sistemas numeri-cos. La primera propiedad de f es que asigne valores distintos a elementos distintos,la segunda que cualquier elemento de F2 es el valor bajo la funcion de alguno delos elementos de F1. Ası f traduce fielmente punto a punto todos los elementos deF1 en todos los elementos de F2. La tercera propiedad se refiere a las operacionesy se puede resumir diciendo que f preserva las operaciones entre los dos sistemasnumericos. La cuarta propiedad dice lo propio con respecto al orden. Vamos aponer como un teorema el resultado que hemos comentado antes.

Theorem 1. Si F es un sistema ordenado completo, entonces existe un isomorfismoentre R y F .

Page 103: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 89

La idea para establecer este resultado es definir una funcion f : R → F quesea un isomorfismo. Vamos a definir la funcion f por etapas. Para distinguir, lasoperaciones de suma y multiplicacion de F denotamos estas por ⊕, y �, el ordenpor E, y algunos de sus elementos en negritas. Empecemos por definir f sobre losenteros. Como F es un sistema numerico, F debe tener dos elementos distinguidosque son analogos a cero y a uno. Denotamos a esos elementos por 0 y 1, y entoncesempezamos a definir f como sigue:

f (0) = 0

f (n) = 1 ⊕ 1 ⊕ 1 ⊕ · · · ⊕ 1︸ ︷︷ ︸n veces

, para n > 0,

f (n) = (1 ⊕ 1 ⊕ 1 ⊕ · · · ⊕ 1︸ ︷︷ ︸)|n| veces

, para n < 0.

Entonces se puede establecer que

f (m + n) = f (m) ⊕ f (n) y f (m · n) = f (m) � f (n)

para todos los enteros m y n. Conviene ahora denotar a f (n) simplemente por n.Entonces para los numeros racionales uno hace

f(m

n

)= m� n−1.

Y tambien se puede demostrar que para todos los numeros racionales se tiene que

f (r1 + r2) = f (r1) ⊕ f (r2) y f (r1 · r2) = f (r1) � f (r2) ,

y mas aun,

r1 ≤ r2 ⇒ f (r1) E f (r2) .

¿Como extender ahora la definicion a todos los numeros reales? Es en estaparte que se usa el hecho de que R y F sean sistemas numericos completos. Paracualquier x ∈ R, sea Ax el subconjunto de F que consiste de todos los f (r) paratodos los numeros racionales r < x; o sea,

Ax = {f (r) : r ∈ Q y r < x} .

El conjunto Ax es ciertamente no vacıo y si t es un racional estrictamente mayorque x, entonces

f (r) ≤ f (t)

para todo r < x; es decir, f (t) debe ser una cota superior para Ax. Como F esun sistema numerico completo, debe existir la mınima cota para Ax y entonceshacemos

f (x) = sup Ax.

Page 104: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

90

Esto completa la definicion de la funcion f para cada punto x de R. Ahora sı sedebe trabajar un poco para demostrar que f ası definida preserva las operacionesalgebraicas, el orden y que es una biyeccion entre R y F . No es nuestra intencionaquı hacer todo eso, para nosotros lo importante es como definir la funcion quenos permite decir que, en esencia, R y F son el mismo objeto. Invitamos al lectorinteresado en ver como se termina la demostracion a consultar [2] donde en elcapıtulo 29 se expone completamente la demostracion de este teorema.

Agradecimientos

El autor agradece a Andres Pedroza y a toda la Facultad de Ciencias de laUniversidad de Colima por la invitacion para presentar esta platica en el InstitutoHeisenberg y la hospitalidad durante su visita.

Page 105: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Bibliografıa

[1] Fernando Hernandez Hernandez, Teorıa de conjuntos, Aportaciones Matemati-cas: Textos [Mathematical Contributions: Texts], vol. 13, Sociedad MatematicaMexicana, Mexico, 1998. MR1648496(99e:04001)

[2] Michael Spivak, Calculus, Ediciones Repla, Mexico, 1988, Version espanola porBartolome Frontera Marques de la obra original Calculus,2nd ed. publicada porW. A. Benjamin Inc. New York.

91

Page 106: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

92

5.3. Jugando con el caos

Monica Moreno Rocha 1

Departament de Matematiques, Universitat Autonoma de Barcelona08193 Bellaterra, Barcelona, Espana

5.3.1. La dimension desconocida

La mayorıa de nosotros tenemos una idea de lo que es la dimension, algunos deforma intuitiva, otros mas formal. En general, un objeto que tiene ancho, altura ygrosor lo consideramos tridimensional ; aquel que solo tienen longitud y altura lellamamos bidimensional, y el que solo tienen longitud lo consideramos unidimen-

sional. Un estudiante que haya llevado un curso de geometrıa podra citar comoejemplos al cubo, el rectangulo y la lınea real, respectivamente.

Muy impresionante, pero ¿por que es verdad todo esto?Una clave nos la da la siguiente proposicion: para un matematico, una “perso-

na unidimensional”puede ser real o imaginaria...o ambas. La forma coloquial dedescribir, por ejemplo, a una persona que piensa de una sola forma, tiene cone-xion con una definicion un tanto mas rigurosa de dimension. Si un objeto tiene ununico grado de libertad de movimiento independiente (dıgase izquierda–derecha,o arriba–abajo) le consideramos unidimensional. Si hay dos grados de libertad demovimiento independiente (izquierda-derecha y arriba-abajo), le llamamos bidi-mensional. Tres grados de libertad o ninguna corresponden pues a objetos tridi-mensionales o a los de dimensıon cero, respectivamente.

Notemos que esta nueva definicion tiene sus problemas: ¿cual es la dimensionde una curva en el espacio tridimensional? Una hormiga subiendo por una curvahelicoidal se mueve claramente de abajo hacia arriba y de izquierda a derecha, ¿espues la helicoidal bidimensional? No, la curva sigue siendo unidimensional, la clavede esto esta en el termino “movimiento independiente”(nada que ver con polıtica)pero no ondaremos en esto. Hemos de describir (aunque a grandes rasgos) unadefinicion matematica de la dimension que puede ser usada en un gran numero decasos.

5.3.2. Juego caotico

Serıa poco interesante describir una formula matematica que compruebe lo quela gran mayorıa de la gente ya ha dado por hecho sobre dimensiones. Ası pues,desistamos de las matematicas y volquemos nuestro ocio en el Chaos Game o eljuego del caos4.

[email protected]: tenga cuidado de un matematico ocioso.

Page 107: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 93

Este juego fue descrito por Michael Barnsley en su libro Fractals Everywhere,editado por Academic Press en el ano de 1989. Y si el lector me permite una notapersonal, en aquel ano me encontraba estudiando la licenciatura en matematicasen Durango, mi ciudad de origen. Y aunque este libro no llegarıa a mis manoshasta principios de los noventa, pude leer un artıculo sobre el juego del caos y losfractales publicado en Nature y que mi hermano fue tan amable de enviarme unacopia xerox. El juego descrito y las figuras fractales me impactaron tanto que esteartıculo tuvo una gran influencia en mi actual lınea de investigacion (aun conservoesas paginas borrosa del artıculo).

¿Le interesa jugar con el caos?, de ser ası he aquı la descripcion del juego:

1. Dibuje tres puntos en una hoja de tal forma que sean los vertices de untriangulo, de preferencia equilatero.5

2. Asigne un color distinto a cada vertice, digamos verde, rojo y azul.

3. Busque un dado que no este cargado y coloree dos de sus lados con cada colorque hemos elegido (y si jugar con dados le implica hacer apuestas, tendra queesperar un poco mas).

4. Para iniciar el juego, elija cualquier punto sobre la hoja. Este sera su puntoinicial x0. Lance el dado. Si ha caıdo en rojo, dibuje un nuevo punto, x1, ala mitad de la distancia entre x0 y el vertice rojo (similarmente si ha caıdoverde o azul).

5. Borre el punto x0 para que x1 sea ahora su punto inicial. Genere x2 de lamisma forma: lanzando el dado y calculando el punto medio entre x1 y elvertice del color, y borre x1. Repita el proceso unas cinco o seis veces.

6. A partir de aquı, ya no borre el punto inicial. Esto es, deje x6, x7, x8 . . .marcados en la hoja.

Y he aquı la parte interesante del juego: despues de lanzar el dado y dibujarpunto tras punto hasta el cansancio, ha generado una sucesion {xn} de puntos enel plano. ¿Es esta sucesion convergente?, ¿que figura forman los puntos xn?

Aquı sı que puede empezar sus apuestas (pero solo con frijolitos): muchos espe-rarıan una nube caotica de puntos esparcida por toda la hoja, otros pensarıan quelos puntos llenarıan el triangulo definido por los vertices iniciales, y unos cuan-tos mas pensarıan haber obtenido el mismısimo perfil de Elvis Presley (y los hay,creame).

Si estas han sido sus elecciones, pues ha perdido y la casa gana. La figura queusted obtendra es lo que los matematicos llamamos el triangulo de Sierpinski yel cual denotaremos por T . Sierpinski fue uno de los mas destacados topologos dela escuela matematica polaca (esto es, matematicos nacidos en Polonia) del sigloXIX. Dos de sus mas conocidas contribuciones fueron los ejemplos topologicos

5¿Que le advertı?

Page 108: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

94

ahora conocidos como el triangulo y la carpeta de Sierpinski. He aquı la descripciondetallada de la construccion del triangulo:

1. Comienze por dibujar un triangulo equilatero solido, T0, y marque los puntosmedios de cada uno de sus lados.

2. Conecte estos puntos para obtener un triangulo central equilatero con lamitad del tamano del original (ya que hemos utilizado puntos medios comovertices).

3. Remueva (o borre) el triangulo central para obtener el conjunto T1, confor-mado por tres triangulos solidos de la mitad del tamano de T0.

Repita el proceso por segunda vez: en cada uno de los tres triangulos, identifiquelos puntos medios, conectelos para formar triangulos centrales y remuevalos paraobtener T2. Este conjunto consiste de nueve triangulos, de un cuarto del tamanode T0. Si repite este proceso una tercera vez, obtendra T3 con 27 triangulos de1/8 del tamano de T0. Podemos pues obtener la siguiente relacıon: si el proceso serepite n veces, se obtiene el conjunto Tn con 3n triangulos, cada uno del tamano1/2n de T0.

Cuando n tiende a infinito, se tiene que Tn → T (esta convergencia entre con-juntos puede verse tambien como una interseccion infinita de conjuntos compactosanidados, donde Tn+1 ⊂ Tn.)

Figura 5.2: Los conjuntos T0, T1, T2, T3 y T4 en la construccion del triangulo deSierpinski

5.3.3. Cuando todo parece ser lo mismo

Una propiedad interesante de T es la autosimilitud. En pocas palabras, unobjeto es autosimilar si podemos encontrar en el copias a escala de sı mismo. Lalınea recta, por ejemplo, es autosimilar: si se corta en n pedazos iguales, cadapedazo es similar a la recta y tiene un factor de magnificacion n. Si los lados deun cuadrado se subdividen en n partes iguales, se generan n2 subcuadrados delmismo tamano. Cada uno puede magnificarse por un factor de n para obtener eloriginal. Algo similar podemos hacer con el cubo: generar n3 pequenos cubos deigual tamano con factor de magnificacion n.

El triangulo de Sierpinski es tambien un objeto autosimilar. Con un rapidoanalisis de T vemos que existen 3 copias de sı mismo con factor de magnificacion

Page 109: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 95

2; 9 copias con factor 4; 27 copias con factor 8, etcetera. No es difıcil ver que paracada entero positivo n, existen pues 3n copias de T con factor de magnificacion2n.

5.3.4. Calculando dimensiones

El lector notara algo interesante en la propiedad de autosimilitud para los ob-jetos analizados anteriormente:

No. de copias FactorLınea n1 n

Cuadrado n2 nCubo n3 nT 3n 2n

El exponente del numero de copias para los primeros tres objetos correspondea su dimension. Pero en el caso de T no es posible “leer”la dimension a partir delos exponentes. Hemos pues de calcular exponentes usando logaritmos. Para ello,definamos la funcion Df como

Df =log(Numero de copias similares)

log(Factor de magnificacion).

Aplicando esta funcion a la lınea, obtenemos

Df =log n

log n= 1,

para el cuadrado obtenemos

Df =log n2

log n=

2 logn

log n= 2

y el cubo da el valor de log n3/ log n = 3. Los valores que la funcion Df tomapara estos objetos coincide pues con su dimension. Por ello, Df es conocida comola dimension de autosimilaridad, de capacidad o dimension fractal. Este ultimonombre se debe a que Df puede tomar valores tanto enteros como fraccionarios. Ypara muestra un boton: calculemos el valor de Df para el triangulo de Sierpinski:

Df =log(3n)

log(2n)=

n log 3

n log 2=

log 3

log 2.

Hemos obtenido Df ≈ 1,58496, por lo que T no es “tan pequenocomo una lınea,pero no “tan grandecomo un triangulo solido.

Page 110: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

96

5.3.5. Otros ejemplos

El triangulo de Sierpinski es un ejemplo de un objeto fractal : es autosimiliary su dimension no es entera, sino fraccionaria. La carpeta de Sierpinski (ver lafigura) es otro ejempo de un fractal autosimilar. Su construccion comienza con uncuadrado solido, se parte en nueve subcuadrados iguales y se borra el cuadradocentral. Se repite el proceso con los cuadrados restantes hasta el lımite. La carpetade Sierpinski es claramente autosimilar: para cada n hay 8n copias autosimilarescon factor de magnitud 3n. Y su dimension esta dada por

Df =log 8n

log 3n=

log 8

log 3≈ 1,61055.

Figura 5.3: La construccion de la carpeta de Sierpinski.

Si aplicamos un proceso similar al cubo: subdividir un cubo solido en 27 sub-cubos y eliminar todos los cubos centrales (siete en total). Repetir el proceso a los20 cubos restantes una y otra vez. Este proceso generara en el lımite la esponja de

Menger, he invitamos al lector a calcular su dimension fractal.

Figura 5.4: La esponja Menger

Page 111: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 97

5.3.6. Bibliografıa

Para mayor informacion sobre fractales y dimension, consulte los libros

M. F. Barnsley, Fractals Everywhere, 2nd Edition, Academic Press, NewYork, 1993.

R. L. Devaney, Chaos, Fractals, and Dynamics: Computer Experiments in

Mathematics Addison-Wesley, 1989.

Si desea jugar una version en lınea del Chaos Game, acceda la pagina

http://math.bu.edu/DYSYS/applets/chaos-game.html

Page 112: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

98

Page 113: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Capıtulo 6

Participantes

99

Page 114: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

100

Nombre Institucion

Angulo Villa Tarcila Viridiana Bach. No. 1Arceo Gallegos Daniela Artemisa Bach. No. 2Blanco Hoyos Aaron Ernesto Bach. No. 16Bustos Manrıquez Manuel Alejandro Bach. No. 4Cisneros Contreras Monica Sugey CBTis No. 19Flores Valle Demis Alberto Bach. No. 4Garcıa Martınez Rodrigo Bach. No. 16Gonzalez Alatorre Arturo Bernardo Bach. No. 4Gutierrez Zamora Omar Salvador CampoverdeHuerta Rodrıguez Luis Armando Bach. No. 5Huızar Padilla Emilio Bach. No. 5Mora y Guerrero Alma Rosa Bach. No. 1Moreno Sanchez Jose Roberto Bach. No. 1Nieto Trujillo Amarantha Bach. No. 30Quijano Rıos Luis Alberto Bach. No. 5Robles Arias Pedro Bach. No. 1Rodrıguez Mendoza Miguel Tadeo Bach. No. 16Romero Mimbela Carmen Cecyte 05 (Michoacn)Sanchez Contreras Cristina CBTis No. 19Silva Arellano Jose Eduardo Bach. No. 4Vargas Magana Marcos C esar Bach. No. 5

Page 115: Instituto Heisenberg Anuario 2005 - fejer.ucol.mxfejer.ucol.mx/ih/notas/anuario2005.pdf · UNIVERSIDAD DE COLIMA MC. Miguel Angel Aguayo L opez, Rector / Dr. Ram on Cedillo Nakay,

Instituto Heisenberg, Anuario 2005 101

Instituto HeisenbergAnuario 2005

Alfredo Aranda Fernandez

Se termino de imprimir en ???? de 2005 en la Direccion General dePublicaciones de la Universidad de Colima, Colima, Mexico.

Diseno: Alfredo Aranda Fernandez/ Correccion: Myriam Cruz Calvario