apuntes teoria de errores

49
Física re-Creativa – S. Gil y E. Rodríguez 1 1 1– Introducción Una magnitud física es un atributo de un cuerpo, un fenómeno o una sustancia, que puede determinarse cuantitativamente, es decir, es un atributo susceptible de ser medido. Ejemplos de magnitudes son la longitud, la masa, la potencia, la velocidad, etc. A la magnitud de un objeto específico que estamos interesado en medir, la llamamos mesurando. Por ejemplo, si estamos interesado en medir la longitud de una barra, esa longitud específica será el mesurando Para establecer el valor de un mesurando tenemos que usar instrumentos de medi- ción y un método de medición. Asimismo es necesario definir unidades de medición. Por ejemplo, si deseamos medir el largo de una mesa, el instrumento de medición será una regla. Si hemos elegido el Sistema Internacional de Unidades (SI), la unidad será el metro y la regla a usar deberá estar calibrada en esa unidad (o submúltiplos). El método de medición consisti- rá en determinar cuantas veces la regla y fracciones de ella entran en la longitud buscada. En ciencias e ingeniería, el concepto de error tiene un significado diferente del uso habitual de este término. Coloquialmente, es usual el empleo del término error como análogo o equiva- lente a equivocación. En ciencia e ingeniería, el error, como veremos en lo que sigue, está más bien asociado al concepto de incerteza en la determinación del resultado de una medición. Más precisamente, lo que procuramos en toda medición es conocer las cotas (o límites pro- babilísticos) de estas incertezas. Gráficamente, buscamos establecer un intervalo x x x x x - como el de la Figura 1.1, donde con cierta probabilidad, podamos decir que se encuentra el mejor valor de la magnitud x . Este mejor valor x es el más representati- vo de nuestra medición y al semiancho x lo denominamo la incerteza o error absoluto de la medición. & Ejemplos @ Ejercicios J Misceláneas $ Evaluación Errores de medición. Precisión y exactitud. Cifras significativas. Errores absolutos y relativos. Histogramas. Errores sistemáticos y accidentales. Propagación de erro- res. Elección de instrumentos de medición. Teoría de errores - Incertezas de medición

Upload: alvaro-mamani-q

Post on 30-Jun-2015

258 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 1

1 1– Introducción

Una magnitud física es un atributo de un cuerpo, un fenómeno o una sustancia, que puede determinarse cuantitativamente, es decir, es un atributo susceptible de ser medido. Ejemplos de magnitudes son la longitud, la masa, la potencia, la velocidad, etc. A la magnitud de un objeto específico que estamos interesado en medir, la llamamos mesurando. Por ejemplo, si estamos interesado en medir la longitud de una barra, esa longitud específica será el mesurando

Para establecer el valor de un mesurando tenemos que usar instrumentos de medi-

ción y un método de medición. Asimismo es necesario definir unidades de medición. Por ejemplo, si deseamos medir el largo de una mesa, el instrumento de medición será una regla. Si hemos elegido el Sistema Internacional de Unidades (SI), la unidad será el metro y la regla a usar deberá estar calibrada en esa unidad (o submúltiplos). El método de medición consisti-rá en determinar cuantas veces la regla y fracciones de ella entran en la longitud buscada.

En ciencias e ingeniería, el concepto de error tiene un significado diferente del uso habitual

de este término. Coloquialmente, es usual el empleo del término error como análogo o equiva-lente a equivocación. En ciencia e ingeniería, el error, como veremos en lo que sigue, está más bien asociado al concepto de incerteza en la determinación del resultado de una medición. Más precisamente, lo que procuramos en toda medición es conocer las cotas (o límites pro-babilísticos) de estas incertezas. Gráficamente, buscamos establecer un intervalo

xxxxx ∆+≤≤∆− como el de la Figura 1.1, donde con cierta probabilidad, podamos decir que se encuentra el mejor valor de la magnitud x. Este mejor valor x es el más representati-vo de nuestra medición y al semiancho x∆ lo denominamo la incerteza o error absoluto de la medición.

& Ejemplos

@ Ejercicios

☺ Misceláneas

$ Evaluación

Errores de medición. Precisión y exactitud. Cifras significativas. Errores absolutos y relativos. Histogramas. Errores sistemáticos y accidentales. Propagación de erro-res. Elección de instrumentos de medición.

Teoría de errores -

Incertezas de medición

Page 2: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 2

Figura 1.1. Intervalo asociado al resultado de una medición. Notamos que, en lugar de dar un único número, definimos un intervalo. Al valor representativo del centro del intervalo ( x ) lo llamamos el mejor valor de la magnitud en cuestión. El semiancho del intervalo ( x∆ ) se denomina la incer-tidumbre o error absoluto de la medición.

En todo proceso de medición existen limitaciones dadas por los instrumentos usados, el

método de medición, el observador (u observadores) que realizan la medición. Asimismo, el mismo proceso de medición introduce errores o incertezas. Por ejemplo, cuando usamos un termómetro para medir una temperatura, parte del calor del objeto fluye al termómetro (o viceversa), de modo que el resultado de la medición es un valor modificado del original debi-do a la inevitable interacción que debimos realizar. Es claro que esta interacción podrá o no ser significativa: Si estamos midiendo la temperatura de un metro cúbico de agua, la cantidad de calor transferida al termómetro puede no ser significativa, pero si lo será si el volumen en cuestión es de una pequeña fracción del mililitro.

Tanto los instrumentos que usamos para medir como las magnitudes mismas son fuente de

incertezas al momento de medir. Los instrumentos tienen una precisión finita, por lo que, para un dado instrumento, siempre existe una variación mínima de la magnitud que puede detectar. Esta mínima cantidad se denomina la apreciación nominal del instrumento. Por ejemplo, con una regla graduada en milímetros, no podemos detectar variaciones menores que una fracción del milímetro.

A su vez, las magnitudes a medir no están definidas con infinita precisión. Imaginemos que

queremos medir el largo de una mesa. Es posible que al usar instrumentos cada vez más preci-sos empecemos a notar las irregularidades típicas del corte de los bordes o, al ir aun más allá, finalmente detectemos la naturaleza atómica o molecular del material que la constituye. Es claro que en ese punto la longitud dejará de estar bien definida. En la práctica, es posible que mucho antes de estos casos límites, la falta de paralelismo en sus bordes haga que el concepto de la “longitud de la mesa” comience a hacerse cada vez menos definido, y a esta limitación intrínseca la denominamos denomina incerteza intrínseca o falta de definición de la magni-tud en cuestión.

Otro ejemplo sería el caso en que se cuenta la cantidad de partículas alfa emitidas por una

fuente radioactiva en 5 segundos. Sucesivas mediciones arrojarán diversos resultados (simila-res, pero en general distintos). En este caso, de nuevo, estamos frente a una manifestación de una incerteza intrínseca asociada a esta magnitud “número de partículas emitidas en 5 s”, más que al error de los instrumentos o del observador.

x

xx ∆+ xx ∆−x

Page 3: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 3

1.2 – Algunos conceptos básicos

Otra fuente de error que se origina en los instrumentos además de la precisión es la exactitud de los mismos. Como vimos, la precisión de un instrumento o un método de medi-ción está asociada a la sensibilidad o menor variación de la magnitud que se pueda detectar con dicho instrumento o método. Así, decimos que un tornillo micrométrico (con una aprecia-ción nominal de 10 µm) es más preciso que una regla graduada en milímetros; o que un cro-nómetro es más preciso que un reloj común, etc.

La exactitud de un instrumento o método de medición está asociada a la calidad de la

calibración del mismo. Imaginemos que el cronómetro que usamos es capaz de determinar la centésima de segundo pero adelanta dos minutos por hora, mientras que un reloj de pulsera común no lo hace. En este caso decimos que el cronómetro es todavía más preciso que el reloj común, pero menos exacto. La exactitud es una medida de la calidad de la calibración de nuestro instrumento respecto de patrones de medida aceptados internacionalmente. En general los instrumentos vienen calibrados, pero dentro de ciertos limites. Es deseable que la calibración de un instrumento sea tan buena como la apreciación del mismo. La Figura 1.2 ilustra de modo esquemático estos dos conceptos.

Figura 1.2. Esta figura ilustra de modo esquemático los conceptos de precisión y exactitud. Los centros de los círculos indican la posición del “verdadero valor” del me-surando y las cruces los valores de varias determinaciones del centro. La dispersión de los puntos da una idea de la precisión, mientras que su centro efectivo (centroide) está asociado a la exactitud. a) es una determinación precisa pero inexacta, mientras d) es más exacta pero imprecisa; b) es una determinación más exacta y más precisa; c) es menos precisa que a).

Exactitud

c ) d

a ) b

Precisión

Page 4: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 4

Decimos que conocemos el valor de una magnitud dada, en la medida en que cono-cemos sus errores. En ciencia consideramos que la medición de una magnitud con un cierto error no significa que se haya cometido una equivocación o que se haya realizado una mala medición. Con la indicación del error de medición expresamos, en forma cuantitativa y lo más precisamente posible, las limitaciones que nuestro proceso de medición introduce en la deter-minación de la magnitud medida.

¡Es imprescindible en ciencia e ingeniería especificar los errores de medición!

La nomenclatura moderna usada en Metrología para denotar los conceptos dis-cutidos en este capitulo puede encontrarse consultando las publicaciones sobre el te-ma elaboradas por la International Organization for Standardization (ISO 3534-1993)[7] que puede obtenerse a través de la pagina de Internet del National Institute of Standard and Technology ( NIST ) de los EE. UU. (http://www.nist.gov/). La institución equivalen-te en la República Argentina es el Instituto de Tecnología Industrial (INTI: http://www.inti.gov.ar/cefis/).

1.3 – Clasificación de los errores Existen varias formas de clasificar y expresar los errores de medición. Según su origen los errores pueden clasificarse del siguiente modo: I. Errores introducidos por el instrumento:

ü Error de apreciación, σσap: si el instrumento está correctamente calibrado la in-certidumbre que tendremos al realizar una medición estará asociada a la mínima divi-sión de su escala o a la mínima división que podemos resolver con algún método de medición. Nótese que no decimos que el error de apreciación es la mínima división del instrumento, sino la mínima división que es discernible por el observador. La mí-nima cantidad que puede medirse con un dado instrumento la denominamos aprecia-ción nominal. El error de apreciación puede ser mayor o menor que la apreciación nominal, dependiendo de la habilidad (o falta de ella) del observador. Así, es posible que un observador entrenado pueda apreciar con una regla común fracciones del mi-límetro mientras que otro observador, con la misma regla pero con dificultades de vi-sión sólo pueda apreciar 2 mm.

ü Error de exactitud, σσexac: representa el error absoluto con el que el instrumento en cuestión ha sido calibrado.

Page 5: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 5

II. Error de interacción; , σσ int: esta incerteza proviene de la interacción del método de medición con el objeto a medir. Su determinación depende de la medición que se realiza y su valor se estima de un análisis cuidadoso del método usado.

III. Falta de definición en el objeto sujeto a medición: como se dijo antes, las

magnitudes a medir no están definidas con infinita precisión. Con σdef designamos la incertidumbre asociada con la falta de definición del objeto a medir y representa su in-certidumbre intrínseca.

En general, en un dado experimento, todas estas fuentes de incertidumbres estarán presentes,

de modo que resulta útil definir el error nominal de una medición σnom, como:

22int

222exacdefapnom σσσσσ +++= (I.1)

Este procedimiento de sumar los cuadrados de los errores es un resultado de la estadística, y proviene de suponer que todas las distintas fuentes de error son independientes una de otras[10,13]. & Se desea determinar el diámetro del tronco de un árbol y el área de su sección

transversal. ¿Cómo procederíamos y cuáles son las fuentes principales de incerti-dumbre en esta determinación? Un método podría consistir en medir el perímetro con una cinta métrica y luego determinar el diámetro y usar este valor para calcu-lar el área. En este caso, la mayor fuente de incertidumbre proviene de la defini-ción del mesurando (el diámetro). Una forma de estimar la incertidumbre sería determinar los valores máximos y mínimos del diámetro usando una serie de me-diciones y tomar como σdiámetro la semidiferencia de estos valores, σdiámetro= ½ (Dmax - Dmin).

Según su carácter los errores pueden clasificarse en sistemáticos, estadísticos e ilegí-

timos o espurios.

a) Errores sistemáticos: se originan por las imperfecciones de los mé-todos de medición. Por ejemplo, pensemos en un reloj que atrasa o ade-lanta, o en una regla dilatada, el error de paralaje, etc. Los errores intro-ducidos por estos instrumentos o métodos imperfectos afectarán nuestros

resultados siempre en un mismo sentido. El valor de σexac sería un ejem-

Page 6: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 6

plo de error sistemático pero no son lo mismo, ni los errores de exactitud son los únicos responsables de los errores sistemáticos. Imaginemos por ejemplo el caso de una balanza bien calibrada que se usa para conocer el peso de las personas en los centros comerciales u otros negocios, como es usual que las personas (en público) se pesen vestidas, los valores re-gistrados con estas balanzas tendrán un error sistemático por el peso de la vestimenta. La única manera de detectarlos y corregirlos es comparar nuestras mediciones con otros métodos alternativos y realizar una análisis crítico y cuidadoso del procedimiento empleado. También es aconseja-ble intercalar en el proceso de medición patrones confiables que permitan calibrar el instrumento durante la medición.

b) Errores estadísticos: Son los que se producen al azar. En general

son debidos a causas múltiples y fortuitas. Ocurren cuando, por ejemplo, nos equivocamos en contar el número de divisiones de una regla, o si es-tamos mal ubicados frente al fiel de una balanza. Estos errores pueden cometerse con igual probabilidad por defecto como por exceso. Por tan-to, midiendo varias veces y promediando el resultado, es posible reducir-los considerablemente. Es a este tipo de errores a los que comúnmente hace referencia la teoría estadística de errores de medición que formula-remos sucintamente en lo que sigue. A estos errores lo designaremos con

σest. c) Errores ilegítimos o espurios: Supongamos que deseamos calcu-

lar el volumen de un objeto esférico y para ello determinamos su diáme-tro. Si al introducir el valor del diámetro en la fórmula, nos equivocamos en el número introducido, o lo hacemos usando unidades incorrectas, o bien usamos una expresión equivocada del volumen, claramente habre-mos cometido un error. Esta vez este error está más asociado al concep-to convencional de equivocación. A este tipo de errores los designamos como ilegítimos o espurios. A este tipo de errores no se aplica la teoría estadística de errores y el modo de evitarlo consiste en una evaluación cuidadosa de los procedimientos realizados en la medición Un ejemplo de este tipo de error es el que se cometió en el Mars Climate Explorer a fines de 1999, al pasar de pulgadas a cm se cometió un error que costo el fracaso de dicha misión a Marte.

Cuando se desea combinar los errores sistemáticos con los estadísticos, la pres-

cripción usual es sumar los cuadrados de los errores absolutos y luego tomar la raíz cua-drada de este resultado, como lo indica la Ec. (1.2). Si estamos midiendo una magnitud Z, el error final o combinado o efectivo de Z, ∆Z, vendrá dado por:

Page 7: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 7

22int

22222exacdefapestnomestZ σσσσσσσ ++++=+=∆ . (1.2)

Los errores pueden asimismo expresarse de distintos modos, a saber:

Ø Error absoluto: es el valor de la incertidumbre combinada (Ec. 1.2). Tiene las mismas dimensiones que la magnitud medida y es conveniente expresarla con las mismas unidades de ésta. Si Z es la magnitud en estudio, Z es el me-jor valor obtenido y ∆Z su incertidumbre absoluta. El resultado se expresa adecuadamente como:

ZZZ ∆±= (1.3)

El significado de esta notación es equivalente a decir que, según nuestra medi-ción, con una cierta probabilidad razonable p0 (usualmente p0 = 0.68, 68%) el

valor de Z está contenido en el intervalo ( Z -∆Z, Z +∆Z), o sea:

ZZZZZ ∆+<<∆− . (1.4) lo que es equivalente a:

0) ( pZZZZZP =∆+<<∆− , (1.5)

que significa que la probabilidad que el mejor estimador de Z esté comprendido entre Z -∆Z y Z +∆Z es igual a p0. El valor de p0 se conoce con el nombre de coeficiente de confianza y los valores )Z , ( ZZZ ∆+∆− determinan un inter-valo de confianza para Z.

Ø Error relativo: ZZZ /∆=ε , el cociente entre el error absoluto y el mejor

valor de la magnitud.

Ø Error relativo porcentual: ZZ εε ⋅= 100,% , es la incertidumbre relativa

multiplicada por 100.

Page 8: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 8

& Imaginemos que medimos el espesor de un alambre (cuyo diámetro es d ≈ 3 mm) y su longitud (L ≈ 1 m) con la misma regla graduada en milímetros. Es claro que los errores absolutos de medición, dados por la apreciación del instrumento, es en am-bos casos la misma (∆d = ∆L = 1 mm). Sin embargo, resulta evidente que la deter-minación de la longitud del alambre es mucho mejor que la del diámetro. El error re-lativo porcentual refleja esta diferencia, ya que para el caso del diámetro su valor es εd% ≈ 30 %, y para el caso de la longitud tenemos εL% ≈ 0.1%.

1.4 – Cifras significativas

Cuando realizamos una medición con una regla graduada en milímetros, está claro que, si somos cuidadosos, podremos asegurar nuestro resultado hasta la cifra de los milímetros o, en el mejor de los casos, con una fracción del milímetro, pero no más. De este modo nuestro resultado podría ser L = (95.2 ± 0.5) mm, o bien L = (95 ± 1) mm. En el primer caso deci-mos que nuestra medición tiene tres cifras significativas y en el segundo caso sólo dos. El número de cifras significativas es igual al número de dígitos contenidos en el resultado de la medición que están a la izquierda del primer dígito afectado por el error, incluyendo este dígi-to. El primer dígito, o sea el que está más a la izquierda, es el más significativo (9 en nuestro caso) y el último (más a la derecha) el menos significativo, ya que es en el que tenemos “me-nos seguridad”. Nótese que carece de sentido incluir en nuestro resultado de L más cifras que aquellas en donde tenemos incertidumbres (donde “cae” el error).

No es correcto expresar el resultado como L = (95.321 ±1) mm, ya que si tenemos in-

certidumbre del orden de 1 mm, mal podemos asegurar el valor de las décimas, centésimas y milésimas del milímetro. Si el valor de L proviene de un promedio y el error es del orden del milímetro, se debe redondear el dígito donde primero cae el error.

Es usual expresar las incertidumbres con una sola cifra significativa, y solo en casos excepcionales y cuando existe fundamento para ello, se pueden usar más. También es usual considerar que la incertidumbre en un resultado de medición afecta a la última cifra si es que no se la indica explícitamente. Por ejemplo, si sólo disponemos de la información que una longitud es L = 95 mm, podemos suponer que la incertidumbre es del orden del milímetro y, como dijimos antes, el resultado de L tiene dos cifras significativas.

Una posible fuente de ambigüedad se presenta con el número de cifras significativas

cuando se hace un cambio de unidades. Si en el último ejemplo deseamos expresar L en µm, el resultado sería L = (95000±1000) µm. ¿Cuántas cifras significativas tenemos en este re-sultado? Claramente dos, igual que antes, ya que la última cifra significativa sigue siendo 5. Sin embargo, si no indicamos explícitamente la incertidumbre de L, es difícil saber cuántas cifras significativas tenemos. Nótese que 95 mm ≠ 95000 µm, ya que el primer resultado tiene sólo dos cifras significativas mientras el segundo tiene 5 (a propósito compare los costos de los

Page 9: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 9

instrumentos para realizar estas dos clases de determinaciones). Para evitar estas ambigüeda-des se emplea la notación científica. Podemos escribir la siguiente igualdad: 9.5 x101 mm = 9.5 x 104 µm. Notemos que los números en ambos miembros de la igualdad tienen igual nú-mero de cifras significativas, siendo la única diferencia las unidades usadas. 1.5 – Histogramas y distribución estadística

Consideremos una población de personas de una ciudad y que queremos analizar cómo

se distribuyen las estaturas de la población. Para llevar adelante este estudio podemos medir la altura de todos los individuos de la población, o bien tomar una muestra representativa de la misma, a partir de la cual inferiríamos las características de la población. Esta clase de estudio es un típico problema de estadística. Si tomamos una muestra de tamaño N y para la misma medimos las alturas de cada individuo, este experimento dará N resultados: x1, x2, x3, ..., xN. Todos estos datos estarán comprendidos en un intervalo de alturas (xmin, xmax) entre la menor y mayor altura medidas. Una manera útil de visualizar las características de este conjunto de datos consiste en dividir el intervalo ( xmin, xmax) en m subintervalos iguales, delimitados por los puntos (y1, y2, y3, ..., ym) que determinan lo que llamaremos el rango de clases. Seguidamente, contamos el número n1 de individuos de la muestra cuyas alturas están en el primer intervalo [y1, y2), el número nj de los individuos de la muestra que están en el j-ésimo intervalo [yj-1, yj), etc., hasta el subintervalo m. Aquí hemos usado la notación usual de usar corchetes, […], para indicar un intervalo cerrado (incluye al extremo) y paréntesis comunes, (…), para denotar un intervalo abierto (excluye el extremo). Con estos valores definimos la función de distribución fj que se define para cada subintervalos j como:

∑=

jj

jj

n

nf (1.6)

Esta función de distribución está normalizada, es decir:

11

=∑ =

m

j jf (1.7)

El gráfico de fj versus xj [xj = 0.5 ( yj-1 + yj)] nos da una clara idea de cómo se distri-buyen las altura de los individuos de la muestra en estudio. Este tipo de gráfico se llama un histograma y la mayoría de las hojas de cálculo de programas comerciales (Excel, Quatro-Pro, Origin, etc.) tienen herramientas para realizar las operaciones descriptas aquí y el gráfico resultante. En la Fig. 1.3 ilustramos dos histogramas típicos.

Page 10: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 10

5 10 15 20 25 300

20

40

60

80

100

FWHM

σσx=1.5

<X>=15

0 5 10 15 20 25 300

20

40

60

80

100

FWHM

σσx=5

<X>=15

100

. fj

xj xj

100

. fj

Figura 1.3. Histograma de dos muestras con igual valor medio pero con distintos grados de dispersión. En este ejemplo, los datos tienen una distribución Gaussiana o Normal, descripta por la curva de trazo continuo.

Tres parámetros importantes de una distribución son:

Ø El valor medio: ∑∑ ==⋅=⋅>==<

N

ii

m

jjj x

Nfxxx

11

1 (1.8)

Ø La varianza: ∑ =⋅−==

m

jjjx fxxxVar

1

22 )()( σ (1.9)

Ø La desviación estándar: )(xVarx =σ (1.10)

El valor medio da una idea de la localización o valor medio de los valores en la mues-tra. En general <x> da el centro de masa (centroide) de la distribución. Tanto Var(x) como

σx dan una idea de la dispersión de los datos alrededor del promedio. Cuando más concen-

trada esté la distribución alrededor de <x> menor será σx y viceversa.

Una distribución de probabilidad muy común en diversos campos es la distribución gaussiana o normal, que tiene la forma de una campana como se ilustra en trazo continuo en la Fig. 1.3. La expresión matemática de esta distribución es:

Page 11: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 11

( )

⋅−

−⋅⋅⋅

==2

2

2exp

2

1),;()(

σσπσ

mxmxNxf (1.11)

La “campana de Gauss” está centrada en m y su ancho está determinado por la desvia-

ción estándar σ. En particular, los puntos de inflexión de la curva están en x−σ y x+σ . El área de esta curva entre estos dos puntos constituye el 68.3% del área total. El área entre

x−2.σ y x+2.σ es del 96% del total. Es útil caracterizar para esta función el ancho a mitad

de su altura, que está relacionado con σ a través de la expresión: FWHM = 2.35σ (FWHM, de “full width half maximum”). Aunque esta distribución ocurre naturalmente en muchos procesos, desde luego no es única y existen muchos tipos de distribuciones de ocu-rrencia común en la naturaleza.

Cuando se desea comparar un histograma no normalizado con una curva normal, es ne-

cesario calcular el número total de datos Nt, el valor medio de los mismos, x y la desviación estándar de los datos, σx. Supondremos que el rango de clases está equiespaciado por una separación ∆x(= x i-x i-1). Para comparar el histograma con la curva normal debemos multipli-car la distribución (1.11) por el factor Nt. ∆x.

& Los parámetros más usuales con los que puede caracterizarse la localización de una distribución asociada a un conjunto de N datos son:

a) la media b) la mediana c) la moda

La media o promedio de la distribución se define, según ya vimos, como:

∑=N

i i Nxx / , y es la media aritmética de los valores observados.

La moda corresponde al valor de la variable donde está la máxima frecuencia, o

sea, que en un histograma la moda corresponde al valor de la variable donde hay un pico o máximo. Si una distribución tiene dos máximos la denominamos distribución bimodal, si tiene tres máximos trimodal y así sucesivamente.

La mediana es el valor de la variable que separa los datos entre aquellos que defi-nen el primer 50% de los valores de los de la segunda mitad. O sea que la mitad de los datos de la población o muestra están a derecha de la mediana y la otra mitad están a la izquierda de la misma.

Page 12: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 12

Mientras que a la media la calculamos usando una fórmula, a la moda la evaluamos directamente del histograma.

Para estimar la mediana tenemos que observar la lista de datos ordenados de me-nor a mayor, y ubicar el valor central de la lista. Si el número de datos es impar, la mediana corresponde precisamente al valor central. Si el número N de datos es par, la mediana se estima como ½ (XN/2 + XN/2+1). En una distribución dada, una línea vertical trazada desde la mediana divide a la distribución en dos partes de área equivalentes.

Es fácil darse cuenta que media, moda y mediana no tienen, en general, porqué co-incidir. Estos tres parámetros sí son iguales en el caso de distribuciones simétricas respecto del valor medio y unimodales. Este es el caso de una distribución gaussiana o normal. En el caso de una distribución asimétrica, las diferencias entre moda, me-dia y mediana pueden ser sustanciales.

Es importante saber cuál parámetro de localización es más apropiado de usar o más representativo en una dada situación. Consideremos, para fijar ideas, la distri-bución del ingreso familiar en un país dado. La presencia de millonarios, aunque sean relativamente pocos, tiene un efecto sobre la media que contrarresta a muchos miembros de la población en el extremo inferior de la escala de salarios. De esta manera, la moda y la media difieren sustancialmente. En este caso tal vez la moda es un parámetro más representativo que la media. A menudo los datos estadísticos pueden ser interpretados de diversas maneras. El siguiente ejemplo ilustra las distin-tas interpretaciones que pueden extraerse de un conjunto de datos estadísticos.

@ La empresa Pochoclos S.A. analiza la necesidad de discutir los salarios. El cua-dro de sueldos es el siguiente:

Gerente $9000

Sub-gerente $5000 2Asesor $2500

2 Secretarias $ 1350 c/u

Capataz $ 1200 6 Operarios $600 c/u

La empresa argumenta que el salario medio es $2000. El delegado gremial sostiene que el sueldo representativo es de $600. Un político consultado asegura que el sala-rio más representativo es $900. ¿Qué parámetros tuvo en cuenta para argumentar cada persona participante de la reunión?. Calcule la moda, la mediana y la media de los ingresos para esta empresa.

Page 13: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 13

1.6 – Error de una magnitud que se mide una única vez

En este caso el mejor valor será simplemente el valor medido y el error vendrá dado por

el error nominal (σnom) del instrumento. Según se deduce de (1.2), ∆Z=σnom.

1.7 – Error de una magnitud que se mide directamente N ve-ces

Un modo de minimizar la incidencia de los errores estadísticos, es realizar varias medicio-nes del mesurando. Dado el carácter al azar de los este tipo de errores es claro que, al pro-mediar los resultados, el promedio estará menos afectado de las desviaciones estadísticas que los valores individuales. El procedimiento que se describe a continuación es un método para determinar el número óptimo de mediciones a realizar en cada caso y el modo de determinar las incertidumbres asociadas al promedio. Esta teoría no es aplicable para reducir los errores de carácter sistemático o espurios.

Supongamos que se han hecho N mediciones de una misma magnitud con resultados

Nj xxxx ,...,...,, 21 . Estas N determinaciones pueden ser consideradas una muestra de

todas las posibles mediciones que se podrían realizar (población). Bajo condiciones muy generales puede demostrarse que el mejor estimador de la magnitud x viene dado por el promedio, >≡< xx , de los valores:

N

x jxx

N

j∑ ==>≡< 1 . (1.12)

Este resultado es llamado también el mejor valor o estimador de x o valor más pro-

bable del mesurando. Llamaremos a ∆ j jx x x= − j =1, 2,..., N

la desviación de cada medición respecto de x . También definimos la desviación estándar o error cuadrático medio de cada medición, Sx . Esta cantidad es equivalente al concepto de

desviación estándar de la población, más específicamente Sx es un estimador de la misma. Sx

da una idea global acerca de la dispersión de los jx alrededor del promedio x . Si la distribu-

ción es ancha Sx será grande y si es afilada su valor será pequeño (ver figura 1.3. Este esti-

mador muestral (Sx) de la desviación estándar poblacional viene dado por:

Page 14: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 14

11

2)(2

∑=

=N

N

jxx j

xS . (1.13)

Sx tiene las mismas dimensiones físicas que x , pudiéndose comparar directamente con

ésta. La calidad del proceso de medición será mayor cuanto menor sea el cociente Sx/x , que en general es una constante del proceso de medición y no disminuye al aumentar N.

Como acabamos de discutir, Sx representa el error “promedio” de cada medición. Otra

manera de explicar el significado de Sx es pensar que, cuando realizamos una serie de medi-

ciones, los resultados obtenidos presentarán una distribución estadística, cuya desviación es-tándar viene dada por Sx.

Si suponemos ahora que realizamos varias series de mediciones de x, y para cada una de

estas series calculamos el valor medio x , es de esperar que estos valores tendrán una distri-bución (puesto que variarán entre sí) pero con una menor dispersión que las mediciones indi-viduales. Se puede probar[1,3] que a medida que el número N de mediciones aumenta, la dis-

tribución de x será normal con una desviación estándar dada por:

N

Sx)N.(N

N

j)xx j(

óestó x =−

∑=

==1

1 . (1.14)

σx se llama el error estándar del promedio y es el estimador del error asociado a x .

Recordemos que Sx es la dispersión de cada medición y que no depende de N sino

de la calidad de las mediciones, mientras que σx sí depende de N y es menor cuanto más

grande es N. Si, por ejemplo, estamos midiendo una longitud con una regla graduada en milí-metros, resulta claro que si aumentamos el número de mediciones podremos disminuir el error estadístico, pero nunca con este instrumento podremos dar con certeza cifras del orden de

los micrones, por más que realicemos muchas mediciones. Al aumentar N, σx ciertamente

disminuye, pero, desde un punto de vista físico, el error en x solo puede disminuir hasta

hacerse igual o del orden de σnom. La Ec. (1.2) indica que no es razonable esforzarse en

disminuir σx mucho más que σnom. El balance óptimo se logra cuando σx ≈ σnom. Esto

nos da un criterio para decidir cual es el número óptimo de mediciones a realizar de un mesu-rando. Como suponemos que Sx es constante con N, la idea es hacer un número pequeño de

mediciones Nprel, digamos unas 5 a 10, luego calcular Sx, de donde se obtiene:

Page 15: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 15

2

≈≈

nom

xop

SN

σ, (1.15)

que resulta de imponer la condición: σest ≈ σnom. Si Nop > Nprel, se completan las medicio-

nes para lograr Nop valores. Si Nop < Nprel, no se realizan más mediciones que las preliminares y se usan todas ellas. En todos los casos, según la Ec. (1.2), el error combinado o efectivo vendrá dado por:

2222xnomefx σσσ +==∆ (1.16)

Para la mayoría de los casos de interés práctico, si medimos 100 veces una magnitud

x, aproximadamente 68 de ellas caerán en el intervalo (x -σx , x+σx), 96 de ellas en el

intervalo (x -2σx , x +2σx), y 99 de ellas en el intervalo (x -3σx , x +3σx). Estos resul-

tados valen estrictamente para el caso en que los errores se distribuyan "normalmente", es decir, si el histograma formado con los resultados de las mediciones adopta la forma de una campana de Gauss [6].

Resumiendo, los pasos a seguir para medir una magnitud física X son:

1. Se realizan unas 5 a 10 mediciones preliminares y se determina el error pro-medio de cada medición Sx .

2. Se determina Nop. 3. Se completan las Nop mediciones de X.

4. Se calcula el promedio X y su incertidumbre estadística σx .

5. Se calcula el valor del error efectivo 22nomxX σσ +=∆ , ecuación (1.2).

6. Se escribe el resultado de la forma ±= XX ∆X.

7. Se calcula el error relativo porcentual εx=100* ∆X /x

8. Si se desea verificar que la distribución de valores es normal, se compara el histograma de distribución de datos con la curva normal correspondiente, es

decir con una distribución normal de media x y desviación estándar Sx.

9. Se analizan posibles fuentes de errores sistemáticos y se corrige el valor medi-do.

10. Se evalúa la incertidumbre absoluta de la medición combinando las incerti-dumbres estadísticas y sistemáticas (Ec. 1.2).

Page 16: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 16

1.8 – Combinación de N mediciones independientes

Una situación frecuente en ciencia es la determinación del mejor valor de una dada mag-nitud usando N valores que resultan de mediciones independientes (obtenidos por diferentes autores, con diferentes técnicas e instrumentos). Cada una de estas mediciones independientes puede tener asociada distintos errores. Es decir, tenemos un conjunto de N mediciones, cada

una caracterizada por un par (xk, σk), con k = 1, 2, ..., N. Nuestro objetivo es obtener el mejor valor para la magnitud en discusión. Es claro que al combinar los distintos resultados para obtener el mejor valor, <x>, es preciso tener en cuenta los errores de cada determina-ción, de tal modo que aquellos valores que tengan menos error “pesen” más en el resultado final. Es posible demostrar en este caso que el mejor valor <x> viene dado por[1,8]:

∑∑

=

=>=<

N

k k

N

k k

kx

x

1 2

1 2

1

σ

σ (1.17)

Con un error dado por ><xσ :

∑ =><=

N

k kx 1 2211

σσ (1.18)

& Un caso especial de interés, es cuando tenemos N determinaciones del mesuran-do todos con el mismo error σ. Como puede deducirse fácilmente de la Ec. (1.17) el promedio será:

N

xx

N

k k∑∑ ==>=>=<< 1 ,

que, como es de esperar, coincide con la expresión (1.12). La incertidumbre aso-ciada a este valor será, según la Ec. (1.18):

Nx

σσ ==>><< ,

que coincide con la expresión (1.14). Además queda ilustrado el significado de

σ como el error asociado a cada medición individual y σ<x> como la incertidumbre asociada al mejor valor.

Page 17: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 17

1.9 – Discrepancia

Si una magnitud física se mide con dos (o más) métodos o por distintos observadores, es posible (y muy probable) que los resultados no coincidan. En este caso decimos que existe una discrepancia en los resultados. Sin embargo, lo importante es saber si la discrepancia es significativa o no. Un criterio que se aplica en el caso especial pero frecuente, en el que las mediciones se puedan suponer que siguen una distribución normal, es el siguiente. Si los resul-tados de las dos observaciones que se comparan son independientes (caso usual) y dieron como resultados:

111 :1 XXXMedición ∆±=

222 :2 XXXMedición ∆±=

definimos:

22221

XXX ∆+∆=∆

Decimos que con un limite de confianza del 68% las mediciones son distintas si:

XXX ∆≥− 21 ,

y que con un limite de confianza del 96% las mediciones son distintas si:

XXX ∆⋅≥− 221

Estos criterios pueden generalizarse para intervalos de confianza mayores en forma

similar. También se aplican cuando se comparan valores obtenidos en el laboratorio con valo-res tabulados o publicados. Nótese la diferencia entre discrepancia y error, que en algunos textos poco cuidadosos se confunde. El error está relacionado con la incertidumbre en la de-terminación del valor de una magnitud. La discrepancia está asociada a la falta de coincidencia o superposición de dos intervalos de dos resultados 1.10 – Propagación de incertidumbres Hay magnitudes que no se miden directamente, sino que se derivan de otras que sí son medidas en forma directa. Por ejemplo, para conocer el área de un rectángulo se miden las longitudes de sus lados, o para determinar el volumen de una esfera se tiene que medir el diámetro. La pregunta que queremos responder aquí es cómo los errores en las magnitudes que se miden directamente se propagarán para obtener el error en la magnitud derivada. Sólo

Page 18: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 18

daremos los resultados, para mayor detalle se recomienda consultar la bibliografía citada. Supongamos, para fijar ideas, que la magnitud V, es una función de los parámetros, x, y, z, etc., o sea:

V V x y z= ( , , ,...) , (1.19)

y que x, y, z, etc., sí se midieron directamente y que conocemos sus errores, a los que desig-namos en el modo usual como ∆x, ∆y, ∆z, etc. Entonces se puede demostrar[1,3] que el error en V vendrá dado por:

⋅⋅⋅+∆⋅

+∆⋅

+∆⋅

=∆ z

dzdV

ydydV

xdxdV

V 22

22

22

(1.20)

En rigor las derivadas involucradas en esta ecuación son derivadas parciales respecto de las variables independientes x, y, z, etc. En el caso especial que la función V(x,y,z,..) sea factori-zable como potencias de x, y, z, etc., la expresión anterior puede ponerse en un modo muy simple. Supongamos que la función en cuestión sea:

V x y z an m

l

x yz

( , , ) ..

= (1.21)

Entonces:

22

22

22

⋅⋅⋅+

⋅+

∆⋅+

⋅=∆

zz

lyy

mxx

nVV

. (1.22)

Para cálculos preliminares, esta expresión puede aproximarse por:

zz

lyy

mxx

nVV ∆

⋅+∆

⋅+∆

⋅≈∆

. (1.23)

Esta última expresión para la propagación de los errores se conoce con el nombre de aproxi-mación de primer orden, mientras que la expresión (1.22) se la denomina usualmente aproxi-mación de segundo orden. Otro caso particular de interés es Z = x ± y. Usando la Ec. (I.10) obtenemos:

Page 19: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 19

( ) ( ) ( )∆ ∆ ∆Z x y2 2 2= + (1.24) && Truncación de números: Se desea determinar la densidad de un cuerpo y para

ello se procedió a medir su volumen, que dio como resultado V = 3.5 ± 0.2 cm3 (εV% = 6%) y su masa m = 22.7±0.1 g. (εm%=0.4%). Para calcular la densi-dad, ρ, debemos realizar el cociente de ρ = m / V. Si realizamos este cociente con la calculadora obtenemos:

ρ= 22.7/3.5=6.485714286 g/cm3. Claramente, la mayoría de estas cifras no son significativas y debemos truncar el

resultado. Para saber dónde hacerlo, debemos propagar los errores del numera-dor y denominador, y ver a qué cifra afecta el error de ρ. Usando (1.22) obte-nemos para ∆ρ/ρ ≈ 0.06 y por tanto ∆ρ ≈ 0.4 g/cm3, con lo que en el valor de ρ sólo una cifra decimal es significativa. Sin embargo, al truncar el número 6.4857, debemos tener en cuenta que el número más cercano a él y con una sola cifra decimal es 6.5 y no 6.4 que resultaría de una truncación automática. Final-mente, el valor que obtenemos para ρ es:

ρ = 6.5 ± 0.4 g/cm3 y ερ%=6%.

Es importante tener en cuenta este criterio de truncación toda vez que realizamos

una operación usando una calculadora o computadora. ☺ Midiendo ππ : Sabemos que el perímetro (p) de un círculo está relacionado con

su diámetro (d) por la expresión p= π.d, por lo tanto midiendo el diámetro y pe-rímetro, es posible “medir π”. Diseñe un experimento que le permita realizar esta medición. Obtenga π con este método. Dé su incertidumbre. Compare los valo-valores tabulados de esta constante. Consulte en la bibliografía otros métodos de obtener π experimentalmente. En particular discuta si con el experimento de Buffon se puede obtener mayor precisión (consulte la páginalas páginas de Inter-net: http://www.angelfire.com/wa/hurben/code5.html y http://www.geocities.com/CapeCanaveral/Lab/1719/).

1.11 – Elección de los instrumentos

Un aspecto importante a tener en cuenta antes de proceder a realizar una medición, es la elección de los instrumentos más apropiados para medir con la tolerancia o error requerido. Ignorar este paso puede acarrear importantes pérdidas de tiempo y dinero. Si se excede la tolerancia requerida, seguramente se dilapidó esfuerzo y recursos innecesariamente; por el

Page 20: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 20

contrario, si se realizó la medición con más error del requerido, la medición podría ser inútil para los fines perseguidos.

& Supongamos que nuestro problema es determinar el volumen de un alam-bre (cuyo diámetro es d ≈ 3 mm) y su longitud (L ≈ 50 cm) con un error del 1% ¿Qué instrumentos debemos usar para lograr nuestro objetivo con el menor costo? Lo que debemos lograr es ∆V/V≈ 0.01. Como V=π.d2.L/4, tenemos que:

002.0 006.0001.001.0

2

++≈

∆+∆⋅+∆≈∆LL

dd

VV

ππ

La primera expresión es una aplicación de (1.23), esta aproximación de primer or-den es útil y suficiente para este análisis preliminar. La asignación de la segunda lí-nea es en cierto modo arbitraria, pero hemos respetado que el error total no supere el 1% requerido. A π , que es un número irracional, le asignamos un error relativo pequeño, para que nos permita saber cuantas cifras debemos usar en π de modo que el error de la truncación de π no afecte nuestra medición. No medimos π!. Nótese que el error en el diámetro tiene mayor incidencia (su error relativo está multiplicado por 2) que la longitud L, y se debe a que el volumen es proporcional a d2 y proporcional a L. Un pequeño error en d tiene mayor incidencia en el error del volumen que lo que tiene el mismo error relativo en L. Por esta razón hemos asig-nado mayor tolerancia (error relativo) a d que a L. Con esta asignación preliminar podemos decidir cuáles instrumentos son más adecuados para realizar el experi-mento (los más adecuados son los que hacen la medición más fácil, en menor tiem-po, con el menor costo y que cumplan los requisitos exigidos). Como

mm01.0mm009.0mm3003.0003.0 003.0 ≈≈⋅=⋅≈∆⇒≈∆

dddd

,

debemos usar un tornillo micrométrico para medir d. Similarmente, para L tenemos:

mm1cm50002.0002.0 002.0 ≈⋅=⋅≈∆⇒≈∆

LLL

L,

por lo tanto podemos usar una regla común graduada en milímetros para medir L. Para π tenemos:

003.03001.0001.0 001.0 ≈⋅=⋅≈∆⇒≈∆ ππππ

,

Page 21: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 21

que indica que debemos usar π con 3 cifras decimales para que el error en su trun-camiento tenga una incidencia despreciable. Nótese que hasta ahora todo es preli-minar y solo hemos elegido los instrumentos a medir. Luego de la elección llevamos adelante la medición usando estos instrumentos y procedemos para la medición de d y L. Nótese también que para elegir los instrumentos a usar debemos conocer el valor aproximado de los valores a medir, lo que parecería una paradoja. No obs-tante, para este análisis preliminar sólo es necesario tener una idea de los órdenes de magnitud y no un valor muy exacto. Este orden de magnitud se puede obtener por una inspección visual o una medición rápida. Finalmente, una vez que realice-mos las mediciones de d y L debemos usar la expresión (1.22) para calcular los errores ∆V y εεV.

Bibliografía 1. Data reduction and error analisys for the physical sciences, 2nd ed., P. Bevington and

D. K. Robinson, McGraw Hill, New York (1993). 2. Numerical recipies in Fortran, 2nd. ed., W.,H. Press, S.A. Teukolsky, W.T. Veetterling

and B.P. Flanner, Cambridge University Press, N.Y. (1992). ISBN 0-521-43064x. 3. Data analysis for scientists and engineers, Stuardt L. Meyer, John Willey & Sons, Inc.,

N.Y. (1975). ISBN 0-471-59995-6. 4. Trabajos prácticos de física, J. Fernández y E. Galloni, Centro de Estudiantes de Ing.

UBA , Buenos Aires (1963). 5. Curso superior de física práctica, B. L. Worsnop y H. T. Flint, Eudeba, Buenos Aires

(1964). 6. Mecánica elemental, J. G. Roederer, 8ª. ed., Buenos Aires, Eudeba (1963). ISBN: 950-

23-0290-7. 7. Guide to the expression of uncertainty in measurement, 1st ed., International Organi-

zation of Standarization (ISO), Suiza (1993). En Internet: http://physics.nist.gov/cuu/Uncertainty/index.html.

8. Statistics: Vocabulary and symbols, International Organization of Standarization (ISO),

Suiza. En Internet: http://www.iso.ch/infoe/sitemap.htm. 9. Radiation detection and measurement, Knoll Glenn F., 2ª. ed., John Willey & Sons,

New York (1989). ISBN 0-471-81504-7.

Page 22: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 22

10. Estadística, Spiegel y Murray, 2da ed., McGraw Hill, Schaum, Madrid (1995). ISBN 84-7615-562-X.

11. Uncertainty in the linear regression slope, J. Higbie, Am. J. Phys. 59, 184 (1991);

Least squares when both variables have uncertainties, J. Orear, ibid., 50, 912 (1982).

12. Probability, statistics and Montecarlo, Review of Particle Properties, Phys. Rev. D 45,

III.32, Part II, June (1992). 13. Teoría de probabilidades y aplicaciones, H. Cramér, Aguilar, Madrid (1968); Mat-

hematical method of statistics, H. Cramér, Princeton Univ. Press, New Jersey (1958).

Page 23: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 1

2.1 – Importancia de la representación gráfica de datos experimentales

La presentación y análisis de los resultados experimentales debe considerarse como

parte integral de los experimentos. Es realmente útil que los datos obtenidos se presenten en un gráfico, donde quede resumida la información para su apreciación y análisis. En la mayoría de los casos un gráfico es más útil que una tabla de valores, especialmente en los casos en que: Ø Los experimentos se llevan a cabo midiendo una variable Y en función de otra

X que se varía independientemente y se quiere interpretar la relación funcional entre ellas. Por ejemplo: medición del período de un péndulo en función de su longitud; medición de la caída de potencial en un alambre en función de la corriente aplicada; etc.

Ø Interesa estudiar si dos variables mantienen una correlación (causal o no) y cómo es esta vinculación o grado de interdependencia. Por ejemplo: estudio de la relación entre el peso y la altura de personas; relación entre la velocidad máxima que alcanza un velero y su extensión desde proa a popa; etc. Se trata, en primera instancia, de que la información que se quiere representar quede

expuesta de una manera lo suficientemente clara y explícita como para que la representación gráfica “hable por sí sola”. Lo importante es que un gráfico debe servir para un posterior tratamiento de los datos, que lleve a inferir las leyes subyacentes en ellos y ahondar así en las posibles implicaciones y generalizaciones de los resultados obtenidos en los experimentos.

Como elemento ordenador de la información colectada en un experimento, un gráfico debe construirse sobre la base de una elección adecuada tanto de las variables como de las escalas. Dado que los experimentos propuestos en este libro están pensados para estudiar la fenomenología de numerosos problemas de la física, en este capítulo presentaremos las bases que nos ayuden a efectuar una adecuada representación gráfica de los datos experimentales. Comentaremos diversas opciones que se presentan y sobre algunos métodos numéricos de utilidad para el tratamiento general de los datos.

& Ejemplos

@ Ejercicios

☺ Misceláneas

$ Evaluación

Métodos cualitativos de análisis gráfico

Page 24: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 2

2.2 – Elección de las variables

De una manera muy general, cuando estudiamos un sistema cualquiera, tratamos de obtener las variaciones o respuestas del sistema ante ciertas perturbaciones que podemos aplicarle de manera controlada. La Fig. 2.1 representa esquemáticamente un sistema bajo estudio.

Figura 2.1 Representación esquemática de un sistema al que se estudia las respuestas Yi cuando se varía el conjunto de variables Xi.

Hemos llamado Xi a las “variables de entrada” o “variables independientes” que podemos controlar y variar. Ante los cambios de Xi, el sistema revela sus características o comportamientos a través de los cambios que sufren las variables Yi, que pueden llamarse las “variables de salida” o “variables dependientes”. Por simplicidad, toda vez que queramos estudiar un sistema, será más útil que nos concentremos en la respuesta de una de las variables de salida ante las variaciones de sólo una de las variables de entrada, lo que es una situación muy común en un experimento. Las ideas aquí expuestas pueden fácilmente generalizarse a sistemas de mayor complejidad. En lo que sigue nos apoyaremos en algunas relaciones funcionales simples con las que nos encontramos a menudo en el trabajo en el laboratorio y las usaremos para ejemplificar las ideas básicas. 2.2.1 −− Relación lineal

Una relación entre las variables X e Y del tipo:

bXaY +⋅= (2.1)

es tal vez la más simple de todas. La representación gráfica de (2.1) deY(X) arrojaría una línea recta, de pendiente a y que corta al eje vertical en b (ordenada al origen). Esta dependencia de Y con X se llama una relación lineal ente X e Y. La recta es la forma geométrica más simple en dos dimensiones. Al mismo tiempo, una relación lineal entre dos variables cualesquiera es más fácil de ser identificada a simple vista. No sería una exageración afirmar que éste es el único caso en que esta discriminación puede hacerse a simple vista. Entre una recta y una curva nuestro ojo siempre notará la diferencia, pero no discriminará a la función que define la curva. Probemos esto con la ayuda de la figura 2.1.

Xi Yi

Page 25: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 3

En la figura 2.1 están representadas dos series de datos. Intentemos inferir

cualitativamente cuál de las series puede aproximarse por una relación lineal entre las variables X e Y. Para esto usemos una regla práctica: llevemos el papel hasta el nivel de nuestros ojos (podemos cerrar uno como cuando hacemos puntería) y veamos si los puntos se ven alineados. Este tipo de toma de decisión no debe desdeñarse en el momento de analizar datos experimentales. La decisión de aceptar o no una relación lineal entre las variables debe ser tomada por el experimentador, ya sea se espere o no una vinculación lineal entre las variables en juego. Una vez que decidimos que los datos “caen sobre una recta”, recién podremos estimar los parámetros (pendiente y ordenada al origen) de la mejor recta que aproxime la relación funcional: O bien podemos dibujar criteriosamente esa mejor recta y definirle los valores de la pendiente y la ordenada al origen, o usar métodos numéricos más generales para encontrarlos, como veremos más adelante.

Figura 2.1: Representación de dos series de datos. ¿Cuál aproxima mejor una relación entre las variables, XY ∝ ?

2.2.2 −− Función potencial Supongamos que medimos pares de valores (X,Y) y tenemos conocimiento que la relación funcional que los vincula es del tipo

caXY = (2.2) donde a y c son constantes. Esta forma funcional potencial es muy común en las ciencias puesto que sirve como aproximación del comportamiento en una gran variedad de casos. En biología, por ejemplo, la Ec. (2.1) tiene el nombre particular de “ecuación alométrica”.

0 2 4 6 8 100

10

20

30

40

50

Y

X

Page 26: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 4

La constante c suele llamarse “exponente de escala” y define la escala de variación de Y según varía X. Esto es, si X se multiplica por un factor f , Y cambiará

consecuentemente cf veces. El significado físico de la constante a es el de representar el valor que toma Y

cuando X vale la unidad. La dimensión de a es tal que da homogeneidad dimensional a la ecuación.

& Entendiendo a las ecuaciones - Parece ser que el peso de los dinosaurios P estaba bien correlacionado con la longitud l de los animales medida desde la cabeza a la cola, según

30 lPP =

Leamos esta fórmula: El significado de P0 es que representa el peso de un dinosaurio de “largo unidad”. Por tanto, si la unidad elegida para la longitud es el metro y para el peso es el Newton, P0 representa cuántos Newton pesaba un animal de largo igual a 1 m. La unidad de P0 será tal que se igualen las unidades de los dos miembros de la ecuación. En este caso, P0 tendrá la unidad N / m3. Sin embargo, es claro que P0 no es la densidad de los animales, a pesar de su unidad, puesto que l3 no es el volumen. Notemos que el valor de P0 cambiará si se eligen otras unidades de medición. Por ejemplo, si el peso se midiera en dinas y la longitud en cm, P0 adoptaría un nuevo valor, que sería P0* (dina / cm3) =10-1P0(N / m3), a lo que se arriba tras pasar de Newton a dina y de metros a centímetros. De manera más general, y sin recurrir a unidades particulares, podemos analizar cuál es la dimensión de P0. Si usamos corchetes [...] para representar la dimensión de una cantidad,

entonces [ ] [ ][ ]30l

PP = . Escribamos esta relación dimensional en términos de las

dimensiones fundamentales masa, longitud y tiempo, a las que llamaremos M, L y T,

respectivamente. Dado que [ ] [ ] [ ][ ]2T

LMgmmgP === , resulta, luego de simplificar:

[ ] 220

−−= TMLP .

Este tipo de análisis puede usarse como prueba de consistencia de una fórmula complicada; o bien, para determinar la dimensión de alguna variable introducida en un problema particular.

@@ La cantidad de potencia .

Q irradiada por unidad de área por un cuerpo negro que está a la

temperatura absoluta T está dada por la ley de Stefan-Boltzman

4.

TQ σ=

donde σ = 5.67 x 10-8 W/ m2 K4 es la constante de Stefan-Boltzman. a) Analice cuál es el significado físico de σ. b) Si el cuerpo negro estuviera a la temperatura de 2 K, ¿cuánto más irradiaría respecto a cuando se mantiene a 1 K? c) ¿A qué temperatura irradiará 25 veces más que a 2 K?

Page 27: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 5

Si representáramos los datos medidos Y en función de X relacionados por una expresión como (2.2), lo que obtendríamos, en el caso en que 1≠c , sería una curva. De nuestro análisis cualitativo del gráfico observaremos una curva “cóncava hacia arriba” si c > 1, mientras que si c < 1, la curva se verá “cóncava hacia abajo”. Lo que cualquiera de los casos precedentes significa es que una variación de la variable X a un dado ritmo, hace que la variable Y cambie a un ritmo distinto: más rápido si c > 1, más lento si c < 1. Esta observación cualitativa (en términos de “más rápido” o “más lento”) bien puede ser buena en una gran variedad de casos de interés en el laboratorio cuando estemos interesados en descripciones generales de algún fenómeno. 2.3 – Transformación de variables

Si en la Ec. (2.2) transformamos las variables haciendo el cambio

X* = Xc Y* = Y −toda vez que conozcamos el exponente c − y representamos las nuevas variables (X*, Y*) = (Xc, Y), lo que obtenemos es una relación lineal entre las variables transformadas y decimos que hemos linealizado la representación gráfica. En este caso hemos transformamos la variable X, pero bien podríamos haber optado por el cambio en la variable dependiente Y, o sea,

X* = X Y* = Y1/c y también habríamos obtenido una relación lineal entre las nuevas variables representadas (X*, Y*) = (X, Y1/c). Está claro que lo anterior es inmediato de realizar si conocemos el valor del exponente c . Además, observamos que un gráfico linealizado nos da el valor de la constante a [ver Ec. (2.2)] si evaluamos la pendiente de la recta que resulta.

&& Se mide el período T de un péndulo simple para distintas longitudes L. En el caso de pequeñas amplitudes de oscilación, ambas variables están relacionadas por

gL

T π2=

donde g es la aceleración de la gravedad. La relación es del tipo

caLT =

Page 28: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 6

con g

aπ2

= y 21

=c .

Si aceptamos que el exponente 21

=c , de un gráfico T versus cL evaluamos la

constante a , de donde podremos obtener el valor de la aceleración gravitatoria g. Es de esperar que resulte una recta que pase por el origen de coordenadas, dado que un péndulo de longitud nula tiene que tener un período de oscilación nulo.

En el caso más general, supongamos que no conocemos a a ni a c , y que ambas constantes deben encontrarse como resultado de la investigación llevada a cabo con el experimentos. Entonces, ¿cómo graficar?

Para facilitar la tarea de encontrar tanto el exponente de escala c como la constante a , es conveniente representar )log( Y versus )log( X . Esto queda claro si transformamos

nuestra ecuación original más general caXY = , sacándole el logaritmo a ambos miembros

)log()log( caXY = (2.3)

)log()log()log( cXaY += (2.4)

)log()log()log( XcaY ⋅+= (2.5)

Comparando esta última expresión con un gráfico de )log( Y en función de )log( X podremos ver que la ecuación representa una recta que tiene pendiente c y ordenada al origen igual a )log( a .

Este tipo de representación gráfica es extremadamente útil cuando se analizan ecuaciones algebraicas, se estudian correlaciones, leyes de crecimiento, etc. En la práctica no es necesario tomar los logaritmos de los datos, sino representarlos en escalas logarítmicas, para lo cual ya existen papeles especialmente diseñados para realizar estos gráficos como veremos en la siguiente sección. Así mismo casi todos los buenos paquetes de graficación usando computadora, brindan la posibilidad de representar los datos en escalas lineales (las normales ) o logarítmicas.

Page 29: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 7

2.4 – Elección de las escalas

Hemos visto cómo elegir las variables con el fin de lograr la mejor representación llevando el caso al de una relación lineal. Lo que hemos propuesto es la transformación de las variables y la representación de las nuevas. Una manera alternativa de análisis es recurrir a gráficos en los que sus ejes tengan escalas logarítmicas. Retomando el ejemplo del caso de variables X, Y relacionadas por la función potencial

caXY = ,

Figura 2.2: Ejemplo de un gráfico con escalas logarítmicas. en vez de recurrir a un gráfico )log( Y en función de )log( X , podemos representar directamente los pares de valores (X, Y) en un gráfico donde sus dos ejes contengan escalas logarítmicas [ver figura 2.2].

Un gráfico doble-logarítmico como el de la figura 2.2 también es llamado “gráfico

log−log”. La posición de las grillas más gruesas identifica un valor igual a una potencia de 10. Por lo tanto, en cada eje, el espacio entre esas grillas representa una década de variación de las variables, es decir, entre 10n y 10n+1, cualquiera sea n . Las ocho grillas intermedias indexan los valores nk 10× , =k 2, 3, 4, ..., 9.

Esto hace muy simple la construcción de ejes en escalas logarítmicas. Esto requiere

marcar intervalos fijos a distancias 1, 10, 100, 1000, ... (100, 101, 102, 103, ...). Si los

C

B

A

10 n+210n-2

10 m-2

10 m-1

10 m + 2

10 m + 1

10 m

10n+110 n-1 10n

Y

X

Page 30: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 8

datos a representar no cubren un rango tan amplio de valores, los intervalos pueden realizarse a distancias de 1, 2, 4, 8, 16, 32, ... (20, 21, 22, 23, 24, 25, ...).

Observando la figura 2.2 podemos advertir que las escalas logarítmicas son “más democráticas” que las lineales, puesto que dejan ocupar el mismo espacio en el gráfico a los intervalos entre décadas entre valores “pequeños” que el espacio ocupado por los intervalos entre décadas entre valores “grandes”; podemos ver, por ejemplo, que el lugar reservado para los valores entre 10-5 y 10-4 es idéntico al reservado para el intervalo 108 y 109.

Si las variables X e Y se representan ambas en escalas logarítmicas, la función potencial de la Ec. (2.2) quedará representada por una recta cuya pendiente es c y cuya ordenada al origen es )log( aord = , por lo que orda 10= .

A su vez, si los datos (X, Y) representados en este tipo de gráfico (log-log)siguen

una relación lineal, podemos inferir que cXY ∝ , descubriendo en este caso la ley subyacente. Para calcular directamente del gráfico el valor de c , hay que contar cuántas décadas varíaY cuando X varía una. En el ejemplo de la figura 2.2, la línea A tiene

pendiente 1=c , por tanto XY ∝ . Para la línea B, 21

=c , por lo tanto, XY ∝ .

¿Cuál es la pendiente de la recta C?

Esta representación usualmente se hacía usando un papel especial (papel logarítmico), que, dicho sea de paso, aun se consigue en las librerías o en laboratorio de investigación de cierta antigüedad que conservan algunas muestras. Con las ventajas que ofrecen hoy en día los programas de computadora (Origin, Excel, etc.), este tipo de representación puede realizarse de manera inmediata para sacar mayor provecho al análisis de los datos experimentales.

Page 31: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 9

@@ Descubriendo una ley de crecimiento - ¿A qué velocidad crecen los árboles de esta especie hipotética? ¿Qué altura tendrá un árbol al cabo de un año? Desafío: no usar calculadora ni computadora.

Sugerencia: Con una regla mida la altura de cada uno de estos árboles y grafique la altura de los mismos como función de su edad. Elija las escalas más apropiadas para descubrir la “ley de crecimiento” de esta especie.

2.5 – Aplicaciones de gráficos log−−log

Hay una gran variedad de casos donde es sumamente útil la representación gráfica usando escalas logarítmicas. En cierta manera, es a lo que recurre un experimentador de inmediato cuando quiere darse cuenta de “la forma de la ley que siguen sus datos”. Efectivamente, es una manera rápida y eficiente de evaluar las tendencias de los resultados y dar un primer paso en el análisis. También es útil recurrir a estas escalas en los casos en los que el rango de valores es muy amplio y los datos que manejamos varían en varias órdenes de magnitud. Amplio margen de valores

Como ejemplo podemos citar el problema de investigar si existe correlación entre el calor metabólico producido por mamíferos, analizando datos provenientes de experimentos que involucren desde ratones, con pesos de unas decenas de gramos (≈10 g), hasta elefantes que pesan varias toneladas (≈106 g), incluyendo especies de tamaños intermedios, como gatos (≈103 g), monos (≈104 g), etc. Es claro que si en un gráfico “Calor − Peso” usamos una escala lineal para el peso, la necesidad de incluir semejante margen de valores −entre 0 g y 106 g− tendrá como ingrata consecuencia el “amontonamiento”, cerca del origen de coordenadas, de los datos de las especies más

Page 32: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 10

pequeñas. La elección de una escala logarítmica en el eje del peso eliminaría inmediatamente tal inconveniente. Relación entre magnitudes

En una situación usual en el laboratorio, podríamos estar interesados en saber si una muestra conductora puede describirse como un conductor óhmico. Si hacemos circular una corriente eléctrica I por la muestra y medimos la diferencia de potencial V que se produce, y repetimos este procedimiento para varios valores de la intensidad de la corriente, tendremos los datos V − I para llevar a un gráfico. En primera instancia, un gráfico con escalas lineales sirve para abrir el juego. Aquí caben varias posibilidades. Una de ellas es usar nuestro ojo, como ya comentamos, y decidir si la relación entre V e I puede considerarse lineal, lo que nos diría que el material conductor es óhmico. Pero supongamos que queremos ir más allá. Si verdaderamente el conductor es óhmico, un gráfico log−log en las variables V e I debería resultar lineal y, lo que es más importante, la pendiente de la recta debería ser igual a uno (el exponente de I es uno).

Detección de posibles errores sistemáticos

Toda vez que se mide una magnitud con un error sistemático, los valores medidos difieren de los “reales” en una cantidad fija. La pericia del experimentador es clave para evaluar las correcciones necesarias de estos datos afectados sistemáticamente por un error de medición. Un ejemplo común es el error de cero de los instrumentos de aguja. El ejemplo más familiar es el de una balanza de farmacia que, dado su desgaste, indica 1 kg. aun cuando nadie está de pie en la plataforma (a veces, este error de medición aporta consuelo cuando nos pesamos en una buena balanza). En el laboratorio, el error de cero suele aparecer en instrumentos de mediciones eléctricas o cronómetros de aguja. Si con uno de estos instrumentos defectuosos medimos la variable Y en función de otra X, un gráfico Y(X) resultará desplazado en la vertical una cantidad δY igual al error sistemático de cada punto Y. Si la relación entre estas variables fuese lineal del tipo

XaY ⋅= , la presencia de tal desplazamiento sistemático llevará a que aparezca una ordenada al origen espuria. Es decir, cuando X=0, tenemos Y=δY, en vez de Y=0. En un gráfico log−log de Y(X) la desviación de la curva resultante de la recta esperada sin ordenada al origen se descubre con facilidad y ayuda a la corrección de los datos. En ese sentido es interesante notar que si tenemos una relación entre las variables X e Y de la forma bXaY c +⋅= , si representamos X en función de Y en escala log-log esta vez no obtenemos una recta. Búsqueda de posibles correlaciones entre variables

Puede obtenerse mucha información cualitativa de un experimento si se conocen las proporcionalidades entre las variables involucradas. En este sentido podemos aprovechar un gráfico log−log para pronosticar tendencias. Podría ser deseable “anticiparnos” al resultado de un experimento –más aun si es caro o de largo aliento–, estableciendo las leyes de escala entre las variables, para así saber cómo varía la variable de salida Y frente a un cambio de la variable de entrada X. Esto redundaría en mejoras sobre la marcha de nuestros diseños y estrategias experimentales.

Page 33: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 11

2.6 – Comparación de los distintos tipos de escalas

La figura 2.3 completa la descripción comparativa de los distintos tipos de escalas y sugiere diferentes notaciones para indexar los ejes. Debe quedar claro la diferencia que existe entre representar los valores de una variable en escala logarítmica, y representar el logaritmo del valor en escala lineal. También notamos que ni el valor cero ni los valores negativos pueden representarse en escala logarítmica. Esto no representa una dificultad a la hora del análisis de datos usando esta escala, ya que, por cierto, los resultados de mediciones de laboratorio (longitudes, tiempos, masas, módulo de velocidades y aceleraciones) caen siempre en el intervalo de los números reales positivos. En caso que la variable sea intrínsecamente negativa, por ejemplo una temperatura bajo cero en la escala Celsius, el valor de una deuda, etc. Siempre es posible definir una nueva variable igual a la variable original pero cambiada de signo y continuar el análisis como antes.

Figura 3: una comparación entre las distintas escalas que podemos usar. Nótese la diferencia entre representar el logaritmo de los valores en una escala lineal y representarlos directamente en escala logarítmica. ¿Dónde está el cero en una escala logarítmica?

Page 34: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 12

@@ Cuando conviene usar escalas logarítmicas - Se mide la propiedad Σ de 100 ml de un líquido puro. Luego se lo diluye en agua al 10% y se repite la medición. La solución se diluye otra vez al 10% y se mide de nuevo. La operación se repite cuatro veces más. Para cada muestra se obtiene Σ = 1 (líquido puro), 1.02, 1.04, 1.08, 1.24, 1.59, 1.95 (en unidades arbitrarias). Representar en un gráfico apropiado el resultado del experimento.

$$ Gráfico de Arrhenius - Se mide la variable Y en función de la temperatura T. Proponer variables y escalas adecuadas que ayuden a discernir por medio de un gráfico si Y(T) sigue la relación de Arrhenius

Tk

U

BefY0

0

⋅=

Describir un procedimiento para obtener los parámetros 0f y 0U . ¿Cuál es la dimensión

de 0f y 0U ? KJkB /1038.1 23−×= es la constante de Boltzman.

$$ La magnetización M de un material varía con el tiempo t según

)/ln( 00 ttMM =

Proponga un tipo de gráfico que linealice la relación M(t). ¿Cómo se procede para obtener

M0? ¿Cuál es el significado físico de M0? 0t es una constante.

☺☺ La imposibilidad de alcanzar físicamente el cero absoluto de temperatura ha cautivado la atención de los hombres de ciencia. Una manera de hacer una analogía de esta imposibilidad la ofrecen los físicos que estudian propiedades de la materia a bajas temperaturas, combinando temperatura con dinero. a) Imaginemos un cuerpo que está inicialmente a la temperatura de 100K y que cuesta $1

reducirle la temperatura 10K. Cuando está a 90K nos cuesta $1 llevarlo a 80K, y otro peso para llevarlo a 70K, y así sucesivamente. Con este procedimiento, ¿cuánto cuesta enfriarlo hasta el cero absoluto?

b) Ahora consideremos el mismo cuerpo a la temperatura inicial de 100K. Pero el procedimiento de enfriamiento consiste en pagar $1 para llevarlo a 10K. Cuando está a 10K nos cuesta $1 para llevarlo a 1K, y otro peso para que alcance 0.1K, y así sucesivamente. Con este procedimiento, ¿cuál es el costo de enfriarlo hasta el cero absoluto?

Page 35: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 13

2.7 – Diseño de gráficos Los programas de representación gráfica disponibles en las computadoras incluyen

entre sus opciones el diseño de gráficos usando los distintos tipos de escalas mencionadas en este capítulo. Pero, ya sea que el gráfico vaya a realizarse usando estos programas o a mano, es conveniente considerar algunos “trucos del buen dibujante” para que la información contenida en el dibujo adquiera la relevancia que le corresponde. Es así que, además de la correcta elección de las variables y de las escalas, un gráfico adquirirá una mejor presentación si se cuidan algunos detalles: Ø Identificación de los ejes con rótulos bien ubicados que digan qué variables se

representan y en qué unidades se miden.

Ø Uso de símbolos que ubiquen los datos (cuadrados, círculos, rombos, etc.), en lo posible con sus incertidumbres (barras); que haya una diferenciación de distintas series de datos cuando se presenten varios resultados, para lo que es recomendable el uso de diferentes símbolos.

Ø Inclusión de un epígrafe, que es un texto descriptivo de lo que está representado en el gráfico y que además puede manifestar información adicional importante.

Ø Carteles interiores al gráfico, con información complementaria relevante para

entender en qué contexto se muestran los datos o sobre las condiciones experimentales particulares bajo las que se los han obtenido.

Ø Una clara diferenciación entre lo que es propio del resultado experimental del

trabajo y lo que corresponde a una comparación con una teoría o modelo propuesto (por ejemplo, usar líneas continuas) o a resultados extraídos de otras fuentes.

Figura 4: Ejemplo de gráfico. Campo magnético axial de un imán de Ne-Fe-B a temperatura ambiente medido con una sonda de efecto Hall. La línea es un ajuste de los datos usando una teoría pertinente.

0 2 4 6 8 1 0 1 2 1 4 1 60

100

200

300

400

500

600

700

T = 3 0 0 K

B (

Ga

uss

)

z (mm)

Page 36: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 14

2.8 – Actividades propuestas

IIActividad 1 Isometría y alometría

La ecuación caXY = se conoce en biología como ecuación alométrica. En el caso

especial de c = 1 se dice que X e Y crecen isométricamente (iso = igual, métrico = medida). Si c ≠ 1, X e Y crecen alométricamente (allo = distinto).

Ø Considere experimentalmente el problema de determinar cómo crece el largo del brazo de las personas a medida que crece la talla. Para ello solicite a varios amigos, parientes y profesores que se presten para el experimento y mídales la altura y el largo del brazo. Lleve sus resultados a un gráfico y de sus mediciones concluya sobre el tipo de crecimiento. Si cree que sus conclusiones están condicionadas por el margen de valores obtenidos de la muestra (por ejemplo, si consideró sólo personas adultas), extienda sus mediciones a niños/as (hermanitos/as, primitos/as).

Ø Los pediatras y médicos clínicos tienen gráficos y tablas del crecimiento normal de las personas como función de la edad. Consiga uno de estos gráficos y trate de determinar la ley de crecimiento de las personas en función del tiempo.

IIActividad 2 “Un problema ecológico”

Un oleoducto se rompe en el mar, y el derrame de petróleo se extiende mientras la rotura no se arregla. Desde un avión se toman fotografías cada día. En la figura 5 se muestra una secuencia de fotografías diaria superpuestas. A Ud. lo contratan para que defina cómo varía “el radio” de la mancha en función de los días que transcurren (un díaà un tono). Ø Defina con un criterio razonable la extensión de la mancha. Un parámetro que

caracteriza la extensión podría ser el diámetro de la mancha. Ø Mida la extensión de la mancha y evalúe el error de la determinación. ¿Cuál es

la fuente de error más importante en la determinación del diámetro, la apreciación de los instrumentos, la interacción o la definición del diámetro ?

Ø Represente en escalas adecuadas el radio de la mancha como función de los días.

Ø Obtenga a partir de sus datos una “ley de crecimiento” de la mancha.

Page 37: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 15

Figura 5: Fotografías de la mancha de petróleo en agua, cada tono indica un día diferente. Extraído de “A proposal for experimental homework”, E. Rodríguez, Phys. Teach. 36, 435 (1998). Los datos de este ejercicio son ficticios.

IIActividad 3 Un experimento en la mesada de la cocina

Usando un cuentagotas o una pipeta derrame, una a una, gotas de aceite de cocina

sobre la superficie del agua contenida en un plato hondo. El aceite es menos denso que el agua, por lo tanto flotará en la superficie y formará una mancha. El propósito del experimento es encontrar la ley de crecimiento de la mancha de aceite que se va formando. Para ello deberá medirse el radio de la mancha a medida que se sueltan las gotas, para lo que bastará el empleo de una reglita graduada en milímetros. Para hacer más visible la mancha de aceite, puede espolvoreas el agua, antes de tirar las gotas, con polvo de tiza , talco o canela.

Ø ¿Convendrá representar los datos en escalas lineales o logarítmicas?. Analice la

estrategia del experimento. ¿Conviene registrar radios gota por gota? ¿Será más práctico medir radios luego de derramar 1, 2, 5, 10, 20, 50, 100,... gotas?

Page 38: Apuntes teoria de errores

Física re-Creativa – S. Gil y E. Rodríguez 16

Ø Realice el experimento y trate de definir una función R(N): Radio como función del número de gotas vertidas. ¿Es posible aproximar R(N) ≈ a N c? Determine a partir de los gráficos los parámetros a y c. ¿Cambian estos parámetros si se usa un aceite más (menos) denso?

Ø ¿Encuentra diferencias entre el resultado del experimento real y el que obtuvo en

el “problema ecológico” (figura 5) usando las imágenes simuladas con un programa de computadora? .¿A qué podría atribuirlas?.

Precaución: Trate de no golpear la mesa donde trabaja para evitar que el aceite se desplace hacia a las paredes del plato. Bibliografía 1. D. C. Baird, Experimentación (Prentice Hall). ISBN 0-13-295338-2.

2. T. McMahon, "Size and shape in Biology," Science 179, 1201 (1973).

3. Dana Mackenzie, "New clues to why size equals destiny," Science 284, 1607

(1999).

4. Eduardo E. Rodríguez, "A proposal for experimental homework," Phys. Teach. 36,

435 (1998).

5. Christopher Deacon, "The importance of graphs in undergraduate physics," Phys.

Teach. 37, 270 (1999).

6. Ernesto Martínez, Logarithmic Park (Instituto Balseiro, Bariloche, 1997).

Page 39: Apuntes teoria de errores

Física re-Creativa, S. Gil y E. Rodríguez 1

3.1 – Método de cuadrados mínimos – Regresión lineal En el capítulo anterior hemos enfatizado sobre la importancia de las representaciones gráficas. Asimismo hemos visto la utilidad de las versiones linealizadas de los gráficos de pares (X, Y) y las distintas maneras de llevar a cabo la linealización, puesto que nos encontraremos a menudo con tales situaciones en el laboratorio. En este capítulo formalizaremos algunos métodos analíticos para estimar los parámetros de un modelo que se confronta a los datos experimentales. De nuevo, el punto de partida será una representación gráfica de los datos experimentales, a la que queremos “superponer” la predicción de un modelo.

Por ejemplo, imaginemos que deseamos determinar la constante k de un resorte que sigue la ley de Hooke:

xkF ⋅−= (3.1)

donde F es la fuerza elástica y x la elongación del resorte. Para determinar k se procede a cargar al resorte con diferentos pesos P y medir la elongación que producen. Es fácil reconocer a estas cargas como el estímulo externo, el cual provoca como respuesta del "sistema resorte" la elongación observada x. Sin embargo, no es necesario que en la representación gráfica de los pares de datos (P, x), la carga P ocupe el lugar de la variable independiente sobre el eje de las abscisas. Por comodidad en el manejo de los datos, es más adecuado representar P en función de x, y de la pendiente de la recta obtener directamente la constante k buscada. En el presente caso, y como regla casi general, si representamos gráficamente los datos experimentales, éstos no caerán exactamente sobre una recta, sino que presentarán cierta dispersión como se ilustra en la Figura 3.1.

Método de cuadrados mínimos. Regresión lineal. Función χ2. Obtención de los parámetros de un modelo. Correlación lineal. Incertidumbre de los parámetros de un ajuste.

Método cuantitativos de

análisis gráfico

& Ejemplos

@ Ejercicios

☺ Misceláneas

$ Evaluación

Page 40: Apuntes teoria de errores

Física re-Creativa, S. Gil y E. Rodríguez 2

Figura 3.1. Gráfico de datos asociados a un modelo lineal. La cantidad yI - f(x i) representa la desviación de cada observación de yi respecto del valor predicho por el modelo f(x i).

Es útil definir la función χ2 (Chi-cuadrado) como:

( )22 ∑ ⋅−= i ixkiPχ (3.2)

que es una medida de la desviación total de los valores observados Pi respecto de los predichos por el modelo kxi. El mejor valor de k es aquel que minimiza esta desviación total, o sea, el valor que puesto en (3.1) minimiza la función Chi-cuadrado. Por lo tanto, el mejor valor de k será el que se obtiene de resolver la siguiente ecuación:

( ) ( ) ( ) 0][2 222

=⋅−⋅⋅=⋅−= ∑∑ ii iii ii xkxPxkPdkd

dkdχ

,

o sea:

∑∑ ⋅

=i i

i ii

x

xPk (1.27)

0 2 4 6 8 10 12

2

4

6

8

10

12

14

yi - f(x

i)

yi

Xi

y

X

Page 41: Apuntes teoria de errores

Física re-Creativa, S. Gil y E. Rodríguez 3

En los programas como Excel, Origin, etc., este cálculo se realiza usando la

herramienta “regresión lineal” o “ajuste lineal” que se aplica cuando la relación esperada entre las magnitudes medidas es lineal y todos los datos tienen la misma incertidumbre absoluta.

El método descripto aquí se aplica de manera análoga para un modelo lineal que

incluya una ordenada al origen:

y a x b= ⋅ + (3.3)

En este caso la función Chi-cuadrado es

( )22 ∑ −⋅−= i bixaiyχ (3.4)

y para obtener los parámetros a y b se requiere minimizar la función repecto de ambos parámetros, es decir:

02

=dadχ

02

=dbdχ

3.2 – Método de cuadrados mínimos incluyendo errores - Regresión no lineal

Supongamos que tomamos una serie de mediciones de dos magnitudes cuya relación deseamos determinar. El resultado de nuestras N mediciones dará lugar a un conjunto de N ternas de la forma (xi, yi, σi), donde σi es la incertidumbre asociada a la determinación de yi. Aquí suponemos que la incertidumbre de xi es despreciable. Supongamos que el modelo que ajusta los datos viene dado por la función f(x;a,b,c,...), donde a, b, c, etc., son los npar parámetros del modelo. Al estimador del valor de y dado por el modelo lo designamos por y(xi)=f(x i ;a,b,c,...). Decimos que y(xi) representa la variación determinista de y con x.

En este caso más general definimos el valor de Chi-cuadrado como:

(( )) (( ))2

112

22 )x(yyw

)x(yyii

N

ii

N

i i

ii −−⋅⋅==−−

== ∑∑∑∑====

σ

χ (3.7)

donde los valores wi son los factores de peso de cada triada de datos (xi, yi, σi); en este caso wi=1/σi

2. Definimos el número de grados de libertad, v, del modelo como:

Page 42: Apuntes teoria de errores

Física re-Creativa, S. Gil y E. Rodríguez 4

parnNv −= . (3.8)

Figura 3.2. Diagrama esquemático de un ejemplo de modelo no lineal representado por la función f(x i). σi representa el error absoluto asociado a cada observación yi.

Introducimos la definición del error medio:

∑∑∑∑====

⋅⋅

====

⋅⋅

==N

ii

N

i iw

N

w

N11

2

2

1

11

11

1

σ

σ (3.9)

En nuestro caso hemos definido los factores de peso de cada triada de datos como la

inversa del cuadrado de la incerteza σi, aunque a veces es útil emplear otros factores de peso de los datos, como por ejemplo:

etc. ,1

o ,1

2i

ii

i yw

yw == (3.10)

También definimos la variancia total como:

( )∑=

−⋅⋅−

=N

iiit yyw

NS

1

22

1

1 (3.11)

xi

y

x

y i

y(xi)

yi

Page 43: Apuntes teoria de errores

Física re-Creativa, S. Gil y E. Rodríguez 5

St es una medida de la dispersión de los datos alrededor del valor medio de y . Este valor no depende del modelo (función f(x)), o sea que St ignora toda variación determinista de y con x.

También definimos la varianza del ajuste:

(( )) 22

1

22 11v

N

iiii

parf v

)x(yywnN

S χχ ==⋅⋅==−−⋅⋅⋅⋅−−

== ∑∑==

(3.12)

La varianza del ajuste, Sf, al igual que 2χ o 2

vχ (Chi-cuadrado por grado de libertad), miden la dispersión residual de los datos alrededor del valor determinista, o sea son medidas de la bondad del ajuste de y(xi) a los valores medido yi. Si el modelo determinista fuese el adecuado, su valor estaría asociado a las fluctuaciones estadísticas de yi respecto de su valor y(xi).

A veces es útil definir el coeficiente de regresión:

−= 2

222

t

ft

S

SSR (3.13)

Si el modelo y(xi) es una buena representación de los datos, es de esperar que tanto Sf como 2χ sean pequeños y que St >> Sf, de donde se deduce que R2 ≈ 1. En caso contrario,

tanto Sf como 2χ serán grandes y St ≈ Sf por lo tanto R2≈ 0.

Una “receta” para la determinación de las incertidumbres de los parámetros del modelo

Al igual que en el caso del modelo lineal discutido anteriormente, los mejores valores de los parámetros del modelo se obtienen de la minimización de la función Chi-cuadrado:

0,...),,(

*

2* =

∂∂

⇔= aa

acba

. (3.14)

Esto es, 2

minχ = 2χ (a*, b*, …)..

La determinación de las incertidumbres en los parámetros (a*, b*, c*,...) es un

procedimiento sofisticado sobre el que existen diversas teorías y opiniones[1,3]. Un método aproximado para calcular estas incertidumbres en forma gráfica se indica en la figura 1.5.

Page 44: Apuntes teoria de errores

Física re-Creativa, S. Gil y E. Rodríguez 6

Figura 3.3. Esquema gráfico que ilustra un procedimiento aproximado para obtener las incertidumbres de los parámetros de un modelo no lineal.

3.3 – Regresión lineal considerando las incertidumbres de medición

Un caso especial importante del esquema estadístico discutido precedentemente, es

el de la regresión lineal, ya que en este caso es posible resolver las expresiones generales en forma analítica, lo que facilita su uso y programación en muchas aplicaciones prácticas. Igual que antes supondremos que se tienen una serie de mediciones de dos magnitudes x e y cuya relación se supone lineal, es decir:

y a x b= ⋅ +

donde a y b son los parámetros del modelo que deseamos determinar y evaluar. El resultado de nuestras N mediciones dará lugar a un conjunto de N ternas de la forma (xi, yi, σi), donde σi es la incertidumbre asociada a la determinación de yi. También aquí suponemos que la incertidumbre de xi es despreciable. Al igual que antes definimos:

2

1 i

iwσ

== . (3.15)

Ya vimos que este modo de definir el peso de los datos puede variarse según sea el caso. En particular si no se dispone de las incertidumbres σI, los wi pueden tomarse iguales a 1. Usando las siguientes definiciones:

2minχ

χχ2

12 +minχ

χχ2

a*

2∆∆a

Page 45: Apuntes teoria de errores

Física re-Creativa, S. Gil y E. Rodríguez 7

∑∑ ==⋅=⋅=

N

i

nii

N

i

nii ywSYnxwSXn

11 , . (3.16)

∑∑∑∑ ======⋅⋅⋅⋅==

N

i iN

i iii wSumyxwSXY11

, . (3.17)

(x) (SX)-2

y 2

y ,

22

2

VarsumSXSum

X-SumSX

Var ( x )

SumSY

YSumSX

Xx

⋅=⋅=∆

=

=>≡<=>≡<

(3.18)

y usando (1-38) es posible demostrar que:

[ ]SYSXSumSXYa ⋅−⋅⋅∆

=1

. (3.19)

[ ] ><⋅−>=<⋅−⋅⋅∆

= yaySXYSXSYSXb 21

(3.20)

siendo sus incertidumbres:

( )( )

( )SumSX

Var(a)Ä

SXÄbVar(b)ó

, Var(x)Sum)(N

bxayw

ÄSum

ÄaVar(a)

b

iiii

a

22

2

22

2

22

⋅==≡≡

⋅⋅−

−⋅−⋅==≡≡

∑σ

(3.21)

respectivamente. De modo análogo se demuestra que el coeficiente de correlación viene dado por:

)( )(

),(

2 22 2 yVarxVaryxCov

ySumSYxSumSX

yxSumSXY⋅

=

⋅−⋅

⋅−

⋅⋅−=ρ (3.22)

Este parámetro da una idea de la bondad del modelo lineal propuesto. Si ρ es

próximo a 1, el modelo es adecuado, mientras que si ρ ≈ 0 el modelo lineal no es el modelo adecuado. Si ρ ≈ 0 esto no significa que no haya una vinculación o correlación entre x e y, sino que el modelo lineal no es el adecuado. Por ejemplo, si los pares de puntos (x,y) tiene una relación tal que caen sobre un círculo, tendríamosρ ≈ 0. Desde luego, si los pares (x,y) no tienen ninguna correlación entre ellos, también tendríamos que ρ ≈ 0 .

Page 46: Apuntes teoria de errores

Física re-Creativa, S. Gil y E. Rodríguez 8

Las incertidumbres en los valores de los parámetros a y b también pueden escribirse en términos de ρ del siguiente modo:

.2 )(

, 12

1

)2(

2

><⋅=

−⋅

−=

xaVar(b)Var

Na

Var(a)ρ (3.23)

Las ecuaciones (3.23) son de verdadera importancia cuando se realiza un análisis

profundo de los datos experimentales. 3.4 - Aplicaciones Consideremos el estudio experimental de un péndulo simple, al que se mide el período T para distintas longitudes L. Supongamos que cada período Ti(Li) (al que consideraremos la variable dependiente del problema) está determinado con la misma incertidumbre σ(Ti), como se muestra en la Figura 3.4 a. En caso de linealizar la representación mediante el cambio de variables (L, T2), la nueva variable dependiente T2 tiene incertidumbre σ(Ti

2) dada por las fórmulas de propagación:

)(2)()(2

2 TTTTT

T σσσ =∂∂

=

de donde se ve inmediatamente que σ(Ti

2) es función de T (ver también la Figura 3.4 b). Si procedemos a estimar los pará,etros del ajuste lineal a partir de los datos de la Figura 3.4 b debemos usar las fórmulas de la Sección 3.3.

Las mismas consideraciones son válidas en el caso de transformaciones usando la función logaritmo. Recordamos que, en caso de efectuar una linealización usando escalas logarítmicas, la incertidumbre propagada de una variable Y es (ver Capítulo 1):

[ ]YY

YY

YY

)()(

)log()log(

σσσ =

∂∂

=

que es una función de la variable Y.

Page 47: Apuntes teoria de errores

Física re-Creativa, S. Gil y E. Rodríguez 9

Figura 3.4. Al cambiar la representación hay cambios en las incertidumbres de las variables. a) la incertidumbre de la variable dependiente es uniforme. b) el cambio T2 por T implica no-uniformidad de las incertidumbres. Este hecho debe considerarse cuando se evalúen los parámetros del ajuste.

3.4 – Comentarios finales

Vale la pena notar que no siempre es suficiente admitir que dos variables siguen una relación lineal guiándonos por lo que muestra un gráfico de los datos en escalas lineales. Menos aun si sólo evaluamos el coeficiente de correlación del ajuste lineal que propondríamos a partir de este gráfico. Un gráfico de Y = X1.1 (variables sin correlación lineal) puede ajustarse por una recta y obtenerse a la vez un coeficiente de correlación lineal (inexistente) de, por ejemplo, 0.998. Un gráfico de datos experimentales de Y=X con algo de dispersión fortuita de los puntos, podría devenir en un coeficiente de, por ejemplo, 0.995, menor que el anterior. Entre los coeficientes hay una diferencia, apenas, del 3 por mil. Pero en un gráfico log-log, la diferencia de pendientes será la que hay entre 1.1 y 1.0, lo que representa un 10% de discrepancia entre los exponentes de la variable X. Estos métodos de análisis nos enseñan que los efectos de correlación pueden estar enmascarados por el efecto del “ruido” de los datos. Muchas veces lo difícil es establecer si existe

0.0 0.3 0.6 0.9 1.2 1.5 1.80.0

0.5

1.0

1.5

2.0

2.5

(a)

T (

s)

L (m)

0.0 0.4 0.8 1.2 1.6 2.0

0

2

4

6

8

(b)

T2 (

s2)

L (m)

Page 48: Apuntes teoria de errores

Física re-Creativa, S. Gil y E. Rodríguez 10

correlación entre las variables, aun cuando los datos provengan de fuentes “limpias”, las que hayan producido datos con relativamente poca dispersión.

Imaginemos un experimento donde se mide la distancia que recorre un móvil sobre una línea recta mientras una fuerza constante actúa sobre él. Esperamos, por tanto, que el movimiento sea uniformemente acelerado. Supongamos que el cuerpo parte del reposo, que medimos x(t) y que los datos colectados son los de la Figura 3.5. Si los datos experimentales se analizan sobre este gráfico con escalas lineales, el ajuste por un modelo lineal es más que tentador. Hecho ésto, se obtiene la ecuación de la mejor recta y un coeficiente de correlación ρ = 0.9995. Sin embargo, un modelo basado en las ecuaciones de la dinámica dice que

2

2

1atx =

donde a es la aceleración. En la Figura 3.5.b están los logaritmos de los mismos datos, de donde se ve claramente la proporcionalidad x ∝ t2 que predice el modelo, difícilmente demostrable a partir del gráfico de la Figura 3.5.a.

Representación de x(t) para un cuerpo que se mueve con movimiento uniformemente acelerado. (a) No se aprecia la curvatura de los datos y bien podría suponerse que la correlación es lineal. El coeficiente de correlación lineal, en efecto, es muy alto. (b) log(x) en función de log(t), de donde se ve que la relación es cuadrática. Para el análisis de errores, ver los comentarios de la Sección 3.3.

1.88 1.90 1.92 1.94 1.96 1.98 2.00 2.023.75

3.80

3.85

3.90

3.95

4.00

4.05

(b)

pendiente = 2

log

(x)

log(t)

75 80 85 90 95 100 105

600

750

900

1050(a)

ρ = 0.99959

x (c

m)

t (s)

Page 49: Apuntes teoria de errores

Física re-Creativa, S. Gil y E. Rodríguez 11

Bibliografía 1. Data reduction and error analisys for the physical sciences, 2nd ed., P. Bevington and

D. K. Robinson, McGraw Hill, New York (1993). 2. Numerical recipies in Fortran, 2nd. ed., W.,H. Press, S.A. Teukolsky, W.T. Veetterling

and B.P. Flanner, Cambridge University Press, N.Y. (1992). ISBN 0-521-43064x. 3. Data analysis for scientists and engineers, Stuardt L. Meyer, John Willey & Sons,

Inc., N.Y. (1975). ISBN 0-471-59995-6. 4. Estadística, Spiegel y Murray, 2da ed., McGraw Hill, Schaum, Madrid (1995). ISBN

84-7615-562-X. 5. Uncertainty in the linear regression slope, J. Higbie, Am. J. Phys. 59, 184 (1991);

Least squares when both variables have uncertainties, J. Orear, Am. J. Phys. 50, 912 (1982).

6. Probability, statistics and Montecarlo, Review of Particle Properties, Phys. Rev. D 45,

III.32, Part II, June (1992). 7. Teoría de probabilidades y aplicaciones, H. Cramér, Aguilar, Madrid (1968);

Mathematical method of statistics, H. Cramér, Princeton Univ. Press, New Jersey (1958).