pr icticas sobre control del integrador doble

SISTEMAS CONTROLADOS POR COMPUTADORA PRÁCTICA SOBRE CONTROL DEL:

INTEGRADOR DOBLE

Gerardo Darío MOLLO

Rubén MILOCCO

Año 2002

INDICE EL INTEGRADOR DOBLE...........................................................................................................1

1. Introducción...........................................................................................................................1 2. Obtención del Modelo Discreto.............................................................................................1 3. Observabilidad Alcanzabilidad y Controlabilidad ................................................................2

3.1. Observabilidad................................................................................................................2 3.2. Alcanzabilidad y Controlabilidad...................................................................................2

4. Estabilidad .............................................................................................................................3 5. Realimentación ......................................................................................................................3

5.1. Realimentación Proporcional .........................................................................................3 5.2. Realimentación Proporcional Derivativa .......................................................................4

6. Diseño Basado en la Asignación de Polos por Realimentación del vector de Estados .........7 7. Observador.............................................................................................................................9 8. Control por Realimentación de la Salida.............................................................................10 9. Diseño Basado en la Asignación de Polos en el Modelo Entrada – Salida .........................11 10. Control Lineal Cuadrático ...................................................................................................15 11. Filtro de Kalman..................................................................................................................16

11.1. Sistema con Ruido en el Proceso .................................................................................16 Filtro de Kalman – Versión Predictor................................................................................17 Filtro de Kalman – Versión Filtro .....................................................................................18

11.2. Sistema con Ruido en el Proceso y en la Medición .....................................................19 Filtro de Kalman – Versión Predictor................................................................................19 Filtro de Kalman – Versión Filtro .....................................................................................20

12. Control Óptimo LQG (Lineal Cuadrático Gaussiano) ........................................................21

Apéndice A: Estabilidad del Sistema Cuando se Utiliza un Controlador LQ ............................. I Apéndice B: Sistema con Ruido en el Proceso. Filtro de Kalman – Versión Predictor............ III Apéndice C: Sistema con Ruido en el Proceso. Filtro de Kalman – Versión Filtro...................V Apéndice D: Sistema con Ruido en el Proceso y en la Medición Correlacionados. Filtro de Kalman – Versión Predictor .................................................................................................... VII Apéndice E: Sistema con Ruido en el Proceso y en la Medición Correlacionados. Filtro de Kalman – Versión Filtro ........................................................................................................... IX Apéndice F: Demostración de las Ecuaciones del Filtro de Kalman – Versión Filtro. ............ XI

UNIVERSIDAD NACIONAL DEL COMAHUE FACULTAD DE INGENIERÍA CÁTEDRA: SISTEMAS CONTROLADOS POR COMPUTADORA

Gerardo Darío Mollo Página 1 Año 2002

EL INTEGRADOR DOBLE

1. Introducción Este apunte constituye un análisis de un sistema sencillo desde los enfoques vistos en

el cursado de Sistemas Controlados por Computadoras en el año 2002. El sistema con el cual se trabajará es el integrador doble, primero bajo el enfoque

determinístico y luego con un enfoque estocástico al introducir perturbaciones estocásticas.

2. Obtención del Modelo Discreto El proceso en tiempo continuo está descrito por la ecuación diferencial

( )2

2d y u tdt

= (2.1)

Definiendo los estados como:

1

2

x yx y

= =

La representación en variables de estado es:

( ) ( ) ( )

( ) [ ] ( )

0 1 00 0 1

1 0

x t x t u t

y t x t

= +

=

(2.2)

El muestreo del sistema con un zero order hold da las siguientes matrices para el

sistema discreto:

2 2

2

0 0

/ 21 0 0 1

00 1 0 0 0 1

/ 21

Ah

h hAs

e I Ah A hh h

s he ds B ds

h

Φ = = + + +

= + + =

Γ = = =

∫ ∫

Finalmente el sistema discreto es:

( ) ( ) ( )

( ) [ ] ( )

21 / 20 1

1 0

h hx kh h x kh u kh

hy kh x kh

+ = +

=

(2.3)

En lo sucesivo, salvo que se indique lo contrario, se utilizará como período de

muestreo 1h = , con lo que el sistema (2.3) se expresa como:



( ) ( ) ( )

( ) [ ] ( )

1 1 0.51

0 1 1

1 0

x k x k u k

y k x k

+ = +

=

(2.4)

Otro modo de representar el sistema se logra haciendo uso del operador de

desplazamiento hacia delante, mediante el operador de transferencia discreta ( ) ( ) 1H q C qI D−= − Φ Γ +

( ) [ ]

[ ]( )

( )( )

1

2

2

1 1 0.51 0

0 1 1

1 1 0.511 00 1 11

0.5 1 11

qH q

qq

qq

qq

−− − = −

− = −−

− +=

−

( ) ( )( )2

0.5 11

qH q

q+

=−

(2.5)

Utilizando el operador desplazamiento hacia atrás se tiene:

( ) ( )( )

1 21

21

0.5

1

q qH q

q

− −−

−

+=

− (2.6)

3. Observabilidad Alcanzabilidad y Controlabilidad La observabilidad y la controlabilidad son dos propiedades importantes de los

sistemas. Muchos de los métodos que se usarán aquí requieren que estas propiedades sean satisfechas. Se hace a continuación un análisis de las mismas para el sistema.

3.1. Observabilidad La matriz de observabilidad del sistema es:

1 01o

CW

C h

= = Φ (3.1)

Puesto que ( )det 0oW h= ≠ , el rango de ella es dos, por lo que el sistema es

observable.

3.2. Alcanzabilidad y Controlabilidad La matriz de controlabilidad para el sistema es:

[ ]2 2/ 2 3 / 2

ch h

Wh h

= Γ ΦΓ =

(3.2)



Como ( ) 3 3det / 2 3 / 2 0cW h h= − ≠ , el rango de la matriz de controlabilidad es dos, condición suficiente para la controlabilidad del sistema. Además, los conceptos de controlabilidad y alcanzabilidad son equivalentes si ( )det 0Φ ≠ . Puesto que ( )det 1 0Φ = ≠ , el sistema es también alcanzable, esto significa que se puede alcanzar cualquier estado deseado desde cualquier estado inicial en un tiempo finito.

4. Estabilidad Del operador de transferencia discreto (2.5) del sistema, se sabe que sus dos polos

están en 1q = , sobre la circunferencia unitaria, por lo que él se encuentra en el límite de estabilidad. Nótese que no se trata de un sistema BIBO debido a la acción integradora pura.

5. Realimentación Análogamente a lo que ocurre en los sistemas continuos, la realimentación es usada

también en los sistemas discretos con el fin de lograr ciertas características del sistema a lazo cerrado. Ello lo logra cambiando los polos del sistema. Algunas de las ventajas de la realimentación son la mejora en el comportamiento transitorio del sistema y la disminución de la sensibilidad a la variación de los parámetros, entre otras.

5.1. Realimentación Proporcional Se comenzará analizando al sistema con realimentación proporcional. Se supondrá que

es deseable que la salida del sistema a lazo cerrado siga una señal de referencia ( )cu t . El controlador proporcional tiene la forma.

( ) ( ) ( )( )cu k K u k y k= − (5.1)

Esquemáticamente:

0.5(z+1)

(z-1)2

H(z)

K

ControladorP

u(k)e(k)y(k)

uc(k)

Figura 1. Integrador doble con controlador proporcional

Haciendo uso de las expresiones (2.5) y (5.1) se puede calcular al función de

transferencia a lazo cerrado:

( ) ( ) ( )( ) ( )1

clc

c

H q H qH q

H q H q=

+

( )

( )( )

( )( )

( )( ) ( )

2

2

2

0.5 11 0.5 1

0.5 1 1 0.5 111

lc

qK

q K qH q

q q K qKq

+− +

= =+ − + ++

−



La ecuación característica del sistema a lazo cerrado es:

( )2 2 0.5 1 0.5 0q K q K+ − + + + =

Con ella es posible hacer una representación del lugar geométrico de las raíces, como se esquematiza en la Figura 2 a continuación:

-4 -3 -2 -1 0 1 2 3 4-3

-2

-1

0

1

2

3

R e z

Im z

Figura 2. Lugar geométrico de las raíces para el integrador doble con realimentación proporcional

En el archivo proporcional.mdl de Simulink se encuentra el sistema a lazo abierto y con realimentación proporcional. Allí, cambiando los valores de la ganancia K se puede ver cómo el sistema a lazo cerrado es siempre inestable.

Notas: El sistema a lazo cerrado es inestable para todo valor de K, puesto que las raíces

siempre se encuentran fuera de la circunferencia unitaria.

5.2. Realimentación Proporcional Derivativa Una forma de lograr estabilidad a lazo cerrado consiste en agregar la acción derivativa

al controlador proporcional. Así, manteniendo la suposición de que es deseable que el sistema a lazo cerrado siga una señal de referencia ( )cu t , el controlador proporcional derivativo toma la forma: ( ) ( ) ( )( ) ( )c Du k K u k y k T y k = − − (5.2)



Ahora es necesario expresar la parte derivativa del controlador en una representación válida para sistemas discretos. Utilizando el método de Euler de diferencias finitas hacia delante, para 1h = , se tiene que:

( ) ( )1dy y k y kdt

≈ + −

Además, teniendo en cuenta que:

dy udt

=

Se tiene que:

( ) ( )11

y k u kq

=−

Lo que conduce a que el controlador (5.2) tome la forma:

( ) ( ) ( )( ) ( )

( ) ( ) ( ) ( )( )

( ) ( ) ( )( )

1

1

11

Dc

Dc

c

D

Tu k K u k y k u kq

Tu k K u k K u k y kq

K u k y ku k TK

q

= − − −

+ = −−

−=

+−

( ) ( )( ) ( ) ( )( )1

1 cD

K qu k u k y k

q KT−

= −− +

(5.3)

Esquemáticamente:

uc(k) 0.5(z+1)

(z-1)2

H(z)

k(z-1)

(z-(1-k*td))Controlador

PD

u(k)e(k)y(k)

Figura 3. Integrador doble con controlador proporcional derivativo

La función de transferencia de lazo cerrado se puede calcular a partir de las

expresiones (2.5) y (5.3):

( ) ( ) ( )( ) ( )

( )( )

( )( )

( )( )

( )( )

2

2

0.5 1 11· 1

0.5 1 11 · 111

Dclc

c

D

q K qq KTH q H q q

H qq K qH q H q

q KTq

+ −− +−

= =+ −+ +

− +−



( ) ( )( )( ) ( )

0.5 11 1 0.5 1lc

D

K qH q

q q KT K q+

=− − + + +

(5.4)

La ecuación característica es:

( )2 2 0.5 1 0.5 0D Dq KT K q KT K+ − + + + − + = (5.5)

De esta expresión se obtiene el lugar de las raíces que se esquematiza en la Figura 4 a

continuación:

-1 -0.5 0 0.5 1 1.5 2 2.5

-1

-0.5

0

0.5

1

Im z

R e z

Figura 4. Lugar geométrico de las raíces para el integrador doble con controlador

proporcional derivativo para el parámetro K con TD = 1,5

En el archivo proporcional_derivativo.mdl de Simulink se encuentra el sistema a lazo abierto y con un controlador PD. Allí, los parámetros K y TD provienen del workspace de Matlab, por lo que deben cargarse antes de realizar la simulación. Las simulaciones para diferentes valores de K y TD permiten apreciar la respuesta del sistema a la referencia escalón (sin error en estado estacionario) y a la rampa (con error en estado estacionario). También puede simularse el sistema para aquellos valores de K y TD para los cuales el sistema se hace inestable.

Notas: Con el controlador PD se puede lograr que el sistema sea estable. Las condiciones

para la estabilidad del sistema a lazo cerrado se obtienen analizando los valores que tienen que tomar los parámetros K y TD para que las raíces de la ecuación



característica (5.5) sean de módulo menor a la unidad. Este análisis arroja las siguientes condiciones para la estabilidad del sistema a lazo cerrado:

0 < K < 4/3 , D1/2 < T < 3/2 y DK·T < 2 . Cabe destacar que el controlador posee un cero en 1z = por lo que uno de los polos del sistema es cancelado. Esto provoca que el sistema cuente con solo un integrador en el camino del lazo directo, siendo capaz de seguir sin error en estado estacionario señales de referencia, ( )cu k , del tipo escalón. Puede reemplazarse el cero del controlador por un valor cercano a 1 y simular la respuesta del sistema a lazo cerrado para una referencia del tipo rampa, en esta situación la respuesta no debe tener error en estado estacionario gracias a los dos integradores en el camino directo de la transferencia. Es posible calcular un controlador proporcional integral y derivativo PID para el sistema. Este controlador es utilizado para eliminar el error en estado estacionario incorporando la acción integral, pero como el sistema ya cuenta con acción integral no se aplicará este controlador.

6. Diseño Basado en la Asignación de Polos por Realimentación del vector de Estados Aquí se plantea un método de diseño basado en la representación en variables de

estado (2.3). Se supone que todas las variables de estado se miden directamente. La fórmula de Ackermann establece que, como el sistema es alcanzable, los polos de lazo cerrado, dados por la ecuación característica ( ) 2

1 2 0P z z p z p= + + = , se pueden elegir arbitrariamente mediante una ley de realimentación de las variables de estado de la forma: ( ) ( )u kh Lx kh= − (6.1)

Esquemáticamente:

y(n)=Cx(n)+Du(n)x(n+1)=Ax(n)+Bu(n)

Estados delIntegrador Doble

K

C

K

- L

y(k)u(k) x(k)

Figura 5. Método de realimentación de las variables de estado

Donde la matriz L está dada por:

[ ] ( )10 1 cL W P−= Φ (6.2)

De (3.2) se tiene que 1cW − es:



2 21

3 2 2

3 / 2 1/ 3 / 21/ 2 / 2 1/ 1/ 2c

h h h hW

h h h h h− − −

= = − − −

Evaluando ( )P z con la matriz Φ del sistema (2.3)

( ) 1 2

1 2 1 1 00 1 0 1 0 1

h hP p p

Φ = + +

( ) 1 2 1

1 2

1 20 1

p p h p hP

p p+ + +

Φ = + + (6.3)

Así, (6.2) queda:

[ ]2

1 2 12

1 2

1 2 12

1 2

1 21/ 3 / 21 0

0 11/ 1/ 2

1 21/ 1/ 2

0 1

p p h p hh hL

p ph hp p h p h

L h hp p

+ + + − = + +−

+ + + = − + +

1 2 1 22 2

1 32

p p h p h p hLh h

+ + + − = (6.4)

En el archivo Ackermann.mdl de Simulink se encuentra el sistema a lazo abierto en la representación de variables de estado y el sistema con realimentación de estados. Para las simulaciones es necesario cargar previamente en el workspace de Matlab el valor del período de muestreo h y los coeficientes 1p y 2p del polinomio característico deseado.

Notas: Los controladores proporcional y proporcional derivativo propuestos anteriormente

pueden considerarse como casos particulares del método de ubicación de polos por realimentación de estados. La diferencia está en cuales son los parámetros de diseño con que cuenta el diseñador, en aquellos eran las constantes de proporcionalidad K y de tiempo derivativo TD, mientras que en este son los polos de lazo cerrado deseados (a través de los coeficientes 1p y 2p del polinomio característico deseado). Lo importante es que ambos enfoques se encargan de reubicar los polos a lazo cerrado del sistema para lograr la respuesta deseada.

Es recomendable verificar el comportamiento de los estados para un controlador deadbeat, el cual se logra haciendo 1 2 0p p= = . Para este caso, los estados llegan al reposo desde cualquier condición inicial en dos pasos (igual al orden del sistema). Aquí debe prestarse gran atención a la señal de control. Nótese cómo aumenta la misma en magnitud a medida que se disminuye el tiempo de muestreo. Por ejemplo, para 1h = el valor de señal de control es del orden de la condición inicial, para

0.1h = la señal de control es del orden de 100 veces la condición inicial.



Nótese que el sistema a lazo abierto tiene una respuesta integral doble pura para cualquier condición inicial, haciendo que la salida crezca indefinidamente, excepto para el estado inicial de reposo.

7. Observador Cuando los estados del sistema no se pueden medir directamente, si el sistema es

completamente observable, es posible estimarlos mediante un observador a partir del modelo del sistema, de la entrada y de la salida.

La reconstrucción de todos los estados se basa en un sistema dinámico “el observador de orden completo” de la forma:

( ) ( ) ( ) ( ) ( )ˆ ˆ ˆ1 1 1x k k x k k u k K y k Cx k k + = Φ − + Γ + − − (7.1)

Esquemáticamente:

q-1 - C

+

ΦΦΦΦ

+ΓΓΓΓ

Kε (k)

x^(k+1|k)- y^(k|k-1)

OBSERVADOR

u(k) x^(k|k-1)

y(k)

x^(k|k-1)

Figura 6. Observador de Orden Completo

El error de estimación se obtiene restando (2.3) y (7.1), lo que conduce a la dinámica

del error de reconstrucción:

( ) [ ] ( )1 1x k k KC x k k+ = Φ − − (7.2) La matriz K se elige para que esta dinámica del error sea asintóticamente estable, esto

es, para que el error converja a cero con la dinámica de (7.2). Este es un problema de ubicación de polos a lazo cerrado, por lo que se puede utilizarse el método de asignación de polos por realimentación del estado (Ackermann). Así, haciendo:

( ) 1 01oK P W −

= Φ

(7.3)

De (3.1) se tiene que 1oW − es:

1 0 1 01

1 1 1/ 1/o

hW

h hh−

= = − −

Haciendo uso de (6.3) y de esta última, la matriz K es:



1 2 1

1 2

1 2 1

1 2

1 2 1 0 00 1 1/ 1/ 1

1 2 00 1 1/

p p h p hK

p p h h

p p h p hK

p p h

+ + + = + + −

+ + + = + +

1

1 2

2

1

h p hhK

p ph

+

= + +

(7.4)

Puesto que:

[ ]1 1 1

1 2 1 2 1 2

2 2 01 11 0

0 1 1 0 1 1 10 1

h p h h p h h p h hh hh h hKCp p p p p ph h h

+ + − −

Φ − = − = − = + + + + + + −

El observador es:

( ) [ ] ( ) ( ) ( )ˆ ˆ1 1x k k KC x k k u k Ky k+ = Φ − − + Γ +

( ) ( ) ( ) ( )1 1

2

1 2 1 2

2/ 2ˆ ˆ1 1

1 11

h p h h p hh hh hx k k x k k u k y kp p p phh h

− − +

+ = − + + + + + + −

(7.5)

En el archivo Observador.mdl de Simulink se encuentra el observador del sistema. Para simularlo es necesario cargar en el workspace de Matlab el valor del período de muestreo h y los coeficientes 1p y 2p del polinomio característico deseado para la dinámica del observador. El modelo presentado responde a la forma (7.5) por lo que difiere de la Figura 6 presentada anteriormente, sin embargo se trata del mismo sistema. Se han cargado diferentes condiciones iniciales para el sistema y el observador1 con el fin de ver cómo el estimador converge a los estados reales con la dinámica elegida, ya que si fueran coincidentes el observador convergería al sistema desde el comienzo.

Notas: Es recomendable verificar el comportamiento del observador para el caso deadbeat

( 1 2 0p p= = ). Para este caso, los estados estimados convergen exactamente al valor real en dos pasos, desde cualquier condición inicial. Eligiendo los polos del observador a lazo cerrado de modo que sea estable se puede apreciar que siempre los estados estimados convergen a los reales en un tiempo finito.

8. Control por Realimentación de la Salida Como en general solo se cuenta con la salida del sistema y con el modelo del mismo,

es posible hacer un diseño basado en la asignación de polos por realimentación del estado 1 La condición inicial para la simulación se carga en el bloque “Unit Delay”



suponiendo que los estados se pueden medir, obtener la matriz L de realimentación dada por (6.4) y luego utilizar las estimaciones de los estados provistas por el observador del sistema dado en (7.5).

Esquemáticamente:

PROCESO

q-1 C

ΦΦΦΦ

+ΓΓΓΓy(k)u(k)

OBSERVADOR

+q-1 C

-+

ΦΦΦΦ

+

+

ΓΓΓΓu(k)

+

+ +

K

+

ε (k)

x^(k)

x(k)

y^(k)

- L

REALIMENTACIÓNDE ESTADOS

x^(k)u(k)

Figura 7. Realimentación de las variables de estado dadas por el observador de orden completo

En el archivo Ackermann_Observador.mdl de Simulink se encuentra el esquema de control propuesto. Allí se han cambiado los coeficientes del polinomio deseado del observador por 1p o y 2p o , para evitar conflictos con aquellos 1p y 2p del polinomio característico deseado para el sistema. Para simular es necesario cargarlos a todos en el workspace de Matlab, además del valor correspondiente al período de muestreo h . También aquí se han cargado diferentes condiciones iniciales para el sistema y el observador (véase nota al pie en la página 10).

Notas: Es recomendable verificar el comportamiento del sistema y del observador para el

caso deadbeat ( 1 2 1 2 0p p p o p o= = = = ). Para este caso, la salida del sistema converge a cero luego de cuatro pasos: dos necesarios para que el observador converja a los estados reales del sistema y dos más para que la dinámica del sistema a lazo cerrado converja a cero, desde condiciones iniciales diferentes.

9. Diseño Basado en la Asignación de Polos en el Modelo Entrada – Salida A partir del sistema modelado en la forma entrada – salida como en (2.5):



( ) ( )( )

( )( )2

0.5 11

B q qH q

A q q+

= =−

(9.1)

Se factoriza el polinomio numerador ( )B q :

( ) ( ) ( ) ( )( )

10.5 0.5

B qB q B q B q

B q q

++ −

−

== ⇒ = + (9.2)

Realimentando la salida, se supone que el sistema a lazo cerrado deseado es de la

forma:

( ) ( )( )

( )2

1 2

0.5 1dd

d

B q K qH q

A q q p q p+

= =+ +

(9.3)

Nótese que para el polinomio característico deseado se han elegido los mismos

coeficientes 1p y 2p con el fin de poder comparar resultados posteriormente. También se supone que no se desea eliminar el cero del sistema. Además, se agrega una ganancia K al sistema de lazo cerrado.

La ley de control propuesta es:

( ) ( )( ) ( ) ( )

( ) ( )c

T q S qu k u k y k

R q R q= − (9.4)

Esquemáticamente:

T(q)

S(q)

B(q)A(q)

1R(q)

uc(k)

-

+ u(k) y(k)

Figura 8. Controlador del enfoque polinomial

Las condiciones para la causalidad son:

( ) ( ) ( ) ( ) 2 1 2 1 1 1d dgr A gr B gr A gr B− ≥ − ⇒ − ≥ − ⇒ ≥ ( ) ( ) ( ) ( ) ( ) ( )2 1 2·2 2 0 1 1o d o ogr A gr A gr A gr B gr A gr A+≥ − − − ⇒ ≥ − − − ⇒ ≥ Los mínimos grados para ( )R q y ( )S q son:

( ) ( ) ( ) ( ) ( ) ( )1 2 0 2 1o dgr R gr A gr A gr B gr A gr R+= + + − = + + − ⇒ =



( ) ( ) ( )1 2 1 1gr S gr A gr S= − = − ⇒ =

Teniendo en cuenta la segunda condición de causalidad y los mínimos grados para

( )R q y ( )S q se eligen los polinomios:

( ) 1oA q q= + (9.5) ( ) 0R q q r= + (9.6) ( ) 1 0S q s q s= + (9.7)

Forzando la transferencia del sistema a lazo cerrado para que sea igual a la función de transferencia deseada (9.3):

( )

( )( ) ( )

( )( ) ( )

( )( )

( )( )

( )( )

( )( )1 1

lc

T q T q B qH q

R q R q A qH q

S q S q B qH q

R q R q A q

= =+ +

( ) ( ) ( )( ) ( ) ( ) ( )

( )( )

dlc

d

T q B q B qH q

R q A q S q B q A q= =

+ (9.8)

Haciendo que ( )B q+ sea factor de ( ) ( ) ( ) ( )R q A q S q B q+ se debe cumplir:

( ) ( ) ( ) ( ) ( )R q B q R q R q R q+ ′ ′= ⇒ = (9.9)

Puesto que los ceros de mínima fase no pueden eliminarse de la transferencia a lazo

cerrado, ( )B q− es factor de ( )dB q . Por lo tanto:

( ) ( ) ( ) ( )d d dB q B q B q B q K− ′ ′= ⇒ = (9.10)

De (9.2), (9.9), (9.10) e incorporando el polinomio del observador dado por (9.5), la

transferencia a lazo cerrado (9.8) queda:

( ) ( )( ) ( ) ( ) ( )

( )( )

( )( )

d olc

d o

T q B q A qH q

R q A q S q B q A q A q−

′= =

′ + (9.11)

Igualando numerador y denominador de (9.11) se tiene:

( ) ( ) ( ) ( ) ( )1d oT q B q A q T q K q′= ⇒ = + (9.12)



( ) ( ) ( ) ( ) ( ) ( )( )( ) ( )( ) ( )( )2 2

0 1 0 1 21 0.5 0.5 1d oR q A q S q B q A q A q

q r q s q s q q p q p q

−′ + =

+ − + + + = + + +

Esta última igualdad conduce a un sistema de tres ecuaciones con tres incógnitas cuya

solución es:

0

0 2

1 1

12 22 4

rs ps p

= = − = +

Así (9.6) y (9.7) quedan:

( ) 1R q q= + (9.13)

( ) ( ) ( )1 22 4 2 2S q p q p= + + − (9.14)

Finalmente, el controlador propuesto (9.4) es:

( ) ( )( ) ( ) ( ) ( )

( ) ( )1 21 2 4 2 21 1c

K q p q pu k u k y k

q q+ + + −

= −+ +

( ) ( ) ( ) ( )( ) ( )1 22 4 2 2

1c

p q pu k K u k y k

q+ + −

= −+

(9.15)

En el archivo Polinomial.mdl de Simulink se encuentra el sistema con el controlador hallado. Para las simulaciones es necesario cargar en el workspace de Matlab los coeficientes 1p y 2p del polinomio característico deseado para la dinámica del sistema a lazo cerrado. El modelo presentado responde a la forma (9.15) por lo que difiere del presentado en la Figura 8 presentada anteriormente, sin embargo se trata del mismo sistema.

Notas: Es recomendable verificar el comportamiento del sistema para el controlador deadbeat

( 1 2 0p p= = ). Para este caso, la salida del sistema llega al reposo en dos pasos, desde cualquier condición inicial y con entrada de referencia ( )cu k nula. Puede comprobarse que el controlador hallado (9.15) junto con el sistema (9.1) satisfacen, a lazo cerrado, la función de transferencia deseada (9.3). Nótese que, debido a la función de transferencia deseada elegida, el sistema tendrá error en estado estacionario. Para lograr error en estado estacionario nulo con entrada escalón es necesario incorporar en el polinomio ( )R q polos de la forma ( )1q − .



10. Control Lineal Cuadrático Se considera ahora el caso determinístico para el modelo discreto (2.4), es decir, sin

perturbaciones. Ello supone que se conocen exactamente los estados. La ley de realimentación de la forma:

( ) ( ) ( )u k L k x k= − (10.1) minimiza la función de costo:

( ) ( ) ( ) ( ) ( ) ( )1

1 2 00

NT T T

Nk

J x k Q x k u k Q u k x N Q x N−

=

= + + ∑ (10.2)

si la matriz L satisface:

( ) ( )( ) ( )1

2 1 1T TL k Q S k S k−

= + Γ + Γ Γ + Φ (10.3) donde ( )S k está dado por la ecuación de Riccati en tiempo discreto:

( ) ( ) ( ) ( )( ) ( )1

1 21 1 1 1T T T TS k S k Q S k Q S k S k−

= Φ + Φ + − Φ + + Γ + Γ Γ + Φ (10.4) con la condición final 0NS Q= .

El problema no se resuelve aquí de manera analítica por la complejidad de las

ecuaciones (10.3) y (10.4). El programa para entorno Matlab “control_LQ” resuelve las mencionadas ecuaciones para el doble integrador con el horizonte definido por el usuario. En él se definen las matrices Φ , Γ y C del sistema y las matrices de peso Q1, Q2 y Q0 de la función de costo (10.2), las cuales pueden ser cambiadas con el fin de probar diferentes controladores óptimos.

En el archivo ControlLQ.mdl de Simulink se encuentra el sistema con el controlador óptimo. Para las simulaciones debe generarse una matriz que contenga los valores de ganancia bajo la variable “gain”. Esta matriz de ganancia es devuelta por el programa “control_LQ” mediante las siguientes instrucciones: » [gain] = control_LQ; Ingrese la matriz de orden 2x2 de peso del estado final Q0= Ingrese la matriz de orden 2x2 de peso de los estados Q1= Ingrese la matriz de orden 1x1 de peso de la entrada Q2= Indique el horizonte N = El programa asignará a la variable “gain” una matriz de orden Nx3, donde la primer columna es el índice temporal que requiere el bloque “from workspace” para la simulación y la segunda y tercer columnas constituyen la ganancia del controlador LQ en cada instante de muestreo.



Notas: Es importante observar que el controlador LQ es variante en el tiempo y que las ganancias variables en el tiempo pueden precalcularse en función del modelo del sistema y de la función de costo, almacenarse y utilizarse posteriormente. El controlador LQ para estado estacionario, que se obtiene haciendo en (10.4)

( ) ( )1S k S k+ = , hace que ( )S k tienda a ser constante cuanto más grande es el horizonte, por lo que este control es análogo al que se obtuvo por Ackermann, con la diferencia que el LQ siempre es estable y garantiza ser óptimo en el sentido de minimizar la función de costo (10.2). En el Apéndice A se hace un análisis de la estabilidad del sistema cuando se utiliza el controlador LQ. Es interesante verificar el comportamiento de la señal de control cuando se varía la matriz de peso Q2. Cuanto más grande es el peso que se le da a la señal de control menor es la magnitud de la señal que utilizará el controlador LQ. Un caso particular que es interesante para comprender el funcionamiento de la función de costo es hacer 0 1 0Q Q= = , es decir , no darle peso a los estados y 2 100Q = , esto es, darle gran peso a la señal de control. Para este caso, la señal de control será nula y los estado es comportarán como en el sistema a lazo abierto. Sin embargo se trata de un control óptimo que garantiza mínima energía en la señal de control.

11. Filtro de Kalman

11.1. Sistema con Ruido en el Proceso El uso del controlador LQ requiere del conocimiento de los estados. Cuando no se

cuenta con ellos, se los puede estimar mediante un filtro de Kalman; el cual, a diferencia del observador hallado en la sección 7, permite la existencia de perturbaciones estocásticas gaussianas en los estados y/o en la medición, siendo ahora el criterio de diseño minimizar la varianza del error de estimación. El filtro de Kalman hace uso del modelo del sistema, y de la medición de la entrada y la salida. La versión predictor estima los estados en el instante de muestreo 1k + con mediciones hasta el instante k, mientras que la versión filtro estima los estados en el instante de muestreo k con mediciones hasta el instante k.

Se considera ahora el caso en que solo existe perturbación en los estados. Así, el integrador doble con ruido en el proceso se describe mediante:

( ) ( ) ( ) ( )

( ) [ ] ( )

1 1 0.5 01

0 1 1 1

1 0

x k x k u k v k

y k x k

+ = + +

=

(11.1)

donde ( )v k es una secuencia de variables aleatorias independientes de media cero y matriz de covarianza 1R . Las matrices de covarianza para las perturbaciones son:

( ) ( )( ) ( ) ( ) ( )( ) ( )( )( ) ( )( )

1 2 2

2

12

0 0 0 0 00

0 0

0

0

T

T

T

R E v k v k E v k Ev k v k

R E e k e k

R E v k e k

σ = = = =

= =

= =

(11.2)



Filtro de Kalman – Versión Predictor El filtro de Kalman – versión predictor:

( ) ( ) ( ) ( ) ( ) ( )ˆ ˆ ˆ1| | 1 | 1x k k x k k u k K k y k C x k k+ = Φ − + Γ + − − (11.3) donde la ganancia de Kalman está dada por: ( ) ( ) ( )( ) 1

2 T TK k P k C R C P k C−

= Φ + (11.4) minimiza la varianza del error ( ) ( ) ( )ˆx k x k x k= − : ( ) ( ) ( ) ( )( ) ( )1

1 21 T T T TP k P k R P k C R C P k C C P k−

+ = Φ Φ + − Φ + Φ (11.5) En el Apéndice B se encuentra el cálculo analítico del filtro de Kalman en la versión

predictor. El mismo problema también se ha resuelto mediante un programa para entorno Matlab como se detalla a continuación:

La matriz de ganancia de Kalman se puede calcular en el workspace de Matlab mediante el programa “Kalman_pre” * mediante las siguientes instrucciones: » [Kpre Ppre]=Kalman_pre Indique la covarianza del ruido de proceso R1=[0 0;0 1] Indique la covarianza del ruido de medición R2=0 Indique la covarianza entre los ruidos de medición y de proceso R12=0 Indique la cantidad de pasos N = 20 La ejecución del programa asignará a la variable “Kpre” una matriz de orden Nx3, donde la primer columna es el índice temporal, necesario para el bloque “from workspace” de Simulink, mientras que la segunda y tercer columnas constituyen la ganancia de Kalman en cada instante de muestreo. También generará una matriz “Ppre” de orden Nx5, donde la primer columna también es el índice temporal y de la columna 2 a la 5 son las componentes de la matriz de covarianza. En el archivo Kalman_predictor.mdl de Simulink se encuentra el filtro de Kalman para el sistema en la versión predictor. Antes de realizar las simulaciones es necesario generar las matrices de ganancia de Kalman y de la covarianza del error como se explica arriba. Además, debe prestarse especial atención al bloque de ganancia del ruido de medición, el cual debe setearse a cero para que responda al modelo propuesto por (11.1) y (11.2).

Notas: Es importante notar que la dinámica del filtro de Kalman es variante en el tiempo y que la ganancia de Kalman puede precalcularse en función del modelo del sistema y de las mediciones de la entrada y salida del sistema. Esta ganancia puede almacenarse para utilizarla posteriormente. Debe recordarse que el modelo propuesto por Kalman

* El programa “Kalman_pre.m” cuenta con el script “help_kalman_pre.m”, el cual contiene la definición del problema para el entorno Matlab. Este debe colocarse en la misma carpeta en la que esté el programa para el correcto funcionamiento del mismo.



se basa en la hipótesis de que las perturbaciones son del tipo estocástico, distribuidos normalmente y sin correlación. Al realizar las simulaciones es recomendable verificar la velocidad de convergencia, tanto de la matriz de Kalman como de la matriz de covarianza del error. En ambos casos las matrices convergen a sus valores estacionarios en dos períodos de muestreo, lo cual se debe a que la medición de la salida es exacta. Obsérvense los valores estacionarios de la matriz de covarianza ( )P k , esto será útil para realizar comparaciones con el filtro de Kalman en la versión filtro y para cuando en el sistema exista ruido en la medición.

Filtro de Kalman – Versión Filtro Para el filtro de Kalman – versión filtro:

( ) ( ) ( ) ( ) ( ) ( ) ( )( )ˆ ˆ ˆ1| 1 | 1 1 | x k k x k k u k K k y k C x k k u k + + = Φ + Γ + + + − Φ + Γ (11.6) el error de estimación ( ) ( ) ( )ˆx k x k x k= − tendrá una matriz de covarianza:

( ) ( )

( ) ( ) ( ) ( ) ( )1

0

| 1 1| 1

| | 1 | 1 0 | 0

TP k k P k k R

P k k P k k K k C P k k P R

− = Φ − − Φ +

= − − − = (11.7)

la cual es mínima para la ganancia de Kalman: ( ) ( ) ( )( ) 1

2| 1 | 1T TK k P k k C R C P k k C−

= − + − (11.8)

En el Apéndice C se encuentra el cálculo analítico del filtro de Kalman en la versión filtro. El mismo problema se ha resuelto mediante un programa para entorno Matlab como se detalla a continuación:

La matriz de ganancia de Kalman se puede calcular en el workspace de Matlab mediante el programa “Kalman_fil” mediante las siguientes instrucciones: » [Kfil Pfil] = Kalman_fil; Indique la covarianza del ruido de proceso R1=[0 0;0 1] Indique la covarianza del ruido de medición R2=[0] Indique la covarianza entre los ruidos de medición y de proceso R12=[0] Indique la cantidad de pasos N = 10 La ejecución del programa asignará a la variable “Kfil” una matriz de orden Nx3, donde la primer columna es el índice temporal, necesario para el bloque “from workspace” de Simulink, mientras que la segunda y tercer columnas constituyen la ganancia de Kalman en cada instante de muestreo. También generará una matriz “Pfil” de orden Nx5, donde la primer columna también es el índice temporal y de la columna 2 a la 5 son las componentes de la matriz de covarianza . En el archivo Kalman_filtro.mdl de Simulink se encuentra implementado el filtro de Kalman para el sistema en la versión filtro. Antes de realizar las simulaciones es



necesario anular la ganancia para el ruido de medición y generar las matrices de ganancia de Kalman y de la covarianza del error como se explica arriba.

Notas: Debe notarse la mejora de la versión filtro con respecto a la versión predictor. Ello se debe a que la versión filtro realiza la corrección de la predicción al utilizar la muestra actual. En la práctica esto implica un retardo de cálculo. Además, los valores de ganancia y de covarianza del error son menores, lo que implica una mejora con respecto al predictor.

11.2. Sistema con Ruido en el Proceso y en la Medición Se considera ahora el caso en que tanto en los estados como en la medición de la salida

del sistema existen perturbaciones. La existencia de ruido en la medición físicamente se puede atribuir, por ejemplo, al ruido térmico que se introduce en el dispositivo de medida.

El integrador doble con ruido en el proceso y en la medición se puede modelar como:

( ) ( ) ( ) ( )

( ) [ ] ( ) ( )

1 1 0.5 01

0 1 1 1

1 0

x k x k u k v k

y k x k e k

+ = + +

= +

(11.9)

donde ( )e k y ( )v k son secuencias de ruido blanco de media nula y matrices de covarianza:

( ) ( )( ) ( ) ( ) ( )( ) ( )( )

( ) ( )( ) ( ) ( ) ( ) ( )

1 2 2

22

12 2

0 0 0 0 00

0 0

0 0 0

T

v

Te

T

ve


R E e k e k

R E v k e k E e k Ev k v k e k

σ

σ

σ

= = = = = =

= = = =

(11.10)

Filtro de Kalman – Versión Predictor Las ecuaciones (11.3), (11.4) y (11.5) siguen siendo válidas para el caso particular de

que no exista correlación entre el ruido del proceso y el ruido de medición, esto es, 12 0R = . Ahora se considerará el caso más general en el cual existe correlación entre ambos ruidos, como lo indica la última expresión de (11.10).

El filtro de Kalman – versión predictor está dado por (11.3), donde la ganancia de Kalman: ( ) ( )( ) ( )( ) 1

12 2 T TK k P k C R R C P k C−

= Φ + + (11.11) minimiza la varianza del error de estimación ( ) ( ) ( )ˆx k x k x k= − : ( ) ( ) ( ) ( )( ) ( )1 21 T T TP k P k R K k R C P k C K k+ = Φ Φ + − + (11.12)



En el Apéndice D se encuentra el cálculo analítico del filtro de Kalman en la versión predictor. El mismo problema también se ha resuelto mediante un programa para entorno Matlab como se detalla a continuación:

La matriz de ganancia de Kalman se puede calcular en el workspace de Matlab mediante el programa “Kalman_pre” mediante las siguientes instrucciones: » [Kpre Ppre]=Kalman_pre Indique la covarianza del ruido de proceso R1=[0 0;0 1] Indique la covarianza del ruido de medición R2=1 Indique la covarianza entre los ruidos de medición y de proceso R12=[0;1] Indique la cantidad de pasos N = 20 La ejecución del programa asignará a la variable “Kpre” una matriz de orden Nx3, donde la primer columna es el índice temporal, necesario para el bloque “from workspace” de Simulink, mientras que la segunda y tercer columnas constituyen la ganancia de Kalman en cada instante de muestreo. También generará una matriz “Ppre” de orden Nx5, donde la primer columna también es el índice temporal y de la columna 2 a la 5 son las componentes de la matriz de covarianza . En el archivo Kalman_predictor.mdl de Simulink se encuentra el filtro de Kalman para el sistema en la versión predictor. Antes de realizar las simulaciones es necesario generar las matrices “Kpre” y “Ppre” como se explica arriba. Además, puesto que el modelo dado por (11.9) y (11.10) impone una correlación entre las perturbaciones, las mismas pueden simularse dándole al bloque de ganancia del ruido de medición un valor no nulo (por ejemplo 1) de modo que los ruidos se obtengan por combinación lineal.

Notas: Es importante notar que la dinámica del filtro de Kalman no cambia, pero si lo hacen los valores de la ganancia de Kalman como de la matriz de covarianza del error. Al realizar las simulaciones es recomendable verificar cómo la existencia de ruido en la medición hace que la velocidad de convergencia, tanto de la ganancia de Kalman como de la matriz de covarianza del error, sean más lentas. En ambos casos las matrices convergen a sus valores estacionarios en más de 15 períodos de muestreo. Obsérvense que los valores estacionarios de la matriz de covarianza ( )P k son mayores que cuando no existe ruido en la medición.

Filtro de Kalman – Versión Filtro El filtro de Kalman – versión filtro, para el caso en el que existan ruidos de medición y

de proceso correlacionados también está dado por la ecuación (11.6), donde la matriz de covarianza del error y la ganancia de Kalman están dadas respectivamente por las ecuaciones (11.7) y (11.8). Puede verse el Apéndice F para una demostración de las ecuaciones del filtro.

En el Apéndice E se encuentra el cálculo analítico del filtro de Kalman en la versión

filtro. Las matrices de ganancia de Kalman y de covarianza del error pueden calcularse en el

entorno Matlab para una cantidad de periodos de muestreo especificada, como se detalla a continuación:



La matriz de ganancia de Kalman se puede calcular en el workspace de Matlab mediante el programa “Kalman_fil” mediante las siguientes instrucciones: » [Kfil Pfil] = Kalman_fil; Indique la covarianza del ruido de proceso R1=[0 0;0 1] Indique la covarianza del ruido de medición R2=[1] Indique la covarianza entre los ruidos de medición y de proceso R12=[0;1] Indique la cantidad de pasos N = 10 La ejecución del programa asignará a la variable “Kfil” una matriz de orden Nx3, con el índice temporal (necesario para el bloque “from workspace” de Simulink) y las ganancias de Kalman. También generará una matriz “Pfil” de orden Nx5, con el índice temporal y las componentes de la matriz de covarianza. En el archivo Kalman_filtro.mdl de Simulink se encuentra implementado el filtro de Kalman para el sistema en la versión filtro. Antes de realizar las simulaciones es necesario configurar la ganancia del ruido de medición con un valor no nulo (por ejemplo 1) para que los ruidos de medición y proceso estén correlacionados y además generar las matrices de ganancia de Kalman y de la covarianza del error como se explica arriba.

Notas: Debe notarse la mejora de la versión filtro con respecto a la versión predictor. Ello se debe a que la versión filtro realiza la corrección de la predicción al utilizar la muestra actual. En la práctica esto implica un retardo de cálculo. Es interesante destacar que la covarianza de los ruidos de medición y proceso no aparecen en las ecuaciones. Ello se debe a la estructura del filtro como puede apreciarse en el Apéndice F. Además, los valores de ganancia y de covarianza del error son menores, lo que implica una mejora con respecto al predictor.

12. Control Óptimo LQG (Lineal Cuadrático Gaussiano) El control LQG combina el control LQ con el Filtro de Kalman. Se trata de un control

por realimentación de estados que minimiza la función de costo (10.2) utilizando los estados estimados por el filtro de Kalman (11.3). Así. la ley de control es:

( ) ( ) ( )ˆ | 1u k L k x k k= − − (12.1)



Esquemáticamente:

PROCESO

+q-1 C

e(k)

+ +

ΦΦΦΦ

++

v(k)

ΓΓΓΓy(k)u(k)

ESTIMADOR

+q-1 C

-+

ΦΦΦΦ

+

+

ΓΓΓΓu(k)

+

+ +

K(k)

+

ε (k)x^(k)

x(k)

y^(k)

- L(k)

REALIMENTACIÓNDE ESTADOS

x^(k)u(k)

Figura 9. Control óptimo LQG

En el archivo ControlLQG.mdl de Simulink se encuentra implementado el control por realimentación del estado estimado por el predictor de Kalman. Antes de realizar las simulaciones es necesario configurar la ganancia del ruido de medición en correspondencia con lo que se desea simular: Además deben generarse las matrices de covarianza del error “Ppre”, de ganancia de realimentación “gain” y de ganancia de Kalman “Kpre” haciendo uso de los programas que se explicaron anteriormente.

Notas: Debe notarse que la implementación del controlador LQG, como indica el teorema de

separación, hace uso de la versión predictor del filtro de Kalman y no de la versión filtro.


Gerardo Darío Mollo Página I Año 2002

Apéndice A: Estabilidad del Sistema Cuando se Utiliza un Controlador LQ

Haciendo uso del Teorema 11.4; el sistema a lazo cerrado, cuando se utiliza un controlador LQ, tiene sus polos dados por los ceros estables de la ecuación:

( ) ( )1 0H z H zρ −+ = (A.1)

Donde se satisface que 1TQ C C= y 2Q ρ= de la función de costo (10.2).

Para encontrar la representación gráfica del lugar geométrico de las raíces se hace uso

de la herramienta de Matlab RLTOOL. Esta herramienta permite obtener el lugar geométrico de las raíces de la ecuación característica de la forma ( )1 0kK s+ = , al introducir unitarios el filtro de entrada (bloque F), el modelo de la planta (bloque P) y el sensor (bloque H) y en el compensador (bloque K) los ceros y polos y donde k es la ganancia, usando además realimentación negativa. Así, llevando la expresión (A.1) a esta forma:

( )( )

( )( )

( )( )

( )( )

( )( )

( )( )

( )( )

1

2 21

2 1

2 22 1

2 2

2

4

1 10.5 0.5 0

11

1 10.251 0 011

1 1 0.251 01 1

11 0

1

z zzz

z z zzz z

z z zk k

z z

z zk

z

ρ

ρρ

ρ

−

−

−

−

+ ++ =

−−

+ ++ = ≠

−−

+ ++ = =

− −

++ =

−

Al introducir esta expresión en la herramienta RLTOOL se obtiene el siguiente lugar

geométrico de las raíces:


Gerardo Darío Mollo Página II Año 2002

-8 -7 -6 -5 -4 -3 -2 -1 0 1 2-5

-4

-3

-2

-1

0

1

2

3

4

5Lugar de las raices

Imag

Real

Ahora, considerando aquellos ceros estables de la ecuación (A.1) como lo establece el

teorema:

-1.5 -1 -0.5 0 0.5 1 1.5-1.5

-1

-0.5

0

0.5

1

1.5Lugar de las raíces para el s istma con controlador LQ

Imag

Real

ρ = 0 ρ = ∞ρ = 0

Notas: Con el fin de aclarar aún más las conclusiones expuestas al final del inciso 10

obsérvense que los polos de lazo cerrado, cuando 2Q ρ= → ∞ , son los de lazo abierto. Esto se debe a que el peso que se le ha dado a la señal de control en la función de costo es tan alto que el controlador LQ anula directamente la señal de control con el fin de minimizar la función de costo, quedando el sistema funcionando como a lazo abierto.


Gerardo Darío Mollo Página III Año 2002

Apéndice B: Sistema con Ruido en el Proceso. Filtro de Kalman – Versión Predictor

Para el filtro de Kalman – versión predictor : ( ) ( ) ( ) ( ) ( ) ( )ˆ ˆ ˆ1| | 1 | 1x k k x k k u k K k y k C x k k+ = Φ − + Γ + − − (B.1) el error de estimación ( ) ( ) ( )ˆx k x k x k= − tendrá una matriz de covarianza:

( ) ( ) ( ) ( )( ) ( )1

1 21 T T T TP k P k R P k C R C P k C C P k−

+ = Φ Φ + − Φ + Φ (B.2)

la cual es mínima para la ganancia de Kalman:

( ) ( ) ( )( ) 1

2 T TK k P k C R C P k C−

= Φ + (B.3) Ahora, para el caso propuesto:

( ) ( )( ) ( ) ( ) ( )( ) ( )( )( ) ( )( )

1 2 2

2

12

0 0 0 0 00

0 0

0

0

T

T

T


R E e k e k

R E v k e k

σ

= = = = = =

= =

(B.4)

Tomando, en general:

( ) 1

4

p pP k

p p

=

(B.5)

y fijando la condición inicial para el vector de estados:

( )

( )

10

1

1 00

0 1

Ex

P

=

=

(B.6)

Las ecuaciones utilizadas en este Apéndice fueron extraídas del libro Computer Controlled System. Theory

and Design.

Con el fin de simplificar la notación, en los coeficientes de la matriz (B.5) no se indica el subíndice temporal, pero no debe olvidarse que estos coeficientes son variables en el tiempo. Estrictamente ( ) ( ) ( )

( ) ( )1

4

p k p kP k

p k p k

=


Gerardo Darío Mollo Página IV Año 2002

se puede resolver la ecuación (B.3) para la ganancia de Kalman:

( ) [ ]

( ) [ ]

( )

11 1

4 4

11 4

14

1

1

1 1 1 11 0

0 1 0 0

1 10 0

1

p p p pK k

p p p p

p p p pK k p p

p p

p pK k

pp

−

−

=

+ + =

+ =

( )1

1

1

p pp

K kpp

+ =

(B.7)

Ahora, nótese que haciendo uso de (B.3), la expresión para la covarianza del error

(B.2) se puede escribir como: ( ) ( ) ( ) ( )

( ) [ ]

( ) ( ) ( )( )

1

1 112

4 41

21 4 4 1 1

2 24 4 1 1

1

1 1 1 0 0 0 1 011 1 00 1 1 1 0 1 1

2 0 0 110

T TP k P k R K k C P k

p p p pp pP k

p p p ppp

p p p p p p p p p pP kp p p p p p p p

σ

σ

+ = Φ Φ + − Φ

+ + = + −

+ + + + ++ = + − + +

( )

( ) ( )

( )

21 1

1 4 41 1

21 2

4 41 1

21

p p p p pp p p p p

p pP kp p p pp p p

p pσ

+ ++ + − + −

+ = + + − + −

(B.8)

En el archivo kalman_ruido en el proceso.xls de Excel se encuentran cargadas las ecuaciones halladas. En este archivo se encuentran también graficadas las componentes de la matriz de ganancia de Kalman (B.7) y de la matriz de covarianza del error (B.8), lo que permite apreciar los valores estacionarios y la velocidad de convergencia de las matrices. Es recomendable verificar el comportamiento de estas matrices para diferentes valores de varianza de ruido en el proceso.


Gerardo Darío Mollo Página V Año 2002

Apéndice C: Sistema con Ruido en el Proceso. Filtro de Kalman – Versión Filtro

Para el filtro de Kalman – versión filtro : ( ) ( ) ( ) ( ) ( ) ( ) ( )( )ˆ ˆ ˆ1| 1 | 1 1 | x k k x k k u k K k y k C x k k u k + + = Φ + Γ + + + − Φ + Γ (C.1) el error de estimación ( ) ( ) ( )ˆx k x k x k= − tendrá una matriz de covarianza:

( ) ( )

( ) ( ) ( ) ( ) ( )1

0

| 1 1| 1

| | 1 | 1 0 | 0

TP k k P k k R

P k k P k k K k C P k k P R

− = Φ − − Φ +

= − − − = (C.2)

la cual es mínima para la ganancia de Kalman: ( ) ( ) ( )( ) 1

2| 1 | 1T TK k P k k C R C P k k C−

= − + − (C.3)

Ahora suponiendo:

( ) 1

4

1| 1p p

P k kp p

− − =

(C.4)

y considerando que las (B.4) todavía son válidas, se puede resolver la primera expresión de (C.2):

( ) 12

4

1 1 1 0 0 0| 1

0 1 1 1 0p p

P k kp p σ

− = +

( ) 1 4 42

4 4

2| 1

p p p p pP k k

p p p σ+ + +

− = + + (C.5)

Haciendo uso de (C.5), la ganancia de Kalman (C.3) es:

Las ecuaciones utilizadas en este Apéndice fueron extraídas del libro: Computer Controlled System. Theory

and Design.

Con el fin de simplificar la notación, en los coeficientes de la matriz (C.4) no se indica el subíndice temporal, pero no debe olvidarse que estos coeficientes son variables en el tiempo. Estrictamente ( ) ( ) ( )

( ) ( )1

4

1| 1 1| 11| 1

1| 1 1| 1p k k p k k

P k kp k k p k k

− − − − − − = − − − −


Gerardo Darío Mollo Página VI Año 2002

( ) [ ]

( )

11 4 4 1 4 4

2 24 4 4 4

1 4

41 4

2 21 11 0

0 0

212

p p p p p p p p p pK k

p p p p p p

p p pK k

p pp p p

σ σ

− + + + + + + = + + + +

+ + = ++ +

( ) 4

1 4

1

2K k p p

p p p

= +

+ +

(C.6)

Finalmente, de (C.5), (C.6) y de la segunda expresión de (C.2), la matriz de covarianza

es:

( )

[ ]

( ) ( ) ( )

1 4 42

4 4

1 4 1 4 42

4 4 41 4

1 4 41 4 422

4 4 4 4 1 4

2|

2 21 1 02

22|

/ 2

p p p p pP k k

p p p

p p p p p p p pp p p p pp p p

p p p p pp p p p pP k k

p p p p p p p p p p

σ

σ

σ

+ + + = + +

+ + + + + − + + ++ +

+ + + + + + = − + + + + + +

( ) ( )( )

242

41 4

0 0

|0

2P k k p p

pp p p

σ

= + + − + +

(C.7)

En el archivo kalman_ruido en el proceso.xls de Excel se encuentran cargadas las ecuaciones halladas. En este archivo se encuentran también graficadas las componentes de la matriz de ganancia de Kalman (C.6) y de la matriz de covarianza del error (C.7), lo que permite apreciar los valores estacionarios y la velocidad de convergencia de las matrices.

Notas: Nótese la mejora del Filtro de Kalman en la versión filtro con respecto a la versión predictor. Los valores estacionarios son alcanzados antes y, tanto la matriz de ganancia, como la matriz de covarianza del error, tienen valores más pequeños. Ello se debe a la estructura más compleja del filtro.


Gerardo Darío Mollo Página VII Año 2002

Apéndice D: Sistema con Ruido en el Proceso y en la Medición Correlacionados. Filtro de Kalman – Versión Predictor

Para el filtro de Kalman – versión predictor : ( ) ( ) ( ) ( ) ( ) ( )ˆ ˆ ˆ1| | 1 | 1x k k x k k u k K k y k C x k k+ = Φ − + Γ + − − (D.1) el error de estimación ( ) ( ) ( )ˆx k x k x k= − tendrá una matriz de covarianza:

( ) ( ) ( ) ( )( ) ( )1 21 T T TP k P k R K k R C P k C K k+ = Φ Φ + − + (D.2)

la cual es mínima para la ganancia de Kalman:

( ) ( )( ) ( )( ) 1

12 2 T TK k P k C R C P k C R−

= Φ + + (D.3) Ahora, para el caso propuesto, las matrices de covarianza de las perturbaciones son:

( ) ( )( ) ( ) ( ) ( )( ) ( )( )

( ) ( )( ) ( ) ( ) ( ) ( )

1 2 2

22

12 2

0 0 0 0 00

0 0

0 0 0

T

v

Te

T

ve


R E e k e k


σ

σ

σ

= = = = = =

= = = =

(D.4)

Tomando, en general:

( ) 1

4

p pP k

p p

=

(D.5)

y fijando la condición inicial para el vector de estados:

( )

( )

10

1

1 00

0 1

Ex

P

=

=

(D.6)

Las ecuaciones utilizadas en este Apéndice fueron extraídas del libro Computer Controlled System. Theory

and Design.

Con el fin de simplificar la notación, en los coeficientes de la matriz (D.5) no se indica el subíndice temporal, pero no debe olvidarse que estos coeficientes son variables en el tiempo. Estrictamente ( ) ( ) ( )

( ) ( )1

4

p k p kP k

p k p k

=


Gerardo Darío Mollo Página VIII Año 2002

se puede resolver la ecuación (D.3) para la ganancia de Kalman:

( ) [ ]

( ) [ ]

11 1 2

24 4

11 2

12

01 1 1 11 0

0 1 0 0

0 10

eve

eve

p p p pK k

p p p p

p pK k p p

p

σσ

σσ

−

−

= + +

+ = + +

( )1

21

2

21

e

ve

e

p pp

K kpp

σσσ

+ + = + +

(D.7)

Haciendo uso de esta última, la covarianza del error (D.2) es:

( ) ( ) ( ) ( )( ) ( )

( )

[ ]

( )

1 2

12

4

1 1 2 2122 2

41 1

11 4 42 2

4 4 1

1

0 01 1 1 01

00 1 1 1

11 11 00

2 11

T T T

v

e vevee e

v e

P k P k R K k C P k C R K k

p pP k

p p

p p p pp p p

p p pp p

pp p p p pP k

p p p p

σ

σ σσσ σ

σ σ

+ = Φ Φ + − +

+ = +

+ − + + + ++ +

++ + + + = − + + +

( ) ( )( )( )( ) ( )

2 21

22 21

ve

ve ve

p p p p

p p p p

σ

σ σ

+ + + + +

( )

( ) ( )( )

( )( ) ( )

2 211

1 4 42 21 1

22 21 2

4 42 21 1

21

ve

e e

ve vev

e e

p p pp pp p p p p

p pP k

p p p pp p p

p p

σσ σ

σ σσ

σ σ

+ ++ + + − + −

+ + + =

+ + + + − + − + +

(D.8)

En el archivo kalman_ruido en el proceso y medición.xls de Excel se encuentran cargadas las ecuaciones halladas. En este archivo se encuentran también graficadas las componentes de la matriz de ganancia de Kalman (D.7) y de la matriz de covarianza del error (D.8), lo que permite apreciar los valores estacionarios y la velocidad de convergencia de las matrices. Es recomendable verificar el comportamiento de estas matrices para diferentes valores de covarianza.


Gerardo Darío Mollo Página IX Año 2002

Apéndice E: Sistema con Ruido en el Proceso y en la Medición Correlacionados. Filtro de Kalman – Versión Filtro

Las ecuaciones: (C.1) para el filtro de Kalman, (C.2) para la matriz de covarianza del error y (C.3) para la ganancia de Kalman siguen siendo válidas. Además, considerando (D.4) y (D.5), se puede resolver la primera expresión de (C.2):

( ) 12

4

0 01 1 1 0| 1

00 1 1 1 v

p pP k k

p p σ − = +

( ) 1 4 42

4 4

2| 1

v

p p p p pP k k

p p p σ+ + +

− = + + (E.1)

Haciendo uso de esta última, la ganancia de Kalman (C.3) es:

( ) [ ]

( )

11 4 4 1 4 42

2 24 4 4 4

1 42

41 4

2 21 11 0

0 0

212

ev v

e

p p p p p p p p p pK k

p p p p p p

p p pK k

p pp p p

σσ σ

σ

−+ + + + + + = + + + + +

+ + = ++ + +

( )1 4

21 4

42

1 4

22

2

e

e

p p pp p p

K kp p

p p p

σ

σ

+ + + + + =

+ + + +

(E.2)

Finalmente, la matriz de covarianza de la segunda expresión de (C.2) es:

( )

[ ]

( )( ) ( )( )

( )( ) ( )

1 4 42

4 4

1 4 41 422

4 441 4

21 4 1 4 41 4 4

2 2 24 4 1 4 1 4 4 4

2|

221 1 02

|

2 22 12 2

v

ve

v e

p p p p pP k k

p p p

p p p p pp p pp p pp pp p p

P k k

p p p p p p p pp p p p pp p p p p p p p p p p p p

σ

σσ

σ σ

+ + + = + +

+ + ++ + − + +++ + +

=

+ + + + ++ + + − + + + + + + + + +


Gerardo Darío Mollo Página X Año 2002

( )

( ) ( ) ( )( )

( ) ( )( ) ( ) ( )

21 4 1 4 4

1 4 42 21 4 1 4

21 4 4 42

4 42 21 4 1 4

2 22

2 2|

22 2

e e

ve e

p p p p p p p pp p p p p

p p p p p pP k k

p p p p p p pp p p

p p p p p p

σ σ

σσ σ

+ + + + ++ + − + −

+ + + + + + = + + + + + − + − + + + + + +

(E.3)

En el archivo kalman_ruido en el proceso y medición.xls de Excel se encuentran cargadas las ecuaciones halladas. En este archivo se encuentran también graficadas las componentes de la matriz de ganancia de Kalman (C.6) y de la matriz de covarianza del error (C.7), lo que permite apreciar los valores estacionarios y la velocidad de convergencia de las matrices.

Notas: Nótese que la estructura del filtro de Kalman – versión filtro es la que produce una menor covarianza del error que la versión predictor bajo las mismas condiciones de perturbaciones. En este caso, también existe una mejora del Filtro de Kalman en la versión filtro, con respecto a la versión predictor. Los valores estacionarios son alcanzados antes y, tanto la matriz de ganancia, como la matriz de covarianza del error, tienen valores más pequeños. Ello se debe a la estructura más compleja del filtro.


Gerardo Darío Mollo Página XI Año 2002

Apéndice F: Demostración de las Ecuaciones del Filtro de Kalman – Versión Filtro.

Sea el proceso:

( ) ( ) ( ) ( )

( ) [ ] ( ) ( )

1 1 0.5 01

0 1 1 1

1 0

x k x k u k v k

y k x k e k

+ = + +

= +

(F.1)

donde el estado inicial ( )0x tiene una distribución gaussiana con ( ) 00Ex m= y

( )( ) 0cov 0x R= . Además, ( )e k y ( )v k son secuencias de ruido blanco discretos gaussianos de media nula y matrices de covarianza:

( ) ( )( ) ( ) ( ) ( )( ) ( )( )

( ) ( )( ) ( ) ( ) ( ) ( )

1 2 2

22

12 2

0 0 0 0 00

0 0

0 0 0

T

v

Te

T

ve


R E e k e k


σ

σ

σ

= = = = = =

= = = =

(F.2)

El filtro de Kalman – Versión Filtro, estima los estados a partir de la medición de la

entrada y salida del sistema mediante la dinámica dada por: ( ) ( ) ( ) ( ) ( ) ( ) ( )( )ˆ ˆ ˆ1| 1 | 1 1 | x k k x k k u k K k y k C x k k u k + + = Φ + Γ + + + − Φ + Γ (F.3)

El error de estimación ( ) ( ) ( )ˆ |x k x k x k k= − satisface la dinámica:

( )

( ) ( )

( ) ( )

1 1 1/ 1

1 / 1 1 /

1 / 1 1 1 /

1 1 1 1 /

1 1

ˆ

ˆ ˆ

ˆ ˆ

ˆ

k k k k

k k k k k k k k k k k k

k k k k k k k k k k k k k

k k k k k k k k k k k k

k k k k k

x x x

x x u v x u K y C x u

x x x u u v K y K C x u

x x v K C x u v e K C x u

x x v K C x

+ + + +

+ + +

+ + + +

+ + + +

+ +

= −

= Φ + Γ + − Φ − Γ − − Φ + Γ

= Φ − + Γ − Γ + − + Φ + Γ

= Φ + − Φ + Γ + + + Φ + Γ

= Φ + − Φ −

( )

1 1 1 1 1 / 1

1 1 / 1 1 1 1 1

ˆ

ˆ

k k k k k k k k k k k

k k k k k k k k k k k k k k k

K C u K Cv K e K C x K C u

x x K C x x v K Cv K e K C u K C u

+ + + + + +

+ + + + + + +

Γ − − + Φ + Γ

= Φ − Φ − + − − + Γ − Γ


Gerardo Darío Mollo Página XII Año 2002

( ) ( )1 1 1 1 1k k k k k k kx K C x I K C v K e+ + + + += Φ − Φ + − −

Con el fin de simplificar la nomenclatura, esta última ecuación se escribe como:

1

1 1 1

1

k

k k k k k

k

X K Cx Xx Yv Ze Y I K C

Z K

+

+ + +

+

= Φ − Φ= + + ⇒ = −

= − (F.4)

El filtro de Kalman minimiza la varianza del error de estimación:

( ) ( ) ( )( ) ( ) ( )( )|

TP k k E x k Ex k x k Ex k= − − (F.5)

Ahora, si 0/ 0 0ˆEx m= , entonces el error de estimación tendrá un valor esperado nulo,

esto es, 0, 0kEx k= ∀ ≥ sin importar Kk, por lo que de (F.5) y (F.4) se tiene:

( )( )

( ) ( ) ( )( ) ( ) ( )( ) ( ) ( )

1/ 1 1 1 1 1

1/ 1 1

1

1 1 1 1

T T T T T T Tk k k k k k k k k k

T T T T T Tk k k k k k k k

T T T T T Tk k k k k k

T T T T T Tk k k k k k

P Ex x E Xx Yv Ze x X v Y e Z

P E Xx x X E Xx v Y E Xx e Z

E Yv x X E Yv v Y E Yv e Z

E Ze x X E Ze v Y E Ze e Z

+ + + + + +

+ + +

+

+ + + +

= = + + + +

= + +

+ + +

+ + +

Dadas las propiedades de los ruidos y la dinámica del proceso (F.1), ( )v k no está

correlacionado con ( )x k ni con ( )1e k + , por lo que se anulan el segundo, cuarto, sexto y

octavo términos. Tampoco se correlacionan ( )1e k + con ( )x k anulándose los términos tercero y séptimo. Así la última expresión se reduce a:

1/ 1 / 1 2

T T Tk k k kP XP X YR Y ZR Z+ + = + +

Sustituyendo las (F.4) y distribuyendo:

( ) ( ) ( ) ( )1/ 1 1 / 1 1 1 1 1 2 1

1/ 1 / / 1 1 / 1 / 1

1 1 1 1 1 1 1 1 1 2 1

T T Tk k k k k k k k k k

T T T T T T T Tk k k k k k k k k k k k k k

T T T T Tk k k k k k

P K C P K C I K C R I K C K R K

P P P C K K C P K C P C KR R C K K CR K CR C K K R K

+ + + + + + + +

+ + + + + +

+ + + + + +

= Φ − Φ Φ − Φ + − − +

= Φ Φ − Φ Φ − Φ Φ + Φ Φ

+ − − + +

( ) ( )

( )1/ 1 / 1 1 / 1 / 1 1

1 / 1 2 1

T T T T T Tk k k k k k k k k k

T T T Tk k k k

P P R K C P CR P C R C K

K C P C CR C R K

+ + + +

+ +

= Φ Φ + − Φ Φ + − Φ Φ +

+ Φ Φ + + (F.6)


Gerardo Darío Mollo Página XIII Año 2002

Ahora debe hallarse la matriz ( )1K k + que minimiza esta última expresión. Para

evitar la derivada con respecto a la matriz ( )1K k + , se propone:

( ) ( )01 1K k K k ε+ = + + Ψ

donde ( )0 1K k + es la matriz óptima buscada (que minimiza (F.6)), ε es un escalar y Ψ es una matriz arbitraria. Luego, se evalúa:

1/ 1

0

0k kP

εε+ +

=

∂ =∂

para hallar la matriz ( )1K k + que minimiza la covarianza del error dada por (F.6). Así:

( ) ( )( ) ( )

( ) ( )

( ) ( )

1/ 1/ 1 / 1

0

/ 1 2 1 1 / 1 2

1/ 1/ 1 / 1 2 1

0

/ 1 1 / 1 2

0

T T T T Tk kk k k k

T T T T T T T Tk k k k k k

T T T T Tk kk k k k k

T T T T T Tk k k k k

P C P CR P C R C

C P C CR C R K K C P C CR C R

P C P CR C P C CR C R K

P C R C K C P C CR C R

ε

ε

ε

ε

+ +

=

+ +

+ ++

=

+

∂ = −Ψ Φ Φ + − Φ Φ + Ψ∂

+Ψ Φ Φ + + + Φ Φ + + Ψ =

∂ = Ψ − Φ Φ + + Φ Φ + + ∂

+ − Φ Φ + + Φ Φ + + 0T Ψ =

La última expresión se ha agrupado en dos términos. Obsérvese que uno es el transpuesto del otro, por lo que igualando a cero uno de ellos, el otro también se anulará. Así, igualando a cero el último término:

( ) ( )/ 1 1 / 1 2 0T T T T T T Tk k k k kP C R C K C P C CR C R+

− Φ Φ + + Φ Φ + + Ψ =

( )( ) 1

1 / 1 / 1 2T T T T T T

k k k k kK P C R C C P C CR C R−

+ = Φ Φ + Φ Φ + + (F.7)

Al sustituir (F.7) en el último término de (F.6) se ve claramente que los dos últimos términos se cancelan, quedando la matriz de covarianza mínima: ( )1/ 1 / 1 1 / 1

T Tk k k k k k kP P R K C P CR+ + += Φ Φ + − Φ Φ + (F.8)

Nótese que las ecuaciones (F.7) y (F.8) son coincidentes con las (11.7) y (11.8) cuando

se sustituye la primera expresión de (11.7) en las restantes.

pr icticas sobre control del integrador doble

Documents