not as control

Analisis de Sistemas de Control

Nicanor Quijano

c© Borrador Editado 30 de abril de 2010

Indice general

Contenido I

Prefacio 1

1. Introduccion 3

1.1. Que es Retroalimentacion? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.2. Que es Control? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.3. Historia del Control Automatico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.3.1. Inicios del Control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.3.2. Perıodo Pre-Clasico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.3.3. Perıodo Clasico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.3.4. Control Moderno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.4. Ejemplos de Sistemas de Control Retroalimentado y Future Directions . . . . . . . . . . . . . 8

2. Modelamiento de Sistemas 9

2.1. Filosofıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.2. Principios de Modelamiento Matematico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.2.1. Esquema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.2.2. Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.3. Sistemas de Primer Orden y Controlador ON-OFF . . . . . . . . . . . . . . . . . . . . . . . . 15

2.4. Transformada de Laplace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2.4.1. Transformada Unilateral de Laplace . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2.4.2. Propiedades de la Transformada de Laplace . . . . . . . . . . . . . . . . . . . . . . . 19

2.4.3. Solucion de ODEs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

2.5. Funciones de Transferencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

2.6. Linealizacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

2.7. Diagramas en Bloques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

2.7.1. Combinacion en Serie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

2.7.2. Combinacion en Paralelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

2.7.3. Puntos de Partida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

2.7.4. Bloques con Sumadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

i

ii INDICE GENERAL

2.7.5. Sistemas Retroalimentados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

2.7.6. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

2.8. Ley de Mason . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

3. Caracterısticas de los Sistemas 37

3.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

3.2. Senal de Error . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

3.3. Sensitividad de Sistemas de Control para Variaciones de Parametros . . . . . . . . . . . . . . 38

4. Respuesta de los Sistemas 41

4.1. Sistemas de Primer Orden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

4.1.1. Entrada paso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

4.1.2. Entrada rampa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

4.2. Sistemas de Segundo Orden . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

4.2.1. Respuesta a Entrada Paso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

4.2.2. Caracterısticas Temporales del Sistema Subamortiguado . . . . . . . . . . . . . . . . . 48

4.3. Sistemas de Orden Superior . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

4.4. Ubicacion de las Raıces en el Plano-s y la Respuesta Transitoria . . . . . . . . . . . . . . . . 55

5. Estabilidad de los Sistemas 57

5.1. Criterio de Estabilidad Routh-Hurwitz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

5.1.1. Robustez y Estabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

6. Sistemas de Control Retroalimentado 65

6.1. Analisis de Error . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

6.2. Controladores PID . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

6.2.1. Controlador Proporcional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

6.2.2. Controlador Proporcional e Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

6.2.3. Controlador Proporcional, Integral, y Derivativo . . . . . . . . . . . . . . . . . . . . . 68

6.2.4. Controlador Proporcional y Derivativo . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

6.2.5. Implementacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

6.2.6. Sintetizando . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

6.3. Sintonizacion de Controladores PID . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

6.3.1. Sintonizacion de Controladores PID: Metodo Manual . . . . . . . . . . . . . . . . . . . 70

6.3.2. Sintonizacion de Controladores PID: Ziegler/Nichols . . . . . . . . . . . . . . . . . . . 71

6.3.3. Sintonizacion de Controladores PID: Cohen y Coon . . . . . . . . . . . . . . . . . . . 73

6.3.4. Sintonizacion de Controladores PID: Metodo del Coeficiente de Ajustabilidad . . . . . 73

6.3.5. Sintonizacion de Controladores PID: Internal Model Control (IMC) . . . . . . . . . . 73

6.3.6. Sintonizacion de Controladores PID: Sıntesis Directa . . . . . . . . . . . . . . . . . . . 73

6.4. Algoritmos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

INDICE GENERAL iii

6.5. PID Digital . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

6.6. Criterios de Desempeno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

6.7. Diseno con Pole Placement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

7. Variables de Estado: Introduccion 81

7.1. Definicion de Variables de Estado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

7.1.1. Definiciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

7.1.2. ODEs Lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

7.2. Representacion y Solucion de Variables de Estado . . . . . . . . . . . . . . . . . . . . . . . . . 84

7.2.1. Representacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

7.2.2. Solucion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

7.3. Funciones de Transferencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

7.4. Formas Canonicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

7.4.1. First Companion Form: Forma Canonica Controlable . . . . . . . . . . . . . . . . . . . 93

7.4.2. Second Companion Form: Forma Canonica Observable . . . . . . . . . . . . . . . . . . 94

7.4.3. Jordan Form . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

7.5. Equilibrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

7.6. Estabilidad y Acotamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

7.6.1. Conceptos Locales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

7.6.2. Conceptos Globales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

8. Variables de Estado: Diseno 105

8.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

8.2. Transformacion de las Variables de Estado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

8.3. Diseno de Controladores Utilizando State Feedback . . . . . . . . . . . . . . . . . . . . . . . . 109

8.4. Diseno de Estimadores en el Espacio de Estado . . . . . . . . . . . . . . . . . . . . . . . . . . 114

8.5. Integrated Full-State Feedback and Observer . . . . . . . . . . . . . . . . . . . . . . . . . . . 116

9. Control Multivariable 119

9.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

9.2. Analisis de los Sistemas Multivariables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

9.2.1. Representacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

9.2.2. Modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120

9.2.3. Problemas de Interaccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

9.2.4. Relative Gain Array . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

9.2.5. Seleccion de Lazos Utilizando RGA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

9.3. Control Multivariable Desacoplado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125

iv INDICE GENERAL

Indice de figuras

1.1. Sistemas de malla abierta a), y de lazo cerrado b). . . . . . . . . . . . . . . . . . . . . . . . . 4

1.2. Componentes de un sistema de control asistido por computador [32]. . . . . . . . . . . . . . . 5

2.1. Primeros pasos en el diseno de un sistema de control [27]. . . . . . . . . . . . . . . . . . . . . 9

2.2. Otra metodologıa en el modelamiento de procesos [27]. . . . . . . . . . . . . . . . . . . . . . . 10

2.3. Tanque de flujo continuo perfectamente agitado. . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.4. Respuesta a entrada paso de un sistema de primer orden. . . . . . . . . . . . . . . . . . . . . 15

2.5. Sistema termico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2.6. Ejemplo de un sistema de control on-off. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2.7. Transformadas tıpicas de Laplace [31] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.8. Sistema Masa-Resorte-Amortiguador [7] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.9. Representacion del sistema en el plano-s [7] . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

2.10. Representacion del sistema en el plano-s [7]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2.11. Representacion como varıa ζ en el plano-s cuando ωn se mantiene constante [7]. . . . . . . . 28

2.12. Respuesta en tiempo del sistema masa-resorte-amortiguador [7] . . . . . . . . . . . . . . . . . 28

2.13. Sistema masa-resorte-amortiguador [7] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

2.14. Representacion del sistema en terminos de la variable desviacion [31] . . . . . . . . . . . . . . 30

2.15. Algunas reglas utiles cuando se manejan diagramas en bloques [31, 22]. . . . . . . . . . . . . 33

2.16. Combinacion Serie [7]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

2.17. Ejemplo de puntos de partida [7]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

2.18. Ejemplo de puntos de partida [7]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

2.19. Ejemplo del algebra de bloques [7]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

2.20. Ejemplo del algebra de bloques [7]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

2.21. Ejemplo del algebra de bloques para sistemas retroalimentados [7]. . . . . . . . . . . . . . . . 35

4.1. Diversos tipos de entradas comunes en el analisis de sistemas de control. . . . . . . . . . . . . 42

4.2. Respuesta a entrada paso del sistema de primer orden (4.1) cuando K = 1, y τ = 10. La lıneapunteada roja representa el valor final cuando se ha cumplido el primer τ , mientras que lapunteada negra representa el valor final cuando se han cumplido 2τ . . . . . . . . . . . . . . . 43

4.3. Respuesta a entrada rampa del sistema de primer orden (4.1) cuando K = 1, y τ = 10 parael panel superior, y τ = 1 para el panel inferior. . . . . . . . . . . . . . . . . . . . . . . . . . . 44

v

vi INDICE DE FIGURAS

4.4. Sistema de segundo orden [7]. En a) se tiene el grafo, mientras que en b) el diagrama en bloques. 44

4.5. Respuesta a entrada paso del sistema de segundo orden descrito por (4.3). En este caso, setiene que ζ = 0 para el panel superior izquierdo, ζ = 0,2 para el panel superior derecho,ζ = 0,4 para el panel inferior izquierdo, y ζ = 0,8 para el panel inferior derecho. En todos loscasos, wn = 24. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

4.6. Respuesta a entrada paso del sistema de segundo orden descrito por (4.3) cuando ζ = 1 ywn = 24. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

4.7. Respuesta a entrada paso del sistema de segundo orden descrito por (4.3) cuando ζ = 2 ywn = 24. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

4.8. Ubicacion de los polos en el plano-s [7]. Para este caso β = θ, σ = ζwn, y wd = wn

√

1− ζ2. . 49

4.9. Curvas envolventes para la respuesta a entrada paso del sistema de segundo orden [22]. . . . . 50

4.10. Respuesta a entrada paso del sistema de segundo orden descrito por (4.7). En este caso,K1 = 1, wn = 23,53, and ζ = 0,46. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

4.11. Relacion entre MP y ζ. Ademas, se incluye la relacion entre wntp y el factor de amortigua-miento [7]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

4.12. Diagrama en bloques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

4.13. Respuesta a entrada paso del sistema de segundo orden disenado para obtener los parametrosMP y tp definidos en el ejercicio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

4.14. Ubicacion de polos de un sistema de tercer orden en el plano-s [7]. . . . . . . . . . . . . . . . 53

4.15. a) Porcentaje de overshoot como funcion de ζ y ωn cuando un sistema de segundo orden poseeun cero. b) Respuesta a entrada paso para diversos valores de a/(ζωn). A=5, B=2, C=1,D=0.5, cuando ζ = 0,45 [7]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

4.16. Ubicacion de los polos y ceros en el plano-s para un sistema de tercer orden [7]. . . . . . . . . 55

4.17. Respuesta a entrada paso para un sistema de tercer orden con un cero. Si se desprecia el polo(-), el overshoot es mayor, pero su ts es menor. Si no se desprecia (–), se tiene que el overshootdisminuye, haciendo que el tiempo de establecimiento aumente. . . . . . . . . . . . . . . . . . 55

4.18. Respuesta impulso para varias ubicaciones de las raıces en el plano-s. El complejo conjugadono se muestra [7]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

5.1. Sistema retroalimentado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

5.2. Disenar Kc para que el sistema sea estable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

5.3. Sistema con tiempo muerto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

6.1. Sistema de control tıpico. La referencia o el set point viene siendo R(s), mientras que lavariable controlada es C(s). La perturbacion es D(s). . . . . . . . . . . . . . . . . . . . . . . . 66

6.2. Sistema retroalimentado. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

6.3. Proceso de tomar una senal continua y(t) que es generada por el proceso, y convertirla en unasecuencia de numeros y[n]. El computador toma una decision y la convierte en otra secuenciade numeros u[n], los cuales se convierten luego en una senal continua u(t) que actua sobre elproceso. Figura adaptada de [2]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

6.4. Figura adaptada de [2]), la cual muestra el efecto de aliasing utilizando dos diferentes senalesx1(t) = sin(2πf1t) (punteada) and x2(t) = − sin(2πf2t) (solida), con sus respectivas frecuen-cias (f1 = 0,1 Hz, f2 = 0,9 Hz, y fs = 1 Hz). Este es un excelente ejemplo de como el aliasingpuede afectar la reconstruccion perfecta de las senales . . . . . . . . . . . . . . . . . . . . . . 78

INDICE DE FIGURAS vii

7.1. Modelo mecanico que corresponde a una masa, sujetada por un amortiguador y un resorte.La posicion esta dada por y, y se le aplica una fuerza inicial f0. . . . . . . . . . . . . . . . . . 83

7.2. Modelo en Simulink que corresponde a la Figura 7.1. . . . . . . . . . . . . . . . . . . . . . . . 84

7.3. Simulacion en Simulink del sistema descrito en la Figura 7.1. Para este caso se utilizaron losparametros f0 = 5N, M = 2kg, k = 16N/m, y cuatro valores para b. En la parte superiorizquierda, se tiene b = 2N.s/m; en la parte superior derecha, se tiene b = 4N.s/m; en la parteinferior izquierda, se tiene b = 8N.s/m; y en la parte inferior derecha, se tiene b = 16N.s/m.En todos los casos se tiene que posicion esta dada por la lınea (-), mientras que la velocidades la lınea punteada (- -). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

7.4. Simulacion en Simulink del sistema descrito en la Figura 7.1, cuando unicamente se aplica unafuerza f0 durante un determinado tiempo. Para este caso se utilizaron los parametros f0 = 5N,M = 2kg, k = 16N/m, y b = 2N.s/m. La posicion esta dada por la lınea (-), mientras que lavelocidad es la lınea punteada (- -). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

7.5. Diagrama en bloques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

7.6. Representacion en diagramas en bloques de la Ecuacion (7.22). Figura tomada de [12]. . . . 93

7.7. Representacion en diagramas en bloques de la Ecuacion (7.23). Figura tomada de [12]. . . . . 94

7.8. Representacion en diagramas en bloques de la forma canonica controlable. Figura tomada de[12]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

7.9. Representacion en diagramas en bloques de la forma canonica de Jordan cuando las raıces sondiferentes. Figura tomada de [12]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

7.10. Representacion en diagramas en bloques de la forma canonica de Jordan cuando las raıces sonrepetidas. Figura tomada de [12]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

7.11. SISL de un punto de equilibrio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

7.12. ES de un punto de equilibrio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

7.13. UUB. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

8.1. Diagrama en bloques para (8.1). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

8.2. Realimentacion de estado por medio de una ganancia K. . . . . . . . . . . . . . . . . . . . . . 109

8.3. Comportamiento de la definicion de controlabilidad en R3. . . . . . . . . . . . . . . . . . . . . 110

8.4. Realimentacion de estado con referencia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

8.5. Realimentacion de estado por medio de una ganancia K. . . . . . . . . . . . . . . . . . . . . . 114

8.6. Observador asociado con la planta. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

8.7. Observador asociado con la planta. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

viii INDICE DE FIGURAS

Indice de Tablas

6.1. Valores de los parametros de los controladores para el metodo de malla cerrada. . . . . . . . . 71

6.2. Valores de los parametros de los controladores para el metodo de malla abierta. . . . . . . . . 72

6.3. Valores de los parametros de los controladores para el metodo de Cohen y Coon. . . . . . . . 73

6.4. Valores de los parametros de los controladores para el metodo del coeficiente de ajustabilidad . 73

ix

x INDICE DE TABLAS

Prefacio

Estas notas de clase son para uso exclusivo de la clase. Este es un primer borrador, el cual contienemuchos errores de toda ındole. En muchos casos no le doy el credito correspondiente a algunos resultados.Sin embargo, una falta de referencia no significa que los resultados sean del todo originales. En efecto, todoslos resultados presentados en estas notas han sido tomados de libros y artıculos que no necesariamente sonmıos (a excepcion de algunos ejemplos).

1

2 INDICE DE TABLAS

Capıtulo 1

Introduccion

Whenever you feel like criticizing any one,-he told me,- just remember that all the people in the worldhaven’t had the advantages that you’ve had.

The Great Gatsby, F.S. Fitzgerald

El curso de sistemas de control se basa en un principio basico: retroalimentacion1. En esta primera entregase brindan las definiciones necesarias para entender un sistema de control retroalimentado, ademas de unahistoria breve del control automatico y el futuro del area. Las siguientes notas han sido adaptadas a partirde varios textos de control (e.g., [32], [12], [3], and [21]).

1.1. Que es Retroalimentacion?

El termino retroalimentacion se utiliza para referirse a una situacion en la cual uno tiene dos (o mas)sistemas dinamicos2 interconectados de tal forma que cada sistema influye al otro y a sus dinamicas. Estetermino fue originalmente un neologismo introducido en los anos 1920s por parte de los ingenieros electronicos(con enfasis en sistemas radiales) para describir los efectos que se producen cuando la senal amplificada desalida afecta los circuitos de entrada.

En la vida diaria se pueden encontrar varios ejemplos. Gracias al mecanismo de retroalimentacion, unmamıfero puede mantener la temperatura corporal constante (dentro de un rango) independientemente delos cambios de la temperatura ambiente. Otro ejemplo en el ambito de la ingenierıa lo encontramos en laparte aeronautica. Un avion puede mantener su altitud y velocidad (ademas de aterrizar) sin que el pilotointervenga. El mecanismo basico en este caso es nuevamente retroalimentacion.

Graficamente, la Figura 1.1 ilustra en forma de diagrama de bloques el concepto principal detras de unsistema retroalimentado. Normalmente, se utilizan los terminos de malla abierta y lazo cerrado3. Un sistemase dice que es de lazo cerrado si los sistemas estan interconectados en forma cıclica, tal como lo muestra laFigura 1.1b). Si la interconexion se rompe, entonces estamos hablando de sistemas en malla abierta como lomuestra la Figura 1.1a).

La retroalimentacion tiene muchas propiedades interesantes. Por ejemplo, la retroalimentacion permiteque un sistema se vuelva menos sensible a perturbaciones externas, a las variaciones de los elementos quecomponen los equipos, o tambien puede servir para crear un comportamiento lineal a partir de un sistema nolineal (practica muy utilizada en componentes electronicos). Sin embargo, si la retroalimentacion se empleade forma incorrecta, se pueden generar inestabilidades en el sistema. Por ejemplo, un ruido indeseado de

1En ingles se conoce como feedback. El diccionario Merriam Webster define el termino como: “The return to the input of apart of the output of a machine, system, or process (as for producing changes in an electronic circuit that improve performanceor in an automatic control device that provide self-corrective action) [1920]”

2Un sistema cuyo comportamiento cambia con el tiempo debido a una respuesta o a un estımulo externo es un sistemadinamico.

3En ingles, los terminos utilizados son open loop y closed loop, respectivamente

3

4 CAPITULO 1. INTRODUCCION

Sistema 1 Sistema 2

a) Sistema de malla abierta

Sistema 1 Sistema 2

b) Sistema de lazo cerrado

Figura 1.1: Sistemas de malla abierta a), y de lazo cerrado b).

un sensor serıa amplificado por la retroalimentacion, por lo que se necesitarıa un filtro que responda a estetipo de detalles. Otro problema cuando se tiene un sistema retroalimentado mal implementado es el hechode inestabilidad. Uno de los casos mas comunes son los efectos de la realimentacion positiva cuando laamplificacion de un microfono es demasiado alta dentro de un salon. Este es un ejemplo de inestabilidaddebida a la retroalimentacion, lo cual por supuesto, se quiere evitar, aunque no es sencillo. Esta es larazon fundamental por la que la mayor parte del estudio de los sistemas retroalimentados esta dedicada alentendimiento de las dinamicas y las tecnicas de diseno de sistemas dinamicos y su control.

1.2. Que es Control?

La real academia de la lengua define control como: Comprobacion, inspeccion, fiscalizacion, interven-cion; Dominio, mando, preponderancia; Oficina, despacho, dependencia, etc., donde se controla; Regulacion,manual o automatica, sobre un sistema; Dispositivo que regula a distancia el funcionamiento de un aparato,mecanismo o sistema. Si bien el termino tiene muchas definiciones, control se definira como sigue.

Definition 1 Control es un dispositivo que por medio del uso de algoritmos y retroalimentacion regula elfuncionamiento de un sistema.

Ası pues, se puede decir que control incluye ejemplos tales como controladores de “set point” en procesosquımicos, “fly-by-wire” en sistemas aeronauticos, ademas de protocolos para el control de trafico en laInternet. En la actualidad, las aplicaciones que estan emergiendo entre otras incluyen vehıculos y robotsautonomos y sistemas bioinspirados. El area de control es esencialmente una ciencia que incluye informacionde tipo analogo y digital.

La idea basica en un controlador moderno es sensar lo que esta sucediendo en el sistema, compararel comportamiento de este con el objetivo inicial, corregir aquello que no este saliendo bien, y enviar estainformacion para que el sistema actue. Es decir, es un sistema retroalimentado donde se sensa, se computa,y se actua para obtener el cambio deseado. El punto clave en este caso es disenar un controlador queasegure que las dinamicas del sistema en malla cerrada sean estables y que el resultado final sea siempreel deseado. Para ello se necesitan tecnicas de modelaje y analisis para capturar los elementos fısicos parapoder describir de manera adecuada el comportamiento de un sistema, para poderlo hacer robusto cuandose tienen perturbaciones, ruido, y otras fallas debido a los componentes.

La figura 1.2 muestra un ejemplo de este tipo de sistemas. En ella se pueden observar los elementosnecesarios para sensar, computar, y actuar. En los sistemas de control moderno, el uso de computadoreses esencial, con lo cual se requieren components tales como conversores analogos y digitales (ADC y DACsegun sus siglas en ingles). Las perturbaciones que entran al sistema se modelan de varias formas (e.g., ruido,

1.3. HISTORIA DEL CONTROL AUTOMATICO 5

perturbaciones en el sistema). El algoritmo de control tiene que ser lo suficientemente robusto para poderresponder rapida y adecuadamente a este tipo de incertidumbres. Este algoritmo se conoce generalmentecomo ley de control. Para poder disenar de manera adecuada el controlador, por lo general es necesario tenerun buen modelo del sistema que se quiere controlar.

Figura 1.2: Componentes de un sistema de control asistido por computador [32].

1.3. Historia del Control Automatico

Por mas de 2000 anos se han utilizado sistemas retroalimentados de control. Dentro de los primerosejemplos se tienen los relojes de agua descritos por Vitruvius y que se le atribuyen a Tesibios (circa 270 B.C.).Cerca de trescientos anos despues, Heron de Alejandrıa describıa un tipo de automato el cual empleaba unmecanismo de retroalimentacion. La historia del control automatico se divide en cuatro perıodos:

Inicios del Control: Hasta 1900.

Perıodo del control pre-clasico: 1900-1940.

Perıodo del control clasico: 1935-1960.

Perıodo del control moderno: 1955 en adelante.

1.3.1. Inicios del Control

Hacia el final del renacimiento se descubrieron en occidente las ingeniosas ideas de sistemas de controldel perıodo helenico, las cuales habıan sido preservadas por la cultura islamica. A partir de ese momento,nuevos inventos comenzaron a aparecer durante el siglo XVIII. Uno de los primeros ejemplos es el controlde temperatura en incubadoras (utilizando dispositivos automaticos) propuesto por Rene-Antoine Ferchaultde Reamur. Durante el siglo XIX se inventaron varios dispositivos termostaticos, los cuales tenıan comocaracterıstica el hecho de que la potencia para operar el actuador era extraıda del sistema de medida.

El mas importante desarrollo de control durante el siglo XVIII fue la maquina de vapor. En 1788Matthew Boulton le describio a su socio James Watt el mecanismo (flyball governor) que le permitio a esteultimo controlar la velocidad de la maquina de vapor y reducir las variaciones de carga. El primer diseno serealizo en Noviembre de 1788, y el controlador se utilizo por primera vez en 1789. Este sistema tiene variosproblemas: tiene un controlador proporcional que proporciona un unico punto de operacion; solo puede


funcionar a velocidades bajas; se necesita un mantenimiento permanente. Sin embargo, este fue uno de losavances mas importantes durante la revolucion industrial.

Mejoras a este sistema se realizaron durante los primeros setenta anos del siglo XIX, dentro de loscuales se podrıan rescatar aquellas patentadas por Siemens (1846; 1853), Porter (1858), y otros. En 1868Maxwell publico el paper “On Governors”, el cual describıa un modelo matematico utilizando ecuacionesdiferenciales para controlar la turbina de vapor, y empezo a analizar la estabilidad del sistema. Por primeravez se determino que la estabilidad estaba dada por la ubicacion de los polos de la ecuacion caracterıstica.Maxwell determino condiciones suficientes y necesarias para ecuaciones hasta de cuarto orden. En su epocasu trabajo no fue tan valorado como lo fue en el siglo XX.

El trabajo que realizo Maxwell fue retomado por Routh, el cual publico los primeros resultados en1874. En 1877, Routh produce un tratado sobre “Stability of Motion.en el cual expone los principios deestabilidad de lo que hoy se conoce como el criterio de estabilidad Routh-Hurwitz (su trabajo tomaba ideasde Cauchy y Sturm, y en 1895 Hurwitz es el que deriva la misma idea independientemente).

La mayorıa de los inventos de la epoca tenıan que ver con control y estabilidad de temperatura,presion, nivel, y velocidad de rotacion de maquinas. Luego las aplicaciones comenzaron a realizarse en laparte naval con la aparicion de barcos navales y armas de guerra. Una de los primeros motores dirigidos ycontroles de posicion en malla cerrada fueron disenados por Farcot en 1866, el cual sugirio por primera vezel nombre de “servo-moteur.”

El desarrollo de la electricidad y su mejor comprension, permitieron que se crearan mas aplicacionesen el area de control (se tenıan mas mecanismos para sensar y manipular senales, y por ende para crearactuadores).

1.3.2. Perıodo Pre-Clasico

Las aplicaciones que se vieron en los primeros anos del siglo XX eran de todo tipo (e.g., control devoltage, corriente, regulacion de frecuencia, control de velocidad de motores electricos, control de tempera-tura, presion, y procesos industriales). Sin embargo, todos estos dispositivos que se disenaron no poseıan untotal entendimiento de las dinamicas, lo cual genero problemas. La unica herramienta teorica que se tenıaera el analisis de estabilidad de Routh-Hurwitz, el cual implica conocer todos los parametros del sistema,ademas de no proveer herramientas para entender el grado de estabilidad.

En 1922, Nicholas Minorsky presento por primera vez un analisis de control de posicion, y formulo loque hoy se conoce como un controlador PID. Su analisis partio del estudio de como un capitan controlabala posicion de su barco. Sin embargo, su trabajo carecıa de herramientas a ser aplicadas.

Por la misma epoca, Harlod Black comenzo a estudiar el incremento de ancho de banda en las lıneas detransmision telefonica, para que no hubiese tantas perdidas y distorsion. El fue el primero en crear un circuitocon retroalimentacion negativa. Su colaborador inmediato fue Harry Nyquist, cuyo paper “RegenerationTheory”publicado en 1932 formula las bases del analisis que lleva su nombre. Este es uno de los papers masimportantes, ya que permite entender los beneficios de la retroalimentacion negativa, y provee herramientaspara el analisis y diseno de sistemas de control sin que se requiriesen ecuaciones diferenciales (la sola respuestaen frecuencia, combinada con los datos calculados permitıan establecer el grado de estabilidad del sistema,y tambien ayudaba a estimar los cambios necesarios para mejorar el desempeno).

Uno de los trabajos que se hicieron a la par del de Black, fue el de Clesson Mason en Foxboro. Masonutilizo retroalimentacion negativa, e hizo que por primera vez en 1928 una companıa tuviese controladorescon amplificacion lineal o integral.

1.3.3. Perıodo Clasico

En diversos paıses se comenzo a entender y analizar los sistemas de control desde un punto de vistamas matematico. Los esfuerzos en los Estados Unidos se debieron mas al esfuerzo que “Bell TelephoneLaboratories”puso en aras de obtener mas ancho de banda. En 1940, Hendrik Bode, demostro que existeuna relacion una atenuacion caracterıstica y el mınimo cambio de fase asociado con ella. A su vez, utilizo el

1.3. HISTORIA DEL CONTROL AUTOMATICO 7

punto (-1,0), en vez del (1,0) que originalmente utilizo Nyquist para introducir los conceptos de margen deganancia y de fase (ademas de las limitaciones de ganancia de ancho de banda).

En 1942 Ziegler y Nichols publicaron un paper describiendo como encontrar los parametros adecuadospara un controlador PI y PID. Coon en los 50s, extendio dicha teorıa que hoy se conoce como el metodo desintonizacion de Ziegler-Nichols.

Un tercer grupo en MIT encabezado por Hazen y Brown, desarrollo por primera vez el estudio dediagramas en bloques, ademas de crear el primer simulador de sistemas de control por intermedio de unanalizador diferencial.

La segunda guerra mundial hizo que el area de control se centrara en temas especıficos, entre los cualesse tiene la deteccion de posicion de una aeronave, ademas de calcular su posicion futura, y el movimientode un arma de alto calibre para poder dispararle. De aca se generaron varios temas de investigacion teorica,los cuales dieron pie al analisis de sistemas discretos (e.g., el trabajo de Tustin), y el estudio de sistemasestocasticos de Norbert Wiener.

Al finalizar la guerra, casi todas las tecnicas de control clasico se habıan desarrollado (la unica excep-cion era el trabajo del lugar de las raıces de Walter Evans en 1948). Las metodologıas de diseno realizadaseran para sistemas lineales y de una sola entrada, con coeficientes constantes (lo que generaba problemas,ya que los sistemas son no lineales y de multiples entradas). Si bien las tecnicas de respuesta en frecuenciaeran bastante utilizadas, algunos preferıan la solucion mediante ecuaciones diferenciales utilizando transfor-madas de Laplace, ya que segun los ingenieros de la epoca, esta era mas ajustada a la realidad. Tambien secomenzo a estudiar optimizacion, area en la que intervinieron personas de la talla de Bellman, y LaSalle.

1.3.4. Control Moderno

Los misiles guiados, la conquista del espacio, y el desarrollo de los computadores marcaron el inicio deesta nueva etapa de conocimiento del control. Ası pues, gracias a las ideas expuestas por Henri Poincare entorno a ecuaciones diferenciales de primer y segundo orden, se comenzo a estudiar todo desde el punto devista de “state-space”.

Richard Bellman entre 1948 y 1952, trabajando para la corporacion RAND, estudio el problema deasignar un misil a un objetivo determinado para que este causara la mayor cantidad de dano posible. Estolo llevo a formular el principio de optimalidad y genero lo que se conoce como programacion dinamica(cuya maxima dificultad radica en la cantidad de memoria de computo que se requiere para resolver estosproblemas). Bellman utilizo formulaciones mecanicas como las expuestas por Lagrange y Hamilton parapoder resolver los problemas optimos que se planteaban. A la par de Bellman, Pontryagin (1956) planteabael “maximum principle”, el cual sento las bases de la teorıa de control optimo. Estas dos teorıas permitieronque se empezara a profundizar en problemas matematicos del area de control. Logicamente, el desarrollo delos computadores incidieron en que muchos de los problemas pudiesen resolverse mas rapido de lo que seesperaba.

Kalman en los anos cincuenta presento un paper en el cual mostraba como problemas de controlmultivariable estaban ligados a aquellos de filtros, lo cual abrıa una nueva area de investigacion dentro delcontrol (tambien se encuentra dentro de todo este desarrollo los aportes que hiciera Bucy tiempo despuespara generar el famoso filtro Kalman-Bucy). Ası pues, se generaron conceptos tales como observabilidady controlabilidad, hoy utilizados extensamente en el desarrollo de controladores bajo el uso de sistemasmodelados a partir de variables de estado.

Despues de estos primeros pasos, se empezaron a abrir otras areas de investigacion: control adaptativo;control no lineal (con tecnicas que van desde phase plane, describing functions, hasta teorıa de estabilidadde Lyapunov); tecnicas dentro de las cuales se comienza a ver una influencia de varias areas de la ciencia:algoritmos geneticos, fuzzy logic, redes neuronales, y otras nuevas tales como foraging theory.


1.4. Ejemplos de Sistemas de Control Retroalimentado y Future

Directions

Un sistema retroalimentado tiene propiedades buenas y malas. Un sistema que era inestable puedevolverse estable, o se pueden reducir los problemas que se pueden producir por un incremento de las pertur-baciones o del ruido. A continuacion se presentan ciertos ejemplos de sistemas de control retroalimentado.

Como se vio en el contexto historico, los primeros controladores retroalimentados se dedicaban mas alcontrol de temperatura. Un ejemplo es el termostato. Este dispositivo mide la temperatura en algun lugar,compara la temperatura con aquella que se desea, y utiliza retroalimentacion para saber si se tiene queaumentar la temperatura en un determinado lugar o no. Si bien la explicacion parece sencilla, esta ilustrael concepto basico de control retroalimentado. En la vida real, hoy en dıa, los termostatos tienen elementosque permiten evitar los problemas que se pueden producir por los retardos de transporte que existen a lahora de medir y actuar.

Otro de los ejemplos donde se ve el progreso de los sistemas de control retroalimentado es en el area dela aeronautica y la industria automotriz. En el caso vehicular, uno de los ejemplos esta en el cruise control.En 1958 se introdujo por primera vez esta tecnologıa que hace que el vehıculo por intermedio de un sistemaretroalimentado controle la velocidad. Ası pues, la velocidad se mantiene constante independientementede si se esta subiendo una cuesta, o si se esta conduciendo en bajada. Hoy en dıa, este tipo de sistemashan mejorado de tal forma que entre otras caracterısticas novedosas, se puede optimizar el consumo decombustible y reducir la polucion.

Mas ejemplos incluyen redes, robots, maquinas inteligentes, e instrumentacion. En estas areas, laretroalimentacion juega un papel muy importante, tanto que sin ella no se podrıan tener redes rapidas yestables, o robots que realicen tareas tan complicadas como jugar futbol, o disenar equipos para el controlde la insulina en pacientes diabeticos.

Finalmente, cabe mencionar una de las areas que mas interes esta presentando en estos momentos:systems biology. Es bien sabido que la naturaleza ha aportado un sin numero de ideas para el desarrollode tecnologıa. Sin embargo, su estudio ha sido mas desde el punto de vista biologico que matematico ytecnologico. Actualmente, se tienen mas herramientas para comprender y modelar de una forma mas completalos sistemas naturales, lo cual nos puede llevar a explorar soluciones en ambitos de la ciencia como lo sonla medicina, la biologıa, y los ecosistemas. En biologıa por ejemplo, uno de los temas mas recurrentes es eltratar de tratar de entender lo que pasa con sistemas complejos en ingenierıa como las redes, para poderentender como funcionan ciertos aspectos moleculares (e.g., scale-free networks). Desde el punto de vistade los ecosistemas, es claro que estos son sistemas complejos, los cuales podrıan verse como de multiplesentradas y salidas. En un ecosistema pueden haber varias capas de retroalimentacion, y aun se necesitanelementos teoricos que puedan explicar el funcionamiento de los mismos. Sin embargo, el traer estas ideas alarea de control, permite que se vayan desmenuzando paulatinamente dichos problemas, y porque no, llegara una solucion futura de ciertos problemas basicos (e.g., redes bacteriales).

Capıtulo 2

Modelamiento de Sistemas

Entusiasmo es una palabra griega que significa “rozado por el ala de Dios”. El entusiasmo es eso. Un

roce, un instante

Historia Argentina, Rodrigo Fresan

En este capıtulo se pretende entender como se modelan los sistemas dinamicos. Para ello, se empiezacon una resena filosofica, para luego definir las ideas para el modelado matematico de un sistema. Se presentanejemplos y simulaciones para que el estudiante comience a familiarizarse con herramientas tales como Matlaby Simulink. Las siguientes notas han sido adaptadas a partir de varios textos de control (e.g., [27, 22, 16, 12,31, 28, 7]).

2.1. Filosofıa

Cuando uno se enfrenta a un problema de control, por lo general se siguen ciertos procedimientos. LaFigura 2.1 nos da una primera idea de como modelar un sistema.

PROCESO

Ganar intuición y

entender la planta

Especificar los objetivos

de diseño

MODELAR

Figura 2.1: Primeros pasos en el diseno de un sistema de control [27].

9

10 CAPITULO 2. MODELAMIENTO DE SISTEMAS

El modelamiento es la base para disenar un buen sistema de control. Sin un buen modelo no podrıamosdisenar un sistema de control que cumpla ciertas caracterısticas. Sin embargo, ningun modelo es perfecto,lo cual ciertas veces dificulta el diseno. Lo bueno es que cualquier tipo de incertidumbre puede llegar a sermodelada de tal forma que se incluya en el proceso de diseno. De esta forma, se estarıa frente a un modelomas completo, y por ende, se tendrıan mas herramientas a la hora del diseno de un controlador. En estecurso, solo se utilizaran sistemas lineales e invariantes en el tiempo (LTI por sus siglas en ingles), ya queestos nos dan una primera aproximacion del modelo de un sistema. Otro tipo metodologıa que se sigue porlo general esta descrito por la Figura 2.2.

PROCESO

Modelamiento físico

SYSID, APPROX

Modelo Verdadero Modelo Diseñado

Approx (reducción,

linealización)

Figura 2.2: Otra metodologıa en el modelamiento de procesos [27].

2.2. Principios de Modelamiento Matematico

Una de las razones fundamentales para el uso de modelos matematicos es que las expresiones analıticasque se encuentran proveen una vision importante entre lo que son las caracterısticas del sistema fısico (e.g.,temperatura, flujo, etc.), y sus dinamicas. En lo que sigue se presenta un procedimiento para modelarsistemas, que en un principio cualquier inexperto deberıa seguir. Sin embargo, con el paso del tiempo, elestudiante ira adquiriendo intuicion e ideas de como se podrıa desarrollar un modelo matematico de unsistema fısico.

2.2.1. Esquema

Un esquema basico que deberıa seguirse se define a continuacion. En la siguiente seccion se presentaun ejemplo que nos lleva paso a paso con el fin de entender cada uno de los puntos expuestos en el siguienteesquema.

1. Definir Objetivos

a) Especificar las decisiones que se deben tomar para el diseno.

b) Valores numericos.

c) Relaciones funcionales.

d) Requisitos de precision.

2. Preparar Informacion

a) Hacer un bosquejo del proceso e identificar el sistema.

b) Identificar las variables de interes.

2.2. PRINCIPIOS DE MODELAMIENTO MATEMATICO 11

c) Hacer suposiciones y toma de datos.

3. Formular el Modelo

a) Balances de conservacion

b) Plantear las ecuaciones.

c) Combinar las ecuaciones y los terminos que se han ido obteniendo.

d) Verificar los grados de libertad para saber si el numero de ecuaciones es el adecuado.

4. Determinar la Solucion

a) Analıticamente.

b) Numericamente.

5. Analizar los Resultados

a) Verificar resultados para saber que tan acertados estan.

1) Limitar y aproximar las respuestas.

2) Precision de los metodos numericos.

b) Interpretar resultados.

1) Graficar la solucion.

2) Relacionar suposiciones y resultados de los datos.

3) Evaluar sensitividad.

4) Responder a preguntas del tipo “y si?”

6. Validar el Modelo

a) Seleccionar valores claves para validar.

b) Comparar con resultados experimentales.

c) Comparar con resultados de modelos mas complejos.

2.2.2. Ejemplo

Para poder entender el procedimiento de modelado previamente descrito, tomemos el ejemplo de untanque de flujo continuo perfectamente agitado (continuous-flow stirred tank de la Figura 2.3).

Figura 2.3: Tanque de flujo continuo perfectamente agitado.

Objetivo: Determinar la respuesta dinamica del tanque a un cambio tipo escalon en la CA0, ası como

la velocidad y forma de respuesta. Todo esto depende del volumen y del flujo. Una de las suposiciones que se


tienen es que la salida no puede ser utilizada a no ser que el 90 % del cambio de concentracion haya ocurrido.Por lo tanto, otro de los objetivos es determinar cuanto tiempo se necesita para llegar a este valor.

Informacion: Para poder preparar la informacion, primero se identifica el sistema, y la manera massencilla de hacerlo es mediante un diagrama. Con ello se pueden identificar las variables y tener una idea delos balances a formular. Para este caso, el sistema es el lıquido en el tanque. El tanque ha sido bien disenadotal que la concentracion sea uniforme en el lıquido. Se asumira luego que,

Es un well-stirred vessel, i.e., permite el uso de ODEs en lugar de PDEs.

Se tiene un flujo constante de entrada.

La densidad es la misma para A y el solvente.

A nivel de datos, se asume que,

F0 = 0,086m3/min.

V = 2,1m3.

CAINIT= 0,925mole/m3.

Despues de aplicar una entrada ‘paso, se tiene que CA0= 1,85mole/m3.

El sistema esta en estado estable al principio, i.e., CA0= CA = CAINIT

, cuando t = 0.

Formulacion: Primero, para poder formular el modelo, tenemos que seleccionar las variables de cuyo com-portamiento queremos predecir. Una vez se tengan estas variables, las ecuaciones pueden ser deducidasbasados en principios fundamentales, como lo es la conservacion. Estos balances de conservacion son relacio-nes que obedecen ciertos supuestos en sistemas fısicos. Estos balances de conservacion se pueden ver por logeneral como,

ACC = IN - OUT + GENERA

donde si ACC 6= 0 para un well-mixed system, se tendra una ODE, mientras que si ACC = 0 para unwell-mixed system, se tendra una ecuacion algebraica. Los mas utilizados son los balances de masa y energıa.

Balance de masa total: Acumulacion de masa = Masa IN - Masa OUT

Balance de masa por componente: Acumulacion del componente de masa = Comp Masa IN - CompMasa OUT + Generacion del Componente de Masa.

Balance de energıa: Acumulacion de U+PE+KE = (U+PE+KE IN por convex) - (U+PE+KE OUTpor convex) + Q - W

donde U es la energıa interna, PE la energıa potencial, KE la cinetica, Q la temperatura transferida alsistema por el ambiente, y W el trabajo (si el volumen es constante, W=Ws).

Hay casos especıficos en los que se utiliza cada uno de los balances previamente descritos. A continuacion seda un ejemplo de los mas utilizados.

Si la variable es el total de masa del lıquido en un tanque o la presion en un recipiente, el balance demateria total es el mas apropiado.

Si la variable es la concentracion de un componente, el balance de masa por componente es el apropiado.

Si la variable es temperatura, el balance de energıa es el apropiado.

Logicamente, si se tienen varias variables, es claro que se pueden utilizar varios balances para poder obtenerel modelo matematico. En ciertos casos los balances no son suficientes, por lo que se utilizan ecuaciones quepueden relacionar varias variables. Por ejemplo,

2.2. PRINCIPIOS DE MODELAMIENTO MATEMATICO 13

Transferencia de calor: Q = hA(∆T ).

Tasa Reaccion Quımica: rA = k0e−E/RT CA.

Flujo: F = CV (∆P/ρ)1/2.

Ecuacion de estado: PV = nRT .

Estas relaciones dependen del problema en cuestion, ya que por lo general no son universalmente aplicables.Finalmente, la formulacion del modelo queda completa cuando se tiene el numero adecuado de ecuacio-nes. Para ello, existe un elemento conocido como grado de libertad (degree of freedom, DOF), el cual vienedado por DOF = NV −NE, donde NV es el numero de variables dependientes (i.e., variables que depen-den del comportamiento del sistema y deberan ser evaluadas por medio de las ecuaciones del modelo), yNE es el numero de ecuaciones independientes. Si DOF = 0, el sistema esta exactamente especificado; siDOF < 0, el sistema esta sobreespecificado, i.e., no existe una solucion del modelo; si DOF > 0, el sistemaesta subespecificado, i.e., existe un numero infinito de soluciones.

Para el ejemplo en cuestion, como se tienen concentraciones, los balances de mas son adecuados. Elbalance total de masa para un incremento de tiempo ∆t viene dado por,

(ρV )(t+∆t) − (ρV )t = F0ρ∆t− F1ρ∆t

donde ρ es la densidad. Dividiendo por ∆t, y tomando el lımite cuando tiende a 0, se tiene que la acumulacionde masa es igual a la masa de entrada menos la masa de salida, i.e.,

lım∆t→0

(ρV )(t+∆t) − (ρV )t

∆t= F0ρ− F1ρ

d(ρV )

dt= F0ρ− F1ρ

Vdρ

dt+ ρ

dV

dt= F0ρ− F1ρ

Como la densidad es constante, dρdt = 0, por lo que se tendrıa que

dV

dt= F0 − F1 (2.1)

Es claro que F0 es una variables externa que no depende del comportamiento del sistema. Como el lıquidosale al rebosarse el lıquido, entonces el flujo de salida F1 esta correlacionado con el nivel del lıquido. Paraello se utiliza una ecuacion de presa que viene dada por,

F1 = kF

√

L− Lw, para L > Lw

donde kF es una constante, L = V/A es el nivel del lıquido en el tanque, y Lw es el nivel en el cual sedesborda la presa. En este caso, L > Lw por lo que el nivel nunca esta por debajo del overflow, y la alturapor encima del desborde L−Lw es pequena comparada con el nivel del lıquido en el tanque L. Por lo tanto,se asumira que el nivel del lıquido en el tanque es aproximadamente constante, y que F0 = F1 = F , por loque (2.1) se convierte en

dV

dt= F0 − F1 = 0 ⇒ V = constante (2.2)

Ahora se necesita formular el balance de masa del componente A. Como es un tanque well-mixed, las con-centraciones del tanque y las de salida son las mismas, por lo que,

(MWAV CA)(t+∆t) − (MWAV CA)t = (MWAFCA0−MWAFCA)(∆t) + 0

donde MWA corresponde al peso molecular del componente A, CA esta en moles/volumen del componenteA, y como no hay reaccion quımica, la generacion es igual a 0. Esto implicarıa finalmente que,

MWAVdCA

dt= MWAF (CA0

− CA) (2.3)


Por lo tanto, las Ecuaciones (2.2) y (2.3) describen nuestro sistema. Se tiene entonces que las variables sonCA y F1, y las variables externas son F0 y CA0

, entonces el DOF = 0. Se tiene que tener en cuenta que losparametros no cambian con el tiempo, lo cual no es real, pero es valido siempre y cuando los cambios seanlentos.

Solucion Matematica: Una de las ventajas de una solucion analıtica es que se puede calcularvalores especıficos de la solucion, ası como determinar las relaciones entre las variables y el comportamientodel sistema.

El modelo en (2.3) es una ODE lineal de primer orden, que puede ser escrita como

dCA

dt+

1

τCA =

1

τCA0

(2.4)

donde τ = V/F = 24,7min, y se conoce como la constante de tiempo del sistema.

Para resolver este tipo de ecuaciones, se recurre a lo visto en ecuaciones diferenciales. Se sabe que

e∫

t

0

1

τdt = et/τ (2.5)

Multiplicando por este factor a ambos lados de (2.4) se obtiene que

et/τ

(dCA

dt+

1

τCA

)

=1

τCA0

et/τ

Pero por (2.5),

et/τ dCA

dt+ CA

det/τ

dt=

1

τCA0

et/τ

d(et/τCA)

dt=

1

τCA0

et/τ

d(et/τCA) =1

τCA0

et/τdt

Como se asumio que CA0es constante incluso despues de hacer el cambio a entrada escalon, entonces

∫

d(et/τCA) =1

τCA0

∫

et/τdt

et/τCA(t) =1

τCA0

τet/τ + I

donde I es una constante. Originalmente se ha asumido que si t = 0, y CA(0) = CAINIT, por lo que

I = CAINIT− CA0

Escrito de otra forma serıa,

CA = CA0+ (CAINIT

− CA0)e−t/τ

Se sabe que CAINIT= CA0INIT

, por lo que

CA − CAINIT= CA0

+ (CAINIT− CA0

)e−t/τ − CAINIT

CA − CAINIT= (CA0

− CAINIT)(1− e−t/τ )

Escrito de otra forma, esto podrıa verse como

y(t) = u(t)(

1− e−t/τ)

Si la entrada u(t) es un escalon unitario, la salida serıa y(t) = 1− e−t/τ para t ≥ 0, lo que graficamente serıaequivalente a lo que se ve en la Figura 2.4).

2.3. SISTEMAS DE PRIMER ORDEN Y CONTROLADOR ON-OFF 15

Figura 2.4: Respuesta a entrada paso de un sistema de primer orden.

Como se puede ver, una de las caracterısticas primordiales de un sistema de primer orden es que sit = τ , el valor de y(t) serıa igual al 63.2 % del valor final, i.e.,

y(t = τ) = 1− e−1 = 0,632

Se puede observar tambien que entre mas pequena sea la constante de tiempo τ , mas rapida es la respuestadel sistema. Otra caracterıstica importante de este tipo de sistemas es que la lınea tangente en t = 0 es 1/τ ,ya que

dy(t)

dt=

1

τe−t/τ

∣∣∣t=0

=1

τ

Es claro tambien que si no se tuviese una entrada escalon unitario sino x(t) = Ku(t), entonces la salida serıa

y(t) = K(1− e−t/τ )

donde el valor final vendrıa dado por

lımt→∞

y(t) = lımt→∞

K − lımt→∞

Ke−t/τ = K

Para el caso del ejemplo en cuestion, CAINIT= 0,925 y τ = 24,7min, lo cual nos brinda la rapidez con la

que responde el sistema. Todo esto depende del equipo (i.e., por el volumen V ), y la operacion del proceso(i.e., F ).

2.3. Sistemas de Primer Orden y Controlador ON-OFF

Otro ejemplo interesante a modelar es el de un sistema simple de calentamiento como el que se muestraen la Figura 2.5)

En un clima frıo, la temperatura de una casa puede mantenerse a una temperatura deseada haciendocircular agua caliente a traves de un intercambiador de calor. Un termostato determina la temperatura enun cuarto, y se desea mantener dicha temperatura en un rango determinado.

Objetivo: Determinar la respuesta dinamica de la temperatura en un cuarto. Ademas, se quieregarantizar que el horno conmute solo cada 3 min, lo cual ayudarıa a que los gases sean purgados antes devolver a ser encendido.

Informacion: Variables importantes: Temperatura del cuarto; Estados ON/OFF del horno.

Suposiciones: El aire en el cuarto es well-mixed; No existe intercambio de material desde/haciacuarto; El calor transmitido solo depende de la ∆T = Troom − Tout; No hay transferencia de calor del sueloo del techo; Efectos de energıa cinetica y potencial son despreciables.

Datos: La capacidad del aire CV = 0,17 cal/(g ◦C); Densidad es ρ = 1190g/m3; El coeficiente detransferencia total de calor UA = 45 × 103cal/(◦Ch); Tamano del cuarto 5m × 5m × 3m; Switcheo entre


Figura 2.5: Sistema termico.

17◦C ON y 23◦C OFF; TINroom= 20◦C, y el horno esta apagado originalmente; La temperatura ambiente

es TA = 10◦C.

Formulacion: El sistema se define como el aire dentro de la casa. Para determinar la temperatura,un balance de energıa es necesario (como no hay material que se transmite, no se necesita hacer balance demateria). La aplicacion del balance de energıa darıa:

dY

dt= 0− 0 + Q−Ws (2.6)

Sin embargo, Ws = 0. Utilizando los principios de termodinamica y transferencia de calor, y sabiendo quela acumulacion de energıa cinetica y potencial son despreciables,

dUdt = ρCV V dT

dtQ = −UA(T − TA) + Qh

(2.7)

donde

Qh =

0 T > 231,5× 106 T < 17sin cambio 17 ≤ T ≤ 23

Por lo tanto las Ecuaciones (2.6) y (2.7) describen totalmente el sistema. El DOF es 0 ya que ademas setienen dos variables (i.e., T y Qh), cuatro parametros (i.e., UA, CV , V , y ρ), y una variable externa TA. Laecuacion que describirıa finalmente todo el sistema es

ρCV VdT

dt= −UA(T − TA) + Qh (2.8)

Solucion: Ordenando (2.8) se tiene que

dT

dt+

1

τT =

UATA + Qh

ρCV V(2.9)

La solucion de (2.9) depende claramente del valor de Qh, por lo que

T − TINIT = (TFINAL − TINIT )(1− e−t/τ ) (2.10)

donde t es el tiempo desde el paso en Qh y τ = 0,34h de acuerdo a los valores asignados originalmente. Elvalor de TFINAL viene dado por

TFINAL = TA +Qh

UA=

{10◦C cuando Qh = 043,3◦C cuando Qh = 1,5× 106

El valor de TINIT es el valor de temperatura cuando un paso en Qh ocurre.

En la Figura 2.6) se muestra un ejemplo de como serıa la respuesta de un controlador ON-OFF.

2.4. TRANSFORMADA DE LAPLACE 17

Figura 2.6: Ejemplo de un sistema de control on-off.

2.4. Transformada de Laplace

Buena parte del material de esta seccion fue tomado de [6, 11, 13, 25].

2.4.1. Transformada Unilateral de Laplace

La transformada unilateral de Laplace de una senal x(t), X(s), se define como

L {x(t)} = X(s) =

∞∫

0

x(t)e−stdt (2.11)

donde s = σ + jw es una variable compleja. El termino e−st es una exponencial decreciente que ayuda a laconvergencia del sistema. Existen ciertas limitantes en x(t) para que exista transformada de Laplace:

1. x(t) debe ser piecewise continuous en cualquier intervalo finito 0 ≤ t1 ≤ t ≤ t2.

2. x(t) debe ser de orden exponencial.

Definition 2 Una funcion x(t) es piecewise continuous en un intervalo finito si este intervalo puede serdividido en un numero finito de subintervalos sobre los cuales la funcion es continuo y se tienen lımites porizquierda y derecha de x(t).

Definition 3 Una funcion x(t) es de orden exponencial si existe una constante a tal que e−at|x(t)| este aco-tada para todo valor de t mayor que un valor finito T .

Esta ultima limitante impone la restriccion de que σ, i.e., la parte real de s tiene que ser mayor a un lımiteinferior σa, para el cual el producto e−σat|x(t)| es de orden exponencial. Esto es lo que se conoce como elconcepto de region of convergence (ROC).

Ejemplo 2.4.1 Sea x(t) = e−atu(t), con a ∈ R+. Cual es L {x(t)}?


Utilizando (2.11),

X(s) =∞∫

0

x(t)e−stdt

=∞∫

0

e−ate−stdt

=∞∫

0

e−(s+a)tdt

= − 1s+a lımt→∞ e−((σ+a)+jw)t + 1

s+a︷︸︸︷

0 if σ + a > 0

X(s) =1

s + a

esto es valido para Re{s} > −a.

Ejemplo 2.4.2 Sea x(t) = cos(wt)u(t), con w ∈ R+. Cual es L {x(t)}?

Utilizando (2.11),

X(s) =

∞∫

0

cos(wt)e−stdt

Por Euler cos(wt) se convierte en

X(s) =1

2

∞∫

0

e(jw−s)tdt +

∞∫

0

e(−jw−s)tdt

X(s) =1

2

(1

jw − slım

t→∞e(jw−s)t − 1

jw + slım

t→∞e(−jw−s)t

)

− 1

2

(1

jw − s− 1

jw + s

)

Sin embargo,lım

t→∞e(jw−σ−jw)t = 0 if σ > 0

lımt→∞

e(−jw−σ−jw)t = 0 if σ > 0

Por ende,

L {cos(wt)u(t)} = ss2+w2

Ejemplo 2.4.3 Sea x(t) = tu(t). Cual es L {x(t)}?

Utilizando (2.11),

X(s) =

∞∫

0

te−stdt

Integrando por partes, y utilizandob∫

a

udv = [uv]ba −

b∫

a

vdu

Sea u = t y dv = e−stdt. Entonces,

X(s) =[

− te−st

s

]∞

0−

∞∫

0

−e−st

s dt

= 0− 1s2 [e−st]

∞0

Por ende,

L {tu(t)} = 1s2 if Re{s} > 0


2.4.2. Propiedades de la Transformada de Laplace

Linearidad

Si

x1(t)L←→ X1(s)

x2(t)L←→ X2(s)

Entonces,

a1x1(t) + a2x2(t)L←→ a1X1(s) + a2X2(s)

Corrimiento en tiempo

Si

x(t)L←→ X(s)

Entonces,

x(t− t0)L←→ X(s)e−st0

Proof: Por (2.11)

L {x(t− t0)} =

∞∫

0

x(t− t0)e−stdt

Cambiando de variables τ = t− t0, dτ = dt,

L {x(t− t0)} =∞∫

0

x(τ)e−s(τ+t0)dτ

= e−st0∞∫

0

x(τ)e−sτdτ

= e−st0X(s)

�

Shifting in the s-Domain

Si

x(t)L←→ X(s)

Entonces,

es0tx(t)L←→ X(s− s0)

Ejemplo 2.4.4

e3tx(t)L←→ X(s− 3)

L {cos(w0t)x(t)} = L { 12x(t)

(ejw0t + e−jw0t

)}}

= L { 12x(t)ejw0t}+ L { 1

2x(t)e−jw0t}

= 12X(s− jw0) + 1

2X(s + jw0)


Time Scaling

Six(t)

L←→ X(s)

Entonces,

x(at)L←→ 1

|a|X( s

a

)

Proof: Por (2.11)

L {x(at)} =

∞∫

0

x(at)e−stdt

Cambiando de variables y definiendo τ = at, 1adτ = dt, entonces si a > 0

L {x(at)} = 1a

∞∫

0

x(τ)e−s( τa)dτ

= 1aX

(sa

)(2.12)

Si a < 0, se tiene

L {x(at)} =

∞∫

0

x(at)e−stdt

Cambiando de variables y definiendo τ = at, 1adτ = dt,

L {x(at)} = 1a

0∫

∞x(τ)e−s( τ

a)dτ

= − 1a

∞∫

0

x(τ)e−s( τa)dτ

= − 1aX

(sa

)

(2.13)

Combinando los resultados de (2.12) y (2.13) para a > 0 y a < 0, se tiene

L {x(at)} =1

|a|X( s

a

)

�

Time Reversal

Six(t)

L←→ X(s)

Entonces,

x(−t)L←→ X(−s)

Differentiation

Six(t)

L←→ X(s)

Entonces,dx(t)

dt

L←→ sX(s)− x(0)


Proof: Por (2.11)

L

{dx(t)

dt

}

=

∞∫

0

dx(t)

dte−stdt

Integrando por partes con u = e−st y dv = dx(t)dt dt, se tiene

L

{dx(t)

dt

}

= [e−stx(t)]∞0 −

∞∫

0

x(t)(−s)e−stdt

= lımt→∞ e−stx(t)− e−s0x(0) + s∞∫

0

x(t)e−stdt

= lımt→∞ e−stx(t)− x(0) + sX(s)

Por hipotesis x(t) es de orden exponencial, lo que implica que

e−at|x(t)| < c⇒ |x(t)| < ceat

Esto implica que para cualquier s tal que Re{s} > a,

lımt→∞

e−stx(t) = 0

Entonces,

L

{dx(t)

dt

}

= sX(s)− x(0)

�

NOTA: Si x(t) es discontinua en t = 0 o si x(t) contiene un impulso o derivada de un impulso en t = 0, esnecesario tomar el tiempo inicial como 0−. Entonces,

dx(t)

dt

L←→ sX(s)− x(0−)

Note que si x(t) = 0 para t < 0, entonces x(0−) = 0.

La definicion general serıa

Six(t)

L←→ X(s)

Entonces,dnx(t)

dtnL←→ snX(s)− sn−1x(0)− sn−2x(0)− . . .− sxn−2(0)− xn−1(0)

donde xn−1(0) corresponde a la derivada n− 1 de x evaluada en t = 0.

Ejemplo 2.4.5 Sea x(t) = e−tu(t). Encuentre L

{dx(t)

dt

}

.

Utilizando tablas o definiciones se tiene que

dx(t)

dt= −e−tu(t) + δ(t)e−t = −e−tu(t) + 1.δ(t)

Por tablas, se sabe que

δ(t)L←→ 1

e−atu(t)L←→ 1

s + a

Entonces

L

{dx(t)

dt

}

=s

s + 1


Si se utilizan las propiedades,

L

{dx(t)

dt

}

= sX(s)− x(0−)

Pero x(0−) = 0. Entonces

L

{dx(t)

dt

}

= s1

s + 1

Differentiation in the s-Domain

Six(t)

L←→ X(s)

Entonces,

tNx(t)L←→ (−1)N dN

dsNX(s)

Integration

Six(t)

L←→ X(s)

Entonces,t∫

0

x(λ)dλL←→ 1

sX(s)

Convolucion

Six1(t)

L←→ X1(s)

x2(t)L←→ X2(s)

Entonces,

x1(t) ∗ x2(t)L←→ X1(s)X2(s)

En la Figura 2.7 tomada de [31] se pueden ver algunas de las transformadas tradicionales de Laplace.

.

2.4.3. Solucion de ODEs

Ejemplo 2.4.6 [29] Un calibrador optico utilizado por la Chrysler Corporation, el cual se utiliza paraverificar el perfecto alineamiento de todos los componentes metalicos de varias clases de Sedan de cuatropuertas, tiene unas dinamicas en lazo cerrado dadas por

y + 5y + 6y = f(t)

Asumiendo que f(t) = 0, y que y(0) = 1, y(0) = 0, halle y(t).

Primero tendrıamos que colocar el sistema en terminos de la transformada de Laplace como sigue

s2Y (s)− sy(0)− y(0) + 5sY (s)− 5y(0) + 6Y (s) = 0

Y (s)(s2 + 5s + 6) = sy(0) + 5y(0)


Figura 2.7: Transformadas tıpicas de Laplace [31]

Esto es equivalente a

Y (s) =s + 5

(s + 3)(s + 2)=−2

s + 3+

3

s + 2

Tomando la transformada inversa de Laplace se obtiene finalmente que

y(t) = 3e−2t − 2e−3t

Un ejemplo de como se obtendrıan los residuos en Matlab viene dado por:

[r,p,k] = residue([1 5],[1 5 6])

r =

-2.0000

3.0000

p =

-3.0000

-2.0000

k =

[]

Para poder obtener la transformada inversa de Laplace se utilizan por lo general fracciones parciales.


Polos Sencillos

Sea

P (s) =N(s)

D(s)=

n∑

i=1

ki

(s− pi)

dondeki = [(s− pi)P (s)]|s=pi

siempre y cuando el grado del numerador sea menor a la del denominador.

Polos Multiples

Sea

P (s) =N(s)

D(s)=

k11

(s− p1)+ . . . +

k1r

(s− p1)r+

k21

(s− p2)+ . . . +

k2m

(s− p2)m+ . . .

dondek1r = [(s− p1)

rP (s)]|s=p1

k1i =1

i!

di[(s− p1)rP (s)]

dsi

∣∣∣∣s=pi

i = 1, . . . , r − 1

y ası sucesivamente para todos los polos.

Ejemplo 2.4.7 Sea

P (s) =1

s2(s + 1)2

P (s) =k11

s+

k12

s2+

k21

(s + 1)+

k22

(s + 1)2

P (s) =−2

s+

1

s2+

2

(s + 1)+

1

(s + 1)2

>> [r,p,k]=residue([1],conv([1 0 0],[1 2 1]))

r =

2

1

-2

1

p =

-1

-1

0

0

k =

[]

%


Polos Complejos Conjugados

P (s) =ki

(s− (−α + jβ))+

ki+1

(s− (−α− jβ))ki = k∗

i+1

donde

ki = [(s + (α− jβ))P (s)]|s=−α+jβ

Por lo tanto,

p(t) = kie(−α−jβ)t + k∗

i e(−α+jβ)t

p(t) = 2|ki|e−αt cos (βt + ]ki)

Ejemplo 2.4.8 Sea

3y + 2y + y = 0

P (s) =4− 3s

3s2 + 2s + 1

s = −1

3±√

2

3

Ejemplo 2.4.9 [7] Se tiene un sistema simple de masa resorte como se ve en la Figura 2.8. Este sistemarepresenta, por ejemplo, un amortiguador de choques para un vehıculo. En el se puede ver el diagrama decuerpo libre de la masa M , donde b es el amortiguamiento viscoso (i.e., la fuerza de friccion es linealmenteproporcional a la velocidad de la masa), y la constante de un resorte ideal k.

Figura 2.8: Sistema Masa-Resorte-Amortiguador [7]

.

La ecuacion diferencial vendrıa dada por la suma de fuerzas actuando sobre M , i.e., utilizando lasegunda ley de Newton,

Ma =∑

F

En otras palabras serıa,

My + by + ky = r(t)

Si y(0−) = y0 y y(0−) = 0, y r(t) = 0, por lo que tendrıamos que la representacion en Laplace serıa,

M(s2 − sy(0−)− y(0−)) + b(sY (s)− y(0−)) + kY (s) = 0

Y (s) =(Ms + b)y0

Ms2 + bs + k=

n(s)

d(s)(2.14)


Si d(s) = 0, estamos hablando de la ecuacion caracterıstica, porque las raıces de esta ecuacion determinanla caracterıstica de la respuesta en tiempo. Las raıces de la ecuacion caracterıstica se conocen como polos osingularidades del sistema. Las raıces de n(s) se denominan ceros.

Consideremos el caso cuando k/m = 2 y b/m = 3, por lo que

Y (s) =(s + 3)y0

(s + 1)(s + 2)

La Figura 2.9 [7] muestra como se graficarıa este sistema en el plano-s.

Figura 2.9: Representacion del sistema en el plano-s [7]

.

Utilizando expansion en fracciones parciales se tiene

Y (s) =2

s + 1− 1

s + 2

Tomando la transformada inversa de Laplace se obtiene finalmente que

y(t) = 2e−t − e−2t

Usualmente tambien se desea obtener el valor final o valor en estado estacionario. Para ello se utilizauna de las propiedades mas utiles de la transformada de Laplace, i.e., el teorema del valor final. Este sepuede ver como

lımt→∞

y(t) = lıms→0

sY (s)

Cabe aclarar que esto solo es valido si lımt→∞ y(t) existe. Para el ejemplo en cuestion, es claro que lımt→∞ y(t) =0, lo que implica que la posicion final de la masa es la posicion y = 0.

Podrıamos ilustrar los puntos principales de la transformada de Laplace hasta ahora enunciados pormetodos graficos. Para ello, tomemos la Ecuacion (2.14) nuevamente, i.e.,

Y (s) =(s + b

M )y0

s2 + ( bM )s + k

M

Esto podrıa escribirse como

Y (s) =(s + 2ζωn)y0

s2 + 2ζωns + ω2w

donde ζ es la tasa de amortiguamiento (no tiene dimensiones), y ωn es la frecuencia natural del sistema. Elpolinomio caracterıstico serıa

d(s) = s2 + 2ζωns + ω2w = 0


Por lo que las raıces vendrıan dadas por

s1,2 = −ζωn ± ωw

√

ζ2 − 1 (2.15)

Para este caso especıfico, ωn =√

kM , y ζ = b

2√

kM.

Si analizaramos la Ecuacion (2.15) es claro que

Cuando ζ > 1, las raıces son reales.

Cuando ζ < 1, las raıces son complejas conjugadas.

Cuando ζ = 1, las raıces son repetidas y reales. Esta ultima condicion se conoce como amortigua-miento crıtico.

Para el caso cuando ζ > 1, la respuesta es subamortiguada, y las raıces de (2.15) se podrıan escribir como

s1,2 = −ζωn ± jωw

√

1− ζ2

Si graficaramos en el plano-s los polos y ceros de Y (s) obtendrıamos lo que se ve en la Figura 4.8 [7].

Figura 2.10: Representacion del sistema en el plano-s [7].

donde θ = cos−1 ζ. Si asumimos que ωn es constante, las raıces complejas conjugadas variarıan de-pendiendo del valor de ζ como se ve en la Figura 2.11 [7].

Es claro que la respuesta transitoria aumentara sus oscilaciones a medida que las raıces tiendan aleje jω, i.e., cuando ζ tiende a cero.

Si calcularamos la transformada inversa utilizando la expansion en fracciones parciales para el casoen que ζ < 1, tendrıamos que

Y (s) =k1

s− s1+

k∗1

s− s2

donde

s1 = −ζωn + jωw

√

1− ζ2

s2 = −ζωn − jωw

√

1− ζ2

Utilizando las ideas vistas previamente, obtenemos que

k1 = −1

2y0 − j

1

2y0

ζ√

1− ζ2


Figura 2.11: Representacion como varıa ζ en el plano-s cuando ωn se mantiene constante [7].

Por lo tanto,

|k1| =1

2y0

1√

1− ζ2

y

∠k1 = tan−1 ζ√

1− ζ2

Finalmente, la respuesta en tiempo serıa igual a

y(t) = y01

√

1− ζ2e−ζωnt cos

(

ωnt√

1− ζ2 + tan−1 ζ√

1− ζ2

)

Graficamente, esto se verıa como se observa en la Figura 2.12 [7].

Figura 2.12: Respuesta en tiempo del sistema masa-resorte-amortiguador [7]

.

Mırese ahora la relacion entre la respuesta en tiempo y la ubicacion de los polos y ceros en el plano-s.Si ζωn varıa, entonces la envolvente e−ζωnt tambien, por lo que la respuesta cambiarıa. Entre mas grandesea el valor de ζωn, mas rapido sera el amortiguamiento de la respuesta. Esto implicarıa desplazar bastantelos polos hacia la izquierda del plano-s.

Es claro que en aplicaciones de control se tendran mas polos, por lo que la respuesta transitoriadependera de la contribucion de todos ellos. Estas ideas se analizaran mas adelante.

2.5. FUNCIONES DE TRANSFERENCIA 29

2.5. Funciones de Transferencia

Definition 4 La funcion de transferencia de un sistema lineal e invariante en el tiempo, es la relacion enfrecuencia que existe entre la entrada y la salida cuando las condiciones iniciales son iguales a cero.

En esta definicion, valida para sistemas lineales e invariantes en el tiempo, se tiene que para un sistema como(7.18), la relacion entre la entrada u y la salida y estara dado por una transformacion en frecuencia de lassenales, siempre y cuando las condiciones iniciales sean nulas.

yn + a1yn−1 + . . . + an−1y + any = b0u

m + b1um−1 + . . . + bm−1u + bmu n ≥ m (2.16)

Esto serıa,

H(s) =L [salida]

L [entrada]

∣∣∣∣CI=0

donde L [·] es la transformada de Laplace. Aplicando esto a (7.18), se obtiene que

H(s) =Y (s)

U(s)=

b0sm + b1s

m−1 + . . . + bm−1s + bm

sn + a1sn−1 + . . . + an−1s + an(2.17)

Cabe aclarar que en realidad la respuesta de un sistema esta dada por dos componentes:

Y (s) =n(s)

d(s)R(s)

︸︷︷︸

+p(s)

d(s)︸︷︷︸

Respuesta a Estado Cero Respuesta a Entrada CeroRespuesta Forzada Respuesta Natural

Funcion de Transferencia

Ejemplo 2.5.1 [7] Se tiene el sistema que se ve en la Figura 2.13 [7]. Obtener la funcion de transferenciaque relaciona la velocidad v1(t) y la fuerza r(t).

Figura 2.13: Sistema masa-resorte-amortiguador [7]

. Al modelar el sistema, se tiene el siguiente conjunto de ecuaciones,

M1v1 + (b1 + b2)v1 − b1v2 = r(t)M2v2 + (v2(t)− v1(t))b1 + kx2(t) = 0

donde x2(t) corresponde a la posicion asociada a la velocidad v2(t). Si las condiciones iniciales son igualesa 0, tendrıamos en frecuencia que


M1sV1(s) + (b1 + b2)V1(s)− b1V2(s) = R(s)

M2sV2(s) + (V2(s)− V1(s))b1 + k V2(s)s = 0

Despejando en terminos de V1(s) se tiene que la funcion de transferencia serıa

V1(s) =M2s + b1 + k

s

(M1s + b1 + b2)(M2s + b1 + ks )− b2

1

R(s)

2.6. Linealizacion

Las aproximaciones de un sistema no lineal a uno lineal se realiza para estudiar el comportamientolocal de un sistema, donde los efectos no lineales son pequenos y practicamente despreciables. Para queuna ecuacion sea lineal, cada uno de los terminos no debe contener variables cuya potencia sea mayor queuno. Existe una tecnica de linealizacion mediante la cual es posible aproximar las ecuaciones no linealesque se pueden analizar mediante la transformada de Laplace. La suposicion basica es que la respuesta dela aproximacion lineal representa la respuesta del proceso en la region cercana a un punto de operacion, alrededor del cual se realiza la linealizacion [31, 7].

El manejo de las ecuaciones linealizadas se facilita en gran medida con la utilizacion de las variablesdesviacion, las que se definen como la diferencia entre el valor de la variable y su valor en un punto deoperacion dado. Esto se podrıa escribir como

x(t) = x(t)− x (2.18)

En (2.18) se tiene que x(t) es la variable que se esta analizando, y x es el punto de operacion al rededordel que deseamos trabajar. En otras palabras, la variable desviacion mide la diferencia entre el valor de lavariable y un valor de operacion sobre el que deseamos trabajar (ver Figura 2.14 [31]).

Figura 2.14: Representacion del sistema en terminos de la variable desviacion [31]

.

La transformacion del valor absoluto de una variable al de desviacion equivale a mover el cero sobreel eje de esa variable hasta el valor base, i.e., x. Se tiene que

dnx(t)

dtn=

dnx(t)

dtn

Supongamos que se tiene la ecuacion diferencial

x(t) = f(x(t))

La expansion por series de Taylor de la funcion no lineal f(x(t)) alrededor de un punto de operacion xesta dada por

f(x(t)) = f(x) +df(x(t))

dx

∣∣∣∣x=x

(x− x) +1

2!

d2f(x(t))

dx2

∣∣∣∣x=x

(x− x)2 +1

3!

d3f(x(t))

dx3

∣∣∣∣x=x

(x− x)3 + . . .

2.6. LINEALIZACION 31

La aproximacion lineal consiste en tomar unicamente los primeros elementos de la serie, i.e., aquellos que noestan elevados a ninguna potencia. Por lo tanto,

f(x(t)) ' f(x) +df(x(t))

dx

∣∣∣∣x=x

(x− x) (2.19)

Si se plantea en terminos de las variables desviacion se tiene que

f(x(t)) ' f(x) +df(x(t))

dx

∣∣∣∣x=x

x

Ejemplo 2.6.1 [31] Linealizar la ecuacion de Arrhenius para la dependencia de las tasas de reaccionquımica de la temperatura,

k(T ) = k0e−E/RT

Supongamos que T es el punto de operacion alrededor del cual queremos linealizar. Tomando (2.19) se tieneque

k(T ) = k(T ) +dk

dt

∣∣∣∣T=T

T

Es decir que

k(T ) = k(T ) + k(T )E

RT 2T

Ejemplo 2.6.2 Analicemos el problema de un tanque acoplado con una valvula que se observa en la Figura...

ANADIR FIGURA

Primero, antes de plantear las ecuaciones diferenciales que nos ayudarıan a entender el sistema,recordemos como se modela un sistema hidraulico.

El flujo de lıquido a traves de una valvula que esta totalmente abierta esta dado por

q(t) = CV

√

∆P

G

donde q(t) corresponde al flujo, CV es el coeficiente de la valvula en gpm/(psi)1/2 y G es la gravedad especıficadel lıquido que fluye a traves de la valvula. Esta ecuacion se puede reducir a

q(t) = K√

∆P

Donde la valvula se modela como se muestra en la Figura...

ANADIR FIGURA

La resistencia al flujo del lıquido se define como la variacion de diferencia de nivel necesaria paraproducir una variacion unitaria en el gasto.

Se sabe que

V =

∫ h

0

A(λ)dλ (2.20)

P = ρgh + Pa (2.21)

donde A es el area del tanque, h la altura, ρ la densidad, g la gravedad, y Pa es la presion atmosferica. Lapresion P y el volumen V de un tanque estan relacionados por dV

dP = C como se observa en la Figura...

ANADIR FIGURA

Utilizando la regla de la cadena, se tiene que

dV

dP=

dV

dh

dh

dP


Reemplazando (2.20) y (2.21) se obtiene que

dV

dP= A(h)

1

ρg

Por lo tanto C = A(h) 1ρg .

Por otra parte, el volumen en funcion del tiempo esta dado por

V (t) = V (0) +

∫ h

0

(qi(α)− qo(α))dα

donde qi es el flujo de entrada y qo es el flujo de salida.

Lo que implica que V = qi − qo, y por ende

dP

dt=

1

C(qi − qo)

Retomando el problema original, tenemos que ∆P1 =√

P1 − Pa, qo = K1

√∆P1, y por lo tanto

P1 =1

C1(qi −K1

√

∆P1)

Si linealizamos el sistema alrededor de los puntos de operacion qo y ∆P 1, se obtiene que

qo = qo +K1

2√

∆P 1

(∆P1 − ∆P 1)

Pero, ∆P 1 = P1 − Pa, por lo que

qo = qo +1

R1(P1 − P1)

Reemplazando en la ecuacion diferencial, obtenemos que

ˆP1 =1

C1

(

qi −1

R1P1

)

Si se tomaran las funciones de transferencia de las variables desviacion (asumiendo que los puntos de opera-cion son las mismas condiciones iniciales para simplificar el problema), se obtendrıan dos sistemas de primerorden, i.e.,

P1

qi=

R1

1 + sC1R1

qo

qi=

1

1 + sC1R1

Para ver el comportamiento de este sistema, serıa util utilizar Simulink para ver el comportamiento tantodel sistema no lineal y el lineal asumiendo que Pa = 3, P1 = 6, C1 = 5, y K1 = 2.

Un sistema de una entrada y una salida se puede ver como

dxdt = f(x, u)y = h(x, u)

(2.22)

con x ∈ Rn, u, y ∈ R.

Asumamos que los puntos de operacion son x = xe y u = ue. Para estudiar comportamientos localesdel sistema al rededor del punto de operacion, se asume que las variables desviacion x = x − xe y u =u−ue son senales pequenas, tal que las perturbaciones no lineales al rededor del punto de operacion puedenser despreciadas con respecto a los terminos lineales. Utilizando el cambio de variables por las variables

2.7. DIAGRAMAS EN BLOQUES 33

desviacion, y tomando w = y − h(xe, ue), ademas del hecho que por series de Taylor, y despreciando losterminos de orden superior, se tiene que

f(x, u) = f(xe, ue) +∂f

∂x(xe, ue)x +

∂f

∂u(xe, ue)u + . . .

Mas formalmente, se puede definir la linealizacion Jacobiana del sistema no lineal (2.22) como

˙x = Ax + Buw = Cx + Du

donde A = ∂f∂x |xe,ue

, B = ∂f∂u |xe,ue

, C = ∂h∂x |xe,ue

, y D = ∂h∂u |xe,ue

. Es importante recalcar que solo sepuede definir la linealizacion de un sistema con respecto a un punto de operacion.

Es decir, si uno generalizara para una funcion con n variables xi, i = 1, . . . , n tendrıamos que esta selinealiza como

f(x1, . . . , xn) = f(x1, . . . , xn) +

n∑

k=1

∂f

∂xk

∣∣∣∣(x1,...,xn)

(xk − xk) (2.23)

Ejemplo 2.6.3 [31] Sea la funcion

f(x, y, z) = 2x2 + xy2 − 3y

z

Demuestre que la aproximacion lineal de f(·) en x = 1, y = 2, y z = 3 es f = 8x + 3y + 23 z.

2.7. Diagramas en Bloques

Previamente, se habıan utilizado sumadores, integradores, y bloques de ganancia unicamente parahacer una representacion en diagramas en bloques. Ahora, tendremos bloques que representaran directamentela funcion de transferencia, por lo cual si quisieramos representar las condiciones iniciales de un determinadosistema, tendrıamos que tener bloques adicionales que representaran dicha energıa inicial [5, 28, 7, 22].

En la Figura 2.15 [31, 22] se muestran algunas de las reglas de diagramas en bloques que se utilizaran.Sin embargo, a continuacion se describen de manera mas profunda algunas de ellas.

Figura 2.15: Algunas reglas utiles cuando se manejan diagramas en bloques [31, 22].


2.7.1. Combinacion en Serie

Se dice que se tiene una combinacion en serie cuando se tienen dos funciones de transferencia conec-tadas una despues de otra. En la Figura 2.16 [7] se muestra un sistema cuya salida X3(s) = X2(s)G2(s)esta conectada con un sistema que tiene una salida X2(s) = X1(s)G1(s). Reemplazando W (s) en la primeraecuacion, se tiene que X3(s) = X1(s)G1(s)G2(s), lo que es equivalente al diagrama en bloques que tambiense puede ver en la Figura 2.16 [7].

Figura 2.16: Combinacion Serie [7].

2.7.2. Combinacion en Paralelo

Cuando dos sistemas tienen una entrada en comun, y sus salidas estan “atadas” a un sumador, setiene una combinacion en paralelo. Analıticamente, se tendrıa que X1(s) = X(s)F1(s), X2(s) = X(s)F2(s), yY (s) = X1(s)+X2(s). Ası pues, el diagrama en bloques se puede reducir tal que Y (s) = X(s)(F1(s)+F2(s)).

2.7.3. Puntos de Partida

Un pick-off point es un punto donde llega una variable y de ahı se divide en mas de un bloque. LasFiguras 2.17 y 2.18 [7] muestran un par de ejemplos.

Figura 2.17: Ejemplo de puntos de partida [7].

Figura 2.18: Ejemplo de puntos de partida [7].

2.7.4. Bloques con Sumadores

Las Figuras 2.19 y 2.20 [7] muestran un par de ejemplos.

2.8. LEY DE MASON 35

Figura 2.19: Ejemplo del algebra de bloques [7].

Figura 2.20: Ejemplo del algebra de bloques [7].

2.7.5. Sistemas Retroalimentados

En la Figura 2.21, G(s) se conoce como la forward transfer function, mientras que H(s) se conocecomo la feedback transfer function. El conjunto G(s)H(s) se conoce como la open-loop transfer function. Lafuncion de transferencia que relaciona la entrada y la salida de un sistema retroalimentado como el que seve en la Figura 2.21 serıa,

T (s) =G(s)

1∓G(s)H(s)

Figura 2.21: Ejemplo del algebra de bloques para sistemas retroalimentados [7].

2.7.6. Ejemplos

2.8. Ley de Mason

En [18, 17] S. Mason definio las ideas para resolver ecuaciones lineales utilizando grafos o diagramasde flujo, pero teniendo en cuenta aquello que Tustin omitio en un artıculo previo. Esto dio origen a lo quese conoce como Mason´s gain formula.

Los diagramas de flujo son una forma alternativa de representar graficamente los sistemas dinamicos.Las senales se representan en estos casos por medio de nodos que estan conectados entre si por ramas. Cadanodo representa una variable del sistema, y cada rama que conecta dos nodos representa una funcion detransferencia o ganancia. El flujo va en una unica direccion, la cual se indica mediante una flecha. Sobre esta,se coloca el valor de la ganancia entre dos nodos, lo que indica una relacion entre dos senales determinadas.La idea es poder utilizar este tipo de ideas para poder obtener relaciones entrada salida sin tener que utilizarel algebra de bloques descrito previamente.

A continuacion se explicara la terminologıa utilizada, y luego se definira dicha formula. Estas defini-ciones fueron sacadas del [22].


Definition 5 Un nodo es un punto que representa una variable o senal.

Definition 6 Una rama es un segmento lineal dirigido que une dos nodos.

Definition 7 Un nodo de entrada (source) es un nodo que solo tiene una rama saliente. Un nodo de salida(sink) es un nodo que solo tiene ramas entrantes. Un nodo mixto es aquel que tiene tanto ramas de entraday de salida. Un nodo suma las senales de todas las ramas entrantes y transmite esta suma a todas las ramassalientes.

Definition 8 Un trayecto es una conexion entre ramas de un nodo a otro con las flechas en la mismadireccion. Es decir, todas las senales van en la misma direccion de un nodo a otro.

Un trayecto directo es aquel que conecta un nodo de entrada con un nodo de salida donde ningun nodose encuentra mas de una vez.

Definition 9 Un lazo es una trayectoria cerrada (loop) en la cual ningun nodo se repite. Notese que ningunnodo de entrada puede ser parte de una trayectoria cerrada ya que cada nodo en un lazo debe tener al menosuna rama que llegue al nodo y al menos otra rama saliendo.

Se dice que un lazo es disyunto cuando no se tiene un nodo en comun.

Definition 10 La ganancia del trayecto es el producto de las funciones de transferencia de todas las ramasdel trayecto.

Es claro que para un sistema dado pueden existir varias formas de realizar el diagrama de flujo. Paradeterminar la relacion entrada salida, se puede reducir el diagrama de flujo utilizando algebra (similar a loque vimos previamente), o se puede utilizar le ley de Mason que definimos a continuacion. La funcion detransferencia entre un nodo de salida y uno de entrada, esta dada por

F (s) =1

∆

n∑

k=1

Pk∆k (2.24)

donde n es el numero de trayectos directos, Pk es la ganancia del trayecto directo k, ∆ es el determinantedel diagrama, y ∆k es el cofactor del determinante de la k-esima trayectoria directa del diagrama eliminandolos lazos que se tocan en el k-esimo camino directo; esto es, se eliminan los lazos que tocan el camino directoPk. ∆ se define a continuacion.

∆ = 1 −∑

a

La

︸︷︷︸

+∑

b,c

LbLc

︸︷︷︸

−∑

d,e,f

LdLeLf

︸︷︷︸

+ . . .

Suma de todas las Suma de los productos Suma de los productosganancias de ganancias de ganancias de

lazos individuales lazos disyuntos (dos) lazos disyuntos (tres)

Capıtulo 3

Caracterısticas de los Sistemas

Pero las lenguas son sustancias radioactivas que hunden sus raıces en nuestro corazon mas primitivo,

en la oscura e irracional memoria de la horda. Rosa Montero

3.1. Introduccion

Como se ha visto previamente, un sistema de control se compone de una serie de elementos que estaninterconectados de tal forma que se obtiene una respuesta deseada del sistema. Ya que lo que uno deseaes conocido, una senal proporcional al error producido entre la senal deseada y la actual se puede generar(ver Figura 4.1p213). Para ello, algun tipo de retroalimentacion es necesaria, la cual redundara en un mejorcomportamiento del sistema. Es claro que este tipo de retroalimentacion aparece en varios sistemas en lanaturaleza, como lo son los sistemas biologicos y fisiologicos.

ANADIR FIGURA

Para poder entender las ventajas y caracterısticas a la hora de introducir la retroalimentacion, com-paremos con un sistema en malla abierta como el de la Figura...

ANADIR FIGURA

En este caso, es claro que la perturbacion TD(s) influye directamente Y (s), por lo que en ausenciade retroalimentacion, el sistema de control es bastante sensible a las perturbaciones y a los cambios en losparametros de G(s).

Por otro lado, un sistema retroalimentado negativamente serıa como el que se observa en la Figura...

ANADIR FIGURA

A pesar de la complejidad, se tiene una serie de ventajas como:

1. Decremento de la sensitividad del sistema a variaciones en los parametros del proceso.

2. Mejora el rechazo a perturbaciones.

3. Mejora la atenuacion de la medicion del ruido.

4. Reduce el valor del error en estado estacionario del sistema.

5. Mas facil de controlar y ajustar la respuesta transitoria del sistema.

37

38 CAPITULO 3. CARACTERISTICAS DE LOS SISTEMAS

3.2. Senal de Error

El sistema de la Figura... tiene tres entradas (i.e., R(s), D(s), N(s)), y una salida Y (s). El error deseguimiento estarıa dado por

E(s) = R(s)− Y (s)

Si asumimos que H(s) = 1 por simplicidad, se tiene que

Y (s) =Gc(s)Gp(s)

1 + Gc(s)Gp(s)R(s) +

Gp(s)

1 + Gc(s)Gp(s)D(s)− Gc(s)Gp(s)

1 + Gc(s)Gp(s)N(s) (3.1)

Por lo que el error vendrıa dado por

E(s) =1

1 + Gc(s)Gp(s)R(s)− Gp(s)

1 + Gc(s)Gp(s)D(s) +

Gc(s)Gp(s)

1 + Gc(s)Gp(s)N(s) (3.2)

Definamos la funcionL(s) = Gc(s)Gp(s)

como la ganancia de lazo, lo cual darıa

E(s) =1

1 + L(s)R(s)− Gp(s)

1 + L(s)D(s) +

Gc(s)Gp(s)

1 + L(s)N(s)

Por otro lado, se defineF (s) = 1 + L(s)

con lo que la funcion de sensitividad serıa

S(s) =1

F (s)(3.3)

y la funcion de sensitividad complementaria serıa

C(s) =L(s)

1 + L(s)

Por lo tanto (3.2) se convertirıa en

E(s) = S(s)R(s)− S(s)Gp(s)D(s) + C(s)N(s) (3.4)

Analizando (3.4) se puede ver que para un Gp(s) dado, si queremos minimizar el error, se necesita que S(s)y C(s) sean lo mas pequenos posibles. Sin embargo, ambas funciones dependen de Gc(s), y ademas

S(s) + C(s) = 1

Por lo que no podrıan minimizarse ambas funciones al tiempo. Para poder entender que significa que unafuncion sea grande o no, analicemos la magnitud de L(s), i.e., |L(jω)| a lo largo de un rango de frecuenciasω de interes. Para reducir la influencia de D(s) en E(s) se quiere que L(s) sea grande en el rango de

frecuencias que caracterizan la perturbacion. Por ende,Gp(s)1+L(s) sera pequeno, haciendo que la influencia de

D(s) disminuya. Al tener L(s) = Gc(s)Gp(s) se requiere que la magnitud de Gc(s) sea alta. Para atenuar lainfluencia del ruido N(s) en E(s), se requiere que L(s) sea pequeno en el rango de frecuencias que caracterizan

el ruido. Por ende, L(s)1+L(s) sera pequeno, haciendo que Gc(s) tenga que tener una magnitud pequena en ese

mismo rango de frecuencias.

3.3. Sensitividad de Sistemas de Control para Variaciones de Parame-tros

Un proceso Gp(s) esta sujeto a una gran cantidad de variaciones en sus parametros que afectan elproceso de control. En un sistema de malla abierta esta redundarıa en bastantes errores en la salida, mientras

3.3. SENSITIVIDAD DE SISTEMAS DE CONTROL PARA VARIACIONES DE PARAMETROS 39

que en un sistema de malla cerrada esto podrıa reducirse gracias al sensado de la salida en la entrada. Paraello, la sensitivdad es de vital importancia.

Por ejemplo, si GcGp >> 1 para toda frecuencia, la salida serıa Y (s) ≈ R(s) cuando D(s) = N(s) = 0.Esto implicarıa que la salida y la entrada serıan similares, pero GcGp >> 1 causarıa oscilaciones y se podrıallegar a la inestabilidad del sistema.

El hecho de que aumente la magnitud de la ganancia de lazo, disminuye el efecto de Gp(s) en la salida,es de mucha utilidad. Por lo tanto, la primera ventaja de un sistema retroalimentado es que el efecto en lasvariaciones de los parametros del proceso Gp(s) se ve reducida.

Supongamos que la planta se ve sujeta a una serie de cambios en los parametros (e.g., cambios delambiente, envejecimiento) de tal forma que la verdadera funcion de transferencia del proceso es

Gp(s) + ∆Gp(s)

Consideremos los efectos que se producen en el error E(s) debidos a ∆Gp(s), asumiendo que D(s) = N(s) = 0,y que solo tenemos como entrada la referencia.

E(s) + ∆E(s) =1

1 + Gc(s)(Gp(s) + ∆Gp(s))R(s)

Sabiendo la relacion que existe entre E(s) y R(s), se tiene que

∆E(s) = − Gc(s)∆Gp(s)

(1 + Gc(s)(Gp(s) + ∆Gp(s)))(1 + Gc(s)Gp(s))R(s)

Por lo general, Gc(s)Gp(s) >> Gc(s)∆Gp(s), i.e.,

∆E(s) ≈ −Gc(s)∆Gp(s)

(1 + L(s))2R(s)

Esto quiere decir que el error se ve reducido por un factor 1+L(s), el cual por lo general se hace mucho masgrande que 1 en el rango de frecuencias de interes. Es decir que por lo general, 1 + L(s) ≈ L(s), haciendoque

∆E(s) ≈ − 1

L(s)

∆Gp(s)

Gp(s)R(s)

La sensitividad se vera reducida para cambios en el proceso siempre y cuando L(s) sea grande, i.e., sensi-tividad S(s) menor. Para este caso, la sensitividad del sistema se define como la proporcion de cambioen la funcion de transferencia del sistema a cambios en el Gp(s) para pequenos cambios incrementales. Esdecir, si la funcion de transferencia del sistema es

T (s) =Y (s)

R(s)

S(s) =∆T (s)/T (s)

∆Gp(s)/Gp(s)

En el lımite, para pequenos cambios, esta ecuacion se convierte en

STGp

(s) =∂T (s)

∂Gp(s)

Gp(s)

T (s)=

∂ ln T (s)

∂ ln Gp(s)

La sensitividad en malla abierta a cambios de la planta Gp(s) es igual a 1. Demostremos que en mallacerrada, se tiene lo mismo obtenido previamente.

T (s) =Gc(s)Gp(s)

1 + Gc(s)Gp(s)

STGp

(s) =∂T (s)

∂Gp(s)

Gp(s)

T (s)=

Gc(s)

(1 + Gc(s)Gp(s))2Gp(s)

Gc(s)Gp(s)1+Gc(s)Gp(s)

=1

1 + Gc(s)Gp(s)

40 CAPITULO 3. CARACTERISTICAS DE LOS SISTEMAS

En muchos casos, lo que se busca obtener es la sensitividad a variaciones de un parametro α de la funcionde transferencia del proceso Gp(s), i.e., ST

α . Utilizando la regla de la cadena, se tiene que

STα (s) = ST

Gp(s)SGp

α (s)

Cuando la funcion de transferencia del sistema depende de un parametro α que esta sujeto a variaciones delestado, i.e.,

T (s) =N(s, α)

D(s, α)

Su funcion de sensitividad estarıa dada por

STα (s) =

∂ ln T (s)

∂ ln α=

∂ ln N(s, α)

∂ ln α

∣∣∣∣α0

− ∂ ln D(s, α)

∂ ln α

∣∣∣∣α0

= SNα (s)− SD

α (s)

donde α0 es el valor nominal del parametro.

Ejemplo 3.3.1 Se tiene el sistema en malla cerrada con retroalimentacion negativa unitaria y ganancia delazo −Ka

1+Ka(β+1) como se ve en la Figura...

ANADIR FIGURA

La funcion de transferencia esta dada por

T (s) =

−Ka

1+Ka(β+1)

1− Ka

1+Ka(β+1)

=−Ka

1 + Kaβ

La sensitividad a variaciones de Ka serıa

STKa

(s) = STGSG

Ka

= ∂T (s)∂G(s)

G(s)T (s)

∂G(s)∂Ka

Ka

G(s)

= ∂T (s)∂G(s)

Ka

T (s)

= 11+Kaβ

Capıtulo 4

Respuesta de los Sistemas

Hemos renunciado a buscar un mundo perfecto quiza porque sabemos que la perfeccion es imposible y a

lo mejor indeseable. Todos aspiramos con las justas a ser sobrevivientes dignos y nos resignamos con

humor a las injusticias, la corrupcion y la violencia que vemos a diario. Alonso Cueto

Antes de iniciar con el diseno de los controladores, necesitamos entender como se comportan lossistemas con respecto a diversas entradas. Los sistemas que analizaremos son sistemas lineales e invariantesen el tiempo (LTI), por lo cual se utilizara la transformada de Laplace para poder analizar el comportamientode sistemas de primero y segundo orden. Luego, se muestra que los sistemas de orden superior son unacombinacion de las respuestas de primer y segundo orden. Las entradas mas comunes en los sistemas decontrol, de las cuales cuatro se ilustran en la Figura 4.1. Estas serıan:

Entrada paso (escalon unitario): Este tipo de entrada se encuentra en varios sistemas como lo sonsistemas de temperatura donde se quiere conservar la misma temperatura en algun lugar determinado.

Entrada rampa: En el aterrizaje automatico de un avion, la aeronave sigue una entrada rampa que leindicara la pendiente de planeacion a seguir (por lo general es igual a 3). Otro ejemplo que se encuentraen la industria es el del tratamiento del calentamiento del acero. La temperatura se incrementa de formagradual a lo largo del tiempo.

Entrada sinusoidal: Su utilidad no parece evidente a simple vista, ya que por lo general no se requiereque un sistema “siga” este tipo de senales. Sin embargo, si se conoce la respuesta de este tipo deentradas en sistemas LTI para todas las frecuencias, se podra tener una descripcion mas completa delsistema. De esta forma, se podran disenar compensadores o controladores para un sistema.

Hay otro tipo de entradas que se pueden utilizar como son las parabolicas, o aquellas que podrıan serdescritas de forma general como

r(t) = tn

Es claro que como su transformada de Laplace es

R(s) =n!

sn+1

su respuesta estara relacionada con otras senales de prueba.

En el siguiente analisis se vera que la respuesta en tiempo de un sistema esta compuesto de doselementos: (i) la respuesta transitoria (o respuesta natural), que es aquella que representa la forma como seva desde el estado inicial hasta el estado final, y (ii) la respuesta en estado estacionario (o entrada forzada),que representa el comportamiento del sistema cuando el tiempo tiende a infinito.

Para el siguiente analisis, se presentan ejemplos y simulaciones en Matlab y Simulink. Las siguientesnotas han sido adaptadas a partir de varios textos de control (e.g., [22, 31, 28, 7]).

41

42 CAPITULO 4. RESPUESTA DE LOS SISTEMAS

0 2 4 6 8 100

0.5

1

1.5

2Entrada paso

tiempo0 2 4 6 8 10

0

2

4

6

8

10Entrada rampa

tiempo

0 2 4 6 8 10−1

−0.5

0

0.5

1Entrada senoidal

tiempo0 2 4 6 8 10

0

20

40

60

80

100Entrada parabólica

tiempo

Figura 4.1: Diversos tipos de entradas comunes en el analisis de sistemas de control.

4.1. Sistemas de Primer Orden

Asumamos que se tiene un diagrama en bloques como el que se muestra en la Figura... Utilizando lovisto en el capıtulo anterior, se tiene que la funcion de transferencia viene dada por

H(s) =K

τs + 1(4.1)

La salida de este sistema es igual a C(s) = R(s) Kτs+1 , donde R(s) puede ser una entrada paso, rampa, o

sinusoidal. Algunas veces vale la pena estudiar la entrada impulso.

4.1.1. Entrada paso

Si se tiene una entrada paso, entonces R(s) = 1s por lo que, utilizando fracciones parciales, C(s) se

vuelve igual a

C(s) =K

s− K

s + 1τ

Tomando la transformada inversa de Laplace, se obtiene que

c(t) = K(

1− e−tτ

)

(4.2)

En lıneas generales, la salida c(t) se puede escribir como

c(t) = css(t) + ctr(t)

donde ctr(t) corresponde a la respuesta que va del estado inicial al estado final, y css(t) corresponde a lamanera como se comporta la salida del sistema conforme t→∞.

La Figura 4.2 ilustra el resultado de (4.2) cuando K = 1, y τ = 10. En (4.2) la primera parte dela respuesta corresponde a la respuesta en estado estacionario, mientras que la segunda parte, i.e., Ke−

tτ

corresponde a la respuesta transitoria del sistema. Esto se debe a que si tomamos el lımite cuando t tiendea infinito de (4.2) , obtenemos que

lımt→∞

c(t) = lıms→0

sC(s) = K

4.1. SISTEMAS DE PRIMER ORDEN 43

Por lo cual K corresponde al valor final o el valor en estado estable. La constante τ se conoce como laconstante de tiempo, y como se puede observar en la figura, despues de 4τ o 5τ el sistema ya esta cerca delvalor final. Por lo general, para t ≥ 4τ la respuesta permanece dentro del 2 % del valor final.

0 10 20 30 40 50 60 70 800

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Step Response

Time (sec)

Am

plitu

de

Figura 4.2: Respuesta a entrada paso del sistema de primer orden (4.1) cuando K = 1, y τ = 10. La lıneapunteada roja representa el valor final cuando se ha cumplido el primer τ , mientras que la punteada negrarepresenta el valor final cuando se han cumplido 2τ .

Otro punto interesante a analizar es lo que puede verse en la Figura 4.2. Cuando t = τ , el valor finales igual al 63.2 % del valor final, ya que c(τ) = K −Ke−1 = 0,632K. Cuando t = 2τ se llega al 86.5 % delvalor final. Estos dos puntos se representan en la Figura 4.2. Ası pues, cuando la constante de tiempo τ espequena, la respuesta es mas rapida, y esto se puede ver porque la pendiente de la curva en t = 0 es igual aKτ .

4.1.2. Entrada rampa

En este caso, la funcion de transferencia expandida viene dada por

C(s) =K

s2− Kτ

s+

Kτ

s + 1τ

Por lo tanto, en tiempo esto viene siendo equivalente a

c(t) = Kt−Kτ + Kτe−tτ para t ≥ 0

La Figura 4.3 muestra un par de ejemplos de este tipo de respuesta. Para este caso, Kt−Kτ corresponde alestado estacionario, mientras que Kτe−

tτ corresponde a la respuesta natural. El error en este caso vendrıa

dado por e(t) = Kr(t)− c(t), por lo que

e(t) = Kτ + Kτe−tτ

Tomando el lımite de esta senal, tendremos que lımt→∞ e(t) = Kτ . Por lo tanto, entre mas pequeno Kτmenor sera la diferencia entre la entrada y la salida en estado estacionario. Esto se puede apreciar masclaramente si comparamos las dos graficas en la Figura 4.3. En el panel superior el valor del error es 10,mientras que en el segundo caso es igual a 1. De esta forma, se puede observar claramente como el errordisminuye.


0 10 20 30 40 50 60 70 800

10

20

30

40

50

60

70

80

Respuesta rampa de un sistema de primer orden con τ = 10

Time (sec)

Am

plitu

de

0 10 20 30 40 50 60 70 800

10

20

30

40

50

60

70

80

Respuesta rampa de un sistema de primer orden con τ = 1

Time (sec)

Am

plitu

de

Figura 4.3: Respuesta a entrada rampa del sistema de primer orden (4.1) cuando K = 1, y τ = 10 para elpanel superior, y τ = 1 para el panel inferior.

4.2. Sistemas de Segundo Orden

Consideremos el diagrama en bloques que se ve en la Figura 4.4, el cual podrıa ser equivalente a un

sistema que representa un servosistema con una funcion de transferencia dada por C(s)R(s) = K

Js2+Bs+K , donde

K es una constante de proporcionalidad, B es una constante de friccion y J es una constante de inercia.Manipulando algebraicamente esta ecuacion, obtendremos

C(s)

R(s)=

KJ

s2 + BJ s + K

J

Una forma conveniente y estandar de escribir dicha expresion es

C(s)

R(s)=

w2n

s2 + 2ζwns + w2n

(4.3)

Esta forma se conoce como la forma estandar del sistema de segundo orden. Para el caso especıfico delservosistema descrito previamente, w2

n = KJ , y 2ζwn = 2σ = B

J . El termino wn se conoce como la frecuencianatural no amortiguada, ζ es el factor de amortiguamiento relativo del sistema, y σ es la atenuacion. Elfactor de amortiguamiento relativo ζ es el cociente real B y el amortiguamiento crıtico Bc = 2

√JK.

Figura 4.4: Sistema de segundo orden [7]. En a) se tiene el grafo, mientras que en b) el diagrama en bloques.

El comportamiento dinamico del sistema se describe en terminos de wn y ζ. Como se vio previamente,si 0 < ζ < 1 los polos del sistema son complejos conjugados y se encuentran ubicados en el semi-planoizquierdo del plano-s. En este caso, se dice que el sistema es subamortiguado y su respuesta transitoriaes oscilatoria. Si ζ = 0, la respuesta transitoria no es amortiguada, y si ζ = 1 el sistema se denominacrıticamente amortiguado; finalmente, si ζ > 1 el sistema es sobreamortiguado. A continuacion se analizaranalgunos de estos casos.

4.2. SISTEMAS DE SEGUNDO ORDEN 45

4.2.1. Respuesta a Entrada Paso

Caso Subamortiguado (0 < ζ < 1)

La Ecuacion (4.3) se puede escribir en este caso como

C(s)

R(s)=

w2n

(s + ζwn + jwd)(s + ζwn − jwd)

donde la frecuencia natural amortiguada del sistema wd es igual a wd = wn

√

1− ζ2. Si R(s) es una entradapaso, se tiene que

C(s) =w2

n

s(s+ζwn+jwd)(s+ζwn−jwd)

= 1s −

s+2ζwn

s2+2ζwn+w2n

= 1s −

s+ζwn

(s+ζwn)2+w2

d

− ζwn

(s+ζwn)2+w2

d

Recordando la transformada inversa de Laplace para este caso, se tiene que

L−1

[s + ζwn

(s + ζwn)2 + w2d

]

= e−ζwnt cos(wdt)

L−1

[wd

(s + ζwn)2 + w2d

]

= e−ζwnt sin(wdt)

Esta ultima ecuacion podrıa asociarse a la que tenıamos previamente de la siguiente forma

L−1

{ζwn

wd

wd

(s + ζwn)2 + w2d

}

=

(

ζ√

(1− ζ2)

)

e−ζwnt sin(wdt)

Por lo tanto,

c(t) = 1− e−ζwnt cos(wdt)−(

ζ√

(1− ζ2)

)

e−ζwnt sin(wdt)

Si se utiliza la identidad trigonometrica C cosβ + D sin β =√

C2 + D2 sin(β + tan−1 C

D

), se obtiene

c(t) = 1− 1√

(1− ζ2)e−ζwnt sin

(

wdt + tan−1

√

(1− ζ2)

ζ

)

(4.4)

De (4.4) se puede deducir que la frecuencia de oscilacion por parte de la respuesta transitoria es igual a wd,i.e., depende directamente de ζ. Si analizaramos la senal de error para este caso, obtendrıamos que

e(t) = r(t)− c(t)

= e−ζwnt

(

cos(wdt) + ζ√(1−ζ2)

sin(wdt)

)

Como se puede ver, la senal de error presenta una oscilacion amortiguada, por lo que si t→∞, entonces noexiste error. El unico caso crıtico serıa si ζ = 0, donde se tiene una oscilacion permanente, con una frecuenciawn (porque?). Un ejemplo de como serıa la respuesta en tiempo para diversos casos se ilustra en la Figura4.5.

Caso Crıticamente Amortiguado (ζ = 1)

Si los dos polos de (4.3) son iguales, el sistema tendrıa que ζ = 1, por lo que a entrada paso se tieneque

C(s) =w2

n

s(s + wn)2


0 2 4 6 8 10 12 14 16 18 200

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

2Figura cuando ξ = 0

0 2 4 6 8 10 12 14 16 18 200

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6Figura cuando ξ = 0.2

0 2 4 6 8 10 12 14 16 18 200

0.2

0.4

0.6

0.8

1

1.2


0 2 4 6 8 10 12 14 16 18 200

0.2

0.4

0.6

0.8

1

1.2


Figura 4.5: Respuesta a entrada paso del sistema de segundo orden descrito por (4.3). En este caso, se tieneque ζ = 0 para el panel superior izquierdo, ζ = 0,2 para el panel superior derecho, ζ = 0,4 para el panelinferior izquierdo, y ζ = 0,8 para el panel inferior derecho. En todos los casos, wn = 24.

La transformada inversa de Laplace serıa

c(t) = 1− e−wnt(1 + wnt) (4.5)

Esto parte de la base que si ζ = 1, tocarıa aproximar uno de los factores de (4.4) a

lımζ→1

sin(wdt)√

1− ζ2= wnt

La Figura 4.6 muestra un ejemplo de como responderıa el sistema para este caso.

0 2 4 6 8 10 12 14 16 18 200

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9


Figura 4.6: Respuesta a entrada paso del sistema de segundo orden descrito por (4.3) cuando ζ = 1 y wn = 24.


Caso Sobreamortiguado (ζ > 1)

En este caso, los dos polos de la funcion de transferencia en (4.3) son reales negativos y diferentes.Para una entrada paso, se tiene que

C(s) =w2

n

s(s + ζwn + wn

√

ζ2 − 1)(s + ζwn − wn

√

ζ2 − 1)

La transformada inversa de Laplace nos da

c(t) = 1 +wn

2√

ζ2 − 1

(e−s1t

s1− e−s2t

s2

)

(4.6)

donde s1 = ζwn + wn

√

ζ2 − 1 y s2 = ζwn − wn

√

ζ2 − 1. Si se analiza (4.6) se puede ver que se tienendos factores exponenciales que decaen. Entre mas grande es el valor de ζ, uno de las exponenciales decaemas rapidamente (s2 serıa considerablemente menor a s1, por lo que la exponencial asociada a este polopodrıa “despreciarse”). El efecto que tiene s2 en el sistema serıa muchısimo mas relevante, por lo cual (4.6)se aproxima mediante

C(s)

R(s)=

s2

s + s2

Esta respuesta es similar a la respuesta de un sistema de primer orden. La Figura 4.7 muestra un ejemplode esta situacion.

0 2 4 6 8 10 12 14 16 18 200

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9


Figura 4.7: Respuesta a entrada paso del sistema de segundo orden descrito por (4.3) cuando ζ = 2 y wn = 24.

Entrada Impulso

Para este caso, se tendrıa que

C(s) =w2

n

s2 + 2ζwns + w2n

Por lo tanto, la respuesta en tiempo del sistema estarıa dada por

c(t)wn

√

1− ζ2e−ζwnt sin

(

wn

√

1− ζ2t)

Es claro que este factor es la derivada del termino que se obtuvo en la seccion anterior para entrada paso.En la Figura... se observa el comportamiento para diferentes ζs.


4.2.2. Caracterısticas Temporales del Sistema Subamortiguado

Para este caso, se asumira que se tiene una funcion de transferencia de la forma

H(s) =k

s2 + 2ζwns + w2n

Esto puede ser escrito como

H(s) = K1w2

n

s2 + 2ζwns + w2n

= K1H1(s) (4.7)

Por lo general, al disenar un sistema de control se especifican ciertas caracterısticas que se definen en el ambitodel tiempo. Estas caracterısticas estan ligadas a la respuesta transitoria, la cual depende de la entrada o laperturbacion que se le aplique al sistema. La entrada clasica que se utiliza para ver dicho comportamiento esel escalon unitario, ya que es facil de generar y es lo suficientemente drastico para observar el comportamientodel sistema (ademas, al conocer su respuesta en tiempo, se pueden obtener todas las demas respuestas). Comoesta respuesta depende de las condiciones iniciales, se asumira que estas son cero, i.e., el sistema esta enreposo al inicio.

Asumiendo que se tiene una entrada paso y el sistema es subamortiguado, se vio previamente que estopuede ser escrito como

C(s) = K1w2

n

s(s2 + 2ζwns + w2n)

C(s) = K1

(1s −

s+2ζwn

s2+2ζwns+w2n

)

= K1

(1s −

s+ζwn

(s+ζwn)2+w2

d

− ζwn

(s+ζwn)2+w2

d

)

Utilizando lo visto previamente, se obtiene finalmente que

c(t) = K1

(

1− 1√

(1− ζ2)e−ζwnt sin

(

wdt + tan−1

√

(1− ζ2)

ζ

))

(4.8)

Para simplificar nuestro analisis, se asumira que K1 = 1.

La Figura 4.10 muestra un ejemplo de la senal c(t) en (4.3). En esta figura, se pueden identificar cincopuntos importantes:

tr: tiempo de subida. Es el tiempo que se necesita para subir del 10 al 90 por ciento del valor final (comose muestra en la Figura 4.10). Sin embargo, esta definicion aplica mas para el caso sobreamortiguado.La definicion que se utilizara aca es el tiempo que toma la senal de pasar del 0 al 100 % del valor final.

Utilizando (4.4), tenemos que el tiempo de subida viene dado cuando c(tr) = 1. Esto quiere decir que

1 = c(t) = 1− 1√

(1− ζ2)e−ζwntr sin

(

wdtr + tan−1

√

(1− ζ2)

ζ

)

Como e−ζwntr 6= 0, esta ecuacion se puede escribir como

tan(wdtr) = − 1√

(1− ζ2)

En la Figura 4.8 se muestra una solucion grafica para poder despejar la tangente en la ecuacion anterior.Eso serıa igual a

tr =1

wdtan−1

(wd

−σ

)

Entonces,

tr = π−βwd


Figura 4.8: Ubicacion de los polos en el plano-s [7]. Para este caso β = θ, σ = ζwn, y wd = wn

√

1− ζ2.

tp: tiempo de pico. Es el tiempo que se requiere para que la respuesta alcance el primer pico delovershoot.

Para esto, se tiene que hallar la derivada de c(t) evaluada en tp, ya que esta sera igual a 0.

dc

dt

∣∣∣∣t=tp

= 0

Esto serıa equivalente a

ζwne−ζwntp

(

coswdtp +ζ

√

1− ζ2sin wdtp

)

+ e−ζwntp

(

wd sin wdtp −ζwd

√

1− ζ2cos wdtp

)

= 0

Esto es equivalente awn

√

1− ζ2e−ζwntp sin wdtp = 0

Lo que darıa que sin wdtp = 0, por lo que wdtp = 0, π, 2π, . . .. Como el tp corresponde al primer pico,

tp = πwd

Si el sistema es sobreamortiguado, el tiempo de pico no estarıa definido, y en este caso el diseno sueletener en cuenta tr.

MP : Maximo pico porcentual. Es el valor del maximo pico de la respuesta medido con respecto alvalor de estado estable. El valor se define por lo general como

MP =c(tp)− c(∞)

c(∞)× 100%

Utilizando esta idea, se obtiene que

MP = −e−ζwn

πwd

(

cos π − ζ√

1− ζ2sinπ

)

Por lo tanto,


MP = e− ζπ√

1−ζ2 × 100%

ts: tiempo de asentamiento. Es el tiempo que se requiere para que la respuesta del sistema llegue a unrango dentro del cual se considera que el sistema esta en estado estable. Por lo general se utilizan lasreglas del 2 y el 5 % (i.e., estar dentro del 2 o el 5 % del valor final).

Si se analiza el sistema, se puede ver que las curvas 1± e−ζwnt√1−ζ2

son las curvas envolventes de la respuesta

transitoria (ver Figura 4.9). Por lo tanto, la constante de tiempo de estas curvas es τ = 1ζwn

. Como

bien se mencionaba previamente, el ts depende de la tolerancia, i.e., ±2% o ±5% del valor final. Sies el 2 % del valor final, se tendra que esperar 4τ para que el sistema ingrese dentro de esta banda,mientras que si es el 5 %, se tendra que esperar 3τ para que el sistema llegue a este rango. En el primercaso,

ts = 4ζwn

, 2%

mientras que en el segundo caso,

ts = 3ζwn

, 5%

Figura 4.9: Curvas envolventes para la respuesta a entrada paso del sistema de segundo orden [22].

Ganancia DC: Este es el valor en estado estable del sistema.

A partir de todo esto, es claro que si uno desea una respuesta rapida, wn debe ser grande. Ademas,para limitar MP y reducir ts, ζ no debe ser demasiado pequeno. La Figura 4.11 ilustra como serıa la relacionen este caso.


Step Response

Time (sec)

Am

plitu

de

0

0.2

0.4

0.6

0.8

1

1.2

1.4

tr

tp ts

MPDC gain

Figura 4.10: Respuesta a entrada paso del sistema de segundo orden descrito por (4.7). En este caso, K1 = 1,wn = 23,53, and ζ = 0,46.

Figura 4.11: Relacion entre MP y ζ. Ademas, se incluye la relacion entre wntp y el factor de amortiguamiento[7].

Ejemplo 4.2.1 Halle los valores de K y Kh en la Figura 4.12 para que el MP = 20% y tp = 1.

La funcion de transferencia en este caso esta dada por

C(s)

R(s)=

K

s2 + s(1 + KKh) + K

Si comparamos con (4.3), se puede deducir que w2n = K y que 2ζwn = 1 + KKh. Utilizando las ecuaciones

para MP y tp podemos obtener los valores de ζ y wn, para luego obtener las variables deseadas. En este caso,


1

C(s)

K

s +s2

Transfer Fcn

1+sKh

Subsystem

1

R(s)

Figura 4.12: Diagrama en bloques.

se tiene que

e− ζπ√

1−ζ2 = 0,2

Despejando, se obtiene que ζ = 0,456. Como

tp =π

wd

Por lo que al despejar se obtiene que wn = 3,53. Con esto se tiene que K = 12,46 y Kh = 0,1781. La Figura4.13 muestra el resultado de la simulacion utilizando estos valores. Es claro que los parametros de disenofueron cumplidos.

Step Response

Time (sec)

Am

plitu

de

0 0.5 1 1.5 2 2.5 3 3.5 40

0.2

0.4

0.6

0.8

1

1.2

1.4

System: untitled1Peak amplitude: 1.2Overshoot (%): 20At time (sec): 0.988

System: untitled1Settling Time (sec): 2.36

System: untitled1Rise Time (sec): 0.442

System: untitled1Final Value: 1

Figura 4.13: Respuesta a entrada paso del sistema de segundo orden disenado para obtener los parametrosMP y tp definidos en el ejercicio.

4.3. Sistemas de Orden Superior

Por lo general, el analisis que se ha hecho de sistemas de segundo orden nos da una clara vision delcomportamiento de los sistemas. Un concepto que aparece en el analisis previo, es el de raıces dominantes.Estas raıces, que para el caso anterior eran los polos del sistema, son las que contienen la mayor cantidadde informacion sobre el comportamiento del mismo. Para sistemas de orden superior a dos, la respuesta a

4.3. SISTEMAS DE ORDEN SUPERIOR 53

entrada paso se puede asemejar a lo visto previamente, haciendo algunas suposiciones (de esta forma, no esnecesario obtener la transformada inversa de Laplace para determinar el comportamiento del sistema).

Por ejemplo, tomemos el sistema de tercer orden,

T (s) =1

(s2 + 2ζs + 1)(γs + 1)

Si se mostrara el comportamiento en el plano-s se obtendrıa lo que se observa en la Figura 4.14, el cualserıa un sistema normalizado con wn = 1. Clement en (falta ref...) demostro que la performance del sistemacalculada por MP y ts se podrıa asemejar a un sistema de orden dos cuando

∣∣∣∣

1

γ

∣∣∣∣≥ 10|ζwn|

Es decir, que la respuesta de un sistema de tercer orden puede aproximarse a uno de segundo orden por susraıces dominantes siempre y cuando la parte real de dichas raıces sea menor que 1

10 de la parte real de latercer raız.

Figura 4.14: Ubicacion de polos de un sistema de tercer orden en el plano-s [7].

Por otro lado cabe aclarar que el analisis de un sistema de segundo orden es valido si la funcionde transferencia no tiene ceros finitos, ya que si estos estan localizados relativamente cerca de los poloscomplejos dominantes, la respuesta transitoria del sistema se verıa altamente afectada. Por ejemplo, si setiene un sistema cuya funcion de transferencia es de la forma

T (s) =

(ω2

n

a

)

(s + a)

(s2 + 2ζωns + ω2n)

El porcentaje de overshoot a una respuesta escalon unitario sera funcion del termino a/ζ, cuando ζ ≤ 1,como se puede ver en la Figura 4.15.

Otro ejemplo de lo que puede suceder cuando se le anade un polo y un cero adicional se tiene en elsiguiente caso. Asuma que se tiene un sistema cuya funcion de transferencia es de la forma

T (s) =

(ω2

n

a

)

(s + a)

(s2 + 2ζωns + ω2n)(1 + τs)


Figura 4.15: a) Porcentaje de overshoot como funcion de ζ y ωn cuando un sistema de segundo orden poseeun cero. b) Respuesta a entrada paso para diversos valores de a/(ζωn). A=5, B=2, C=1, D=0.5, cuandoζ = 0,45 [7].

Cuyos polos y ceros pueden afectar la respuesta transitoria del sistema. Si a� ζωn y τ � 1/(ζωn), entoncesel polo y el cero no tendran mucho efecto sobre la respuesta a entrada paso. Sin embargo, si se tuviera unsistema donde

T (s) =62,5(s + 2,5)

(s2 + 6s + 25)(s + 6,25)

Entonces, sı habrıa inconvenientes. Por ejemplo, la ubicacion de los polos en el plano-s serıa la que se observaen la Figura 4.16.

Notese que la ganancia DC es igual a 1 (i.e., T (0) = 1), por lo que se espera tener un error en estadoestacionario nulo a entrada paso. A su vez, se tiene que ζωn = 3, τ = 0,16, y a = 2,5. Si quisieramosdespreciar el polo real, la funcion de transferencia serıa

T (s) =10(s + 2,5)

(s2 + 6s + 25)

donde el factor de 62.5 cambio por el de 10 para preservar el valor DC de la funcion. Es claro que en estecaso se tendrıa que ζ = 0,6, y ωn = 5, lo que implicarıa que se tienen polos dominantes acompanados deun cero con a/(ζωn) = 0,833. Utilizando Matlab, se tiene que el MP = 55%, y el ts = 1,33 segundos. Sinembargo, si graficaramos la respuesta a entrada paso del sistema, se ve que se obtiene un overshoot muchomenor (i.e., 38 %), y que el ts aumenta a 1.6 segundos (ver Figura 4.17). Es decir que los efectos de un tercerpolo en T (s) hacen que se amortigue el overshoot, pero que se aumente el tiempo de establecimiento. Por lotanto, no se puede despreciar el tercer polo en este caso.

4.4. UBICACION DE LAS RAICES EN EL PLANO-S Y LA RESPUESTA TRANSITORIA 55

Figura 4.16: Ubicacion de los polos y ceros en el plano-s para un sistema de tercer orden [7].

Step Response

Time (sec)

Am

plitu

de

0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 20

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

System: T2Peak amplitude: 1.54Overshoot (%): 54.4At time (sec): 0.353

System: T1Peak amplitude: 1.38Overshoot (%): 37.9At time (sec): 0.565

System: T2Settling Time (sec): 1.47

System: T1Settling Time (sec): 1.59

Figura 4.17: Respuesta a entrada paso para un sistema de tercer orden con un cero. Si se desprecia el polo(-), el overshoot es mayor, pero su ts es menor. Si no se desprecia (–), se tiene que el overshoot disminuye,haciendo que el tiempo de establecimiento aumente.

4.4. Ubicacion de las Raıces en el Plano-s y la Respuesta Transi-toria

La respuesta transitoria de un sistema retroalimentado en malla cerrada puede ser descrito en terminosde la ubicacion de los polos de la funcion de transferencia. En general se vio que la funcion de transferenciaesta dada por

T (s) =C(s)

R(s)=

∑

k Pk(s)∆k(s)

∆(s)

donde ∆(s) = 0 es la ecuacion caracterıstica del sistema. Para un sistema con ganancia de lazo G(s) yretroalimentacion negativa con ganancia H(s), la ecuacion caracterıstica serıa ∆(s) = 1 + G(s)H(s).


Para un sistema de malla cerrada, los polos de T (s) son las raıces de ∆(s) y a su vez los polos de∑

k Pk(s)∆k(s), por lo que la respuesta transitoria del sistema estarıa descrita por las raıces de ∆(s) (i.e.,los polos y ceros de T (s) estan incluidos en ∆(s)).

La salida de un sistema con ganancia 1 a entrada paso unitaria, donde no hay raıces repetidas sepuede expresar como

C(s) =1

s+

M∑

i=1

Ai

s + σi+

N∑

k=1

Bk + Ck

s2 + 2αks + (α2k + ω2

k)

donde Ai, Bk, Ck son constantes. Las raıces del sistema serıan s = −σi y s = −αk± jωk, por lo que al tomarla transformada inversa se tendrıa una respuesta transitoria que serıa la suma de varios terminos, i.e.,

c(t) = 1 +M∑

i=1

Aie−σit +

N∑

k=1

Dke−αkt sin ωkt + θk

donde Dk es una constante que depende de Bk y Ck, αk, ωk. La respuesta transitoria se compone de la salidaen estado estable, los terminos exponenciales, y los terminos senoidales amortiguados. Para que el sistemasea estable, i.e., para que la salida sea acotada a una entrada paso, la parte real de las raıces −σi y −αk

debe estar ubicada en el semi-plano izquierdo del plano-s. En la Figura 4.18 se ve la respuesta impulso paravarias ubicaciones de las raıces.

Figura 4.18: Respuesta impulso para varias ubicaciones de las raıces en el plano-s. El complejo conjugadono se muestra [7].

A medida que se vaya tomando experiencia, se va a ver que la ubicacion de los ceros tambien esfundamental en la respuesta del sistema. Los polos de T (s) determinan los modos particulares que estaranpresentes en la respuesta, mientras que los ceros estableceran un peso relativo en cada uno de los modos.Por ejemplo, mover un cero cerca de un polo reducira la contribucion relativa del modo correspondiente alpolo. El ejemplo siguiente ilustra mejor estos detalles (ver ppt para el ejemplo...).

Capıtulo 5

Estabilidad de los Sistemas

Me costaba entender que no tenıa que caerle bien a todos para ser respetado, ni tampoco que el agrado

o desagrado que nos procura una persona es algo caprichoso, incapaz de ser explicado solo por la razon

La materia del deseo, Edmundo Paz Soldan

Uno de los problemas que se tiene a la hora de disenar los controladores, es el de la estabilidad. Unsistema puede ser estable o inestable, pero al interactuar con otros dispositivos, las caracterısticas puedencambiar. Existen varios metodos, que sirven de base para el desarrollo de controladores.

Criterio de estabilidad Routh-Hurwitz: este criterio fue de los primeros metodos de estabilidad desa-rrollados. Su importancia radicaba en la consecucion del numero de raıces con parte real positiva, conlo que se podıa determinar si un sistema era o no estable. Se dice que un sistema es de fase mınima sitodos los polos y ceros estan ubicados en el semiplano izquierdo del plano s (si al menos uno se ubicaen el semiplano derecho, se dicen de fase no mınima).

Criterio del lugar de las raıces: Evans desarrollo un metodo grafico que permitıa entender mas clara-mente como se desplazaban los polos y ceros de la ecuacion caracterıstica. Durante muchos anos suuso fue fundamental para el desarrollo de controladores, y en la actualidad existen herramientas decomputador que permiten graficar lugares de las raıces complejos.

Diagramas de Bode y Nyquist: Estas dos herramientas tambien permiten observar el comportamientode un sistema desde un punto de vista practico.

En el siguiente analisis se presentan ejemplos y simulaciones en Matlab y Simulink, ademas de la teorıa delcriterio de estabilidad de Routh-Hurwitz, ademas de una extension a la parte robusta como lo es el metodode Kharitonov. Las siguientes notas han sido adaptadas a partir de varios artıculos y textos de control(e.g., [10, 22, 9, 15, 31, 28, 7, 26]).

5.1. Criterio de Estabilidad Routh-Hurwitz

La funcion de transferencia del sistema de la Figura 6.2 se puede escribir como

C(s)

R(s)=

G(s)

1 + G(s)H(s)

oC(s)

R(s)=

b0sm + b1s

m−1 + . . . + bm−1s + bm

a0sn + a1sn−1 + . . . + an−1s + anm ≤ n (5.1)

donde el denominador se conoce como la ecuacion caracterıstica del sistema. Las raıces de esta ecuaciondefinen la estabilidad del sistema, por lo que estas tienen que estar en el semi-plano izquierdo del plano

57

58 CAPITULO 5. ESTABILIDAD DE LOS SISTEMAS

s. Las ventajas del metodo establecido paralelamente por E. J. Routh y A. Hurwitz es que no se tienenque factorizar el denominador para encontrar exactamente la ubicacion de las raıces. El metodo original sedesarrollo en terminos de los determinantes, pero para explicar de una manera mas clara, se utilizara unaforma mas sencilla que involucra un conjunto de elementos en forma de filas y columnas. En (5.1), se eliminacualquier raız cero (i.e., an 6= 0), y se hace el analisis siempre y cuando todos los coeficientes ai sean positivos,cuando uno esta interesado en estabilidad absoluta del sistema (esto se debe a que si se tienen ai ≤ 0 y almenos un aj > 0, entonces al menos existe una raız imaginaria o con una parte real positiva, lo cual implicaque el sistema es inestable).

1

C(s)

H(s)

H(s)

G(s)

G(s)

1

R(s)

Figura 5.1: Sistema retroalimentado.

El criterio de estabilidad parte de organizar el polinomio de la ecuacion caracterıstica como

a0sn + a1s

n−1 + . . . + an−1s + an = 0

donde todos los coeficientes ai > 0. Luego, se define la siguiente tabla

sn a0 a2 a4 a6

sn−1 a1 a3 a5 a7

sn−2 b1 b2 b3 . . .sn−3 c1 c2 c3 . . .

......

......

...s2 e1 e2

s f1

s0 e2

donde b1 = a1a2−a0a3

a1

, b2 = a1a4−a0a5

a1

, b3 = a1a6−a0a7

a1

, y ası sucesivamente. Por ejemplo, c1 = b1a3−b2a1

b1,

c2 = b1a5−b3a1

b1, y c3 = b1a7−b4a1

b1, entre otros.

El criterio de estabilidad de Routh-Hurwitz propone que el numero de raıces con parte real positivaen la ecuacion caracterıstica es equivalente al numero de cambios de signo en los coeficientes de la primeracolumna de la “matriz”formada previamente. Si todos los coeficientes en esta primera columna son positivos,entonces el sistema es estable.

Ejemplo 5.1.1 Determine la estabilidad del sistema

a0s3 + a1s

2 + a2s + a3 = 0

s3 a0 a2

s2 a1 a3

s a1a2−a0a3

a1

s0 a3

Por lo tanto, para que el sistema sea estable, se requiere que a1a2 > a0a3.

5.1. CRITERIO DE ESTABILIDAD ROUTH-HURWITZ 59

Ejemplo 5.1.2 Determine la estabilidad del sistema

s4 + 2s3 + 3s2 + 4s + 5 = 0

s4 1 3 5s3 2 4 0s2 1 5s −6s0 5

Por lo tanto, al haber dos cambios de signo, existen dos raıces con parte real positiva. Esto puede ser compro-bado directamente utilizando el comando roots en Matlab. En este caso, se obtendrıan las siguientes raıces:−1,28± j0,86 y 0,29± j1,41.

Existen un par de casos especiales que se trataran a continuacion.

1. Caso 1: Si un termino en la primera columna es cero, pero el resto no, el cero se sustituye por un valorpequeno que se denominara ε.

Ejemplo 5.1.3 La ecuacion caracterıstica esta dada por

s3 + 2s2 + s + 2 = 0

s3 1 1s2 2 2s 0 ' εs0 2

Como no hay cambio de signo, pero el sistema presenta un ε, se puede decir que el sistema es crıtica-mente (marginalmente) estable.


s5 + 2s4 + 4s3 + 8s2 + 10s + 6 = 0

s5 1 4 10s4 2 8 6s3 0 ' ε 7s2 8ε−14

ε 6s 7s0 6

Hay dos cambios de signo, ya que ε > 0, por lo que el factor 8ε−14ε < 0. Por lo tanto, el sistema es

inestable.

2. Caso 2: Si toda una fila de elementos es igual a cero, esta tiene que ser sustituida por la derivada dela fila anterior.


s4 + 4 = 0

s4 1 0 4s3 0 0

En este caso, se toma como polinomio auxiliar el que corresponde a la fila anterior a la que se tienellena de ceros. En este caso, P (s) = s4 + 4, y su derivada correspondera ahora a la nueva fila de s3.En este caso, se tendrıa que

s4 1 0 4s3 4 0s2 0 ' ε 4s −16/εs0 4

Hay dos cambios de signo, ya que ε > 0. Por lo tanto, el sistema es inestable.


Este criterio es bastante utilizado en el diseno de controladores.

Ejemplo 5.1.6 Hallar el rango de Kc en la Figura 5.2 para que el sistema sea estable.

1

C(s)

50

30s+1

Transfer Fcn2

0.016

3s+1

Transfer Fcn1

1

10s+1

Transfer Fcn

Kc

Kc

1

R(s)

Figura 5.2: Disenar Kc para que el sistema sea estable

La ecuacion caracterıstica esta dada por

1 + Kc0,016

3s + 1

50

30s + 1

1

10s + 1= 0

Esto se puede escribir como900s3 + 420s2 + 43s + (1 + 0,8Kc) = 0

Utilizando el criterio de estabilidad de Routh-Hurwitz, se tiene que

s3 900 43s2 420 1 + 0,8Kc

s 17160−720Kc

420s0 1 + 0,8Kc

Por lo tanto el rango de Kc tiene que ser −1,25 < Kc < 23,83.

Ejemplo 5.1.7 Se tiene un proceso inestable cuya funcion de transferencia viene dada por

P (s) =1

(s− 1)(s2 + 2s + 2)

Lo que se desea en este caso es utilizar un compensador G(s) de la forma

G(s) =K(s + 2)

s + 3

tal que el sistema en malla cerrada unitaria con retroalimentacion negativa sea estable. Halle el rango de Kpara que esto se logre.

3 < K < 14

68−K −K2 > 0

Por lo que se tiene que

3 < K <

√68,25− 0,5

7,76

Ejemplo 5.1.8 Halle el rango de K en funcion de T para que el sistema sea estable para el sistema de laFigura 5.3.

La ecuacion caracterıstica, esta dada por

s + 1 + Ke−Ts = 0

Sistemas con Tiempo Muerto

Existen sistemas en los cuales la respuesta no es inmediata, con lo que se tiene un tiempo muerto oretardo de transporte. Por lo general, la salida viene siendo una senal desplazada un determinado tiempo T .


1

C(s)

Ke^(Ts)/(s+1)

Kc

1

R(s)

Figura 5.3: Sistema con tiempo muerto

En frecuencia, un desplazamiento en tiempo, implica multiplicar el sistema por una exponencial e−sT . Parapoder hacer el analisis, se utilizan aproximaciones, dentro de las cuales, la mas conocida es la aproximacionde Pade. En general, la aproximacion de Pade de orden n viene dada por

Pd(s) = e−Ts =

∑nk=0(−1)kckT ksk

∑nk=0 ckT ksk

donde

ck =(2n− k)!n!

2n!k!(n− k)!k = 0, . . . , n

Por ejemplo, para n = 1, c0 = 1 y c1 = 1/2. Es decir que la aproximacion de Pade de primer orden vienedada por

e−sT =1− T

2 s

1 + T2 s

Para n = 2, se tiene que c0 = 1, c1 = 1/2 y c2 = 1/12, por lo que se tendrıa que

Pd(s) = e−sT =1− T

2 s + (Ts)2

12

1 + T2 s + (Ts)2

12

Utilizando la aproximacion de Pade descrita previamente, se tiene que

T

2s2 + s

(

1−KT

2+

T

2

)

+ (1 + K) = 0

Utilizando el criterio de Routh-Hurwitz, se tiene que

s2 T2 1 + K

s 1−K T2 + T

2s0 1 + K

Esto implica finalmente que K > −1 y K < 1+ 2T . Se puede ver claramente que a medida que T aumenta, el

rango de ganancia disminuye, por lo cual el tiempo muerto influye bastante en la estabilidad de los sistemas.

5.1.1. Robustez y Estabilidad

El criterio de estabilidad de Routh-Hurwitz determina la estabilidad de un polinomio caracterısticocon coeficientes fijos. Sin embargo, si algunos de los parametros tienen ciertos tipos de incertidumbres (debidoa la planta), o parametros libres como los del controlador en los coeficientes de la ecuacion caracterıstica, senecesita hacer una variacion al criterio de Routh-Hurwitz. Para ello, se introduce a continuacion el criterio deestabilidad de Kharitanov, el cual es util en este tipo de problemas (sin embargo, si el numero de parametroses grande, el analisis se vuelve un poco largo y tedioso) [26].

Asumamos que la funcion de transferencia de una planta esta dada por

P (s) =Kp

s2 + 2ζωnsω2n


A su vez, supongamos que de acuerdo al conocimiento que se tiene de la planta se sabe que se tienen unosrangos para cada uno de los parametros, i.e., Kp ∈ [0,8, 1,3], ζ ∈ [0,2, 0,3] y ωn ∈ [10, 12].

La funcion de transferencia se puede escribir entonces como

P (s) =q0

r0s2 + r1s + r2

donde q0 ∈ [0,8, 1,3], r0 ∈ [1, 1], r1 ∈ [4, 7,2], y r2 ∈ [100, 144]. Es claro entonces que se tendrıan una grancantidad de posibilidades para formar una unica funcion de transferencia del sistema.

Generalizando, se puede ver que cualquier funcion de transferencia que tenga incertidumbre en susparametros se puede escribir de la forma

Pq,r(s) =Np(s)

Dp(s)=

q0sm + q1s

m−1 + . . . + qm

r0sn + r1sn−1 + . . . + rn

donde qk ∈ [q−k , q+k ] para todo k = 0, . . . ,m, y rl ∈ [r−l , r+

l ] para todo l = 0, . . . , n. Los − y + correspondena los lımites inferiores y superiores de los parametros, respectivamente. Las plantas Pq,r(s) con esta clase deincertidumbres se conocen como interval plants. Si se tiene un sistema retroalimentado como el que se ve en

la Figura..., con C(s) = Nc(s)Dc(s)

, la funcion de transferencia vendrıa dada por

T (s) =Nc(s)Np(s)

Dc(s)Dp(s) + Nc(s)Np(s)

Por lo que el sistema serıa robustamente estable si todas las raıces de la ecuacion caracterıstica Dc(s)Dp(s)+Nc(s)Np(s) = 0 estan ubicadas en el semi-plano izquierdo para todas las posibles combinaciones de P (s) ∈Pq,r(s).

ANADIR FIGURA

Ejemplo 5.1.9 Sean

C(s) =s + 2

s2 + 2s + 2

P (s) =q0

r0s3 + r1s2 + r2s + r3

con r0 ∈ [1, 1,1], r1 ∈ [4, 4,2], r2 ∈ [6, 8], r3 ∈ [10, 20], y q0 ∈ [3, 5]. Entonces, el polinomio caracterısticoestarıa dado por

(s2 + 2s + 2)(r0s3 + r1s

2 + r2s + r3) + q0(s + 2) = 0

Expandiendo este polinomio, se tendrıa que

a0s5 + a1s

4 + a2s3 + a3s

2 + a4s + a5 = 0

donde a0 ∈ [1, 1,1], a1 ∈ [6, 6,4], a2 ∈ [16, 18,6], a3 ∈ [30, 44,4], y a5 ∈ [26, 50]. Notese bien que en este casohay seis coeficientes, pero en realidad solo cinco son variables caracterısticas del sistema (i.e., solo los ris yq0 son variables).

Consideremos que el polinomio caracterıstico es

χ = a0sn + a1s

n−1 + . . . + an

donde los coeficientes ak pueden tomar cualquier valor en un intervalo dado [a−k , a+

k ], k = 0, . . . , n, cuyosvalores son independientes de aj , j 6= k. El conjunto de todas las ecuaciones caracterısticas esta dado por

χa :={a0s

n + . . . + an : [a−k , a+

k ], k = 0, . . . , n}

Theorem 5.1.1 Teorema de Kharitanov Todos los polinomios en χa son estables sı y solo sı los siguien-tes cuatro polinomios son estables

a1(s) = a−n + a−

n−1s + a+n−2s

2 + a+n−3s

3 + a−n−4s

4 + a−n−5s

5 + . . .a2(s) = a+

n + a+n−1s + a−

n−2s2 + a−

n−3s3 + a+

n−4s4 + a+

n−5s5 + . . .

a3(s) = a−n + a+

n−1s + a+n−2s

2 + a−n−3s

3 + a−n−4s

4 + a+n−5s

5 + . . .a4(s) = a+

n + a−n−1s + a−

n−2s2 + a+

n−3s3 + a+

n−4s4 + a−

n−5s5 + . . .


En la literatura, los polinomios a1(s), . . . , a4(s) se conocen como los polinomios de Kharitanov. Por mediodel teorema de Kharitanov, la robustez en estabilidad puede ser obtenida al aplicar el teorema de estabilidadde Routh-Hurwitz a cada uno de los cuatro polinomios. Si se ve desde el punto de vista de complejidad, elhecho de haber reducido todo el espacio de posibilidades a solo tener que observar el comportamiento enestos cuatro polinomios es un gran logro.

Capıtulo 6

Sistemas de Control Retroalimentado

Dicen que la manera mas limpia y sana de salir de un presente que agobia y que no vislumbra ningun

futuro es poner marcha atras e internarse en el pasado. Solo el pasado, con sus hechos y recuerdos,

podra esclarecer lo que hoy nos parece tan enredado y oscuro. Quizas. Pero entiendo a los que se

niegan a rebobinar hacia cualquier lado. Si algo tenıamos en comun todos nosotros era que no

querıamos ni mirar ni sentir. Nuestra unica conviccion era no volver a tener ninguna.

Por favor, Rebobinar, Alberto Fuguet

La estrategia de control retroalimentado es tratar de mantener el valor de salida cerca de un valordeseado o set-point por medio de:

1. “Medir”la salida utilizando un dispositivo determinado, independientemente que la salida de un sen-sor/transmisor pueda llegar a alterarse.

2. “Comparar”la variable medida con el valor deseado o set-point para obtener la desviacion (que serıa lasenal de error, o la senal de error retroalimentado).

3. Utilizando esta senal de error, el controlador procesara dicho valor y su salida sera la alimentacion delproceso.

4. Esta salida, antes de ir al proceso pasa por un elemento final de control, el cual se encarga de transmitirdicha senal en las unidades determinadas al proceso.

5. Nuevamente se mide la senal de salida, y se repite el proceso.

Un sistema de control tıpico tiene la forma que se muestra en la Figura 6.1.

A continuacion se analizara en primera instancia lo que sucede con la senal de error que surge alcomparar la variable medida con el valor deseado, para luego ver como funcionan diversos tipos de con-troladores. Las notas de este capıtulo han sido sacadas de varios libros, dentro de los que se destacan[22, 31, 7, 11, 8, 24, 16, 32, 2, 23].

6.1. Analisis de Error

Por lo general, este sistema se analiza como un sistema retroalimentado como el que se muestra en

la Figura 6.2, cuya funcion de transferencia viene dada por C(s)R(s) = G(s)

1+G(s)H(s) . Es bien sabido que los

sistemas responden de manera diferente, dependiendo del tipo de entrada que se aplica al mismo. En estadoestacionario, existen sistemas que tienen errores iguales a cero para una entrada paso, mientras que si laentrada es una rampa o parabola, entonces el sistema ya no tiene a cero de manera asintotica.

65

66 CAPITULO 6. SISTEMAS DE CONTROL RETROALIMENTADO

1

C(s)Gv(s)

VálvulaElemento final de control

Gt(s)

TransmisorElemento Secundario

Gs(s)

SensorElemento Primario

Gp(s)

Proceso

Gc(s)

Controlador

2

D(s)

1

R(s)

Figura 6.1: Sistema de control tıpico. La referencia o el set point viene siendo R(s), mientras que la variablecontrolada es C(s). La perturbacion es D(s).

1

C(s)

H(s)

H(s)

G(s)

G(s)

1

R(s)

Figura 6.2: Sistema retroalimentado.

La funcion de transferencia que relaciona el error E(s) en la Figura... con la entrada esta dado por

E(s)

R(s)=

1

1 + G(s)H(s)

donde el termino G(s)H(s) se conoce como la funcion de transferencia de lazo abierto. Por lo general, estafuncion se puede escribir como

G(s)H(s) = K(Tas + 1)(Tbs + 1) . . . (Tms + 1)

sN (T1s + 1)(T2s + 1) . . . (Tps + 1)

El termino sN representa la multiplicidad de un polo en el origen, y N representa el tipo de sistema que setiene. Entre mas grande sea el valor de N , menor sera la estabilidad del sistema como se vera luego. Caberesaltar que el tipo del sistema es diferente del orden de un sistema.

El error en estado estacionario viene dado por

ess = lımt→∞

e(t) = lıms→0

sE(s)

De acuerdo al sistema de la Figura.... este error se puede escribir como

ess = lıms→0

sR(s)1

1 + G(s)H(s)

Definamos Kp = lıms→0 G(s)H(s), por lo que tendrıamos varios casos dependiendo el tipo de entrada delsistema.

6.2. CONTROLADORES PID 67

1. R(s) = 1s . En este caso, si N = 0, Kp = K, por lo que ess = 1

1+K . Si N ≥ 1, Kp = ∞, con lo queess = 0.

2. R(s) = 1s2 . En este caso, si N = 0, ess =∞. Si N = 1, ess = 1

K . Finalmente, N ≥ 2, Kp =∞, con loque ess = 0.

3. R(s) = 1s3 . En este caso, si N ≤ 1, ess =∞. Si N = 2, ess = 1

K . Finalmente, si N ≥ 3, ess = 0.

6.2. Controladores PID

El controlador de tres terminos como se le conocıa originalmente aparecio por primera vez en 1922[19]. En este artıculo, Minorsky aplicaba por primera vez ideas de control a barcos, y se basaba en el hechode que pequenas desviaciones (producidas por la linealizacion de los elementos) podrıan ser utilizadas paraentender las dinamicas de un sistema bajo control. A continuacion se estudiara el controlador Proporcional,Integral, y Derivativo (PID) en cada una de sus diversas configuraciones.

6.2.1. Controlador Proporcional

El controlador proporcional es el mas simple (sin contar con el controlador ON-OFF). La ecuaciontıpica esta dada por

u(t) = u + Kc(r(t)− y(t)) = u + Kce(t) (6.1)

donde u(t) corresponde a la salida del controlador (por lo general estarıa dada en unidades de psi o mA);u es el valor base (este valor es la salida del controlador cuando el error es 0. Generalmente se fija durantela calibracion del controlador); Kc es la ganancia del controlador, y e(t) es la senal de error. Por lo general,asumiremos que u = 0.

Como se puede ver, si y(t) se incrementa de tal forma que supere a r(t), el error se vuelve negativo,y por ende u(t) decrece. Por otra parte, la salida del controlador es proporcional al error, y esta gananciadetermina cuanto se modifica la salida.

Es claro que como solo tiene un valor que ajustar, se hace mas sencillo. Pero como se vio en la seccionanterior, existe un error en estado estacionario, dependiendo de la entrada que se tenga, y el proceso que seesta controlando.

En algunos casos, los controladores reales no utilizan el termino ganancia sino que utilizan el conceptode Banda Proporcional (BP). Esta es inversamente proporcional a la ganancia Kc, y se define como

BP =100

Kc

En algunos textos se conoce tambien como porcentaje de banda proporcional. Por lo tanto, la ecuacion eneste caso serıa,

u(t) = u +100

BPe(t) (6.2)

Es claro que las Ecuaciones (6.1) y (6.2) son totalmente diferentes, por lo que se tiene que tener saber muybien que tipo de controlador se esta utilizando.

ANADIR EJEMPLO

6.2.2. Controlador Proporcional e Integral

Para evitar ese error en estado estable, se anade un elemento que tiene en cuenta lo que sucede y hasucedido en terminos del error. Esta accion integral o de reajuste tiene como consecuencia que la Ecuacion(6.1) se convierta en

u(t) = u + Kce(t) +Kc

τi

∫

e(t)dt (6.3)


donde τi corresponde al tiempo de integracion o reajuste (por lo general su valor se da en minutos porrepeticiones). Si se ve graficamente, este valor serıa la respuesta que le toma al controlador en repetir laaccion proporcional (ver Figura...).

ANADIR FIGURA

Tanto menor sea τi, mas pronunciada es la curva de respuesta, lo que implica que la respuesta delcontrolador es mas rapida. Otra forma de verlo es que si τi es pequeno, mayor sera el termino constantedelante de la integral, por lo que se le dara mas importancia al controlador. Ademas, recuerdese que la integrales como una suma, por lo que a medida que e(t) cambia, se van integrando todos los valores presentes yanteriores, por lo que el controlador tiende a cambiar su respuesta. Cuando e(t) = 0, la integral no esnecesariamente cero, ya que tiene en cuenta los terminos anteriores.

Algunos fabricantes utilizan un termino conocido como la rapidez de reajuste, que corresponde aτ ri = 1

τi.

ANADIR TABLA FABRICANTES

6.2.3. Controlador Proporcional, Integral, y Derivativo

Al anadir un tercer termino como lo es una accion derivativa, se esta ajustando la rapidez de deri-vacion o de preactuacion. Este nuevo termino tiene como fin anticipar hacia donde va el proceso durantela observacion de la rapidez para el cambio del error, i.e., su derivada. En este caso, la Ecuacion (6.3) seconvierte en

u(t) = u + Kce(t) +Kc

τi

∫

e(t)dt + Kcτdde(t)

dt(6.4)

donde el termino τd corresponde a la rapidez de derivacion, y esta dado por lo general en minutos.

Los controladores PID se utilizan en procesos donde las constantes de tiempo son muy largas. Enprocesos en los que las constantes son cortas, existe una mayor susceptibilidad al ruido, por lo que laderivada tenderıa a amplificarlo. Esto se ve mas claramente al obtener una funcion de transferencia de (6.4)cuando u =, i.e.,

U(s)

E(s)= Kc

(

1 +1

τis+ τds

)

En la practica, esta funcion de transferencia no se suele implementar, sobre todo por lo que se dijo sobreel termino derivativo. Mas adelante veremos otro tipo de funciones de transferencias que sı se suelen im-plementar. En general, el uso de filtros y configuraciones diferentes ayudan a la implementacion de dichoscontroladores.

6.2.4. Controlador Proporcional y Derivativo

Este tipo de controlador se utiliza en procesos donde solo es posible utilizar controladores proporcio-nales, pero que cuentan con cierto tipo de anticipacion. La ecuacion caracterıstica para este caso es

u(t) = u + Kce(t) + Kcτdde(t)

dt(6.5)

Su mayor desventaja radica en el hecho de que unicamente opera con una desviacion en la variable que secontrola. Esto solo puede ser eliminado con la accion integral. Sin embargo, un PD puede soportar mayorganancia.

6.2.5. Implementacion

Dentro de todas las acciones del controlador de tres terminos, la accion derivativa es la mas complicadade implementar, y por eso muchos fabricantes no la utilizan. Los problemas de implementacion radican en:

6.2. CONTROLADORES PID 69

El uso o no de un filtro. Esto con el fin de evitar danos en los actuadores y no amplificar ruidos de altafrecuencia. Estos filtros pueden ser de primero o segundo orden, dependiendo del fabricante.

El punto en el cual la accion derivativa actua, bien sea en la medida o en el error.

Si la accion derivativa actua o no con la accion integral, lo cual depende del algoritmo que se utilice.

El punto de accion depende de si se hace regulacion o tracking. En el primer caso, se requiere que el procesoeste en un estado fijo a pesar de las perturbaciones, por lo que el set point es constante. En este caso, noimporta si la parte derivativa se encuentra a la salida del error o de la medida. Sin embargo, cuando se hacetracking los cambios son bruscos, ya que el set point es variable, por lo que ubicar la parte derivativa conrespecto a la medida es mucho mas util. En estos casos, se suele recurrir tambien al uso del filtro, por lo queel termino derivativo vendrıa siendo:

U(s)

Y (s)= − Kdτds

1 + s τd

N

Este serıa un filtro ideal utilizando un sistema de primer orden con constante de tiempo τd

N . Es claro en estecaso que si las frecuencias son bajas, i.e., s pequeno, se tiene que el factor que predomina es τds, mientrasque si las frecuencias son altas, i.e., s grande, el factor que predomina es τd

τdN

= N , lo cual lo hace constante a

frecuencias altas (N se suele escoger entre 2 y 20). La salida del controlador en este caso serıa para un PIDigual a

U(s) = Kc

(

1 +1

τis

)

E(s)− Kdτds

1 + s τd

N

Y (s)

6.2.6. Sintetizando

Hasta este punto se han visto los controladores P, PI, PD, PID, y los parametros asociados a ellos.Se conoce el concepto de Kc, BP , τi, τR

i , τd. Cabe recordar que la forma en la que se basan la mayorıa deconceptos de sintonizacion esta basada en la funcion de transferencia ideal.

Si se tuviera un sistema de primer ordenKp

τs+1 asociado a un controlador proporcional, se obtendrıa

en malla cerrada que T (s) = K∗

τ∗s+1 , donde

K∗ =KcKp

1 + KcKp

τ∗ =τ

1 + KcKp

Esto implicarıa que el controlador proporcional modificarıa el comportamiento dinamico del sistema, con-servando el orden del mismo, pero modificando los valores de los parametros asociados. Uno de los puntosimportantes es ver la contribucion de Kc en el τ∗. Si KcKp > 0, entonces τ∗ < τ , por lo que se harıa masrapida la respuesta del proceso.

Si en lugar de un regulador proporcional se tuviera un PI, la funcion de transferencia en lazo cerradovendrıa siendo

T (s) =KpKc(τis + 1)

τiτs2 + (τi + KpKcτi)s + KcKp

Es claro que se tiene un cero y dos polos. En el caso anterior, el efecto de P solo era cambiar las caracterısticasdel proceso, i.e., sus parametros. En el caso de un PI, se anaden un polo y un cero a la funcion de transferencia.Si la entrada fuera un escalon unitario, y se factorizara el denominador. se tendrıa algo de la forma

C(s) =1

s

KpKc(τis + 1)

ττi(s− r1)(s− r2)

Es decir que c(t) = A0 + A1er1t + A2e

r2t. Una serie de conclusiones se pueden obtener en este caso:

El cero puede forzar la existencia de un overshoot.


Si r1 y r2 son reales y negativos, el valor se aproxima a su valor final de forma exponencial.

Si r1 y r2 son complejos conjugados con parte real negativa, se tendra una respuesta amortiguadaoscilatoria.

Si al menos uno de los valores r1 o r2 fuera positivo, se tiene un sistema inestable.

No hay offset en este caso.

En el caso de tener un PD en vez de un PI, T (s) tiene un cero y un polo, pero hace que la respuesta transitoriaexhiba error en estado estacionario como el proporcional. Este se va si se tiene un PID, caso en el cual setienen dos polos y dos ceros, y 0 error en estado estacionario.

Por lo tanto, se podrıa decir que las caracterısticas de los controladores clasicos serıan:

Control P: Acelera la respuesta del sistema de control pero posee un offset para todos los procesos, aexcepcion logica de un proceso de capacidad constante.

Control PI: Elimina offsets pero el sistema se vuelve mas oscilatorio. El anadir la accion integral haceque se aumente la inestabilidad si Kc aumenta.

Control PD: Anticipa y estabiliza pero tiene offset como el controlador P.

Control PID: El termino I elimina el offset y las oscilaciones son compensadas por el termino D. Sinembargo, estas amplifican las componentes de ruido de las senales.

6.3. Sintonizacion de Controladores PID

A continuacion se revisan diversas estrategias conocidas para la sintonizacion de los controladoresPID.

6.3.1. Sintonizacion de Controladores PID: Metodo Manual

Es basicamente de ensayo y error en el campo y puede ser tedioso y prolongado en algunos casos. Laaccion derivativa es particularmente difıcil de sintonizar adecuadamente, por lo tanto, esta no es muy utili-zada. La sintonizacion se inicia con valores lımites de los parametros del P.I.D, variandolos consecutivamentehasta lograr la respuesta deseada.

El metodo consta de los siguientes pasos:

Tomar valores lımites de los parametros:

• Para Kc y τd valores pequenos

• El valor de τi debe ser grande.

Luego, se dobla el valor de Kc y se observa la respuesta. Se continua de esta misma forma hasta obteneroscilaciones sostenidas (Kcu). El valor final sera Kc = Kcu/2.

Luego, se reduce el valor de τi a la mitad de su valor. Se observa su respuesta y se continua de la mismaforma hasta obtener oscilaciones sostenidas (τ ∗

i ). El valor final sera τi = 2τ∗i .

Se realiza el mismo procedimiento con τd. Primero, se aumenta τd hasta obtener una respuesta oscila-toria (τ∗

d ), con lo que el valor final sera τd = τ∗d /3.

6.3. SINTONIZACION DE CONTROLADORES PID 71

Tipo De Regulador Kc τi τd

P 0,5Kcr - -PI 0,45Kcr Pcr/1,2 -

PID 0,6Kcr 0,5Pcr 0,125Pcr

Tabla 6.1: Valores de los parametros de los controladores para el metodo de malla cerrada.

6.3.2. Sintonizacion de Controladores PID: Ziegler/Nichols

Hasta el momento se ha visto la forma tıpica de un controlador de tres terminos, conocido como elPID. Estos tipos de controladores se disenan para mantener un nivel, o una temperatura, por ejemplo. Engeneral, se requiere que estos controladores sean: estables y robustos en lazo cerrado; que la influencia delas perturbaciones no sea crıtica; que la respuesta sea rapida y suave a cambios de set-point; y que no tengaerror en estado estable, entre otros. Sin embargo, aun no hemos dado detalles de como seleccionar cada unade las constantes asociadas al controlador de tres terminos. Logicamente, estos valores van a estar asociadosdirectamente con las caracterısticas del proceso, y esto es lo que se conoce como sintonizacion.

Para poder sintonizar controladores, existen metodos heurısticos (aquellos que estan asociados alconocimiento que tengan los operadores de la planta), metodos matematicos (los cuales requieren de unmodelo matematico del proceso), y un tercer metodo que combina las tecnicas heurısticas y analıticas. Esteultimo metodo surgio en el ano de 1942 cuando John G. Ziegler y Nathaniel B. Nichols propusieron unastecnicas experimentales simples que permitiesen mejorar las caracterısticas de los controladores de la empresaen la que ellos trabajaban (Taylor Instruments) [35]. Las tecnicas desarrolladas tienen tres funciones basicas:

1. Se realiza un estımulo en el proceso.

2. Se identifica el modelo matematico de acuerdo a los resultados experimentales.

3. Se determinan los parametros del controlador a partir de lo obtenido en 2.

Dentro de estas tecnicas estan las que son de:

Malla abierta requieren la operacion del controlador en la opcion MANUAL. Esta tecnica no es laadecuada para sistemas que en lazo abierto puedan tener un comportamiento inestable (e.g., reactoresquımicos, o controles de nivel de lıquidos).

Malla cerrada, los cuales operan con el controlador en la opcion AUTOMATICO.

Ziegler/Nichols de Malla Cerrada

La idea de este metodo es trabajar el lazo de control en modo automatico con una accion proporcional,i.e., τi = ∞, τd = 0, y utilizar el criterio de estabilidad de Routh-Hurwitz asociado con el metodo desustitucion directa para caracterizar el proceso con dos parametros:

1. Ganancia ultima o crıtica: Kcr.

2. Perıodo ultimo o crıtico: Pcr.

En la Figura... se muestra el lazo tıpico para la prueba en automatico para este caso.

ANADIR FIGURA

La idea es entonces ir incrementando el valor de Kc desde 0 hasta un valor Kcr, el cual correspondeal valor de ganancia en el cual la salida presenta oscilaciones sostenidas por primera vez (ver Figura...). Elperıodo crıtico corresponde al perıodo de oscilacion tal como se ve en la Figura... Si estas no se presentan,este metodo no deberıa aplicarse. La Tabla 6.1 muestra los valores que se requieren para cada uno de lostres controladores tıpicos que podrıan sintonizarse bajo este metodo.



P T/(L.K) - -PI 0,9T/(L.K) 3,33L -

PID 1,2T/(L.K) 2L 0,5L

Tabla 6.2: Valores de los parametros de los controladores para el metodo de malla abierta.

Ejemplo 6.3.1 Asumamos que

Gp(s) =1

(s + 1)(0,5s + 1)(0,2s + 1)

Como bien se sabe, la estabilidad esta definida por intermedio de la ecuacion caracterıstica del sistema, i.e.,1 + Gp(s)Gc(s) = 0, lo que en este caso darıa que

0,1s3 + 0,8s2 + 1,7s + 1 + Kc = 0

Si se utilizar el criterio de Routh-Hurwitz se ve que el sistema es estable si −1 < Kc < 12,6 (aunque losvalores negativos de Kc no tengan mucho sentido practico). Es claro que cuando la ganancia llega a sulımite superior, se tienen oscilaciones sostenidas, ya que el sistema se volverıa crıticamente estable. Paracomprobar esto, utilicemos el metodo de sustitucion para hallar Kcr y Pcr. Para ello, se sustituye s = jω,i.e.,

−0,1jω3 − 0,8ω2 + 1,7jω + 1 + Kc = 0

Se tendrıa entonces una ecuacion para la parte real y otra para la parte imaginaria, i.e.,

−0,1ω3 + 1,7jω = 0

y

−0,8ω2 + 1 + Kc = 0

Esto nos da que ωcr =√

17, por lo que el Pcr = 2πωcr

= 1,52 segundos, y Kcr = 12,6.

Este metodo suele utilizarse cuando el 10% ≤MP ≤ 60% a entrada escalon unitario.

Ziegler/Nichols de Malla Abierta

El metodo de malla abierta pretende ajustar el controlador a partir del modelo del proceso. Para ello,es necesario identificar el proceso utilizando una entrada paso en malla abierta como se ve en la Figura....

ANADIR FIGURA

Ziegler y Nichols se refieren a una curva de reaccion, i.e., una curva en forma de S luego de aplicar laentrada escalon unitario. Esto suele darse si la planta no incluye integrador(es) o polos dominantes complejosconjugados. Si la respuesta no esta en esta forma, el metodo no debe aplicarse. La respuesta del proceso eneste caso serıa

C(s)

U(s)=

Ke−Ls

Ts + 1

donde L se conoce como el tiempo de atraso, y T es la constante de tiempo del sistema medida como sepuede ver en la Figura....

ANADIR FIGURA

La Tabla 6.2 muestra los valores que se requieren para cada uno de los tres controladores tıpicos quepodrıan sintonizarse bajo este metodo.

6.3. SINTONIZACION DE CONTROLADORES PID 73


P 1K

TL

[3T+L

3T

]- -

PI 1K

TL

[10,8T+L

12T

]

L 30+3(L/T )9+20(L/T ) -

PD 1K

TL

[30T+4L

24T

]- L

[6−2(L/T )22+3(L/T )

]

PID 1K

TL

[16T+3L

12T

]L 32+6(L/T )

13+8(L/T )4L

11+2(L/T )

Tabla 6.3: Valores de los parametros de los controladores para el metodo de Cohen y Coon.

rc Kc τi τd

0 a 0.1 5K T 0

0.1 a 0.2 0,5Krc

T 0

0.2 a 0.5 0,5(1+0,5rc)Krc

T (1 + 0,5rc) T 0,5rc

0,5rc+1

Tabla 6.4: Valores de los parametros de los controladores para el metodo del coeficiente de ajustabilidad .

6.3.3. Sintonizacion de Controladores PID: Cohen y Coon

Este metodo trabaja con la respuesta temporal del sistema a una entrada escalon, es muy parecido alde Ziegler-Nichols y tambien utiliza el modelo de primer orden con tiempo muerto para hallar los parametros.Las reglas para la sintonıa se encuentran matematicamente establecidas. Una de las grandes ventajas de estemetodo es que se puede seleccionar un controlador PD, cosa que no se logra en los otros metodos. Los valoresde los parametros se calculan basados en las relaciones de la Tabla 6.3.

6.3.4. Sintonizacion de Controladores PID: Metodo del Coeficiente de Ajusta-bilidad

Los metodos de Ziegler - Nichols y de Cohen - Coon, son difıciles de aplicar en la practica, porque llevana un comportamiento muy oscilatorio, por esto los instrumentistas implementaron una version derivada deestas reglas que tambien se basa en el modelo de primer orden con retardo, para hallar los coeficientes delP.I.D se utiliza el coeficiente de ajustabilidad rc, definido como:

rc =L

T

Se recomienda que 0,1 < rc < 1, pero con los valores de este coeficiente se encuentran relaciones especıficaspara los parametros del P.I.D. como se ve en la Tabla 6.4. Para un valor mas grande del coeficiente deajustabilidad, el sistema es imposible de controlar con un PID.

6.3.5. Sintonizacion de Controladores PID: Internal Model Control (IMC)

COMPLETAR

6.3.6. Sintonizacion de Controladores PID: Sıntesis Directa

Este metodo no parte de un algoritmo en particular para el controlador. Su objetivo es encontrar unafuncion de transferencia del controlador que cumpla con las especificaciones de lazo cerrado dadas. Para ello,se utiliza el modelo de malla abierta del proceso. El problema es que con este metodo no necesariamentese garantiza que el controlador va a existir en la vida real, pero sirve para tener una idea de que tipo decontrolador podrıa utilizarse. Para este caso se tiene el sistema de la Figura...

ANADIR FIGURA


La funcion de transferencia de lazo cerrado serıa

T (s) =C(s)

R(s)=

Gc(s)Gp(s)

1 + Gc(s)Gp(s)

En el metodo de Ziegler/Nichols se ajustan los parametros del controlador y se observa la respuesta paraası hacerle ajustes finos a dichas constantes. Sin embargo, en el metodo de sıntesis directa lo que se hace esdespejar Gc(s), por lo que

Gc(s) =T (s)

Gp(s)(1− T (s))(6.6)

La Ecuacion (6.6) sera la del controlador, ya que uno tiene caracterısticas propias de diseno para T (s). LaEcuacion (6.6) se conoce como la ecuacion de sıntesis, y lo difıcil en este caso es la seleccion de T (s). Sinembargo, algunas caracterısticas basicas que se tienen que cumplir son

El error en estado estable debe ser nulo.

La respuesta del sistema debe ser lo suficientemente rapida, pero el sobreimpulso debe ser lo maspequeno posible.

T (s) tiene que ser una funcion simple matematicamente hablando.

Las funciones de transferencia que generalmente se utilizan para cumplir estos objetivos son

T1(s) =1

α1s + 1(6.7)

T1(s) =1

(α2s + 1)(α3s + 1)(6.8)

donde los αis son las constantes de tiempo que determinan que tan rapido responde el sistema. Si estosparametros son pequenos, el sistema no responde mas rapido, aunque la ganancia del controlador se incre-menta. Por ende, de acuerdo al proceso que se tenga, la seleccion de estos parametros es bastante crıtica.Los dos tipos de controladores que aparecen al reemplazar (6.7) y (6.8) en (6.6) son

Gc(s) =1

Gp(s)

1

α1s(6.9)

Gc(s) =1

Gp(s)

1

s(α2α3s + α3 + α2)(6.10)

Notese bien que el hecho de que se tenga un controlador con un polo en cero, hace que para una entradaescalon, el error en estado estable tienda a 0.

Si Gp(s) = Kp, Gc(s) = 1α1Kps , por lo que el controlador serıa similar a uno con accion integral, y α1

determina que tan rapida serıa la respuesta del sistema. Si,

Gp(s) =Kp

τs + 1

y Gc(s) se selecciona de acuerdo a (6.9), se tiene un controlador PI, ya que

Gc(s) =τ

α1Kp

τs + 1

sτ

Si lo comparamos con la ecuacion ideal de un PI tendrıamos que Kc = τα1Kp

y τi = τ .

En los dos casos previamente expuestos se trato de buscar una relacion directa entre la forma delcontrolador que se obtiene a partir del proceso y un controlador clasico. Es claro que en ocasiones se tienenque hacer suposiciones fuertes (e.g., despreciar ciertos parametros) para que el sistema se parezca a una delas ecuaciones ideales que conocemos.

6.4. ALGORITMOS 75

6.4. Algoritmos

En general, los controladores comerciales utilizan algoritmos diferentes para implementar un PID. Deeste tipo de algoritmo dependen los valores de los parametros obtenidos mediante el metodo de sintonizacionque se utilice.

Los algoritmos clasicos son:

Ideal:

Gc(s) = KIc

(

1 +1

τ Ii s

+ τ Id s

)

(6.11)

Paralelo o No Interactivo:

Gc(s) = KPc +

1

τPi s

+ τPd s (6.12)

Serie o Interactivo:

Gc(s) = KSc

(

1 +1

τSi s

)(1 + τS

d s)

(6.13)

Es claro que los metodos de sintonizacion vistos hasta el momento se basan en (6.11). Por lo tanto, setendrıan que expresar (6.12) y (6.13) en terminos de (6.11) para ası poder utilizar los parametros que seobtienen en los metodos de sintonizacion vistos.

Para (6.13), se tiene que

KSc

((

1 +τSd

τSi s

)

+1

τSi

+ τSd s

)

Este tipo de controladores se caracterizan porque las acciones derivativa e integral se aplican sucesivamente,lo que hace que exista una fuerte interaccion entre ambas acciones. Al comparar con un controlador ideal,se tiene que

KIc = KS

c

(

1 +τSd

τSi

)

τ Ii = τS

d + τSi

τ Id =

11

τSd

+ 1τS

i

Por otro lado, el algoritmo paralelo (utilizado por Modicon, Siemens, Allan Braedley, entre otros) es similar alideal ya que tiene las tres acciones estan actuando en forma independiente, pero su sintonizacion es diferenteya que

KIc = KP

c

τ Ii = KP

c τPi

τ Id =

τPd

KPc

6.5. PID Digital

CAMBIAR!!!!!

Para poder implementar un controlador de lazo sencillo, se requieren tres acciones basicas que unprocesador realizarıa de forma permanente para controlar la planta.

Se hace una conversion de las senales analogas que provienen de los sensores utilizando un conversorADC.

Se procesan los datos, i.e., se hace el calculo del algoritmo de control.


Finalmente, se envıa el resultado a los actuadores en forma analoga utilizando un conversor DAC.

La secuencia de operacion serıa:

1. Esperar la interrupcion de un reloj que serıa el encargado de darle la orden al procesador de cadacuanto se tienen que tomar datos. Esto serıa el tiempo de muestreo Ts.

2. Leer los datos del sensor.

3. Calcular la senal de control por medio de un algoritmo discretizado del PID.

4. Enviar el resultado a los actuadores.

5. Actualizar las variables del controlador modificadas por la discretizacion del algoritmo.

6. Repetir.

En la Figura 6.3 se puede observar un diagrama condensado de un sistema de control digital de un solo lazo.Un ejemplo tıpico mas detallado es el que se muestra en la Figura...

y(t)u(t)

t

t

t

t

u[n] y[n]

PROCESS

COMPUTER A/DD/A

HOLD

SAMPLER

Figura 6.3: Proceso de tomar una senal continua y(t) que es generada por el proceso, y convertirla en unasecuencia de numeros y[n]. El computador toma una decision y la convierte en otra secuencia de numerosu[n], los cuales se convierten luego en una senal continua u(t) que actua sobre el proceso. Figura adaptadade [2].

ANADIR FIGURA

Los computadores que se utilizan se conectan a los actuadores y al proceso por medio de conversoresde senal. La salida es procesada por un DAC durante un perıodo fijo de tiempo T el cual se conoce comoel tiempo de muestreo (lo mismo sucede a la entrada). El muestreador es basicamente un interruptor que secierra cada T segundos por un instante corto de tiempo. Por ejemplo, en la Figura... se tiene un ejemplo,que graficamente darıa algo como se ve en la Figura...

ANADIR FIGURAS

El DAC es un dispositivo que convierte la senal muestreada r∗(t) en una senal continua p(t). Por logeneral, el DAC se representa como un circuito de zero-order hold (ZOH) como se ve en la Figura...

ANADIR FIGURA

La funcion de transferencia del ZOH es

G0(s) =1− e−sT

s

6.5. PID DIGITAL 77

La idea de este retenedor de orden cero es tomar el valor de r[kT ] y “retenerloconstante por un tiempokT ≤ t < (k + 1)T , como se ve en la Figura... para k = 0.

ANADIR FIGURA

El muestreador y el ZOH pueden seguir acertadamente la senal de entrada si T es pequeno comparadocon los cambios transientes en la senal. Para una rampa y una exponencial se tendrıa lo que se observa enlas Figuras...

ANADIR FIGURAS

Muy poco se pierde si se hace un muestreo entre instantes muy cercanos, mas sin embargo, muchose pierde si los puntos de muestreo se ubican demasiado lejos. Esto se da sobre todo en la conversion de lasenal muestreada a una continua. Si la frecuencia de muestreo

ωs =2π

T

es lo suficientemente grande comparada con la componente de frecuencia mas alta en una senal continua,entonces se puede afirmar que las caracterısticas de amplitud de la senal se preservan. Para evitar este tipode inconvenientes, asumamos que ω1 es la frecuencia maxima o ancho de banda de una senal x(t), i.e., no haycomponentes de frecuencia por encima de ω1. El siguiente teorema conocido como el teorema de muestreode Nyquist, ilustra la escogencia de la frecuencia de muestreo de acuerdo al ancho de banda de la senal encuestion.

Theorem 6.5.1 Si ωs = 2πT , i.e., la frecuencia de muestreo, cumple con

ωs > 2ω1

donde ω1 es la componente de frecuencia mas alto en una senal continua x(t) (i.e., su ancho de banda),entonces esta puede ser reconstruida en su totalidad de la senal muestreada x∗(t).

Si esto se cumple, no habra problemas de aliasing, fenomeno que se da cuando se crean nuevos componentesde frecuencia debidos al muestreo. Si no, se pueden tener dos senales diferentes cuya reconstruccion serıaimposible (e.g., Figura 6.4).

Por lo general, se analiza el sistema en frecuencia utilizando la Transformada Z, la cual es un equiva-lente de la transformada de Laplace en tiempo discreto, pero con

z = esT

En terminos de estabilidad, esta transformacion llevara a que un sistema muestreado es estable si todos lospolos de lazo cerrado de T (z) estan ubicados dentro del cırculo unitario en el plano z. Criterios de estabilidadcomo el de Jury se aplican en estos casos en lugar de Routh-Hurwitz. En terminos de diagramas en bloques,hay que tener mucho cuidado donde se ubican los muestreadores, ya que las funciones de transferencia noserıan las mismas. En las Figuras... se muestra un ejemplo donde G(z)H(z) 6= GH(z).

ANADIR FIGURAS

Para poder implementar un PID en un procesador, es menester discretizar cada una de las funciones.Por ende, necesitamos expresar las ecuaciones continuas en terminos de ecuaciones de diferencias, lo cualse puede hacer utilizando algoritmos posicionales e incrementales. Por simplicidad, veremos los primerosunicamente.

El algoritmo posicional recibe su nombre porque este determina directamente la posicion que debetomar el actuador. Sea, la Ecuacion (6.4) con u = 0, y la integral de 0 a t. La aproximacion de la integral seda por medio de la regla rectangular o trapezoidal de una senal, i.e.,

1

τi

∫ t

0

e(τ)dτ ∼= Ts

τi

n∑

h=1

e(hTs)

o1

τi

∫ t

0

e(τ)dτ ∼= Ts

τi

n∑

h=1

e(hTs − Ts) + e(hTs)

2


0 1 2 3 4 5 6 7 8 9 10−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

Figura 6.4: Figura adaptada de [2]), la cual muestra el efecto de aliasing utilizando dos diferentes senalesx1(t) = sin(2πf1t) (punteada) and x2(t) = − sin(2πf2t) (solida), con sus respectivas frecuencias (f1 = 0,1 Hz,f2 = 0,9 Hz, y fs = 1 Hz). Este es un excelente ejemplo de como el aliasing puede afectar la reconstruccionperfecta de las senales

respectivamente. La Figura... muestra un ejemplo de como se calcularıan dichas aproximaciones a partir deun ejemplo grafico.

ANADIR FIGURA

La accion derivativa tiene por aproximacion

τdde(t)

dt∼= τd

e(nTs)− e(nTs − Ts)

Ts

Como se menciono previamente, Ts corresponde al tiempo de muestreo. De esta forma, el PID ideal discre-tizado se convertirıa en

u[nTs] = Kc

(

e[nTs] +Ts

τi

n∑

h=1

e[hTs] + τde[nTs]− e[(n− 1)Ts]

Ts

)

Observaciones:

Teniendo el controlador PID digital, para poderlo sintonizar utilizando alguno de los metodos vistospreviamente, se recurre a anadir T/2 al tiempo muerto del proceso, para ası poder utilizar dichoscriterios. Es decir, el nuevo tiempo muerto serıa dependiente del tiempo de muestreo, i.e.,

L = L +T

2

Con ello, se estarıa incluyendo el tiempo de muestreo en la seleccion de cada uno de los componentes.

En cuanto al desempeno, si el muestreo es muy lento/rapido, el PID puede no responder adecuadamente.

Una guıa util se puede resumir como:

• Obtener un modelo empırico del sistema.

• Para lograr en un controlador digital un desempeno cercano al de su contraparte continua, selec-cione T ≤ 0,05(L + τ), donde L y τ son el tiempo muerto y la constante de tiempo del sistemade primer orden, respectivamente.

6.6. CRITERIOS DE DESEMPENO 79

• Determinar las constantes de sintonizacion utilizando Ziegler y Nichols por ejemplo, con L = L+T2 .

• Implementar y ajustar de forma mas fina.

6.6. Criterios de Desempeno

Hasta este punto se han visto tres criterios fundamentales que uno suele buscar a la hora de disenarun controlador: estabilidad, criterios de estado estacionario, y respuesta dinamica del sistema. Otro de loscriterios que existen, aborda el desempeno de la integral de tiempo que puede ser utilizado par la escogenciade los parametros. Los mas comunes son aquellos que involucran minimizar una funcion que contenga laintegral del error. Estos metodos clasicos son:

1. Integral Absolute Error (IAE)

IAE =

∫ ∞

0

|e(t)|dt

En algunos casos se toma como lımite superior un tiempo t finito tal que se haya alcanzado el valor enestado estacionario. Por lo general este es igual al tiempo de establecimiento ts.

2. Integral Squared Error (ISE)

ISE =

∫ ∞

0

e2(t)dt

La idea en este caso es penalizar errores grandes.

3. Integral Time-weighted Absolute Error (ITAE)

ITAE =

∫ ∞

0

t|e(t)|dt

La idea en este caso es penalizar mas los errores en tiempos grandes.

4. Integral Time-weighted Squared Error (ITSE)

ITSE =

∫ ∞

0

te2(t)dt

La idea en este caso es penalizar errores grandes en tiempos largos.

ANADIR EJEMPLO

En lıneas generales, lo que se tiene es I =∫ T

0f(e(t), r(t), y(t))dt, ya que no necesariamente tendrıa

que ser el error, sino una combinacion de cualquiera de las senales que se tengan a disposicion.

6.7. Diseno con Pole Placement

En esta forma de diseno, se desea que los polos de lazo cerrado se ubiquen en lugares previamenteestipulados por la respuesta del sistema. Para un sistema con retroalimentacion unitaria, controlador Gc(s)y proceso Gp(s), la ecuacion caracterıstica serıa 1 + GcGp = 0. Si tuvieramos un sistema de primer orden yun controlador PID ideal, la ecuacion caracterıstica vendrıa siendo

τiKcKpτd + τ

KpKcs2 +

1 + KcKp

KcKpτis + 1 = 0

Se tendrıan entonces dos polos de lazo cerrado

r1,2 =−(1 + KcKp)

2(KcKpτd + τ)± KcKp

2(KcKpτd + τ)

√(

(1 + KcKp)τi

KcKp

)2

− 4τi(KcKpτd + τ)

KcKp


Como los valores de Kp y τ del proceso se conocen por lo general, la escogencia de Kc, τi, y τd nos lleva aubicar los polos donde se desee en el plano complejo.

Si se quisiera obtener una salida determinada, uno puede tener un polinomio caracterıstico de base/guıapara la ubicacion de los polos. Por ejemplo, para una ecuacion de segundo orden, una funcion de transferenciaserıa

1

τ2r s2 + 2ζrτrs + 1

Si τr = 4 y ζr = 0,5, en este caso se necesitarıa que

τiKcKpτd + τ

KpKc= 16

1 + KcKp

KcKpτi = 4

Sin embargo, es claro que las respuestas no van a ser exactamente las mismas, ya que solo se estan escogiendolos polos mientras que los ceros no se tienen en cuenta y estos pueden afectar el desempeno.

Capıtulo 7

Variables de Estado: Introduccion

Es gracias a la muerte que podemos ser felices porque sabemos que en algun momento todo va a

terminar Mario Vargas Llosa

Hasta el momento hemos analizado los sistemas desde el punto de vista de funciones de transferencia.Hemos visto como los modelos matematicos obtenidos por medio de leyes fısicas nos ayudan a modelarrelaciones de toda ındole, ademas de brindarnos la posibilidad de estudiar dichos sistemas para obtener suestabilidad y buscar metodos de control. Sin embargo, todo este estudio se ha basado en el hecho de que lossistemas estudiados son lineales y estan representados en el espacio s. Es sabido que cualquier sistema nolineal se puede transformar en uno lineal por medio de metodos de linealizacion como los vistos previamente.En este capıtulo veremos otra forma de representar los sistemas por medio de las variables de estado. Elanalisis que se hara en este y los subsiguientes capıtulos se basa en los sistemas lineales, y su representacionpor medio de ecuaciones diferenciales ordinarias. Primero se repasan los conceptos de variables de estado y surelacion con cualquier tipo de sistema, y luego se ahonda en la representacion de sistemas lineales. Las notasde este capıtulo han sido sacadas de varios libros, dentro de los que se destacan [22, 31, 7, 11, 32, 12, 14, 30, 33].

7.1. Definicion de Variables de Estado

El proposito de un modelo de variables de estado es desarrollar una representacion que preserve larelacion entrada-salida, pero expresada en terminos de n ecuaciones de primer orden. La principal ventajade este modelo es que las caracterısticas internas del sistema son representadas [28].

Un modelo de variables de estado es un conjunto de ecuaciones diferenciales de primer orden que estanacopladas, y usualmente se representa de forma vectorial. Supongamos que se tienen n variables de estado ym entradas.

xi = fi(x1, x2, . . . , xn, u1, u2, . . . , um) i = 1, . . . , n (7.1)

Si se transformase (7.1) en termino de vectores, se tendrıa que

x = f(x, u, t)

donde x = [x1, x2, . . . , xn]>, y u = [u1, u2, . . . , um]>. En este caso f(·) es una funcion vectorial con n+m+1argumentos, de dimension n.

7.1.1. Definiciones

Existen dos tipos de sistemas dinamicos. Aquellos que estan descritos por ecuaciones diferenciales (i.e.,aquellas que describen la evolucion de los sistemas en tiempo continuo), y aquellos descritos por ecuacionesde diferencias o iterated maps (i.e., aquellas dinamicas en tiempo discreto). A lo largo del curso se utilizaran

81

82 CAPITULO 7. VARIABLES DE ESTADO: INTRODUCCION

ecuaciones diferenciales, y mas especıficamente las ordinarias (las parciales no seran utilizadas) de la forma

xi = fi(x1, x2, . . . , xn, t), i = 1, . . . , n (7.2)

Con xi ≡ dxi

dt , y f(·) una funcion determinada por el problema a tratar. El sistema descrito por (7.25) puedeser lineal o no lineal y depende tanto de x como de t.

Definition 11 El sistema descrito por (7.25) se dice que es un sistema autonomo si fi(·) no depende deltiempo. En caso contrario, decimos que (7.25) es un sistema no autonomo o dependiente del tiempo.

Definition 12 El sistemaxi = fi(x1, x2, . . . , xn, t, u(t)) (7.3)

se dice que es un sistema forzado o con entrada. Si f(·) no depende de u(t) se tiene un sistema no forzado.

Definition 13 El vector x∗ ∈ Rn es un equilibrio del sistema no forzado (7.26) si

fi(t, x∗) = 0 ∀t ≥ 0, ∀i ∈ {1, . . . , n}

Si x∗ es un equilibrio de (7.26), y las condiciones inciales son xi(t0) = x∗i para todo t ≥ t0, el sistema tiene

una solucion unica xi(t) = x∗i .

Es decir que si el sistema esta en equilibrio desde el principio, este no se movera de ahı.

Definition 14 El estado de un sistema dinamico es un conjunto de cantidades fısicas, cuyas especificaciones(en ausencia de otro tipo de excitacion) determina completamente la evolucion del sistema [12].

Esto implicarıa que el numero de condiciones iniciales que deben ser especificadas constituye el orden delsistema, y por ende el numero de variables de estado necesarias para determinar el mismo.

Ejemplo 7.1.1 Seax1 = x2 + x1

x2 = 4 + x2x1(7.4)

Los puntos de equilibrio del sistema estarıan dados por (2,−2) y (−2, 2).

7.1.2. ODEs Lineales

Si la ecuacion diferencial en (7.1) es lineal, esta se puede escribir como

x1(t) = a11(t)x1(t) + . . . + a1n(t)xn(t) + b11(t)u1(t) + . . . + b1m(t)um(t)x2(t) = a21(t)x1(t) + . . . + a2n(t)xn(t) + b21(t)u1(t) + . . . + b2m(t)um(t)

...xn(t) = an1(t)x1(t) + . . . + ann(t)xn(t) + bn1(t)u1(t) + . . . + bnm(t)um(t)

(7.5)

La Ecuacion (7.5) se puede reducir a nivel vectorial de tal forma que

x(t) = A(t)x(t) + B(t)u(t) (7.6)

donde A(t) y B(t) son matrices de n × n y n ×m, respectivamente. La Ecuacion (7.6) se conoce como laEcuacion de Estado. En este caso, A(t) y B(t) dependen del tiempo. En nuestro analisis, estas dos matricesno dependeran por lo general del tiempo. En algunos casos se tienen tambien entradas exogenas (ademas delas entradas de control) las cuales dependen del ambiente. En esos casos, la Ecuacion (7.6) se transforma en

x(t) = A(t)x(t) + B(t)u(t) + E(t)x0(t)

donde x0 es un vector que reune las entradas exogenas (e.g., perturbaciones, ruido), y E(t) es una matriz delas ganancias que poseen dichas entradas.

7.1. DEFINICION DE VARIABLES DE ESTADO 83

Finalmente, lo que nos interesa es la salida en la mayorıa de los casos, mas no el estado. Por ello, sedefine un vector de salida y = [y1, y2, . . . , yr]

> y estarıa dado por

y(t) = h(x(t), u(t))

Si se linealizara el sistema, este vector serıa el observation vector, y la ecuacion de salida o de observacionvendrıa dada por

y(t) = C(t)x(t) + D(t)u(t) (7.7)

donde C(t) y D(t) son matrices de r × n y r ×m, respectivamente.

Ejemplo 7.1.2 [12, 28] En este caso se tiene un modelo que corresponde a una masa M que esta sujetadaa un amortiguador cuya constante de amortiguacion es b y a un resorte cuya constante es k. La Figura7.1muestra el sistema.

M

k b

yfo

Figura 7.1: Modelo mecanico que corresponde a una masa, sujetada por un amortiguador y un resorte. Laposicion esta dada por y, y se le aplica una fuerza inicial f0.

Por intermedio de las leyes de Newton, sabemos que

Md2y(t)

dt2=∑

f(t)

Asumiendo que el sistema es lineal en todos sus componentes, se tiene que

Md2y(t)

dt2+ b

dy(t)

dt+ ky(t) = f0 (7.8)

La Ecuacion (7.8) es una representacion de un sistema de segundo orden por intermedio de ecuacionesdiferenciales. Para poder hacer una representacion en variables de estado, se necesita hacer un cambio devariables de la siguiente forma.

x1(t) = y(t)

x2(t) = dy(t)dt

(7.9)

Por lo tantox1(t) = x2(t)

x2(t) = d2y(t)dt2

(7.10)

Utilizando (7.8) en (7.10), con el cambio de variables descrito en (7.9) se tiene que

x1(t) = x2(t)x2(t) = − b

M x2(t)− kM x1(t) + 1

M f0

Las Figuras 7.2 y 7.3 muestran la implementacion del sistema utilizando Simulink. La primera corres-ponde al modelo utilizando diagrama en bloques donde solo se pueden utilizar sumadores, integradores, yganancias. La segunda corresponde a la simulacion del sistema para cuatro casos diferente. Como se puede


observar, en los cuatro casos la posicion final es la misma ( f0

k , i.e., 0.3125m), pero lo que varıa es la respuestadel sistema. Esto se debe a que los puntos de equilibrio serıan x2 = 0 y x1 = 1

kf0. Entre mas grande sea elamortiguamiento, menos oscilaciones tiene el sistema, pero su respuesta pareciera ser mas lenta. Es el mismocaso de la velocidad, ya que esta siempre llega a 0, pero con mas o menos oscilaciones. Cabe aclarar que enestos cuatro casos las otras variables permanecieron exactamente iguales. Un ejemplo de que sucede cuandose deja de aplicar una fuerza constante f0 se puede ver en la Figura 7.4. Claramente, en este caso, el sistemacambia su punto de equilibrio luego de 19 segundos, ya que en ese momento f0 = 0. Esto era de esperarsedebido a la fısica del sistema (i.e., se tiene un amortiguador).

�� !#"�$% !#& �'� !#()�$�* +, !#&- .- /�- ()�$�0 � * +

f0

To Workspace2

x2

To Workspace1

x1

To Workspace

Step

Scope

1s

Integrator1

1s

Integrator

k/M

Gain2

1/M

Gain1

b/M

Gain

Figura 7.2: Modelo en Simulink que corresponde a la Figura 7.1.

Ejemplo 7.1.3 [12] Representar el sistema descrito en (7.11) por intermedio de diagramas de bloques.

x1(t) = a11x1 + a12x2(t) + b11u1 + b12u2(t)x2(t) = a21x1 + a22x2(t) + b21u1 + b22u2(t)

(7.11)

7.2. Representacion y Solucion de Variables de Estado

7.2.1. Representacion

Consideremos el siguiente sistema de n-esimo orden [22]

yn + a1yn−1 + . . . + an−1y + any = u (7.12)

En este caso, yn corresponde a la n-esima derivada de y. Para poder hacer una representacion en terminode ecuaciones de estado, se asume que se conocen las condiciones iniciales y(0), y(0), . . ., yn−1(0), ademasde la entrada u(t). Por lo tanto, el conjunto de n variables de estado sera

x1(t) = y(t)x2(t) = y

...

xn(t) = dn−1y(t)dtn−1

7.2. REPRESENTACION Y SOLUCION DE VARIABLES DE ESTADO 85

0 5 10 15 20−0.4

−0.2

0

0.2

0.4

0.6

0.8

1Simulación para b=2. Velocidad (−−)

0 5 10 15 20−0.2

−0.1

0

0.1

0.2

0.3

0.4

0.5

0.6Simulación para b=4. Posición (−)

0 5 10 15 20−0.1

0

0.1

0.2

0.3

0.4Simulación para b=8, Velocidad (−−)

0 5 10 15 200

0.05

0.1

0.15

0.2

0.25

0.3

0.35Simulación para b=16, Posición (−)

Figura 7.3: Simulacion en Simulink del sistema descrito en la Figura 7.1. Para este caso se utilizaron losparametros f0 = 5N, M = 2kg, k = 16N/m, y cuatro valores para b. En la parte superior izquierda, setiene b = 2N.s/m; en la parte superior derecha, se tiene b = 4N.s/m; en la parte inferior izquierda, se tieneb = 8N.s/m; y en la parte inferior derecha, se tiene b = 16N.s/m. En todos los casos se tiene que posicionesta dada por la lınea (-), mientras que la velocidad es la lınea punteada (- -).

Es decir que la Ecuacion (7.12) se puede escribir como

x1 = x2

x2 = x3

...xn−1 = xn

xn = −anx1 − an−1x2 − . . .− a1xn + u

Lo que expresado en una forma matricial serıa

x1

x2

...xn−1

xn

=

0 1 0 . . . 00 0 1 . . . 0...

......

...0 0 0 . . . 1−an −an−1 −an−2 . . . −a1

x1

x2

...xn−1

xn

+

00...01

u

La salida se obtiene mediante,

y =[

1 0 . . . 0]

x1

x2

...xn

De esta forma, el sistema de orden n se ve representado por un conjunto de ecuaciones de estado y de salidacomo las que se describen en (7.6) y (7.7).


0 5 10 15 20 25 30 35 40−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

Entrada f0=5, únicamente los primeros 19 segundos

Figura 7.4: Simulacion en Simulink del sistema descrito en la Figura 7.1, cuando unicamente se aplica unafuerza f0 durante un determinado tiempo. Para este caso se utilizaron los parametros f0 = 5N, M = 2kg,k = 16N/m, y b = 2N.s/m. La posicion esta dada por la lınea (-), mientras que la velocidad es la lıneapunteada (- -).

Otra representacion mas compleja es la que se describe en (7.13).

yn + a1yn−1 + . . . + an−1y + any = b0u

n + b1un−1 + . . . + bn−1u + bnu (7.13)

Como se puede observar, el problema en este caso es como definir las variables de estado de tal forma quese eliminen las derivadas de u en (7.13). Para ello, se plantea la siguiente solucion

x1 = y − β0ux2 = y − β0u− β1u = x1 − β1ux3 = y − β0u− β1u− β2u = x2 − β2u

...xn = yn−1 − β0u

n−1 − β1un−2 − . . .− βn−2u− βn−1u = xn−1 − βn−1u

Donde

β0 = b0

β1 = b1 − a1β0

β2 = b2 − a1β1 − a2β0

β3 = b3 − a1β2 − a2β1 − a3β0

...βn = bn − a1βn−1 − . . .− an−1β1 − anβ0

Lo que expresado en una forma matricial serıa

x1

x2

...xn−1

xn

=

0 1 0 . . . 00 0 1 . . . 0...

......

...0 0 0 . . . 1−an −an−1 −an−2 . . . −a1

x1

x2

...xn−1

xn

+

β1

β2

...βn

u

7.2. REPRESENTACION Y SOLUCION DE VARIABLES DE ESTADO 87

La salida se obtiene mediante,

y =[

1 0 . . . 0]

x1

x2

...xn

+ β0u

Ejemplo 7.2.1 Transforme la siguiente ecuacion en terminos de variables de estado

y + a1y + a2y = b0u + b1u + b2u

Para ello, se utilizan las transformaciones vistas previamente, por lo cual

x1 = y − β0ux2 = y − β0u− β1u = x1 − β1u

dondeβ0 = b0

β1 = b1 − a1b0

β2 = b2 − a1β1 − a2β0

Reemplazando, se obtiene que

x1 = x2 − β1ux2 = y − β0u− β1u

= −a1y − a2y + b0u + b1u + b2u− b0u− b1u + a1b0u= −a1(x2 + b0u + β1u)− a2(x1 + b0u) + b2u + a1b0u= −a1x2 − a1b0u− a1β1u− a2x1 − a2b0u + b2u + a1b0u= −a1x2 − a2x1 − β2u

7.2.2. Solucion

Asumamos que se tiene la representacion en el espacio de estado

x(t) = Ax(t)

Esta ecuacion se puede escribir como

x1(t) = a11x1(t) + . . . + a1nxn(t)x2(t) = a21x1(t) + . . . + a2nxn(t)

...xn(t) = an1x1(t) + . . . + annxn(t)

Se asume que se conocen las condiciones iniciales del sistema (x(0)), por lo cual se podrıa integrar a amboslados de la ecuacion, para ası obtener

x1(t)− x1(0) =∫ t

0(a11x1(τ) + . . . + a1nxn(τ)) dτ

x2(t)− x2(0) =∫ t

0(a21x1(τ) + . . . + a2nxn(τ)) dτ

...

xn(t)− xn(0) =∫ t

0(an1(t)x1(τ) + . . . + annxn(τ)) dτ

Esto, escrito de forma matricial, se convierte en

x(t) =

(∫ t

0

Ax(τ)dτ

)

+ x(0) (7.14)


Pero, que es x(τ) en (7.14)? Si observamos (7.14), x(τ) viene siendo la solucion de dicha ecuacion cuandox(t)|t=τ . En otras palabras,

x(τ) =

(∫ τ

0

Ax(τ ′)dτ ′)

+ x(0) (7.15)

Reemplazando (7.15) en (7.14),

x(t) =

(∫ t

0

A

((∫ τ

0

Ax(τ ′)dτ ′)

+ x(0)

)

dτ

)

+ x(0)

Si se hiciera esto repetidamente, se obtiene que

x(t) =

(

I +

∫ t

0

Adτ +

∫ t

0

∫ τ

0

A2dτ ′dτ +

∫ t

0

∫ τ

0

∫ τ ′

0

A3dτ ′′dτ ′dτ + . . .

)

x(0)

Como el sistema es lineal e invariante en el tiempo, la matriz A es constante, por lo que

x(t) =

(

I + At +A2t2

2!+

A3t3

3!+ . . .

)

x(0)

El termino entre parentesis es la aproximacion en series de Taylor de una exponencial. Por lo tanto,

x(t) = eAtx(0) = Φ(t)x(0) (7.16)

El termino Φ(t) = eAt se conoce como matriz de transicion de estado. Esta matriz se conoce ası porquetransfiere el estado del sistema en tiempo 0 a tiempo t. En el paper [20] se deducen 19 diferentes formas decomputar dicha matriz.

Algunas propiedades de la matriz de transicion de estado son

Φ(0) = I

Φ−1(t) = Φ(−t)

Φk(t) = Φ(kt)

Φ(t1 + t2) = Φ(t1)Φ(t2)

Φ(t2 − t2)Φ(t1 − t0) = eA(t2−t0)

Ahora, si se asume que el sistema tiene respuesta forzada, i.e.,

x(t) = Ax(t) + Bu(t)

x(t)−Ax(t) = Bu(t)

Multiplicando a ambos costados por e−At,

e−At (x(t)−Ax(t)) = e−AtBu(t)

Pero,

e−At (x(t)−Ax(t)) =d

dt

(e−Atx(t)

)

Integrando a ambos lados,

e−Atx(t) =

∫ t

0

e−AτBu(τ)dτ + x(0)

Por ende, la solucion cuando se tiene respuesta forzada es

x(t) = eAt

∫ t

0

e−AτBu(τ)dτ + eAtx(0) (7.17)


7.3. Funciones de Transferencia

Definition 15 La funcion de transferencia de un sistema lineal e invariante en el tiempo, es la relacion enfrecuencia que existe entre la entrada y la salida cuando las condiciones iniciales son iguales a cero.

En esta definicion, valida para sistemas lineales e invariantes en el tiempo, se tiene que para un sistema como(7.18), la relacion entre la entrada u y la salida y estara dado por una transformacion en frecuencia de lassenales, siempre y cuando las condiciones iniciales sean nulas.

yn + a1yn−1 + . . . + an−1y + any = b0u

m + b1um−1 + . . . + bm−1u + bmu n ≥ m (7.18)

Esto serıa,

H(s) =L [salida]

L [entrada]

∣∣∣∣CI=0

donde L [·] es la transformada de Laplace. Aplicando esto a (7.18), se obtiene que

H(s) =Y (s)

U(s)=

b0sm + b1s

m−1 + . . . + bm−1s + bm

sn + a1sn−1 + . . . + an−1s + an(7.19)

Cual es la relacion que existe entre la funcion de transferencia y la representacion en variables de estado?Tomemos la Ecuacion (7.6), y aplicando la transformada de Laplace, se obtiene que

sX(s)− x(0) = AX(s) + BU(s)

Como se sabe que las condiciones iniciales son cero, se tiene que

sX(s)−AX(s) = BU(s)

Se asume que (sI −A) es no singular (porque?), por lo que se deduce que

X(s) = (sI −A)−1BU(s) (7.20)

Por otra parte, la transformada de y(t) en (7.7) viene siendo Y (s) = CX(s) + DU(s), por lo cual si reem-plazamos X(s) en (7.20), se obtiene que la funcion de transferencia es

Y (s)

U(s)= C(sI −A)−1B + D (7.21)

Si se analiza la Ecuacion (7.21) se puede observar que |sI − A| corresponde al polinomio caracterıstico del

sistema, ya que el resto de terminos podrıan ser agrupados de tal forma que H(s) = G(s)|sI−A| , por lo que los

valores propios de A son identicos a los polos de H(s). Su rol es vital ya que las raıces del polinomio son lasraıces caracterısticas, o valores propios, o polos del sistema, los que determinan las principales caracterısticasdel comportamiento del sistema no forzado.

Se sabe que

Φ(t) = eAt = I + At +A2t2

2!+

A3t3

3!+ . . .

Por lo tanto, la transformada de Laplace serıa igual a

Φ(s) =I

s+

A

s2+

A2

s3+

A3

s4+ . . .

[sI −A]Φ(s) = [sI −A]

(I

s+

A

s2+

A2

s3+

A3

s4+ . . .

)

[sI −A]Φ(s) = I2 + As + A2

s2 + . . .

−As − A2

s2 − A3

s3 . . .= I

Por lo tanto,eAt = L

−1{(sI −A)−1}En la literatura, la matriz Φ(s) = (sI − A)−1 se conoce como el resolvent de A (o la matriz caracterıstica).Por lo tanto, los pasos a seguir a la hora de calcular la matriz de transicion de estado son:


1. Calcular (sI −A).

2. Obtener Φ(s) = (sI −A)−1.

3. Tomar la transformada inversa de Laplace de Φ(s) elemento por elemento.

Recuerde que

A−1 =adj(A)

|A| =1

|A| (Cij)>

donde adj(A) es la matriz adjunta, o la matriz de cofactores, la cual tiene como coeficientes (Cij) =(−1)i+jMij (Mij es la matriz que remueve la fila i y la columna j, para luego tomar el determinante).El determinante de una matriz A de n × n se puede definir por medio de la expansion de Laplace conrespecto a una fila arbitraria i de la forma

detA =

n∑

j=1

aijCij

Esto tambien se puede hacer con respecto a una columna arbitraria k de la forma,

detA =

n∑

i=1

aikCik

Ejemplo 7.3.1 [4] Sea

A =

2 4 13 0 22 0 3

Se tiene entonces la siguiente serie de menores,

M12 =

∣∣∣∣

3 22 3

∣∣∣∣= 5

M22 =

∣∣∣∣

2 12 3

∣∣∣∣= 4

M32 =

∣∣∣∣

2 13 2

∣∣∣∣= 1

Por lo tanto, los cofactores asociados serıan C12 = (−1)35 = −5, C12 = (−1)44 = 4, y C32 = (−1)51 = −1.Por lo tanto, usando la expansion de Laplace con respecto a la columna 2, se tiene que |A| = 4C12 = −20.

Ejemplo 7.3.2 Calcular la matriz adjunta cuando se tiene una matriz cuadrada de n = 2, y n = 3.

A =

[a11 a12

a21 a22

]

B =

b11 b12 b13

b21 b22 b23

b31 b32 b33

adj(A) =

[a22 −a12

−a21 a11

]

B =

b11 b12 b13

b21 b22 b23

b31 b32 b33

adj(B) =

∣∣∣∣

b22 b23

b32 b33

∣∣∣∣−∣∣∣∣

b12 b13

b32 b33

∣∣∣∣

∣∣∣∣

b12 b13

b22 b23

∣∣∣∣

−∣∣∣∣

b21 b23

b31 b33

∣∣∣∣

∣∣∣∣

b11 b13

b31 b33

∣∣∣∣−∣∣∣∣

b11 b13

b21 b23

∣∣∣∣

∣∣∣∣

b21 b22

b31 b32

∣∣∣∣−∣∣∣∣

b11 b12

b31 b32

∣∣∣∣

∣∣∣∣

b11 b12

b21 b22

∣∣∣∣


Ejemplo 7.3.3 [12] Hallar la matriz de transicion de estado si las dinamicas de un motor DC con inerciaestan dadas por

θ = ww = −αw + βu

donde α y β son constantes del motor.

eAt =

[1 (1− e−αt)/α0 e−αt

]

Ejemplo 7.3.4 Considerese la funcion de transferencia asociada al diagrama de la Figura 7.5.

Y (s)

U(s)=

a2s2 + a1s + a0

s3 + b2s2 + b1s + b0

1

s3+b2s2+b1s+b0

a2s2 + a1s + a0

U(s)

V (s)

Y (s)

Figura 7.5: Diagrama en bloques.

Halle la representacion de la forma

x = Ax + Buy = Cx + Du

Se tiene entonces quedv3

dt3+ b2v + b1v + b0v = u

Tomando x1 = v, x2 = v, y x3 = v, se tiene entonces que

x =

0 1 00 0 1−b0 −b1 −b2

x +

001

u

Por otro lado, se tiene quea2v + a1v + a0v = y

Por lo tanto, se obtendrıa quey = [a0 a1 a2]x

Ejemplo 7.3.5 [29] Un calibrador optico utilizado por la Chrysler Corporation, el cual se utiliza paraverificar el perfecto alineamiento de todos los componentes metalicos de varias clases de Sedan de cuatropuertas, tiene unas dinamicas en lazo cerrado dadas por

y + 5y + 6y = f(t)

Asumiendo que f(t) = 0, y que y(0) = 1, y(0) = 0, halle y(t).

Haciendo x1(t) = y(t), y x2(t) = x1(t), se tiene que

[x1(t)x2(t)

]

=

[0 1−6 −5

] [x1(t)x2(t)

]

y C = [1, 0]. Hallando la matriz de transicion de estado

(sI −A)−1 =1

s2 + 5s + 6

[s + 5 1−6 s

]


Φ(s) =

[s+5

(s+2)(s+3)1

(s+2)(s+3)−6

(s+2)(s+3)s

(s+2)(s+3)

]

Φ(t) =

[3e−2t − 2e−3t e−2t − e−3t

−6e−2t + 6e−3t −2e−2t + 3e−3t

]

Como sabemos,[

x1(t)x2(t)

]

= Φ(t)

[x1(0)x2(0)

]

Entonces,

y(t) = 3e−2t − 2e−3t

7.4. Formas Canonicas

En el siguiente ejemplo se muestra como una misma ecuacion diferencial puede tener varias represen-taciones en el espacio de estado. Porque? Porque existen varios metodos para transformar las variables deestado. De ahı que surjan diversos tipos de formas que se denominaran las formas canonicas.

Ejemplo 7.4.1 Encuentre la representacion en el espacio de estado de

d3y

dt3+ 6y + 11y + 6y = 6u

Segun lo visto en la seccion anterior, se tiene que las matrices A, B, C, y D vienen dadas por

A =

0 1 00 0 1−6 −11 −6

B =

006

C =[

1 0 0]

y D = 0. La matriz de transicion de estado estarıa dada en Laplace por

(sI −A)−1 =1

s3 + 6s2 + 11s + 6

s2 + 6s + 11 s + 6 1−6 s2 + 6s s−6s −11s− 6 s2

Por lo que la funcion de transferencia serıa

H(s) = C(sI −A)−1B =6

s3 + 6s2 + 11s + 6

Si partimos de la funcion de transferencia, se tiene que

Y (s) = 3s+1U(s)− 6

s+2U(s) + 3s+3U(s)

= X1(s) + X2(s) + X3(s)

Por lo que se tendrıa una representacion en el espacio de estado igual a

x1 = −x1 + 3ux2 = −2x2 − 6ux3 = −3x3 + 3uy = x1 + x2 + x3

Por ende, se tendrıan otro tipo de matrices A, B, C, y D.

El resultado del ejemplo anterior nos muestra claramente que una funcion de transferencia puede tener mu-chas representaciones en el espacio de estado. A continuacion se explicaran los metodos estandares conocidoscomo representaciones CANONICAS, las cuales tienen varias propiedades que seran explotadas a lo largodel curso.

7.4. FORMAS CANONICAS 93

7.4.1. First Companion Form: Forma Canonica Controlable

Arranquemos por definir las variables de estado para la siguiente funcion de transferencia

H(s) =1

sn + a1sn−1 + . . . + an−1s + an(7.22)

Esto es equivalente ayn + a1y

n−1 + . . . + an−1y + an = u

Esta ecuacion se puede ver como una serie de n integradores, donde la salida del ultimo corresponderıa a lasalida y, la salida del penultimo seria y, y ası sucesivamente. La Figura 7.6 muestra como serıa el diagramaen bloques para este caso.

Figura 7.6: Representacion en diagramas en bloques de la Ecuacion (7.22). Figura tomada de [12].

La representacion en el espacio de estado viene dada por

x1 = x2

x2 = x3

...xn−1 = xn

xn = −anx1 − an−1x2 − . . .− a1xn + uy = x1

Si formasemos la matriz A, se puede ver que tiene una estructura especial: los coeficientes del denominador deH(s) estan en la ultima fila precedidos de un signo menos; el resto de valores son 0, excepto la “superdiagonal”cuyos terminos son 1. Este tipo de matrices se conocen como matrices que tienen una companion form.

La funcion de transferencia en (7.22) se modifica de tal forma que ahora, la funcion de transferenciaes

H(s) =b0s

n + b1sn−1 + . . . + bn−1s + bn

sn + a1sn−1 + . . . + an−1s + an(7.23)

donde si el grado del numerador fuera menor o igual al grado del denominador, i.e., deg(num) ≤ deg(den),entonces se dice que es una funcion de transferencia propia; si es estrictamente menor, entonces se dice quees una funcion de transferencia estrictamente propia; y si es mayor, entonces se dice que la funcion detransferencia es impropia.

Pero esta ecuacion es equivalente a

H(s) =Y (s)

Z(s)

Z(s)

U(s)

Por linealidad, Z(s)U(s) serıa equivalente a (7.22), mientras que se puede decir que

Y (s)

Z(s)= b0s

n + b1sn−1 + . . . + bn−1s + bn

Ası pues, se tiene una parte que es identica a lo expuesto anteriormente, mientras que la segunda serıa lasuma escalizada de las salidas de los integradores que se forman de acuerdo a lo visto previamente. Undiagrama en bloques se puede ver en la Figura 7.7.


Figura 7.7: Representacion en diagramas en bloques de la Ecuacion (7.23). Figura tomada de [12].

Las matrices A y B son las mismas que se definieron previamente, mientras que las matrices C y Destarıan dadas en este caso por el hecho de que

y = (bn − anb0)x1 + (bn−1 − an−1b0)x2 + . . . + (b1 − a1b0)xn + b0u

Esta ecuacion se obtiene por los dos caminos directos que existen, i.e.,

a Uno que multiplica cada uno de los elementos.

b Otro que llega al sumador/restador y se ve multiplicado por b0.

La estructura en este caso se conoce como la first canonical form. En control se le da el nombre de formacanonica controlable.

Ejemplo 7.4.2 EJEMPLO

La forma canonica tiene las siguientes propiedades:

El polinomio caracterıstico se puede determinar por la ultima lınea de Ac, i.e.,

|λI −A| = 0⇒ an + an−1λ + . . . + a1λn = 0

Un sistema con esta estructura siempre es controlable, y su matriz de controlabilidad es full rank.

7.4.2. Second Companion Form: Forma Canonica Observable

En la first companion form los coeficientes del denominador de H(s) aparecıan en alguna fila de lamatriz A. Existe otra forma en la que los coeficientes aparecen en alguna columna de dicha matriz. Tomando(7.23), y factorizando, se obtiene que

sn(Y (s)− b0U(s)) + sn−1(a1Y (s)− b1U(s)) + . . . + (anY (s)− bnU(s)) = 0

Dividiendo por sn y despejando Y (s), se tiene que

Y (s) = boU(s) +1

s(b1U(s)− a1Y (s)) + . . . +

1

sn(bnU(s)− anY (s))

El termino 1si corresponde a la funcion de transferencia de una cadena de i integradores. La Figura 7.8 ilustra

este hecho.


Figura 7.8: Representacion en diagramas en bloques de la forma canonica controlable. Figura tomada de[12].

x1 = x2 − a1(x1 + b0u) + b1ux2 = x3 − a2(x1 + b0u) + b2u

...xn−1 = xn − an(x1 + b0u) + bn−1u

xn = −an(x1 + b0u) + bnuy = x1 + b0u

Si en la Figura 7.8 se numeran las variables de estado de izquierda a derecha (i.e., terminos dentro decırculos en la figura?) se obtiene la forma

Ao =

0 0 . . . −an

1 0 . . . −an−1

0 1 . . . −an−2

. . . . . . . . . . . .0 0 . . . −a1

Bo =

bn − anb0

bn−1 − an−1b0

...b1 − a1b0

Co =[

0 0 . . . 1]

y Do = b0. Esta es la que se conoce como la forma canonica observable. Si se comparan las matrices de laseccion anterior con estas, se tiene que Ac = A>

o , Bc = C>o , y Cc = B>

o .

7.4.3. Jordan Form

Polos de H(s) Diferentes

La funcion de transferencia en (7.23) se convierte en

b0 +r1

s− s1+

r2

s− s2+ . . . +

rn

s− sn

En algunos casos, para hallar los residuos de una funcion de transferencia, se puede recurrir a programascomo Matlab. A continuacion se presenta como se deberıa hacer para obtener dichos residuos de la expansionen fracciones parciales.


RESIDUE Partial-fraction expansion (residues).

[R,P,K] = RESIDUE(B,A) finds the residues, poles and direct term of

a partial fraction expansion of the ratio of two polynomials B(s)/A(s).

If there are no multiple roots,

B(s) R(1) R(2) R(n)

---- = -------- + -------- + ... + -------- + K(s)

A(s) s - P(1) s - P(2) s - P(n)

Vectors B and A specify the coefficients of the numerator and

denominator polynomials in descending powers of s. The residues

are returned in the column vector R, the pole locations in column

vector P, and the direct terms in row vector K. The number of

poles is n = length(A)-1 = length(R) = length(P). The direct term

coefficient vector is empty if length(B) < length(A), otherwise

length(K) = length(B)-length(A)+1.

If P(j) = ... = P(j+m-1) is a pole of multplicity m, then the

expansion includes terms of the form

R(j) R(j+1) R(j+m-1)

-------- + ------------ + ... + ------------

s - P(j) (s - P(j))^2 (s - P(j))^m

[B,A] = RESIDUE(R,P,K), with 3 input arguments and 2 output arguments,

converts the partial fraction expansion back to the polynomials with

coefficients in B and A.

Una forma de ver esta ecuacion es utilizar diagramas en bloques como se puede ver en la Figura 7.9.

x1 = s1x1 + ux2 = s2xs + u

...xn = snxn + uy = r1x1 + r2x2 + . . . + rnxn + b0u

En este caso

A =

s1 0 . . . 00 s2 . . . 0

. . . . . . . . . . . .0 0 . . . sn

B =

11...1

C =[

r1 r2 . . . rn

]

y D = b0. Si las raıces son reales, se podrıa implementar en hardware. En cualquier otro caso solo servirıadesde un punto de vista teorico.

Polos de H(s) con Raıces Repetidas

Cuando el sistema tiene raıces repetidas, la expansion en terminos de fracciones parciales no es tansimple. En este caso, lo que se tiene es algo de la forma

H(s) = bo + H1(s) + . . . + Hn(s) (7.24)


Figura 7.9: Representacion en diagramas en bloques de la forma canonica de Jordan cuando las raıces sondiferentes. Figura tomada de [12].

donde n < n es el numero de polos diferentes de H(s), y

Hi(s) =r1,i

s− si+

r2,i

(s− si)2+ . . . +

rki,i

(s− si)ki

con ki como la multiplicidad del polo i (i = 1, . . . , n). El ultimo termino se puede ver como una cadena deki bloques identicos con una funcion de transferencia del tipo 1

s−si. En la Figura 7.10 se ilustra este hecho.

La representacion serıa

x1,i = six1,i + ux2,i = x1,i + six2,i

...xki,i = xki−1,i + sixki,i

yi = r1,ix1,i + r2,ix2,i + . . . + rki,ixki,i


Figura 7.10: Representacion en diagramas en bloques de la forma canonica de Jordan cuando las raıces sonrepetidas. Figura tomada de [12].

En este caso si definimos xi = [x1,i, x2,i, . . . , xki,i]>, se tiene la siguiente representacion

xi = Aixi + biu

yi = Cixi

donde

Ai =

si 0 . . . 01 si . . . 00 1 . . . 0

. . . . . . . . . . . .0 0 . . . si

Bi =

10...0

C =[

r1,i r2,i . . . rki,i

]

La matriz Ai consiste en dos diagonales: la diagonal principal con los polos mas una subdiagonal de unos.En algebra esto se conoce como la Jordan form (si se tomara otra nomenclatura, los unos irıan en la partesuperior).

Por (7.24) se tienen n subsistemas de este mismo calibre. Por lo tanto, el sistema general consistirıaen concatenar cada uno de ellos, definiendo x = [x1, x2, . . . , xn]>, con

A =

A1 0 . . . 00 A2 . . . 0

. . . . . . . . . . . .0 0 . . . An

B =

B1

B2

...Bn

C =[

C1 C2 . . . Cn

]

y D = b0.

EJEMPLOS MATLAB/SIMULINK

7.5. EQUILIBRIO 99

7.5. Equilibrio

Asumamos que se tiene un sistema que puede ser descrito mediante la siguiente ecuacion diferencial

x = f(t, x) (7.25)

donde x ∈ Rn es el estado del sistema, t ≥ 0, con una condicion inicial x(t0) = x0, siendo t0 el valor inicial del

tiempo. Por lo general, no existen reglas generales que permitan encontrar de manera explıcita las solucionesdel sistema descrito mediante la Ecuacion (7.25). En este caso, el analisis de este tipo de problemas se realizade dos formas: i) un analisis cuantitativo mediante el cual se haya de manera explıcita la solucion de (7.25)utilizando metodos numericos y aproximaciones; o ii) un analisis cualitativo, en el cual no se busca unasolucion explıcita de la solucion de (7.25), sino que el sistema es estudiado gracias al comportamiento dela familia de soluciones del problema en cuestion. Nosotros enfocaremos este tutorial en este segundo ıtem,ya que los resultados principales de este analisis incluyen las propiedades de estabilidad de un punto deequilibrio (o posicion de reposo), y el acotamiento de las soluciones de ecuaciones diferenciales de la formadefinida en (7.25).

Empecemos nuestro analisis por definir ciertas propiedades basicas en nuestro problema. La ecuaciondiferencial que nos atane esta definida por intermedio de la Ecuacion (7.25), donde x ∈ R

n. Para definir eldominio de f tenemos que considerar dos opciones:

1. Si hablamos de resultados globales debemos asumir que f : R+×R

n 7→ Rn, donde R

+ = [0,+∞) esel dominio del tiempo.

2. Si estamos considerando resultados locales debemos asumir que f : R+×B(h) 7→ R

n, para un ciertoh tal que B(h) = {x ∈ R

n : |x| < h}, y | · | es cualquiera de las normas en Rn. Esto quiere decir que

estamos limitando nuestro analisis a una cierta bola de radio h donde esta definido nuestro estado x.

Algunas veces se asume que t ∈ R, pero nosotros asumiremos en lo que resta que t ∈ [t0,+∞), donde t0 ≥ 0.En el siguiente analisis asumiremos que para un determinado t0, y una condicion inicial x(t0) = x0, el sistemade la Ecuacion (7.25) posee una solucion unica que llamaremos φ(t, t0, x0). Esta solucion esta definida paratodo t ≥ t0 y depende de manera continua de los datos iniciales, i.e., (t0, x0). Uno de los casos particulares enlos que esta aseveracion es cierta es cuando f satisface la condicion de Lipschitz que definimos a continuacion.

Definition 16 Condicion de Lipschitz: Sea D un conjunto tal que D ⊂ Rn. Llamemos C(D) al conjunto

donde todos los elementos de f son continuos, i.e., f ∈ C(D). Decimos que f ∈ C(D) satisface la condicionde Lipschitz en D (con respecto a x) con constante Lipschitz L si

|f(t, x)− f(t, y)| ≤ L|x− y| (7.26)

para todo (t, x), (t, y) que pertenezcan a D. En este caso, la funcion f es continua segun Lipschitz en x.

La Definicion 16 es importante porque nos permite establecer el siguiente teorema.

Theorem 7.5.1 Existencia Local y unica: Sea f(t, x) una funcion continua en todo t que satisface (7.26)para todo x, y ∈ B = {x ∈ R

n : ||x− x0|| ≤ r} y para todo t ∈ [t0, t1]. Existe pues un determinado δ > 0 talque la ecuacion

x = f(t, x) con x(t0) = x0

tiene una solucion unica sobre [t0, t0 + δ].

Lo que nos quiere decir el Teorema 7.5.1 es que si para cierto xm → x0, entonces la trayectoria φ(t, t0, xm)→φ(t, t0, x0) de manera uniforme en t en |t− t0| ≤ δ para cierto δ > 0.

Una vez establecidas estas condiciones, podemos definir el punto de equilibrio.

Definition 17 Un punto xe ∈ Rn se dice que es un punto de equilibrio de la Ecuacion (7.25) (en un tiempo

t∗ ∈ R+) si,

f(t∗, xe) = 0 ∀t ≥ t∗


Notese que para sistemas autonomos (aquellos en los cuales la Ecuacion (7.25) no depende del tiempo), unpunto xe ∈ R

n es un punto de equilibrio en un determinado tiempo t∗ si y solo si es un punto de equilibriopara todo tiempo. Notese tambien que si xe es un punto de equilibrio en t∗, entonces la transformacionτ = t− t∗ reduce la Ecuacion (7.25) a

dx

dτ= f(τ + t∗, x)

y por ende, xe es un punto de equilibrio en τ = 0. Es por ello que se asumira que t∗ = 0, y omitiremos suuso en lo que resta del documento. Ademas, si x(t0) = xe, el sistema esta en reposo desde el inicio, por locual no tiene porque desplazarse de su punto de equilibrio.

Ejemplo [14]: Consideremos el sistema descrito por

x1 = x2

x2 = − gl sin(x1)− k

mx2

donde g, l,m, k > 0. Este sistema describe de forma simple el pendulo sin friccion, y como se puede ver tieneinfinitos puntos de equilibrio localizados en (πn, 0), n = 0,±1,±2, . . .. Fısicamente solo tiene dos puntos deequilibrio, y los demas son la repeticion de los dos primeros.

Para poder definir ciertas caracterısticas de un punto de equilibrio, introducimos la siguiente definicion.

Definition 18 Un punto xe de (7.25) se dice que es un punto de equilibrio aislado si existe una constanter > 0 tal que B(xe, r) ⊂ R

n no contiene mas puntos de equilibrio de (7.25) que xe. En este caso, la bola deradio r y centro xe se define como B(xe, r) = {xe ∈ R

n : |x− xe| ≤ r}.

Como podemos observar, todos los puntos de equilibrio de la Ecuacion (7.27) son aislados en R2. Sin embargo,

existen sistemas en los cuales los puntos de equilibro no son aislados.

Ejemplo [?]: Consideremos el sistema

x1 = −ax1 + bx1x2

x2 = −bx1x2

donde a > 0 y b > 0 son constantes. Queda claro que x1e = 0, por lo cual cualquier punto en el eje positivode x2 es un punto de equilibrio de (7.27). Ası pues, el punto de equilibrio no es aislado.

Es claro que existen casos en los cuales no existen puntos de equilibrio. Por ejemplo, tomemos elsiguiente ejemplo

x1 = 2 + sin(x1 + x2) + x1

x2 = 2 + sin(x1 + x2)− x1

En lo que nos resta, asumiremos que los puntos de equilibrio son aislados. Tambien asumiremos que el puntoaislado de equilibrio que analizaremos es xe = 0. Por que? Asumamos que xe 6= 0 es un punto de equilibriode (7.25). Si definimos e = x− xe, entonces e = 0 es un punto de equilibrio de

e = f(t, e + xe) (7.27)

Como las propiedades de (7.27) y (7.25) son las mismas, podemos asumir que el punto de equilibrio esta lo-calizado en xe = 0, el cual es conocido como el punto de equilibrio trivial de (7.25).

7.6. Estabilidad y Acotamiento

7.6.1. Conceptos Locales

El siguiente analisis definira la estabilidad de un punto de equilibrio xe = 0 de (7.25), mas no deun conjunto de puntos de equilibrio. La razon primordial de ello es que si quisieramos hacer lo ultimo,tendrıamos que introducir el concepto de distancia, el cual puede llegar a confundir inicialmente al lector.En una version mas detallada de este tutorial, es menester incluir este tipo de definiciones.

7.6. ESTABILIDAD Y ACOTAMIENTO 101

Definition 19 Se dice que el punto de equilibrio xe de (7.25) es estable en el sentido de Lyapunov(SISL) si para cualquier ε > 0 y cualquier t0 ∈ R

+ existe un δ(ε, t0) > 0 tal que

|φ(t, t0, x0)| < ε ∀t > t0 (7.28)

cuando|x0| < δ(ε, t0) (7.29)

Graficamente esto podrıa verse como en la Figura 7.11, para el caso de n = 2.

ε

δ(ε,t )0

x1

φ(t,t ,x )0 0

x2

Figura 7.11: SISL de un punto de equilibrio.

Cabe reafirmar que es el punto de equilibrio el que es estable, mas no el sistema. Ademas, como enla definicion se tienen que cumplir las Ecuaciones (7.28) y (7.29) para cualquier ε > 0 y cualquier t0 ∈ R

+,no es logico tratar de probar que un punto de equilibrio es estable por medio de simulaciones. La simulacionsolo ayudarıa para dar una intuicion sobre lo que podrıa suceder, mas no es en ningun caso una pruebamatematica.

En la Definicion 19, δ(ε, t0) depende de ε y t0. Si δ es independiente de t0, i.e., δ = δ(ε), entonces sedice que el punto de equilibrio xe = 0 de (7.25) es uniformemente estable.

Definition 20 Se dice que el punto de equilibrio xe de (7.25) es asintoticamente estable (AS) si:

1. Es SISL.

2. Para cualquier t0 ≥ 0, existe un η(t0) > 0, tal que

lımt→∞

φ(t, t0, x0) = 0 si |x0| < η(t0)

El dominio de atraccion del punto de equilibrio xe de (7.25) es el conjunto de todas las condicionesiniciales x0 ∈ R

n tales que φ(t, t0, x0)→ 0 cuando t→∞ para un cierto t0 ≥ 0. Si la segunda condicion esvalida, se dice que el punto de equilibrio xe de (7.25) es atraıdo.

Si η en la segunda condicion no depende de t0, y ademas el punto de equilibrio xe de (7.25) esuniformemente estable, se dice que el punto de equilibrio xe de (7.25) es uniformemente asintoticamenteestable (UAS).

Cual es la diferencia entre un punto de equilibrio que es SISL y uno que es AS? Cuando hablamos de SISL sedice que el sistema tiene unas condiciones iniciales tales que si el sistema esta cerca de su punto de equilibrio,entonces al final el sistema se mantendra cerca del punto de equilibrio. Sin embargo, en la definicion de AS loque se tiene es que si el sistema arranca cercano al punto de equilibrio, entonces ademas de que la trayectoria


se mantendra cerca, esta convergera al punto de equilibrio.

Ejemplos:

x = 0: Este sistema tiene un punto de equilibrio que es SISL, mas en ningun momento es AS ya quelas trayectorias no convergen al punto de equilibrio.

x = −ax: Si asumimos que a > 0, el punto de equilibrio es xe = 0, y como se puede ver este es SISLpero ademas como la trayectoria es φ(t, t0, x0) = x0e

−at, tomando el lımite en el infinito, se puede verque la trayectoria converge a 0, con lo cual es AS.

Este ultimo ejemplo nos muestra una caracterıstica adicional, y es cuan rapido las trayectorias con-vergen al punto de equilibrio. A continuacion la definimos.

Definition 21 El punto de equilibrio xe = 0 es exponencialmente estable (ES) si existe una constanteα > 0, y para cualquier ε > 0, existe un δ(ε) > 0 tal que

|φ(t, t0, x0)| ≤ ε exp−α(t−t0)

para todo t ≥ t0 cuando |x0| < δ(ε) y t0 ≥ 0.

La Figura 7.12 muestra el comportamiento de φ(t, t0, x0) en las vecindades de un punto de equilibrio xe = 0que es ES.

δ

ε

x0

φ(t)

t

ε e- αt

Figura 7.12: ES de un punto de equilibrio.

Si un punto de equilibrio xe = 0 de (7.25) no es SISL, entonces se dice que es inestable. Sin embargo,pueden existir casos en los que las soluciones de φ(t, t0, x0) tienden a cero cuando t aumenta, por lo cual losconceptos de inestabilidad y atraccion pueden ser compatibles.

Hasta ahora solo hemos considerado propiedades locales del punto de equilibrio. A continuacion enun-ciaremos ciertas propiedades globales.

7.6.2. Conceptos Globales

Definition 22 La solucion de φ(t, t0, x0) de (7.25) es acotada si existen un β > 0 tal que

|φ(t, t0, x0)| < β t ≥ t0

7.6. ESTABILIDAD Y ACOTAMIENTO 103

El sistema (7.25) posee estabilidad segun Lagrange si para cada t0 ≥ 0 y x0, la solucion φ(t, t0, x0) es acotada.

En la definicion anterior β podıa depender de t0. Si esta constante es tal que para cualquier α > 0 y cualquiert0 ∈ R

+, β = β(α) > 0 (independiente de t0), se tiene que si |x0| < α, entonces |φ(t, t0, x0)| < β para todot ≥ t0.

Definition 23 Las soluciones de la Ecuacion (7.25) son uniformemente y ultimamente acotadas(UUB) si existe una constante B > 0 (que es la constante de acotamiento), y si para cualquier α > 0 yt0 ∈ R

+, existe un T = T (α) (independiente de t0) tal que

|x0| < α⇒ |φ(t, t0, x0)| < β t ≥ t0 + T

Graficamente esta ultima definicion puede verse ilustrada en la Figura 7.13. Lo que se ilustra en esta figuraes que si bien se pueden llegar a tener oscilaciones elevadas en un principio, luego de un tiempo T (α), lastrayectorias se ven acotadas por una especie de cilindro de radio B.

αx0

φ(t)

t

T(α)

B

Figura 7.13: UUB.

En la definicion de AS si el dominio de atraccion del punto de equilibrio xe = 0 es Rn, se dice que

xe = 0 de (7.25) es globalmente asintoticamente estable (GAS). Finalmente, el punto de equilibrioxe = 0 de (7.25) es globalmente exponencialmente estable (GES) si existe un α > 0, y para cualquierβ > 0 existe un k(β) > 0 tal que |φ(t, t0, x0)| ≤ k(β)|x0|e−α(t−t0) para todo t ≥ t0 cuando |x0| < β.

Capıtulo 8

Variables de Estado: Diseno

Entre tenerle miedo a todo y tenerle miedo a mi propio miedo, elijo esto ultimo, no se olvide que soy

policıa y que si le tuviera miedo a todo no podrıa trabajar. Pero si le tiene miedo a sus miedos su vida

se puede convertir en una observacion constante del miedo, y si estos se activan, lo que se produce es

un sistema que se alimenta a sı mismo, un rizo del que le resultarıa difıcil escapar, dijo la directora.

2666, Roberto Bolano

Las notas de este capıtulo han sido sacadas de varios libros, dentro de los que se destacan [22, 7, 11,32, 12, 4].

8.1. Introduccion

Normalmente estamos interesados en controlar el sistema con una senal de control u(t), que esta ligadaa las variables de estado del sistema. Este controlador opera bajo la informacion disponible, y es un sistemade compensacion bastante utilizado para optimizacion de sistemas.

Los conceptos de controlabilidad y observabilidad fueron introducidos por R. E. Kalman en los anos50s para explicar porque un metodo de diseno de compensadores para sistemas inestables por medio de lacancelacion de los polos en el semiplano derecho por ceros en el mismo semiplano no siempre funcionaba.Kalman demostro que una cancelacion perfecta polo-cero podrıa resultar en un sistema inestable inclusoteniendo una funcion de transferencia estable.

Ejemplo 8.1.1 [12] Asumamos que se tiene el sistema descrito por las ecuaciones de estado,

x1 = 2x1 + 3x2 + 2x3 + x4 + ux2 = −2x1 − 3x2 − 2ux3 = −2x1 − 2x2 − 4x3 + 2ux4 = −2x1 − 2x2 − 2x3 − 5x4 − uy = 7x1 + 6x2 + 4x3 + 2x4

La funcion de transferencia esta dada por

H(s) = C(sI −A)−1B =s3 + 9s2 + 26s + 24

s4 + 10s3 + 35s2 + 50s + 24

Factorizando, se puede ver como un sistema de cuarto orden se reduce a uno de primer orden de la forma

H(s) =(s + 2)(s + 3)(s + 4)

(s + 1)(s + 2)(s + 3)(s + 4)=

1

s + 1

Porque sucede esto?

105

106 CAPITULO 8. VARIABLES DE ESTADO: DISENO

Por intermedio de un cambio de variables (que se vera mas adelante), el sistema puede ser escritocomo

z1 = −z1 + uz2 = −2z2

z3 = −3z3 + uz4 = −4z4

y = z1 + z2

(8.1)

El diagrama en bloques que se muestra en la Figura 8.1 nos ilustra que:

La variables z1 se ve afectada por la entrada u y es visible por la salida.

La variables z2 no se ve afectada por la entrada u, pero sı es visible por la salida.

La variables z3 se ve afectada por la entrada u, pero no es visible por la salida.

La variables z4 no se ve afectada por la entrada u y no es visible por la salida.

u

+

+

∫z1

y

−1

∫

z2

−2

∫z3

−3

+

+

∫ z4

−4

Figura 8.1: Diagrama en bloques para (8.1).

Como Kalman demostro, todo sistema de la forma generica,

x = Ax + Buy = Cx

puede ser transformado en susbistemas como los del ejemplo anterior. Para este caso especıfico, se concluyeque

8.2. TRANSFORMACION DE LAS VARIABLES DE ESTADO 107

1. El primer subsistema es controlable y observable.

La parte que es controlable se dice que es estabilizable, mientras que la que es observable se dice quees detectable.

2. El segundo subsistema no es controlable, pero sı es observable.

3. El tercer subsistema es controlable, pero no es observable.

4. El ultimo subsistema no es ni controlable ni observable.

La funcion de trasferencia esta determinada solo por el subsistema que es tanto controlable como observable.Se dice que un sistema que contiene un subsistema NO controlable es NO controlable; un sistema que contieneun subsistema NO observable es NO observable.

Si existe al menos una cancelacion de polos y ceros inestables, cualquier perturbacion llevarıa al sistemaa volverse inestable. Sin embargo, en este caso no habrıa problema ya que los polos eran todos estables, porlo cual la cancelacion polos/ceros no nos afectaba en demasıa.

8.2. Transformacion de las Variables de Estado

Muy frecuentemente las variables de estado que se utilizan no son las mejores en la formulacion de unsistema dinamico

x = Ax + Buy = Cx + Du

Esta es una de las razones por las que pasar de G(s) a (A,B,C,D) no es unico (realization problem).

Si se escogez = Txz = T x

T−1z = Ax + BuT−1z = AT−1z + Bu

Por lo que, la normal/modal canonical form viene siendo

z = TAT−1x + TBuy = CT−1x + Du

Lo que se puede escribir de forma mas sencilla como

z = Az + Buy = Cz + Du

Por ejemplo, en el caso de calcular eAt, si la matriz A fuera diagonal, entonces serıa mas sencillo calculareAt que eAt, ya que los valores propios no se ven afectados bajo una transformacion ideal, i.e.,

|λI − TAT−1| = |T (λI −A)T−1|= |T ||λI −A||T−1|= |T ||T−1||λI −A|= |λI −A|

El problema que surge entonces es escoger T de tal forma que A = TAT−1 sea diagonal.

Definition 24 Una valor propio λ ∈ C de A satisface

λe = Ae

donde A ∈ Rn×n, e ∈ C

n. Este ultimo es el vector propio de A asociado con λ.


Una de los metodos para hallar T es utilizando la nocion de vectores propios agrupados todos en la matrizT−1. Sin embargo, el metodo que se describe a continuacion solo es valido si los n valores propios sondiferentes, i.e., no existe ninguno que sea repetido.

Para hacer la explicacion mas sencilla, supongamos que A tiene tres vectores propios diferentese1, e2, e3. A continuacion escogemos las columnas de T−1 como cada uno de los vectores propios, i.e.,

T−1 =

| | |e1 e2 e3

| | |

Luego, se puede obtener T , y por lo tanto calcular A, la cual sera una matriz diagonal que tendra en sudiagonal los valores propios λi, i = 1, . . . , n. Esto nos permitirıa encontrar la modal canonical form si es queexiste.

Ejemplo 8.2.1 Encontrar la modal canonical form del siguiente sistema, si es que existe.

x =

[−1 −20 −2

]

x +

[31

]

u

y = [2 − 6]x

En primera instancia, tendrıamos que hallar los valores propios de A por medio de |λI − A| = 0, lo que eneste caso implica que λ = {−1,−2}.

Luego, para encontrar T se necesita encontrar una base de vectores propios, i.e., (λiI − A)ei = 0,i = 1, 2. Esto implica que si λ1 = −1 se puede escoger que e1 = (1, 0)>, y que si λ2 = −2 se puede escogerque e2 = (2, 1)>. Por lo tanto se tendrıa que

T−1 =

[1 20 1

]

y

T =

[1 −20 1

]

Por lo cual

TAT−1 =

[−1 00 −2

]

TB =

[11

]

CT−1 = [2,−2]

Otra forma mas sencilla de obtener la matriz T cuando los valores propios son todos diferentes, es utilizar

A =

λ1 0 . . . 00 λ2 0 0

0 0. . . 0

0 0 . . . λn

Con

T−1 =

1 1 . . . 1λ1 λ2 . . . λn

λ21 λ2

2 . . . λ2n

......

......

λn−11 λn−1

2 . . . λn−1n

8.3. DISENO DE CONTROLADORES UTILIZANDO STATE FEEDBACK 109

Ejemplo 8.2.2 Encontrar la modal canonical form del siguiente sistema, si es que existe.

x =

0 1 00 0 1−18 −27 −10

x +

001

u

y = [1 0 0]x

En primera instancia, tendrıamos que hallar los valores propios de A por medio de |λI − A| = 0, lo que eneste caso implica que λ = {−1,−3,−6}.

Si T se escoge como

T−1 =

1 1 1−1 −3 −61 9 36

Se puede comprobar que

TAT−1 = A =

−1 0 00 −3 00 0 −6

B =

1/10−1/61/15

C = [1, 1, 1]

Tambien podrıa comprobarse que la escogencia de dicha matriz T se puede obtener por el metodo de losvectores propios descrito previamente.

Vale resaltar nuevamente que los metodos descritos son validos si se tienen n valores propios diferentes. Si unode los valores propios es repetido, el metodo falla, ya que no se tendran n vectores propios independientes.

Otra de las cosas que valdrıa resaltar es el hecho de que el polinomio ∆(λ) = |λI−A| = 0 correspondeal polinomio caracterıstico. Esto se hace mas evidente cuando uno recuerda la definicion de funcion detransferencia que se utilizo previamente.

8.3. Diseno de Controladores Utilizando State Feedback

La idea general de hacer todas estas transformaciones y saber cuales estados estan disponibles conrespecto a la entrada, es poder disenar controladores para que se cumplan ciertas caracterısticas. En lıneasgenerales, lo que se pretende es obtener una ganancia en funcion del estado, de tal forma que la entradacambie, y haciendo que los polos se ubiquen donde uno desea. La Figura 8.5 muestra como se retroalimentarıael estado por medio de una ganancia K. La pregunta serıa entonces, cuando se puede utilizar la tecnicaconocida como state-feedback para ubicar los polos de lazo cerrado en cualquier punto?

−

uB

+

+

∫

A

Cx

y

K

r+

Figura 8.2: Realimentacion de estado por medio de una ganancia K.


Ejemplo 8.3.1

x =

[−1 a3 −2

]

x +

[01

]

u

La idea es poder disenar un controlador lineal de la forma u = −Kx tal que los polos queden ubicados dondese desee. Por lo tanto, l reemplazar u, se tendrıa un sistema de la forma

x =

[−1 a

3−K1 −2−K2

]

x

Los polos de lazo cerrado estan determinados por el polinomio caracterıstico, i.e.,

|λI − (A−BK)| = 0

λ2 + λ(K2 + 3) + 2 + K2 + a(K1 − 3) = 0

Supongamos que queremos que los polos de lazo cerrado esten ubicados en -2, -3, i.e.,

(λ + 2)(λ + 3) = 0

λ2 + 5λ + 6 = 0

Entonces, se tendrıa finalmente que escoger K2 = 2, y K1 = 2a + 3, con a 6= 0.

Que sucederıa en el problema anterior si a = 0? En ese caso, no se pueden colocar los polos de lazo cerradodonde uno lo desea, ya que el sistema no serıa controlable. La siguiente definicion ilustra mejor este concepto.

Definition 25 El sistema

x = Ax + Bu

es controlable si y solo si es posible transferir, por medio de la entrada u(t), el sistema de cualquier estadoinicial x(t) = x0 a cualquier otro estado x(T ) = xT en un tiempo finito T − t ≥ 0.

En R3 serıa algo como se ve en la Figura 8.3.

x0

xf = x(T )

x3

x1

x2

Figura 8.3: Comportamiento de la definicion de controlabilidad en R3.


Definition 26 El sistema

x = Ax + Bu

se dice que es controlable si para cualquier polinomio αc(s) de orden n existe un unico control u = −Kxtal que el polinomio caracterıstico de A−BK sea igual a αc(s).

Otra forma de comprobar si un sistema es controlable o no, es por medio de las caracterısticas algebraicasde sus matrices. Para definir correctamente esto, se necesita recordar lo siguiente.

Theorem 8.3.1 El rango de una matriz A es el numero de columnas (o filas) linealmente independientes.

Definition 27 Un conjunto de vectores {v1, v2, . . . , vn} son linealmente independientes si

α1v1 + . . . αnvn = 0⇒ α1 = α2 = . . . = αn = 0

Si no, son linealmente dependientes, ya que al menos un αi 6= 0 uno podrıa expresar el vector asociado conel como una combinacion lineal en terminos de los otros vectores.

Ejemplo 8.3.2 Los vectores [1, 3]>, [4, 5]>, [6, 4]> NO son independientes, porque se pueden escogerα1 = −2, α2 = 2, y α3 = −1, tal que α1[1, 3]> + α2[4, 5]> + α3[6, 4]> = 0.

Theorem 8.3.2 El sistema

x = Ax + Bu A ∈ Rn×n

se dice que es controlable si rank(C) = n donde

C = [B... AB

... . . .... An−1B]

es la matriz de controlabilidad.

Ejemplo 8.3.3 Dado el sistema

x =

[−1 00 −3

]

x +

[11

]

u

Determina si

1. El sistema es controlable?

2. Si es ası, determine las ganancias K = [K1,K2] tal que los polos de lazo cerrado esten ubicados enλ ∈ {−2,−2}.

Una de las ventajas de las formas canonicas se puede ver a continuacion. Si el sistema esta en la formacanonica controlable, se tiene que

A =

0 1 0 . . . 00 0 1 . . . 0

. . . . . . . . . . . . . . .0 0 0 . . . 1−a0 −a1 −a2 . . . −an−1

B =

00...1


Si se quisieran ubicar los polos en unos puntos determinados con K = [K1, . . . ,Kn], los valores propios deA−BK estan dados por las raıces de |λI − (A−BK)| = 0, los cuales son

λn + (an−1 + Kn)λn−1 + (an−2 + Kn−1)λn−2 + . . . + a0 + K1 = 0

Si se comparara con el polinomio deseado,

λn + β1λn−1 + . . . + βn−1λ + βn = 0

Por lo tanto, serıa muy sencillo obtener los valores de las ganancias Ki, de la forma

K1 = βn − a0

K2 = βn−1 − a1

Y ası sucesivamente.

Sin embargo, no es necesario transformar el sistema en la forma canonica controlable para hacer laubicacion de polos. Se puede hacer esto directamente con el sistema (A,B) y luego calcular la ecuacioncaracterıstica con A−BK directamente.

Un test interesante con el cual se puede verificar la controlabilidad de un sistema es el PBH test.

Theorem 8.3.3 El par (A,B) es controlable si y solo si rank[A−λI... B] = n para todos los valores propios

de A.

El desarrollo hasta ahora se ha basado en state feedback u = −Kx. Se tendrıa la misma libertad si seescogieran los polos si se utilizara output feedback, u = −Ky?

Ejemplo 8.3.4 [22] Considere la funcion de transferencia

Y (s)

U(s)=

1

s(s + 1)(s + 2)

Se desea disenar este servosistema para que lo polos en lazo cerrado esten ubicados en −2 ± j3,464 y −10.Se supone que la configuracion del sistema es la que se ve en la Figura 8.4.

r+

−

K1

+

−−

K2

K3

x = Ax + Bux2

x1

x3

y = Cxy = x1

Figura 8.4: Realimentacion de estado con referencia.

El sistema en terminos de las variables de estado se ve como

x =

0 1 00 0 10 −2 −3

x +

001

u

y = [1 0 0]x

Y ademas, a partir de la Figura... es claro que u = −(K2x2 + K3x3) + K1(r − x1) = −Kx + K1r.


En primera instancia tenemos que determinar si el sistema es controlable. Para ello, se define lamatriz de controlabilidad

C = [B | AB | A2B]

=

0 0 10 1 −31 −3 7

Por lo tanto, se puede ver que el rank(C) = 3, y por ende, el sistema es controlable. Ahora sı podemos mirarel polinomio caracterıstico |λI − (A−BK)| = 0, y compararlo con el deseado. De esta forma se obtienen losdos polinomios a comparar, i.e.,

λ3 + λ2(K3 + 3)− λ(2−K2) + K1 = 0

Y el polinomio deseado serıaλ3 + 14λ2 + 56λ + 160 = 0

Por lo tanto, K = [160, 54, 11]. El sistema finalmente quedarıa de la forma

x =

0 1 00 0 1−160 −56 −14

x +

00

160

r

y = [1 0 0]x

Para un sistema de una entrada y una salida, la formula de Ackermann es util para calcular la matriz K deu = −Kx, dada la ecuacion caracterıstica

q(λ) = λn + αn−1λn−1 + . . . + α0

En este caso,K = [0 0 . . . 1]C−1q(A)

dondeq(A) = An + αn−1A

n−1 + . . . + α0I

y C es la matriz de controlabilidad.

Ejemplo 8.3.5 Se tiene una funcion de transferencia

Y (s)

U(s)=

1

s2

determinar K tal que los polos esten ubicados en −1± j.

En este caso, el polinomio caracterıstico serıa de la forma

q(λ) = λ2 + 2λ + 2

Por lo tanto se tendrıa que α1 = α0 = 2. La representacion de estado esta dada por

x =

[0 10 0

]

x +

[01

]

u

Por ende, la matriz de controlabilidad estarıa dada por

C = [B|AB] =

[0 11 0

]

Lo cual implica que el sistema es controlable (Notese bien que para obtener K utilizando esta formula,se requiere que la inversa de la matriz C exista, y esto se da esencialmente al garantizar que Ces full rank, i.e., cuando el sistema es controlable). Por lo tanto, podrıamos calcular K de la forma

K = [0 1]C−1q(A)


donde

C−1 =1

−1

[0 −1−1 0

]

=

[0 11 0

]

y

q(A) =

[0 10 0

]2

+ 2

[0 10 0

]

+ 2

[1 00 1

]

=

[2 20 2

]

Por lo tanto,K = [2 2]

8.4. Diseno de Estimadores en el Espacio de Estado

En lo que hemos visto, es necesario tener acceso a todas las variables de estado. Recordemos que latopologıa de state feedback viene dada por el diagrama de la Figura 8.5.

−

uB

+

+

∫

A

Cx

y

K

r+

Figura 8.5: Realimentacion de estado por medio de una ganancia K.

Si recordaramos el ejemplo anterior, hay sistemas que no tienen todas sus variables de estado accesibles.Por lo tanto, existen tecnicas que proveen un estimado de los estados inaccesibles. Un sistema dinamico cuyasvariables son las variables de estado de otro sistema se conoce como un observador de este sistema. El terminofue acunado por D. Luemberger en 1963, el cual demostro que para cualquier sistema lineal observable, sepuede disenar un observador tal que el error de lo estimado (i.e., la diferencia entre el estado del sistemaactual y el observado), tiende a cero asintoticamente tan rapido como uno lo desee. Esta tecnica de disenoes equivalente al diseno de sistemas retroalimentados por pole placement.

Un observador es un dispositivo que reconstruye una senal, el cual provee el estimado de los estadosinaccequibles como e ve en la Figura 8.6.

−

u y

K

r

+

Observer

Plant (A, B, C)

z

Figura 8.6: Observador asociado con la planta.

Asumamos que existe una planta cuyo comportamiento esta dado por

x = Ax + Buy = Cx

La entrada u y la salida y estan conectadas al sistema estimado como se muestra en la Figura 8.7.

Si el estado del sistema es z, entonces por inspeccion se tiene

˙z = (A− LC)z + Bu + Ly

8.4. DISENO DE ESTIMADORES EN EL ESPACIO DE ESTADO 115

y

+

−

u B

+

+

+

˙z ∫

A

zC

yL

Figura 8.7: Observador asociado con la planta.

Por lo tanto, el comportamiento dinamico de la diferencia entre los estados de los dos sistemas esta dado por

˙z − x = (A− LC)(z − x)

Si se puede escoger L tal que A− LC tenga raıces con parte real negativa, entonces z → x cuando t → ∞,independientemente de la entrada u.

Definition 28 El sistemax = Ax + Buy = Cx

con condiciones iniciales x(0) = x0 es observable si el estado x(t) puede ser determinado por la entradau(s) y la salida y(s), 0 ≤ s ≤ t.

Theorem 8.4.1 El sistemax = Ax + Buy = Cx

es observable si rank(O) = n, donde O = [C... CA

... CA2... . . .

... CAn−1]> es la matriz de observabilidad.

Es claro que los polos del error de lazo cerrado ˙z − x = (A− LC)(z − x) pueden ser colocados en cualquierposicion (escogiendo L), siempre y cuando el par (A,C) sea observable.

Para un sistema de una entrada y una salida, tambien se pueden seleccionar los valores de L por mediode la formula de Ackermann, con

L = [L1 L2 . . . Ln]>

Si la ecuacion caracterıstica esρ(λ) = λn + βn−1λ

n−1 + . . . + β0

En este caso,L = ρ(A)O−1[0 0 . . . 1]>

dondeρ(A) = An + αn−1A

n−1 + . . . + α0I

y O es la matriz de observabilidad.

Ejemplo 8.4.1 Para el sistema

x =

[2 3−1 4

]

x +

[01

]

u

y = [1 0]x

asumamos que queremos tener un polinomio caracterıstico de la forma

ρ(λ) = λ2 + 2ζωnλ + ω2n

donde ζ = 0,8 y ωn = 10.

Halle L para tal efecto.


Teniendo estos datos, se sabe entonces que β1 = 16 y que β0 = 100. Por ende, el polinomio caracterısticoutilizando la formula de Ackermann serıa

ρ(A) =

[2 3−1 4

]2

+ 16

[2 3−1 4

]

+ 100

[1 00 1

]

=

[133 66−22 177

]

donde

O =

[1 02 3

]

y

O−1 =

[1 0−2/3 1/3

]

Por lo tanto,L = [22 59]>

Esto se pudo haber obtenido como se habıa venido haciendo hasta el momento.

Definition 29 El sistemax(t) = Ax + Bux(0) = x0

(8.2)

se dice que es stabilizable si existe una matriz K tal que para u = −Kx, el sistema en lazo cerrado

x = (A−BK)x

es estable.

De manera informal, lo que nos plantea la definicion es que (8.2) es stabilizable si y solo si todos los modosinestables son controlables.

Definition 30 El par (C,A) es detectable si existe una matriz L tal que A− LC, sea estable.

En otras palabras, desde el punto de vista de los valores propios se tiene que

λ{A− LC} = λ{A> − C>L>}

Entonces, (C,A) es detectable si y solo si (A>, C>) es stabilizable.

8.5. Integrated Full-State Feedback and Observer

El compensador de variables de estado se construye a partir de la union de la ley de control de lo quese conoce como full-state feedback y el observador. El compensador se muestra en la Figura...

ANADIR FIGURA

Para el diseno se siguen los siguientes pasos:

1. Se asume que todas las variables de estado son medibles, y se utiliza una ley de control conocida comofull-state feedback control law. En realidad esto no es practico ya que por lo general no es posible medirtodos los estados. En la practica solo algunos estados son medibles, o algunas combinaciones de ellosexisten.

2. Se construye un observador para estimar los estados que no se pueden sensar directamente, ni queestan disponibles como salidas. Estos observadores pueden ser full-state o de orden reducido (estos enel caso que algunos estados esten disponibles como salidas, por lo cual no necesitan ser estimados).

3. Se requiere acoplar el observador con el full-state feedback control law. Esto ultimo se conoce comocompensador.

8.5. INTEGRATED FULL-STATE FEEDBACK AND OBSERVER 117

4. Adicionalmente, se pueden considerar entradas de referencia para completar el diseno.

Para el 3er punto, se podrıa tener que la ley de control esta dada por

u(t) = −Kx(t) (8.3)

Es esta una buena estrategia? Originalmente, K se diseno para garantizar que el sistema en malla cerradafuera estable, i.e.,

det(λI − (A−BK)) = 0

tenıa raıces ubicadas en el LHP. Si todos los estados estaban disponibles, entonces al seleccionar K para quela premisa se cumpla, se tenıa que x(t) → 0 cuando t → ∞ para cualquier condicion inicial x(t0). Ahorabien, lo que se necesita es comprobar que con (8.3) el sistema sigue siendo estable. Para ello, se tiene que elobservador de estado viene dado por

˙x = (A−BK − LC)x + Ly (8.4)

como se ve en la Figura...

ANADIR FIGURA

El error de estimacion utilizando el compensador de (8.4) darıa que

e = x− ˙x = Ax + Bu−Ax−Bu− Ly + LCx

Es decire = (A− LC)e (8.5)

lo cual es equivalente al error de estimacion que se obtuvo en el diseno del observador. Esto implica que elerror de estimacion NO depende de la entrada.

Se tiene el sistemax = Ax + Buy = Cx

Si u = −Kx, entoncesx = (A−BK)x + BKe (8.6)

donde x = x− e. De forma matricial, combinando (8.5) y (8.6) tendrıamos que

[xe

]

=

[A−BK BK

0 A− LC

] [xe

]

El objetivo es verificar que la ley de control u = −Kx sigue siendo una buena solucion para mantener elsistema estable.

Para ello, recordemos que la ecuacion caracterıstica esta dada por

det(λI − (A−BK))det(λI − (A− LC)) = 0

Si las raıces del polinomio det(λI − (A−BK)) = 0 estan en el semi-plano izquierdo (lo cual es cierto por eldiseno de K), y si las raıces de det(λI − (A−LC)) = 0 estan tambien en dicho semi-plano (lo cual es ciertopor el diseno del observador), entonces el sistema total serıa estable. Por ende, el diseno de ambas cosas porseparado es valido, y esto se conoce como el separation principle.

Ası pues, todo se podrıa resumir de la siguiente manera:

1. Determinar K tal que det(λI−(A−BK)) = 0 tenga raıces en el semi-plano izquierdo, y ubicar los polostal que se cumplan las especificaciones de diseno. La ubicacion arbitraria de los polos esta garantizadapor el hecho de que el sistema sea completamente controlable.

2. Determinar L tal que det(λI − (A − LC)) = 0 tenga raıces en el semi-plano izquierdo y ubicar polospara cumplir los criterios de desempeno del observador. Esto se da porque el sistema es observable.


3. Conectar utilizandou(t) = −Kx

La funcion de transferencia del compensador serıa

sX(s) = (A−BK − LC)X(s) + LY (s)

U(s) = −KX(s)

U(s) = (−K(sI − (A−BK − LC))−1L)Y (s)

Capıtulo 9

Control Multivariable

Lo expuesto en este capıtulo esta desglosado en el artıculo [34]. Sin embargo, algunos ejemplo hansido tomados de [1] y [31].

9.1. Introduccion

Por lo general, en la industria siempre se tiene mas de un lazo de control para poder fabricar susproductos. Estos sistemas se conocen como sistemas multivariables o sistemas de multiples entradas y salidas(MIMO, por sus siglas en ingles). Algunos ejemplos comunes son:

Reactores quımicos.

Columnas de destilacion.

Intercambiadores de calor.

Por ejemplo, en un reactor quımico como el que se ve en la Figura..., las variables de interes son usualmentela composicion del producto y la temperatura de reaccion.

ANADIR FIGURA

Por lo tanto, habra un lazo dedicado a la composicion, y otro a la temperatura. Sin embargo, cualquiercambio en uno de los lazos estara afectando al otro por lo que ambos lazos deberan saber que hace el otropara ası poder cumplir sus objetivos de control. Este fenomeno es lo que se conoce como interaccion delazo. Este tipo de interacciones debidas a la forma del proceso o a su diseno pueden causar problemas deinestabilidad del sistema.

9.2. Analisis de los Sistemas Multivariables

9.2.1. Representacion

Las tecnicas de diseno de controladores se basa en modelos lineales por lo general por medio deecuaciones diferenciales que describen su comportamiento (tambien pueden existir metodos empıricos paradeterminar la estructura del proceso).

Por lo general, este tipo de modelos se hace mediante aproximaciones de espacio de estado, o utilizandoel modelo de entrada/salida (i.e., funciones de transferencia).

119

120 CAPITULO 9. CONTROL MULTIVARIABLE

9.2.2. Modelos

Por lo general, los sistemas de dimension elevada se pueden descomponer en subsistemas de 2× 2, porlo que la discusion a seguir se basara en procesos de dos entradas y dos salidas.

Estos modelos pueden asumir varios tipos de formas estructurales. Dos modelos comunes son lasrepresentaciones P- y V-canonical que se muestran en la Figura...

ANADIR FIGURA

Con la estructura en P-canonical se tiene una interaccion conocida como feedforwards, mientras quela V-canonical posee un acople feedback. Los elementos Gk

ij corresponden a funciones de transferencia quedeterminan las diversas relaciones entrada/salida.

P-canonical Representation

Como se puede ver en la Figura..., las salidas estan determinadas por

y1 = u1Gp11 + u2G

p12

y2 = u1Gp21 + u2G

p22

Esto se puede ver de manera matricial como

y = Gpu

Es decir[

y1

y2

]

=

[Gp

11 Gp12

Gp21 Gp

22

] [u1

u2

]

V-canonical Representation

Como se puede ver en la Figura..., las salidas estan determinadas por

y1 = (y2Gv12 + u1)G

v11

y2 = (y1Gv21 + u2)G

v22

Esto se puede ver de manera matricial como

y = [I −GvmGv

I ]−1Gvmu

donde

y =

[y1

y2

]

Gvm =

[Gv

11 00 Gv

22

]

GvI =

[0 Gv

12

Gv21 0

]

u =

[u1

u2

]

9.2. ANALISIS DE LOS SISTEMAS MULTIVARIABLES 121

Relacion Entre Representaciones

Un sistema puede ser modelado utilizando cualquiera de las estructura P o V, y su relacion esta dadapor

Gp = [I −GvmGv

I ]−1Gvm

siempre y cuando la inversa exista.

La pregunta que surgirıa serıa cual de estas dos representaciones tendrıa que utilizarse. No existenreglas para ello, sin embargo, lo siguiente deberıa ser tenido en cuenta:

1. Los parametros del modelo deben ser determinados por los experimentos.

2. El modelo debe ser lo suficientemente representativo del proceso.

3. El modelo debe ser simple y que contenga la mayor cantidad de informacion.

Consideremos primero la V-canonical representation. No es posible obtener las matrices Gvm y Gv

I a partir delas pruebas de malla-abierta por ejemplo. Esto se debe a que un cambio en cualquiera entrada afectara todaslas otras I/O del sistema. Sin embargo, tecnicas numericas de identificacion permitiran la obtencion de lasfunciones de transferencia de la V-canonical representation. Por otro lado, los procesos se ven afectados porperturbaciones externas de carga. En la V-canonical representation se tiene que

y = [I −GvmGv

I ]−1(Gvm + GDv)

donde

GD =

[GD1 0

0 GD2

]

y v es un vector de perturbaciones. Si se tuviesen las mismas perturbaciones de carga en P-canonical repre-sentation esto darıa

y = Gpu + GDv

Notese que en este caso cada par de I/O esta unicamente definido, y los elementos de las funciones detransferencia Gp y GD se pueden determinar directamente por experimentacion de lazo abierto. Ademas, enla P-canonical representation el modelo es implıcitamente observable y controlable, i.e., las salidas puedenser medidas y las entradas pueden ser consideradas para control. Por lo tanto, de ahora en adelante nosconcentraremos en representaciones tipo P-canonical.

9.2.3. Problemas de Interaccion

Preguntas como porque se necesita el control multivariable, o cuales son los efectos de la interaccionen el desempeno del sistema surgen en estos casos. Para poder ver el efecto de la interaccion, asumamos quese tiene el sistema de la Figura... con G21 = G12 = 0.

ANADIR FIGURA

Es decir, se tienen dos procesos G11 y G22 los cuales interactuan con unos controladores proporcionales.Como no existirıa acople entre los sistemas, se tendrıan ecuaciones caracterısticas independientes de la forma

1 + Kc1G11 = 0

1 + Kc2G22 = 0

Si asumimos que los procesos G11 y G22 son de primer orden, con un controlador proporcional se tendra unsistema estable, independientemente de la magnitud de las ganancias Kci. Sin embargo, la ecuacion carac-terıstica cuando G21 6= 0 y G12 6= 0 vendrıa dada por

1 + Kc1G11 + Kc2G21 + Kc1G11Kc2G22 −Kc1Kc2G12G21 = 0

(1 + Kc1G11)(1 + Kc2G22)−Kc1Kc2G12G21 = 0


Esta ecuacion nos muestras que en este caso sı habra un rango limitado de accion de las ganancias para queexista estabilidad en el sistema.

El problema de la interaccion puede ser disimuido por la escogencia de los acoples entrada/salida. Paraun sistema de 2×2, esto serıa simple ya que u1 se acopla con y2, y u2 con y1, y si estos acoples no surtenefecto en el diseno entonces se acoplan u1 − y1 y u2 − y2. Sin embargo, para sistemas de n dimensiones,se tendran que intentar n! acoples lo que hace imposible probar todas las posibilidades. Por lo tanto, esimportante evaluar cuantitativamente el grado de interaccion entre lazos de control con el fin de estructurarel esquema de control que contenga la menor interaccion posible. Una tecnica para ello es lo que se conocecomo el relative gain analysis technique.

9.2.4. Relative Gain Array

Bristol (REF Bristol 66) desarrolla una tecnica que sirve para la seleccion de “manipulative-controlledvariable pairings”, ası como los comportamientos de las respuestas controladas (REF Skinskey 81). Estemetodo permite determinar si un par entrada/salida es una buena escogencia para implementar un contro-lador SISO, ya que la interaccion con otros lazos sera despreciable. El analisis se basa en la construcciondel relative gain array (RGA), el cual se presenta a continuacion para un sistema de 2 × 2 en la formap-canonical.

Sean Kij las ganancias de la funcion de transferencia Gij . Asumiendo que u2 permanece constante,un cambio a entrada paso en u1 de magnitud ∆u1, producira un cambio ∆y1 en la salida y1. Entonces, laganancia entre u1 y y1 cuando u2 es constante esta dada por

K11|u2=

∆y1

∆u1

∣∣∣∣u2

Si ahora se mantiene constante y2 en vez de u2, entonces un cambio en ∆u1 resultara en un cambio diferenteen y1, y

K11|y2=

∆y1

∆u1

∣∣∣∣y2

Si bien las ganancias estan definidas para el mismo par de variables, sus valores pueden ser diferentes ya quese obtienen para diferente condiciones. Si existe interaccion, entonces el cambio en y1 debido al cambio enu1 para los dos casos (i.e., u2 y y2 constantes) sera diferente.

Se define

λ11 =K11|u2

K11|y2

como el relative gain entre la salida y1 y la entrada u1. Se tiene entonces que

Si λ11 = 0 entonces el cambio en u1 no influye en y1. Por ende, no deberıa ser utilizado para controlary1.

Si λ11 = 1 entonces la ganancia entre la salida y1 y la entrada u1 no se ve afectada por el lazo y2− u2,i.e., no existe interaccion.

Para un proceso de 2× 2 se tienen los siguientes elementos

λ12 =K12|u1

K12|y2

=

∆y1

∆u2

∣∣∣u1

∆y1

∆u2

∣∣∣y2

λ21 =K21|u2

K21|y1

=

∆y2

∆u1

∣∣∣u2

∆y2

∆u1

∣∣∣y1

9.2. ANALISIS DE LOS SISTEMAS MULTIVARIABLES 123

λ22 =K22|u1

K22|y1

=

∆y2

∆u2

∣∣∣u1

∆y2

∆u2

∣∣∣y1

Por lo que la matriz RGA serıa

Λ =

[λ11 λ12

λ21 λ22

]

Para un sistema de n entradas y n salidas se tiene que

λij =Kij |uKij |y

=

∆yi

∆uj

∣∣∣u

∆yi

∆uj

∣∣∣y

Los subındices u y y significan que se tienen valores constantes para um, m 6= j y yk, k 6= i, respectivamente.Por lo que la matriz RGA serıa

Λ =

λ11 λ12 . . . λ1n

...λ21 λ22 . . . λnn

Calcular todos estos elementos parecerıa algo tedioso si no fuere porque:

La suma de todos los elementos en cada columna es 1, i.e.,

n∑

i=1

λij = 1, ∀j = 1, . . . , n

La suma de todos los elementos en cada fila es 1, i.e.,

n∑

j=1

λij = 1, ∀i = 1, . . . , n

Por lo tanto, en un sistema de 2 × 2, solo se tiene que determinar un solo elemento del RGA, ya que losdemas se podran encontrar a partir de este, i.e.,

λ12 = 1− λ11

λ21 = λ12

λ22 = λ11

De manera similar para un sistema de n× n, solo se tienen que determinar (n− 1)× (n− 1) elementos.

Este metodo se basa en un procedimiento experimental. Una determinacion analıtica es posible si unmodelo en estado estable esta disponible. Entonces si tenemos

y1 = K11u1 + K12u2

y2 = K21u1 + K22u2

donde Kij son las ganancias en estado estable de la matriz de funciones de transferencia. Entonces,

K11|u2=

∂y1

∂u1

∣∣∣∣u2

= K11

Se sabe que

y1 = K11u1 + K12y2 −K21u1

K22


Entonces

K11|y2=

∂y1

∂u1

∣∣∣∣y2

= K11 −K12K21

K22

Por lo tanto, si reemplazaramos obtenemos que

λ11 =K11K22

K11K22 −K12K21

De esta forma, los demas elementos de la matriz RGA podran ser calculados.

Para un sistema de n× n, si se conoce la matriz de ganancias del proceso K, entonces

Λ = K. ∗ (K>)−1

donde .∗ corresponde a la multiplicacion elemento por elemento.

9.2.5. Seleccion de Lazos Utilizando RGA

Una vez se tenga Λ, los siguientes casos pueden surgir:

1. Si λ11 = 0 entonces la matriz RGA tiene elementos en 0 en la diagonal principal y 1 en la no diagonal.Es decir, que el control del sistema solo se puede lograr agrupando y1 con u2 y y2 con u1. El sistemacontrolado resultante no tendra interaccion.

2. Si λ11 = 1 entonces el sistema no interactua entre sı, y los pares y1 − u1 y y2 − u2 son los que estarıanactivos. Por ende, u1 (u2) no puede ser utilizado para controlar y2 (y1).

3. Si 0 < λ11 < 0,5 (e.g., λ11 = 0,25), entonces los elementos de la diagonal tendran menos peso, i.e., elmejor acople se dara entre y1 − u2 y y2 − u1.

4. Si 0,5 < λ11 < 1, es el caso opuesto al anterior, i.e., los elementos que tendran mas peso se dara por elacople de y1 − u1 y y2 − u2.

5. Si λ11 > 1, entonces los elementos de la no-diagonal seran negativos. Si los pares y1 − u1 y y2 − u2 setoman en cuenta, se tendrıa que

λ11 =K11|u2

K11|y2

> 1

y

λ22 =K22|u1

K22|y1

> 1

Suponiendo que K11|u2= 1, entonces 0 < K11|y2

< 1, lo que implica que el cambio en y1 debido alcambio en u1 es reducido si el lazo y2 − u2 esta cerrado. Es decir que las respuestas controladas severan afectadas por la interaccion del otro lazo. Entre mayor sea la ganancia relativa, mayor sera elefecto. Por lo tanto, el par en cuestion requerira el uso de ganancias de controlador mayores. Los paresy1 − u2 y y2 − u1 no son los adecuados para ello, ya que las ganancias son negativas. Esto implica quelas interacciones resultantes haran que las salidas controladas se desvıen de donde se deseaba, y por lotanto el controlador no sera el adecuado ya que fallara.

Estos son solo algunos casos, pero si uno quisiera ser mas riguroso tendrıa que mirar los casos con diferentenumero de I/O y perturbaciones, lo cual esta fuera del alcance al que queremos llegar en esta clase. Sinembargo, una regla general para la seleccion de los lazos de control serıa:

Los lazos de control deberan tener pares I/O que tengan positive relative gainscon valores lo mas cercanos posibles a 1.

El uso de las ganancias relativas para determinar el mejor acoplamiento I/O para control de un sistemamultivariable lleva a lo que se conoce como la estrategia de control “dominant interaction.”

9.3. CONTROL MULTIVARIABLE DESACOPLADO 125

Ejemplo 9.2.1 [1] Un sistema tiene una matriz de ganancias DC dadas por

K = G(0) =

−1 1,5 2,84 1,6 4

0,15 2 −0,1

Cuales serıan los pares ideales?

La matriz RGA estarıa dada por

RGA = K. ∗K> =

0,26 0,0478 0,69220,7328 −0− 0163 0,28350,0073 0,9685 0,0242

Los pares recomendados en este caso serıan y2 − u1, y3 − u2 y y1 − u3 si se llegasen a utilizar controladoresPI SISO.

9.3. Control Multivariable Desacoplado

Otra aproximacion para tratar interacciones entre los lazos de control es disenar esquemas de controlque no interactuen entre sı, i.e., desacoplados. La idea fundamental es eliminar completamente los efectos delas interacciones de lazo. Esto se logra por medio de la especificacion de redes de compensacion conocidascomo desacopladas. El rol de estos desacopladores es descomponer un proceso multivariable en una seriede subsistemas independientes de un solo lazo. Si esto se logra, entonces un desacople completo (o ideal)ocurre y el proceso multivariable puede ser controlado utilizando controladores independientes de un sololazo. La Figura... ilustra el esquema generalmente utilizado en el desacople.

ANADIR FIGURA

La forma de la red de desacople ha sido la causa de cierta controversia, ya que existen diferentes tiposde representaciones (e.g., P- o V-decouplers), de los cuales la mas popular es el P-decoupler introducido porBoksenbom and Hood , el cual se ve en la Figura...

ANADIR FIGURA

En este caso, G∗c corresponde a la matriz de elementos de desacople,

G∗c =

[G∗

c,11 G∗c,12

G∗c,21 G∗

c,22

]

Por otro lado, la matriz G (2×2) es la matriz de funciones de transferencia del proceso descrita previamente,la cual esta asociada con unos vectores de entrada/salida u y y. Se introduce un vector de set points oreferencias, w = [w1, w2]

>, lo cual redunda en

y = Gu

u = G∗c(w − y)

y = GG∗c(w − y)

y = [I + GG∗c ]

−1GG∗cw

Para que los lazos individuales del sistema de malla cerrada sean independientes el uno del otro, se requiereque

X = [I + GG∗c ]

−1GG∗c = diag(x1, x2)

i.e., X debe ser una matriz diagonal. Como la suma y el producto de dos matrices diagonales son diagonales,y la inversa de una matriz diagonal tambien es diagonal, entonces este requisito se cumple si GG∗

c es diagonal,i.e.,

GG∗c =

[G11 G12

G21 G22

] [G∗

c,11 G∗c,12

G∗c,21 G∗

c,22

]

=

[q1 00 q2

]


donde

q1 = G11G∗c,11 + G12G

∗c,21

0 = G11G∗c,12 + G12G

∗c,22

0 = G21G∗c,11 + G22G

∗c,21

q2 = G21G∗c,12 + G22G

∗c,22

Por lo tanto, si los elementos de la funcion de transferencia G se conocen, y teniendo especificados loselementos de la diagonal de G∗

c , entonces se pueden seleccionar los elementos de la no diagonal de G∗c para

determinar el desacople. Esto implicarıa que

G∗c,12 = −

G12G∗c,22

G11

G∗c,21 = −

G21G∗c,11

G22

Si los elementos del camino directo del desacoplador (i.e., G∗c,11 y G∗

c,22) se toman como controladores PI porejemplo, entonces dadas las funciones de transferencia del proceso, la red de desacople se podra especificartotalmente. Esta tecnica de diseno requiere un conocimiento total de G, y por lo tanto se enfatiza enel uso de la P-canonical form, ya que como se dijo previamente esta representacion puede ser obtenidaexperimentalmente.

Notese que esta estructura solo estudia el problema del servomecanismo. El rechazo a perturbacionesde carga requiere una aproximacion diferente. Con esta configuracion, si los elementos del forward path(G∗

c,11 y G∗c,22) se sintonizan online, entonces los elementos de compensacion de la off-diagonal se tienen que

recalcular. Si bien este no es un gran problema si la estrategia se implemente en un microcontrolador, lainter-dependencia de los elementos desacoplados se convierte en una desventaja cuando uno de los lazos secoloca en modo manual. Para este caso, el efecto de desacople se pierde.

Otro metodo es el de Zalkind-Luyben. Previamente se discutio la necesidad del desacople con contro-ladores de lazo independiente como se ve en la Figura...

ANADIR FIGURA

En este caso, se tienen dos bloques extra que representan los controladores del forward-loop. A diferen-cia del caso anterior, la red de desacople forma una segunda post-compensacion y permitira mas flexibilidaden la implementacion y commissioning1del esquema de control non-interacting. Sea Gc la matriz del contro-lador del forward path con salid u, por lo que

y = Gu∗

u∗ = G∗cu

u = Gc(w − y)

y = GG∗cGc(w − y)

Como Gc es una matriz diagonal, el objetivo de desacople se logra si

X = GG∗c = diag[x1, x2]

Es decir,

G∗c = G−1X =

1

det(G)

[G22x1 −G12x2

−G21x1 G11x2

]

La forma mas simple se da con elementos unitarios en la diagonal, i.e.,

G∗c,11 = G∗

c,22 = 1

1A form of payment to an agent for services rendered. Remuneration.

9.3. CONTROL MULTIVARIABLE DESACOPLADO 127

Lo que hace que

G∗c,12 = −G12

G11

G∗c,21 = −G21

G22

Lo que indican estas ecuaciones es que con este metodo los elementos de desacople son independientes delos controladores del forward path. Por lo tanto, la sintonizacion online de los controladores no requiereun rediseno de los elementos de desacople. Los modos del controlador se pueden cambiar de PI a PID porejemplo, y cualquiera de los forward paths se pueden colocar en manual sin perdida de desacople. Notese queel desacople se hace entre la senal de control del forward path y las salidas del proceso, y no entre set pointsy salidas, por lo que esta tecnica no esta restringida al servo-problema. Sin embargo, la matriz G tiene queconocerse.

Bibliografıa

[1] Pedro Albertos and Antonio Sala. Multivariable control systems: an engineering approach. SpringerVerlag, 2004.

[2] Karl J. Astrom and Bjorn Wittenmark. Computer Controlled Systems. Prentice Hall, New Jersey, NJ,1997.

[3] S. Bennett. A brief history of automatic control. IEEE Control Systems Magazine, 16(3):17–25, 1996.

[4] W.L. Brogan. Modern control theory. Prentice-Hall, Inc. Upper Saddle River, NJ, USA, 1991.

[5] C.M. Close and D.K. Frederick. Modeling and analysis of dynamic systems. Wiley New York, 2001.

[6] J.J. D’Azzo and C.H. Houpis. Linear Control System Analysis and Design. McGraw-Hill, third editionedition, 1988.

[7] Richard C. Dorf and Robert H. Bishop. Modern Control Systems. Addison-Wesley, Reading, MA, 1995.

[8] Asdrubal Espitia. El PID Bajo Control. Asdrubal Espitia Guerra, 1999.

[9] G.W. Evans. Bringing root locus to the classroom. IEEE Control Systems Magazine, 24(6):74–81, 2004.

[10] WR Evans. Control system synthesis by root locus method. Trans. AIEE, 69:66–69, 1950.

[11] Gene F. Franklin, J. David Powell, and Abbas Emami-Naeini. Feedback Control of Dynamic Systems.Addison-Wesley, Reading, MA, 1994.

[12] B. Friedland. Control System Design: An Introduction to State-space Methods. McGraw-Hill, 1986.

[13] Edward W. Kamen and Bonnie S. Heck. Fundamentals of signals and systems using MATLAB. PrenticeHall, Upper Saddle River, New Jersey, 1997.

[14] Hassan. K. Khalil. Nonlinear Systems. Prentice Hall, New Jersey, 1996.

[15] K.H. Lundberg. Pole-zero phase maps: visualization helps students develop s-plane intuition. IEEEControl Systems Magazine, 25(1):84–87, 2005.

[16] T.E. Marlin. Process Control: Designing Processes and Control Systems for Dynamic Performance.McGraw-Hill, 1995.

[17] S.J. Mason. Feedback Theory-Some Properties of Signal Flow Graphs. Proceedings of the IRE,41(9):1144–1156, 1953.

[18] S.J. Mason. Feedback Theory-Further Properties of Signal Flow Graphs. Proceedings of the IRE,44(7):920–926, 1956.

[19] N. Minorsky. Directional stability of automatically steered bodies. J. Am. Soc. Nav. Eng, 34:280, 1922.

[20] C. B. Moler and C.F.V. Loan. Nineteen dubious ways to compute the matrix exponential. SIAM Review,20(4):801–836, 1978.

129

130 BIBLIOGRAFIA

[21] R.M. Murray, K.J. Astrom, S.P. Boyd, R.W. Brockett, and G. Stein. Future directions in control in aninformation-rich world. IEEE Control Systems Magazine, 23(2):20 – 33, 2003.

[22] K. Ogata. Modern control engineering. Prentice-Hall, Inc. Upper Saddle River, NJ, USA, 1996.

[23] Katsuhiko Ogata. Discrete-Time Control Systems. Prentice Hall, New Jersey, NJ, 1987.

[24] B.A. Ogunnaike and W.H. Ray. Process dynamics, modeling, and control. Oxford University Press NewYork, 1994.

[25] Alan V. Oppenheim and Alan S. Willsky. Signals and Systems. Prentice Hall, Upper Saddle River, NewJersey, 1997.

[26] H. Ozbay. Introduction to Feedback Control Theory. CRC Press, 1999.

[27] K.M. Passino. Biomimicry for Optimization, Control, and Automation. Springer-Verlag, London, 2005.

[28] C. Phillips and R. Harbor. Feedback Control Systems. Prentice Hall, 1996.

[29] F.H. Raven. Automatic Control Engineering. McGraw-Hill New York, 1995.

[30] S. Sastry. Nonlinear Systems: analysis, stability, and control. Springer, 1999.

[31] C.A. Smith and A.B. Corripio. Principles and practice of automatic process control. Wiley New York,1985.

[32] Karl J. Astrom and Richard M. Murray. Feedback Systems: An Introduction for Scientists and Engineers.2007.

[33] S.H. Strogatz. Nonlinear dynamics and chaos. Addison-Wesley Reading, MA, 1994.

[34] MT Tham. Multivariable Control: An Introduction to Decoupling Control. In K. Warwick and D.Rees,editors, Industrial Digital Control Systems, volume 1 of IEE Control Engineering Series 37, chapter 8,pages 1–19. Peter Peregrinus, 1998.

[35] J.G. Ziegler and N.B. Nichols. Optimum settings for automatic controllers. Trans. ASME, 64(8):759–768, 1942.

not as control

Documents

analisis de sistemas

modelamiento de sistemas

ejemplos de sistemas

sensitividad de sistemas

sistemas retroalimentados

sistemas de orden superior

controladores pid676

pid digital756