perspectiva general del control predictivo …danirr/cursodoct.pdf · ventajas e inconvenientes del...

Depto. de Ingenierıa de Sistemas y Automatica

PERSPECTIVA GENERAL DEL CONTROL PREDICTIVO

MIN-MAX

Curso de Doctorado ’Control Avanzado de Procesos Industriales’

Daniel Rodrıguez Ramırez

Indice general

Lista de figuras V

1. Introduccion 1

1.1. Introduccion al control predictivo . . . . . . . . . . . . . . . . . . . . . 1

1.2. Ventajas e inconvenientes del Control Predictivo . . . . . . . . . . . . . 5

1.3. Control Predictivo Mın-Max . . . . . . . . . . . . . . . . . . . . . . . . 6

2. Perspectiva general de los controladores Min-Max MPC 9

2.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.2. Los primeros trabajos (1987-1992) . . . . . . . . . . . . . . . . . . . . . 10

2.2.1. El trabajo original de Campo y Morari (1987) . . . . . . . . . . 10

2.2.2. Mejoras y formulacion con norma 1 . . . . . . . . . . . . . . . . 12

2.2.3. Un algoritmo basado en la norma 2 . . . . . . . . . . . . . . . . 15

2.2.4. Controlador predictivo adaptativo con diseno para el peor caso

de Veres y Norton (1991) . . . . . . . . . . . . . . . . . . . . . . 17

2.3. Controladores adaptativos basados en incertidumbres globales . . . . . 19

i

ii INDICE GENERAL

2.4. Controladores predictivos robustos basados en LMIs . . . . . . . . . . . 22

2.5. Controladores Min-Max MPC con expresion analıtica . . . . . . . . . . 27

2.6. Controladores para el peor caso con parametros acotados . . . . . . . . 31

2.6.1. MMMPC con predicciones en bucle cerrado . . . . . . . . . . . 33

2.6.2. Estabilidad de las estrategias presentadas . . . . . . . . . . . . . 35

2.6.3. MMMPC en bucle abierto con incertidumbres en B . . . . . . . 36

2.6.3.1. Plantas estables . . . . . . . . . . . . . . . . . . . . . . 37

2.6.3.2. Procesos con un integrador . . . . . . . . . . . . . . . 38

2.7. Min-Max MPC en bucle cerrado de Scokaert y Mayne . . . . . . . . . . 39

2.7.1. Controlador con horizonte de prediccion variable . . . . . . . . . 43

2.8. Estrategias de control Quasi Min-Max MPC . . . . . . . . . . . . . . . 44

2.8.1. Quasi-Min-Max MPC sin restricciones . . . . . . . . . . . . . . 45

2.8.2. Quasi-Min-Max MPC con restricciones . . . . . . . . . . . . . . 47

2.8.3. Actualizacion del politopo Ω . . . . . . . . . . . . . . . . . . . . 48

2.8.4. Extension a sistemas no lineales . . . . . . . . . . . . . . . . . . 49

2.9. Controladores Min-Max MPC basados en series de funciones . . . . . . 50

2.10. Soluciones explıcitas para norma ∞ o norma 1 . . . . . . . . . . . . . . 53

2.11. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

3. Min-Max MPC con incertidumbres globales acotadas 57

3.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

INDICE GENERAL iii

3.2. Min-Max MPC con incertidumbres globales acotadas . . . . . . . . . . 58

3.3. Formulacion del MMMPC con restricciones . . . . . . . . . . . . . . . . 64

3.4. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

3.4.1. Ejemplo de MMMPC sin restricciones . . . . . . . . . . . . . . 66

3.4.2. Ejemplo de MMMPC con restricciones . . . . . . . . . . . . . . 67

3.5. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

A. Elementos basicos del MPC 71

A.1. Modelo de prediccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71

A.1.1. Modelo del Proceso . . . . . . . . . . . . . . . . . . . . . . . . . 71

A.1.2. Modelo de las perturbaciones . . . . . . . . . . . . . . . . . . . 73

A.2. La funcion objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

A.3. Control Predictivo Generalizado . . . . . . . . . . . . . . . . . . . . . . 74

Bibliografıa 76

iv INDICE GENERAL

Indice de figuras

1.1. Estrategia del control predictivo. . . . . . . . . . . . . . . . . . . . . . 2

1.2. Estructura general de los controladores predictivos . . . . . . . . . . . . 4

2.1. Posibles trayectorias del estado . . . . . . . . . . . . . . . . . . . . . . 42

3.1. Simulacion de control de un doble integrador con un MMMPC (trazo

continuo) y GPC (trazo discontinuo): a) salida del proceso b) cambios

en la senal de control. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

3.2. Simulacion de control de un sistema de primer orden con un MMM-

PC con restricciones (trazo continuo) y GPC con restricciones (trazo

discontinuo): a) salida del proceso b) cambios en la senal de control. . . 70

v

vi INDICE DE FIGURAS

Capıtulo 1

Introduccion

Este trabajo trata sobre las estrategias de control predictivo mın-max, las cuales

forman parte del conjunto mas amplio formado por las tecnicas de control predictivo. El

control predictivo es una de las estrategias mas populares de control por computador.

A grosso modo, el problema del control automatico en general y del control por com-

putador en particular, consiste en mantener la salida o estado de un proceso en un valor

deseado (o referencia) actuando sobre ciertas variables manipulables (o entradas). Las

principales caracterısticas y elementos del control predictivo lo son tambien del control

predictivo mın-max. Es por esto que este primer capıtulo se dedica a presentar los

conceptos basicos del control predictivo en general y del min-max en particular.

1.1. Introduccion al control predictivo

El termino control predictivo basado en modelo (MPC) se aplica a un conjunto de

estrategias de control por computador, organizadas en torno a algunas ideas comunes,

que ya desde finales de los 70 (Richalet et al., 1978; Cutler and Ramaker, 1980)1

comenzaron a atraer la atencion del mundo industrial y de la comunidad academica.

Las ideas mas importantes del control predictivo son:

1Es destacable que las ideas presentes en el MPC aparecieron mucho antes. Por ejemplo el empleo

de un modelo de prediccion y la optimizacion de una funcion objetivo pueden encontrarse en el control

en tiempo mınimo empleado en (Coales and Noton, 1956).

1

2 INTRODUCCION AL CONTROL PREDICTIVO

Salidas predichas Y (t+i t)

Variable manipulada U(t+i t)

. . . . . .

FuturoPasado

Referencia

Horizonte de controlHorizonte de predicción

t+1 t+Nu t+N

Figura 1.1: Estrategia del control predictivo.

Como su nombre indica, el MPC esta basado en un modelo del proceso a controlar,

el cual es empleado para predecir la evolucion futura del estado o de las salidas.

El modelo del proceso es conocido como modelo de prediccion. En la seccion A.1

se puede encontrar una descripcion de los tipos de modelos mas habituales. El

intervalo de tiempo (expresado en instantes de muestreo) sobre el que se predice

la evolucion de las salidas es conocido como horizonte de prediccion. Por tanto, si

el horizonte de prediccion es N , empleando el modelo de prediccion se calculara la

siguiente secuencia de predicciones de las salidas:

y(t+ 1|t), y(t+ 2|t), · · · , y(t+N |t)

Para el calculo de esta secuencia se emplea la informacion de la evolucion del

proceso hasta el instante t, es decir:

• Valores pasados de las entradas o actuaciones del proceso.

• Valores presentes y pasados de las salidas del proceso.

Tambien se emplea una secuencia de actuaciones o senales de control futuras:

u(t|t), u(t+ 1|t), · · · , u(t+N − 1|t)

Usualmente se suele considerar un horizonte de control Nu < N , de manera que

para los instantes futuros mas alla del horizonte de control se supone que la senal

de control es constante. Estos conceptos se ilustran en la figura 1.1.

La secuencia de actuaciones futuras condiciona en gran medida la evolucion futura

del proceso. Para medir la bondad del control obtenido se puede formular un

CAPITULO 1. INTRODUCCION 3

criterio o ındice de comportamiento, de manera que se puede obtener, mediante

tecnicas de optimizacion, la secuencia de actuaciones optima. Esta sera la que,

de acuerdo con el criterio elegido, proporcione el mejor control. El calculo de

la senal de control mediante la minimizacion de un ındice de comportamiento o

funcion objetivo, es otra de las ideas comunes a las tecnicas de control predictivo.

La forma de la funcion objetivo varıa de un tipo de control a otro. Una de las

formas mas populares es la de un criterio cuadratico en el que se calcula la suma

de los errores predichos (diferencia entre las salidas predichas y la trayectoria de

referencia) al cuadrado a lo largo del horizonte de prediccion. Es habitual tambien

considerar algun tipo de ponderacion del esfuerzo de control, por lo que la forma

del criterio serıa:

J(u) =N∑

k=1

(y(t+ k|t) − w(t+ k))2 + λ

N∑

k=1

u(t+ k − 1|t)2 (1.1)

donde u es la secuencia de actuaciones futuras, w(t+k) es el valor de la trayectoria

de referencia y λ es un parametro que pondera la importancia que tiene en la

optimizacion el termino del esfuerzo de control. Para mas informacion sobre los

parametros tıpicos de la funcion objetivo se remite al lector a la seccion A.2.

En vista de lo anterior el objetivo de un controlador predictivo sera obtener en

cada instante de muestreo la secuencia de actuaciones u∗ que hace mınimo el

ındice de funcionamiento, es decir:

u∗ = arg mınu∈U

J(u) (1.2)

donde U es el conjunto de secuencias de actuaciones admisibles. Este conjunto

vendra definido por restricciones sobre las entradas y salidas de la planta (las

cuales a su vez determinan restricciones sobre las entradas). Como se vera mas

adelante, la posibilidad de limitar la busqueda de la secuencia de actuaciones

mediante restricciones es una de las caracterısticas mas apreciables y genuinas

del control predictivo. En caso de no considerarse restricciones U ≡ RN .

La tercera caracterıstica fundamental de las tecnicas de control predictivo es la

aplicacion de la senal de control mediante una estrategia de horizonte deslizante.

Esta estrategia, que aparece anteriormente a las primeras estrategias de MPC

(Propoi, 1963), consiste en aplicar solo la primera de las componentes de la se-

cuencia de actuaciones calculada en (1.2), es decir u∗(t|t), descartandose el resto.

En el instante t+1 se repite el proceso de calcular la secuencia optima, aplicandose

entonces la primera componente de la secuencia obtenida, es decir u∗(t+ 1|t+ 1)

y descartandose las demas. Notese que en general, debido a que el modelo no

describe perfectamente la dinamica del proceso, u∗(t+ 1|t) 6= u∗(t+ 1|t+ 1).

Esta forma de aplicar la ley de control supone la resolucion de un problema de

control optimo en bucle abierto, cuya solucion se aplica en bucle cerrado.

4 INTRODUCCION AL CONTROL PREDICTIVO

Pasadas

-

+

Modelo

Entradas y Salidas

Función de Coste

Entradas Futuras

Salidas Predichas

Trayectoria de Referencia

Optimizador Errores Futuros

Restricciones

Figura 1.2: Estructura general de los controladores predictivos

Estas ideas determinan la estructura general empleada para la implementacion de

controladores predictivos, la cual se ilustra en la figura 1.2. En esta estructura, dos ele-

mentos fundamentales son el modelo de prediccion y el optimizador. Las caracterısticas

del problema de optimizacion vienen determinadas principalmente por la funcion obje-

tivo. En general, para resolver el problema se requerira emplear algun tipo de metodo

numerico, aunque existen casos en los que se puede obtener una expresion analıtica

de la ley de control. Esto ocurre por ejemplo, cuando el modelo es lineal, la funcion

objetivo tiene la forma de un criterio cuadratico y no se consideran restricciones ex-

plıcitamente. En el caso de considerarse restricciones, tradicionalmente, la ley de control

se ha tenido por no lineal. Por tanto en este caso, se requiere emplear metodos numeri-

cos para obtener la secuencia optima de actuaciones. Sin embargo, recientemente se

ha demostrado (Bemporad et al., 2000a; Bemporad et al., 2002) que en este caso, la

ley de control es lineal a trozos, y es posible obtener una descripcion explıcita. La

forma de obtener tal descripcion pasa por emplear algoritmos constructivos (Tondel et

al., 2001). Un inconveniente de esto es que el numero de regiones en las que se ha de

dividir el espacio de estados es muy grande. Por tanto, puede ser mas eficiente resolver

el problema numericamente.


1.2. Ventajas e inconvenientes del Control Predic-

tivo

El control predictivo es quizas la tecnica de control avanzado que mayor aceptacion

ha tenido en el mundo industrial con miles de aplicaciones (Qin and Badgwell, 1996)

la mayorıa en la industria petroquımica y de procesos. Las razones de este exito, que

no han conseguido otros tipos de control avanzado, son las numerosas ventajas que

permiten lograr un incremento en la productividad de las instalaciones donde se aplica.

Estas ventajas incluyen:

Es aplicable a practicamente cualquier tipo de proceso independientemente de

que sea estable o inestable2, de fase mınima o no mınima o tenga retardos.

De manera natural se pueden obtener formulaciones multivariables, especialmente

si se emplean modelos de prediccion de espacio de estados.

Tambien presenta de manera natural compensacion de retardos, sin tener que

recurrir a compensadores de retardos como el predictor de Smith, salvo en el

caso de existir incertidumbre en el retardo (Normey-Rico and Camacho, 1999).

Las perturbaciones medibles son facilmente compensables mediante prealimentacion.

Es capaz de aprovechar el conocimiento que se tenga sobre la evolucion de la

referencia a lo largo del horizonte de prediccion, de manera que la accion de

control tenga en cuenta los cambios de referencia antes de que se produzcan. Esto

es muy util cuando se trata de controlar procesos batch o en robotica (Gomez-

Ortega and Camacho, 1994; Ramırez et al., 1998; Ramırez et al., 1999b; Gomez-

Ortega et al., 2001).

La mayor ventaja del control predictivo sobre otras estrategias de control, es

la capacidad para considerar restricciones en las entradas y salidas del proceso

a la hora de calcular la ley de control. Esta caracterıstica es genuina de las

tecnicas de control predictivo y es la mas apreciada desde el punto de vista

industrial, en el que a veces resulta crıtico mantener las salidas del proceso dentro

de unos margenes estrechos, evitando por otra parte incurrir en saturaciones de

los actuadores.

2Algunos tipos de control predictivo basados en modelos de respuesta impulsional finita estan

limitados a procesos estables. Este es el caso del Model Algorithmic Control (MAC) (conocido inicial-

mente como Model Predictive Heuristic Control (MPHC) (Richalet et al., 1978)). Esta limitacion la

comparten los algoritmos de control predictivo basados en modelos de respuesta ante escalon como el

popular DMC (Cutler and Ramaker, 1980).

6 CONTROL PREDICTIVO MIN-MAX

Por otra parte, estas tecnicas de control presentan tambien sus inconvenientes. El

principal de ellos es que salvo en los casos mas simples, el calculo de la senal de con-

trol implica resolver mediante metodos numericos un problema de optimizacion. Esto

conlleva una carga de calculo muy superior a la que requieren las tecnicas clasicas

de control. El problema es mas acusado cuando se tienen en cuenta restricciones. Por

ello, la aplicacion de controladores predictivos ha tenido lugar principalmente en pro-

cesos con dinamicas lentas. Sin embargo en la ultima decada, los avances en tecnologıa

de computadores y metodos numericos de optimizacion convexa, han logrado que los

problemas convexos que aparecen en casi todos los metodos de control predictivo, se

puedan resolver 106 veces mas rapido (Roos et al., 1997). En cualquier caso existen

formulaciones de MPC mas eficaces que las propuestas originalmente (Camacho, 1993)

y formulaciones simplificadas para tipos de modelos concretos (Bordons and Cama-

cho, 1998).

Otra limitacion del MPC es la necesidad de disponer un modelo suficientemente

realista del proceso que no siempre es facil de obtener. El comportamiento del con-

trolador depende en gran medida de ello, aunque existen metodos para mejorarlo en

presencia de incertidumbres como las estrategias Min-Max MPC que se veran en este

trabajo.

1.3. Control Predictivo Mın-Max

Una de las limitaciones del MPC es la necesidad de contar con un modelo de predic-

cion realista, pero a la vez simple, de manera que se satisfagan los requisitos de calculo

necesarios para obtener la senal de control en tiempo real. Ademas es importante que

sea facil de obtener. La opcion mas popular consiste en emplear modelos de prediccion

lineales. El empleo de tales modelos supone que en realidad se considera una dinamica

simplificada de la planta, que aunque probablemente aproxima muy bien a la dinamica

real en torno a un punto de operacion, no puede contemplar todos los aspectos de esta.

Esto provocara diferencias entre los valores predichos y los valores reales de la salida

del proceso. Estas discrepancias seran absorbidas por la realimentacion, pero llevara a

un peor control que el obtenido si no existiesen esas diferencias, e incluso a la perdida

de estabilidad en bucle cerrado.

Para solucionar los problemas ocasionados por las discrepancias entre el modelo de

prediccion y el proceso real, se ha de considerar explıcitamente de alguna manera la

incertidumbre en el calculo de la senal de control. Aquellos sistemas de control que

consideran explıcitamente las incertidumbres de modelado se denominan sistemas de


control robustos.

Existen diversas formas de disenar el controlador MPC teniendo en cuenta la incer-

tidumbre o discrepancias entre el modelo y la planta. Una de las primeras (Campo and

Morari, 1987) es la que considera el peor caso posible de la salida. De esta manera no se

minimiza un criterio que considera el valor nominal de la salida del proceso, sino que se

minimiza el maximo de los valores que puede tomar la funcion objetivo para todos los

valores considerados de la incertidumbre, es decir, la secuencia optima de actuaciones

se calcula como:

u∗ = arg mınu∈U

maxθ∈Θ

J(u, θ) (1.3)

donde θ representa la incertidumbre y Θ es el conjunto de valores considerados de

la incertidumbre, el cual suele ser un conjunto convexo. A las estrategias de control

predictivo que descansan sobre un problema mın-max como el anterior se las conoce

como control predictivo mın-max o Min-Max MPC (MMMPC). Al igual que en el caso

del MPC nominal, no existe una forma unica de MMMPC y dependiendo del tipo de

modelo, funcion objetivo y sobre todo de la manera de representar la incertidumbre se

tendran diversos tipos de MMMPC.

Una de las formas mas empleadas para representar la incertidumbre es la tecnica

de incertidumbres globales acotadas (Camacho and Bordons, 1995). Esta tecnica, apli-

cable a cualquier tipo de modelo, consiste en suponer que la incertidumbre se puede

concentrar en un vector global de parametros de manera que la salida del proceso se

expresarıa como:

y(t+ 1) = f(y(t), · · · , y(t− nna), u(t), · · · , u(t− nnb)) + θ(t) θ(t) ∈ Θ (1.4)

donde θ(t) es el vector de incertidumbre, f representa el modelo nominal y Θ es el con-

junto de todos los posibles valores de la incertidumbre, usualmente un conjunto convexo

de la forma Θ ,

θ : θ ≤ θ ≤ θ

. Se puede argumentar que esta forma de representar

la incertidumbre se asemeja mas a una perturbacion a la salida que a incertidumbre de

modelado propiamente dicha. Sin embargo, no se hace ninguna suposicion sobre la nat-

uraleza de θ(t) mas alla de considerarse que esta siempre contenida en Θ. Puede ser una

funcion de los valores previos de la entrada o la salida o de sus propios valores pasados.

Por tanto, puede servir para describir cualquier incertidumbre en los parametros del

modelo ademas de perturbaciones no medibles. Usualmente el modelo de prediccion es

lineal, extendiendose el concepto de error presente en los modelos CARIMA, de manera

que la dinamica del proceso se representa por:

A(z−1)y(t) = B(z−1)z−du(t− 1) + C(z−1)θ(t)

∆θ(t) ∈ Θ

siendo usualmente C(z−1) = 1.

8 CONTROL PREDICTIVO MIN-MAX

Las ventajas del MMMPC sobre el MPC ((nominal)) han de buscarse en un mejor

control, cuando la dinamica no es descrita suficientemente bien por el modelo de predic-

cion. Sin embargo, el entendimiento y desarrollo del MMMPC ha estado oscurecido y

obstaculizado por el altısimo coste computacional que conlleva la resolucion del pro-

blema mın-max. Esto ha ocasionado tambien, que el numero de aplicaciones hasta el

presente sea escaso (Camacho and Berenguel, 1997). Es en este marco en el que se

encuadran las estrategias de MMMPC que se presentaran en el capıtulo 2.

Capıtulo 2

Perspectiva general de los

controladores Min-Max MPC

2.1. Introduccion

En este capıtulo se pasa revista al estado del arte de los controladores predictivos

mın-max. Estas estrategias consideran en la optimizacion las incertidumbres en el mod-

elo de prediccion, mediante el calculo de la senal de control para el peor caso posible de

la salida. Este tipo de controladores surgen a partir del trabajo de Campo and Morari

(1987). Hay que hacer notar sin embargo, que la idea de control para el peor caso no

es exclusiva ni original del control predictivo, existiendo este tipo de formulaciones en

control optimo (Savkin and Petersen, 1995), H∞ (Milliken et al., 1999) o en el control

dual (Veres, 2000).

La literatura existente en este campo es bastante mas escasa que la que se tiene, por

ejemplo, para el control predictivo no lineal. Las razones de esto habrıa que buscarlas en

la enorme potencia de calculo requerida para resolver el problema mın-max en lınea. Por

otra parte, no quedan claros los beneficios que aporta el hecho de considerar el peor caso

de la salida. De hecho, tuvieron que transcurrir anos desde que se formulo el MMMPC

original hasta que se probara mediante un contraejemplo (Zheng and Morari, 1993) que,

la estabilidad en bucle cerrado no esta garantizada por el mero hecho de considerar el

peor caso de la salida. A medida que la potencia de calculo disponible ha ido creciendo,

se ha recuperado el interes en este tipo de controladores predictivos, desarrollandose

estrategias cada vez mas complejas en las que se emplean herramientas matematicas

muy en boga como las desigualdades lineales matriciales (LMI) (Boyd et al., 1994)

9

10 LOS PRIMEROS TRABAJOS (1987-1992)

o la programacion multiparametrica (Gal, 1979). De hecho, a partir del trabajo de

Kothare et al. (1996) se han publicado muchos mas artıculos sobre el tema que en

anos precedentes, de manera que en el momento en el que se redacta este texto existen

suficientes formulaciones del MMMPC como para que este justificado dedicar este

capıtulo a describirlas.

2.2. Los primeros trabajos (1987-1992)

En esta seccion se recogen los primeros trabajos en los que se presentaron estrategias

de control predictivo mın-max. En estos trabajos el tipo de funcion objetivo determina

la facilidad de resolucion del problema mın-max. Por otra parte, en las estrategias pre-

sentadas no se garantiza de manera expresa la estabilidad en bucle cerrado del sistema,

hecho que debe ser imputado a la falta de resultados sobre el tema en el momento de

presentarse estos trabajos. Tal y como menciona Zheng (1995), en esa primera epoca los

resultados disponibles sobre estabilidad en control predictivo se referıan a la estabilidad

nominal, no a la estabilidad robusta del control predictivo.

2.2.1. El trabajo original de Campo y Morari (1987)

En 1987 fue presentada la primera estrategia de control predictivo basada en la

resolucion de un problema mın-max (Campo and Morari, 1987). En este trabajo se

empleaba una descripcion del proceso basada en la respuesta impulsional , la cual se

supone una funcion lineal de ciertos parametros θj, es decir:

Hi(θ) =

q∑

j=1

Gjθj i = 1, · · · , N (2.1)

donde θj ≤ θj ≤ θj. La planta se describe por una combinacion de q plantas ponderadas

por unos pesos desconocidos θj. La salida del proceso en el instante k+ p se representa

por:

y(k + p) =N∑

i=1

Hi(θ)u(k + p− i)

y se supone ademas que Hi(θ) = 0 para i > N , es decir, el proceso debe ser estable.

Tal y como se apunta en (Camacho and Bordons, 1999) la salida tambien se puede

calcular como:

y(k + p) =N∑

i=1

(Hmi + θi)u(k + p− i) (2.2)

CAPITULO 2. PERSPECTIVA GENERAL DE LOS CONTROLADORES MIN-MAX MPC 11

de manera que la salida nominal serıa:

ym(k + p) =N∑

i=1

Hmiu(k + p− i)

y la salida del proceso teniendo en cuenta la incertidumbre estarıa confinada a unas

bandas en torno a la salida nominal que vendrıan dadas por:

mınθ

N∑

i=1

θiu(k + p− i) y maxθ

N∑

i=1

θiu(k + p− i)

En el trabajo original de Campo and Morari (1987) la funcion objetivo empleada

esta basada en la norma ∞ − ∞. La principal ventaja de usar esta norma es que el

problema mın-max se puede reescribir como un problema de programacion lineal, que

puede resolverse de manera muy eficiente. La funcion objetivo, suponiendo un sistema

SISO y que la referencia permanece constante a lo largo del horizonte de prediccion,

vendra descrita por:

J(u, θ) = ‖y(t+ j|t) − r(t)‖∞ = maxj=1,···,N

|y(t+ j|t) − r(t)|

La senal de control se obtendra resolviendo el siguiente problema mın-max:

mınu∈U

maxθ∈Θ

maxj=1,···,N

|y(t+ j|t) − r(t)|

Este problema puede reescribirse como:

mınu∈U,µ

µ (2.3)

s.a.

(y(t+ j|t) − r(t)) ≤ µ ∀θ ∈ Θ ∀j = 1, · · · , N

−(y(t+ j|t) − r(t)) ≤ µ ∀θ ∈ Θ ∀j = 1, · · · , N

Si las predicciones y(t+ j|t) son una funcion afın de la incertidumbre y Θ y U son

conjuntos convexos, el maximo y el mınimo de y(t+ j|t) se obtendran para los vertices

del politopo Θ y U respectivamente. Por tanto, el conjunto de infinitas restricciones

que aparecen para todo valor de θ se sustituye por un conjunto de restricciones para

cada uno de los 2q (si se utiliza la descripcion dada en (2.1)) o 2N (si se utiliza la

descripcion dada en (2.2)) vertices.

El problema (2.3) es un programa lineal el cual se puede escribir como:

mınx

cTx (2.4)

s.a.

Ax ≤ b

x ≥ 0


Aunque este problema puede resolverse de manera mucho mas eficiente que el pro-

blema mın-max original, tiene el inconveniente de tener muchas restricciones, pues

existe un grupo de restricciones por cada vertice de Θ. Ademas, si se tienen en cuenta

restricciones sobre la salida del proceso, tambien habra que considerar un grupo de

estas restricciones por cada vertice de Θ. Por otra parte, tal y como apunta Campo

and Morari (1987), la solucion de un programa lineal, cuyo numero de restricciones es

mucho mas grande que el de variables de decision, puede ser determinada mas eficien-

temente resolviendo el problema dual.

Una caracterıstica a tener en cuenta de esta formulacion es que se puede generalizar

a cualquier otra descripcion de la incertidumbre con la condicion de que las predicciones

de la salida sean una funcion afın de esa incertidumbre. Por ejemplo, en el caso de

emplear incertidumbres globales aditivas, en las que las predicciones toman la forma

y = Guu+Gθθ + f , el problema (2.3) se podrıa escribir como:

mınu∈U,µ

µ (2.5)

s.a.

Guu ≤ 1µ−Gθθ − f + w ∀θ ∈ Θ

−Guu ≤ 1µ+Gθθ + f − w ∀θ ∈ Θ

Guu ≤ 1y −Gθθ − f ∀θ ∈ Θ

−Guu ≤ 1y +Gθθ + f ∀θ ∈ Θ

En este caso el alto numero de restricciones puede reducirse pues, aunque para cada

componente del vector de salidas futuras existiran 2N restricciones, solo una de ellas

debera ser considerada, siendo el resto redundantes. Por tanto, solo sera necesario

considerar un bloque de restricciones sobre la salida del proceso, de tal manera que el

numero de restricciones totales dependera linealmente de los horizontes de prediccion

y control1.

Finalmente hay que destacar que esta formulacion no garantiza la estabilidad del

sistema en bucle cerrado tal y como se demuestra mediante un contraejemplo en (Zheng

and Morari, 1993).

2.2.2. Mejoras y formulacion con norma 1

El trabajo original de Campo and Morari (1987) fue desarrollado por Allwright

y Papavasiliou, en una serie de trabajos en los que se mejora la formulacion basada

1En la formulacion original de Campo y Morari, en la cual se emplean modelos FIR, el numero de

restricciones depende exponencialmente del numero de coeficientes del modelo, no de los horizontes.


en la norma ∞ (Allwright and Papavasilou, 1991) y se extiende la estrategia original

a funciones de coste basadas en la norma 1 (Allwright and Papavasilou, 1992; All-

wright, 1994). Tambien se presenta un algoritmo eficiente (no de programacion lineal)

para resolver el problema mın-max con una funcion de coste basada en la norma 1

(Papavasilou and Allwright, 1991).

Uno de los inconvenientes del MMMPC de Campo y Morari es la gran cantidad de

restricciones que aparecen en el problema LP (en principio una por cada vertice del

politopo sobre el cual varıan los coeficientes de la respuesta impulsional). En (Allwright

and Papavasilou, 1991) se presenta un metodo para reescribir el problema LP, de man-

era que se evita tener que manejar un numero de restricciones que depende de manera

exponencial del numero de coeficientes del modelo. En lugar de eso, el numero de re-

stricciones que aparecen depende linealmente del numero de coeficientes del modelo,

sin tener que eliminar restricciones redundantes.

En (Papavasilou and Allwright, 1991) se describe un algoritmo del tipo de direc-

ciones factibles para resolver el problema mın-max que aparece cuando se considera la

siguiente funcion de coste basada en la norma 1:

J(u, θ) = ‖y(t+ j|t) − r(t)‖1

La norma 1 para un vector c ∈ Rk se puede calcular como:

‖c‖1 = maxv∈Vk

vT c Vk =

v ∈ Rk : −1 ≤ vj ≤ 1, j = 1, · · · , k

donde, por convexidad, el maximo se alcanzara en uno de los vertices de Vk. La senal

de control se calculara mediante el algoritmo que se describe a continuacion. La senal

de control se obtendra minimizando una funcion que tiene la forma:

J∗(u) = maxw=1,···,n

aTwu− bw

Para minimizar esta clase de funcion, Papavasilou and Allwright (1991) proponen em-

plear el siguiente algoritmo:

1. Determinar el conjunto de hiperplanos en los que se alcanza el maximo para

u = uk, es decir:

I(uk) =

i|J∗(uk) = aTi uk − bi

2. Determinar la direccion de descenso sk resolviendo:

mıns

t (2.6)

s.a.

aTi s ≤ t ∀i ∈ I(uk)

‖s‖∞ ≤ 1 (2.7)


Sea sk, la solucion del problema (2.6) y tk el valor mınimo alcanzado de t. Parar

el proceso de optimizacion si tk ≥ −ε para un ε > 0 y pequeno.

3. Calcular:

λk = max

λ|I(uk) ⊆ I(uk + λsk)

4. Mejorar la solucion candidata tomando:

uk+1 = uk + λksk

incrementar k e ir al paso 1.

El trabajo presentado en (Papavasilou and Allwright, 1991) tiene como interes ser

el primero que aborda la formulacion MMMPC basada en la norma 1. Sin embargo

la solucion propuesta no es satisfactoria, pudiendose plantear esta estrategia de una

manera mas eficiente.

Ademas de las mejoras presentadas, la formulacion del MMMPC basado en la

norma 1 fue desarrollada completamente en (Allwright and Papavasilou, 1992; All-

wright, 1994). La funcion de coste empleada en el MMMPC de Campo y Morari no

contemplaba la ponderacion del esfuerzo de control. Ademas, el uso de la norma ∞

para ponderar el error de seguimiento puede no dar buenos resultados, pues en realidad

solo se esta penalizando la maxima desviacion de la salida con respecto a la referencia,

mientras que el resto del comportamiento es ignorado. A fin de solventar estos prob-

lemas Allwright y Papavasiliou proponen la siguiente funcion de coste basada en la

norma 1:

J(u, θ) =

N2∑

j=N1

|y(t+ j|t, θ) − r(t+ j)| + λ

Nu∑

j=1

|∆u(t+ j − 1)|

El problema mın-max resultante se puede formular como:

mınγ,µ,β,u

γ (2.8)

s.a.

−µj ≤ (y(t+ j|t, θ) − r(t+ j)) ≤ µj ∀θ ∈ Θ

−βj ≤ ∆u(t+ j − 1) ≤ βj

0 ≤

N2∑

j=N1

µj + λ

Nu∑

j=1

βj ≤ γ (2.9)

donde γ es una cota superior de:

µ∗(u) = maxθ∈Θ

N2∑

j=N1

|y(t+ j|t, θ) − r(t+ j)| + λ

Nu∑

j=1

|∆u(t+ j − 1)|


es decir de la funcion de coste. El MMMPC de Allwright y Papavasiliou esta basado en

modelos FIR, sin embargo este esquema es facilmente extensible a modelos basados en

la funcion de transferencia (Camacho and Bordons, 1999). Ası, cuando se consideran

incertidumbres globales aditivas, el problema (2.8) se reescribirıa como:

mınγ,µ,β,u

γ (2.10)

s.a.

µ−Guu ≥ Gθθ + f + r ∀θ ∈ Θ

µ+Guu ≥ −Gθθ − f + r ∀θ ∈ Θ

β − u ≥ 0

β + u ≥ 0

γ ≥ 1Tµ+ λ1β

el cual a su vez se puede expresar en la forma (2.4). Dado que este problema LP tiene

usualmente mas restricciones que variables de decision se puede considerar la resolucion

del problema LP dual. Como en el caso del MMMPC con norma ∞, aplicando un

algoritmo de eliminacion de restricciones redundantes, se puede reducir el numero de

restricciones hasta depender linealmente de los horizontes de control y prediccion.

2.2.3. Un algoritmo basado en la norma 2

Las estrategias de control MMMPC anteriores estan basadas en la norma ∞ o 1,

de manera que los problemas mın-max se pueden reescribir como programas lineales,

que se pueden resolver eficientemente empleando algoritmos tipo Simplex. En control

predictivo, una de las elecciones mas populares para la funcion de coste es la funcion de

coste cuadratica con ponderacion del esfuerzo de control. En el caso del control MMM-

PC cuadratico, no existen algoritmos eficientes para resolver el problema mın-max, por

lo que inicialmente no se escogio este criterio. Sin embargo, si las predicciones de la

salida son una funcion afın de la incertidumbre y esta varıa sobre un politopo convexo,

el problema mın-max se puede reescribir como un problema de optimizacion convexa.

Este tipo de problemas mın-max pueden tener unos requerimientos computacionales

muy grandes, pero en general son problemas matematicamente tratables2. Uno de los

primeros trabajos en los que se explota este hecho se presenta en (Lau et al., 1991).

2El termino ((problema matematicamente tratable)) debe entenderse aquı como un problema que

puede resolverse en un tiempo razonablemente corto, al menos para valores pequenos del parametro

que define el tamano del problema. Eso no impide que la complejidad de ese problema sea muy grande.

Por ejemplo, el problema mın-max de la formulacion presentada en esta seccion no puede resolverse en

tiempo polinomial y sin embargo su complejidad es mucho menor que la que se tendrıa si ese problema

no fuera convexo.


En este caso se considera un modelo FIR:

y(k) = θTφ(k)

donde θ = [b1, b2, · · · , bm]T y φ(k) = [u(k − 1), u(k − 2), · · · , u(k −m)]T . El vector de

parametros θ se supone que esta contenido en el elipsoide definido por:

θ ∈ Θ ,

θ : (θ − θc)T Γ(θ − θc) ≤ 1

donde Γ = ΓT > 0. El problema mın-max se formula como:

u∗ = arg mınu

[J1(u) + J2(u)]

donde:

J1(u) = ρuTu

J2(u) = maxθ∈Θ

yTy

e y se puede expresar como:

y = Uθ

donde:

U =

u(−1) u(−2) · · · u(−m)

u(0) u(−1) · · · u(−m+ 1)

u(1)...

......

......

......

u(N − 1) u(N − 2) · · · u(N −m)

Las predicciones son una funcion afın de los parametros inciertos (θ), y dado que Θ es

un elipsoide convexo, el maximo de la funcion de coste con respecto a θ se alcanzara en

la frontera de Θ. Encontrar el maximo supone factorizar matrices, calcular autovalores

y encontrar el maximo dentro de una lista de esos autovalores. Esto conlleva una

cantidad de calculo no despreciable, pero es un problema convexo y por tanto tratable.

Por otra parte tambien se puede probar que la funcion de coste es una funcion convexa

con respecto a u, por lo que el mınimo sera unico y no se daran problemas de mınimos

locales.

Lau et al. (1991) propone para resolver el problema mın-max usar el algoritmo del

elipsoide (Bland et al., 1981), utilizando el subgradiente de J dado que aunque J es

continua y convexa, no es continuamente diferenciable en u. Finalmente, los autores

formulan el problema dual, en el cual, dado un vector de parametros conocidos se

calcula el control que minimiza el peor de los estados iniciales posibles dentro de un

elipsoide dado.


El metodo descrito en esta seccion difiere en algunos puntos de los MMMPC con

criterio cuadratico que se formularıan en anos sucesivos. Estas diferencias son por

ejemplo el tipo de modelo empleado y la forma del conjunto que contiene a todos los

posibles valores de la incertidumbre. En trabajos posteriores los modelos mas frecuentes

son los de funcion de transferencia y los modelos en espacio de estados , reemplazando

a los FIR, los cuales son incapaces de representar sistemas inestables. Ademas, se

suele considerar que la incertidumbre esta contenida en un politopo, en lugar de en un

elipsoide. De esta manera, basta con considerar los vertices del politopo en lugar de la

frontera.

2.2.4. Controlador predictivo adaptativo con diseno para el

peor caso de Veres y Norton (1991)

La estrategia que se describira a continuacion fue presentada en (Veres and Norton,

1991) y posteriormente extendida en (Veres and Norton, 1993). Corresponde a un

esquema de control, que a diferencia de los anteriores considera la adaptacion del

modelo de prediccion. La idea que separa a este controlador de los anteriores es que

considera una descripcion entrada-salida del proceso, donde los parametros del modelo

pueden tomar valores dentro de unas cotas establecidas, las cuales estan relacionadas

con las cotas del error de estimacion del modelo respecto del proceso real. Las cotas

sobre los parametros del modelo se obtienen y refinan de las medidas tomadas en

tiempo real de la salida del proceso, segun las tecnicas descritas en (Norton, 1987a;

Norton, 1987b; Mo and Norton, 1990).

En este trabajo se considera un modelo del proceso tipo ARMAX, por lo que el

proceso se puede describir como:

yt+k = −

p∑

i=1

aiyt−i+k +

q∑

i=1

biut−i+k + et+k et+k ∈ E

con E ≡ [−δ, δ]. Por otra parte, las predicciones a lo largo del horizonte de prediccion

para k = 1, · · · , n pueden expresarse como funcion de los valores de las salidas actuales

y pasadas y de las entradas pasadas:

yt+k =

p∑

i=1

αi(k)yt−i+1 +

q∑

i=1

βi(k)ut−i+1 +k−1∑

i=1

β1(i)ut+k−i +k−1∑

i=1

α1(i)et+k−i + et+k

con k = 1, · · · , n, et+i ∈ E y i = 1, · · · , k.

El controlador debera minimizar la funcion de coste para el peor caso teniendose en

cuenta en la optimizacion un conjunto de parametros factibles Dt, que se actualizaran


en base a las medidas observadas del proceso. Los parametros tendran la forma:

θ =[

a1 a2 · · · ap b1 · · · bq]T

La funcion de coste usada en el instante t+ k calculada en el instante t es:

Ck(t) = supθ∈Dt, et+i∈E, i=1,···,k

max (|rt+k − yt+k|, |λut+k−1|)

donde rt+k es la referencia a seguir en t+k y λ es un factor de ponderacion del esfuerzo

de control. La secuencia optima de actuaciones se calculara como:

ut(t), · · · , ut+N−1(t) = arg infut,···,ut+N−1

maxk=1,···,n

Ck(t) (2.11)

Es de destacar que el problema anterior emplea una funcion de coste que es notable-

mente mas compleja que las empleadas en los trabajos anteriores. De hecho, tal y como

senalan los autores, en las ecuaciones de prediccion, yt+k es lineal en et+i pero multino-

mial con grado N en los parametros del modelo. Por otra parte los conjuntos E y Dt

son convexos. Por lo tanto, el calculo de Ck(t) supone la optimizacion de una funcion

multinomial en un conjunto convexo. Dado que esto es un problema bastante complejo

los autores proponen una alternativa.

La alternativa propuesta pasa por calcular las cotas de los parametros del predictor,

no del modelo. Esto tiene ventajas computacionales. Ademas las ecuaciones de predic-

cion se calculan sobre un intervalo mayor que el considerado en el modelo. La ley de

control basada en los parametros de las ecuaciones de prediccion se calcularıa como:

ut(t), · · · , ut+N−1(t) = arg infut,···,ut+N−1

maxk=1,···,n

Cpk(t)

donde:

Cpk(t) = sup

θp

k∈Pk(t), et+i∈E, i=1,···,k

max (|rt+k − yt+k|, |λut+k−1|)

y las predicciones se expresan como:

yt+k = ϕTtkθ

pk

siendo el vector de parametros:

θpk = [α1(k) · · ·αp(k) β1(1) · · · β1(k − 1) · · · β1(k) · · · βq(k) α1(1) · · ·α1(k − 1)]T

que pertenecera a un conjunto de parametros factibles Pk y siendo el regresor:

ϕtk = [yt · · · yt−p+1 ut+k−1 · · · ut−q+1 et+k−2 · · · et]


Los autores demuestran que en esta formulacion, CPk (t) es lineal a trozos con respec-

to al dominio U de actuaciones posibles, y que su maximo es el maximo de un numero

finito de formas lineales, es decir:

C = maxk=1,···,n

Cpk(t) = max

i∈I

Li(ut)

Por otra parte, si se consideran cotas sobre la accion de control, la minimizacion con

respecto a ut se reduce a comprobar cual de los vertices del politopo que viene definido

por C(ut) y las cotas sobre ut presenta menor valor C. Por tanto, esta formulacion es

mucho mas eficiente desde el punto de vista computacional en comparacion con la que

se describe en el problema (2.11).

La estrategia anterior se complementa con el mecanismo de acotacion de paramet-

ros, de manera que para cada instante de muestreo, se determina la cota del error de

prediccion δ y un escalar denotado por ρ que caracteriza la variacion mayor de los

parametros θ. Estos parametros caracterizan el conjunto de parametros factibles del

predictor, es decir Pk(t, δt, ρt). Esto se puede utilizar para obtener la ley de control:

ut(δt, ρt) = arg infut∈Ut

Lt(ut, δt, ρt)

donde:

Lt(ut, δt, ρt) = infut+1,···,ut+N−1

maxk=1,···,n

supθ

p

k∈Pk(t,δt,ρt) et+i∈E,i=0,···,k−2

|rt+k − ϕTtkθ

pk|

El conjunto de actuaciones factibles Ut, se construye de manera que la salida

este acotada. Para cada valor δt, en el rango [δtmin, δtmax] existira un valor ρmin(δt)

que de la menor variacion de los parametros. El esquema definitivo serıa:

ut = arg infut∈Ut

Lt(ut, δ∗t , ρ

∗tmin)

donde:

δ∗t = arg infδt∈[δtmin,δtmax]

infut∈Ut

Lt(ut, δt, ρmin(ρt))

con ρ∗tmin = ρmin(δ∗t ).

2.3. Controladores Min-Max MPC adaptativos basa-

dos en incertidumbres globales acotadas

En esta seccion se revisaran los trabajos presentados en (Gutierrez and Cama-

cho, 1995; Camacho and Berenguel, 1997), en los cuales se propone y se aplica un

20 CONTROLADORES ADAPTATIVOS BASADOS EN INCERTIDUMBRES GLOBALES

controlador mın-max que esta basado en la tecnica de incertidumbres globales acota-

das y funcion de coste cuadratica (Camacho and Bordons, 1995). Esa formulacion se

complementa con un esquema de identificacion en lınea, de manera que se adapta el

modelo a las condiciones de la planta a la vez que se mantiene un hipercubo en el cual

estan contenidos los parametros ((reales)).

En estos trabajos se considera un modelo del proceso ARMAX que viene dado por:

y(t) =na∑

i=1

aiy(t− i) +

nb∑

i=0

biu(t− d− i) + e(t)

donde e(t) es el error de modelado, el cual se supone desconocido pero acotado, es

decir, emin ≤ e(t) ≤ emax. La ecuacion anterior se puede reescribir como:

y(t) = ϕT (t)θ + e(t) (2.12)

donde ϕ(t) es el regresor y θ es el vector de parametros estimados:

ϕ(t) =

y(t− 1)...

y(t− na)

u(t− d)...

u(t− d− nb)

θ =

a1

...

ana

b0...

bnb

Teniendo en cuenta las cotas del error y la ecuacion (2.12) se puede considerar que:

y(t) − emax ≤ ϕT (t)θ ≤ y(t) − emin

Esta ecuacion define dos hiperplanos entre los cuales estara incluido en cada instante

el vector de parametros θ. A lo largo de k instantes de muestreo se ira construyendo

un conjunto el cual estara delimitado por k pares de hiperplanos:

S(k) =

θ : y(t) − emax ≤ ϕT (t)θ ≤ y(t) − emin t = 1, · · · , k

A medida que k es mayor, S(k) se vuelve muy complejo para ser empleado y se aproxima

por un hipercubo P (k):

P (k) =

θ : θjmin(k) ≤ θj ≤ θj

max(k) j = 1, · · · , na + nb + 1

el cual se construye con el metodo descrito en (Mo and Norton, 1990).

Una vez se cuenta con el hipercubo P (k), la senal de control se calculara resolviendo:

mınu

maxθ,e

J(θ, e, u) (2.13)


sujeto a:

emin ≤ ek+j ≤ emax j = d, · · · , d+N − 1

θ ∈ Pk

Umin ≤ uk+j ≤ Umax j = 0, · · · , N − 1

Los parametros inciertos, es decir θ y e se pueden agrupar en un vector θ∗ = [θ e].

Igualmente se puede considerar un hipercubo generalizado donde se incorporen los

parametros inciertos de θ∗:

Tk = θ, e : θ ∈ Pk, e ∈ ξ

donde ξ es el hipercubo que contiene a e. El problema (2.13) se puede reescribir como:

mınu∈U

J∗(u) con J∗(u) = maxθ∗∈Tk

J(θ∗, u)

La funcion de coste toma la forma:

J(θ∗, u) =

N2∑

j=N1

(

yk+j|k − wk+j

)2+ λ

N3∑

j=1

(∆uk+j−1)2

teniendo en cuenta que en las predicciones de salida se ha de considerar la secuencia de

futuros errores de modelado ek+d, · · · , ek+d+N−1, la cual se evalua en los vertices del

hipercubo ξ. El vector de predicciones se puede escribir en forma condensada como:

y = Guu+ f

donde la matriz Gu y f dependen de θ. De esta manera la funcion de coste queda:

J(θ∗, u) = (Guu+ f − w)T (Guu+ f − w) + Ju (2.14)

donde Ju = λ(Mu −m)T (Mu −m) con M una matriz cuya diagonal principal tiene

todos los valores a 1, la diagonal inferior a -1 y el resto de los elementos a cero siendo

m =[

uk−1 0 · · · 0]T

. La ecuacion (2.14) se puede reescribir como:

J(θ∗, u) =1

2uTHuu+ qT

u u+ pu

con:

Hu = 2(

GTuGu + λMTM

)

qu = 2[

GTu (f − w) + λMTm

]

y pu = (f − w)T (f − w) + λmTm.

Esta formulacion comparte muchas de las caracterısticas de la estrategia MMM-

PC con incertidumbres globales acotadas (Camacho and Bordons, 1995). Una de las

22 CONTROLADORES PREDICTIVOS ROBUSTOS BASADOS EN LMIS

caracterısticas mas destacables de esa formulacion, es que el maximo de la funcion de

coste se alcanza en uno de los vertices del politopo que encierra a todos las posibles

realizaciones de la incertidumbre. Esto es porque las predicciones son una funcion afın

de los valores de la incertidumbre, luego la funcion de coste es convexa con respecto

a la incertidumbre y el maximo de una funcion convexa sobre un politopo convexo se

alcanza en uno de los vertices del politopo. En el caso de las predicciones empleadas

en la formulacion presentada en esta seccion, las predicciones son funcion afın del error

de modelado e y de las incertidumbres sobre los coeficientes b0, b1, · · · , bnb, pero no son

funciones afines de a1, a2, · · · , anapor lo que el problema de optimizacion es mucho mas

complejo dado que se han de considerar todos los posibles valores de esos parametros

para hallar el maximo.

En (Camacho and Berenguel, 1997) la estrategia presentada en esta seccion se

aplico sobre la planta solar de Tabernas (Almerıa) con resultados satisfactorios. El

modelo de prediccion toma la forma:

G(z−1) = z−1 b0z−1 + b1z

−2

1 − az−1

En este caso, dado que solo hay un parametro a, la parte ((max)) para este parametro

se soluciona tomando una ((malla)) de valores sobre los que se evalua J(θ∗, u) para

encontrar el maximo. Para modelos simples esta tecnica es valida, no ası para modelos

de orden superior, en los que el numero de puntos a evaluar se dispararıa.

2.4. Controladores predictivos robustos basados en

LMIs

Las desigualdades matriciales lineales (LMI) constituyen una herramienta matematica

muy potente que permite representar y resolver muchos problemas que aparecen en la

teorıa de control (Boyd et al., 1994). De este modo, incluso desigualdades que no son

afines en las variables consideradas, por ejemplo desigualdades cuadraticas, se pueden

representar como LMIs. Mas aun, existen algoritmos numericos muy eficientes (como

los metodos de punto interior), que permiten resolver los problemas LMI que aparecen

cuando se expresan mediante esta tecnica, problemas de control como la estabilidad ro-

busta, colocacion de polos robusta, LQG y tambien el MPC robusto. En este contexto

Kothare et al. (1996) propuso un controlador predictivo robusto con restricciones, que

si bien no se puede considerar un Min-Max MPC en sentido estricto, tiene su origen en

el diseno para el peor caso. Por tanto, se considera que este tipo de controlador forma

parte del conjunto de estrategias que se describen en este capıtulo.


En el trabajo de Kothare et al. (1996) se considera que los sistemas sujetos a in-

certidumbre se describen mediante una aproximacion politopica o multimodelo lineal

y variable en el tiempo, es decir:

x(k + 1) = A(k)x(k) +B(k)x(k)

y(k + 1) = Cx(k)

perteneciendo las matrices del sistema a un politopo:

[A(k) B(k)] ∈ Ω

donde Ω es conjunto convexo, el cual viene definido por sus vertices:

Ω = Co [A1, B1], [A2, B2], · · · , [AL, BL]

por lo que se supone que la dinamica exacta de la planta estara descrita en todo

momento por una combinacion convexa de los vertices:

[A,B] =L∑

i=1

λi[Ai, Bi]

con λi ≥ 0 y∑L

i=1 λi = 1.

La funcion de coste usada en este caso emplea la norma 2 con horizonte de predic-

cion infinito, el cual conduce a leyes de control con estabilidad nominal garantizada

(Rawlings and Muske, 1993):

J(k) =∞∑

i=0

(

x(k + i|k)TQ1x(k + i|k) + u(k + i)TRu(k + i))

El problema de optimizacion a resolver para obtener la senal de control es en este caso:

mınu(k+i|k),i≥0

max[A(k+i),B(k+i)]∈Ω,i≥0

J(k) (2.15)

Este problema mantiene la complejidad computacional presente en las formulaciones

anteriores, de manera que se desestima su resolucion, adoptandose la estrategia descrita

a continuacion. Por simplicidad solo se describira el caso mas sencillo en el que no se

consideran restricciones. En primer lugar se define una funcion de Lyapunov cuadratica

V (x) = xTPx con P > 0 construida de manera que sea una cota superior de J(k):

max[A(k+i),B(k+i)]∈Ω,i≥0

J(k) ≤ V (x(k|k))

En segundo lugar, en vez de calcularse la senal de control directamente, se calcula la

matriz F que se usa en una ley de control por realimentacion del vector de estados, es

decir:

u(k + i|k) = Fx(k + i|k) (2.16)


donde F se calcula minimizando V (x(k|k)), resolviendo el siguiente problema de opti-

mizacion:

mınγ,Q,Y

γ (2.17)

sujeto a las siguientes LMIs:

[

1 x(k|k)T

x(k|k) Q

]

≥ 0

Q QATj + Y TBT

j QQ121 Y TR

12

AjQ+BjY Q 0 0

Q121Q 0 γI 0

R12Y 0 0 γI

≥ 0 ∀j = 1, · · · , L

Con la solucion del problema anterior la ganancia de la ley de control (2.16) se puede

determinar como:

F = Y Q−1

Estos resultados se pueden generalizar a fin de considerar restricciones en la salida

del proceso y la actuacion, cuadraticas ‖u(k + i|k)‖2 ≤ umax, y en valor absoluto

|u(k+ i|k)| ≤ umax, las cuales pueden ser expresadas como LMIs (Kothare et al., 1996).

Por otra parte, tambien se considera un invariante robusto en el cual se mantiene el

estado del sistema para todos los valores de las matrices del sistema. Esta formulacion

puede ser extendida de manera que se considere seguimiento de referencia, rechazo de

perturbaciones y sistemas con retrasos, siendo necesario en este caso modificar la forma

de la funcion V (x).

Esta estrategia de control es una de las primeras en considerar predicciones en bucle

cerrado en la optimizacion, una idea que luego serıa recogida en otras estrategias de

Min-Max MPC (Scokaert and Mayne, 1998; Bemporad et al., 2001) o MPC en general

(Bemporad, 1998; Batina et al., 2001)3. La idea, segun la interpretacion del propio

autor, es que aunque tradicionalmente la realimentacion se interpreta como un medio

para tener en cuenta la incertidumbre y las perturbaciones, en este contexto se debe

interpretar como un medio de reducir potencialmente el conservadurismo de la accion

de control para el peor caso.

En este tipo de control, la estabilidad viene estrechamente relacionada con la

factibilidad de las LMIs, de manera que se cumple que si el problema es factible para el

primer instante de muestreo, lo sera para todos los demas. Relacionado con este punto

esta el hecho de que las matrices de ponderacion podran afectar al rendimiento del

3En este parrafo se ha recogido una consideracion presente en la literatura (Mayne et al., 2000). Sin

embargo, a juicio del autor, en esta estrategia la idea de bucle cerrado no se identifica tan claramente

como en (Lee and Yu, 1997; Scokaert and Mayne, 1998) o (Bemporad et al., 2001).


controlador, pero no a la estabilidad. Por tanto, la sintonıa del controlador, al menos

en lo que respecta a estas matrices, es mas sencilla y menos crıtica.

Otra caracterıstica apreciable es que esta formulacion se puede extender a sistemas

no lineales, aunque debe cumplirse que el Jacobiano del modelo pertenezca en todo

momento al politopo Ω.

Las limitaciones de esta estrategia incluyen la imposibilidad de describir incertidum-

bres en los polos, siendo esto consecuencia de la dificultad de aplicar las tecnicas de

optimizacion antes mencionadas con descripciones entrada-salida. Otros inconvenientes

apuntados en (Camacho and Bordons, 1999) son:

Los algoritmos LMI no son tan eficientes desde el punto de vista numerico como

los algoritmos especializados de programacion lineal o cuadratica.

Las variables manipuladas se computan como una realimentacion lineal del vector

de estados que satisfacen las restricciones, pero se obvia que el optimo no tiene

porque coincidir con ninguna realimentacion lineal cuando se usan restricciones.

Las restricciones pierden parte de su significado fısico al expresarse con LMIs.

En cualquier caso el impacto de este trabajo ha sido considerable, estando entre

los mas citados dentro de la literatura de control predictivo robusto. Ha sido tomado

como partida para otros trabajos, entre los que se pueden citar (Wu, 1997; Cuzzola et

al., 2001; Ozkan et al., 2000; Casavola et al., 2000)

En (Wu, 1997), la estrategia descrita aquı, se extiende para considerar una clase

general de sistemas lineales con incertidumbres descritas por transformaciones lineales

fraccionales (LFT) variantes en el tiempo. La estrategia presentada se compara con un

MPC nominal sobre un modelo correspondiente a un reactor agitado (CSTR).

Por otra parte, Cuzzola et al. (2001) mejoran la estrategia original eliminando el

requisito de que el sistema con incertidumbres sea cuadraticamente estabilizable. Para

ello se considera que la incertidumbre es politopica y en lugar de considerar una sola

funcion de Lyapunov, se utiliza una funcion de Lyapunov para cada vertice:

V (i, k) = x(k + i|k)TP (i, k)x(k + i|k) ∀i ≥ 0

donde P (i, k) > 0. Los autores aducen que con esta representacion se consigue describir

un mayor numero de sistemas. Por otra parte, se tienen en cuenta restricciones tanto

en la entrada como en la salida.


Kothare es coautor de (Ozkan et al., 2000) en el cual se toma la estrategia robusta

original y se adapta para el uso con sistemas lineales a trozos. La particion del espacio

de estados en las que el sistema es lineal se hace usando regiones elipsoidales en lugar de

politopicas, pues como los autores demuestran, en ese caso las desigualdades matriciales

que aparecen son no lineales. Tal y como se hace en (Cuzzola et al., 2001) se emplean

multiples funciones de Lyapunov, esta vez una para cada region del espacio de estados

de la forma Vi = xTPix. Ademas, para cada region tambien se obtiene una ley de control

por realimentacion del vector de estados distinta, es decir u(k + l|k) = Kix(k + l|k).

La estrategia presentada por Casavola et al. (2000) extiende la formulacion de

Kothare et al. (1996) incluyendo N terminos libres en el coste cuadratico ademas de la

matriz de ganancias de realimentacion del vector de estados. Tambien es una extension

del trabajo presentado en (Casavola et al., 1999), en el cual se propone la minimizacion

de un coste cuadratico con horizonte finito, forzandose mediante restricciones que al

final del horizonte de prediccion, el estado entre en un invariante donde se emplea una

ley de control tipo LQR. Al extender esta estrategia para que se consideren incertidum-

bres, se minimiza una cota superior del coste cuadratico con horizonte infinito, el cual

depende de los N terminos libres y de la matriz de ganancias. Debido a la incertidum-

bre, todas las trayectorias del estado debidas a la secuencia de N senales de control a

partir del estado actual, estan contenidas en un politopo compacto y convexo, cuyos

vertices son funciones afines de las N senales de control y del estado actual del proceso.

La estabilidad se garantiza asegurando que todos los vertices de ese politopo esten a su

vez dentro del invariante robusto, cuando se emplea la ley de realimentacion del vector

de estados definida por la matriz de ganancias. La ley de control tendra por tanto la

forma:

u(·|t) =

u∗(t+ k|t) k = 0, 1, · · · , N − 1

u(t+ k|t) = F (t)x(t+ k|t) k ≥ N

donde u∗(t+ k|t) se calcula minimizando:

V (x(t), Q(t), u∗(·|t)) =N−1∑

k=0

maxz(k)∈vertices

Xt+k|tu∗(·|t)

(x(t))

‖z(k)‖2Ψx

+ ‖u∗(t+ k|t)‖2Ψu

+ maxz∈vertices

Xt+N|tu∗(·|t)

(x(t))

‖z‖2Q(t) (2.18)

sujeto a:

u∗(t+ k|t) ∈ Ωu ∀k = 0, 1, · · · , N − 1

vertices

Xt+N |tu∗(·|t)(x(t))

⊂ E(Q(t), ρ(t))

En (2.18) los conjuntos Xt+k|tu∗(·|t)(x(t)) denotan los conjuntos convexos de todas las trayec-

torias predichas a k pasos desde x(t), cuando se aplican las secuencias de actuaciones


u∗(t+ i|t)k−1i=0 . Por otra parte, E(Q(t), ρ(t)) es un elipsoide:

E(Q(t), ρ(t)) =

x ∈ Rn : xTQ(t)x ≤ ρ(t) ρ(t) > 0

que define un invariante robusto para el modelo politopico controlado por la matriz de

ganancias F (t). Esta, junto con Q(t) y ρ(t) se calculara de manera que se garantice que

el conjunto de plantas descrito por el modelo politopico sea estabilizable cuadratica-

mente por F (t). Para garantizar esto se ha de cumplir que todos los vertices del politopo

en el cual varıan las matrices del modelo, deben ser estabilizables cuadraticamente por

F (t) (Geromel et al., 1991), condicion que se puede expresar en forma de LMIs. Ademas

ρ(t) es una cota superior del coste para el peor caso con horizonte finito. Se obtiene

mediante un problema similar a (2.17), de manera que su valor sea el mınimo compat-

ible con las LMIs que garantizan la estabilidad cuadratica para todos los vertices del

politopo definido por las matrices del modelo.

2.5. Controladores Min-Max MPC con expresion

analıtica

En esta seccion se resumen los resultados presentados en una serie de trabajos (Noh

et al., 1996; Lee et al., 1996; Kim et al., 1998; Kim and Kwon, 1998) que tienen como

caracterıstica principal que la ley de control resultante tiene una expresion analıtica,

de manera que la senal de control se puede obtener sin apenas calculos. Este resul-

tado es posible porque no se consideran restricciones de ningun tipo, como se vera a

continuacion.

El primer trabajo presentado fue (Noh et al., 1996). En este trabajo se emplea un

modelo CARIMA en el cual se consideran incertidumbres aditivas no acotadas :

A(z−1)y(t) = B(z−1)u(t− 1) + C(z−1)w(t)

∆

En cuanto a los horizontes de prediccion, se considera un horizonte de control Nu, un

horizonte de salida N y un horizonte de restricciones NF , de manera que la accion de

control se supone constante a partir de t + Nu inclusive, es decir ∆u(t +Nu) = · · · =

∆u(t +N +NF − 1) = 0. El horizonte de restricciones NF se emplea para mejorar la

estabilidad y el rendimiento del controlador. Las predicciones, al igual que en el caso

de las incertidumbres globales acotadas se pueden expresar de una manera condensada

como:

Y = GU +DW + F

28 CONTROLADORES MIN-MAX MPC CON EXPRESION ANALITICA

y dado que se consideran dos horizontes de prediccion, es decir N y NF la anterior

expresion se puede reescribir de la siguiente manera:

[

Y1

Y2

]

=

[

G1

G2

]

U +

[

D1 0

DF D2

] [

W1

W2

]

+

[

F1

F2

]

La ley de control presentada en este trabajo esta derivada a partir de la teorıa de juegos

discretos LQ. Considerese la siguiente funcion de coste:

JLQ =N∑

i=1

f1(y(t+ i) − r(t+ i))T (y(t+ i) − r(t+ i)) (2.19)

+λ∆u(t+ i− 1)T ∆u(t+ i− 1)

+f2

N+NF∑

i=N+1

(y(t+ i) − r(t+ i))T (y(t+ i) − r(t+ i))

= (Y −R)TQ(Y −R) + λUTU

donde:

Q =

[

f1I 0

0 f2I

]

, λ > 0, Q ≥ 0

y R es la secuencia de valores de la referencia, la cual se puede considerar que tiene la

forma [R1 R2]T . La secuencia optima de actuaciones se obtendra resolviendo:

∆u = arg mınu

maxw

[

JLQ − γ2W TW]

(2.20)

donde el termino γ2W TW se anade a fin de que la solucion del min-max no este en w →

∞. Es decir, se consigue que la solucion este en un punto de silla. La introduccion de

este termino conduce a una funcion de coste artificiosa en la que se pierde el sentido que

tiene el criterio cuadratico (2.19). Sea J = JLQ − γ2W TW , dado que no se consideran

restricciones de ningun tipo (las incertidumbres no estan acotadas), la solucion del

problema mın-max se obtiene encontrando aquellos valores U ∗ y W ∗ tal que cumplen:

A :∂J

∂W W=W ∗= 0

∂2J

∂W 2W=W ∗

≤ 0

B :∂J

∂U U=U∗= 0

∂2J

∂U2U=U∗

≥ 0

Si no se considera el horizonte de restriccion, es decir si f1 = 1 y f2 = 0 la ley de

control resulta ser:

∆u =

(

λI +GT

(

I −1

λ2DDT

)−1

G

)−1

GT

(

I −1

λ2DDT

)−1

(R− F )


Puede observarse que si no se consideran los terminos relativos a la incertidumbre (es

decir, si γ → ∞) la ley de control que resulta es la misma que en el caso del GPC

estandar (Clarke et al., 1987).

En el caso de considerar un valor f2 6= 0 la formulacion considerada en (2.20) es

una ley de control lineal que depende de la existencia de una matriz que tiene la forma

(Q∗− 1γ2DD

T )−1. Esta matriz no tiene porque existir siempre, por lo que la formulacion

que se propone para el caso en el que se considera una penalizacion sobre el estado final

es diferente a la considerada en (2.20). La senal de control se considerara resolviendo:

∆u = arg mınu

(

maxw1

(

JLQ1 − γ2W T1 W1

)

+ JLQ2

)

(2.21)

donde:

JLQ1 = (Y1 −R1)TQ1(Y1 −R1) + λUTU Q1 = f1I, f1 > 0

JLQ2 = (Y2 −R2)TQ2(Y2 −R2) Q2 = f2I, f2 > 0

Y2 = [y(t+N + 1|t) · · · y(t+N +NF |t)]T

y y(t+ i|t) son las predicciones para t+ i sin considerar las incertidumbres, es decir:

Y2 = G2U + F2

Por tanto, esta formulacion solo considera las incertidumbres en parte del horizonte

de prediccion, de manera que en la parte final del horizonte de prediccion el uso de la

penalizacion del estado final pueda actuar mejorando la estabilidad del sistema.

Aplicando el mismo procedimiento seguido para el problema (2.20) se puede obtener

la solucion del formulado en (2.21):

∆u =(

Φ−1 − Φ−1GT2

(

f−12 I +G2Φ

−1GT2

)−1G2Φ

−1)

GT1 F (R1 − F1)

+Φ−1GT2

(

f−12 I +G2Φ

−1GT2

)−1(R2 − F2)

donde:

φ = λI +GT1

(

Q−11 −

1

γ2D1D

T1

)−1

G1

F =

(

Q−11 −

1

γ2D1D

T1

)−1

Los autores muestran con ejemplos simulados que en el caso de sistemas inestables la

mejora sobre un GPC estandar es notable, sin embargo, en el caso de sistemas estables

y de bajo orden las diferencias son pequenas.

30 CONTROLADORES MIN-MAX MPC CON EXPRESION ANALITICA

En el trabajo anterior no se garantiza la estabilidad del sistema en bucle cerrado.

En (Lee et al., 1996; Kim et al., 1998) se presenta una variante del controlador anterior

para la cual si se garantiza estabilidad. En este la senal de control se obtiene resolviendo

el problema:

∆u = arg mınu

(

maxw1

(

JLQ1 − γ2W T1 W1 + JLQ2

)

)

(2.22)

donde JLQ1 y JLQ2 tienen las mismas definiciones que en el problema (2.21), salvo que

en el caso de JLQ2 los valores de la salida se calculan a partir de los valores de la salida

en t + N y sin tener en cuenta la incertidumbre a partir de ese instante. Es decir, en

este caso:

Y2 = [y(t+N + 1|t+N) · · · y(t+N +NF |t+N)]T

de manera que las predicciones son mas fidedignas. Por otra parte, la subfuncion de

coste JLQ2 se incluye en la maximizacion de manera que la senal de control resulta ser:

∆u =1

λGT

(

1

λGGT +Q−1 −

1

γ2DDT

)−1

(R− F )

donde:

Q−1 =

[

f−11 I 0

0 f−12 I

]

, D =

[

D1

DF

]

Para este controlador los autores demuestran que el sistema es estable si se verifican

las siguientes desigualdades:

γ2I − DTQD > 0 (2.23)

γ2 − f1 − dTQ2d > 0

Q2 ≥(

F − gkT)T

Q2

(

F − gkT)

+ λkkT + f1ggT (2.24)

+(

f1gT + dT

(

F − gkT))T

(

γ2 − f1 − dTQ2d)−1(

f1gT + dT

(

F − gkT))

donde:

F =

0 1 0 · · · 0

0 0 1 · · · 0...

......

0 0 0 · · · 1

−aN −aN−1 −aN−2 · · · −a1

los −ai son los coeficientes del polinomio A(z−1) = ∆A(z−1), y se supone que N = n,

el grado de A(z−1). Por otra parte, en las desigualdades anteriores g, d son las primeras

columnas de las matrices G1 y D1 respectivamente. Finalmente:

gT =[

1 0 · · · 0]

− g0kT


donde g0 es el primer elemento de la primera columna de G1 y k es un vector de

dimension apropiada tal que se cumple que ∆u(t+N) = −kTY2.

Ademas de estabilidad, la ley de control obtenida de resolver (2.22) regula la salida

del proceso de manera que la norma inducida por la norma l2 de las perturbaciones a

la salida esta acotada por γ2, es decir, se cumple que:

∞∑

i=1

y(t+ i)2

∞∑

i=1

w(t+ i)2

≤ γ2

Las condiciones (2.23)-(2.24) admiten una formulacion basada en LMIs (Kim et al.,

1998), de manera que se podran hallar los valores de los parametros (si existen) para

los cuales el sistema es estable en bucle cerrado y mantiene la norma H∞ acotada.

Finalmente, en (Kim and Kwon, 1998) se ilustra la aplicacion simulada del contro-

lador anterior sobre un complejo modelo de un proceso metalurgico obtenido a partir

de los datos de una instalacion real, en el cual el controlador se compara favorablemente

con un control PID clasico.

En conclusion, los trabajos presentados en esta seccion se apartan del resto de los

revisados en este capıtulo porque formulan leyes de control que tienen una expresion

analıtica, con las ventajas computacionales y de analisis que ello conlleva. Sin embar-

go, presentan limitaciones tales como no contemplar ningun tipo de restriccion en la

accion de control o en las incertidumbres consideradas. En caso de considerarse tales

restricciones, el principal atractivo de estas estrategias se perderıa y serıa necesario

realizar la optimizacion por metodos numericos.

2.6. Controladores para el peor caso con parame-

tros acotados de J.H. Lee (1997)

En esta seccion se presentan las estrategias de control desarrolladas en (Lee and

Yu, 1997; Lee and Cooley, 2000). En el primer trabajo se presentan diversas formas de

MMMPC en las que por primera vez se argumentan las desventajas que presenta em-

plear predicciones en bucle abierto y se propone una estrategia MMMPC que emplea

el concepto de bucle cerrado. En las estrategias presentadas se consideran modelos en

espacio de estados, con penalizacion del estado terminal y se aportan pruebas de esta-

bilidad. Por otra parte, se proponen soluciones suboptimas con menores requerimientos

32 CONTROLADORES PARA EL PEOR CASO CON PARAMETROS ACOTADOS

de calculo.

El sistema considerado toma la forma:

zk+1 = A(ϑk)zk +B(ϑk)vk (2.25)

donde ϑ es un vector de incertidumbres sobre el que estan parametrizadas las matrices

del sistema y que puede ser constante o variar en el tiempo. En el primer caso se

considerara que ϑk = ϑ ∈ Θ, ∀k donde Θ es un conjunto compacto. En el caso de que

se considere que la incertidumbre es variante en el tiempo se asumira que ϑk ∈ Θ, ∀k

o bien de una manera mas general ϑk ∈ Θk.

La primera formulacion que se considera es el MMMPC en bucle abierto con vector

de incertidumbres invariante en el tiempo. En esta formulacion la senal de control se

calcula resolviendo:

mınu

maxθ∈Θ

xTk+pQpxk+p +

p−1∑

l=1

xTk+lQxk+l +

q−1∑

j=0

uTk+jRuk+j

(2.26)

con:

xk+l ∈ X l = 1, · · · , p ∀θ ∈ Θ

uk+j ∈ V j = 0, · · · , q − 1

uk+i = 0, i = q, · · · , p− 1

y:

xk+l = Al(θ)zk +l−1∑

j=0

Al−j−1(θ)B(θ)uk+j

Por otra parte, cuando el vector de incertidumbre varıa en el tiempo la senal de control

se obtendra resolviendo:

mınu

max[θk,···,θk+p−1]∈Θ×···×Θ

xTk+pQpxk+p +

p−1∑

l=1

xTk+lQxk+l +

q−1∑

j=0

uTk+jRuk+j

(2.27)

con:

xk+l ∈ X l = 1, · · · , p ∀ [θk, · · · , θk+p−1] ∈ Θ × · · · × Θ

uk+j ∈ V j = 0, · · · , q − 1

uk+i = 0, i = q, · · · , p− 1

siendo en este caso la ecuacion de prediccion:

xk+l =

(

l−1∏

i=0

A(θk+i)

)

zk +l−1∑

j=0

(

l−1∏

i=j+1

A(θk+i)

)

B(θk+j)uk+j


La formulacion con incertidumbre variante en el tiempo tiende a ser mas robusta que la

formulada en el problema (2.26), ya que considera un mayor numero de combinaciones

de los parametros de la planta. De hecho en la formulacion variante en el tiempo, bajo

ciertas condiciones, se puede garantizar la estabilidad en bucle cerrado, mientras que

para la otra formulacion no. Ambas formulaciones, sin embargo, emplean predicciones

en bucle abierto, por lo que no tienen en cuenta en la prediccion de las salidas futuras

que la ley de control se aplica en bucle cerrado. Esto significa que las acciones de

control futuras, a lo largo del horizonte de control, no tienen en cuenta las salidas

predichas, ignorando el hecho de que las acciones de control futuras afectan a los

valores factibles de los parametros a lo largo del horizonte de prediccion. Otro hecho

que se ignora al emplear predicciones en bucle abierto es que solo se aplica la primera

de las componentes, y que las restantes, incluso para la secuencia optima, puede que no

coincidan con las que realmente se apliquen debido a perturbaciones o incertidumbres

no consideradas.

2.6.1. MMMPC con predicciones en bucle cerrado

Dado que es beneficioso considerar la realimentacion en las predicciones de la salida

Lee and Yu (1997) proponen una estrategia MMMPC que emplea predicciones en bucle

cerrado. Para ello se basan en el conocido principio de optimalidad de Bellman (emplea-

do por ejemplo para la derivacion del regulador LQ) (Bellman, 1961). Considerando

un horizonte de prediccion finito, el valor de la funcion de coste para la solucion del

problema mın-max desde t = k + p− 1 hasta t = k + p partiendo de xk+p−1 serıa:

Vk+pk+p−1(xk+p−1) = mın

uk+p−1∈V

maxθk+p−1∈Θ

xTk+pQpxk+p + uT

k+p−1Ruk+p−1

donde:

xk+p = A(θk+p−1)xk+p−1 +B(θk+p−1)uk+p−1

De igual manera, aplicando el principio de optimalidad de Bellman, desde t = k+p−2

hasta t = k + p el coste sera:

Vk+pk+p−2(xk+p−2) = mın

uk+p−2∈V

maxθk+p−2∈Θ

xTk+p−1Qpxk+p−1 + uT

k+p−2Ruk+p−2

+V k+pk+p−1(xk+p−1)

con:

xk+p−1 = A(θk+p−2)xk+p−2 +B(θk+p−2)uk+p−2

Es decir, V k+pk+p−1, depende de xk+p−1, que a su vez depende de xk+p−2, el valor optimo

de uk+p−2 y de θk+p−2 a traves de la ecuacion de prediccion anterior. Esta idea se puede


aplicar hacia atras de manera que se llega a t = k:

Vk+pk (zk) = mın

uk∈V

maxθk∈Θ

xTk+1Qxk+1 + uT

kRuk + Vk+pk+1 (xk+1) (2.28)

cumpliendose que:

xk+1 = A(θk)zk +B(θk)uk

xk+1 ∈ X ∀θk ∈ Θ

El termino V k+pk+1 (xk+1) se puede calcular de manera recursiva usando:

Vk+pk+i−1(xk+i−1) = mın

uk+i−1∈V

maxθk+i−1∈Θ

xTk+iQixk+i + uT

k+i−1Ruk+i−1 (2.29)

+V k+pk+i (xk+i)

desde i = p hasta i = 2, con:

xk+i = A(θk+i−1)xk+i−1 +B(θk+i−1)uk+i−1

xk+i ∈ X ∀θk+i−1 ∈ Θ

tomando V k+pk+p (xk+p) = 0 y Q1 = · · · = Qp−1 = Q. El caracter de bucle cerrado de esta

estrategia se advierte si se tiene en cuenta que para obtener la senal de control para

xk+p se resuelve un problema de optimizacion donde interviene xk+p−1. Este a su vez,

no se calcula prediciendo a partir del estado actual del proceso mediante una secuencia

de actuaciones que se conocen de antemano (formulacion en bucle abierto), si no que

se obtiene al resolver un problema de optimizacion recurrente. Esto corresponde a la

aplicacion de la ley de control en bucle cerrado.

Una caracterıstica importante de esta estrategia es que el calculo de la senal de

control es un problema de optimizacion no lineal y no convexa aunque el sistema sea

lineal y el espacio de parametros convexo. Esto quiere decir que la resolucion en tiempo

real de este problema es inabordable. Esto es algo inherente a todas las formulaciones

MMMPC en bucle cerrado4, tal y como ocurre tambien en (Scokaert and Mayne, 1998)

(vease la seccion 2.7).

Lee and Yu (1997) proponen emplear una malla que discretice el espacio de estados,

obtener la solucion en estos puntos y emplear alguna tecnica de interpolacion cuando

el estado del proceso no coincida con los puntos de la malla.

4La solucion ideal a este problema pasarıa por obtener una solucion en forma explıcita tal y como se

presenta para otra estrategia MMMPC en bucle cerrado en (Bemporad et al., 2001). Desgraciadamente

esto no es siempre posible por lo que en la practica el uso de controladores MMMPC en bucle cerrado

esta muy limitado, de manera que tal y como se reconoce en (Mayne et al., 2000) tan solo se les debe

considerar (por ahora) como meras herramientas teoricas.


2.6.2. Estabilidad de las estrategias presentadas

Las estrategias de control MMMPC en bucle cerrado (2.28) y en bucle abierto

con incertidumbre variante en el tiempo (2.27) presentadas en esta seccion garantizan

la estabilidad en bucle cerrado cuando se considera el caso de horizonte de predic-

cion infinito. Ademas para modelos FIR la estabilidad puede garantizarse, bajo ciertas

condiciones, con horizonte de prediccion finito. La demostracion de esta propiedad se

hace basandose en la idea de que el valor de la funcion de coste para horizonte infinito

decrece con el tiempo monotonamente (tecnica que ha sido aplicada en otros problemas

de control predictivo (Mayne and Michalska, 1990; Rawlings and Muske, 1993)).

En el caso de la formulacion en bucle cerrado (2.28) se establece que para un estado

zk con Q,R > 0, el sistema (2.25) bajo la ley de control vk = f∞(zk) es estable para

todas las secuencias de parametros factibles y sobre el conjunto de estados z0 para el

cual el coste con horizonte infinito esta acotado, es decir V ∞0 (z0) <∞.

La demostracion, que se omite por brevedad, se basa en probar que el coste para

horizonte infinito:

V ∞k = mın

uk∈V

maxθk∈Θ

mınuk+1∈V

maxθk+1∈Θ

· · · mınuk+q−1∈V

maxθk+q−1∈Θ

· · ·

∞∑

l=1

xTk+lQxk+l +

q−1∑

j=0

uTk+jRuk+j

decrece monotonamente con el tiempo, de manera que se demuestra que:

V ∞k+1 − V ∞

k ≤ −(zTk Qzk + vT

k Rvk)

En el caso de sistemas estables en bucle abierto se puede probar la estabilidad global

del sistema en bucle cerrado. Por otra parte, en caso de considerarse restricciones el

resultado enunciado sigue siendo valido siempre que las restricciones sean factibles.

En caso de que puedan presentarse problemas de factibilidad, existen alternativas em-

pleadas en control predictivo (Rawlings and Muske, 1993; Zheng and Morari, 1995),

con las que se puede seguir garantizando estabilidad.

En cuanto a la formulacion en bucle abierto con parametros inciertos variables en

el tiempo tambien se demuestra, usando la misma lınea argumental, que el sistema

es estable en bucle cerrado. No obstante, se debe cumplir que el coste con horizonte

infinito este acotado. Teniendo en cuenta que las predicciones son en bucle abierto

eso implica que los parametros sobre los que se considera la incertidumbre no pueden

corresponder a modos inestables del sistema. Por otra parte, no se puede garantizar

estabilidad en el caso de la formulacion con parametros inciertos invariantes. La razon

es que el valor de esos parametros que constituye el peor caso puede variar de un


instante a otro por efecto de la realimentacion, por lo que no se puede garantizar que

el coste V ∞k sea monotonamente decreciente.

Las conclusiones de Lee and Yu (1997) sobre las estrategias presentadas valoran

favorablemente al MMMPC en bucle cerrado como opcion preferente. El MMMPC en

bucle abierto con incertidumbre variable en el tiempo se valora como compromiso en-

tre robustez y bajos requerimientos de calculo. Sin embargo, se advierte que el exceso

de conservadurismo de la formulacion en bucle abierto puede dar lugar a un compor-

tamiento pobre del controlador. Un hecho a destacar es que los autores consideran

que la estrategia en bucle abierto se debe considerar una aproximacion suboptima al

MMMPC en bucle cerrado, que es la verdadera estrategia de control predictivo robusto

basado en optimizacion mın-max.

Finalmente ademas de los resultados ya enunciados, los autores presentan un algo-

ritmo suboptimo para modelos FIR, derivan el MPC estandar a partir de la MMMPC

y presentan diversos ejemplos donde se comparan las diversas estrategias presentadas.

2.6.3. MMMPC en bucle abierto para un conjunto acotado

de matrices de entrada

El trabajo anterior tiene su continuacion en (Lee and Cooley, 2000)5, en el que

se presenta una estrategia MMMPC menos ambiciosa que la presentada en (Lee and

Yu, 1997). En este caso se consideran predicciones en bucle abierto e incertidumbres

solo en la matriz de entrada. El sistema que se considera tendra la forma:

zk+1 = Azk +B(ϑk)vk (2.30)

Todos los elementos de B(ϑ) se suponen funciones afines de ϑ, el cual pertenece al

conjunto compacto Ω. Tal y como se planteaba en (Lee and Yu, 1997) se consideran

dos casos dependiendo de si el vector de incertidumbres varıa o no en el tiempo. Por

otra parte se tratan procesos estables o integradores.

5Aunque publicado en Automatica en 2000, este trabajo realmente se presento en primer lugar en

la Conferencia de Control Americana (ACC) de 1997.


2.6.3.1. Plantas estables

En el caso de considerar incertidumbres variables en el tiempo la senal de control

se hallara resolviendo:

mınuk,···,uk+m−1

maxθk,···,θk+m−1

[

Vk ,

∞∑

i=1

xTk+iQxk+i +

m−1∑

j=0

uTk+jRuk+j

]

(2.31)

obteniendose las predicciones mediante:

xk+i = Aizk +i∑

j=1

Ai−jB(θk+j−1)uk+j−1 i = 1, · · · ,∞

con:

uk+j ∈ V j = 0, · · · ,m− 1

uk+m+l = 0, l ≥ 0 (2.32)

y θk+j ∈ Ω para j = 0, · · · ,m − 1. Este es un problema en el que el horizonte de

prediccion es infinito (no ası el de control). Un problema de este tipo es equivalente a

uno de horizonte finito, pues se puede probar que:

Vk =m−1∑

i=1

xTk+iQxk+i + xk+mQxk+m +

m−1∑

j=0

uTk+jRuk+j

donde Q es la solucion de la ecuacion de Lyapunov:

ATQA+Q = Q

El problema mın-max resultante es un problema de optimizacion convexo y por tanto

tratable, aunque los requerimientos computacionales para resolverlo puedan ser muy

altos.

Para esta estrategia se puede garantizar la estabilidad robusta para cualquier valor

inicial del estado y de los parametros de ϑk.

En el caso de considerarse que el vector de parametros inciertos no varıa en el

tiempo no se puede garantizar la estabilidad (algo que ya se establecio para el caso mas

general presentado en (Lee and Yu, 1997)). Sin embargo, el problema de optimizacion

resultante es mucho mas facil de resolver. Por tanto, en caso de aplicar una estrategia de

incertidumbre invariante, se debe emplear alguna de las tecnicas que han aparecido para

mejorar la robustez del control predictivo como por ejemplo una restriccion contractiva

sobre el estado (Zheng, 1995) o bien imponer para todos los valores extremos de la

incertidumbre que el coste alcanzado en el optimo sea decreciente (Badgwell, 1997).


2.6.3.2. Procesos con un integrador

En el caso de que el modelo contenga un integrador (hecho frecuente pues es nece-

sario para rechazar perturbaciones constantes), el modelo se puede expresar como:

[

zSk+1

zIk+1

]

=

[

AS 0

0 I

] [

zSk

zIk

]

+

[

BS(ϑk)

BI(ϑk)

]

vk (2.33)

donde AS tiene todos sus autovalores dentro del cırculo unidad. Por otra parte, un

criterio cuadratico se podra expresar como:

∞∑

k=0

[

(zSk )T (zI

k)T]

[

QS QSI

QIS QI

] [

zSk

zIk

]

+ vTk Rvk

donde QS, QI > 0 y QTIS = QSI .

Si para este tipo de procesos se considera un problema mın-max analogo al formula-

do en (2.31) surgen problemas. Esto se debe a que para mantener acotado el coste con

horizonte infinito (requisito para asegurar la estabilidad) los modos inestables deben

ser regulados a cero dentro del horizonte de control, y esto no es siempre posible. Se

necesita por tanto una formulacion diferente. Considerese el siguiente problema mın-

max:

mınuk,···,uk+m−1∈V

maxθk,···,θk+m−1∈Ω

[

1

p

(

p∑

i=1

xTk+iQxk+i +

m−1∑

j=0

uTk+jRuk+j

)]

Si p → ∞ los modos estables decaen exponencialmente, por lo que los modos inte-

gradores dominan y el valor de la funcion de coste se aproxima a (xIk+m)TQI(x

Ik+m).

De ahı que el problema mın-max se puede redefinir como:



[

(xIk+m)TQI(x

Ik+m)

]

El problema anterior puede sufrir problemas de condicionamiento numerico que lleven a

la existencia de mas de una solucion. Para evitar esto se anade un termino que penalice

el esfuerzo de control:



[

(xIk+m)TQI(x

Ik+m) + λ

m−1∑

j=0

uTk+jRuk+j

]

(2.34)

con λ > 0.

La ley de control obtenida mediante la resolucion del problema (2.34) estabiliza

al sistema (2.33) para cualquier valor de las condiciones iniciales z0 y para cualquier


secuencia de parametros ϑk ∈ Ω, k ≥ 0. La unica condicion es que la matriz de entrada

BI(ϑ) tenga rango completo por filas para todo ϑ ∈ Ω.

Tambien en este caso se da un algoritmo que considera incertidumbres constantes, y

como en el caso anterior no se puede garantizar la estabilidad a menos que se apliquen

tecnicas especıficas para ello.

Los resultados presentados en este trabajo se ilustran mediante ejemplos que ponen

de manifiesto la superioridad de las formulaciones MMMPC sobre estrategias MPC con

horizonte de prediccion infinito. Las leyes de control presentadas en este trabajo no son

tan robustas como las que emplean predicciones en bucle cerrado o incertidumbres en

la matriz A, pero tienen la importante ventaja de calcularse mediante la resolucion

de problemas convexos, que aunque pueden ser costosos de resolver, son tratables, a

diferencia de las estrategias presentadas en (Lee and Yu, 1997).

2.7. Min-Max MPC con predicciones en bucle ce-

rrado de Scokaert y Mayne (1998)

Como ya pusieron de manifiesto Lee and Yu (1997), uno de los inconvenientes del

MMMPC tradicional (Campo and Morari, 1987) en sus diversas formulaciones es que

al emplear predicciones en bucle abierto no se esta teniendo en cuenta que la senal

de control en realidad se aplica en bucle cerrado, por lo que se estan ignorando los

efectos que esto conlleva (una menor sensibilidad ante perturbaciones por ejemplo).

Esto proporciona un control mas conservador y en caso de que se consideren restric-

ciones es muy probable que aparezcan problemas de factibilidad, por lo que la ley de

control serıa inaplicable. Scokaert and Mayne (1998) proponen una estrategia MMM-

PC en bucle cerrado6 que se caracteriza por considerar una familia de secuencias de

actuaciones en lugar de una sola secuencia de actuaciones. Tambien se garantiza la

estabilidad mediante un esquema de control dual, segun el cual, se emplea el MMMPC

para llevar el estado del sistema a un conjunto invariante robusto de control en el cual

se usa un controlador lineal estandar para llevarlo al origen. Otra caracterıstica es que

se proponen dos versiones del algoritmo, una de horizonte fijo y otra con horizonte

variable.

6En este trabajo no se hace mencion alguna a la estrategia de MMMPC en bucle cerrado que

proponen Lee and Yu (1997) a pesar de haber publicado sus resultados con anterioridad. La razon es

que el trabajo de Scokaert and Mayne (1998) fue enviado con anterioridad a la publicacion de (Lee

and Yu, 1997), lo que explica que la idea de MMMPC en bucle cerrado presentada sea diferente de la

presentada por Lee y Yu.

40 MIN-MAX MPC EN BUCLE CERRADO DE SCOKAERT Y MAYNE

El modelo que se considera para el sistema es lineal e invariante en el tiempo:

xt+1 = Axt +But + wt

donde (A,B) definen un sistema controlable y wt ∈ W es una perturbacion aditiva de

valor desconocido pero acotado. Por su parte, W es un conjunto compacto, convexo y

que contiene un entorno abierto del origen.

Como se ha mencionado al principio de esta seccion, la estrategia de control emplea

un control con dos modos correspondientes a un controlador ((exterior)) y otro ((interior))

en un invariante robusto de control X0. El controlador exterior tiene como objetivo

llevar el estado del proceso al invariante X0. El controlador interior esta disenado para

mantener el estado del proceso en X0 a pesar de las perturbaciones. Este controlador

interior es lineal y tiene la forma u = −Kx donde K cumple que (A−BK)s = 0 para

algun entero s. El invariante robusto de control se tomara como:

X0 = W + FW + · · · + F s−1W

donde F = A−BK.

El controlador exterior es un MMMPC en el que, como se vera a continuacion, se

considera que el control es en bucle cerrado. En el instante t se pueden considerar una

serie de realizaciones de la perturbacion que se denotaran por wlj|t donde l ∈ L son los

ındices que permiten hacer referencia a las realizaciones. Por otra parte ulj|t denota

la secuencia de actuaciones asociada con la l-esima realizacion de la perturbacion. Se

tendrıa por tanto:

xlj+1|t = Axl

j|t +Bulj|t + wl

j|t l ∈ L

donde xlt|t = xt para todo l ∈ L. La senal de control se calcula resolviendo:

mınul

j|tmaxl∈L

N−1∑

j=0

L(xlt+j|t, x

lt+j|t) (2.35)

sujeto a:

xlj|t ∈ X j > t ∀l ∈ L

ulj|t ∈ U j ≥ t ∀l ∈ L

xlt+N |t ∈ X0 ∀l ∈ L (2.36)

xl1j|t = xl2

j|t ⇒ ul1j|t = ul2

j|t j ≥ t ∀l1, l2 ∈ L (2.37)

donde la funcion de coste L : Rn × R

m → R es semidefinida positiva. La restriccion

(2.36) es la que garantiza la estabilidad en esta estrategia de control.


La nocion de bucle cerrado se introduce en esta formulacion por el hecho de que se

considera una posible secuencia de actuaciones por cada realizacion de la perturbacion.

Esto supone una gran cantidad de grados de libertad que se pueden emplear para

garantizar que se lleva al sistema al invariante X0 para cualquier realizacion de la

perturbacion. Se impone que para un mismo estado, la accion de control en cada una

de las secuencias consideradas debe ser la misma. Esto es lo que se consigue con la

restriccion (2.37), llamada de causalidad. De esta manera la actuacion para el instante

j depende solo de la prediccion del estado en j y no de la sucesion de estados recorridos

hasta llegar a xj|t.

El problema (2.35) considera todas las posibles realizaciones de la perturbacion,

por lo que se convierte en un problema de optimizacion infinito-dimensional (pues se

considera una secuencia de actuaciones por cada realizacion). Sin embargo si W es

un politopo convexo, el modelo es lineal y L es convexa, solo han de considerarse los

vertices de W en la optimizacion, de manera que el numero de variables a considerar

se vuelve finito. De esta manera el problema (2.35) se puede reescribir como:

mınul

j|tmaxl∈Lv

N−1∑

j=0

L(xlt+j|t, x

lt+j|t) (2.38)

sujeto a:

xlj|t ∈ X j > t ∀l ∈ Lv

ulj|t ∈ U j ≥ t ∀l ∈ Lv

xlt+N |t ∈ X0 ∀l ∈ Lv

xl1j|t = xl2


j|t j ≥ t ∀l1, l2 ∈ Lv

donde Lv es el conjunto de vertices l de manera que wlj|t toma valores solo en los

vertices de W . De esta manera, como el numero de vertices es finito, el problema puede

ser tratado con tecnicas mas eficientes (aunque como se vera mas adelante no es un

problema que se pueda resolver en tiempo real).

Como se ha mencionado anteriormente, la idea de bucle cerrado es incorporada a

la ley de control porque se considera una secuencia de actuaciones para cada posible

realizacion extrema de la perturbacion, de manera que si N = 3 y W ≡ w ∈ R3 :

w− ≤ wi ≤ w+ i = 1, 2, 3 se tendrıan 23 = 8 realizaciones extremas asociadas a 8

secuencias de actuaciones [ult|t, u

lt+1|t, u

lt+2|t] con l = 1, · · · , 8. Esto darıa 24 variables de

decision. Sin embargo, con la restriccion de causalidad este numero se reduce bastante.

Para ilustrar este hecho considerese la figura 2.1, en la que se muestran las trayectorias

posibles del estado del proceso bajo las 8 realizaciones extremas de la perturbacion.

Puede observarse que las ocho secuencias de actuaciones comienzan con la misma senal

42 MIN-MAX MPC EN BUCLE CERRADO DE SCOKAERT Y MAYNE

w−

ut+12

t

w+

w+

xt+12

xt+11

xt+21

xt+31

xt+32

xt+33

xt+34

xt+35

xt+36

xt+37

xt+38

xt+22

xt+23

xt+24

w− w

+

w+

t+3

w+

w+

ut+12

w− u

t

w−

w−

w−

w+

w−

ut+24

ut

ut+23

ut+11

ut+11

ut+22

ut+22

ut+24

ut+23

ut+21

t+2 t+1

ut+21

xt

Figura 2.1: Posibles trayectorias del estado

de control (ut), debido a la restriccion de causalidad. A partir de ahı se puede pasar

a dos estados distintos en t + 1, dependiendo de si se considera que la perturbacion

puede ser w+ o w−. Las secuencias que parten de cada uno de esos dos estados tambien

comienzan por la misma actuacion y ası sucesivamente, hasta obtener 7 diferentes

valores de la senal de control a optimizar, de manera que el vector de variables a

optimizar serıa:

u =[

ut|t u1t+1|t u2

t+1|t u1t+2|t u2

t+2|t u3t+2|t u4

t+2|t

]

De la ecuacion anterior se desprende que, aunque el numero de variables de decision

es menor que si no se considerase la restriccion de causalidad, sigue siendo mucho mas

grande que en la formulacion en bucle abierto donde solo se considerarıan 3 variables.

Este ejemplo pone de manifiesto el principal problema de esta formulacion: el alto coste

computacional, que relega a este tipo de controladores a ser una mera herramienta

teorica (Mayne et al., 2000).

En cuanto a la estabilidad en bucle cerrado del sistema, Scokaert and Mayne (1998)

demuestran que la ley de control que resulta de aplicar la solucion de (2.35) y (2.38)

mediante la estrategia de horizonte deslizante es capaz de llevar el estado del sistema

al invariante robusto X0 asimptoticamente.


El trabajo de Scokaert and Mayne (1998) no ofrece una comparativa entre la formu-

lacion en bucle abierto y la que aquı se ha presentado. En (Megıas et al., 2001) se aplica

esta formulacion en un MMMPC con horizonte infinito, funcion de coste cuadratica e

incertidumbres globales acotadas comparandose con la formulacion en bucle abierto.

2.7.1. Controlador con horizonte de prediccion variable

Ademas del controlador MMMPC con horizonte fijo que se ha presentado, los au-

tores presentan otro de horizonte variable, el cual elimina la necesidad de tener que

escoger el horizonte de prediccion a la vez que se obtiene un mejor rendimiento. La

formulacion de este controlador se diferencia de la anterior en que el horizonte de

prediccion se transforma en una variable de decision mas y en que la funcion de coste

es el propio horizonte, es decir, la secuencia de actuaciones se obtendra resolviendo:

mınul

j|t,N

maxl∈Lv

N (2.39)

sujeto a:

xlj|t ∈ X j > t ∀l ∈ Lv

ulj|t ∈ U j ≥ t ∀l ∈ Lv

xlt+N |t ∈ X0 ∀l ∈ Lv

xl1j|t = xl2


j|t j ≥ t ∀l1, l2 ∈ Lv

Dado que el ındice a minimizar es el propio horizonte de prediccion, el controlador

MMMPC tratara de llevar el estado del proceso al invariante robusto en el menor

numero de intervalos, en un comportamiento que recuerda al control dead-beat . No se

pondera la manera de llegar a ese invariante robusto, por lo que el control puede ser

muy brusco. Una vez en el invariante el controlador interior es el que se encarga de

regular el estado del proceso al origen, garantizandose la estabilidad en bucle cerrado.

Los autores demuestran que el controlador externo MMMPC de horizonte variable

es capaz de llevar el estado al invariante robusto X0 independientemente del valor que

tome la perturbacion, por lo que se garantiza la estabilidad en bucle cerrado tambien

en este caso.

Esta estrategia sin embargo, no se puede resolver de manera eficiente, pues dado

que N es una variable entera, el problema resultante es de programacion mixta entera.

Afortunadamente, dado que solo hay una variable entera, la solucion pasa por no

emplear un algoritmo de programacion mixta entera sino que se ha de buscar cual es el

44 ESTRATEGIAS DE CONTROL QUASI MIN-MAX MPC

valor de N mas bajo para el cual existe una secuencia de actuaciones, tal que el estado

puede ser llevado al invariante robusto y satisface el resto de las restricciones.

En conclusion, las estrategias presentadas por Scokaert and Mayne (1998) ofrecen

otra forma de incorporar la nocion de bucle cerrado al problema de optimizacion. Si en

(Lee and Yu, 1997) esto se conseguıa resolviendo una serie de problemas de optimizacion

anidados, inspirados en el principio de optimalidad de Bellman, en este caso se mantiene

una secuencia de actuaciones por cada realizacion extrema de la perturbacion. De este

modo no se exige a un solo perfil de control que regule frente a todas las realizaciones

de la perturbacion, sino que se dispone de mas grados de libertad para conseguir esto.

Otras diferencias estriban en la forma de garantizar la estabilidad, en un caso mediante

la adopcion de un horizonte de prediccion infinito y en el otro mediante un invariante

robusto de control. Ambas formulaciones estan limitadas, sin embargo, por el coste que

conlleva resolver el problema mın-max. En la seccion 2.10 se presentara una estrategia

MMMPC en bucle cerrado que aunque conlleva la resolucion de un problema complejo,

se puede expresar en forma explıcita, por lo que no se requiere mucho calculo en tiempo

real.

2.8. Estrategias de control Quasi Min-Max MPC

En esta seccion se presentaran los controladores publicados en (Lu and Arkun,

2000b; Lu and Arkun, 2000a; Lu and Arkun, 2001), los cuales son en esencia una mejora

de (Kothare et al., 1996). Se consideran sistemas lineales de parametros variables en

el tiempo. La principal diferencia con (Kothare et al., 1996) consiste en separar la

primera de las componentes de la secuencia de actuacion, de manera que sobre ella

no se considera incertidumbre. Ası se reduce el conservadurismo presente en todas las

formulaciones MMMPC, y se aumenta la region del espacio de estados para la cual se

garantiza la estabilidad. Por otra parte, dado que la incertidumbre solo se considera

a partir de k + 2, se asume que se pueden medir los parametros del sistema en cada

instante, aunque se desconoce su evolucion futura. Al usarse los parametros medidos

para determinar la accion de control, este controlador emplea una adaptacion del tipo

usado en las tecnicas de planificacion de la ganancia (gain scheduling).

El modelo considerado corresponde a un sistema lineal de parametros variantes en

el tiempo (LPV) cuyas matrices son funciones afines de un vector de parametros p(k):

x(k + 1) = A(p(k))x(k) +B(p(k))u(k)


donde:

A(p(k)) =l∑

j=1

pj(k)Aj B(p(k)) =l∑

j=1

pj(k)Bj

cumpliendose que p(k) pertenece a un politopo convexo P definido por los valores pj(k)

tales quel∑

j=1

pj(k) = 1, con 0 ≤ pj(k) ≤ 1. Por otra parte, al variar p(k) en el politopo

P las matrices del sistema varıan en un politopo Ω definido por sus vertices:

[A(p(k)), B(p(k))] ∈ Ω = Co [A1, B1], [A2, B2], · · · , [Al, Bl]

donde [Ai, Bi] es el vertice que se obtiene cuando pi = 1 y pj = 0 para j 6= i. Se supone

que el vector de parametros p(k) y el estado x(k) se pueden medir en tiempo real y

que la dinamica de la planta coincide con la del modelo. Por tanto, en el instante k se

conoce la dinamica de la planta pero no como va a evolucionar a lo largo del horizonte

de prediccion.

La funcion de coste empleada en este trabajo se divide en dos partes:

J∞0 (k) = x(k|k)TQx(k|k) + u(k|k)TRu(k|k) + J∞

1 (k)

donde:

J∞1 (k) =

∞∑

i=1

x(k + i|k)TQx(k + i|k) + u(k + i|k)TRu(k + i|k)

2.8.1. Quasi-Min-Max MPC sin restricciones

La senal de control se calculara aplicando, segun la estrategia de horizonte deslizante,

la primera componente de la solucion de:

mınU∞

0 (k)max

[A(p(k+i)),B(p(k+i))]∈Ω i≥0J∞

0 (k)

con U∞0 (k) = [u(k|k), U∞

1 (k)] donde u(k|k) es la senal de control que realmente se

aplica y el resto de componentes vienen dados por una ley de realimentacion del vector

de estados cuya matriz no depende de p(k) (igual que en (Kothare et al., 1996)):

U∞1 (k) : u(k + i|k) = F (k)x(k + i|k) i ≥ 1 (2.40)

o bien por una realimentacion del estado dependiente de p(k):

U∞1 (k) :

u(k + i|k) =l∑

j=1

pj(k + i)Fj(k)x(k + i|k) i ≥ 1

(2.41)


Siguiendo la idea de Kothare et al. (1996) en lugar de resolver el problema mın-max

se deriva una cota superior de J∞1 (k) de manera que:

max[A(p(k+i)),B(p(k+i))]∈Ω i≥0

J∞1 (k) ≤ V (x(k + 1|k)) = x(k + 1|k)TP (k)x(k + 1|k)

con P (k) > 0.

El Quasi-Min-Max MPC minimiza la cota superior del peor caso de J∞1 y el coste

asociado a u(k|k), es decir:

mınu(k|k),P (k)

x(k|k)TQx(k|k) + u(k|k)TQu(k|k) + x(k + 1|k)TP (k)x(k + 1|k) (2.42)

El algoritmo se denomina ((Quasi)) pues la componente que se aplica (u(k|k)) no se con-

sidera en la parte ((max)) de la optimizacion (la cual en realidad se realiza minimizando

la cota de J∞1 ). El problema (2.42) se puede reformular usando LMIs, resultando ser

equivalente a:

mınγ,u(k|k),Q(k),Y (k)

γ (2.43)

sujeto a:

1 x(k + 1|k)T x(k|k)TQ12 u(k|k)TR

12

x(k + 1|k) Q(k) 0 0

Q12x(k|k) 0 γI 0

R12u(k|k) 0 0 γI

≥ 0

Q(k) ϑT Q(k)Q12 Y (k)TR

12

ϑ Q(k) 0 0

Q12 Q(k) 0 γI 0

R12Y (k) 0 0 γI

≥ 0 ∀j = 1, · · · , l

con x(k + 1|k) = [A(p(k))x(k|k) +B(p(k))u(k|k)], ϑ = AjQ(k) + BjY (k) y Q(k) =

Q(k)T . La ganancia de la ley de control (2.40) viene dada por F (k) = Y (k)Q−1(k),

de manera que se garantiza que los estados futuros evolucionan hacia un invariante

elipsoidal. En el caso de emplearse la ley de control (2.41), el problema anterior no

necesita ser modificado si Bj = B para todo j = 1, · · · , l. Si esto no ocurre en vez de

Y (k) se tendrıa Yj(k) y las matrices vendrıan dadas por Fj(k) = Yj(k)Q−1(k).

Los autores demuestran que la solucion de (2.43), implementada mediante la es-

trategia de horizonte deslizante, estabiliza al sistema si se llega a una solucion factible.


2.8.2. Quasi-Min-Max MPC con restricciones

En el caso de considerarse restricciones Lu and Arkun (2000b) proponen dos al-

ternativas. La primera consiste en formular las restricciones sobre las salidas y la

senal de actuacion como LMIs e incluirlas en el problema (2.43), de manera que se

seguira garantizando la estabilidad del sistema en bucle cerrado mientras que haya

soluciones factibles. En estas restricciones se separan las que se imponen sobre y(k+1)

y u(k), de las que se imponen sobre el resto de las entradas y predicciones de la salida.

La razon de esto es que para las primeras componentes es posible formular las restric-

ciones directamente mientras que para las otras no. Estas restricciones se formulan

como:

|u(k|k)| ≤ umax (2.44)

‖C[A(p(k))x(k|k) +B(p(k))u(k|k)]‖2 ≤ ymax (2.45)

donde C es la matriz de salida del sistema que cumple que y(k + 1) = Cx(k + 1). Las

restricciones sobre las restantes entradas se verifican si existe una matriz simetrica X

tal que se verifica:(

X Y

Y T Q

)

≥ 0 con Xii ≤ u2max

De igual manera, la restriccion sobre el resto de las salidas es equivalente a la siguiente

LMIs:(

Q [AjQ+BjY ]TCT

C[AjQ+BjY ] y2max

)

≥ 0 j = 1, · · · , l

Otra alternativa es imponer restricciones solo sobre y(k + 1) y u(k) y anadir una

restriccion que asegure que la funcion de coste decrece monotonamente, de manera que

se garantice estabilidad, es decir:

φ(k) < φ(k − 1) (2.46)

con:

φ(k) = x(k|k)TQx(k|k) + u(k|k)TQu(k|k) + x(k + 1|k)TP (k)x(k + 1|k)

El problema (2.42) junto con las restricciones (2.44) y (2.45) y la restriccion (2.46) es

equivalente al siguiente problema de optimizacion basado en LMIs:

mınγ,u(k|k),Q(k),Y (k)

γ (2.47)

sujeto a:

γ x(k + 1|k)T x(k|k)TQ12 u(k|k)TR

12

x(k + 1|k) Q(k) 0 0

Q12x(k|k) 0 I 0

R12u(k|k) 0 0 I

≥ 0


φ(k − 1) x(k + 1|k)T x(k|k)TQ12 u(k|k)TR

12

x(k + 1|k) Q(k) 0 0

Q12x(k|k) 0 I 0

R12u(k|k) 0 0 I

> 0

Q(k) ϕT Q(k)Q12 Y (k)TR

12

ϕ Q(k) 0 0

Q12 Q(k) 0 I 0

R12Y (k) 0 0 I

≥ 0 ∀j = 1, · · · , l

(

u(k|k) − umax

−umax − u(k|k)

)

≤ 0

(

C[A(p(k))x(k|k) +B(p(k))u(k|k)] − ymax

−ymax − C[A(p(k))x(k|k) +B(p(k))u(k|k)]

)

≤ 0

con ϕ = AjQ(k)+BjY (k) y Q(k) = Q(k)T . La ganancia de la ley de control vendra dada

por F (k) = Y (k)Q−1.

La estrategia de control resultante tiene la estabilidad en bucle cerrado garantizada

siempre que haya soluciones factibles. El uso de la restriccion de estabilidad (2.46)

aumenta la region del espacio de estados para la cual existen soluciones factibles, por

lo que es preferible su uso.

De los ejemplos simulados que aportan los autores se deduce que esta estrategia

presenta un menor conservadurismo que la estrategia de Kothare et al. (1996). Esto se

traduce en un mejor comportamiento del sistema en bucle cerrado y un aumento de la

region del espacio de estados para los que la estabilidad en bucle cerrado esta garanti-

zada.

Finalmente, hay que recalcar que ademas de la particularidad de ser ((Quasi)) mın-

max, el controlador descrito en esta seccion presenta una capacidad de adaptacion

similar a la de las tecnicas de planificacion de la ganancia. La razon es que la accion

de control que realmente se aplica, es decir u(k|k), depende (a traves del problema de

optimizacion) de los parametros p(k) que se estiman en tiempo real. Debido a esto los

autores se refieren a estos controladores como Scheduling Quasi-Min-Max MPC.

2.8.3. Actualizacion del politopo Ω

En (Lu and Arkun, 2000a) se presenta una modificacion al algoritmo anterior que

implica actualizar el politopo Ω, a la vez que se mantiene definido por el menor numero


posible de vertices. Esto viene motivado por el hecho de que, tal y como se desprende de

ejemplos simulados, cuantos menos vertices tenga el politopo Ω menos probable sera que

aparezcan problemas de factibilidad (y por tanto de perdida de estabilidad). Por otra

parte, tambien sera mas sencillo resolver el problema de optimizacion correspondiente.

La manera de solucionar esto es sencilla, y pasa por considerar, que una vez que se

mide el vector de parametros p(k), los parametros futuros estaran acotados:

pj(k) + ∆pj(k) ≤ pj(j + i) ≤ pj(k) + ∆pj(k)

Por otra parte, la matriz de transicion de estados futura A(p(k+ i|k)) se puede escribir

como:

A(p(k + i|k)) =L∑

j=1

(pj(k) + ∆pj(k))Aj

de manera que se pueden definir dos matrices:

A1 =L∑

j=1

(pj(k) + ∆pj(k))Aj = A(k) + ∆A(k) (2.48)

A2 =L∑

j=1

(pj(k) + ∆pj(k))Aj = A(k) + ∆A(k) (2.49)

y se considera entonces que A(p(k + i|k)) pertenece a un nuevo politopo Ω(k):

Ω(k) = CoA1, A2

el cual se actualiza en cada periodo de muestreo al leer p(k). Los valores ∆pj(k) y

∆pj(k) se tratan como parametros de sintonıa. Al reemplazar el politopo Ω por Ω(k)

se mejora el rendimiento del controlador y se reducen los problemas de factibilidad.

2.8.4. Extension a sistemas no lineales

En (Lu and Arkun, 2001) se presenta la extension de esta estrategia a sistemas no

lineales. Para ello se considera que se conoce un modelo no lineal del proceso, del cual

se obtiene un modelo linealizado que se utiliza como dinamica del proceso para ese

instante de muestreo. Para la dinamica en los instantes futuros se emplea un modelo

LPV que se supone varıa en un politopo Ω. El algoritmo de control empleado es el

Quasi-Min-Max MPC con restricciones descrito anteriormente.

50 CONTROLADORES MIN-MAX MPC BASADOS EN SERIES DE FUNCIONES

2.9. Controladores Min-Max MPC basados en se-

ries de funciones

La mayorıa de los controladores MMMPC estan basados en modelos en espacio de

estados o funcion de transferencia (modelos CARIMA o CARMA). Otros estan basa-

dos en la respuesta impulsional (FIR). Sin embargo existen otras maneras de mod-

elar sistemas que, aunque no muy extendidas, pueden presentar ventajas sobre los

metodos tradicionales. Una de estas formas es la que emplea expansiones en series de

funciones ortonormales. En estas representaciones se aproxima la ((funcion)) que da la

salida del proceso, por una suma ponderada de una serie de funciones de transferencia

ortonormales entre sı que forman una base. Este tipo de modelos se han empleado en

controladores MMMPC (Oliveira et al., 2000; Oliveira et al., 1996) con las siguientes

caracterısticas:

La funcion de coste es convexa en la incertidumbre, por lo que el maximo con

respecto a la incertidumbre se encuentra en uno de los vertices del politopo que

contiene a los posibles valores de los parametros inciertos. Por otra parte solo

existe un mınimo, lo que implica que no hay problemas de optimos locales. A

diferencia de otras formas de modelar el proceso y la incertidumbre como la de

incertidumbres globales acotadas (Camacho and Bordons, 1995), en este caso

estas propiedades se verifican para todos los parametros del modelo.

Los sistemas estables se representan con menos parametros que por ejemplo los

modelos FIR, de manera que se reduce la cantidad de calculos necesarios y se

simplifican las tareas de identificacion robusta.

A la hora de identificar un proceso con un modelo basado en expansion de fun-

ciones ortonormales no es necesario conocer el retraso y orden del sistema.

Se puede aplicar a procesos integradores y con restricciones en la entrada.

La estabilidad del sistema en bucle cerrado se garantiza estableciendo condiciones

suficientes en los parametros del controlador.

El modelo del sistema que se utiliza toma la forma:

y(k) =n∑

i=1

ci(εi)Φi(z−1)u(k) (2.50)

donde Φi(z−1) para i = 1, · · · , n es un conjunto de funciones de transferencia ortonor-

males que forman la base que se usa en la expansion en serie. Los coeficientes ci(εi)


caracterizan la dinamica del proceso y se consideran desconocidos pero acotados, es

decir cmini ≤ ci(εi) ≤ cmax

i , para i = 1, · · · , n, donde εi representa la incertidumbre

sobre el coeficiente ci. Si la salida de Φi(z−1) se denota por li(k), la salida del proceso

se podra reescribir como:

y(k) =n∑

i=1

ci(εi)li(k) (2.51)

Los parametros ci(εi) se pueden calcular a partir de los parametros de la respuesta

impulsional del sistema. Sea h(k) el conjunto de parametros de la respuesta impul-

sional, definido como:

h(k) , h(k) + εh(k)δh(k) : |εh(k)| ≤ 1

donde h(k) es el valor medio de h(k), δh(k) ≥ 0 es el valor absoluto de la maxima

desviacion de h(k) con respecto a su valor medio y εh(k) representa la incertidumbre

sobre el coeficiente h(k). De esta manera los coeficientes del modelo vendran dados

por:

ci =∞∑

k=0

h(k)Φi(z−1)δ(k)

donde δ(k) es un impulso unitario. De lo anterior se puede obtener que:

ci(εi) = ci + εiδci

donde |εi| ≤ 1 y ci y δci son el valor medio y desviacion maxima de ci(εi) que vienen

dados por:

ci =∞∑

k=0

h(k)Φi(z−1)δ(k) δci =

∞∑

k=0

δh(k)Φi(z−1)δ(k)

Como funciones ortonormales Oliveira et al. (2000) emplean funciones de Laguerre

y Kautz (Wahlberg and Makila, 1996). Estas funciones se caracterizan porque emplean

la dinamica dominante del sistema, la cual puede venir dada por un polo real (p) o un

par de polos complejos conjugados (p,p∗). Usando estas funciones el modelo (2.51) se

puede reescribir como:

l(k + 1) = Al(k) + bu(k) (2.52)

y(k) = cT (ε)l(k)

con:

l(k) = [l1(k), · · · , ln(k)]T (2.53)

c(ε) = c+ δc(ε) (2.54)

52 CONTROLADORES MIN-MAX MPC BASADOS EN SERIES DE FUNCIONES

donde la matriz A y el vector b se calculan usando el polo p y el numero de elementos

de la expansion en serie.

En (Oliveira et al., 2000) se presentan dos controladores MMMPC que emplean el

modelo anterior. El primero emplea un coste cuadratico igual al utilizado en (Camacho

and Bordons, 1995) para la norma cuadratica:

mın∆u

maxε∈Ω

N2∑

j=N1

(y(k + j|k, ε) − w(k + j))2 +Nu∑

j=1

λ∆u2(k + j − 1|k) (2.55)

s.a.

umin ≤ u(k + j − 1|k) ≤ umax ∀j = 1, · · · , Nu

∆umin ≤ ∆u(k + j − 1|k) ≤ ∆umax ∀j = 1, · · · , Nu

Las predicciones de la salida del proceso vendran dadas por:

y(k + j|k, ε) = y(k) + cT (ε)(Kj − I)∆l(k) + cT (ε)Nu∑

m=1

Kj−mb∆u(k +m− 1|k) (2.56)

donde Kj =∑j

i=0Ai y ∆l(k) = l(k) − l(k − 1) con l(k) = 0 para k ≤ 0.

Las predicciones son una funcion afın de la incertidumbre, por lo que la funcion de

coste es convexa en la incertidumbre y en ∆u, de manera que el maximo de la funcion

de coste con respecto a la incertidumbre estara en uno de los vertices de Ω, lo cual

implica que el problema de optimizacion, aunque costoso, sera tratable. Por otra parte

el mınimo con respecto a ∆u sera unico, por lo que no se produciran problemas de

mınimos locales.

El otro controlador presentado esta basado en la norma ∞, al igual que los de

(Campo and Morari, 1987). Teniendo en cuenta las ecuaciones de prediccion (2.56) y

del modelo (2.52)-(2.54), la ley de control se obtendra aplicando la primera componente

de la solucion de:

mın∆u

maxj=N1,···,N2

|yl(k + j|k) + cT Ψj∆u− w(k + j)| +n∑

i=1

|δci(γj,i + Ψj,(i,:)∆u)|

s.a.

umin ≤ u(k + j − 1|k) ≤ umax ∀j = 1, · · · , Nu

∆umin ≤ ∆u(k + j − 1|k) ≤ ∆umax ∀j = 1, · · · , Nu

donde:

yl(k + j|k) = y(k) + cT Γj (2.57)

Ψj = [Kj−1b, · · · , Kj−Nub] (2.58)

Γj = (Kj − I)∆l(k) (2.59)


siendo Ψj,(i,:) la i-esima fila de Ψj y γj,i la i-esima componente del vector γj.

La ley de control resultante de aplicar la solucion del problema mın-max anterior

en una estrategia de horizonte deslizante estabiliza al sistema (2.50) en bucle cerrado

si N2 ≥ ni+Nu − 1, donde ni es el maximo orden de los modelos FIR necesarios para

describir todas las posibles respuestas impulsionales asociadas al modelo (2.52) cuando

se consideran las incertidumbres ε ∈ Ω.

2.10. Soluciones explıcitas para controladores Min-

Max MPC con norma ∞ o norma 1

Uno de los inconvenientes que siempre se ha achacado al control predictivo con

restricciones y al MMMPC es la cantidad de calculo que conlleva la resolucion en tiempo

real del problema de optimizacion para obtener la senal de control. Recientemente, se

ha aplicado la teorıa de la programacion parametrica (Gal, 1979), para estudiar la

variacion de la senal de control cuando varıa el estado. Un resultado conocido (Gal and

Nedoma, 1972) es que la solucion de un programa lineal, en el cual los parametros al

variar causan una variacion lineal del lado derecho de las restricciones, es una funcion

lineal a trozos de los parametros. El programa lineal que aparece cuando se considera un

MPC basado en la norma 1 o ∞ se puede expresar como un programa multiparametrico

en el que los parametros (el estado del proceso en este caso) solo aparecen en el lado

derecho de las restricciones, por lo que la ley de control es una funcion lineal a trozos

del estado y admite una solucion explıcita (Bemporad et al., 2000a). Eso implica que

el MMMPC basado en la norma 1 o ∞ (Campo and Morari, 1987; Allwright and

Papavasilou, 1991; Papavasilou and Allwright, 1991; Allwright and Papavasilou, 1992;

Allwright, 1994) el cual se puede formular tambien como un programa lineal resulta

ser una ley de control lineal a trozos. En (Bemporad et al., 2001) se presenta este

resultado, el cual se describe a continuacion.

Considerese un proceso descrito por el siguiente modelo en el espacio de estados:

x(t+ 1) = Ax(t) +Bu(t) + Ev(t) (2.60)

y(t) = Cx(t)

donde la perturbacion a la entrada v(t) esta acotada, de manera que pertenece a un

politopo definido por por V = v : Mv ≤ L con L ≥ 0. Se considera una estrategia

de control MMMPC basado en la norma ∞ que requiere la resolucion del siguiente

problema mın-max:

54 SOLUCIONES EXPLICITAS PARA NORMA ∞ O NORMA 1

mınut,···,ut+N−1

maxvt,···,vt+N−1

ψPλ(xt+N |t) +

N−1∑

k=1

‖Qxt+k|t‖∞

+N−1∑

k=0

‖Rut+k‖∞

(2.61)

s.a.

F1xt+k|t ≤ f1 k = 1, · · · , N

F2xt+k|t +G2ut+k ≤ f2 k = 0, · · · , N − 1

Mvt+k ≤ L k = 0, · · · , N − 1

xt+k+1|t = Axt+k|t +But+k + Fvt+k k ≥ 0

xt|t = x(t)

xt+N |t ∈ Pλ

El conjunto Pλ es un invariante robusto para el sistema (2.60) y la funcion ψPλ(x) es

su funcional de Minkowski (Blanchini, 1999) el cual viene definido por:

ψPλ(x)

.= inf µ ≥ 0 : x ∈ µPλ

El problema (2.61) define una estrategia de control MMMPC que emplea predic-

ciones en bucle abierto. Como ya se ha mencionado en secciones precedentes (veanse

las secciones 2.6.1 y 2.7), el uso de predicciones en bucle cerrado conlleva un menor

conservadurismo en la accion de control lo que implica un mejor control. En esta lınea,

Bemporad et al. (2001) proponen un MMMPC en bucle cerrado en el que se considera

el problema de optimizacion:

mınut

‖Rut‖∞ + maxvt

‖Qxt+1|t‖∞ + mınut+1

· · · + mınut+N−1

‖Rut+N−1‖∞ (2.62)

+ maxvt+N−1

ψPλ(xt+N |t)

· · ·

sujeto a las restricciones del problema (2.61).

La solucion de los problemas (2.61) y (2.62) es una funcion lineal a trozos del estado

del proceso. Para hallar la descripcion en forma explıcita ha de considerarse el siguiente

problema:

mınz.=[zc,zd]

cT z (2.63)

s.a.

Gz ≤ W + Sx

donde zc ∈ Rnc son variables continuas, zd ∈ 0, 1nd son variables enteras y x ∈ R

s

es el vector de parametros. Un problema del tipo (2.63) se conoce como programa


multiparametrico lineal mixto entero (mp-MILP). La solucion y el coste alcanzado en

la solucion de este tipo de problemas son funciones lineales a trozos de los parametros

x. Teniendo en cuenta esto Bemporad et al. (2001) demuestran que:

La solucion del problema (2.61) es lineal a trozos y se puede expresar en forma

explıcita, es decir:

u(t) = Fix(t) + gi si x(t) ∈ Xi , x : Tix ≤ Si i = 1, · · · , s (2.64)

donde X , ∪si=1Xi es el conjunto de estados donde las restricciones son factibles

mediante la resolucion de 2N problemas mp-MILP.

La solucion del problema (2.62) es lineal a trozos y se puede expresar en la forma

explıcita (2.64) mediante la resolucion de 2 problemas mp-MILP.

Contrariamente a lo que podrıa pensarse, resolver los 2 problemas mp-MILP necesar-

ios para obtener la solucion explıcita de (2.62) es mas costoso (debido al tamano) que

resolver los 2N necesarios para el problema (2.61). Los metodos para resolver proble-

mas mp-MILP se basan fundamentalmente en emplear tecnicas de branch and bound

(Acevedo and Pistikopoulos, 1997), o en descomponer el problema en un subproblema

de programacion lineal multiparametrica (mp-LP) y otro subproblema de programacion

lineal mixta entera en el que los parametros se consideran variables de decision (Dua

and Pistikopoulos, 2000). En cualquier caso, la obtencion de la forma (2.64) conlleva

una gran cantidad de calculos, aunque en tiempo real el calculo de la ley de control

no requerira mas tiempo del necesario para determinar en que region del espacio de

estados se encuentra el estado en cada instante.

2.11. Conclusiones

En este capıtulo se ha presentado una vision general de las diversas formas de control

predictivo mın-max. Aunque se ha pasado revista a los trabajos mas significativos no

se ha pretendido cubrir todos los trabajos publicados en revistas o actas de congresos.

Considerando los trabajos descritos, es evidente que la idea original de Campo and

Morari (1987) se ha desarrollado a lo largo de un proceso en el cual partiendo de la

formulacion original, se busco su extension a otras formas de representar los procesos y

otros tipos de funciones de coste, mientras que con el objetivo de garantizar un mejor

control se presentaron estrategias adaptativas que combinaban el control mın-max con

56 CONCLUSIONES

tecnicas de identificacion robusta. Desgraciadamente se comprobo que la formulacion

mın-max por sı misma no garantiza la estabilidad en bucle cerrado del sistema a la

vez que resulta ser una ley de control muy conservadora. Por ello las formulaciones

mas recientes del MMMPC buscan garantizar la estabilidad, ya sea con formulaciones

de horizonte infinito, invariantes robustos, restricciones contractivas, etc . . . Por otra

parte se ha buscado reducir el exceso de conservadurismo incorporando al proceso de

optimizacion la nocion de bucle cerrado, existiendo diversas variantes. Para muchos

autores, a raız del trabajo de Kothare et al. (1996), el MMMPC no implica forzosa-

mente la resolucion de un problema mın-max, sino que se puede sustituir por una cota

conservadora del coste para el peor caso formulada a base de LMIs. De esta man-

era se evita tener que pagar el elevado coste computacional tradicionalmente asociado

a las formulaciones MMMPC. Este problema ha sido atacado de manera muy difer-

ente por Bemporad et al. (2001), quienes aplicando los resultados de la programacion

multiparametrica, proporcionan un procedimiento para dar la solucion explıcita de

controladores basados en la norma 1 o ∞.

Capıtulo 3

Min-Max MPC con incertidumbres

globales acotadas

3.1. Introduccion

En el capıtulo anterior se presento una perspectiva general de los diversos tipos

de estrategias de control predictivo que se basan en un problema de optimizacion

mın-max. En este capıtulo se presenta la estrategia de control predictivo mın-max

con incertidumbres globales acotadas (Camacho and Bordons, 1995). Esta estrategia

parte de una descripcion de las incertidumbres que es simple de implementar pero

posee una gran capacidad para describir todo tipo de incertidumbres o perturbaciones,

imponiendose como unico requisito que esten acotadas por valores conocidos. Una de

las caracterısticas mas apreciables de este tipo de MMMPC es que ofrece la posibilidad

real de implementar la ley de control sobre procesos cuyas dinamicas no sean demasiado

rapidas, pues la parte ((max)) del problema de optimizacion solo requiere de la evaluacion

del peor caso sobre una lista finita de realizaciones extremas de la incertidumbre. Esto

no quiere decir sin embargo, que sea un problema trivial de resolver, pues como se

vera a lo largo de este capıtulo, el numero de casos a considerar para decidir cual es el

peor crece de manera exponencial con el horizonte de prediccion. Otra caracterıstica

de esta estrategia es que se pueden considerar restricciones en la optimizacion como en

el control predictivo estandar.

La estrategia de MMMPC con incertidumbres globales (o aditivas) acotadas se for-

mula originalmente en una descripcion de entrada-salida (Camacho and Berenguel,

1997), pero se puede emplear tambien en descripciones en espacio de estados (Scokaert

57

58 MIN-MAX MPC CON INCERTIDUMBRES GLOBALES ACOTADAS

and Mayne, 1998). Cuando se emplea como modelo de prediccion un modelo lineal

en descripcion entrada-salida es comun optar entre un modelo de incertidumbres in-

tegradas o no integradas. Como se vera en este capıtulo, es deseable utilizar el primero,

pues la ley de control resultante es capaz de rechazar perturbaciones en escalon. Sin

embargo eso conlleva emplear predicciones inestables en bucle abierto que causan prob-

lemas de factibilidad cuando se consideran restricciones sobre la salida del proceso. En

este capıtulo se justificara la necesidad de usar incertidumbres aditivas integradas y

se propondra una forma para solventar los problemas de factibilidad, a los que se ha

aludido antes, mientras se retiene la capacidad para rechazar perturbaciones en escalon.

El capıtulo esta organizado de la siguiente manera: en primer lugar se presenta la

estrategia de control Min-Max MPC con incertidumbres globales acotadas, primero

sin restricciones y posteriormente con restricciones. Despues se analiza la necesidad

de emplear una formulacion incremental y se muestran los problemas que conlleva.

Posteriormente se propone una solucion a esos problemas y finalmente, se ilustra como

esa solucion ayuda a resolver los problemas antes mencionados.

3.2. Min-Max MPC con incertidumbres globales

acotadas

El funcionamiento del MPC consiste en calcular la secuencia de futuras acciones

de control u(t), u(t + 1), . . . , u(t + Nu − 1), de tal manera que las predicciones a j

pasos y(t+ j|t) se acerquen lo mas posible a la secuencia de valores futuros del punto

de consigna w(t), w(t + 1), . . . , w(t + N2 − 1) a lo largo del horizonte de prediccion.

La bondad de la solucion alcanzada se considerara mediante una funcion de coste J

que dependera de los valores presentes y pasados de las salidas, senales de control e

incertidumbres.

Si en el calculo de la secuencia de actuaciones se consideran de manera explıcita

incertidumbres, el control obtenido serıa mas robusto si el controlador considerase la

peor situacion posible, es decir, si se resolviese el siguiente problema mın-max:

mınu

maxθ∈Θ

J(θ, u) (3.1)

donde θ representa la secuencia de futuros valores de la incertidumbre. El problema

(3.1) se puede reescribir como:

mınu

maxθ∈Θ

J(θ, u) = mınuJ∗(u) (3.2)

CAPITULO 3. MIN-MAX MPC CON INCERTIDUMBRES GLOBALES ACOTADAS 59

con:

J∗(u) = maxθ∈Θ

J(θ, u) (3.3)

siendo Θ = θ ∈ Rn : θ ≤ θ ≤ θ. La funcion J∗(u) es el maximo de los posibles

valores de la funcion objetivo J(θ, u), la cual mide la bondad del seguimiento de la

referencia por parte de la salida del proceso. La forma mas usual de J(θ, u) es un

criterio cuadratico:

J(θ, u) = E

N2∑

j=N1

(y(t+ j|t) − w(t+ j))2 + λ

Nu∑

j=1

(∆u(t+ j − 1))2

(3.4)

donde: ∆ = 1−z−1,N1 y N2 definen el comienzo y final del horizonte de prediccion, Nu

es el horizonte de control, y(t+j|t) es la prediccion de la salida cuando la incertidumbre

vale θ y E· indica la esperanza matematica. En la literatura especializada se pueden

encontrar esquemas similares que usan otros tipos de funcion objetivo, por ejemplo

basados en la norma ∞−∞ (Campo and Morari, 1987) o 1 −∞ (Allwright, 1994).

Cuando se emplea la tecnica de incertidumbres globales acotadas se asume que todos

los errores de modelado se agrupan en un vector de parametros, de tal manera que la

dinamica de la planta se puede describir mediante la siguiente familia de modelos:

y(t+ 1) = f(y(t), . . . , y(t− nna), u(t), . . . , u(t− nnb

)) + θ(t) (3.5)

En (Camacho and Bordons, 1999) se muestra como se puede relacionar esta tecnica con

otros tipos de descripcion de incertidumbres. Es importante mencionar que, aunque la

notacion no lo ponga de manifiesto, la incertidumbre puede ser funcion tambien del

estado.

Podrıa argumentarse que este tipo de incertidumbres son esencialmente perturba-

ciones. Sin embargo, es de destacar que no se esta imponiendo sobre el valor que toman

las incertidumbres ninguna restriccion mas alla de exigir que esten acotadas. Por tanto,

podrıan ser funcion de valores pasados, es decir, presentar cierta dinamica (que podrıa

ser lineal o no, estable o inestable, etc . . . ) , por lo que no se pueden considerar como

simples perturbaciones. En cualquier caso una perturbacion aditiva tambien estarıa

perfectamente descrita por este tipo de incertidumbres.

Cuando el modelo de prediccion que se considera en (3.5) es lineal, es frecuente

utilizar como descripcion un modelo CARMA que viene dado por:

A(z−1)y(t) = z−dB(z−1)u(t− 1) + C(z−1)e(t) (3.6)

o un modelo CARIMA:

A(z−1)y(t) = z−dB(z−1)u(t− 1) + C(z−1)e(t)

∆(3.7)


donde y(t) y u(t) son las secuencias de salidas y actuaciones, d es el tiempo muerto del

sistema, e(t) es un ruido blanco de media nula y A,B y C son polinomios en z−1:

A(z−1) = 1 + a1z−1 + a2z

−2 + · · · + anaz−na

B(z−1) = b0 + b1z−1 + b2z

−2 + · · · + bnbz−nb

C(z−1) = 1 + c1z−1 + c2z

−2 + · · · + cncz−nc

El segundo tipo es mas apropiado cuando se pretende que se rechacen perturbaciones

no estacionarias, esto es, cuando se desea que haya rechazo de perturbaciones en escalon

(Clarke et al., 1987).

Los modelos CARMA y CARIMA se pueden extender para considerar explıcita-

mente las perturbaciones o incertidumbres en el modelo de prediccion. Como resultado

se obtienen los siguientes modelos de prediccion que pueden ser usados en una estrategia

de control Min-Max MPC con incertidumbres aditivas:

A(z−1)y(t) = z−dB(z−1)u(t− 1) + θ(t) θ(t) ∈ Θ (3.8)

A(z−1)y(t) = z−dB(z−1)∆u(t− 1) + θ(t) θ(t) ∈ Θ (3.9)

con A(z−1) = ∆A(z−1). Estos modelos de prediccion se conocen como modelos de

prediccion con incertidumbres integradas (3.9) o no integradas (3.8). Un MMMPC que

utiliza un modelo de prediccion con incertidumbres integradas se dice que adopta una

formulacion incremental. Por contra una formulacion no incremental es aquella que

utiliza un modelo del tipo (3.8). Tal y como se vera a lo largo del capıtulo, cada una

de estas formulaciones presenta ventajas e inconvenientes.

Como se ha mencionado anteriormente, la secuencia optima de actuaciones se ob-

tiene resolviendo el problema (3.1). Para ello es necesario formular la prediccion optima

de y(t + j) para j = N1, · · · , N2. En lo sucesivo se considerara la formulacion incre-

mental pues, como se justifica en este capıtulo, es la mas apropiada al poder rechazar

perturbaciones en escalon. Para ello considerese la siguiente ecuacion Diofantica:

1 = Ej(z−1)A(z−1) + z−jFj(z

−1) (3.10)

Los polinomios Ej y Fj estan definidos unıvocamente y son de grado j−1 y na respec-

tivamente. Se pueden obtener dividiendo 1 entre A(z−1) hasta que el resto se pueda

factorizar como z−jFj(z−1). El cociente de esa division es el polinomio Ej(z

−1).

Si se multiplica la ecuacion (3.9) por Ej(z−1)zj se obtiene:

A(z−1)Ej(z−1)y(t+ j) = Ej(z

−1)B(z−1)∆u(t+ j − d− 1) + Ej(z−1)θ(t+ j)


Teniendo en cuenta la ecuacion Diofantica (3.10) lo anterior se puede expresar como:

(1 − z−jFj(z−1))y(t+ j)=Ej(z

−1)B(z−1)∆u(t+ j − d− 1) + Ej(z−1)θ(t+ j)

que se puede reescribir como:

y(t+ j) = Fj(z−1)y(t) + Ej(z

−1)B(z−1)∆u(t+ j − d− 1) + Ej(z−1)θ(t+ j)

Por tanto la mejor prediccion de y(t+ j) es:

y(t+ j|t) = Gj(z−1)∆u(t+ j − d− 1) + Ej(z

−1)θ(t+ j) + Fj(z−1)y(t)

con Gj(z−1) = Ej(z

−1)B(z−1).

Los polinomios Ej y Fj se pueden obtener de manera recursiva (Clarke et al., 1987),

aunque existen otras formas (Albertos and Ortega, 1989). Considerense los polinomios

Ej y Fj, los cuales como se ha visto en la ecuacion (3.10) provienen de la division de

1 entre A(z−1):

Fj(z−1) = fj,0 + fj,1z

−1 + fj,2z−2 + · · · + fj,naz

−na

Ej(z−1) = ej,0 + ej,1z

−1 + ej,2z−2 + · · · + ej,j−1z

−(j−1)

Considerense ahora los polinomios Ej+1 y Fj+1. Estos se obtendran dividiendo 1

por A(z−1) hasta que el resto se pueda factorizar como z−(j+1)Fj+1(z−1) con:

Fj+1(z−1) = fj+1,0 + fj+1,1z

−1 + fj+1,2z−2 + · · · + fj+1,naz

−na

Para obtener Ej+1 y Fj+1 solo hay que dar un paso mas en la division que hay que

hacer para obtener Ej y Fj. Eso quiere decir que podemos obtener el polinomio Ej+1

mediante:

Ej+1(z−1) = Ej(z

−1) + ej+1,jz−j

siendo ej+1,j = fj,0.

Por otra parte los coeficientes del polinomio Fj+1 se calculan usando:

fj+1,i = fj,i+1 − fj,0ai+1 para i = 0, · · · , na− 1

fj+1,na = −fj,0ana+1

y el polinomio Gj+1 = Ej+1B se obtiene recursivamente como:

Gj+1 = Gj + fj,0z−jB


con lo que los j primeros coeficientes de Gj+1 seran identicos a los de Gj y el resto

vendran dados por:

gj+1,j+i = gj,j+i + fj,0bi para i = 0, · · · , nb

Tal y como se indica en (Camacho and Bordons, 1999) una eleccion natural de los

horizontes de control es tomar N1 = d+ 1, N2 = d+N con Nu = N . Con esta eleccion

se considera el siguiente grupo de N predicciones:

y(t+ d+ 1|t) = Gd+1∆u(t) + Ed+1θ(t+ d+ 1) + Fd+1y(t)

y(t+ d+ 2|t) = Gd+2∆u(t+ 1) + Ed+2θ(t+ d+ 2) + Fd+2y(t)...

y(t+ d+N |t) = Gd+N∆u(t+N − 1) + Ed+Nθ(t+ d+N) + Fd+Ny(t)

que se pueden reescribir como:

y = Gu+ Eθ + F (z−1)y(t) +G′(z−1)∆u(t− 1) (3.11)

donde:

y =

y(t+ d+ 1|t)

y(t+ d+ 2|t)...

y(t+ d+N |t)

u =

∆u(t)

∆u(t+ 1)...

∆u(t+N − 1)

G =

g0 0 · · · 0

g1 g0 · · · 0...

......

...

gN−1 gN−2 · · · g0

E =

e0 0 · · · 0

e1 e0 · · · 0...

......

...

eN−1 eN−2 · · · e0

θ =

θ(t+ d+ 1)

θ(t+ d+ 2)...

θ(t+ d+N)

F (z−1) =

Fd+1(z−1)

Fd+2(z−1)

...

Fd+N(z−1)

G′(z−1) =

(Gd+1(z−1) − g0)z

(Gd+2(z−1) − g0 − g1z

−1)z2

...

(Gd+N(z−1) − g0 − g1z−1 − · · · − gN−1z

−(N−1))zN

Se observa que los dos ultimos terminos de (3.11) dependen solo de valores pasados de

las entradas y salidas, por lo que se pueden agrupar y expresar en forma condensada

como:

y = Guu+Gθθ + f

donde Gu = G, Gθ = E y el vector f representa la respuesta libre del sistema, la cual

es cero si las condiciones iniciales son cero. Los coeficientes de la primera columna Gu


se pueden calcular como la secuencia y(t+ d+ 1),y(t+ d+ 2),. . . ,y(t+ d+N) cuando

se aplica un escalon unitario al sistema. Por otra parte el termino de la respuesta libre

se puede calcular de manera recursiva como:

fj+1 = z(1 − A(z−1))fj +B(z−1)∆u(t− d+ j)

con f0 = y(t) y ∆u(t+j) = 0 para j ≥ 0 (pues este termino solo depende de los valores

pasados de la salida y de la senal de control). Por otra parte teniendo en cuenta (3.11)

es facil ver que el termino de respuesta libre se puede expresar como el producto de

una matriz por un vector que contiene las salidas y entradas pasadas, por lo que las

predicciones se pueden expresar en forma condensada como:

y = Guu+Gθθ + Fxx (3.12)

donde Fx = [F G′] y x representa el estado del proceso formado por los valores presentes

y pasados de las salidas y de los valores pasados de las entradas:

x = [y(t) · · · y(t− na)∆u(t− 1) · · ·∆u(t− nb)]T

Con esas predicciones optimas la funcion de coste (3.4) se puede expresar como:

J(θ, u) = (Guu+Gθθ + Fxx− w)T (Guu+Gθθ + Fxx− w) + λuTu (3.13)

donde w es un vector que contiene los valores futuros para la referencia:

w =[

w(t+N1) · · · w(t+N2)]T

A continuacion se estudiaran una serie de propiedades que son muy importantes

a la hora de resolver el problema de optimizacion (3.1). Para ello, y sin perdida de

generalidad, considerese que el objetivo es regular la salida del sistema a cero, es decir

w(t + j) = 0 para j = N1 · · ·N2. Teniendo en cuenta esto en la expresion (3.13) y

operando se llega a:

J(θ, u) = uTMuuu+ θTMθθθ + 2θTMθuu+ 2MTufu+ 2MT

θfθ + xTF Tx Fxx (3.14)

donde Muu = GTuGu + λI, Mθθ = GT

θ Gθ, Mθu = GTθ Gu, Muf = GT

uFxx, Mθf = GTθ Fxx.

De la ecuacion (3.14) se desprende que la funcion J ∗ definida en (3.3) se puede

expresar como el maximo de una funcion que es cuadratica en θ para cada valor de u:

J∗(u) = maxθ∈Θ

θTMθθθ +M ′θ(u)θ +M ′(u) (3.15)

donde M ′θ(u) = 2(MT

θf + uTMTθu) y M ′(u) = uTMuuu+ 2MT

ufu+ xTF Tx Fxx. Gθ es una

matriz triangular inferior que tiene todos los elementos de la diagonal principal igual

64 FORMULACION DEL MMMPC CON RESTRICCIONES

a uno, lo que implica que Mθθ es una matriz definida positiva. Por otra parte, esta

propiedad supone que la funcion J∗ es estrictamente convexa (vease el teorema 3.3.8

de (Bazaraa and Shetty, 1979)) y por ello el maximo de J se alcanzara en uno de los

vertices del politopo Θ (vease el teorema 3.4.6 de (Bazaraa and Shetty, 1979)).

La funcion J∗ es una funcion cuadratica a trozos de u (Gutierrez and Camacho,

1995), por tanto, podemos establecer una particion de U en diferentes regiones Up de

tal manera que para u ∈ Up el maximo del funcional J se alcanza para el vertice θp.

En esa region Up se puede expresar J∗ como una funcion de u:

J∗(u) = uTMuuu+M∗u(θp)u+M ∗(θp)

donde M∗u(θp) = 2(θT

p Mθu +MTuf ) y M ∗(θp) = θT

p Mθθθp +2MTθfθp +xTF T

x Fxx. La matriz

hessiana de la funcion J∗(u) es Muu la cual es definida positiva para valores positivos

de λ. Esto implica que la funcion es convexa (vease el teorema 3.3.8 de (Bazaraa and

Shetty, 1979)) y ademas que existe un unico mınimo (vease el teorema 3.4.2 de (Bazaraa

and Shetty, 1979)). De esta manera se evita uno de los principales problemas que es el

de la existencia de mınimos locales. A pesar de eso, para determinar en que vertice se

alcanza el maximo hay que visitarlos todos por lo que la complejidad computacional

del problema mın-max es muy grande. Por tanto, para valores tıpicos del horizonte

de control es imposible pensar en implementaciones en tiempo real para procesos con

dinamicas rapidas.

Finalmente hay que mencionar que el hecho de que la funcion J ∗ sea convexa en

u, no garantiza que sea necesariamente diferenciable. Esto hace que el problema de

optimizacion sea mas difıcil de resolver, y que por ejemplo metodos numericos populares

como los gradenciales no se puedan usar para resolver el problema mın-max. Otros

metodos como la busqueda lineal de Nelder-Mead sı se pueden usar, pero tienen el

inconveniente de que son mucho mas costosos desde el punto de vista computacional.

3.3. Formulacion del MMMPC con restricciones

Una de las caracterısticas mas apreciadas del control predictivo es su capacidad para

considerar restricciones en el calculo de la senal de control. Fundamentalmente se habla

de restricciones blandas y duras. Una restriccion blanda se puede violar (sobrepasar) en

cierta medida, aunque al resolver el problema de optimizacion se buscara que la solucion

la respete. Hay diferentes maneras de implementar restricciones blandas (Scokaert and

Rawlings, 1999). La forma mas sencilla es introducir variables de holgura no negativas

y diferentes de cero solo si las restricciones son sobrepasadas. El valor de esas variables


de holgura esta fuertemente penalizado en la funcion de coste. Esto ocasiona que la

solucion tienda a respetar en lo posible la restriccion, minimizandose el margen por el

que se sobrepasa. Las restricciones duras por otra parte, son aquellas que no se pueden

violar de ninguna manera. Un problema de programacion cuadratica con restricciones

blandas es equivalente a uno con restricciones duras, pero con mas variables. Por esta

razon, las estrategias de control se suelen estudiar con restricciones duras solamente.

Cuando se consideran restricciones duras en el problema mın-max, la ley de control

se obtendra resolviendo:

mınu∈U

maxθ∈Θ

J(θ, u) (3.16)

donde U es un conjunto convexo de soluciones factibles que vendra definido por Au ≤ b.

Las restricciones mas habituales a tener en cuenta son aquellas que se imponen sobre

el incremento en la senal de control, la amplitud de la senal de control y la salida del

proceso. Estas restricciones se formulan como:

u ≤ u(t) − u(t− 1) ≤ u

U ≤ u(t) ≤ U

y ≤ y(t) ≤ y

Teniendo en cuenta las ecuaciones de prediccion y la formulacion incremental:

1u ≤ ∆u(t) ≤ 1u

1U ≤ T∆u(t) + u(t− 1)1 ≤ 1U

1y ≤ G∆u(t) +Gθθi + Fxx ≤ 1y

donde 1 es un N vector cuyos componentes son todos uno y T es una matriz triangular

inferior de unos y dimensiones N×N . Por otra parte la restriccion sobre la salida debe

verificarse para cualquier realizacion extrema de la incertidumbre, significando esto que

la restriccion de la salida debe replicarse una vez por cada posible realizacion extrema

de la incertidumbre, esto es, i variara de 1 hasta 2N2 . No obstante esto no implica que

se hayan de considerar 2N2 vectores de restricciones para la salida, ya que se pueden

descartar las restricciones redundantes, explorando cada componente de cada vector y

reteniendo las mas restrictivas. Ası se tendra un solo vector de restricciones.

Las restricciones anteriormente consideradas se pueden escribir en forma condensa-

da como:

Ru ≤ cθ + Fx (3.17)

66 EJEMPLOS

con:

R =

IN×N

−IN×N

T

−T

G

−G

cθ =

1u

−1u

1U − 1u(t− 1)

−1U + 1u(t− 1)

1y −Gθθi

−1y +Gθθi

F =

0

0

0

0

−Fx

Fx

La ley de control MMMPC con restricciones se calculara resolviendo en cada instante

el problema mın-max:

mınu

maxθ∈Θ

J(θ, u) (3.18)

s.a.

Ru ≤ cθ + Fx

3.4. Ejemplos

A continuacion se presentaran dos ejemplos simulados de uso del MMMPC con

incertidumbres globales acotadas sobre dos sistemas tıpicos, sobre los cuales tambien

se aplicara un controlador predictivo del tipo GPC.

3.4.1. Ejemplo de MMMPC sin restricciones

En esta seccion se va a presentar el primer ejemplo simulado de aplicacion del

MMMPC. El proceso elegido es un doble integrador, cuya funcion de transferencia

viene dada por:

G(s) =1

s2

Se empleara una formulacion incremental para el MMMPC y se compararan los re-

sultados con los producidos cuando el sistema se controla con un GPC estandar. Los

horizontes empleados seran en ambos casos Nu = N2 = 4, λ = 0,9 y el tiempo de

muestreo 0,25. En el caso del MMMPC las cotas de la incertidumbre seran −0,05 y

0,05. Las predicciones en el caso del MMMPC se obtendran mediante la expresion


(3.12) con las siguientes matrices:

Gu =

0,0313 0 0 0

0,1250 0,0313 0 0

0,2813 0,1250 0,0313 0

0,5000 0,2813 0,1250 0,0313

Gθ =

1 0 0 0

3 1 0 0

6 3 1 0

10 6 3 1

Fx =

3 −3 1 0,0313

6 −8 3 0,0938

10 −15 6 0,1875

15 −24 10 0,3125

xk =

yk

yk−1

yk−2

∆uk−1

Los resultados de las simulaciones con ambos tipos de controladores se muestran en

la figura 3.1. En la simulacion se ha anadido una perturbacion aleatoria que varıa entre

−0,025 y 0,025 que es la responsable de la salida ((ruidosa)) en el caso del MMMPC

(en la simulacion del GPC no es tan evidente por la amplitud que toma la salida).

Es evidente que el GPC es incapaz de controlar la salida del proceso, la cual comien-

za a experimentar oscilaciones cada vez mas grandes. El MMMPC por contra, sı es

capaz de llevar la salida a cero, pero, debido a que el sistema es difıcil de controlar,

para mantenerlo requiere de muchos cambios en la senal de control. En ausencia de

perturbaciones la senal de control permanecerıa constante una vez alcanzado el valor

deseado. Es importante tener en cuenta que los resultados mostrados en la figura 3.1

no implican que no se pueda controlar dicho sistema con un GPC, tan solo se puede

decir que esa circunstancia se produce para esa combinacion particular de parametros

del controlador. Sin embargo, se aprecia que una de las ventajas que puede aportar el

uso del MMMPC es un control mas robusto en sistemas y circunstancias que plantean

problemas al control predictivo tradicional.

3.4.2. Ejemplo de MMMPC con restricciones

A fin de ilustrar el comportamiento de un MMMPC con restricciones considerese

el siguiente modelo de primer orden:

G(s) =0,4

s+ 1

Sobre ese sistema se van a aplicar la estrategia de control MMMPC con restricciones y

un GPC con restricciones estandar. La salida del proceso debe estar en todo momento

entre 0 y 1.1, mientras que los incrementos de control estaran acotados por 1 y −1.

Los horizontes empleados en ambos controladores seran Nu = 3, N2 = 6 y λ = 1. En el

68 EJEMPLOS

5 10 15 20 25 30 35 40 45−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

y k

(a)

5 10 15 20 25 30 35 40 45−1.5

−1

−0.5

0

0.5

1

1.5

muestras

∆ u k

(b)

Figura 3.1: Simulacion de control de un doble integrador con un MMMPC (trazo continuo) y GPC

(trazo discontinuo): a) salida del proceso b) cambios en la senal de control.


caso del controlador mın-max la incertidumbre esperada estara entre −0,01 y 0,01. El

tiempo de muestreo es 0,16 y la referencia valdra 1. A lo largo de la simulacion se va a

anadir una perturbacion aleatoria que variara entre 0.005 y −0,005 y en los instantes 30

y 60 se anade una perturbacion en escalon de amplitud −0,05 y 0,05 respectivamente.

El resultado de la simulacion se muestra en la figura 3.2. Puede apreciarse que la

salida del sistema cuando es gobernado por el MMMPC con restricciones no llega al

valor de referencia, si no que se queda por debajo con un ((offset)) permanente, aunque,

como puede observarse, se rechazan perturbaciones en escalon. La razon de ese offset es

que el controlador estima que, con los valores esperados de la incertidumbre y dadas las

restricciones que tiene sobre la senal de control, no le serıa posible evitar una violacion

de las restricciones causada por el peor caso posible si se llevara la salida a la referencia.

Por tanto, se muestra ((cauteloso)) y se mantiene por debajo del valor deseado. Eso causa

que cuando llega la perturbacion en t = 60, no se viole la restriccion, lo que sı ocurre

en el caso del GPC con restricciones. Es importante mencionar que si el GPC parece

rechazar la perturbacion mas rapido (pero sin evitar sobrepasar la restriccion) es porque

tambien se viola la restriccion sobre ∆uk. Por otra parte la perturbacion en t = 30 es

rechazada mas rapidamente por el MMMPC.

En este ejemplo se observa que con unos valores muy pequenos para las cotas de la

incertidumbre se rechazan perturbaciones mucho mas grandes, evitandose la violacion

de restricciones. Esto es un efecto de la formulacion incremental empleada, la cual con-

sidera una incertidumbre que va integrandose, por lo que aunque los valores esperados

de la incertidumbre sean muy pequenos en cada instante la contribucion total de esta

a lo largo del horizonte de prediccion es mucho mayor.

3.5. Conclusiones

En este capıtulo se ha presentado la estrategia de control MMMPC con incertidum-

bres aditivas acotadas. Es una forma de control predictivo mın-max que puede asimilar

casi cualquier forma de incertidumbre o perturbacion y que, gracias a las propiedades de

la funcion de coste, permite resolver la parte ((max)) en un numero fijo y finito de eval-

uaciones de la funcion de coste. Desafortunadamente, ese numero de evaluaciones crece

de manera exponencial con el horizonte de prediccion, aunque para valores pequenos se

puede implementar con una clase amplia de procesos (Camacho and Berenguel, 1997).

70 CONCLUSIONES

10 20 30 40 50 60 70 80 900

0.2

0.4

0.6

0.8

1

1.2

y k

(a)

10 20 30 40 50 60 70 80 90−1.5

−1

−0.5

0

0.5

1

muestras

∆ u k

(b)

Figura 3.2: Simulacion de control de un sistema de primer orden con un MMMPC con restricciones

(trazo continuo) y GPC con restricciones (trazo discontinuo): a) salida del proceso b) cambios en la

senal de control.

Apendice A

Elementos basicos del MPC

Las caracterısticas de los diversos tipos de MPC existentes vienen determinadas por

los elementos basicos empleados en el calculo de la ley de control, es decir, el modelo de

prediccion y la funcion objetivo. En este apendice se presentaran los tipos e ideas basicas

que se pueden encontrar en la literatura sobre estos elementos. Ademas se presenta una

breve descripcion del control predictivo generalizado, una de las estrategias MPC mas

populares.

A.1. Modelo de prediccion

El modelo de prediccion, llamado a veces modelo interno, es el elemento principal

del MPC, debiendo ser lo mas realista posible pero sin ser tan complejo que deje de

ser intuitivo y dificulte el analisis teorico de la ley de control resultante. El modelo de

prediccion se divide en dos partes, el modelo del proceso y un modelo de las perturba-

ciones que recoge el efecto de ruido, errores de modelado y entradas no medibles.

A.1.1. Modelo del Proceso

Se puede emplear casi cualquier tipo de modelo existente. Los mas populares son:

Modelos basados en la respuesta impulsional finita (FIR). Estos modelos son muy

populares en el mundo industrial, pero tienen el inconveniente de estar limitados

71

72 MODELO DE PREDICCION

a procesos estables. En ellos la salida del proceso esta relacionada con la entrada

por:

y(t) =N∑

i=1

hiu(t− i) = H(z−1)u(t) (A.1)

donde los coeficientes hi se obtienen midiendo la salida del proceso cuando se le

aplica un impulso unitario de amplitud igual a la del tiempo de muestreo. Este

tipo de modelo se emplea por ejemplo en el MPHC de Richalet et al. (1978).

Modelos basados en la respuesta ante escalon. Estan muy relacionados con los

FIR, aplicandose a la entrada un escalon unitario en lugar de un impulso unitario.

La salida del proceso estara relacionada con la entrada por:

y(t) = y0 +N∑

i=1

gi∆u(t− i) = y0 +G(z−1)∆u(t) (A.2)

donde ∆ = (1−z−1) y los coeficientes gi se obtienen midiendo la salida al aplicarse

el escalon. El offset y0 se suele tomar como nulo. Este tipo de modelos, que goza

de las mismas ventajas e inconvenientes que el anterior, se emplea por ejemplo

en el DMC de Cutler and Ramaker (1980).

Modelos basados en la funcion de transferencia. Estos modelos son muy populares

en el mundo academico, y pueden representar cualquier tipo de proceso, estando

la salida del proceso relacionada con la entrada por:

y(t) =B(z−1)

A(z−1)u(t) (A.3)

con:

A(z−1) = 1 + a1z−1 + a2z

−2 + · · · + anaz−na

B(z−1) = b1z−1 + b2z

−2 + · · · + bnbz−nb

Este tipo de modelos se usa por ejemplo en el GPC de Clarke et al. (1987).

Modelos en el espacio de estados. Aunque en el mundo industrial las representa-

ciones entrada-salida son las mas habituales, tambien existen controladores MPC

formulados en el espacio de estados como por ejemplo el PFC de Richalet (1992).

Un modelo en espacio de estados vendra dado por:

x(t) = Mx(t− 1) +Nu(t− 1)

y(t) = Qx(t)

Otros. A veces se emplean modelos no lineales (Ramırez et al., 1999a), mode-

los basados en redes neuronales (Tan and Cauwenberghe, 1995) o logica difusa

(Skrjanc and Matko, 1994).

APENDICE A. ELEMENTOS BASICOS DEL MPC 73

A.1.2. Modelo de las perturbaciones

Usualmente el modelo de perturbaciones toma la forma de un modelo CARIMA

(Controlled Auto-Regressive and Integrated Moving Average) en el que la diferencia

entre la salida del proceso y la calculada mediante el modelo viene dada por:

n(t) =C(z−1)e(t)

D(z−1)

donde D(z−1) incluye un integrador ∆ = 1 − z−1, e(t) es un ruido blanco de media

nula y el polinomio C(z−1), llamado polinomio coloreador es considerado generalmente

igual a 1. La ley de control resultante es capaz de rechazar perturbaciones en escalon.

Este modelo de perturbaciones se emplea por ejemplo en el GPC.

A.2. La funcion objetivo

Como se menciono en la seccion 1.1, la funcion objetivo suele tener la forma de un

criterio cuadratico en la que aparecen los errores de seguimiento predichos y el esfuerzo

de control. De manera general la funcion objetivo toma la forma:

J(u) =

N2∑

k=N1

δ(k) [y(t+ k|t) − w(t+ k)]2 + λ

Nu∑

k=1

λ(k)∆u(t+ k − 1|t)2 (A.4)

En esta funcion, N1 y N2 determinan el comienzo y el final del horizonte de prediccion,

mientras que Nu es el horizonte de control. Los dos primeros parametros marcan los

lımites de los instantes en los que es deseable que la salida siga a la trayectoria de

referencia. Si el retardo del proceso es d el valor mas razonable para N1 es d + 1. Por

otra parte, el horizonte de control Nu no tiene porque coincidir con N2, pudiendo ser

un valor menor. Esto trae como consecuencia la reduccion del numero de variables

de decision por lo que la optimizacion conllevara menos calculo. En ese caso se suele

suponer que la entrada permanece constante a partir del instante t+Nu − 1, es decir:

∆u(t+ k − 1) = 0 k > Nu

Por otra parte, los coeficientes δ(k) y λ(k) son secuencias de ponderacion que usual-

mente toman la forma:

δ(k) = αN2−k

Si 0 < α < 1 los errores futuros mas lejos de t tienen mas peso, dando lugar a un

control mas suave. Si α > 1 el error en los instantes mas cercanos a t tiene mas peso,

por lo que el control sera mas rapido.

74 CONTROL PREDICTIVO GENERALIZADO

Finalmente hay que destacar que la trayectoria de referencia w(t + k) no tiene

porque coincidir con el punto de consigna (set point), empleandose generalmente una

trayectoria que parte del valor de la salida en t y se aproxima suavemente al valor del

punto de consigna, generalmente con una dinamica de primer orden:

w(t) = y(t) w(t+ k) = αw(t+ k − 1) + (1 − α)r(t+ k) k = 1, · · · , N

con 0 < α < 1.

A.3. Control Predictivo Generalizado

El Control Predictivo Generalizado (GPC) (Clarke et al., 1987) es uno de los tipos

mas populares de MPC. La estrategia de control predictivo mın-max con incertidum-

bres globales acotadas se basa en el esquema del GPC, el cual emplea un modelo de

prediccion del tipo CARIMA:

A(z−1)y(t) = B(z−1)z−du(t− 1) + C(z−1)e(t)

∆

Las predicciones optimas se obtienen resolviendo una ecuacion Diofantica, de manera

que estas se pueden expresar en forma condensada como:

y = Guu+ f (A.5)

donde u es el vector de incrementos de control, y el vector de salidas predichas y f es el

vector de la respuesta libre del sistema, es decir, la parte de la salida que solo depende

de los valores pasados de la senal de control y de salida. Teniendo en cuenta esto, la

funcion objetivo (A.4) suponiendo δ(k) = 1 y λ(k) constante puede reescribirse como:

J(u) = (Guu+ f − w)T (Guu+ f − w) + λuTu (A.6)

donde w es el vector de valores futuros de la trayectoria de referencia. A su vez, esto

se puede reescribir como:

J(u) =1

2uTHu+ bTu+ f0 (A.7)

siendo:

H = 2(GTuGu + λI)

bT = 2(f − w)Gu

f0 = (f − w)T (f − w)

APENDICE A. ELEMENTOS BASICOS DEL MPC 75

Suponiendo que no se consideran restricciones, existe una solucion analıtica facil de

calcular diferenciando (A.7) obteniendose la secuencia optima de control como:

u∗ = −H−1b (A.8)

Por otra parte si se consideran restricciones, es posible encontrar una particion del

espacio de estado del proceso (formado en este caso por las entradas y salidas pasadas)

en regiones donde la ley de control tiene una expresion analıtica, por lo que la ley de

control es lineal a trozos (Bemporad et al., 2000b). Tradicionalmente sin embargo, se

ha calculado la senal de control resolviendo el problema de programacion cuadratica

(QP) mediante metodos numericos. Tal y como se muestra en (Camacho, 1993) es

posible encontrar la solucion del problema QP de manera muy eficiente, resolviendo el

problema lineal complementario (LCP) mediante el algoritmo de Lemke.

76 CONTROL PREDICTIVO GENERALIZADO

Bibliografıa

Acevedo, J. and E.N. Pistikopoulos (1997). A multiparametric programming approach

for linear process engineering problems under uncertainty. Industrial Engineering

Chemical Research 36, 717–728.

Albertos, P. and R. Ortega (1989). On Generalized Predictive Control: Two Alternative

Formulations. Automatica 25(5), 753–755.

Allwright, J.C. (1994). Advances in Model-Based Predictive Control. Chap. On min-

max Model-Based Predictive Control. Oxford University Press.

Allwright, J.C. and G.C. Papavasilou (1991). A Reduced-Size LP Formulation for Ro-

bust MPC using Impulse Responses. In: Proc. 30th IEEE Conference on Decision

and Control.

Allwright, J.C. and G.C. Papavasilou (1992). On Linear Programming and Robust

Model-Predictive Control using Impulse-Responses. Systems and Control Letters

18, 159–164.

Badgwell, T. (1997). Robust Model Predictive Control of Stable Linear Systems. In-

ternationa Journal of Control 68, 797–818.

Batina, I., A.A. Stoorvogel and S. Weiland (2001). Feedback Model Predictive Con-

trol by Randomized Algorithms. In: Proc. European Control Conference, ECC’01.

pp. 3185–3189.

Bazaraa, M.S. and C.M. Shetty (1979). Nonlinear Programming. Theory and Algo-

rithms. John Wiley & Sons.

Bellman, R. (1961). Adaptive Control Processes - A guided tour. Princeton University

Press.

Bemporad, A., F. Borrelli and M. Morari (2000a). Explicit Solution of LP-based Model

Predictive Control. In: Proc. 39th IEEE Conf. on Decision and Control.

77

78 BIBLIOGRAFIA

Bemporad, A., F. Borrelli and M. Morari (2001). Robust Model Predictive Con-

trol: Piecewise Linear Explicit Solution. In: Proc. European Control Conference,

ECC’01.

Bemporad, A., M. Morari, V. Dua and E.N. Pistikopoulos (2002). The Explicit Linear

Quadratic Regulator for Constrained Systems. Automatica 38, 3–20.

Bemporad, A., M. Morari, V.Dua and E.N. Pistikopoulos (2000b). The Explicit So-

lution of Model Predictive Control via Multiparametric Quadratic Programming.

In: Proc. American Control Conference.

Bemporad, Alberto (1998). Reducing conservativeness in predictive control of con-

strained systems with disturbances. In: Proceedings of the 37th IEEE Conference

on Decision and Control. pp. 1384–1389.

Blanchini, F. (1999). Set Invariance in Control. Automatica 35, 1747–1767.

Bland, R., D.Goldfarb and M. Todd (1981). The ellipsoid method: a survey. Operations

Research 29(6), 1039–1091.

Bordons, C. and E.F. Camacho (1998). A Generalized Predictive Controller for a Wide

Range of Industrial Processes. IEEE Transactions on Control Systems Technology

6(3), 372–387.

Boyd, S., L.E. Ghaoui, E. Feron and V. Balakrishnan (1994). Linear matrix inequalities

in system and control theory. SIAM. Philadelphia.

Camacho, E. F. and Manuel Berenguel (1997). Robust Adaptive Model Predictive

Control of a Solar Plant with Bounded Uncertainties. International Journal of

Adaptive and Signal Processing 11, 311–325.

Camacho, E.F. (1993). Constrained Generalized Predictive Control. IEEE Transactions

on Automatic Control 38(2), 327–332.

Camacho, E.F. and C. Bordons (1995). Model Predictive Control in the Process Indus-

try. Springer-Verlag.

Camacho, E.F. and C. Bordons (1999). Model Predictive Control. Springer-Verlag.

Campo, P.J. and M. Morari (1987). Robust Model Predictive Control. In: Proc. Amer-

ican Control Conference. pp. 1021–1026.

Casavola, A., M. Giannelli and Edoardo Mosca (1999). Global Predictive Regulation

of Null-Controllable Input-Saturated Linear Systems. IEEE Transactions on Au-

tomatic Control 44, 2226–2230.

BIBLIOGRAFIA 79

Casavola, A., M. Giannelli and Edoardo Mosca (2000). Min-Max Predictive Control

strategies for input-saturated polytopic uncertain systems. Automatica 36, 125–

133.

Clarke, D.W., C. Mohtadi and P.S. Tuffs (1987). Generalized Predictive Control - part

I. The basic algorithm. Automatica 23(2), 137–148.

Coales, J.F. and A.R.M. Noton (1956). An on-off servo mechanism with predicted

change-over. Proc. Institution of Electrical Engineers, Part B 103, 449–462.

Cutler, C.R. and B.C. Ramaker (1980). Dynamic Matrix Control - A Computer Control

Algorithm. In: Proc. American Control Conference.

Cuzzola, F. A., J. C. Geromel and M. Morari (2001). An improved approach for con-

strained robust Model Predictive Control. In: Proc. European Control Conference,

ECC’01, Aceptado en Automatica. pp. 3759–3764.

Dua, V. and E.N. Pistikopoulos (2000). An algorithm for the solution of multipara-

metric mixed integer linear programming problems. Annals of Operations Research

99, 123–139.

Gal, T. (1979). Postoptimal analyses, parametric programming and related topics.

McGraw-Hill.

Gal, T. and J.Nedoma (1972). Multiparametric Linear Programming. Management

Science 18(7), 406–422.

Geromel, J.C., P.L.D. Peres and J. Bernoussou (1991). On a convex parameter space

method for linear control design of uncertain systems. SIAM Journal of Control

and Optimisation 29(2), 381–402.

Gomez-Ortega, J. and E. F. Camacho (1994). Neural network GPC for mobile robots

path tracking. Robotics and Computer Integrated Manufacturing 11(4), 271–278.

Gomez-Ortega, J., D.R. Ramırez, D. Limon-Marruedo and E.F. Camacho (2001). Ge-

netic Algorithms Based Predictive Control for Mobile Robot Navigation in Chang-

ing Environments. In: Proc. European Control Conference, ECC’01. pp. 3179–

3184.

Gutierrez, A.J. and E. F. Camacho (1995). Robust Adaptive Control for Processes

with Bounded Uncertainties. In: Proc. Third European Control Conference. Vol. 2.

Rome. pp. 1295–1300.

Kim, Y.H. and W.H. Kwon (1998). An application of min-max generalized predictive

control to sintering processes. Control Engineering Practice 6, 999–1007.

80 BIBLIOGRAFIA

Kim, Y.H., W.H. Kwon and Y.I. Lee (1998). Min-max generalized predictive control

with stability. Computers & Chemical Engineering 22(12), 1851–1858.

Kothare, M.V., V. Balakrishnan and M. Morari (1996). Robust constrained model

predictive control using linear model inequalities. Automatica 32(10), 1361–1379.

Lau, M.K., S. Boyd, R.L. Kosut and G.F. Franklin (1991). A Robust Control Design

for FIR Plants with Parameter Set Uncertainty. In: Proceedings of the 30th IEEE

Conference on Decision and Control. pp. 83–88.

Lee, J.H. and B.L. Cooley (2000). Min-max predictive control techniques for a linear

state-space system with a bounded set of input matrices. Automatica.

Lee, J.H. and Zhenghong Yu (1997). Worst-case formulations of model predictive con-

trol for systems with bounded parameters. Automatica 33(5), 763–781.

Lee, Y.I., W.H. Kwon and Y.H. Kim (1996). A robust GPC which guarantees H∞ norm

bounds and its stability properties. In: Proceedings of the 35th IEEE Conference

on Decision and Control. pp. 721–725.

Lu, Y. and Y. Arkun (2000a). Polytope updating in Quasi-Min-Max MPC algorithms.

In: Proceedings of the International Symposium on Advanced Control of Chemical

Processes, ADCHEM 2000. pp. 413–418.

Lu, Y. and Y. Arkun (2000b). Quasi-Min-Max MPC algorithms for LPV systems.

Automatica 36(4), 527–540.

Lu, Y. and Y. Arkun (2001). Scheduling Quasi-Min-Max Model Predictive Control Al-

gorithm for Nonlinear Systems. In: Proc. European Control Conference, ECC’01.

pp. 3741–3746.

Mayne, D.Q. and H. Michalska (1990). Receding horizon control of nonlinear systems.

IEEE Transactions on Automatic Control 35, 714–724.

Mayne, D.Q., J.B. Rawlings, C.V. Rao and P.O.M. Scokaert (2000). Constrained model

predictive control: Stability and optimality. Automatica 36, 789–814.

Megıas, D., J. Serrano and C. de Prada (2001). Min-Max Constrained Infinite Horizon

Model Predictive Control: Standard vs. Feedback Formulation. In: Proc. European

Control Conference, ECC’01. pp. 3765–3770.

Milliken, P., C. Marsh and B. vanBrunt (1999). Minimax controller design for a class

of uncertain nonlinear systems. Automatica 35, 583–590.

Mo, S.H. and J.P. Norton (1990). Fast and robust algorithm to compute exact polytope

parameter bounds. Math & Computers in Simulation 32, 481–493.

BIBLIOGRAFIA 81

Noh, S.B., Y.H. Kim, Y.I. Lee and W.H. Kwon (1996). A robust generalized predictive

control with terminal output weightings. International Journal of Process Control

6(2-3), 137–144.

Normey-Rico, J.E. and E.F. Camacho (1999). Robustness effects of a prefilter in a

Smith predictor-based generalised predictive controller. IEE Proceedings on Con-

trol Theory Applications 146(2), 179–185.

Norton, J.P. (1987a). Identification and Application of Bounded-Parameter Models.

Automatica 23, 497–507.

Norton, J.P. (1987b). Identification of parameter bounds for ARMAX models from

records with bounded noise. International Journal of Control 45, 375–390.

Oliveira, G., G. Favier, G. Dumont and W. Amaral (1996). Robust Predictive Con-

troller Based on Laguerre Filters Modeling. In: Proceedings of the 13th IFAC World

Congress. Vol. G. San Francisco, USA. pp. 375–380.

Oliveira, G.H.C., W.C. Amaral, G. Favier and G.A. Dumont (2000). Constrained Ro-

bust Predictive controller for uncertain processes modeled by orthonormal series

functions. Automatica 36, 563–571.

Ozkan, L., M. Kothare and C. Georgakis (2000). Model Predictive Control of nonlin-

ear systems using piecewise linear models. Computers & Chemical Engineering

24, 793–799.

Papavasilou, G.C. and J.C. Allwright (1991). A descent algorithm for a min-max prob-

lem in Model-Predictive Control. In: Proc. 30th IEEE Conference on Decision and

Control.

Propoi, A. I. (1963). Use of linear programming methods for synthesising sampled-data

automatic systems. Automation and Remote Control 24, 837–844.

Qin, S.J. and T.A. Badgwell (1996). An overview of industrial model predictive control

technology. In: Proceedings of the Conference on Chemical Process Control, CPC

V. Tahoe City, USA. pp. 232–256.

Ramırez, D.R., D. Limon-Marruedo, J. Gomez-Ortega and E.F. Camacho (1998). Ge-

netic Algorithm Approach for Nonlinear Multivariable MBPC Mobile Robot Nav-

igation. In: Proc. First NICONET Workshop on Numerical Software in Control

Engineering.

Ramırez, D.R., D. Limon-Marruedo, J. Gomez-Ortega and E.F. Camacho (1999a).

Model Based Predictive Control using Genetic Algorithms. Application to a Pilot

Plant. In: Proc. European Control Conference, ECC’99.

82 BIBLIOGRAFIA

Ramırez, D.R., D. Limon-Marruedo, J. Gomez-Ortega and E.F. Camacho (1999b).

Nonlinear MBPC for Mobile Robot Navigation using Genetic Algorithms. In: Proc.

of the International Conference on Robotics and Automation (ICRA’99).

Rawlings, J.B. and K.R. Muske (1993). The stability of constrained receding horizon

control. IEEE Transactions on Automatic Control 38, 1512–1516.

Richalet, J. (1992). Practique de la Commande Predictive. Editions Hermes.

Richalet, J., A. Rault, J.L. Testud and J. Papon (1978). Model Predictive Heuristic

Control: Application to Industrial Processes. Automatica 14(2), 413–428.

Roos, C., T. Terlaky and J.P. Vial (1997). Theory and Algorithms for Linear Opti-

mization - An Interior Point Approach. Wiley.

Savkin, A.V. and I.R. Petersen (1995). Minimax optimal control of uncertain systems

with structured uncertainty. International Journal of Robust and Nonlinear Con-

trol 5, 119–137.

Scokaert, P.O.M. and D.Q. Mayne (1998). Min-max feedback model predictive con-

trol for constrained linear systems. IEEE Transactions on Automatic Control

43(8), 1136–1142.

Scokaert, P.O.M. and J.B. Rawlings (1999). Feasibility issues in linear model predictive

control. AICHE Journal 45, 1649–1659.

Skrjanc, I. and D. Matko (1994). Advances in Model-Based Predictive Control. Chap.

Fuzzy Predictive Controller with Adaptive Gain. Oxford University Press.

Tan, Y. and A. Van Cauwenberghe (1995). Use of neural networks for nonlinear pre-

dictive control. In: 3rd European Control Conf.. pp. 2760–2765.

Tondel, P., T.A. Johansen and A. Bemporad (2001). An Algorithm for Multi-

Parametric Quadratic Programming and Explicit MPC Solutions. In: Proc. 40th

Conference on Decision and Control, CDC’2001.

Veres, S.M. (2000). Worst case dual control: basic results. International Journal of

Control 73(18), 1621–1646.

Veres, S.M. and J.P. Norton (1991). Bound-Based Worst-Case Predictive Controller.

In: Proc. IFAC Symposium on Intelligent Tuning and Adaptive Control. Singapore.

Veres, S.M. and J.P. Norton (1993). Predictive Self-Tuning Control by Parameter

Bounding and Worst Case Design. Automatica 29(4), 911–928.

BIBLIOGRAFIA 83

Wahlberg, B. and P. Makila (1996). On Approximation of Stable Linear Dynamical

Systems using Laguerre and Kautz Functions. Automatica 32(5), 693–708.

Wu, Fen (1997). LMI-based Robust Model Predictive Control Evaluated on An In-

dustrial CSTR Model. In: Proceedings of the IEEE International Conference on

Control Applications. pp. 609–614.

Zheng, A. (1995). Robust Control of systems subject to constraints. PhD thesis. Cali-

fornia Institute of Technology.

Zheng, A. and M. Morari (1993). Robust Stability of Constrained Model Predictive

Control. In: Proc. American Control Conference. Vol. 1.

Zheng, A. and M. Morari (1995). Stability of Model Predictive Control with soft con-

straints. IEEE Transactions on Automatic Control 40(10), 1818–1823.

perspectiva general del control predictivo …danirr/cursodoct.pdf · ventajas e inconvenientes del...

Documents