perspectiva general del control predictivo …danirr/cursodoct.pdf · ventajas e inconvenientes del...
TRANSCRIPT
Depto. de Ingenierıa de Sistemas y Automatica
PERSPECTIVA GENERAL DEL CONTROL PREDICTIVO
MIN-MAX
Curso de Doctorado ’Control Avanzado de Procesos Industriales’
Daniel Rodrıguez Ramırez
Indice general
Lista de figuras V
1. Introduccion 1
1.1. Introduccion al control predictivo . . . . . . . . . . . . . . . . . . . . . 1
1.2. Ventajas e inconvenientes del Control Predictivo . . . . . . . . . . . . . 5
1.3. Control Predictivo Mın-Max . . . . . . . . . . . . . . . . . . . . . . . . 6
2. Perspectiva general de los controladores Min-Max MPC 9
2.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2. Los primeros trabajos (1987-1992) . . . . . . . . . . . . . . . . . . . . . 10
2.2.1. El trabajo original de Campo y Morari (1987) . . . . . . . . . . 10
2.2.2. Mejoras y formulacion con norma 1 . . . . . . . . . . . . . . . . 12
2.2.3. Un algoritmo basado en la norma 2 . . . . . . . . . . . . . . . . 15
2.2.4. Controlador predictivo adaptativo con diseno para el peor caso
de Veres y Norton (1991) . . . . . . . . . . . . . . . . . . . . . . 17
2.3. Controladores adaptativos basados en incertidumbres globales . . . . . 19
i
ii INDICE GENERAL
2.4. Controladores predictivos robustos basados en LMIs . . . . . . . . . . . 22
2.5. Controladores Min-Max MPC con expresion analıtica . . . . . . . . . . 27
2.6. Controladores para el peor caso con parametros acotados . . . . . . . . 31
2.6.1. MMMPC con predicciones en bucle cerrado . . . . . . . . . . . 33
2.6.2. Estabilidad de las estrategias presentadas . . . . . . . . . . . . . 35
2.6.3. MMMPC en bucle abierto con incertidumbres en B . . . . . . . 36
2.6.3.1. Plantas estables . . . . . . . . . . . . . . . . . . . . . . 37
2.6.3.2. Procesos con un integrador . . . . . . . . . . . . . . . 38
2.7. Min-Max MPC en bucle cerrado de Scokaert y Mayne . . . . . . . . . . 39
2.7.1. Controlador con horizonte de prediccion variable . . . . . . . . . 43
2.8. Estrategias de control Quasi Min-Max MPC . . . . . . . . . . . . . . . 44
2.8.1. Quasi-Min-Max MPC sin restricciones . . . . . . . . . . . . . . 45
2.8.2. Quasi-Min-Max MPC con restricciones . . . . . . . . . . . . . . 47
2.8.3. Actualizacion del politopo Ω . . . . . . . . . . . . . . . . . . . . 48
2.8.4. Extension a sistemas no lineales . . . . . . . . . . . . . . . . . . 49
2.9. Controladores Min-Max MPC basados en series de funciones . . . . . . 50
2.10. Soluciones explıcitas para norma ∞ o norma 1 . . . . . . . . . . . . . . 53
2.11. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3. Min-Max MPC con incertidumbres globales acotadas 57
3.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
INDICE GENERAL iii
3.2. Min-Max MPC con incertidumbres globales acotadas . . . . . . . . . . 58
3.3. Formulacion del MMMPC con restricciones . . . . . . . . . . . . . . . . 64
3.4. Ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.4.1. Ejemplo de MMMPC sin restricciones . . . . . . . . . . . . . . 66
3.4.2. Ejemplo de MMMPC con restricciones . . . . . . . . . . . . . . 67
3.5. Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
A. Elementos basicos del MPC 71
A.1. Modelo de prediccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
A.1.1. Modelo del Proceso . . . . . . . . . . . . . . . . . . . . . . . . . 71
A.1.2. Modelo de las perturbaciones . . . . . . . . . . . . . . . . . . . 73
A.2. La funcion objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
A.3. Control Predictivo Generalizado . . . . . . . . . . . . . . . . . . . . . . 74
Bibliografıa 76
Indice de figuras
1.1. Estrategia del control predictivo. . . . . . . . . . . . . . . . . . . . . . 2
1.2. Estructura general de los controladores predictivos . . . . . . . . . . . . 4
2.1. Posibles trayectorias del estado . . . . . . . . . . . . . . . . . . . . . . 42
3.1. Simulacion de control de un doble integrador con un MMMPC (trazo
continuo) y GPC (trazo discontinuo): a) salida del proceso b) cambios
en la senal de control. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.2. Simulacion de control de un sistema de primer orden con un MMM-
PC con restricciones (trazo continuo) y GPC con restricciones (trazo
discontinuo): a) salida del proceso b) cambios en la senal de control. . . 70
v
Capıtulo 1
Introduccion
Este trabajo trata sobre las estrategias de control predictivo mın-max, las cuales
forman parte del conjunto mas amplio formado por las tecnicas de control predictivo. El
control predictivo es una de las estrategias mas populares de control por computador.
A grosso modo, el problema del control automatico en general y del control por com-
putador en particular, consiste en mantener la salida o estado de un proceso en un valor
deseado (o referencia) actuando sobre ciertas variables manipulables (o entradas). Las
principales caracterısticas y elementos del control predictivo lo son tambien del control
predictivo mın-max. Es por esto que este primer capıtulo se dedica a presentar los
conceptos basicos del control predictivo en general y del min-max en particular.
1.1. Introduccion al control predictivo
El termino control predictivo basado en modelo (MPC) se aplica a un conjunto de
estrategias de control por computador, organizadas en torno a algunas ideas comunes,
que ya desde finales de los 70 (Richalet et al., 1978; Cutler and Ramaker, 1980)1
comenzaron a atraer la atencion del mundo industrial y de la comunidad academica.
Las ideas mas importantes del control predictivo son:
1Es destacable que las ideas presentes en el MPC aparecieron mucho antes. Por ejemplo el empleo
de un modelo de prediccion y la optimizacion de una funcion objetivo pueden encontrarse en el control
en tiempo mınimo empleado en (Coales and Noton, 1956).
1
2 INTRODUCCION AL CONTROL PREDICTIVO
Salidas predichas Y (t+i t)
Variable manipulada U(t+i t)
. . . . . .
FuturoPasado
Referencia
Horizonte de controlHorizonte de predicción
t+1 t+Nu t+N
Figura 1.1: Estrategia del control predictivo.
Como su nombre indica, el MPC esta basado en un modelo del proceso a controlar,
el cual es empleado para predecir la evolucion futura del estado o de las salidas.
El modelo del proceso es conocido como modelo de prediccion. En la seccion A.1
se puede encontrar una descripcion de los tipos de modelos mas habituales. El
intervalo de tiempo (expresado en instantes de muestreo) sobre el que se predice
la evolucion de las salidas es conocido como horizonte de prediccion. Por tanto, si
el horizonte de prediccion es N , empleando el modelo de prediccion se calculara la
siguiente secuencia de predicciones de las salidas:
y(t+ 1|t), y(t+ 2|t), · · · , y(t+N |t)
Para el calculo de esta secuencia se emplea la informacion de la evolucion del
proceso hasta el instante t, es decir:
• Valores pasados de las entradas o actuaciones del proceso.
• Valores presentes y pasados de las salidas del proceso.
Tambien se emplea una secuencia de actuaciones o senales de control futuras:
u(t|t), u(t+ 1|t), · · · , u(t+N − 1|t)
Usualmente se suele considerar un horizonte de control Nu < N , de manera que
para los instantes futuros mas alla del horizonte de control se supone que la senal
de control es constante. Estos conceptos se ilustran en la figura 1.1.
La secuencia de actuaciones futuras condiciona en gran medida la evolucion futura
del proceso. Para medir la bondad del control obtenido se puede formular un
CAPITULO 1. INTRODUCCION 3
criterio o ındice de comportamiento, de manera que se puede obtener, mediante
tecnicas de optimizacion, la secuencia de actuaciones optima. Esta sera la que,
de acuerdo con el criterio elegido, proporcione el mejor control. El calculo de
la senal de control mediante la minimizacion de un ındice de comportamiento o
funcion objetivo, es otra de las ideas comunes a las tecnicas de control predictivo.
La forma de la funcion objetivo varıa de un tipo de control a otro. Una de las
formas mas populares es la de un criterio cuadratico en el que se calcula la suma
de los errores predichos (diferencia entre las salidas predichas y la trayectoria de
referencia) al cuadrado a lo largo del horizonte de prediccion. Es habitual tambien
considerar algun tipo de ponderacion del esfuerzo de control, por lo que la forma
del criterio serıa:
J(u) =N∑
k=1
(y(t+ k|t) − w(t+ k))2 + λ
N∑
k=1
u(t+ k − 1|t)2 (1.1)
donde u es la secuencia de actuaciones futuras, w(t+k) es el valor de la trayectoria
de referencia y λ es un parametro que pondera la importancia que tiene en la
optimizacion el termino del esfuerzo de control. Para mas informacion sobre los
parametros tıpicos de la funcion objetivo se remite al lector a la seccion A.2.
En vista de lo anterior el objetivo de un controlador predictivo sera obtener en
cada instante de muestreo la secuencia de actuaciones u∗ que hace mınimo el
ındice de funcionamiento, es decir:
u∗ = arg mınu∈U
J(u) (1.2)
donde U es el conjunto de secuencias de actuaciones admisibles. Este conjunto
vendra definido por restricciones sobre las entradas y salidas de la planta (las
cuales a su vez determinan restricciones sobre las entradas). Como se vera mas
adelante, la posibilidad de limitar la busqueda de la secuencia de actuaciones
mediante restricciones es una de las caracterısticas mas apreciables y genuinas
del control predictivo. En caso de no considerarse restricciones U ≡ RN .
La tercera caracterıstica fundamental de las tecnicas de control predictivo es la
aplicacion de la senal de control mediante una estrategia de horizonte deslizante.
Esta estrategia, que aparece anteriormente a las primeras estrategias de MPC
(Propoi, 1963), consiste en aplicar solo la primera de las componentes de la se-
cuencia de actuaciones calculada en (1.2), es decir u∗(t|t), descartandose el resto.
En el instante t+1 se repite el proceso de calcular la secuencia optima, aplicandose
entonces la primera componente de la secuencia obtenida, es decir u∗(t+ 1|t+ 1)
y descartandose las demas. Notese que en general, debido a que el modelo no
describe perfectamente la dinamica del proceso, u∗(t+ 1|t) 6= u∗(t+ 1|t+ 1).
Esta forma de aplicar la ley de control supone la resolucion de un problema de
control optimo en bucle abierto, cuya solucion se aplica en bucle cerrado.
4 INTRODUCCION AL CONTROL PREDICTIVO
Pasadas
-
+
Modelo
Entradas y Salidas
Función de Coste
Entradas Futuras
Salidas Predichas
Trayectoria de Referencia
Optimizador Errores Futuros
Restricciones
Figura 1.2: Estructura general de los controladores predictivos
Estas ideas determinan la estructura general empleada para la implementacion de
controladores predictivos, la cual se ilustra en la figura 1.2. En esta estructura, dos ele-
mentos fundamentales son el modelo de prediccion y el optimizador. Las caracterısticas
del problema de optimizacion vienen determinadas principalmente por la funcion obje-
tivo. En general, para resolver el problema se requerira emplear algun tipo de metodo
numerico, aunque existen casos en los que se puede obtener una expresion analıtica
de la ley de control. Esto ocurre por ejemplo, cuando el modelo es lineal, la funcion
objetivo tiene la forma de un criterio cuadratico y no se consideran restricciones ex-
plıcitamente. En el caso de considerarse restricciones, tradicionalmente, la ley de control
se ha tenido por no lineal. Por tanto en este caso, se requiere emplear metodos numeri-
cos para obtener la secuencia optima de actuaciones. Sin embargo, recientemente se
ha demostrado (Bemporad et al., 2000a; Bemporad et al., 2002) que en este caso, la
ley de control es lineal a trozos, y es posible obtener una descripcion explıcita. La
forma de obtener tal descripcion pasa por emplear algoritmos constructivos (Tondel et
al., 2001). Un inconveniente de esto es que el numero de regiones en las que se ha de
dividir el espacio de estados es muy grande. Por tanto, puede ser mas eficiente resolver
el problema numericamente.
CAPITULO 1. INTRODUCCION 5
1.2. Ventajas e inconvenientes del Control Predic-
tivo
El control predictivo es quizas la tecnica de control avanzado que mayor aceptacion
ha tenido en el mundo industrial con miles de aplicaciones (Qin and Badgwell, 1996)
la mayorıa en la industria petroquımica y de procesos. Las razones de este exito, que
no han conseguido otros tipos de control avanzado, son las numerosas ventajas que
permiten lograr un incremento en la productividad de las instalaciones donde se aplica.
Estas ventajas incluyen:
Es aplicable a practicamente cualquier tipo de proceso independientemente de
que sea estable o inestable2, de fase mınima o no mınima o tenga retardos.
De manera natural se pueden obtener formulaciones multivariables, especialmente
si se emplean modelos de prediccion de espacio de estados.
Tambien presenta de manera natural compensacion de retardos, sin tener que
recurrir a compensadores de retardos como el predictor de Smith, salvo en el
caso de existir incertidumbre en el retardo (Normey-Rico and Camacho, 1999).
Las perturbaciones medibles son facilmente compensables mediante prealimentacion.
Es capaz de aprovechar el conocimiento que se tenga sobre la evolucion de la
referencia a lo largo del horizonte de prediccion, de manera que la accion de
control tenga en cuenta los cambios de referencia antes de que se produzcan. Esto
es muy util cuando se trata de controlar procesos batch o en robotica (Gomez-
Ortega and Camacho, 1994; Ramırez et al., 1998; Ramırez et al., 1999b; Gomez-
Ortega et al., 2001).
La mayor ventaja del control predictivo sobre otras estrategias de control, es
la capacidad para considerar restricciones en las entradas y salidas del proceso
a la hora de calcular la ley de control. Esta caracterıstica es genuina de las
tecnicas de control predictivo y es la mas apreciada desde el punto de vista
industrial, en el que a veces resulta crıtico mantener las salidas del proceso dentro
de unos margenes estrechos, evitando por otra parte incurrir en saturaciones de
los actuadores.
2Algunos tipos de control predictivo basados en modelos de respuesta impulsional finita estan
limitados a procesos estables. Este es el caso del Model Algorithmic Control (MAC) (conocido inicial-
mente como Model Predictive Heuristic Control (MPHC) (Richalet et al., 1978)). Esta limitacion la
comparten los algoritmos de control predictivo basados en modelos de respuesta ante escalon como el
popular DMC (Cutler and Ramaker, 1980).
6 CONTROL PREDICTIVO MIN-MAX
Por otra parte, estas tecnicas de control presentan tambien sus inconvenientes. El
principal de ellos es que salvo en los casos mas simples, el calculo de la senal de con-
trol implica resolver mediante metodos numericos un problema de optimizacion. Esto
conlleva una carga de calculo muy superior a la que requieren las tecnicas clasicas
de control. El problema es mas acusado cuando se tienen en cuenta restricciones. Por
ello, la aplicacion de controladores predictivos ha tenido lugar principalmente en pro-
cesos con dinamicas lentas. Sin embargo en la ultima decada, los avances en tecnologıa
de computadores y metodos numericos de optimizacion convexa, han logrado que los
problemas convexos que aparecen en casi todos los metodos de control predictivo, se
puedan resolver 106 veces mas rapido (Roos et al., 1997). En cualquier caso existen
formulaciones de MPC mas eficaces que las propuestas originalmente (Camacho, 1993)
y formulaciones simplificadas para tipos de modelos concretos (Bordons and Cama-
cho, 1998).
Otra limitacion del MPC es la necesidad de disponer un modelo suficientemente
realista del proceso que no siempre es facil de obtener. El comportamiento del con-
trolador depende en gran medida de ello, aunque existen metodos para mejorarlo en
presencia de incertidumbres como las estrategias Min-Max MPC que se veran en este
trabajo.
1.3. Control Predictivo Mın-Max
Una de las limitaciones del MPC es la necesidad de contar con un modelo de predic-
cion realista, pero a la vez simple, de manera que se satisfagan los requisitos de calculo
necesarios para obtener la senal de control en tiempo real. Ademas es importante que
sea facil de obtener. La opcion mas popular consiste en emplear modelos de prediccion
lineales. El empleo de tales modelos supone que en realidad se considera una dinamica
simplificada de la planta, que aunque probablemente aproxima muy bien a la dinamica
real en torno a un punto de operacion, no puede contemplar todos los aspectos de esta.
Esto provocara diferencias entre los valores predichos y los valores reales de la salida
del proceso. Estas discrepancias seran absorbidas por la realimentacion, pero llevara a
un peor control que el obtenido si no existiesen esas diferencias, e incluso a la perdida
de estabilidad en bucle cerrado.
Para solucionar los problemas ocasionados por las discrepancias entre el modelo de
prediccion y el proceso real, se ha de considerar explıcitamente de alguna manera la
incertidumbre en el calculo de la senal de control. Aquellos sistemas de control que
consideran explıcitamente las incertidumbres de modelado se denominan sistemas de
CAPITULO 1. INTRODUCCION 7
control robustos.
Existen diversas formas de disenar el controlador MPC teniendo en cuenta la incer-
tidumbre o discrepancias entre el modelo y la planta. Una de las primeras (Campo and
Morari, 1987) es la que considera el peor caso posible de la salida. De esta manera no se
minimiza un criterio que considera el valor nominal de la salida del proceso, sino que se
minimiza el maximo de los valores que puede tomar la funcion objetivo para todos los
valores considerados de la incertidumbre, es decir, la secuencia optima de actuaciones
se calcula como:
u∗ = arg mınu∈U
maxθ∈Θ
J(u, θ) (1.3)
donde θ representa la incertidumbre y Θ es el conjunto de valores considerados de
la incertidumbre, el cual suele ser un conjunto convexo. A las estrategias de control
predictivo que descansan sobre un problema mın-max como el anterior se las conoce
como control predictivo mın-max o Min-Max MPC (MMMPC). Al igual que en el caso
del MPC nominal, no existe una forma unica de MMMPC y dependiendo del tipo de
modelo, funcion objetivo y sobre todo de la manera de representar la incertidumbre se
tendran diversos tipos de MMMPC.
Una de las formas mas empleadas para representar la incertidumbre es la tecnica
de incertidumbres globales acotadas (Camacho and Bordons, 1995). Esta tecnica, apli-
cable a cualquier tipo de modelo, consiste en suponer que la incertidumbre se puede
concentrar en un vector global de parametros de manera que la salida del proceso se
expresarıa como:
y(t+ 1) = f(y(t), · · · , y(t− nna), u(t), · · · , u(t− nnb)) + θ(t) θ(t) ∈ Θ (1.4)
donde θ(t) es el vector de incertidumbre, f representa el modelo nominal y Θ es el con-
junto de todos los posibles valores de la incertidumbre, usualmente un conjunto convexo
de la forma Θ ,
θ : θ ≤ θ ≤ θ
. Se puede argumentar que esta forma de representar
la incertidumbre se asemeja mas a una perturbacion a la salida que a incertidumbre de
modelado propiamente dicha. Sin embargo, no se hace ninguna suposicion sobre la nat-
uraleza de θ(t) mas alla de considerarse que esta siempre contenida en Θ. Puede ser una
funcion de los valores previos de la entrada o la salida o de sus propios valores pasados.
Por tanto, puede servir para describir cualquier incertidumbre en los parametros del
modelo ademas de perturbaciones no medibles. Usualmente el modelo de prediccion es
lineal, extendiendose el concepto de error presente en los modelos CARIMA, de manera
que la dinamica del proceso se representa por:
A(z−1)y(t) = B(z−1)z−du(t− 1) + C(z−1)θ(t)
∆θ(t) ∈ Θ
siendo usualmente C(z−1) = 1.
8 CONTROL PREDICTIVO MIN-MAX
Las ventajas del MMMPC sobre el MPC ((nominal)) han de buscarse en un mejor
control, cuando la dinamica no es descrita suficientemente bien por el modelo de predic-
cion. Sin embargo, el entendimiento y desarrollo del MMMPC ha estado oscurecido y
obstaculizado por el altısimo coste computacional que conlleva la resolucion del pro-
blema mın-max. Esto ha ocasionado tambien, que el numero de aplicaciones hasta el
presente sea escaso (Camacho and Berenguel, 1997). Es en este marco en el que se
encuadran las estrategias de MMMPC que se presentaran en el capıtulo 2.
Capıtulo 2
Perspectiva general de los
controladores Min-Max MPC
2.1. Introduccion
En este capıtulo se pasa revista al estado del arte de los controladores predictivos
mın-max. Estas estrategias consideran en la optimizacion las incertidumbres en el mod-
elo de prediccion, mediante el calculo de la senal de control para el peor caso posible de
la salida. Este tipo de controladores surgen a partir del trabajo de Campo and Morari
(1987). Hay que hacer notar sin embargo, que la idea de control para el peor caso no
es exclusiva ni original del control predictivo, existiendo este tipo de formulaciones en
control optimo (Savkin and Petersen, 1995), H∞ (Milliken et al., 1999) o en el control
dual (Veres, 2000).
La literatura existente en este campo es bastante mas escasa que la que se tiene, por
ejemplo, para el control predictivo no lineal. Las razones de esto habrıa que buscarlas en
la enorme potencia de calculo requerida para resolver el problema mın-max en lınea. Por
otra parte, no quedan claros los beneficios que aporta el hecho de considerar el peor caso
de la salida. De hecho, tuvieron que transcurrir anos desde que se formulo el MMMPC
original hasta que se probara mediante un contraejemplo (Zheng and Morari, 1993) que,
la estabilidad en bucle cerrado no esta garantizada por el mero hecho de considerar el
peor caso de la salida. A medida que la potencia de calculo disponible ha ido creciendo,
se ha recuperado el interes en este tipo de controladores predictivos, desarrollandose
estrategias cada vez mas complejas en las que se emplean herramientas matematicas
muy en boga como las desigualdades lineales matriciales (LMI) (Boyd et al., 1994)
9
10 LOS PRIMEROS TRABAJOS (1987-1992)
o la programacion multiparametrica (Gal, 1979). De hecho, a partir del trabajo de
Kothare et al. (1996) se han publicado muchos mas artıculos sobre el tema que en
anos precedentes, de manera que en el momento en el que se redacta este texto existen
suficientes formulaciones del MMMPC como para que este justificado dedicar este
capıtulo a describirlas.
2.2. Los primeros trabajos (1987-1992)
En esta seccion se recogen los primeros trabajos en los que se presentaron estrategias
de control predictivo mın-max. En estos trabajos el tipo de funcion objetivo determina
la facilidad de resolucion del problema mın-max. Por otra parte, en las estrategias pre-
sentadas no se garantiza de manera expresa la estabilidad en bucle cerrado del sistema,
hecho que debe ser imputado a la falta de resultados sobre el tema en el momento de
presentarse estos trabajos. Tal y como menciona Zheng (1995), en esa primera epoca los
resultados disponibles sobre estabilidad en control predictivo se referıan a la estabilidad
nominal, no a la estabilidad robusta del control predictivo.
2.2.1. El trabajo original de Campo y Morari (1987)
En 1987 fue presentada la primera estrategia de control predictivo basada en la
resolucion de un problema mın-max (Campo and Morari, 1987). En este trabajo se
empleaba una descripcion del proceso basada en la respuesta impulsional , la cual se
supone una funcion lineal de ciertos parametros θj, es decir:
Hi(θ) =
q∑
j=1
Gjθj i = 1, · · · , N (2.1)
donde θj ≤ θj ≤ θj. La planta se describe por una combinacion de q plantas ponderadas
por unos pesos desconocidos θj. La salida del proceso en el instante k+ p se representa
por:
y(k + p) =N∑
i=1
Hi(θ)u(k + p− i)
y se supone ademas que Hi(θ) = 0 para i > N , es decir, el proceso debe ser estable.
Tal y como se apunta en (Camacho and Bordons, 1999) la salida tambien se puede
calcular como:
y(k + p) =N∑
i=1
(Hmi + θi)u(k + p− i) (2.2)
CAPITULO 2. PERSPECTIVA GENERAL DE LOS CONTROLADORES MIN-MAX MPC 11
de manera que la salida nominal serıa:
ym(k + p) =N∑
i=1
Hmiu(k + p− i)
y la salida del proceso teniendo en cuenta la incertidumbre estarıa confinada a unas
bandas en torno a la salida nominal que vendrıan dadas por:
mınθ
N∑
i=1
θiu(k + p− i) y maxθ
N∑
i=1
θiu(k + p− i)
En el trabajo original de Campo and Morari (1987) la funcion objetivo empleada
esta basada en la norma ∞ − ∞. La principal ventaja de usar esta norma es que el
problema mın-max se puede reescribir como un problema de programacion lineal, que
puede resolverse de manera muy eficiente. La funcion objetivo, suponiendo un sistema
SISO y que la referencia permanece constante a lo largo del horizonte de prediccion,
vendra descrita por:
J(u, θ) = ‖y(t+ j|t) − r(t)‖∞ = maxj=1,···,N
|y(t+ j|t) − r(t)|
La senal de control se obtendra resolviendo el siguiente problema mın-max:
mınu∈U
maxθ∈Θ
maxj=1,···,N
|y(t+ j|t) − r(t)|
Este problema puede reescribirse como:
mınu∈U,µ
µ (2.3)
s.a.
(y(t+ j|t) − r(t)) ≤ µ ∀θ ∈ Θ ∀j = 1, · · · , N
−(y(t+ j|t) − r(t)) ≤ µ ∀θ ∈ Θ ∀j = 1, · · · , N
Si las predicciones y(t+ j|t) son una funcion afın de la incertidumbre y Θ y U son
conjuntos convexos, el maximo y el mınimo de y(t+ j|t) se obtendran para los vertices
del politopo Θ y U respectivamente. Por tanto, el conjunto de infinitas restricciones
que aparecen para todo valor de θ se sustituye por un conjunto de restricciones para
cada uno de los 2q (si se utiliza la descripcion dada en (2.1)) o 2N (si se utiliza la
descripcion dada en (2.2)) vertices.
El problema (2.3) es un programa lineal el cual se puede escribir como:
mınx
cTx (2.4)
s.a.
Ax ≤ b
x ≥ 0
12 LOS PRIMEROS TRABAJOS (1987-1992)
Aunque este problema puede resolverse de manera mucho mas eficiente que el pro-
blema mın-max original, tiene el inconveniente de tener muchas restricciones, pues
existe un grupo de restricciones por cada vertice de Θ. Ademas, si se tienen en cuenta
restricciones sobre la salida del proceso, tambien habra que considerar un grupo de
estas restricciones por cada vertice de Θ. Por otra parte, tal y como apunta Campo
and Morari (1987), la solucion de un programa lineal, cuyo numero de restricciones es
mucho mas grande que el de variables de decision, puede ser determinada mas eficien-
temente resolviendo el problema dual.
Una caracterıstica a tener en cuenta de esta formulacion es que se puede generalizar
a cualquier otra descripcion de la incertidumbre con la condicion de que las predicciones
de la salida sean una funcion afın de esa incertidumbre. Por ejemplo, en el caso de
emplear incertidumbres globales aditivas, en las que las predicciones toman la forma
y = Guu+Gθθ + f , el problema (2.3) se podrıa escribir como:
mınu∈U,µ
µ (2.5)
s.a.
Guu ≤ 1µ−Gθθ − f + w ∀θ ∈ Θ
−Guu ≤ 1µ+Gθθ + f − w ∀θ ∈ Θ
Guu ≤ 1y −Gθθ − f ∀θ ∈ Θ
−Guu ≤ 1y +Gθθ + f ∀θ ∈ Θ
En este caso el alto numero de restricciones puede reducirse pues, aunque para cada
componente del vector de salidas futuras existiran 2N restricciones, solo una de ellas
debera ser considerada, siendo el resto redundantes. Por tanto, solo sera necesario
considerar un bloque de restricciones sobre la salida del proceso, de tal manera que el
numero de restricciones totales dependera linealmente de los horizontes de prediccion
y control1.
Finalmente hay que destacar que esta formulacion no garantiza la estabilidad del
sistema en bucle cerrado tal y como se demuestra mediante un contraejemplo en (Zheng
and Morari, 1993).
2.2.2. Mejoras y formulacion con norma 1
El trabajo original de Campo and Morari (1987) fue desarrollado por Allwright
y Papavasiliou, en una serie de trabajos en los que se mejora la formulacion basada
1En la formulacion original de Campo y Morari, en la cual se emplean modelos FIR, el numero de
restricciones depende exponencialmente del numero de coeficientes del modelo, no de los horizontes.
CAPITULO 2. PERSPECTIVA GENERAL DE LOS CONTROLADORES MIN-MAX MPC 13
en la norma ∞ (Allwright and Papavasilou, 1991) y se extiende la estrategia original
a funciones de coste basadas en la norma 1 (Allwright and Papavasilou, 1992; All-
wright, 1994). Tambien se presenta un algoritmo eficiente (no de programacion lineal)
para resolver el problema mın-max con una funcion de coste basada en la norma 1
(Papavasilou and Allwright, 1991).
Uno de los inconvenientes del MMMPC de Campo y Morari es la gran cantidad de
restricciones que aparecen en el problema LP (en principio una por cada vertice del
politopo sobre el cual varıan los coeficientes de la respuesta impulsional). En (Allwright
and Papavasilou, 1991) se presenta un metodo para reescribir el problema LP, de man-
era que se evita tener que manejar un numero de restricciones que depende de manera
exponencial del numero de coeficientes del modelo. En lugar de eso, el numero de re-
stricciones que aparecen depende linealmente del numero de coeficientes del modelo,
sin tener que eliminar restricciones redundantes.
En (Papavasilou and Allwright, 1991) se describe un algoritmo del tipo de direc-
ciones factibles para resolver el problema mın-max que aparece cuando se considera la
siguiente funcion de coste basada en la norma 1:
J(u, θ) = ‖y(t+ j|t) − r(t)‖1
La norma 1 para un vector c ∈ Rk se puede calcular como:
‖c‖1 = maxv∈Vk
vT c Vk =
v ∈ Rk : −1 ≤ vj ≤ 1, j = 1, · · · , k
donde, por convexidad, el maximo se alcanzara en uno de los vertices de Vk. La senal
de control se calculara mediante el algoritmo que se describe a continuacion. La senal
de control se obtendra minimizando una funcion que tiene la forma:
J∗(u) = maxw=1,···,n
aTwu− bw
Para minimizar esta clase de funcion, Papavasilou and Allwright (1991) proponen em-
plear el siguiente algoritmo:
1. Determinar el conjunto de hiperplanos en los que se alcanza el maximo para
u = uk, es decir:
I(uk) =
i|J∗(uk) = aTi uk − bi
2. Determinar la direccion de descenso sk resolviendo:
mıns
t (2.6)
s.a.
aTi s ≤ t ∀i ∈ I(uk)
‖s‖∞ ≤ 1 (2.7)
14 LOS PRIMEROS TRABAJOS (1987-1992)
Sea sk, la solucion del problema (2.6) y tk el valor mınimo alcanzado de t. Parar
el proceso de optimizacion si tk ≥ −ε para un ε > 0 y pequeno.
3. Calcular:
λk = max
λ|I(uk) ⊆ I(uk + λsk)
4. Mejorar la solucion candidata tomando:
uk+1 = uk + λksk
incrementar k e ir al paso 1.
El trabajo presentado en (Papavasilou and Allwright, 1991) tiene como interes ser
el primero que aborda la formulacion MMMPC basada en la norma 1. Sin embargo
la solucion propuesta no es satisfactoria, pudiendose plantear esta estrategia de una
manera mas eficiente.
Ademas de las mejoras presentadas, la formulacion del MMMPC basado en la
norma 1 fue desarrollada completamente en (Allwright and Papavasilou, 1992; All-
wright, 1994). La funcion de coste empleada en el MMMPC de Campo y Morari no
contemplaba la ponderacion del esfuerzo de control. Ademas, el uso de la norma ∞
para ponderar el error de seguimiento puede no dar buenos resultados, pues en realidad
solo se esta penalizando la maxima desviacion de la salida con respecto a la referencia,
mientras que el resto del comportamiento es ignorado. A fin de solventar estos prob-
lemas Allwright y Papavasiliou proponen la siguiente funcion de coste basada en la
norma 1:
J(u, θ) =
N2∑
j=N1
|y(t+ j|t, θ) − r(t+ j)| + λ
Nu∑
j=1
|∆u(t+ j − 1)|
El problema mın-max resultante se puede formular como:
mınγ,µ,β,u
γ (2.8)
s.a.
−µj ≤ (y(t+ j|t, θ) − r(t+ j)) ≤ µj ∀θ ∈ Θ
−βj ≤ ∆u(t+ j − 1) ≤ βj
0 ≤
N2∑
j=N1
µj + λ
Nu∑
j=1
βj ≤ γ (2.9)
donde γ es una cota superior de:
µ∗(u) = maxθ∈Θ
N2∑
j=N1
|y(t+ j|t, θ) − r(t+ j)| + λ
Nu∑
j=1
|∆u(t+ j − 1)|
CAPITULO 2. PERSPECTIVA GENERAL DE LOS CONTROLADORES MIN-MAX MPC 15
es decir de la funcion de coste. El MMMPC de Allwright y Papavasiliou esta basado en
modelos FIR, sin embargo este esquema es facilmente extensible a modelos basados en
la funcion de transferencia (Camacho and Bordons, 1999). Ası, cuando se consideran
incertidumbres globales aditivas, el problema (2.8) se reescribirıa como:
mınγ,µ,β,u
γ (2.10)
s.a.
µ−Guu ≥ Gθθ + f + r ∀θ ∈ Θ
µ+Guu ≥ −Gθθ − f + r ∀θ ∈ Θ
β − u ≥ 0
β + u ≥ 0
γ ≥ 1Tµ+ λ1β
el cual a su vez se puede expresar en la forma (2.4). Dado que este problema LP tiene
usualmente mas restricciones que variables de decision se puede considerar la resolucion
del problema LP dual. Como en el caso del MMMPC con norma ∞, aplicando un
algoritmo de eliminacion de restricciones redundantes, se puede reducir el numero de
restricciones hasta depender linealmente de los horizontes de control y prediccion.
2.2.3. Un algoritmo basado en la norma 2
Las estrategias de control MMMPC anteriores estan basadas en la norma ∞ o 1,
de manera que los problemas mın-max se pueden reescribir como programas lineales,
que se pueden resolver eficientemente empleando algoritmos tipo Simplex. En control
predictivo, una de las elecciones mas populares para la funcion de coste es la funcion de
coste cuadratica con ponderacion del esfuerzo de control. En el caso del control MMM-
PC cuadratico, no existen algoritmos eficientes para resolver el problema mın-max, por
lo que inicialmente no se escogio este criterio. Sin embargo, si las predicciones de la
salida son una funcion afın de la incertidumbre y esta varıa sobre un politopo convexo,
el problema mın-max se puede reescribir como un problema de optimizacion convexa.
Este tipo de problemas mın-max pueden tener unos requerimientos computacionales
muy grandes, pero en general son problemas matematicamente tratables2. Uno de los
primeros trabajos en los que se explota este hecho se presenta en (Lau et al., 1991).
2El termino ((problema matematicamente tratable)) debe entenderse aquı como un problema que
puede resolverse en un tiempo razonablemente corto, al menos para valores pequenos del parametro
que define el tamano del problema. Eso no impide que la complejidad de ese problema sea muy grande.
Por ejemplo, el problema mın-max de la formulacion presentada en esta seccion no puede resolverse en
tiempo polinomial y sin embargo su complejidad es mucho menor que la que se tendrıa si ese problema
no fuera convexo.
16 LOS PRIMEROS TRABAJOS (1987-1992)
En este caso se considera un modelo FIR:
y(k) = θTφ(k)
donde θ = [b1, b2, · · · , bm]T y φ(k) = [u(k − 1), u(k − 2), · · · , u(k −m)]T . El vector de
parametros θ se supone que esta contenido en el elipsoide definido por:
θ ∈ Θ ,
θ : (θ − θc)T Γ(θ − θc) ≤ 1
donde Γ = ΓT > 0. El problema mın-max se formula como:
u∗ = arg mınu
[J1(u) + J2(u)]
donde:
J1(u) = ρuTu
J2(u) = maxθ∈Θ
yTy
e y se puede expresar como:
y = Uθ
donde:
U =
u(−1) u(−2) · · · u(−m)
u(0) u(−1) · · · u(−m+ 1)
u(1)...
......
......
......
u(N − 1) u(N − 2) · · · u(N −m)
Las predicciones son una funcion afın de los parametros inciertos (θ), y dado que Θ es
un elipsoide convexo, el maximo de la funcion de coste con respecto a θ se alcanzara en
la frontera de Θ. Encontrar el maximo supone factorizar matrices, calcular autovalores
y encontrar el maximo dentro de una lista de esos autovalores. Esto conlleva una
cantidad de calculo no despreciable, pero es un problema convexo y por tanto tratable.
Por otra parte tambien se puede probar que la funcion de coste es una funcion convexa
con respecto a u, por lo que el mınimo sera unico y no se daran problemas de mınimos
locales.
Lau et al. (1991) propone para resolver el problema mın-max usar el algoritmo del
elipsoide (Bland et al., 1981), utilizando el subgradiente de J dado que aunque J es
continua y convexa, no es continuamente diferenciable en u. Finalmente, los autores
formulan el problema dual, en el cual, dado un vector de parametros conocidos se
calcula el control que minimiza el peor de los estados iniciales posibles dentro de un
elipsoide dado.
CAPITULO 2. PERSPECTIVA GENERAL DE LOS CONTROLADORES MIN-MAX MPC 17
El metodo descrito en esta seccion difiere en algunos puntos de los MMMPC con
criterio cuadratico que se formularıan en anos sucesivos. Estas diferencias son por
ejemplo el tipo de modelo empleado y la forma del conjunto que contiene a todos los
posibles valores de la incertidumbre. En trabajos posteriores los modelos mas frecuentes
son los de funcion de transferencia y los modelos en espacio de estados , reemplazando
a los FIR, los cuales son incapaces de representar sistemas inestables. Ademas, se
suele considerar que la incertidumbre esta contenida en un politopo, en lugar de en un
elipsoide. De esta manera, basta con considerar los vertices del politopo en lugar de la
frontera.
2.2.4. Controlador predictivo adaptativo con diseno para el
peor caso de Veres y Norton (1991)
La estrategia que se describira a continuacion fue presentada en (Veres and Norton,
1991) y posteriormente extendida en (Veres and Norton, 1993). Corresponde a un
esquema de control, que a diferencia de los anteriores considera la adaptacion del
modelo de prediccion. La idea que separa a este controlador de los anteriores es que
considera una descripcion entrada-salida del proceso, donde los parametros del modelo
pueden tomar valores dentro de unas cotas establecidas, las cuales estan relacionadas
con las cotas del error de estimacion del modelo respecto del proceso real. Las cotas
sobre los parametros del modelo se obtienen y refinan de las medidas tomadas en
tiempo real de la salida del proceso, segun las tecnicas descritas en (Norton, 1987a;
Norton, 1987b; Mo and Norton, 1990).
En este trabajo se considera un modelo del proceso tipo ARMAX, por lo que el
proceso se puede describir como:
yt+k = −
p∑
i=1
aiyt−i+k +
q∑
i=1
biut−i+k + et+k et+k ∈ E
con E ≡ [−δ, δ]. Por otra parte, las predicciones a lo largo del horizonte de prediccion
para k = 1, · · · , n pueden expresarse como funcion de los valores de las salidas actuales
y pasadas y de las entradas pasadas:
yt+k =
p∑
i=1
αi(k)yt−i+1 +
q∑
i=1
βi(k)ut−i+1 +k−1∑
i=1
β1(i)ut+k−i +k−1∑
i=1
α1(i)et+k−i + et+k
con k = 1, · · · , n, et+i ∈ E y i = 1, · · · , k.
El controlador debera minimizar la funcion de coste para el peor caso teniendose en
cuenta en la optimizacion un conjunto de parametros factibles Dt, que se actualizaran
18 LOS PRIMEROS TRABAJOS (1987-1992)
en base a las medidas observadas del proceso. Los parametros tendran la forma:
θ =[
a1 a2 · · · ap b1 · · · bq]T
La funcion de coste usada en el instante t+ k calculada en el instante t es:
Ck(t) = supθ∈Dt, et+i∈E, i=1,···,k
max (|rt+k − yt+k|, |λut+k−1|)
donde rt+k es la referencia a seguir en t+k y λ es un factor de ponderacion del esfuerzo
de control. La secuencia optima de actuaciones se calculara como:
ut(t), · · · , ut+N−1(t) = arg infut,···,ut+N−1
maxk=1,···,n
Ck(t) (2.11)
Es de destacar que el problema anterior emplea una funcion de coste que es notable-
mente mas compleja que las empleadas en los trabajos anteriores. De hecho, tal y como
senalan los autores, en las ecuaciones de prediccion, yt+k es lineal en et+i pero multino-
mial con grado N en los parametros del modelo. Por otra parte los conjuntos E y Dt
son convexos. Por lo tanto, el calculo de Ck(t) supone la optimizacion de una funcion
multinomial en un conjunto convexo. Dado que esto es un problema bastante complejo
los autores proponen una alternativa.
La alternativa propuesta pasa por calcular las cotas de los parametros del predictor,
no del modelo. Esto tiene ventajas computacionales. Ademas las ecuaciones de predic-
cion se calculan sobre un intervalo mayor que el considerado en el modelo. La ley de
control basada en los parametros de las ecuaciones de prediccion se calcularıa como:
ut(t), · · · , ut+N−1(t) = arg infut,···,ut+N−1
maxk=1,···,n
Cpk(t)
donde:
Cpk(t) = sup
θp
k∈Pk(t), et+i∈E, i=1,···,k
max (|rt+k − yt+k|, |λut+k−1|)
y las predicciones se expresan como:
yt+k = ϕTtkθ
pk
siendo el vector de parametros:
θpk = [α1(k) · · ·αp(k) β1(1) · · · β1(k − 1) · · · β1(k) · · · βq(k) α1(1) · · ·α1(k − 1)]T
que pertenecera a un conjunto de parametros factibles Pk y siendo el regresor:
ϕtk = [yt · · · yt−p+1 ut+k−1 · · · ut−q+1 et+k−2 · · · et]
CAPITULO 2. PERSPECTIVA GENERAL DE LOS CONTROLADORES MIN-MAX MPC 19
Los autores demuestran que en esta formulacion, CPk (t) es lineal a trozos con respec-
to al dominio U de actuaciones posibles, y que su maximo es el maximo de un numero
finito de formas lineales, es decir:
C = maxk=1,···,n
Cpk(t) = max
i∈I
Li(ut)
Por otra parte, si se consideran cotas sobre la accion de control, la minimizacion con
respecto a ut se reduce a comprobar cual de los vertices del politopo que viene definido
por C(ut) y las cotas sobre ut presenta menor valor C. Por tanto, esta formulacion es
mucho mas eficiente desde el punto de vista computacional en comparacion con la que
se describe en el problema (2.11).
La estrategia anterior se complementa con el mecanismo de acotacion de paramet-
ros, de manera que para cada instante de muestreo, se determina la cota del error de
prediccion δ y un escalar denotado por ρ que caracteriza la variacion mayor de los
parametros θ. Estos parametros caracterizan el conjunto de parametros factibles del
predictor, es decir Pk(t, δt, ρt). Esto se puede utilizar para obtener la ley de control:
ut(δt, ρt) = arg infut∈Ut
Lt(ut, δt, ρt)
donde:
Lt(ut, δt, ρt) = infut+1,···,ut+N−1
maxk=1,···,n
supθ
p
k∈Pk(t,δt,ρt) et+i∈E,i=0,···,k−2
|rt+k − ϕTtkθ
pk|
El conjunto de actuaciones factibles Ut, se construye de manera que la salida
este acotada. Para cada valor δt, en el rango [δtmin, δtmax] existira un valor ρmin(δt)
que de la menor variacion de los parametros. El esquema definitivo serıa:
ut = arg infut∈Ut
Lt(ut, δ∗t , ρ
∗tmin)
donde:
δ∗t = arg infδt∈[δtmin,δtmax]
infut∈Ut
Lt(ut, δt, ρmin(ρt))
con ρ∗tmin = ρmin(δ∗t ).
2.3. Controladores Min-Max MPC adaptativos basa-
dos en incertidumbres globales acotadas
En esta seccion se revisaran los trabajos presentados en (Gutierrez and Cama-
cho, 1995; Camacho and Berenguel, 1997), en los cuales se propone y se aplica un
20 CONTROLADORES ADAPTATIVOS BASADOS EN INCERTIDUMBRES GLOBALES
controlador mın-max que esta basado en la tecnica de incertidumbres globales acota-
das y funcion de coste cuadratica (Camacho and Bordons, 1995). Esa formulacion se
complementa con un esquema de identificacion en lınea, de manera que se adapta el
modelo a las condiciones de la planta a la vez que se mantiene un hipercubo en el cual
estan contenidos los parametros ((reales)).
En estos trabajos se considera un modelo del proceso ARMAX que viene dado por:
y(t) =na∑
i=1
aiy(t− i) +
nb∑
i=0
biu(t− d− i) + e(t)
donde e(t) es el error de modelado, el cual se supone desconocido pero acotado, es
decir, emin ≤ e(t) ≤ emax. La ecuacion anterior se puede reescribir como:
y(t) = ϕT (t)θ + e(t) (2.12)
donde ϕ(t) es el regresor y θ es el vector de parametros estimados:
ϕ(t) =
y(t− 1)...
y(t− na)
u(t− d)...
u(t− d− nb)
θ =
a1
...
ana
b0...
bnb
Teniendo en cuenta las cotas del error y la ecuacion (2.12) se puede considerar que:
y(t) − emax ≤ ϕT (t)θ ≤ y(t) − emin
Esta ecuacion define dos hiperplanos entre los cuales estara incluido en cada instante
el vector de parametros θ. A lo largo de k instantes de muestreo se ira construyendo
un conjunto el cual estara delimitado por k pares de hiperplanos:
S(k) =
θ : y(t) − emax ≤ ϕT (t)θ ≤ y(t) − emin t = 1, · · · , k
A medida que k es mayor, S(k) se vuelve muy complejo para ser empleado y se aproxima
por un hipercubo P (k):
P (k) =
θ : θjmin(k) ≤ θj ≤ θj
max(k) j = 1, · · · , na + nb + 1
el cual se construye con el metodo descrito en (Mo and Norton, 1990).
Una vez se cuenta con el hipercubo P (k), la senal de control se calculara resolviendo:
mınu
maxθ,e
J(θ, e, u) (2.13)
CAPITULO 2. PERSPECTIVA GENERAL DE LOS CONTROLADORES MIN-MAX MPC 21
sujeto a:
emin ≤ ek+j ≤ emax j = d, · · · , d+N − 1
θ ∈ Pk
Umin ≤ uk+j ≤ Umax j = 0, · · · , N − 1
Los parametros inciertos, es decir θ y e se pueden agrupar en un vector θ∗ = [θ e].
Igualmente se puede considerar un hipercubo generalizado donde se incorporen los
parametros inciertos de θ∗:
Tk = θ, e : θ ∈ Pk, e ∈ ξ
donde ξ es el hipercubo que contiene a e. El problema (2.13) se puede reescribir como:
mınu∈U
J∗(u) con J∗(u) = maxθ∗∈Tk
J(θ∗, u)
La funcion de coste toma la forma:
J(θ∗, u) =
N2∑
j=N1
(
yk+j|k − wk+j
)2+ λ
N3∑
j=1
(∆uk+j−1)2
teniendo en cuenta que en las predicciones de salida se ha de considerar la secuencia de
futuros errores de modelado ek+d, · · · , ek+d+N−1, la cual se evalua en los vertices del
hipercubo ξ. El vector de predicciones se puede escribir en forma condensada como:
y = Guu+ f
donde la matriz Gu y f dependen de θ. De esta manera la funcion de coste queda:
J(θ∗, u) = (Guu+ f − w)T (Guu+ f − w) + Ju (2.14)
donde Ju = λ(Mu −m)T (Mu −m) con M una matriz cuya diagonal principal tiene
todos los valores a 1, la diagonal inferior a -1 y el resto de los elementos a cero siendo
m =[
uk−1 0 · · · 0]T
. La ecuacion (2.14) se puede reescribir como:
J(θ∗, u) =1
2uTHuu+ qT
u u+ pu
con:
Hu = 2(
GTuGu + λMTM
)
qu = 2[
GTu (f − w) + λMTm
]
y pu = (f − w)T (f − w) + λmTm.
Esta formulacion comparte muchas de las caracterısticas de la estrategia MMM-
PC con incertidumbres globales acotadas (Camacho and Bordons, 1995). Una de las
22 CONTROLADORES PREDICTIVOS ROBUSTOS BASADOS EN LMIS
caracterısticas mas destacables de esa formulacion, es que el maximo de la funcion de
coste se alcanza en uno de los vertices del politopo que encierra a todos las posibles
realizaciones de la incertidumbre. Esto es porque las predicciones son una funcion afın
de los valores de la incertidumbre, luego la funcion de coste es convexa con respecto
a la incertidumbre y el maximo de una funcion convexa sobre un politopo convexo se
alcanza en uno de los vertices del politopo. En el caso de las predicciones empleadas
en la formulacion presentada en esta seccion, las predicciones son funcion afın del error
de modelado e y de las incertidumbres sobre los coeficientes b0, b1, · · · , bnb, pero no son
funciones afines de a1, a2, · · · , anapor lo que el problema de optimizacion es mucho mas
complejo dado que se han de considerar todos los posibles valores de esos parametros
para hallar el maximo.
En (Camacho and Berenguel, 1997) la estrategia presentada en esta seccion se
aplico sobre la planta solar de Tabernas (Almerıa) con resultados satisfactorios. El
modelo de prediccion toma la forma:
G(z−1) = z−1 b0z−1 + b1z
−2
1 − az−1
En este caso, dado que solo hay un parametro a, la parte ((max)) para este parametro
se soluciona tomando una ((malla)) de valores sobre los que se evalua J(θ∗, u) para
encontrar el maximo. Para modelos simples esta tecnica es valida, no ası para modelos
de orden superior, en los que el numero de puntos a evaluar se dispararıa.
2.4. Controladores predictivos robustos basados en
LMIs
Las desigualdades matriciales lineales (LMI) constituyen una herramienta matematica
muy potente que permite representar y resolver muchos problemas que aparecen en la
teorıa de control (Boyd et al., 1994). De este modo, incluso desigualdades que no son
afines en las variables consideradas, por ejemplo desigualdades cuadraticas, se pueden
representar como LMIs. Mas aun, existen algoritmos numericos muy eficientes (como
los metodos de punto interior), que permiten resolver los problemas LMI que aparecen
cuando se expresan mediante esta tecnica, problemas de control como la estabilidad ro-
busta, colocacion de polos robusta, LQG y tambien el MPC robusto. En este contexto
Kothare et al. (1996) propuso un controlador predictivo robusto con restricciones, que
si bien no se puede considerar un Min-Max MPC en sentido estricto, tiene su origen en
el diseno para el peor caso. Por tanto, se considera que este tipo de controlador forma
parte del conjunto de estrategias que se describen en este capıtulo.
CAPITULO 2. PERSPECTIVA GENERAL DE LOS CONTROLADORES MIN-MAX MPC 23
En el trabajo de Kothare et al. (1996) se considera que los sistemas sujetos a in-
certidumbre se describen mediante una aproximacion politopica o multimodelo lineal
y variable en el tiempo, es decir:
x(k + 1) = A(k)x(k) +B(k)x(k)
y(k + 1) = Cx(k)
perteneciendo las matrices del sistema a un politopo:
[A(k) B(k)] ∈ Ω
donde Ω es conjunto convexo, el cual viene definido por sus vertices:
Ω = Co [A1, B1], [A2, B2], · · · , [AL, BL]
por lo que se supone que la dinamica exacta de la planta estara descrita en todo
momento por una combinacion convexa de los vertices:
[A,B] =L∑
i=1
λi[Ai, Bi]
con λi ≥ 0 y∑L
i=1 λi = 1.
La funcion de coste usada en este caso emplea la norma 2 con horizonte de predic-
cion infinito, el cual conduce a leyes de control con estabilidad nominal garantizada
(Rawlings and Muske, 1993):
J(k) =∞∑
i=0
(
x(k + i|k)TQ1x(k + i|k) + u(k + i)TRu(k + i))
El problema de optimizacion a resolver para obtener la senal de control es en este caso:
mınu(k+i|k),i≥0
max[A(k+i),B(k+i)]∈Ω,i≥0
J(k) (2.15)
Este problema mantiene la complejidad computacional presente en las formulaciones
anteriores, de manera que se desestima su resolucion, adoptandose la estrategia descrita
a continuacion. Por simplicidad solo se describira el caso mas sencillo en el que no se
consideran restricciones. En primer lugar se define una funcion de Lyapunov cuadratica
V (x) = xTPx con P > 0 construida de manera que sea una cota superior de J(k):
max[A(k+i),B(k+i)]∈Ω,i≥0
J(k) ≤ V (x(k|k))
En segundo lugar, en vez de calcularse la senal de control directamente, se calcula la
matriz F que se usa en una ley de control por realimentacion del vector de estados, es
decir:
u(k + i|k) = Fx(k + i|k) (2.16)
24 CONTROLADORES PREDICTIVOS ROBUSTOS BASADOS EN LMIS
donde F se calcula minimizando V (x(k|k)), resolviendo el siguiente problema de opti-
mizacion:
mınγ,Q,Y
γ (2.17)
sujeto a las siguientes LMIs:
[
1 x(k|k)T
x(k|k) Q
]
≥ 0
Q QATj + Y TBT
j QQ121 Y TR
12
AjQ+BjY Q 0 0
Q121Q 0 γI 0
R12Y 0 0 γI
≥ 0 ∀j = 1, · · · , L
Con la solucion del problema anterior la ganancia de la ley de control (2.16) se puede
determinar como:
F = Y Q−1
Estos resultados se pueden generalizar a fin de considerar restricciones en la salida
del proceso y la actuacion, cuadraticas ‖u(k + i|k)‖2 ≤ umax, y en valor absoluto
|u(k+ i|k)| ≤ umax, las cuales pueden ser expresadas como LMIs (Kothare et al., 1996).
Por otra parte, tambien se considera un invariante robusto en el cual se mantiene el
estado del sistema para todos los valores de las matrices del sistema. Esta formulacion
puede ser extendida de manera que se considere seguimiento de referencia, rechazo de
perturbaciones y sistemas con retrasos, siendo necesario en este caso modificar la forma
de la funcion V (x).
Esta estrategia de control es una de las primeras en considerar predicciones en bucle
cerrado en la optimizacion, una idea que luego serıa recogida en otras estrategias de
Min-Max MPC (Scokaert and Mayne, 1998; Bemporad et al., 2001) o MPC en general
(Bemporad, 1998; Batina et al., 2001)3. La idea, segun la interpretacion del propio
autor, es que aunque tradicionalmente la realimentacion se interpreta como un medio
para tener en cuenta la incertidumbre y las perturbaciones, en este contexto se debe
interpretar como un medio de reducir potencialmente el conservadurismo de la accion
de control para el peor caso.
En este tipo de control, la estabilidad viene estrechamente relacionada con la
factibilidad de las LMIs, de manera que se cumple que si el problema es factible para el
primer instante de muestreo, lo sera para todos los demas. Relacionado con este punto
esta el hecho de que las matrices de ponderacion podran afectar al rendimiento del
3En este parrafo se ha recogido una consideracion presente en la literatura (Mayne et al., 2000). Sin
embargo, a juicio del autor, en esta estrategia la idea de bucle cerrado no se identifica tan claramente
como en (Lee and Yu, 1997; Scokaert and Mayne, 1998) o (Bemporad et al., 2001).
CAPITULO 2. PERSPECTIVA GENERAL DE LOS CONTROLADORES MIN-MAX MPC 25
controlador, pero no a la estabilidad. Por tanto, la sintonıa del controlador, al menos
en lo que respecta a estas matrices, es mas sencilla y menos crıtica.
Otra caracterıstica apreciable es que esta formulacion se puede extender a sistemas
no lineales, aunque debe cumplirse que el Jacobiano del modelo pertenezca en todo
momento al politopo Ω.
Las limitaciones de esta estrategia incluyen la imposibilidad de describir incertidum-
bres en los polos, siendo esto consecuencia de la dificultad de aplicar las tecnicas de
optimizacion antes mencionadas con descripciones entrada-salida. Otros inconvenientes
apuntados en (Camacho and Bordons, 1999) son:
Los algoritmos LMI no son tan eficientes desde el punto de vista numerico como
los algoritmos especializados de programacion lineal o cuadratica.
Las variables manipuladas se computan como una realimentacion lineal del vector
de estados que satisfacen las restricciones, pero se obvia que el optimo no tiene
porque coincidir con ninguna realimentacion lineal cuando se usan restricciones.
Las restricciones pierden parte de su significado fısico al expresarse con LMIs.
En cualquier caso el impacto de este trabajo ha sido considerable, estando entre
los mas citados dentro de la literatura de control predictivo robusto. Ha sido tomado
como partida para otros trabajos, entre los que se pueden citar (Wu, 1997; Cuzzola et
al., 2001; Ozkan et al., 2000; Casavola et al., 2000)
En (Wu, 1997), la estrategia descrita aquı, se extiende para considerar una clase
general de sistemas lineales con incertidumbres descritas por transformaciones lineales
fraccionales (LFT) variantes en el tiempo. La estrategia presentada se compara con un
MPC nominal sobre un modelo correspondiente a un reactor agitado (CSTR).
Por otra parte, Cuzzola et al. (2001) mejoran la estrategia original eliminando el
requisito de que el sistema con incertidumbres sea cuadraticamente estabilizable. Para
ello se considera que la incertidumbre es politopica y en lugar de considerar una sola
funcion de Lyapunov, se utiliza una funcion de Lyapunov para cada vertice:
V (i, k) = x(k + i|k)TP (i, k)x(k + i|k) ∀i ≥ 0
donde P (i, k) > 0. Los autores aducen que con esta representacion se consigue describir
un mayor numero de sistemas. Por otra parte, se tienen en cuenta restricciones tanto
en la entrada como en la salida.
26 CONTROLADORES PREDICTIVOS ROBUSTOS BASADOS EN LMIS
Kothare es coautor de (Ozkan et al., 2000) en el cual se toma la estrategia robusta
original y se adapta para el uso con sistemas lineales a trozos. La particion del espacio
de estados en las que el sistema es lineal se hace usando regiones elipsoidales en lugar de
politopicas, pues como los autores demuestran, en ese caso las desigualdades matriciales
que aparecen son no lineales. Tal y como se hace en (Cuzzola et al., 2001) se emplean
multiples funciones de Lyapunov, esta vez una para cada region del espacio de estados
de la forma Vi = xTPix. Ademas, para cada region tambien se obtiene una ley de control
por realimentacion del vector de estados distinta, es decir u(k + l|k) = Kix(k + l|k).
La estrategia presentada por Casavola et al. (2000) extiende la formulacion de
Kothare et al. (1996) incluyendo N terminos libres en el coste cuadratico ademas de la
matriz de ganancias de realimentacion del vector de estados. Tambien es una extension
del trabajo presentado en (Casavola et al., 1999), en el cual se propone la minimizacion
de un coste cuadratico con horizonte finito, forzandose mediante restricciones que al
final del horizonte de prediccion, el estado entre en un invariante donde se emplea una
ley de control tipo LQR. Al extender esta estrategia para que se consideren incertidum-
bres, se minimiza una cota superior del coste cuadratico con horizonte infinito, el cual
depende de los N terminos libres y de la matriz de ganancias. Debido a la incertidum-
bre, todas las trayectorias del estado debidas a la secuencia de N senales de control a
partir del estado actual, estan contenidas en un politopo compacto y convexo, cuyos
vertices son funciones afines de las N senales de control y del estado actual del proceso.
La estabilidad se garantiza asegurando que todos los vertices de ese politopo esten a su
vez dentro del invariante robusto, cuando se emplea la ley de realimentacion del vector
de estados definida por la matriz de ganancias. La ley de control tendra por tanto la
forma:
u(·|t) =
u∗(t+ k|t) k = 0, 1, · · · , N − 1
u(t+ k|t) = F (t)x(t+ k|t) k ≥ N
donde u∗(t+ k|t) se calcula minimizando:
V (x(t), Q(t), u∗(·|t)) =N−1∑
k=0
maxz(k)∈vertices
Xt+k|tu∗(·|t)
(x(t))
‖z(k)‖2Ψx
+ ‖u∗(t+ k|t)‖2Ψu
+ maxz∈vertices
Xt+N|tu∗(·|t)
(x(t))
‖z‖2Q(t) (2.18)
sujeto a:
u∗(t+ k|t) ∈ Ωu ∀k = 0, 1, · · · , N − 1
vertices
Xt+N |tu∗(·|t)(x(t))
⊂ E(Q(t), ρ(t))
En (2.18) los conjuntos Xt+k|tu∗(·|t)(x(t)) denotan los conjuntos convexos de todas las trayec-
torias predichas a k pasos desde x(t), cuando se aplican las secuencias de actuaciones
CAPITULO 2. PERSPECTIVA GENERAL DE LOS CONTROLADORES MIN-MAX MPC 27
u∗(t+ i|t)k−1i=0 . Por otra parte, E(Q(t), ρ(t)) es un elipsoide:
E(Q(t), ρ(t)) =
x ∈ Rn : xTQ(t)x ≤ ρ(t) ρ(t) > 0
que define un invariante robusto para el modelo politopico controlado por la matriz de
ganancias F (t). Esta, junto con Q(t) y ρ(t) se calculara de manera que se garantice que
el conjunto de plantas descrito por el modelo politopico sea estabilizable cuadratica-
mente por F (t). Para garantizar esto se ha de cumplir que todos los vertices del politopo
en el cual varıan las matrices del modelo, deben ser estabilizables cuadraticamente por
F (t) (Geromel et al., 1991), condicion que se puede expresar en forma de LMIs. Ademas
ρ(t) es una cota superior del coste para el peor caso con horizonte finito. Se obtiene
mediante un problema similar a (2.17), de manera que su valor sea el mınimo compat-
ible con las LMIs que garantizan la estabilidad cuadratica para todos los vertices del
politopo definido por las matrices del modelo.
2.5. Controladores Min-Max MPC con expresion
analıtica
En esta seccion se resumen los resultados presentados en una serie de trabajos (Noh
et al., 1996; Lee et al., 1996; Kim et al., 1998; Kim and Kwon, 1998) que tienen como
caracterıstica principal que la ley de control resultante tiene una expresion analıtica,
de manera que la senal de control se puede obtener sin apenas calculos. Este resul-
tado es posible porque no se consideran restricciones de ningun tipo, como se vera a
continuacion.
El primer trabajo presentado fue (Noh et al., 1996). En este trabajo se emplea un
modelo CARIMA en el cual se consideran incertidumbres aditivas no acotadas :
A(z−1)y(t) = B(z−1)u(t− 1) + C(z−1)w(t)
∆
En cuanto a los horizontes de prediccion, se considera un horizonte de control Nu, un
horizonte de salida N y un horizonte de restricciones NF , de manera que la accion de
control se supone constante a partir de t + Nu inclusive, es decir ∆u(t +Nu) = · · · =
∆u(t +N +NF − 1) = 0. El horizonte de restricciones NF se emplea para mejorar la
estabilidad y el rendimiento del controlador. Las predicciones, al igual que en el caso
de las incertidumbres globales acotadas se pueden expresar de una manera condensada
como:
Y = GU +DW + F
28 CONTROLADORES MIN-MAX MPC CON EXPRESION ANALITICA
y dado que se consideran dos horizontes de prediccion, es decir N y NF la anterior
expresion se puede reescribir de la siguiente manera:
[
Y1
Y2
]
=
[
G1
G2
]
U +
[
D1 0
DF D2
] [
W1
W2
]
+
[
F1
F2
]
La ley de control presentada en este trabajo esta derivada a partir de la teorıa de juegos
discretos LQ. Considerese la siguiente funcion de coste:
JLQ =N∑
i=1
f1(y(t+ i) − r(t+ i))T (y(t+ i) − r(t+ i)) (2.19)
+λ∆u(t+ i− 1)T ∆u(t+ i− 1)
+f2
N+NF∑
i=N+1
(y(t+ i) − r(t+ i))T (y(t+ i) − r(t+ i))
= (Y −R)TQ(Y −R) + λUTU
donde:
Q =
[
f1I 0
0 f2I
]
, λ > 0, Q ≥ 0
y R es la secuencia de valores de la referencia, la cual se puede considerar que tiene la
forma [R1 R2]T . La secuencia optima de actuaciones se obtendra resolviendo:
∆u = arg mınu
maxw
[
JLQ − γ2W TW]
(2.20)
donde el termino γ2W TW se anade a fin de que la solucion del min-max no este en w →
∞. Es decir, se consigue que la solucion este en un punto de silla. La introduccion de
este termino conduce a una funcion de coste artificiosa en la que se pierde el sentido que
tiene el criterio cuadratico (2.19). Sea J = JLQ − γ2W TW , dado que no se consideran
restricciones de ningun tipo (las incertidumbres no estan acotadas), la solucion del
problema mın-max se obtiene encontrando aquellos valores U ∗ y W ∗ tal que cumplen:
A :∂J
∂W W=W ∗= 0
∂2J
∂W 2W=W ∗
≤ 0
B :∂J
∂U U=U∗= 0
∂2J
∂U2U=U∗
≥ 0
Si no se considera el horizonte de restriccion, es decir si f1 = 1 y f2 = 0 la ley de
control resulta ser:
∆u =
(
λI +GT
(
I −1
λ2DDT
)−1
G
)−1
GT
(
I −1
λ2DDT
)−1
(R− F )
CAPITULO 2. PERSPECTIVA GENERAL DE LOS CONTROLADORES MIN-MAX MPC 29
Puede observarse que si no se consideran los terminos relativos a la incertidumbre (es
decir, si γ → ∞) la ley de control que resulta es la misma que en el caso del GPC
estandar (Clarke et al., 1987).
En el caso de considerar un valor f2 6= 0 la formulacion considerada en (2.20) es
una ley de control lineal que depende de la existencia de una matriz que tiene la forma
(Q∗− 1γ2DD
T )−1. Esta matriz no tiene porque existir siempre, por lo que la formulacion
que se propone para el caso en el que se considera una penalizacion sobre el estado final
es diferente a la considerada en (2.20). La senal de control se considerara resolviendo:
∆u = arg mınu
(
maxw1
(
JLQ1 − γ2W T1 W1
)
+ JLQ2
)
(2.21)
donde:
JLQ1 = (Y1 −R1)TQ1(Y1 −R1) + λUTU Q1 = f1I, f1 > 0
JLQ2 = (Y2 −R2)TQ2(Y2 −R2) Q2 = f2I, f2 > 0
Y2 = [y(t+N + 1|t) · · · y(t+N +NF |t)]T
y y(t+ i|t) son las predicciones para t+ i sin considerar las incertidumbres, es decir:
Y2 = G2U + F2
Por tanto, esta formulacion solo considera las incertidumbres en parte del horizonte
de prediccion, de manera que en la parte final del horizonte de prediccion el uso de la
penalizacion del estado final pueda actuar mejorando la estabilidad del sistema.
Aplicando el mismo procedimiento seguido para el problema (2.20) se puede obtener
la solucion del formulado en (2.21):
∆u =(
Φ−1 − Φ−1GT2
(
f−12 I +G2Φ
−1GT2
)−1G2Φ
−1)
GT1 F (R1 − F1)
+Φ−1GT2
(
f−12 I +G2Φ
−1GT2
)−1(R2 − F2)
donde:
φ = λI +GT1
(
Q−11 −
1
γ2D1D
T1
)−1
G1
F =
(
Q−11 −
1
γ2D1D
T1
)−1
Los autores muestran con ejemplos simulados que en el caso de sistemas inestables la
mejora sobre un GPC estandar es notable, sin embargo, en el caso de sistemas estables
y de bajo orden las diferencias son pequenas.
30 CONTROLADORES MIN-MAX MPC CON EXPRESION ANALITICA
En el trabajo anterior no se garantiza la estabilidad del sistema en bucle cerrado.
En (Lee et al., 1996; Kim et al., 1998) se presenta una variante del controlador anterior
para la cual si se garantiza estabilidad. En este la senal de control se obtiene resolviendo
el problema:
∆u = arg mınu
(
maxw1
(
JLQ1 − γ2W T1 W1 + JLQ2
)
)
(2.22)
donde JLQ1 y JLQ2 tienen las mismas definiciones que en el problema (2.21), salvo que
en el caso de JLQ2 los valores de la salida se calculan a partir de los valores de la salida
en t + N y sin tener en cuenta la incertidumbre a partir de ese instante. Es decir, en
este caso:
Y2 = [y(t+N + 1|t+N) · · · y(t+N +NF |t+N)]T
de manera que las predicciones son mas fidedignas. Por otra parte, la subfuncion de
coste JLQ2 se incluye en la maximizacion de manera que la senal de control resulta ser:
∆u =1
λGT
(
1
λGGT +Q−1 −
1
γ2DDT
)−1
(R− F )
donde:
Q−1 =
[
f−11 I 0
0 f−12 I
]
, D =
[
D1
DF
]
Para este controlador los autores demuestran que el sistema es estable si se verifican
las siguientes desigualdades:
γ2I − DTQD > 0 (2.23)
γ2 − f1 − dTQ2d > 0
Q2 ≥(
F − gkT)T
Q2
(
F − gkT)
+ λkkT + f1ggT (2.24)
+(
f1gT + dT
(
F − gkT))T
(
γ2 − f1 − dTQ2d)−1(
f1gT + dT
(
F − gkT))
donde:
F =
0 1 0 · · · 0
0 0 1 · · · 0...
......
0 0 0 · · · 1
−aN −aN−1 −aN−2 · · · −a1
los −ai son los coeficientes del polinomio A(z−1) = ∆A(z−1), y se supone que N = n,
el grado de A(z−1). Por otra parte, en las desigualdades anteriores g, d son las primeras
columnas de las matrices G1 y D1 respectivamente. Finalmente:
gT =[
1 0 · · · 0]
− g0kT
CAPITULO 2. PERSPECTIVA GENERAL DE LOS CONTROLADORES MIN-MAX MPC 31
donde g0 es el primer elemento de la primera columna de G1 y k es un vector de
dimension apropiada tal que se cumple que ∆u(t+N) = −kTY2.
Ademas de estabilidad, la ley de control obtenida de resolver (2.22) regula la salida
del proceso de manera que la norma inducida por la norma l2 de las perturbaciones a
la salida esta acotada por γ2, es decir, se cumple que:
∞∑
i=1
y(t+ i)2
∞∑
i=1
w(t+ i)2
≤ γ2
Las condiciones (2.23)-(2.24) admiten una formulacion basada en LMIs (Kim et al.,
1998), de manera que se podran hallar los valores de los parametros (si existen) para
los cuales el sistema es estable en bucle cerrado y mantiene la norma H∞ acotada.
Finalmente, en (Kim and Kwon, 1998) se ilustra la aplicacion simulada del contro-
lador anterior sobre un complejo modelo de un proceso metalurgico obtenido a partir
de los datos de una instalacion real, en el cual el controlador se compara favorablemente
con un control PID clasico.
En conclusion, los trabajos presentados en esta seccion se apartan del resto de los
revisados en este capıtulo porque formulan leyes de control que tienen una expresion
analıtica, con las ventajas computacionales y de analisis que ello conlleva. Sin embar-
go, presentan limitaciones tales como no contemplar ningun tipo de restriccion en la
accion de control o en las incertidumbres consideradas. En caso de considerarse tales
restricciones, el principal atractivo de estas estrategias se perderıa y serıa necesario
realizar la optimizacion por metodos numericos.
2.6. Controladores para el peor caso con parame-
tros acotados de J.H. Lee (1997)
En esta seccion se presentan las estrategias de control desarrolladas en (Lee and
Yu, 1997; Lee and Cooley, 2000). En el primer trabajo se presentan diversas formas de
MMMPC en las que por primera vez se argumentan las desventajas que presenta em-
plear predicciones en bucle abierto y se propone una estrategia MMMPC que emplea
el concepto de bucle cerrado. En las estrategias presentadas se consideran modelos en
espacio de estados, con penalizacion del estado terminal y se aportan pruebas de esta-
bilidad. Por otra parte, se proponen soluciones suboptimas con menores requerimientos
32 CONTROLADORES PARA EL PEOR CASO CON PARAMETROS ACOTADOS
de calculo.
El sistema considerado toma la forma:
zk+1 = A(ϑk)zk +B(ϑk)vk (2.25)
donde ϑ es un vector de incertidumbres sobre el que estan parametrizadas las matrices
del sistema y que puede ser constante o variar en el tiempo. En el primer caso se
considerara que ϑk = ϑ ∈ Θ, ∀k donde Θ es un conjunto compacto. En el caso de que
se considere que la incertidumbre es variante en el tiempo se asumira que ϑk ∈ Θ, ∀k
o bien de una manera mas general ϑk ∈ Θk.
La primera formulacion que se considera es el MMMPC en bucle abierto con vector
de incertidumbres invariante en el tiempo. En esta formulacion la senal de control se
calcula resolviendo:
mınu
maxθ∈Θ
xTk+pQpxk+p +
p−1∑
l=1
xTk+lQxk+l +
q−1∑
j=0
uTk+jRuk+j
(2.26)
con:
xk+l ∈ X l = 1, · · · , p ∀θ ∈ Θ
uk+j ∈ V j = 0, · · · , q − 1
uk+i = 0, i = q, · · · , p− 1
y:
xk+l = Al(θ)zk +l−1∑
j=0
Al−j−1(θ)B(θ)uk+j
Por otra parte, cuando el vector de incertidumbre varıa en el tiempo la senal de control
se obtendra resolviendo:
mınu
max[θk,···,θk+p−1]∈Θ×···×Θ
xTk+pQpxk+p +
p−1∑
l=1
xTk+lQxk+l +
q−1∑
j=0
uTk+jRuk+j
(2.27)
con:
xk+l ∈ X l = 1, · · · , p ∀ [θk, · · · , θk+p−1] ∈ Θ × · · · × Θ
uk+j ∈ V j = 0, · · · , q − 1
uk+i = 0, i = q, · · · , p− 1
siendo en este caso la ecuacion de prediccion:
xk+l =
(
l−1∏
i=0
A(θk+i)
)
zk +l−1∑
j=0
(
l−1∏
i=j+1
A(θk+i)
)
B(θk+j)uk+j
CAPITULO 2. PERSPECTIVA GENERAL DE LOS CONTROLADORES MIN-MAX MPC 33
La formulacion con incertidumbre variante en el tiempo tiende a ser mas robusta que la
formulada en el problema (2.26), ya que considera un mayor numero de combinaciones
de los parametros de la planta. De hecho en la formulacion variante en el tiempo, bajo
ciertas condiciones, se puede garantizar la estabilidad en bucle cerrado, mientras que
para la otra formulacion no. Ambas formulaciones, sin embargo, emplean predicciones
en bucle abierto, por lo que no tienen en cuenta en la prediccion de las salidas futuras
que la ley de control se aplica en bucle cerrado. Esto significa que las acciones de
control futuras, a lo largo del horizonte de control, no tienen en cuenta las salidas
predichas, ignorando el hecho de que las acciones de control futuras afectan a los
valores factibles de los parametros a lo largo del horizonte de prediccion. Otro hecho
que se ignora al emplear predicciones en bucle abierto es que solo se aplica la primera
de las componentes, y que las restantes, incluso para la secuencia optima, puede que no
coincidan con las que realmente se apliquen debido a perturbaciones o incertidumbres
no consideradas.
2.6.1. MMMPC con predicciones en bucle cerrado
Dado que es beneficioso considerar la realimentacion en las predicciones de la salida
Lee and Yu (1997) proponen una estrategia MMMPC que emplea predicciones en bucle
cerrado. Para ello se basan en el conocido principio de optimalidad de Bellman (emplea-
do por ejemplo para la derivacion del regulador LQ) (Bellman, 1961). Considerando
un horizonte de prediccion finito, el valor de la funcion de coste para la solucion del
problema mın-max desde t = k + p− 1 hasta t = k + p partiendo de xk+p−1 serıa:
Vk+pk+p−1(xk+p−1) = mın
uk+p−1∈V
maxθk+p−1∈Θ
xTk+pQpxk+p + uT
k+p−1Ruk+p−1
donde:
xk+p = A(θk+p−1)xk+p−1 +B(θk+p−1)uk+p−1
De igual manera, aplicando el principio de optimalidad de Bellman, desde t = k+p−2
hasta t = k + p el coste sera:
Vk+pk+p−2(xk+p−2) = mın
uk+p−2∈V
maxθk+p−2∈Θ
xTk+p−1Qpxk+p−1 + uT
k+p−2Ruk+p−2
+V k+pk+p−1(xk+p−1)
con:
xk+p−1 = A(θk+p−2)xk+p−2 +B(θk+p−2)uk+p−2
Es decir, V k+pk+p−1, depende de xk+p−1, que a su vez depende de xk+p−2, el valor optimo
de uk+p−2 y de θk+p−2 a traves de la ecuacion de prediccion anterior. Esta idea se puede
34 CONTROLADORES PARA EL PEOR CASO CON PARAMETROS ACOTADOS
aplicar hacia atras de manera que se llega a t = k:
Vk+pk (zk) = mın
uk∈V
maxθk∈Θ
xTk+1Qxk+1 + uT
kRuk + Vk+pk+1 (xk+1) (2.28)
cumpliendose que:
xk+1 = A(θk)zk +B(θk)uk
xk+1 ∈ X ∀θk ∈ Θ
El termino V k+pk+1 (xk+1) se puede calcular de manera recursiva usando:
Vk+pk+i−1(xk+i−1) = mın
uk+i−1∈V
maxθk+i−1∈Θ
xTk+iQixk+i + uT
k+i−1Ruk+i−1 (2.29)
+V k+pk+i (xk+i)
desde i = p hasta i = 2, con:
xk+i = A(θk+i−1)xk+i−1 +B(θk+i−1)uk+i−1
xk+i ∈ X ∀θk+i−1 ∈ Θ
tomando V k+pk+p (xk+p) = 0 y Q1 = · · · = Qp−1 = Q. El caracter de bucle cerrado de esta
estrategia se advierte si se tiene en cuenta que para obtener la senal de control para
xk+p se resuelve un problema de optimizacion donde interviene xk+p−1. Este a su vez,
no se calcula prediciendo a partir del estado actual del proceso mediante una secuencia
de actuaciones que se conocen de antemano (formulacion en bucle abierto), si no que
se obtiene al resolver un problema de optimizacion recurrente. Esto corresponde a la
aplicacion de la ley de control en bucle cerrado.
Una caracterıstica importante de esta estrategia es que el calculo de la senal de
control es un problema de optimizacion no lineal y no convexa aunque el sistema sea
lineal y el espacio de parametros convexo. Esto quiere decir que la resolucion en tiempo
real de este problema es inabordable. Esto es algo inherente a todas las formulaciones
MMMPC en bucle cerrado4, tal y como ocurre tambien en (Scokaert and Mayne, 1998)
(vease la seccion 2.7).
Lee and Yu (1997) proponen emplear una malla que discretice el espacio de estados,
obtener la solucion en estos puntos y emplear alguna tecnica de interpolacion cuando
el estado del proceso no coincida con los puntos de la malla.
4La solucion ideal a este problema pasarıa por obtener una solucion en forma explıcita tal y como se
presenta para otra estrategia MMMPC en bucle cerrado en (Bemporad et al., 2001). Desgraciadamente
esto no es siempre posible por lo que en la practica el uso de controladores MMMPC en bucle cerrado
esta muy limitado, de manera que tal y como se reconoce en (Mayne et al., 2000) tan solo se les debe
considerar (por ahora) como meras herramientas teoricas.
CAPITULO 2. PERSPECTIVA GENERAL DE LOS CONTROLADORES MIN-MAX MPC 35
2.6.2. Estabilidad de las estrategias presentadas
Las estrategias de control MMMPC en bucle cerrado (2.28) y en bucle abierto
con incertidumbre variante en el tiempo (2.27) presentadas en esta seccion garantizan
la estabilidad en bucle cerrado cuando se considera el caso de horizonte de predic-
cion infinito. Ademas para modelos FIR la estabilidad puede garantizarse, bajo ciertas
condiciones, con horizonte de prediccion finito. La demostracion de esta propiedad se
hace basandose en la idea de que el valor de la funcion de coste para horizonte infinito
decrece con el tiempo monotonamente (tecnica que ha sido aplicada en otros problemas
de control predictivo (Mayne and Michalska, 1990; Rawlings and Muske, 1993)).
En el caso de la formulacion en bucle cerrado (2.28) se establece que para un estado
zk con Q,R > 0, el sistema (2.25) bajo la ley de control vk = f∞(zk) es estable para
todas las secuencias de parametros factibles y sobre el conjunto de estados z0 para el
cual el coste con horizonte infinito esta acotado, es decir V ∞0 (z0) <∞.
La demostracion, que se omite por brevedad, se basa en probar que el coste para
horizonte infinito:
V ∞k = mın
uk∈V
maxθk∈Θ
mınuk+1∈V
maxθk+1∈Θ
· · · mınuk+q−1∈V
maxθk+q−1∈Θ
· · ·
∞∑
l=1
xTk+lQxk+l +
q−1∑
j=0
uTk+jRuk+j
decrece monotonamente con el tiempo, de manera que se demuestra que:
V ∞k+1 − V ∞
k ≤ −(zTk Qzk + vT
k Rvk)
En el caso de sistemas estables en bucle abierto se puede probar la estabilidad global
del sistema en bucle cerrado. Por otra parte, en caso de considerarse restricciones el
resultado enunciado sigue siendo valido siempre que las restricciones sean factibles.
En caso de que puedan presentarse problemas de factibilidad, existen alternativas em-
pleadas en control predictivo (Rawlings and Muske, 1993; Zheng and Morari, 1995),
con las que se puede seguir garantizando estabilidad.
En cuanto a la formulacion en bucle abierto con parametros inciertos variables en
el tiempo tambien se demuestra, usando la misma lınea argumental, que el sistema
es estable en bucle cerrado. No obstante, se debe cumplir que el coste con horizonte
infinito este acotado. Teniendo en cuenta que las predicciones son en bucle abierto
eso implica que los parametros sobre los que se considera la incertidumbre no pueden
corresponder a modos inestables del sistema. Por otra parte, no se puede garantizar
estabilidad en el caso de la formulacion con parametros inciertos invariantes. La razon
es que el valor de esos parametros que constituye el peor caso puede variar de un
36 CONTROLADORES PARA EL PEOR CASO CON PARAMETROS ACOTADOS
instante a otro por efecto de la realimentacion, por lo que no se puede garantizar que
el coste V ∞k sea monotonamente decreciente.
Las conclusiones de Lee and Yu (1997) sobre las estrategias presentadas valoran
favorablemente al MMMPC en bucle cerrado como opcion preferente. El MMMPC en
bucle abierto con incertidumbre variable en el tiempo se valora como compromiso en-
tre robustez y bajos requerimientos de calculo. Sin embargo, se advierte que el exceso
de conservadurismo de la formulacion en bucle abierto puede dar lugar a un compor-
tamiento pobre del controlador. Un hecho a destacar es que los autores consideran
que la estrategia en bucle abierto se debe considerar una aproximacion suboptima al
MMMPC en bucle cerrado, que es la verdadera estrategia de control predictivo robusto
basado en optimizacion mın-max.
Finalmente ademas de los resultados ya enunciados, los autores presentan un algo-
ritmo suboptimo para modelos FIR, derivan el MPC estandar a partir de la MMMPC
y presentan diversos ejemplos donde se comparan las diversas estrategias presentadas.
2.6.3. MMMPC en bucle abierto para un conjunto acotado
de matrices de entrada
El trabajo anterior tiene su continuacion en (Lee and Cooley, 2000)5, en el que
se presenta una estrategia MMMPC menos ambiciosa que la presentada en (Lee and
Yu, 1997). En este caso se consideran predicciones en bucle abierto e incertidumbres
solo en la matriz de entrada. El sistema que se considera tendra la forma:
zk+1 = Azk +B(ϑk)vk (2.30)
Todos los elementos de B(ϑ) se suponen funciones afines de ϑ, el cual pertenece al
conjunto compacto Ω. Tal y como se planteaba en (Lee and Yu, 1997) se consideran
dos casos dependiendo de si el vector de incertidumbres varıa o no en el tiempo. Por
otra parte se tratan procesos estables o integradores.
5Aunque publicado en Automatica en 2000, este trabajo realmente se presento en primer lugar en
la Conferencia de Control Americana (ACC) de 1997.
CAPITULO 2. PERSPECTIVA GENERAL DE LOS CONTROLADORES MIN-MAX MPC 37
2.6.3.1. Plantas estables
En el caso de considerar incertidumbres variables en el tiempo la senal de control
se hallara resolviendo:
mınuk,···,uk+m−1
maxθk,···,θk+m−1
[
Vk ,
∞∑
i=1
xTk+iQxk+i +
m−1∑
j=0
uTk+jRuk+j
]
(2.31)
obteniendose las predicciones mediante:
xk+i = Aizk +i∑
j=1
Ai−jB(θk+j−1)uk+j−1 i = 1, · · · ,∞
con:
uk+j ∈ V j = 0, · · · ,m− 1
uk+m+l = 0, l ≥ 0 (2.32)
y θk+j ∈ Ω para j = 0, · · · ,m − 1. Este es un problema en el que el horizonte de
prediccion es infinito (no ası el de control). Un problema de este tipo es equivalente a
uno de horizonte finito, pues se puede probar que:
Vk =m−1∑
i=1
xTk+iQxk+i + xk+mQxk+m +
m−1∑
j=0
uTk+jRuk+j
donde Q es la solucion de la ecuacion de Lyapunov:
ATQA+Q = Q
El problema mın-max resultante es un problema de optimizacion convexo y por tanto
tratable, aunque los requerimientos computacionales para resolverlo puedan ser muy
altos.
Para esta estrategia se puede garantizar la estabilidad robusta para cualquier valor
inicial del estado y de los parametros de ϑk.
En el caso de considerarse que el vector de parametros inciertos no varıa en el
tiempo no se puede garantizar la estabilidad (algo que ya se establecio para el caso mas
general presentado en (Lee and Yu, 1997)). Sin embargo, el problema de optimizacion
resultante es mucho mas facil de resolver. Por tanto, en caso de aplicar una estrategia de
incertidumbre invariante, se debe emplear alguna de las tecnicas que han aparecido para
mejorar la robustez del control predictivo como por ejemplo una restriccion contractiva
sobre el estado (Zheng, 1995) o bien imponer para todos los valores extremos de la
incertidumbre que el coste alcanzado en el optimo sea decreciente (Badgwell, 1997).
38 CONTROLADORES PARA EL PEOR CASO CON PARAMETROS ACOTADOS
2.6.3.2. Procesos con un integrador
En el caso de que el modelo contenga un integrador (hecho frecuente pues es nece-
sario para rechazar perturbaciones constantes), el modelo se puede expresar como:
[
zSk+1
zIk+1
]
=
[
AS 0
0 I
] [
zSk
zIk
]
+
[
BS(ϑk)
BI(ϑk)
]
vk (2.33)
donde AS tiene todos sus autovalores dentro del cırculo unidad. Por otra parte, un
criterio cuadratico se podra expresar como:
∞∑
k=0
[
(zSk )T (zI
k)T]
[
QS QSI
QIS QI
] [
zSk
zIk
]
+ vTk Rvk
donde QS, QI > 0 y QTIS = QSI .
Si para este tipo de procesos se considera un problema mın-max analogo al formula-
do en (2.31) surgen problemas. Esto se debe a que para mantener acotado el coste con
horizonte infinito (requisito para asegurar la estabilidad) los modos inestables deben
ser regulados a cero dentro del horizonte de control, y esto no es siempre posible. Se
necesita por tanto una formulacion diferente. Considerese el siguiente problema mın-
max:
mınuk,···,uk+m−1∈V
maxθk,···,θk+m−1∈Ω
[
1
p
(
p∑
i=1
xTk+iQxk+i +
m−1∑
j=0
uTk+jRuk+j
)]
Si p → ∞ los modos estables decaen exponencialmente, por lo que los modos inte-
gradores dominan y el valor de la funcion de coste se aproxima a (xIk+m)TQI(x
Ik+m).
De ahı que el problema mın-max se puede redefinir como:
mınuk,···,uk+m−1∈V
maxθk,···,θk+m−1∈Ω
[
(xIk+m)TQI(x
Ik+m)
]
El problema anterior puede sufrir problemas de condicionamiento numerico que lleven a
la existencia de mas de una solucion. Para evitar esto se anade un termino que penalice
el esfuerzo de control:
mınuk,···,uk+m−1∈V
maxθk,···,θk+m−1∈Ω
[
(xIk+m)TQI(x
Ik+m) + λ
m−1∑
j=0
uTk+jRuk+j
]
(2.34)
con λ > 0.
La ley de control obtenida mediante la resolucion del problema (2.34) estabiliza
al sistema (2.33) para cualquier valor de las condiciones iniciales z0 y para cualquier
CAPITULO 2. PERSPECTIVA GENERAL DE LOS CONTROLADORES MIN-MAX MPC 39
secuencia de parametros ϑk ∈ Ω, k ≥ 0. La unica condicion es que la matriz de entrada
BI(ϑ) tenga rango completo por filas para todo ϑ ∈ Ω.
Tambien en este caso se da un algoritmo que considera incertidumbres constantes, y
como en el caso anterior no se puede garantizar la estabilidad a menos que se apliquen
tecnicas especıficas para ello.
Los resultados presentados en este trabajo se ilustran mediante ejemplos que ponen
de manifiesto la superioridad de las formulaciones MMMPC sobre estrategias MPC con
horizonte de prediccion infinito. Las leyes de control presentadas en este trabajo no son
tan robustas como las que emplean predicciones en bucle cerrado o incertidumbres en
la matriz A, pero tienen la importante ventaja de calcularse mediante la resolucion
de problemas convexos, que aunque pueden ser costosos de resolver, son tratables, a
diferencia de las estrategias presentadas en (Lee and Yu, 1997).
2.7. Min-Max MPC con predicciones en bucle ce-
rrado de Scokaert y Mayne (1998)
Como ya pusieron de manifiesto Lee and Yu (1997), uno de los inconvenientes del
MMMPC tradicional (Campo and Morari, 1987) en sus diversas formulaciones es que
al emplear predicciones en bucle abierto no se esta teniendo en cuenta que la senal
de control en realidad se aplica en bucle cerrado, por lo que se estan ignorando los
efectos que esto conlleva (una menor sensibilidad ante perturbaciones por ejemplo).
Esto proporciona un control mas conservador y en caso de que se consideren restric-
ciones es muy probable que aparezcan problemas de factibilidad, por lo que la ley de
control serıa inaplicable. Scokaert and Mayne (1998) proponen una estrategia MMM-
PC en bucle cerrado6 que se caracteriza por considerar una familia de secuencias de
actuaciones en lugar de una sola secuencia de actuaciones. Tambien se garantiza la
estabilidad mediante un esquema de control dual, segun el cual, se emplea el MMMPC
para llevar el estado del sistema a un conjunto invariante robusto de control en el cual
se usa un controlador lineal estandar para llevarlo al origen. Otra caracterıstica es que
se proponen dos versiones del algoritmo, una de horizonte fijo y otra con horizonte
variable.
6En este trabajo no se hace mencion alguna a la estrategia de MMMPC en bucle cerrado que
proponen Lee and Yu (1997) a pesar de haber publicado sus resultados con anterioridad. La razon es
que el trabajo de Scokaert and Mayne (1998) fue enviado con anterioridad a la publicacion de (Lee
and Yu, 1997), lo que explica que la idea de MMMPC en bucle cerrado presentada sea diferente de la
presentada por Lee y Yu.
40 MIN-MAX MPC EN BUCLE CERRADO DE SCOKAERT Y MAYNE
El modelo que se considera para el sistema es lineal e invariante en el tiempo:
xt+1 = Axt +But + wt
donde (A,B) definen un sistema controlable y wt ∈ W es una perturbacion aditiva de
valor desconocido pero acotado. Por su parte, W es un conjunto compacto, convexo y
que contiene un entorno abierto del origen.
Como se ha mencionado al principio de esta seccion, la estrategia de control emplea
un control con dos modos correspondientes a un controlador ((exterior)) y otro ((interior))
en un invariante robusto de control X0. El controlador exterior tiene como objetivo
llevar el estado del proceso al invariante X0. El controlador interior esta disenado para
mantener el estado del proceso en X0 a pesar de las perturbaciones. Este controlador
interior es lineal y tiene la forma u = −Kx donde K cumple que (A−BK)s = 0 para
algun entero s. El invariante robusto de control se tomara como:
X0 = W + FW + · · · + F s−1W
donde F = A−BK.
El controlador exterior es un MMMPC en el que, como se vera a continuacion, se
considera que el control es en bucle cerrado. En el instante t se pueden considerar una
serie de realizaciones de la perturbacion que se denotaran por wlj|t donde l ∈ L son los
ındices que permiten hacer referencia a las realizaciones. Por otra parte ulj|t denota
la secuencia de actuaciones asociada con la l-esima realizacion de la perturbacion. Se
tendrıa por tanto:
xlj+1|t = Axl
j|t +Bulj|t + wl
j|t l ∈ L
donde xlt|t = xt para todo l ∈ L. La senal de control se calcula resolviendo:
mınul
j|tmaxl∈L
N−1∑
j=0
L(xlt+j|t, x
lt+j|t) (2.35)
sujeto a:
xlj|t ∈ X j > t ∀l ∈ L
ulj|t ∈ U j ≥ t ∀l ∈ L
xlt+N |t ∈ X0 ∀l ∈ L (2.36)
xl1j|t = xl2
j|t ⇒ ul1j|t = ul2
j|t j ≥ t ∀l1, l2 ∈ L (2.37)
donde la funcion de coste L : Rn × R
m → R es semidefinida positiva. La restriccion
(2.36) es la que garantiza la estabilidad en esta estrategia de control.
CAPITULO 2. PERSPECTIVA GENERAL DE LOS CONTROLADORES MIN-MAX MPC 41
La nocion de bucle cerrado se introduce en esta formulacion por el hecho de que se
considera una posible secuencia de actuaciones por cada realizacion de la perturbacion.
Esto supone una gran cantidad de grados de libertad que se pueden emplear para
garantizar que se lleva al sistema al invariante X0 para cualquier realizacion de la
perturbacion. Se impone que para un mismo estado, la accion de control en cada una
de las secuencias consideradas debe ser la misma. Esto es lo que se consigue con la
restriccion (2.37), llamada de causalidad. De esta manera la actuacion para el instante
j depende solo de la prediccion del estado en j y no de la sucesion de estados recorridos
hasta llegar a xj|t.
El problema (2.35) considera todas las posibles realizaciones de la perturbacion,
por lo que se convierte en un problema de optimizacion infinito-dimensional (pues se
considera una secuencia de actuaciones por cada realizacion). Sin embargo si W es
un politopo convexo, el modelo es lineal y L es convexa, solo han de considerarse los
vertices de W en la optimizacion, de manera que el numero de variables a considerar
se vuelve finito. De esta manera el problema (2.35) se puede reescribir como:
mınul
j|tmaxl∈Lv
N−1∑
j=0
L(xlt+j|t, x
lt+j|t) (2.38)
sujeto a:
xlj|t ∈ X j > t ∀l ∈ Lv
ulj|t ∈ U j ≥ t ∀l ∈ Lv
xlt+N |t ∈ X0 ∀l ∈ Lv
xl1j|t = xl2
j|t ⇒ ul1j|t = ul2
j|t j ≥ t ∀l1, l2 ∈ Lv
donde Lv es el conjunto de vertices l de manera que wlj|t toma valores solo en los
vertices de W . De esta manera, como el numero de vertices es finito, el problema puede
ser tratado con tecnicas mas eficientes (aunque como se vera mas adelante no es un
problema que se pueda resolver en tiempo real).
Como se ha mencionado anteriormente, la idea de bucle cerrado es incorporada a
la ley de control porque se considera una secuencia de actuaciones para cada posible
realizacion extrema de la perturbacion, de manera que si N = 3 y W ≡ w ∈ R3 :
w− ≤ wi ≤ w+ i = 1, 2, 3 se tendrıan 23 = 8 realizaciones extremas asociadas a 8
secuencias de actuaciones [ult|t, u
lt+1|t, u
lt+2|t] con l = 1, · · · , 8. Esto darıa 24 variables de
decision. Sin embargo, con la restriccion de causalidad este numero se reduce bastante.
Para ilustrar este hecho considerese la figura 2.1, en la que se muestran las trayectorias
posibles del estado del proceso bajo las 8 realizaciones extremas de la perturbacion.
Puede observarse que las ocho secuencias de actuaciones comienzan con la misma senal
42 MIN-MAX MPC EN BUCLE CERRADO DE SCOKAERT Y MAYNE
w−
ut+12
t
w+
w+
xt+12
xt+11
xt+21
xt+31
xt+32
xt+33
xt+34
xt+35
xt+36
xt+37
xt+38
xt+22
xt+23
xt+24
w− w
+
w+
t+3
w+
w+
ut+12
w− u
t
w−
w−
w−
w+
w−
ut+24
ut
ut+23
ut+11
ut+11
ut+22
ut+22
ut+24
ut+23
ut+21
t+2 t+1
ut+21
xt
Figura 2.1: Posibles trayectorias del estado
de control (ut), debido a la restriccion de causalidad. A partir de ahı se puede pasar
a dos estados distintos en t + 1, dependiendo de si se considera que la perturbacion
puede ser w+ o w−. Las secuencias que parten de cada uno de esos dos estados tambien
comienzan por la misma actuacion y ası sucesivamente, hasta obtener 7 diferentes
valores de la senal de control a optimizar, de manera que el vector de variables a
optimizar serıa:
u =[
ut|t u1t+1|t u2
t+1|t u1t+2|t u2
t+2|t u3t+2|t u4
t+2|t
]
De la ecuacion anterior se desprende que, aunque el numero de variables de decision
es menor que si no se considerase la restriccion de causalidad, sigue siendo mucho mas
grande que en la formulacion en bucle abierto donde solo se considerarıan 3 variables.
Este ejemplo pone de manifiesto el principal problema de esta formulacion: el alto coste
computacional, que relega a este tipo de controladores a ser una mera herramienta
teorica (Mayne et al., 2000).
En cuanto a la estabilidad en bucle cerrado del sistema, Scokaert and Mayne (1998)
demuestran que la ley de control que resulta de aplicar la solucion de (2.35) y (2.38)
mediante la estrategia de horizonte deslizante es capaz de llevar el estado del sistema
al invariante robusto X0 asimptoticamente.
CAPITULO 2. PERSPECTIVA GENERAL DE LOS CONTROLADORES MIN-MAX MPC 43
El trabajo de Scokaert and Mayne (1998) no ofrece una comparativa entre la formu-
lacion en bucle abierto y la que aquı se ha presentado. En (Megıas et al., 2001) se aplica
esta formulacion en un MMMPC con horizonte infinito, funcion de coste cuadratica e
incertidumbres globales acotadas comparandose con la formulacion en bucle abierto.
2.7.1. Controlador con horizonte de prediccion variable
Ademas del controlador MMMPC con horizonte fijo que se ha presentado, los au-
tores presentan otro de horizonte variable, el cual elimina la necesidad de tener que
escoger el horizonte de prediccion a la vez que se obtiene un mejor rendimiento. La
formulacion de este controlador se diferencia de la anterior en que el horizonte de
prediccion se transforma en una variable de decision mas y en que la funcion de coste
es el propio horizonte, es decir, la secuencia de actuaciones se obtendra resolviendo:
mınul
j|t,N
maxl∈Lv
N (2.39)
sujeto a:
xlj|t ∈ X j > t ∀l ∈ Lv
ulj|t ∈ U j ≥ t ∀l ∈ Lv
xlt+N |t ∈ X0 ∀l ∈ Lv
xl1j|t = xl2
j|t ⇒ ul1j|t = ul2
j|t j ≥ t ∀l1, l2 ∈ Lv
Dado que el ındice a minimizar es el propio horizonte de prediccion, el controlador
MMMPC tratara de llevar el estado del proceso al invariante robusto en el menor
numero de intervalos, en un comportamiento que recuerda al control dead-beat . No se
pondera la manera de llegar a ese invariante robusto, por lo que el control puede ser
muy brusco. Una vez en el invariante el controlador interior es el que se encarga de
regular el estado del proceso al origen, garantizandose la estabilidad en bucle cerrado.
Los autores demuestran que el controlador externo MMMPC de horizonte variable
es capaz de llevar el estado al invariante robusto X0 independientemente del valor que
tome la perturbacion, por lo que se garantiza la estabilidad en bucle cerrado tambien
en este caso.
Esta estrategia sin embargo, no se puede resolver de manera eficiente, pues dado
que N es una variable entera, el problema resultante es de programacion mixta entera.
Afortunadamente, dado que solo hay una variable entera, la solucion pasa por no
emplear un algoritmo de programacion mixta entera sino que se ha de buscar cual es el
44 ESTRATEGIAS DE CONTROL QUASI MIN-MAX MPC
valor de N mas bajo para el cual existe una secuencia de actuaciones, tal que el estado
puede ser llevado al invariante robusto y satisface el resto de las restricciones.
En conclusion, las estrategias presentadas por Scokaert and Mayne (1998) ofrecen
otra forma de incorporar la nocion de bucle cerrado al problema de optimizacion. Si en
(Lee and Yu, 1997) esto se conseguıa resolviendo una serie de problemas de optimizacion
anidados, inspirados en el principio de optimalidad de Bellman, en este caso se mantiene
una secuencia de actuaciones por cada realizacion extrema de la perturbacion. De este
modo no se exige a un solo perfil de control que regule frente a todas las realizaciones
de la perturbacion, sino que se dispone de mas grados de libertad para conseguir esto.
Otras diferencias estriban en la forma de garantizar la estabilidad, en un caso mediante
la adopcion de un horizonte de prediccion infinito y en el otro mediante un invariante
robusto de control. Ambas formulaciones estan limitadas, sin embargo, por el coste que
conlleva resolver el problema mın-max. En la seccion 2.10 se presentara una estrategia
MMMPC en bucle cerrado que aunque conlleva la resolucion de un problema complejo,
se puede expresar en forma explıcita, por lo que no se requiere mucho calculo en tiempo
real.
2.8. Estrategias de control Quasi Min-Max MPC
En esta seccion se presentaran los controladores publicados en (Lu and Arkun,
2000b; Lu and Arkun, 2000a; Lu and Arkun, 2001), los cuales son en esencia una mejora
de (Kothare et al., 1996). Se consideran sistemas lineales de parametros variables en
el tiempo. La principal diferencia con (Kothare et al., 1996) consiste en separar la
primera de las componentes de la secuencia de actuacion, de manera que sobre ella
no se considera incertidumbre. Ası se reduce el conservadurismo presente en todas las
formulaciones MMMPC, y se aumenta la region del espacio de estados para la cual se
garantiza la estabilidad. Por otra parte, dado que la incertidumbre solo se considera
a partir de k + 2, se asume que se pueden medir los parametros del sistema en cada
instante, aunque se desconoce su evolucion futura. Al usarse los parametros medidos
para determinar la accion de control, este controlador emplea una adaptacion del tipo
usado en las tecnicas de planificacion de la ganancia (gain scheduling).
El modelo considerado corresponde a un sistema lineal de parametros variantes en
el tiempo (LPV) cuyas matrices son funciones afines de un vector de parametros p(k):
x(k + 1) = A(p(k))x(k) +B(p(k))u(k)
CAPITULO 2. PERSPECTIVA GENERAL DE LOS CONTROLADORES MIN-MAX MPC 45
donde:
A(p(k)) =l∑
j=1
pj(k)Aj B(p(k)) =l∑
j=1
pj(k)Bj
cumpliendose que p(k) pertenece a un politopo convexo P definido por los valores pj(k)
tales quel∑
j=1
pj(k) = 1, con 0 ≤ pj(k) ≤ 1. Por otra parte, al variar p(k) en el politopo
P las matrices del sistema varıan en un politopo Ω definido por sus vertices:
[A(p(k)), B(p(k))] ∈ Ω = Co [A1, B1], [A2, B2], · · · , [Al, Bl]
donde [Ai, Bi] es el vertice que se obtiene cuando pi = 1 y pj = 0 para j 6= i. Se supone
que el vector de parametros p(k) y el estado x(k) se pueden medir en tiempo real y
que la dinamica de la planta coincide con la del modelo. Por tanto, en el instante k se
conoce la dinamica de la planta pero no como va a evolucionar a lo largo del horizonte
de prediccion.
La funcion de coste empleada en este trabajo se divide en dos partes:
J∞0 (k) = x(k|k)TQx(k|k) + u(k|k)TRu(k|k) + J∞
1 (k)
donde:
J∞1 (k) =
∞∑
i=1
x(k + i|k)TQx(k + i|k) + u(k + i|k)TRu(k + i|k)
2.8.1. Quasi-Min-Max MPC sin restricciones
La senal de control se calculara aplicando, segun la estrategia de horizonte deslizante,
la primera componente de la solucion de:
mınU∞
0 (k)max
[A(p(k+i)),B(p(k+i))]∈Ω i≥0J∞
0 (k)
con U∞0 (k) = [u(k|k), U∞
1 (k)] donde u(k|k) es la senal de control que realmente se
aplica y el resto de componentes vienen dados por una ley de realimentacion del vector
de estados cuya matriz no depende de p(k) (igual que en (Kothare et al., 1996)):
U∞1 (k) : u(k + i|k) = F (k)x(k + i|k) i ≥ 1 (2.40)
o bien por una realimentacion del estado dependiente de p(k):
U∞1 (k) :
u(k + i|k) =l∑
j=1
pj(k + i)Fj(k)x(k + i|k) i ≥ 1
(2.41)
46 ESTRATEGIAS DE CONTROL QUASI MIN-MAX MPC
Siguiendo la idea de Kothare et al. (1996) en lugar de resolver el problema mın-max
se deriva una cota superior de J∞1 (k) de manera que:
max[A(p(k+i)),B(p(k+i))]∈Ω i≥0
J∞1 (k) ≤ V (x(k + 1|k)) = x(k + 1|k)TP (k)x(k + 1|k)
con P (k) > 0.
El Quasi-Min-Max MPC minimiza la cota superior del peor caso de J∞1 y el coste
asociado a u(k|k), es decir:
mınu(k|k),P (k)
x(k|k)TQx(k|k) + u(k|k)TQu(k|k) + x(k + 1|k)TP (k)x(k + 1|k) (2.42)
El algoritmo se denomina ((Quasi)) pues la componente que se aplica (u(k|k)) no se con-
sidera en la parte ((max)) de la optimizacion (la cual en realidad se realiza minimizando
la cota de J∞1 ). El problema (2.42) se puede reformular usando LMIs, resultando ser
equivalente a:
mınγ,u(k|k),Q(k),Y (k)
γ (2.43)
sujeto a:
1 x(k + 1|k)T x(k|k)TQ12 u(k|k)TR
12
x(k + 1|k) Q(k) 0 0
Q12x(k|k) 0 γI 0
R12u(k|k) 0 0 γI
≥ 0
Q(k) ϑT Q(k)Q12 Y (k)TR
12
ϑ Q(k) 0 0
Q12 Q(k) 0 γI 0
R12Y (k) 0 0 γI
≥ 0 ∀j = 1, · · · , l
con x(k + 1|k) = [A(p(k))x(k|k) +B(p(k))u(k|k)], ϑ = AjQ(k) + BjY (k) y Q(k) =
Q(k)T . La ganancia de la ley de control (2.40) viene dada por F (k) = Y (k)Q−1(k),
de manera que se garantiza que los estados futuros evolucionan hacia un invariante
elipsoidal. En el caso de emplearse la ley de control (2.41), el problema anterior no
necesita ser modificado si Bj = B para todo j = 1, · · · , l. Si esto no ocurre en vez de
Y (k) se tendrıa Yj(k) y las matrices vendrıan dadas por Fj(k) = Yj(k)Q−1(k).
Los autores demuestran que la solucion de (2.43), implementada mediante la es-
trategia de horizonte deslizante, estabiliza al sistema si se llega a una solucion factible.
CAPITULO 2. PERSPECTIVA GENERAL DE LOS CONTROLADORES MIN-MAX MPC 47
2.8.2. Quasi-Min-Max MPC con restricciones
En el caso de considerarse restricciones Lu and Arkun (2000b) proponen dos al-
ternativas. La primera consiste en formular las restricciones sobre las salidas y la
senal de actuacion como LMIs e incluirlas en el problema (2.43), de manera que se
seguira garantizando la estabilidad del sistema en bucle cerrado mientras que haya
soluciones factibles. En estas restricciones se separan las que se imponen sobre y(k+1)
y u(k), de las que se imponen sobre el resto de las entradas y predicciones de la salida.
La razon de esto es que para las primeras componentes es posible formular las restric-
ciones directamente mientras que para las otras no. Estas restricciones se formulan
como:
|u(k|k)| ≤ umax (2.44)
‖C[A(p(k))x(k|k) +B(p(k))u(k|k)]‖2 ≤ ymax (2.45)
donde C es la matriz de salida del sistema que cumple que y(k + 1) = Cx(k + 1). Las
restricciones sobre las restantes entradas se verifican si existe una matriz simetrica X
tal que se verifica:(
X Y
Y T Q
)
≥ 0 con Xii ≤ u2max
De igual manera, la restriccion sobre el resto de las salidas es equivalente a la siguiente
LMIs:(
Q [AjQ+BjY ]TCT
C[AjQ+BjY ] y2max
)
≥ 0 j = 1, · · · , l
Otra alternativa es imponer restricciones solo sobre y(k + 1) y u(k) y anadir una
restriccion que asegure que la funcion de coste decrece monotonamente, de manera que
se garantice estabilidad, es decir:
φ(k) < φ(k − 1) (2.46)
con:
φ(k) = x(k|k)TQx(k|k) + u(k|k)TQu(k|k) + x(k + 1|k)TP (k)x(k + 1|k)
El problema (2.42) junto con las restricciones (2.44) y (2.45) y la restriccion (2.46) es
equivalente al siguiente problema de optimizacion basado en LMIs:
mınγ,u(k|k),Q(k),Y (k)
γ (2.47)
sujeto a:
γ x(k + 1|k)T x(k|k)TQ12 u(k|k)TR
12
x(k + 1|k) Q(k) 0 0
Q12x(k|k) 0 I 0
R12u(k|k) 0 0 I
≥ 0
48 ESTRATEGIAS DE CONTROL QUASI MIN-MAX MPC
φ(k − 1) x(k + 1|k)T x(k|k)TQ12 u(k|k)TR
12
x(k + 1|k) Q(k) 0 0
Q12x(k|k) 0 I 0
R12u(k|k) 0 0 I
> 0
Q(k) ϕT Q(k)Q12 Y (k)TR
12
ϕ Q(k) 0 0
Q12 Q(k) 0 I 0
R12Y (k) 0 0 I
≥ 0 ∀j = 1, · · · , l
(
u(k|k) − umax
−umax − u(k|k)
)
≤ 0
(
C[A(p(k))x(k|k) +B(p(k))u(k|k)] − ymax
−ymax − C[A(p(k))x(k|k) +B(p(k))u(k|k)]
)
≤ 0
con ϕ = AjQ(k)+BjY (k) y Q(k) = Q(k)T . La ganancia de la ley de control vendra dada
por F (k) = Y (k)Q−1.
La estrategia de control resultante tiene la estabilidad en bucle cerrado garantizada
siempre que haya soluciones factibles. El uso de la restriccion de estabilidad (2.46)
aumenta la region del espacio de estados para la cual existen soluciones factibles, por
lo que es preferible su uso.
De los ejemplos simulados que aportan los autores se deduce que esta estrategia
presenta un menor conservadurismo que la estrategia de Kothare et al. (1996). Esto se
traduce en un mejor comportamiento del sistema en bucle cerrado y un aumento de la
region del espacio de estados para los que la estabilidad en bucle cerrado esta garanti-
zada.
Finalmente, hay que recalcar que ademas de la particularidad de ser ((Quasi)) mın-
max, el controlador descrito en esta seccion presenta una capacidad de adaptacion
similar a la de las tecnicas de planificacion de la ganancia. La razon es que la accion
de control que realmente se aplica, es decir u(k|k), depende (a traves del problema de
optimizacion) de los parametros p(k) que se estiman en tiempo real. Debido a esto los
autores se refieren a estos controladores como Scheduling Quasi-Min-Max MPC.
2.8.3. Actualizacion del politopo Ω
En (Lu and Arkun, 2000a) se presenta una modificacion al algoritmo anterior que
implica actualizar el politopo Ω, a la vez que se mantiene definido por el menor numero
CAPITULO 2. PERSPECTIVA GENERAL DE LOS CONTROLADORES MIN-MAX MPC 49
posible de vertices. Esto viene motivado por el hecho de que, tal y como se desprende de
ejemplos simulados, cuantos menos vertices tenga el politopo Ω menos probable sera que
aparezcan problemas de factibilidad (y por tanto de perdida de estabilidad). Por otra
parte, tambien sera mas sencillo resolver el problema de optimizacion correspondiente.
La manera de solucionar esto es sencilla, y pasa por considerar, que una vez que se
mide el vector de parametros p(k), los parametros futuros estaran acotados:
pj(k) + ∆pj(k) ≤ pj(j + i) ≤ pj(k) + ∆pj(k)
Por otra parte, la matriz de transicion de estados futura A(p(k+ i|k)) se puede escribir
como:
A(p(k + i|k)) =L∑
j=1
(pj(k) + ∆pj(k))Aj
de manera que se pueden definir dos matrices:
A1 =L∑
j=1
(pj(k) + ∆pj(k))Aj = A(k) + ∆A(k) (2.48)
A2 =L∑
j=1
(pj(k) + ∆pj(k))Aj = A(k) + ∆A(k) (2.49)
y se considera entonces que A(p(k + i|k)) pertenece a un nuevo politopo Ω(k):
Ω(k) = CoA1, A2
el cual se actualiza en cada periodo de muestreo al leer p(k). Los valores ∆pj(k) y
∆pj(k) se tratan como parametros de sintonıa. Al reemplazar el politopo Ω por Ω(k)
se mejora el rendimiento del controlador y se reducen los problemas de factibilidad.
2.8.4. Extension a sistemas no lineales
En (Lu and Arkun, 2001) se presenta la extension de esta estrategia a sistemas no
lineales. Para ello se considera que se conoce un modelo no lineal del proceso, del cual
se obtiene un modelo linealizado que se utiliza como dinamica del proceso para ese
instante de muestreo. Para la dinamica en los instantes futuros se emplea un modelo
LPV que se supone varıa en un politopo Ω. El algoritmo de control empleado es el
Quasi-Min-Max MPC con restricciones descrito anteriormente.
50 CONTROLADORES MIN-MAX MPC BASADOS EN SERIES DE FUNCIONES
2.9. Controladores Min-Max MPC basados en se-
ries de funciones
La mayorıa de los controladores MMMPC estan basados en modelos en espacio de
estados o funcion de transferencia (modelos CARIMA o CARMA). Otros estan basa-
dos en la respuesta impulsional (FIR). Sin embargo existen otras maneras de mod-
elar sistemas que, aunque no muy extendidas, pueden presentar ventajas sobre los
metodos tradicionales. Una de estas formas es la que emplea expansiones en series de
funciones ortonormales. En estas representaciones se aproxima la ((funcion)) que da la
salida del proceso, por una suma ponderada de una serie de funciones de transferencia
ortonormales entre sı que forman una base. Este tipo de modelos se han empleado en
controladores MMMPC (Oliveira et al., 2000; Oliveira et al., 1996) con las siguientes
caracterısticas:
La funcion de coste es convexa en la incertidumbre, por lo que el maximo con
respecto a la incertidumbre se encuentra en uno de los vertices del politopo que
contiene a los posibles valores de los parametros inciertos. Por otra parte solo
existe un mınimo, lo que implica que no hay problemas de optimos locales. A
diferencia de otras formas de modelar el proceso y la incertidumbre como la de
incertidumbres globales acotadas (Camacho and Bordons, 1995), en este caso
estas propiedades se verifican para todos los parametros del modelo.
Los sistemas estables se representan con menos parametros que por ejemplo los
modelos FIR, de manera que se reduce la cantidad de calculos necesarios y se
simplifican las tareas de identificacion robusta.
A la hora de identificar un proceso con un modelo basado en expansion de fun-
ciones ortonormales no es necesario conocer el retraso y orden del sistema.
Se puede aplicar a procesos integradores y con restricciones en la entrada.
La estabilidad del sistema en bucle cerrado se garantiza estableciendo condiciones
suficientes en los parametros del controlador.
El modelo del sistema que se utiliza toma la forma:
y(k) =n∑
i=1
ci(εi)Φi(z−1)u(k) (2.50)
donde Φi(z−1) para i = 1, · · · , n es un conjunto de funciones de transferencia ortonor-
males que forman la base que se usa en la expansion en serie. Los coeficientes ci(εi)
CAPITULO 2. PERSPECTIVA GENERAL DE LOS CONTROLADORES MIN-MAX MPC 51
caracterizan la dinamica del proceso y se consideran desconocidos pero acotados, es
decir cmini ≤ ci(εi) ≤ cmax
i , para i = 1, · · · , n, donde εi representa la incertidumbre
sobre el coeficiente ci. Si la salida de Φi(z−1) se denota por li(k), la salida del proceso
se podra reescribir como:
y(k) =n∑
i=1
ci(εi)li(k) (2.51)
Los parametros ci(εi) se pueden calcular a partir de los parametros de la respuesta
impulsional del sistema. Sea h(k) el conjunto de parametros de la respuesta impul-
sional, definido como:
h(k) , h(k) + εh(k)δh(k) : |εh(k)| ≤ 1
donde h(k) es el valor medio de h(k), δh(k) ≥ 0 es el valor absoluto de la maxima
desviacion de h(k) con respecto a su valor medio y εh(k) representa la incertidumbre
sobre el coeficiente h(k). De esta manera los coeficientes del modelo vendran dados
por:
ci =∞∑
k=0
h(k)Φi(z−1)δ(k)
donde δ(k) es un impulso unitario. De lo anterior se puede obtener que:
ci(εi) = ci + εiδci
donde |εi| ≤ 1 y ci y δci son el valor medio y desviacion maxima de ci(εi) que vienen
dados por:
ci =∞∑
k=0
h(k)Φi(z−1)δ(k) δci =
∞∑
k=0
δh(k)Φi(z−1)δ(k)
Como funciones ortonormales Oliveira et al. (2000) emplean funciones de Laguerre
y Kautz (Wahlberg and Makila, 1996). Estas funciones se caracterizan porque emplean
la dinamica dominante del sistema, la cual puede venir dada por un polo real (p) o un
par de polos complejos conjugados (p,p∗). Usando estas funciones el modelo (2.51) se
puede reescribir como:
l(k + 1) = Al(k) + bu(k) (2.52)
y(k) = cT (ε)l(k)
con:
l(k) = [l1(k), · · · , ln(k)]T (2.53)
c(ε) = c+ δc(ε) (2.54)
52 CONTROLADORES MIN-MAX MPC BASADOS EN SERIES DE FUNCIONES
donde la matriz A y el vector b se calculan usando el polo p y el numero de elementos
de la expansion en serie.
En (Oliveira et al., 2000) se presentan dos controladores MMMPC que emplean el
modelo anterior. El primero emplea un coste cuadratico igual al utilizado en (Camacho
and Bordons, 1995) para la norma cuadratica:
mın∆u
maxε∈Ω
N2∑
j=N1
(y(k + j|k, ε) − w(k + j))2 +Nu∑
j=1
λ∆u2(k + j − 1|k) (2.55)
s.a.
umin ≤ u(k + j − 1|k) ≤ umax ∀j = 1, · · · , Nu
∆umin ≤ ∆u(k + j − 1|k) ≤ ∆umax ∀j = 1, · · · , Nu
Las predicciones de la salida del proceso vendran dadas por:
y(k + j|k, ε) = y(k) + cT (ε)(Kj − I)∆l(k) + cT (ε)Nu∑
m=1
Kj−mb∆u(k +m− 1|k) (2.56)
donde Kj =∑j
i=0Ai y ∆l(k) = l(k) − l(k − 1) con l(k) = 0 para k ≤ 0.
Las predicciones son una funcion afın de la incertidumbre, por lo que la funcion de
coste es convexa en la incertidumbre y en ∆u, de manera que el maximo de la funcion
de coste con respecto a la incertidumbre estara en uno de los vertices de Ω, lo cual
implica que el problema de optimizacion, aunque costoso, sera tratable. Por otra parte
el mınimo con respecto a ∆u sera unico, por lo que no se produciran problemas de
mınimos locales.
El otro controlador presentado esta basado en la norma ∞, al igual que los de
(Campo and Morari, 1987). Teniendo en cuenta las ecuaciones de prediccion (2.56) y
del modelo (2.52)-(2.54), la ley de control se obtendra aplicando la primera componente
de la solucion de:
mın∆u
maxj=N1,···,N2
|yl(k + j|k) + cT Ψj∆u− w(k + j)| +n∑
i=1
|δci(γj,i + Ψj,(i,:)∆u)|
s.a.
umin ≤ u(k + j − 1|k) ≤ umax ∀j = 1, · · · , Nu
∆umin ≤ ∆u(k + j − 1|k) ≤ ∆umax ∀j = 1, · · · , Nu
donde:
yl(k + j|k) = y(k) + cT Γj (2.57)
Ψj = [Kj−1b, · · · , Kj−Nub] (2.58)
Γj = (Kj − I)∆l(k) (2.59)
CAPITULO 2. PERSPECTIVA GENERAL DE LOS CONTROLADORES MIN-MAX MPC 53
siendo Ψj,(i,:) la i-esima fila de Ψj y γj,i la i-esima componente del vector γj.
La ley de control resultante de aplicar la solucion del problema mın-max anterior
en una estrategia de horizonte deslizante estabiliza al sistema (2.50) en bucle cerrado
si N2 ≥ ni+Nu − 1, donde ni es el maximo orden de los modelos FIR necesarios para
describir todas las posibles respuestas impulsionales asociadas al modelo (2.52) cuando
se consideran las incertidumbres ε ∈ Ω.
2.10. Soluciones explıcitas para controladores Min-
Max MPC con norma ∞ o norma 1
Uno de los inconvenientes que siempre se ha achacado al control predictivo con
restricciones y al MMMPC es la cantidad de calculo que conlleva la resolucion en tiempo
real del problema de optimizacion para obtener la senal de control. Recientemente, se
ha aplicado la teorıa de la programacion parametrica (Gal, 1979), para estudiar la
variacion de la senal de control cuando varıa el estado. Un resultado conocido (Gal and
Nedoma, 1972) es que la solucion de un programa lineal, en el cual los parametros al
variar causan una variacion lineal del lado derecho de las restricciones, es una funcion
lineal a trozos de los parametros. El programa lineal que aparece cuando se considera un
MPC basado en la norma 1 o ∞ se puede expresar como un programa multiparametrico
en el que los parametros (el estado del proceso en este caso) solo aparecen en el lado
derecho de las restricciones, por lo que la ley de control es una funcion lineal a trozos
del estado y admite una solucion explıcita (Bemporad et al., 2000a). Eso implica que
el MMMPC basado en la norma 1 o ∞ (Campo and Morari, 1987; Allwright and
Papavasilou, 1991; Papavasilou and Allwright, 1991; Allwright and Papavasilou, 1992;
Allwright, 1994) el cual se puede formular tambien como un programa lineal resulta
ser una ley de control lineal a trozos. En (Bemporad et al., 2001) se presenta este
resultado, el cual se describe a continuacion.
Considerese un proceso descrito por el siguiente modelo en el espacio de estados:
x(t+ 1) = Ax(t) +Bu(t) + Ev(t) (2.60)
y(t) = Cx(t)
donde la perturbacion a la entrada v(t) esta acotada, de manera que pertenece a un
politopo definido por por V = v : Mv ≤ L con L ≥ 0. Se considera una estrategia
de control MMMPC basado en la norma ∞ que requiere la resolucion del siguiente
problema mın-max:
54 SOLUCIONES EXPLICITAS PARA NORMA ∞ O NORMA 1
mınut,···,ut+N−1
maxvt,···,vt+N−1
ψPλ(xt+N |t) +
N−1∑
k=1
‖Qxt+k|t‖∞
+N−1∑
k=0
‖Rut+k‖∞
(2.61)
s.a.
F1xt+k|t ≤ f1 k = 1, · · · , N
F2xt+k|t +G2ut+k ≤ f2 k = 0, · · · , N − 1
Mvt+k ≤ L k = 0, · · · , N − 1
xt+k+1|t = Axt+k|t +But+k + Fvt+k k ≥ 0
xt|t = x(t)
xt+N |t ∈ Pλ
El conjunto Pλ es un invariante robusto para el sistema (2.60) y la funcion ψPλ(x) es
su funcional de Minkowski (Blanchini, 1999) el cual viene definido por:
ψPλ(x)
.= inf µ ≥ 0 : x ∈ µPλ
El problema (2.61) define una estrategia de control MMMPC que emplea predic-
ciones en bucle abierto. Como ya se ha mencionado en secciones precedentes (veanse
las secciones 2.6.1 y 2.7), el uso de predicciones en bucle cerrado conlleva un menor
conservadurismo en la accion de control lo que implica un mejor control. En esta lınea,
Bemporad et al. (2001) proponen un MMMPC en bucle cerrado en el que se considera
el problema de optimizacion:
mınut
‖Rut‖∞ + maxvt
‖Qxt+1|t‖∞ + mınut+1
· · · + mınut+N−1
‖Rut+N−1‖∞ (2.62)
+ maxvt+N−1
ψPλ(xt+N |t)
· · ·
sujeto a las restricciones del problema (2.61).
La solucion de los problemas (2.61) y (2.62) es una funcion lineal a trozos del estado
del proceso. Para hallar la descripcion en forma explıcita ha de considerarse el siguiente
problema:
mınz.=[zc,zd]
cT z (2.63)
s.a.
Gz ≤ W + Sx
donde zc ∈ Rnc son variables continuas, zd ∈ 0, 1nd son variables enteras y x ∈ R
s
es el vector de parametros. Un problema del tipo (2.63) se conoce como programa
CAPITULO 2. PERSPECTIVA GENERAL DE LOS CONTROLADORES MIN-MAX MPC 55
multiparametrico lineal mixto entero (mp-MILP). La solucion y el coste alcanzado en
la solucion de este tipo de problemas son funciones lineales a trozos de los parametros
x. Teniendo en cuenta esto Bemporad et al. (2001) demuestran que:
La solucion del problema (2.61) es lineal a trozos y se puede expresar en forma
explıcita, es decir:
u(t) = Fix(t) + gi si x(t) ∈ Xi , x : Tix ≤ Si i = 1, · · · , s (2.64)
donde X , ∪si=1Xi es el conjunto de estados donde las restricciones son factibles
mediante la resolucion de 2N problemas mp-MILP.
La solucion del problema (2.62) es lineal a trozos y se puede expresar en la forma
explıcita (2.64) mediante la resolucion de 2 problemas mp-MILP.
Contrariamente a lo que podrıa pensarse, resolver los 2 problemas mp-MILP necesar-
ios para obtener la solucion explıcita de (2.62) es mas costoso (debido al tamano) que
resolver los 2N necesarios para el problema (2.61). Los metodos para resolver proble-
mas mp-MILP se basan fundamentalmente en emplear tecnicas de branch and bound
(Acevedo and Pistikopoulos, 1997), o en descomponer el problema en un subproblema
de programacion lineal multiparametrica (mp-LP) y otro subproblema de programacion
lineal mixta entera en el que los parametros se consideran variables de decision (Dua
and Pistikopoulos, 2000). En cualquier caso, la obtencion de la forma (2.64) conlleva
una gran cantidad de calculos, aunque en tiempo real el calculo de la ley de control
no requerira mas tiempo del necesario para determinar en que region del espacio de
estados se encuentra el estado en cada instante.
2.11. Conclusiones
En este capıtulo se ha presentado una vision general de las diversas formas de control
predictivo mın-max. Aunque se ha pasado revista a los trabajos mas significativos no
se ha pretendido cubrir todos los trabajos publicados en revistas o actas de congresos.
Considerando los trabajos descritos, es evidente que la idea original de Campo and
Morari (1987) se ha desarrollado a lo largo de un proceso en el cual partiendo de la
formulacion original, se busco su extension a otras formas de representar los procesos y
otros tipos de funciones de coste, mientras que con el objetivo de garantizar un mejor
control se presentaron estrategias adaptativas que combinaban el control mın-max con
56 CONCLUSIONES
tecnicas de identificacion robusta. Desgraciadamente se comprobo que la formulacion
mın-max por sı misma no garantiza la estabilidad en bucle cerrado del sistema a la
vez que resulta ser una ley de control muy conservadora. Por ello las formulaciones
mas recientes del MMMPC buscan garantizar la estabilidad, ya sea con formulaciones
de horizonte infinito, invariantes robustos, restricciones contractivas, etc . . . Por otra
parte se ha buscado reducir el exceso de conservadurismo incorporando al proceso de
optimizacion la nocion de bucle cerrado, existiendo diversas variantes. Para muchos
autores, a raız del trabajo de Kothare et al. (1996), el MMMPC no implica forzosa-
mente la resolucion de un problema mın-max, sino que se puede sustituir por una cota
conservadora del coste para el peor caso formulada a base de LMIs. De esta man-
era se evita tener que pagar el elevado coste computacional tradicionalmente asociado
a las formulaciones MMMPC. Este problema ha sido atacado de manera muy difer-
ente por Bemporad et al. (2001), quienes aplicando los resultados de la programacion
multiparametrica, proporcionan un procedimiento para dar la solucion explıcita de
controladores basados en la norma 1 o ∞.
Capıtulo 3
Min-Max MPC con incertidumbres
globales acotadas
3.1. Introduccion
En el capıtulo anterior se presento una perspectiva general de los diversos tipos
de estrategias de control predictivo que se basan en un problema de optimizacion
mın-max. En este capıtulo se presenta la estrategia de control predictivo mın-max
con incertidumbres globales acotadas (Camacho and Bordons, 1995). Esta estrategia
parte de una descripcion de las incertidumbres que es simple de implementar pero
posee una gran capacidad para describir todo tipo de incertidumbres o perturbaciones,
imponiendose como unico requisito que esten acotadas por valores conocidos. Una de
las caracterısticas mas apreciables de este tipo de MMMPC es que ofrece la posibilidad
real de implementar la ley de control sobre procesos cuyas dinamicas no sean demasiado
rapidas, pues la parte ((max)) del problema de optimizacion solo requiere de la evaluacion
del peor caso sobre una lista finita de realizaciones extremas de la incertidumbre. Esto
no quiere decir sin embargo, que sea un problema trivial de resolver, pues como se
vera a lo largo de este capıtulo, el numero de casos a considerar para decidir cual es el
peor crece de manera exponencial con el horizonte de prediccion. Otra caracterıstica
de esta estrategia es que se pueden considerar restricciones en la optimizacion como en
el control predictivo estandar.
La estrategia de MMMPC con incertidumbres globales (o aditivas) acotadas se for-
mula originalmente en una descripcion de entrada-salida (Camacho and Berenguel,
1997), pero se puede emplear tambien en descripciones en espacio de estados (Scokaert
57
58 MIN-MAX MPC CON INCERTIDUMBRES GLOBALES ACOTADAS
and Mayne, 1998). Cuando se emplea como modelo de prediccion un modelo lineal
en descripcion entrada-salida es comun optar entre un modelo de incertidumbres in-
tegradas o no integradas. Como se vera en este capıtulo, es deseable utilizar el primero,
pues la ley de control resultante es capaz de rechazar perturbaciones en escalon. Sin
embargo eso conlleva emplear predicciones inestables en bucle abierto que causan prob-
lemas de factibilidad cuando se consideran restricciones sobre la salida del proceso. En
este capıtulo se justificara la necesidad de usar incertidumbres aditivas integradas y
se propondra una forma para solventar los problemas de factibilidad, a los que se ha
aludido antes, mientras se retiene la capacidad para rechazar perturbaciones en escalon.
El capıtulo esta organizado de la siguiente manera: en primer lugar se presenta la
estrategia de control Min-Max MPC con incertidumbres globales acotadas, primero
sin restricciones y posteriormente con restricciones. Despues se analiza la necesidad
de emplear una formulacion incremental y se muestran los problemas que conlleva.
Posteriormente se propone una solucion a esos problemas y finalmente, se ilustra como
esa solucion ayuda a resolver los problemas antes mencionados.
3.2. Min-Max MPC con incertidumbres globales
acotadas
El funcionamiento del MPC consiste en calcular la secuencia de futuras acciones
de control u(t), u(t + 1), . . . , u(t + Nu − 1), de tal manera que las predicciones a j
pasos y(t+ j|t) se acerquen lo mas posible a la secuencia de valores futuros del punto
de consigna w(t), w(t + 1), . . . , w(t + N2 − 1) a lo largo del horizonte de prediccion.
La bondad de la solucion alcanzada se considerara mediante una funcion de coste J
que dependera de los valores presentes y pasados de las salidas, senales de control e
incertidumbres.
Si en el calculo de la secuencia de actuaciones se consideran de manera explıcita
incertidumbres, el control obtenido serıa mas robusto si el controlador considerase la
peor situacion posible, es decir, si se resolviese el siguiente problema mın-max:
mınu
maxθ∈Θ
J(θ, u) (3.1)
donde θ representa la secuencia de futuros valores de la incertidumbre. El problema
(3.1) se puede reescribir como:
mınu
maxθ∈Θ
J(θ, u) = mınuJ∗(u) (3.2)
CAPITULO 3. MIN-MAX MPC CON INCERTIDUMBRES GLOBALES ACOTADAS 59
con:
J∗(u) = maxθ∈Θ
J(θ, u) (3.3)
siendo Θ = θ ∈ Rn : θ ≤ θ ≤ θ. La funcion J∗(u) es el maximo de los posibles
valores de la funcion objetivo J(θ, u), la cual mide la bondad del seguimiento de la
referencia por parte de la salida del proceso. La forma mas usual de J(θ, u) es un
criterio cuadratico:
J(θ, u) = E
N2∑
j=N1
(y(t+ j|t) − w(t+ j))2 + λ
Nu∑
j=1
(∆u(t+ j − 1))2
(3.4)
donde: ∆ = 1−z−1,N1 y N2 definen el comienzo y final del horizonte de prediccion, Nu
es el horizonte de control, y(t+j|t) es la prediccion de la salida cuando la incertidumbre
vale θ y E· indica la esperanza matematica. En la literatura especializada se pueden
encontrar esquemas similares que usan otros tipos de funcion objetivo, por ejemplo
basados en la norma ∞−∞ (Campo and Morari, 1987) o 1 −∞ (Allwright, 1994).
Cuando se emplea la tecnica de incertidumbres globales acotadas se asume que todos
los errores de modelado se agrupan en un vector de parametros, de tal manera que la
dinamica de la planta se puede describir mediante la siguiente familia de modelos:
y(t+ 1) = f(y(t), . . . , y(t− nna), u(t), . . . , u(t− nnb
)) + θ(t) (3.5)
En (Camacho and Bordons, 1999) se muestra como se puede relacionar esta tecnica con
otros tipos de descripcion de incertidumbres. Es importante mencionar que, aunque la
notacion no lo ponga de manifiesto, la incertidumbre puede ser funcion tambien del
estado.
Podrıa argumentarse que este tipo de incertidumbres son esencialmente perturba-
ciones. Sin embargo, es de destacar que no se esta imponiendo sobre el valor que toman
las incertidumbres ninguna restriccion mas alla de exigir que esten acotadas. Por tanto,
podrıan ser funcion de valores pasados, es decir, presentar cierta dinamica (que podrıa
ser lineal o no, estable o inestable, etc . . . ) , por lo que no se pueden considerar como
simples perturbaciones. En cualquier caso una perturbacion aditiva tambien estarıa
perfectamente descrita por este tipo de incertidumbres.
Cuando el modelo de prediccion que se considera en (3.5) es lineal, es frecuente
utilizar como descripcion un modelo CARMA que viene dado por:
A(z−1)y(t) = z−dB(z−1)u(t− 1) + C(z−1)e(t) (3.6)
o un modelo CARIMA:
A(z−1)y(t) = z−dB(z−1)u(t− 1) + C(z−1)e(t)
∆(3.7)
60 MIN-MAX MPC CON INCERTIDUMBRES GLOBALES ACOTADAS
donde y(t) y u(t) son las secuencias de salidas y actuaciones, d es el tiempo muerto del
sistema, e(t) es un ruido blanco de media nula y A,B y C son polinomios en z−1:
A(z−1) = 1 + a1z−1 + a2z
−2 + · · · + anaz−na
B(z−1) = b0 + b1z−1 + b2z
−2 + · · · + bnbz−nb
C(z−1) = 1 + c1z−1 + c2z
−2 + · · · + cncz−nc
El segundo tipo es mas apropiado cuando se pretende que se rechacen perturbaciones
no estacionarias, esto es, cuando se desea que haya rechazo de perturbaciones en escalon
(Clarke et al., 1987).
Los modelos CARMA y CARIMA se pueden extender para considerar explıcita-
mente las perturbaciones o incertidumbres en el modelo de prediccion. Como resultado
se obtienen los siguientes modelos de prediccion que pueden ser usados en una estrategia
de control Min-Max MPC con incertidumbres aditivas:
A(z−1)y(t) = z−dB(z−1)u(t− 1) + θ(t) θ(t) ∈ Θ (3.8)
A(z−1)y(t) = z−dB(z−1)∆u(t− 1) + θ(t) θ(t) ∈ Θ (3.9)
con A(z−1) = ∆A(z−1). Estos modelos de prediccion se conocen como modelos de
prediccion con incertidumbres integradas (3.9) o no integradas (3.8). Un MMMPC que
utiliza un modelo de prediccion con incertidumbres integradas se dice que adopta una
formulacion incremental. Por contra una formulacion no incremental es aquella que
utiliza un modelo del tipo (3.8). Tal y como se vera a lo largo del capıtulo, cada una
de estas formulaciones presenta ventajas e inconvenientes.
Como se ha mencionado anteriormente, la secuencia optima de actuaciones se ob-
tiene resolviendo el problema (3.1). Para ello es necesario formular la prediccion optima
de y(t + j) para j = N1, · · · , N2. En lo sucesivo se considerara la formulacion incre-
mental pues, como se justifica en este capıtulo, es la mas apropiada al poder rechazar
perturbaciones en escalon. Para ello considerese la siguiente ecuacion Diofantica:
1 = Ej(z−1)A(z−1) + z−jFj(z
−1) (3.10)
Los polinomios Ej y Fj estan definidos unıvocamente y son de grado j−1 y na respec-
tivamente. Se pueden obtener dividiendo 1 entre A(z−1) hasta que el resto se pueda
factorizar como z−jFj(z−1). El cociente de esa division es el polinomio Ej(z
−1).
Si se multiplica la ecuacion (3.9) por Ej(z−1)zj se obtiene:
A(z−1)Ej(z−1)y(t+ j) = Ej(z
−1)B(z−1)∆u(t+ j − d− 1) + Ej(z−1)θ(t+ j)
CAPITULO 3. MIN-MAX MPC CON INCERTIDUMBRES GLOBALES ACOTADAS 61
Teniendo en cuenta la ecuacion Diofantica (3.10) lo anterior se puede expresar como:
(1 − z−jFj(z−1))y(t+ j)=Ej(z
−1)B(z−1)∆u(t+ j − d− 1) + Ej(z−1)θ(t+ j)
que se puede reescribir como:
y(t+ j) = Fj(z−1)y(t) + Ej(z
−1)B(z−1)∆u(t+ j − d− 1) + Ej(z−1)θ(t+ j)
Por tanto la mejor prediccion de y(t+ j) es:
y(t+ j|t) = Gj(z−1)∆u(t+ j − d− 1) + Ej(z
−1)θ(t+ j) + Fj(z−1)y(t)
con Gj(z−1) = Ej(z
−1)B(z−1).
Los polinomios Ej y Fj se pueden obtener de manera recursiva (Clarke et al., 1987),
aunque existen otras formas (Albertos and Ortega, 1989). Considerense los polinomios
Ej y Fj, los cuales como se ha visto en la ecuacion (3.10) provienen de la division de
1 entre A(z−1):
Fj(z−1) = fj,0 + fj,1z
−1 + fj,2z−2 + · · · + fj,naz
−na
Ej(z−1) = ej,0 + ej,1z
−1 + ej,2z−2 + · · · + ej,j−1z
−(j−1)
Considerense ahora los polinomios Ej+1 y Fj+1. Estos se obtendran dividiendo 1
por A(z−1) hasta que el resto se pueda factorizar como z−(j+1)Fj+1(z−1) con:
Fj+1(z−1) = fj+1,0 + fj+1,1z
−1 + fj+1,2z−2 + · · · + fj+1,naz
−na
Para obtener Ej+1 y Fj+1 solo hay que dar un paso mas en la division que hay que
hacer para obtener Ej y Fj. Eso quiere decir que podemos obtener el polinomio Ej+1
mediante:
Ej+1(z−1) = Ej(z
−1) + ej+1,jz−j
siendo ej+1,j = fj,0.
Por otra parte los coeficientes del polinomio Fj+1 se calculan usando:
fj+1,i = fj,i+1 − fj,0ai+1 para i = 0, · · · , na− 1
fj+1,na = −fj,0ana+1
y el polinomio Gj+1 = Ej+1B se obtiene recursivamente como:
Gj+1 = Gj + fj,0z−jB
62 MIN-MAX MPC CON INCERTIDUMBRES GLOBALES ACOTADAS
con lo que los j primeros coeficientes de Gj+1 seran identicos a los de Gj y el resto
vendran dados por:
gj+1,j+i = gj,j+i + fj,0bi para i = 0, · · · , nb
Tal y como se indica en (Camacho and Bordons, 1999) una eleccion natural de los
horizontes de control es tomar N1 = d+ 1, N2 = d+N con Nu = N . Con esta eleccion
se considera el siguiente grupo de N predicciones:
y(t+ d+ 1|t) = Gd+1∆u(t) + Ed+1θ(t+ d+ 1) + Fd+1y(t)
y(t+ d+ 2|t) = Gd+2∆u(t+ 1) + Ed+2θ(t+ d+ 2) + Fd+2y(t)...
y(t+ d+N |t) = Gd+N∆u(t+N − 1) + Ed+Nθ(t+ d+N) + Fd+Ny(t)
que se pueden reescribir como:
y = Gu+ Eθ + F (z−1)y(t) +G′(z−1)∆u(t− 1) (3.11)
donde:
y =
y(t+ d+ 1|t)
y(t+ d+ 2|t)...
y(t+ d+N |t)
u =
∆u(t)
∆u(t+ 1)...
∆u(t+N − 1)
G =
g0 0 · · · 0
g1 g0 · · · 0...
......
...
gN−1 gN−2 · · · g0
E =
e0 0 · · · 0
e1 e0 · · · 0...
......
...
eN−1 eN−2 · · · e0
θ =
θ(t+ d+ 1)
θ(t+ d+ 2)...
θ(t+ d+N)
F (z−1) =
Fd+1(z−1)
Fd+2(z−1)
...
Fd+N(z−1)
G′(z−1) =
(Gd+1(z−1) − g0)z
(Gd+2(z−1) − g0 − g1z
−1)z2
...
(Gd+N(z−1) − g0 − g1z−1 − · · · − gN−1z
−(N−1))zN
Se observa que los dos ultimos terminos de (3.11) dependen solo de valores pasados de
las entradas y salidas, por lo que se pueden agrupar y expresar en forma condensada
como:
y = Guu+Gθθ + f
donde Gu = G, Gθ = E y el vector f representa la respuesta libre del sistema, la cual
es cero si las condiciones iniciales son cero. Los coeficientes de la primera columna Gu
CAPITULO 3. MIN-MAX MPC CON INCERTIDUMBRES GLOBALES ACOTADAS 63
se pueden calcular como la secuencia y(t+ d+ 1),y(t+ d+ 2),. . . ,y(t+ d+N) cuando
se aplica un escalon unitario al sistema. Por otra parte el termino de la respuesta libre
se puede calcular de manera recursiva como:
fj+1 = z(1 − A(z−1))fj +B(z−1)∆u(t− d+ j)
con f0 = y(t) y ∆u(t+j) = 0 para j ≥ 0 (pues este termino solo depende de los valores
pasados de la salida y de la senal de control). Por otra parte teniendo en cuenta (3.11)
es facil ver que el termino de respuesta libre se puede expresar como el producto de
una matriz por un vector que contiene las salidas y entradas pasadas, por lo que las
predicciones se pueden expresar en forma condensada como:
y = Guu+Gθθ + Fxx (3.12)
donde Fx = [F G′] y x representa el estado del proceso formado por los valores presentes
y pasados de las salidas y de los valores pasados de las entradas:
x = [y(t) · · · y(t− na)∆u(t− 1) · · ·∆u(t− nb)]T
Con esas predicciones optimas la funcion de coste (3.4) se puede expresar como:
J(θ, u) = (Guu+Gθθ + Fxx− w)T (Guu+Gθθ + Fxx− w) + λuTu (3.13)
donde w es un vector que contiene los valores futuros para la referencia:
w =[
w(t+N1) · · · w(t+N2)]T
A continuacion se estudiaran una serie de propiedades que son muy importantes
a la hora de resolver el problema de optimizacion (3.1). Para ello, y sin perdida de
generalidad, considerese que el objetivo es regular la salida del sistema a cero, es decir
w(t + j) = 0 para j = N1 · · ·N2. Teniendo en cuenta esto en la expresion (3.13) y
operando se llega a:
J(θ, u) = uTMuuu+ θTMθθθ + 2θTMθuu+ 2MTufu+ 2MT
θfθ + xTF Tx Fxx (3.14)
donde Muu = GTuGu + λI, Mθθ = GT
θ Gθ, Mθu = GTθ Gu, Muf = GT
uFxx, Mθf = GTθ Fxx.
De la ecuacion (3.14) se desprende que la funcion J ∗ definida en (3.3) se puede
expresar como el maximo de una funcion que es cuadratica en θ para cada valor de u:
J∗(u) = maxθ∈Θ
θTMθθθ +M ′θ(u)θ +M ′(u) (3.15)
donde M ′θ(u) = 2(MT
θf + uTMTθu) y M ′(u) = uTMuuu+ 2MT
ufu+ xTF Tx Fxx. Gθ es una
matriz triangular inferior que tiene todos los elementos de la diagonal principal igual
64 FORMULACION DEL MMMPC CON RESTRICCIONES
a uno, lo que implica que Mθθ es una matriz definida positiva. Por otra parte, esta
propiedad supone que la funcion J∗ es estrictamente convexa (vease el teorema 3.3.8
de (Bazaraa and Shetty, 1979)) y por ello el maximo de J se alcanzara en uno de los
vertices del politopo Θ (vease el teorema 3.4.6 de (Bazaraa and Shetty, 1979)).
La funcion J∗ es una funcion cuadratica a trozos de u (Gutierrez and Camacho,
1995), por tanto, podemos establecer una particion de U en diferentes regiones Up de
tal manera que para u ∈ Up el maximo del funcional J se alcanza para el vertice θp.
En esa region Up se puede expresar J∗ como una funcion de u:
J∗(u) = uTMuuu+M∗u(θp)u+M ∗(θp)
donde M∗u(θp) = 2(θT
p Mθu +MTuf ) y M ∗(θp) = θT
p Mθθθp +2MTθfθp +xTF T
x Fxx. La matriz
hessiana de la funcion J∗(u) es Muu la cual es definida positiva para valores positivos
de λ. Esto implica que la funcion es convexa (vease el teorema 3.3.8 de (Bazaraa and
Shetty, 1979)) y ademas que existe un unico mınimo (vease el teorema 3.4.2 de (Bazaraa
and Shetty, 1979)). De esta manera se evita uno de los principales problemas que es el
de la existencia de mınimos locales. A pesar de eso, para determinar en que vertice se
alcanza el maximo hay que visitarlos todos por lo que la complejidad computacional
del problema mın-max es muy grande. Por tanto, para valores tıpicos del horizonte
de control es imposible pensar en implementaciones en tiempo real para procesos con
dinamicas rapidas.
Finalmente hay que mencionar que el hecho de que la funcion J ∗ sea convexa en
u, no garantiza que sea necesariamente diferenciable. Esto hace que el problema de
optimizacion sea mas difıcil de resolver, y que por ejemplo metodos numericos populares
como los gradenciales no se puedan usar para resolver el problema mın-max. Otros
metodos como la busqueda lineal de Nelder-Mead sı se pueden usar, pero tienen el
inconveniente de que son mucho mas costosos desde el punto de vista computacional.
3.3. Formulacion del MMMPC con restricciones
Una de las caracterısticas mas apreciadas del control predictivo es su capacidad para
considerar restricciones en el calculo de la senal de control. Fundamentalmente se habla
de restricciones blandas y duras. Una restriccion blanda se puede violar (sobrepasar) en
cierta medida, aunque al resolver el problema de optimizacion se buscara que la solucion
la respete. Hay diferentes maneras de implementar restricciones blandas (Scokaert and
Rawlings, 1999). La forma mas sencilla es introducir variables de holgura no negativas
y diferentes de cero solo si las restricciones son sobrepasadas. El valor de esas variables
CAPITULO 3. MIN-MAX MPC CON INCERTIDUMBRES GLOBALES ACOTADAS 65
de holgura esta fuertemente penalizado en la funcion de coste. Esto ocasiona que la
solucion tienda a respetar en lo posible la restriccion, minimizandose el margen por el
que se sobrepasa. Las restricciones duras por otra parte, son aquellas que no se pueden
violar de ninguna manera. Un problema de programacion cuadratica con restricciones
blandas es equivalente a uno con restricciones duras, pero con mas variables. Por esta
razon, las estrategias de control se suelen estudiar con restricciones duras solamente.
Cuando se consideran restricciones duras en el problema mın-max, la ley de control
se obtendra resolviendo:
mınu∈U
maxθ∈Θ
J(θ, u) (3.16)
donde U es un conjunto convexo de soluciones factibles que vendra definido por Au ≤ b.
Las restricciones mas habituales a tener en cuenta son aquellas que se imponen sobre
el incremento en la senal de control, la amplitud de la senal de control y la salida del
proceso. Estas restricciones se formulan como:
u ≤ u(t) − u(t− 1) ≤ u
U ≤ u(t) ≤ U
y ≤ y(t) ≤ y
Teniendo en cuenta las ecuaciones de prediccion y la formulacion incremental:
1u ≤ ∆u(t) ≤ 1u
1U ≤ T∆u(t) + u(t− 1)1 ≤ 1U
1y ≤ G∆u(t) +Gθθi + Fxx ≤ 1y
donde 1 es un N vector cuyos componentes son todos uno y T es una matriz triangular
inferior de unos y dimensiones N×N . Por otra parte la restriccion sobre la salida debe
verificarse para cualquier realizacion extrema de la incertidumbre, significando esto que
la restriccion de la salida debe replicarse una vez por cada posible realizacion extrema
de la incertidumbre, esto es, i variara de 1 hasta 2N2 . No obstante esto no implica que
se hayan de considerar 2N2 vectores de restricciones para la salida, ya que se pueden
descartar las restricciones redundantes, explorando cada componente de cada vector y
reteniendo las mas restrictivas. Ası se tendra un solo vector de restricciones.
Las restricciones anteriormente consideradas se pueden escribir en forma condensa-
da como:
Ru ≤ cθ + Fx (3.17)
66 EJEMPLOS
con:
R =
IN×N
−IN×N
T
−T
G
−G
cθ =
1u
−1u
1U − 1u(t− 1)
−1U + 1u(t− 1)
1y −Gθθi
−1y +Gθθi
F =
0
0
0
0
−Fx
Fx
La ley de control MMMPC con restricciones se calculara resolviendo en cada instante
el problema mın-max:
mınu
maxθ∈Θ
J(θ, u) (3.18)
s.a.
Ru ≤ cθ + Fx
3.4. Ejemplos
A continuacion se presentaran dos ejemplos simulados de uso del MMMPC con
incertidumbres globales acotadas sobre dos sistemas tıpicos, sobre los cuales tambien
se aplicara un controlador predictivo del tipo GPC.
3.4.1. Ejemplo de MMMPC sin restricciones
En esta seccion se va a presentar el primer ejemplo simulado de aplicacion del
MMMPC. El proceso elegido es un doble integrador, cuya funcion de transferencia
viene dada por:
G(s) =1
s2
Se empleara una formulacion incremental para el MMMPC y se compararan los re-
sultados con los producidos cuando el sistema se controla con un GPC estandar. Los
horizontes empleados seran en ambos casos Nu = N2 = 4, λ = 0,9 y el tiempo de
muestreo 0,25. En el caso del MMMPC las cotas de la incertidumbre seran −0,05 y
0,05. Las predicciones en el caso del MMMPC se obtendran mediante la expresion
CAPITULO 3. MIN-MAX MPC CON INCERTIDUMBRES GLOBALES ACOTADAS 67
(3.12) con las siguientes matrices:
Gu =
0,0313 0 0 0
0,1250 0,0313 0 0
0,2813 0,1250 0,0313 0
0,5000 0,2813 0,1250 0,0313
Gθ =
1 0 0 0
3 1 0 0
6 3 1 0
10 6 3 1
Fx =
3 −3 1 0,0313
6 −8 3 0,0938
10 −15 6 0,1875
15 −24 10 0,3125
xk =
yk
yk−1
yk−2
∆uk−1
Los resultados de las simulaciones con ambos tipos de controladores se muestran en
la figura 3.1. En la simulacion se ha anadido una perturbacion aleatoria que varıa entre
−0,025 y 0,025 que es la responsable de la salida ((ruidosa)) en el caso del MMMPC
(en la simulacion del GPC no es tan evidente por la amplitud que toma la salida).
Es evidente que el GPC es incapaz de controlar la salida del proceso, la cual comien-
za a experimentar oscilaciones cada vez mas grandes. El MMMPC por contra, sı es
capaz de llevar la salida a cero, pero, debido a que el sistema es difıcil de controlar,
para mantenerlo requiere de muchos cambios en la senal de control. En ausencia de
perturbaciones la senal de control permanecerıa constante una vez alcanzado el valor
deseado. Es importante tener en cuenta que los resultados mostrados en la figura 3.1
no implican que no se pueda controlar dicho sistema con un GPC, tan solo se puede
decir que esa circunstancia se produce para esa combinacion particular de parametros
del controlador. Sin embargo, se aprecia que una de las ventajas que puede aportar el
uso del MMMPC es un control mas robusto en sistemas y circunstancias que plantean
problemas al control predictivo tradicional.
3.4.2. Ejemplo de MMMPC con restricciones
A fin de ilustrar el comportamiento de un MMMPC con restricciones considerese
el siguiente modelo de primer orden:
G(s) =0,4
s+ 1
Sobre ese sistema se van a aplicar la estrategia de control MMMPC con restricciones y
un GPC con restricciones estandar. La salida del proceso debe estar en todo momento
entre 0 y 1.1, mientras que los incrementos de control estaran acotados por 1 y −1.
Los horizontes empleados en ambos controladores seran Nu = 3, N2 = 6 y λ = 1. En el
68 EJEMPLOS
5 10 15 20 25 30 35 40 45−1
−0.8
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
y k
(a)
5 10 15 20 25 30 35 40 45−1.5
−1
−0.5
0
0.5
1
1.5
muestras
∆ u k
(b)
Figura 3.1: Simulacion de control de un doble integrador con un MMMPC (trazo continuo) y GPC
(trazo discontinuo): a) salida del proceso b) cambios en la senal de control.
CAPITULO 3. MIN-MAX MPC CON INCERTIDUMBRES GLOBALES ACOTADAS 69
caso del controlador mın-max la incertidumbre esperada estara entre −0,01 y 0,01. El
tiempo de muestreo es 0,16 y la referencia valdra 1. A lo largo de la simulacion se va a
anadir una perturbacion aleatoria que variara entre 0.005 y −0,005 y en los instantes 30
y 60 se anade una perturbacion en escalon de amplitud −0,05 y 0,05 respectivamente.
El resultado de la simulacion se muestra en la figura 3.2. Puede apreciarse que la
salida del sistema cuando es gobernado por el MMMPC con restricciones no llega al
valor de referencia, si no que se queda por debajo con un ((offset)) permanente, aunque,
como puede observarse, se rechazan perturbaciones en escalon. La razon de ese offset es
que el controlador estima que, con los valores esperados de la incertidumbre y dadas las
restricciones que tiene sobre la senal de control, no le serıa posible evitar una violacion
de las restricciones causada por el peor caso posible si se llevara la salida a la referencia.
Por tanto, se muestra ((cauteloso)) y se mantiene por debajo del valor deseado. Eso causa
que cuando llega la perturbacion en t = 60, no se viole la restriccion, lo que sı ocurre
en el caso del GPC con restricciones. Es importante mencionar que si el GPC parece
rechazar la perturbacion mas rapido (pero sin evitar sobrepasar la restriccion) es porque
tambien se viola la restriccion sobre ∆uk. Por otra parte la perturbacion en t = 30 es
rechazada mas rapidamente por el MMMPC.
En este ejemplo se observa que con unos valores muy pequenos para las cotas de la
incertidumbre se rechazan perturbaciones mucho mas grandes, evitandose la violacion
de restricciones. Esto es un efecto de la formulacion incremental empleada, la cual con-
sidera una incertidumbre que va integrandose, por lo que aunque los valores esperados
de la incertidumbre sean muy pequenos en cada instante la contribucion total de esta
a lo largo del horizonte de prediccion es mucho mayor.
3.5. Conclusiones
En este capıtulo se ha presentado la estrategia de control MMMPC con incertidum-
bres aditivas acotadas. Es una forma de control predictivo mın-max que puede asimilar
casi cualquier forma de incertidumbre o perturbacion y que, gracias a las propiedades de
la funcion de coste, permite resolver la parte ((max)) en un numero fijo y finito de eval-
uaciones de la funcion de coste. Desafortunadamente, ese numero de evaluaciones crece
de manera exponencial con el horizonte de prediccion, aunque para valores pequenos se
puede implementar con una clase amplia de procesos (Camacho and Berenguel, 1997).
70 CONCLUSIONES
10 20 30 40 50 60 70 80 900
0.2
0.4
0.6
0.8
1
1.2
y k
(a)
10 20 30 40 50 60 70 80 90−1.5
−1
−0.5
0
0.5
1
muestras
∆ u k
(b)
Figura 3.2: Simulacion de control de un sistema de primer orden con un MMMPC con restricciones
(trazo continuo) y GPC con restricciones (trazo discontinuo): a) salida del proceso b) cambios en la
senal de control.
Apendice A
Elementos basicos del MPC
Las caracterısticas de los diversos tipos de MPC existentes vienen determinadas por
los elementos basicos empleados en el calculo de la ley de control, es decir, el modelo de
prediccion y la funcion objetivo. En este apendice se presentaran los tipos e ideas basicas
que se pueden encontrar en la literatura sobre estos elementos. Ademas se presenta una
breve descripcion del control predictivo generalizado, una de las estrategias MPC mas
populares.
A.1. Modelo de prediccion
El modelo de prediccion, llamado a veces modelo interno, es el elemento principal
del MPC, debiendo ser lo mas realista posible pero sin ser tan complejo que deje de
ser intuitivo y dificulte el analisis teorico de la ley de control resultante. El modelo de
prediccion se divide en dos partes, el modelo del proceso y un modelo de las perturba-
ciones que recoge el efecto de ruido, errores de modelado y entradas no medibles.
A.1.1. Modelo del Proceso
Se puede emplear casi cualquier tipo de modelo existente. Los mas populares son:
Modelos basados en la respuesta impulsional finita (FIR). Estos modelos son muy
populares en el mundo industrial, pero tienen el inconveniente de estar limitados
71
72 MODELO DE PREDICCION
a procesos estables. En ellos la salida del proceso esta relacionada con la entrada
por:
y(t) =N∑
i=1
hiu(t− i) = H(z−1)u(t) (A.1)
donde los coeficientes hi se obtienen midiendo la salida del proceso cuando se le
aplica un impulso unitario de amplitud igual a la del tiempo de muestreo. Este
tipo de modelo se emplea por ejemplo en el MPHC de Richalet et al. (1978).
Modelos basados en la respuesta ante escalon. Estan muy relacionados con los
FIR, aplicandose a la entrada un escalon unitario en lugar de un impulso unitario.
La salida del proceso estara relacionada con la entrada por:
y(t) = y0 +N∑
i=1
gi∆u(t− i) = y0 +G(z−1)∆u(t) (A.2)
donde ∆ = (1−z−1) y los coeficientes gi se obtienen midiendo la salida al aplicarse
el escalon. El offset y0 se suele tomar como nulo. Este tipo de modelos, que goza
de las mismas ventajas e inconvenientes que el anterior, se emplea por ejemplo
en el DMC de Cutler and Ramaker (1980).
Modelos basados en la funcion de transferencia. Estos modelos son muy populares
en el mundo academico, y pueden representar cualquier tipo de proceso, estando
la salida del proceso relacionada con la entrada por:
y(t) =B(z−1)
A(z−1)u(t) (A.3)
con:
A(z−1) = 1 + a1z−1 + a2z
−2 + · · · + anaz−na
B(z−1) = b1z−1 + b2z
−2 + · · · + bnbz−nb
Este tipo de modelos se usa por ejemplo en el GPC de Clarke et al. (1987).
Modelos en el espacio de estados. Aunque en el mundo industrial las representa-
ciones entrada-salida son las mas habituales, tambien existen controladores MPC
formulados en el espacio de estados como por ejemplo el PFC de Richalet (1992).
Un modelo en espacio de estados vendra dado por:
x(t) = Mx(t− 1) +Nu(t− 1)
y(t) = Qx(t)
Otros. A veces se emplean modelos no lineales (Ramırez et al., 1999a), mode-
los basados en redes neuronales (Tan and Cauwenberghe, 1995) o logica difusa
(Skrjanc and Matko, 1994).
APENDICE A. ELEMENTOS BASICOS DEL MPC 73
A.1.2. Modelo de las perturbaciones
Usualmente el modelo de perturbaciones toma la forma de un modelo CARIMA
(Controlled Auto-Regressive and Integrated Moving Average) en el que la diferencia
entre la salida del proceso y la calculada mediante el modelo viene dada por:
n(t) =C(z−1)e(t)
D(z−1)
donde D(z−1) incluye un integrador ∆ = 1 − z−1, e(t) es un ruido blanco de media
nula y el polinomio C(z−1), llamado polinomio coloreador es considerado generalmente
igual a 1. La ley de control resultante es capaz de rechazar perturbaciones en escalon.
Este modelo de perturbaciones se emplea por ejemplo en el GPC.
A.2. La funcion objetivo
Como se menciono en la seccion 1.1, la funcion objetivo suele tener la forma de un
criterio cuadratico en la que aparecen los errores de seguimiento predichos y el esfuerzo
de control. De manera general la funcion objetivo toma la forma:
J(u) =
N2∑
k=N1
δ(k) [y(t+ k|t) − w(t+ k)]2 + λ
Nu∑
k=1
λ(k)∆u(t+ k − 1|t)2 (A.4)
En esta funcion, N1 y N2 determinan el comienzo y el final del horizonte de prediccion,
mientras que Nu es el horizonte de control. Los dos primeros parametros marcan los
lımites de los instantes en los que es deseable que la salida siga a la trayectoria de
referencia. Si el retardo del proceso es d el valor mas razonable para N1 es d + 1. Por
otra parte, el horizonte de control Nu no tiene porque coincidir con N2, pudiendo ser
un valor menor. Esto trae como consecuencia la reduccion del numero de variables
de decision por lo que la optimizacion conllevara menos calculo. En ese caso se suele
suponer que la entrada permanece constante a partir del instante t+Nu − 1, es decir:
∆u(t+ k − 1) = 0 k > Nu
Por otra parte, los coeficientes δ(k) y λ(k) son secuencias de ponderacion que usual-
mente toman la forma:
δ(k) = αN2−k
Si 0 < α < 1 los errores futuros mas lejos de t tienen mas peso, dando lugar a un
control mas suave. Si α > 1 el error en los instantes mas cercanos a t tiene mas peso,
por lo que el control sera mas rapido.
74 CONTROL PREDICTIVO GENERALIZADO
Finalmente hay que destacar que la trayectoria de referencia w(t + k) no tiene
porque coincidir con el punto de consigna (set point), empleandose generalmente una
trayectoria que parte del valor de la salida en t y se aproxima suavemente al valor del
punto de consigna, generalmente con una dinamica de primer orden:
w(t) = y(t) w(t+ k) = αw(t+ k − 1) + (1 − α)r(t+ k) k = 1, · · · , N
con 0 < α < 1.
A.3. Control Predictivo Generalizado
El Control Predictivo Generalizado (GPC) (Clarke et al., 1987) es uno de los tipos
mas populares de MPC. La estrategia de control predictivo mın-max con incertidum-
bres globales acotadas se basa en el esquema del GPC, el cual emplea un modelo de
prediccion del tipo CARIMA:
A(z−1)y(t) = B(z−1)z−du(t− 1) + C(z−1)e(t)
∆
Las predicciones optimas se obtienen resolviendo una ecuacion Diofantica, de manera
que estas se pueden expresar en forma condensada como:
y = Guu+ f (A.5)
donde u es el vector de incrementos de control, y el vector de salidas predichas y f es el
vector de la respuesta libre del sistema, es decir, la parte de la salida que solo depende
de los valores pasados de la senal de control y de salida. Teniendo en cuenta esto, la
funcion objetivo (A.4) suponiendo δ(k) = 1 y λ(k) constante puede reescribirse como:
J(u) = (Guu+ f − w)T (Guu+ f − w) + λuTu (A.6)
donde w es el vector de valores futuros de la trayectoria de referencia. A su vez, esto
se puede reescribir como:
J(u) =1
2uTHu+ bTu+ f0 (A.7)
siendo:
H = 2(GTuGu + λI)
bT = 2(f − w)Gu
f0 = (f − w)T (f − w)
APENDICE A. ELEMENTOS BASICOS DEL MPC 75
Suponiendo que no se consideran restricciones, existe una solucion analıtica facil de
calcular diferenciando (A.7) obteniendose la secuencia optima de control como:
u∗ = −H−1b (A.8)
Por otra parte si se consideran restricciones, es posible encontrar una particion del
espacio de estado del proceso (formado en este caso por las entradas y salidas pasadas)
en regiones donde la ley de control tiene una expresion analıtica, por lo que la ley de
control es lineal a trozos (Bemporad et al., 2000b). Tradicionalmente sin embargo, se
ha calculado la senal de control resolviendo el problema de programacion cuadratica
(QP) mediante metodos numericos. Tal y como se muestra en (Camacho, 1993) es
posible encontrar la solucion del problema QP de manera muy eficiente, resolviendo el
problema lineal complementario (LCP) mediante el algoritmo de Lemke.
Bibliografıa
Acevedo, J. and E.N. Pistikopoulos (1997). A multiparametric programming approach
for linear process engineering problems under uncertainty. Industrial Engineering
Chemical Research 36, 717–728.
Albertos, P. and R. Ortega (1989). On Generalized Predictive Control: Two Alternative
Formulations. Automatica 25(5), 753–755.
Allwright, J.C. (1994). Advances in Model-Based Predictive Control. Chap. On min-
max Model-Based Predictive Control. Oxford University Press.
Allwright, J.C. and G.C. Papavasilou (1991). A Reduced-Size LP Formulation for Ro-
bust MPC using Impulse Responses. In: Proc. 30th IEEE Conference on Decision
and Control.
Allwright, J.C. and G.C. Papavasilou (1992). On Linear Programming and Robust
Model-Predictive Control using Impulse-Responses. Systems and Control Letters
18, 159–164.
Badgwell, T. (1997). Robust Model Predictive Control of Stable Linear Systems. In-
ternationa Journal of Control 68, 797–818.
Batina, I., A.A. Stoorvogel and S. Weiland (2001). Feedback Model Predictive Con-
trol by Randomized Algorithms. In: Proc. European Control Conference, ECC’01.
pp. 3185–3189.
Bazaraa, M.S. and C.M. Shetty (1979). Nonlinear Programming. Theory and Algo-
rithms. John Wiley & Sons.
Bellman, R. (1961). Adaptive Control Processes - A guided tour. Princeton University
Press.
Bemporad, A., F. Borrelli and M. Morari (2000a). Explicit Solution of LP-based Model
Predictive Control. In: Proc. 39th IEEE Conf. on Decision and Control.
77
78 BIBLIOGRAFIA
Bemporad, A., F. Borrelli and M. Morari (2001). Robust Model Predictive Con-
trol: Piecewise Linear Explicit Solution. In: Proc. European Control Conference,
ECC’01.
Bemporad, A., M. Morari, V. Dua and E.N. Pistikopoulos (2002). The Explicit Linear
Quadratic Regulator for Constrained Systems. Automatica 38, 3–20.
Bemporad, A., M. Morari, V.Dua and E.N. Pistikopoulos (2000b). The Explicit So-
lution of Model Predictive Control via Multiparametric Quadratic Programming.
In: Proc. American Control Conference.
Bemporad, Alberto (1998). Reducing conservativeness in predictive control of con-
strained systems with disturbances. In: Proceedings of the 37th IEEE Conference
on Decision and Control. pp. 1384–1389.
Blanchini, F. (1999). Set Invariance in Control. Automatica 35, 1747–1767.
Bland, R., D.Goldfarb and M. Todd (1981). The ellipsoid method: a survey. Operations
Research 29(6), 1039–1091.
Bordons, C. and E.F. Camacho (1998). A Generalized Predictive Controller for a Wide
Range of Industrial Processes. IEEE Transactions on Control Systems Technology
6(3), 372–387.
Boyd, S., L.E. Ghaoui, E. Feron and V. Balakrishnan (1994). Linear matrix inequalities
in system and control theory. SIAM. Philadelphia.
Camacho, E. F. and Manuel Berenguel (1997). Robust Adaptive Model Predictive
Control of a Solar Plant with Bounded Uncertainties. International Journal of
Adaptive and Signal Processing 11, 311–325.
Camacho, E.F. (1993). Constrained Generalized Predictive Control. IEEE Transactions
on Automatic Control 38(2), 327–332.
Camacho, E.F. and C. Bordons (1995). Model Predictive Control in the Process Indus-
try. Springer-Verlag.
Camacho, E.F. and C. Bordons (1999). Model Predictive Control. Springer-Verlag.
Campo, P.J. and M. Morari (1987). Robust Model Predictive Control. In: Proc. Amer-
ican Control Conference. pp. 1021–1026.
Casavola, A., M. Giannelli and Edoardo Mosca (1999). Global Predictive Regulation
of Null-Controllable Input-Saturated Linear Systems. IEEE Transactions on Au-
tomatic Control 44, 2226–2230.
BIBLIOGRAFIA 79
Casavola, A., M. Giannelli and Edoardo Mosca (2000). Min-Max Predictive Control
strategies for input-saturated polytopic uncertain systems. Automatica 36, 125–
133.
Clarke, D.W., C. Mohtadi and P.S. Tuffs (1987). Generalized Predictive Control - part
I. The basic algorithm. Automatica 23(2), 137–148.
Coales, J.F. and A.R.M. Noton (1956). An on-off servo mechanism with predicted
change-over. Proc. Institution of Electrical Engineers, Part B 103, 449–462.
Cutler, C.R. and B.C. Ramaker (1980). Dynamic Matrix Control - A Computer Control
Algorithm. In: Proc. American Control Conference.
Cuzzola, F. A., J. C. Geromel and M. Morari (2001). An improved approach for con-
strained robust Model Predictive Control. In: Proc. European Control Conference,
ECC’01, Aceptado en Automatica. pp. 3759–3764.
Dua, V. and E.N. Pistikopoulos (2000). An algorithm for the solution of multipara-
metric mixed integer linear programming problems. Annals of Operations Research
99, 123–139.
Gal, T. (1979). Postoptimal analyses, parametric programming and related topics.
McGraw-Hill.
Gal, T. and J.Nedoma (1972). Multiparametric Linear Programming. Management
Science 18(7), 406–422.
Geromel, J.C., P.L.D. Peres and J. Bernoussou (1991). On a convex parameter space
method for linear control design of uncertain systems. SIAM Journal of Control
and Optimisation 29(2), 381–402.
Gomez-Ortega, J. and E. F. Camacho (1994). Neural network GPC for mobile robots
path tracking. Robotics and Computer Integrated Manufacturing 11(4), 271–278.
Gomez-Ortega, J., D.R. Ramırez, D. Limon-Marruedo and E.F. Camacho (2001). Ge-
netic Algorithms Based Predictive Control for Mobile Robot Navigation in Chang-
ing Environments. In: Proc. European Control Conference, ECC’01. pp. 3179–
3184.
Gutierrez, A.J. and E. F. Camacho (1995). Robust Adaptive Control for Processes
with Bounded Uncertainties. In: Proc. Third European Control Conference. Vol. 2.
Rome. pp. 1295–1300.
Kim, Y.H. and W.H. Kwon (1998). An application of min-max generalized predictive
control to sintering processes. Control Engineering Practice 6, 999–1007.
80 BIBLIOGRAFIA
Kim, Y.H., W.H. Kwon and Y.I. Lee (1998). Min-max generalized predictive control
with stability. Computers & Chemical Engineering 22(12), 1851–1858.
Kothare, M.V., V. Balakrishnan and M. Morari (1996). Robust constrained model
predictive control using linear model inequalities. Automatica 32(10), 1361–1379.
Lau, M.K., S. Boyd, R.L. Kosut and G.F. Franklin (1991). A Robust Control Design
for FIR Plants with Parameter Set Uncertainty. In: Proceedings of the 30th IEEE
Conference on Decision and Control. pp. 83–88.
Lee, J.H. and B.L. Cooley (2000). Min-max predictive control techniques for a linear
state-space system with a bounded set of input matrices. Automatica.
Lee, J.H. and Zhenghong Yu (1997). Worst-case formulations of model predictive con-
trol for systems with bounded parameters. Automatica 33(5), 763–781.
Lee, Y.I., W.H. Kwon and Y.H. Kim (1996). A robust GPC which guarantees H∞ norm
bounds and its stability properties. In: Proceedings of the 35th IEEE Conference
on Decision and Control. pp. 721–725.
Lu, Y. and Y. Arkun (2000a). Polytope updating in Quasi-Min-Max MPC algorithms.
In: Proceedings of the International Symposium on Advanced Control of Chemical
Processes, ADCHEM 2000. pp. 413–418.
Lu, Y. and Y. Arkun (2000b). Quasi-Min-Max MPC algorithms for LPV systems.
Automatica 36(4), 527–540.
Lu, Y. and Y. Arkun (2001). Scheduling Quasi-Min-Max Model Predictive Control Al-
gorithm for Nonlinear Systems. In: Proc. European Control Conference, ECC’01.
pp. 3741–3746.
Mayne, D.Q. and H. Michalska (1990). Receding horizon control of nonlinear systems.
IEEE Transactions on Automatic Control 35, 714–724.
Mayne, D.Q., J.B. Rawlings, C.V. Rao and P.O.M. Scokaert (2000). Constrained model
predictive control: Stability and optimality. Automatica 36, 789–814.
Megıas, D., J. Serrano and C. de Prada (2001). Min-Max Constrained Infinite Horizon
Model Predictive Control: Standard vs. Feedback Formulation. In: Proc. European
Control Conference, ECC’01. pp. 3765–3770.
Milliken, P., C. Marsh and B. vanBrunt (1999). Minimax controller design for a class
of uncertain nonlinear systems. Automatica 35, 583–590.
Mo, S.H. and J.P. Norton (1990). Fast and robust algorithm to compute exact polytope
parameter bounds. Math & Computers in Simulation 32, 481–493.
BIBLIOGRAFIA 81
Noh, S.B., Y.H. Kim, Y.I. Lee and W.H. Kwon (1996). A robust generalized predictive
control with terminal output weightings. International Journal of Process Control
6(2-3), 137–144.
Normey-Rico, J.E. and E.F. Camacho (1999). Robustness effects of a prefilter in a
Smith predictor-based generalised predictive controller. IEE Proceedings on Con-
trol Theory Applications 146(2), 179–185.
Norton, J.P. (1987a). Identification and Application of Bounded-Parameter Models.
Automatica 23, 497–507.
Norton, J.P. (1987b). Identification of parameter bounds for ARMAX models from
records with bounded noise. International Journal of Control 45, 375–390.
Oliveira, G., G. Favier, G. Dumont and W. Amaral (1996). Robust Predictive Con-
troller Based on Laguerre Filters Modeling. In: Proceedings of the 13th IFAC World
Congress. Vol. G. San Francisco, USA. pp. 375–380.
Oliveira, G.H.C., W.C. Amaral, G. Favier and G.A. Dumont (2000). Constrained Ro-
bust Predictive controller for uncertain processes modeled by orthonormal series
functions. Automatica 36, 563–571.
Ozkan, L., M. Kothare and C. Georgakis (2000). Model Predictive Control of nonlin-
ear systems using piecewise linear models. Computers & Chemical Engineering
24, 793–799.
Papavasilou, G.C. and J.C. Allwright (1991). A descent algorithm for a min-max prob-
lem in Model-Predictive Control. In: Proc. 30th IEEE Conference on Decision and
Control.
Propoi, A. I. (1963). Use of linear programming methods for synthesising sampled-data
automatic systems. Automation and Remote Control 24, 837–844.
Qin, S.J. and T.A. Badgwell (1996). An overview of industrial model predictive control
technology. In: Proceedings of the Conference on Chemical Process Control, CPC
V. Tahoe City, USA. pp. 232–256.
Ramırez, D.R., D. Limon-Marruedo, J. Gomez-Ortega and E.F. Camacho (1998). Ge-
netic Algorithm Approach for Nonlinear Multivariable MBPC Mobile Robot Nav-
igation. In: Proc. First NICONET Workshop on Numerical Software in Control
Engineering.
Ramırez, D.R., D. Limon-Marruedo, J. Gomez-Ortega and E.F. Camacho (1999a).
Model Based Predictive Control using Genetic Algorithms. Application to a Pilot
Plant. In: Proc. European Control Conference, ECC’99.
82 BIBLIOGRAFIA
Ramırez, D.R., D. Limon-Marruedo, J. Gomez-Ortega and E.F. Camacho (1999b).
Nonlinear MBPC for Mobile Robot Navigation using Genetic Algorithms. In: Proc.
of the International Conference on Robotics and Automation (ICRA’99).
Rawlings, J.B. and K.R. Muske (1993). The stability of constrained receding horizon
control. IEEE Transactions on Automatic Control 38, 1512–1516.
Richalet, J. (1992). Practique de la Commande Predictive. Editions Hermes.
Richalet, J., A. Rault, J.L. Testud and J. Papon (1978). Model Predictive Heuristic
Control: Application to Industrial Processes. Automatica 14(2), 413–428.
Roos, C., T. Terlaky and J.P. Vial (1997). Theory and Algorithms for Linear Opti-
mization - An Interior Point Approach. Wiley.
Savkin, A.V. and I.R. Petersen (1995). Minimax optimal control of uncertain systems
with structured uncertainty. International Journal of Robust and Nonlinear Con-
trol 5, 119–137.
Scokaert, P.O.M. and D.Q. Mayne (1998). Min-max feedback model predictive con-
trol for constrained linear systems. IEEE Transactions on Automatic Control
43(8), 1136–1142.
Scokaert, P.O.M. and J.B. Rawlings (1999). Feasibility issues in linear model predictive
control. AICHE Journal 45, 1649–1659.
Skrjanc, I. and D. Matko (1994). Advances in Model-Based Predictive Control. Chap.
Fuzzy Predictive Controller with Adaptive Gain. Oxford University Press.
Tan, Y. and A. Van Cauwenberghe (1995). Use of neural networks for nonlinear pre-
dictive control. In: 3rd European Control Conf.. pp. 2760–2765.
Tondel, P., T.A. Johansen and A. Bemporad (2001). An Algorithm for Multi-
Parametric Quadratic Programming and Explicit MPC Solutions. In: Proc. 40th
Conference on Decision and Control, CDC’2001.
Veres, S.M. (2000). Worst case dual control: basic results. International Journal of
Control 73(18), 1621–1646.
Veres, S.M. and J.P. Norton (1991). Bound-Based Worst-Case Predictive Controller.
In: Proc. IFAC Symposium on Intelligent Tuning and Adaptive Control. Singapore.
Veres, S.M. and J.P. Norton (1993). Predictive Self-Tuning Control by Parameter
Bounding and Worst Case Design. Automatica 29(4), 911–928.
BIBLIOGRAFIA 83
Wahlberg, B. and P. Makila (1996). On Approximation of Stable Linear Dynamical
Systems using Laguerre and Kautz Functions. Automatica 32(5), 693–708.
Wu, Fen (1997). LMI-based Robust Model Predictive Control Evaluated on An In-
dustrial CSTR Model. In: Proceedings of the IEEE International Conference on
Control Applications. pp. 609–614.
Zheng, A. (1995). Robust Control of systems subject to constraints. PhD thesis. Cali-
fornia Institute of Technology.
Zheng, A. and M. Morari (1993). Robust Stability of Constrained Model Predictive
Control. In: Proc. American Control Conference. Vol. 1.
Zheng, A. and M. Morari (1995). Stability of Model Predictive Control with soft con-
straints. IEEE Transactions on Automatic Control 40(10), 1818–1823.