知的制御システム 8週目 -...
TRANSCRIPT
SIC-1
知的制御システム8週目
安信誠二筑波大学 大学院 システム情報工学研究科
入出力関係
入力 出力
知的制御システム 講義資料
1993-2014 (c) [email protected] 1/36
知的制御システムと計算機の処理
制御指令u
状態X
制御目的
知的コントローラ
制御対象
制御・運転知識
制御・運転経験
知識の定式化
知的コントローラの処理
知識に基づき,学習して制御指令uを推論する
計算機:0.01秒毎に制御知識を元に,知的処理を実行・予め決められてはいない状況に対処・人間と協調した処理(3.2GHz: 3200万演算/0.01秒)
知的制御システム 講義資料
1993-2014 (c) [email protected] 2/36
SIC-6-3
熟練者の知的活動熟練者の運転
• 過去の操作経験– 特性を定性的に把握
• 運転ノウハウを制御知識として蓄積– 制御目的を満足する「うまい制御」
(1)多次元的状態評価(浅い知識)
「もし、○○のシステム状態ならば、△△の制御指令をだしたら良い制御ができそうだ。」
(2)多次元的目的評価 (システムの動特性に基づく「深い知識」)
「もし、このシステム状態で、△△の制御指令を出したならば、
◇◇のように動くから、対象システム本来の制御目的□□を
満足した制御ができそうだ。」
知的制御システム 講義資料
1993-2014 (c) [email protected] 3/36
SIC-8-4
多次元的状態評価 (状態評価ファジィ制御 )
ファジィ状態評価 制御指令選択指令評価
「温度」 「圧力」 「燃料増加量」
(重心計算)
燃料変化
対象システム状態観測部
もし温度が高く、
1
0
1
0
1
0
1
0
1
0
μμ
μμ μ
圧力が高ければ、
もし温度が低く、 圧力が低ければ、 燃料を増す
燃料を減らす
+ー
温度
温度
圧力
圧力
1
0
μ
+ー 0
0
燃料変化
燃料変化
min計算
min計算
1
0
ー +0
1μ
システム状態
制御指令
状態評価ファジィ制御の推論過程
知的制御システム 講義資料
1993-2014 (c) [email protected] 4/36
多次元的目的評価 (予見ファジィ制御)
仮 定
制御指令を保持
制御指令を
増加
制御指令
を減少
予 見 指令評価値 指令選択ファジィ目的評価
目的1(x) 目的2(y)
システム状況
対象システム
1
0
1
0
1
0
目的予見値 1
0
許容
1
0
1
0
1
0
正確
X
小さい
正確 大きい
同上
同上制御指令
将来状態の予測
X
X Y
C1
1
0C2
C3
C2
1
0 C1C3
1
0
大きい
Y
Y U
U
U
U
制御指令を保持
制御指令を増加
制御指令を減少
予見ファジィ制御方式の推論過程
対象モデル
知的制御システム 講義資料
1993-2014 (c) [email protected] 5/36
9
システムを制御• サイバネ ティックス(Cybernetics)“われわれの状況に関する二つの状況があるものとして,その一方はわれ
われには制御できないもの,他の一方はわれわれに調節できるものとし
よう.そのとき制御できない変量の過去から現在にいたるまでの値に基
づいて,調節できる変量の値を適当に定め,われわれに最も都合のよ
い状況をもたらすという望みがもたれます.それを達成する方法が
Cyberneticsにほかならないのです.”
ノーバート・ウィナー著「サイバネティックス」
• 制御(control):「ある目的に適合するように,対象となっているものに所要の操作を加えること」
対象システム+制御器 => 制御システム
知的制御システム 講義資料
1993-2014 (c) [email protected] 9/36
10
システムとはシステムの言葉:Systemある目的を達成するように秩序立てること訳語:組織,系統,体系,系,制度,方法カオス(Chaos,混沌)の反対語
要素1
要素2要素n
目的
JIS(Z8121)システム「多数の構成要素が、有機的な秩序を保ち、同一の目的に向かって行動するもの」
統一
複数要素
相互関連
自動車,ロケット携帯電話,鉄道銀行,・・・
知的制御システム 講義資料
1993-2014 (c) [email protected] 10/36
11
システムの入力と出力• システムは、入力(原因)によって出力(結果)が決まる。
実システム入力 出力
モデル化
出力入力
要素
要素
要素状態変数s
システム・モデル
車
機械システム
アクセル 速度
経済システム
単価 売上ラーメン屋
知的制御システム 講義資料
1993-2014 (c) [email protected] 11/36
コーザリティ(causality、因果関係、工学要素で大事なこと)
・水ホース(抵抗R)の圧力(高さ)hと流れ(水量)q場合
・タンクへの流入水量qと水の高さ・深さhの場合
hh qRR
1R抵抗
水量q噴水の高さh
R抵抗
h
q
水量q
高さh
タンク
浴槽
バケツの高さh
水量q
逆方向も成立
高さh
水量q
1タンク
逆方向は解らないタイムマシン・瞬間移動
q
知的制御システム 講義資料
1993-2014 (c) [email protected] 12/36
13
コーザリティ(causality、因果関係) (2)
質量M の物体に働く力 f と位置 x の関係は、f(すなわち加速度)から、速度v、位置 x が決まり、位置xを入力、指定,しても、無限の速度、加速度(力)が必要
fM v
x
α:加速度:速度
:位置
fM
α = dtα∫ v xvdt∫
車は急には止まれない!
• 制御(control):「ある目的に適合するように,対象となっているものに所要の操作を加えること」
対象システム+制御器 => 制御システム
制御システムは、望みをかなえる。(奇跡を起こす)
知的制御システム 講義資料
1993-2014 (c) [email protected] 13/36
14
部屋の温度を調節(制御)する(望みの温度にしたい)
ヒータ 部屋
温度計
スイッチ目標温度 熱量
外部の温度
部屋の温度
温度計の読みフィードバック
比較
(目的)
ヒータ
温度計20
ブロック線図(block diagram)フィードバック(帰還,feedback)
知的制御システム 講義資料
1993-2014 (c) [email protected] 14/36
15
従来制御と知的制御
制御対象
偏差 操作指令外乱
制御量
計測器
知的制御器目標値
数式モデル設計された制御方式
コントローラへ実装し調整 対象をモデル化
望ましい応答となるように,計算機で設計従来制御
安全・正確な運転
知的制御
うまい運転制御則
人間の操作知識、経験、ノウハウ
組み込み
熟練者の操作経験
係数
知的制御システム 講義資料
1993-2014 (c) [email protected] 15/36
16
システムの記述(1)状態変数モデル
制御対象システム内部状態x(t)
入力u(t)初期値
出力y(t)
[ ]
11 12 11 1 1
21 22 22 2 2
1 2
1
21 2
( ) ( )( ) ( )
( )
( ) ( )
( )( )
( )
( )
n
n
n n nnn n n
n
n
a a ax t x t ba a ax t x t b
u t
a a ax t x t b
x tx t
y t c c c
x t
= +
=
& L& L
M M MM M M& L
LM
( ) ( ) ( )( ) ( )t t u t
y t t= +=
x Ax BCx
&
y(t)C
A
状態変数線図
Bu(t) +
+∫
x(0)
x(t)x(t).
ベクトル,マトリックスはスカラ値と同様に扱える
( ) ( , , )
( ) ( , )
d t f u tdt
y t g t
=
=
x x
x
: 状態方程式
: 出力方程式
(n n)( )(n 1), (n 1)(1 n)t
×× ×
×
Ax BC
行列
列ベクトル
行ベクトル
知的制御システム 講義資料
1993-2014 (c) [email protected] 16/36
17
2
2
M=1, k=2, b=0.566(=2*0.2 2)( ) ( )0.566 2 ( ) ( )d y t dy t y t u t
dt dt+ + =
の時
2
2
(1)
( ) ( ) ( ) ( )
(0)(0)( (0)) :
d y t dy tM b ky t u tdt dt
yy v
+ + =
=
初期条件 :初期位置
初期速度
11 1 1( ) sin( )ty t K e tα β θ−= +
減衰振動の時,未定係数法などにより
0 2 4 6 8 10-1.5
-1
-0.5
0
0.5
1
1.5
Time (sec) [f2p1.m]
y(t)
(m
ete
rs)
ωn=1.4142 ζ=0.2
質量
M
y(t)
u(t)力
粘性摩擦b
k
ばね・質量・ダンパ系
実対象のダイナミクスを,数式(微分方程式)モデルで扱える
対象を解析
m1go.mmd2p1.mdl
知的制御システム 講義資料
1993-2014 (c) [email protected] 17/36
18
[ ]
1 1
2 2
1
2
0 1 0( )
/ / 1/
( ) 1 0
x xu t
x xk M b M M
xy t
x
= + − −
=
&&
2
1( ) ( )Y s U sM s bs k
=+ +
初期値が全て0の時( )U s )(sY
2
1M s b s k+ +
対象を数式モデル化,状態変数モデル(A,B,C),伝達関数モデル化
( )u t ( ) ( ) ( )( ) ( )t t u t
y t t= +=
x Ax BCx
& ( )y t
知的制御システム 講義資料
1993-2014 (c) [email protected] 18/36
19
対象の初期値x(0)からの動き,u(t)=0 (自由系)の時
Aから求まる,"固有値"で決まる.( ) ( ), ( ) ( )
(0) ( ) (0)t t
x t x t y t x tx(t) e x y t e x
= =
= =A A
A CC
&解は,
1 1[( ) ]te s− −= −A I AL
1 01
, , :1 2
01( ) (0) (0)
0
n nsI s s n
v vi i iv v vn
tetx t x xe
te
t t tv e v e v e
α α
λ λ λλ
λ
λ
λ λ λ
−− = + + + =
=
−= =
=
AA
AA
A T T
LL
L
O
LL
特性方程式
の根、 , , , を の という1 2 n
の
1
n
1 + i + + n+z z z1(0) i(0) n(0)1 i n
固有値
固有ベクトル
( )1 2
1(0)
, , , ( )
1(0)(0)
(0)
n n n
zx
zn
v v v
−
= ×
≠
= =
T
T
T Z
L
M
固有値が重複しないとき
は、 ( 0)正則
自由応答は,固有値λiでモード展開できλiで減衰していく
知的制御システム 講義資料
1993-2014 (c) [email protected] 19/36
20
数式モデルから速く減衰できる,制御器が設計できる.
全体の極を決める.(極配置)
2
( )( )( ) ( )
Zero: -15.1Pole: -7.5500 6.7080i
d
d p
Ms b kY sMs b k s k k
+ +=
+ + + +
± と決める(設計)
0 2 4 6 8 10-2
-1
0
1
2
Time (sec) [f2p6.m]y(
t) (m
ete
rs)
ωn=10.0995 ζ=0.74756
-15 -10 -5 0-8
-6
-4
-2
0
2
4
6
8Pole-Zero Map
Real Axis [f2p5.m]
Imagi
nary
Axi
s
×
×
○
常微分方程式のSimulinkによる解
x
In1 Out1
Subsystem
md1_anim
S-Function
Manual Switch
100
Kp
15
Kd
du/dt
Derivative
0
Constant1
0
Constant
m1go.mmd2p1.mdl
知的制御システム 講義資料
1993-2014 (c) [email protected] 20/36
21
最適制御
対象のA,B,Cが決まる.
ゲインKの最適操作量u*(t)を考える
対象の動きと制御指令の評価QRを決める(設計).
C
A
B+
+
( )x t&*( )u t
∫
(0)x( )x t ( )y t( ) ( ) ( )
( ) ( )t t u t
y t t= +=
x Ax BCx
&
0( )T Tx x u u dt
∞Φ = +∫ Q R
K+
-0
*( ) ( )u t x t= −K
知的制御システム 講義資料
1993-2014 (c) [email protected] 21/36
22
自動的に制御器が出来る(ただし,解が求まるには,条件がある)
u*(t)を状態フィードバック制御則というゲインKは,リッカチ方程式
1
1
0
=
T T
T
T
−
−
+ − + =
− − −
PA A P PBR B P Q
A BR BH
Q A
の係数で作ったハミルトニアン行列
の固有値問題を解いて,
その解 P を用い,[ex:MATLABにて,P=lqr(A,B,Q,R)で解ける]
1 T−=K R B Pで制御すれば良い.
知的制御システム 講義資料
1993-2014 (c) [email protected] 22/36
23
重さ,長さから対象を記述[m, l, M, ....を測定]
対象を倒立 (x=0,v=0,θ=0,ω=0)近傍で数式モデル化
倒立を保てる最適制御器を設計[Q,R を決め,Kを求める.]
計算機シミュレーションで確認対象の非線形数式モデル,対象の仮想物理モデル(SimMechanics)実際の振り子で確認
倒立振り子の最適制御
( ) ( ) ( )( ) ( ) ( )t t u t
y t t u t= += +
x Ax BCx D
&
設計値からモデルを用いて良好な実制御システムを構築可能
実機実験倒立
pgo@1Pendsim7s1
p1go@2pend_SimMecha7s1
知的制御システム 講義資料
1993-2014 (c) [email protected] 23/36
24
人間の言葉をファジィ理論で定量化(計算機が度合いを持った言葉を扱える)
従来集合
暑い
1
00 10 20 30 40
寒い 快適
室温℃
ファジィ集合
1.0
0.00 10 20 30 40
寒い 快適 暑い
室温℃
26℃
26.1℃
快適
暑いラベル化
26℃
快適 0.9
暑い 0.7
ラベル +度合
ファジィ理論提唱者のザディ教授と@2005年北京
知的制御システム 講義資料
1993-2014 (c) [email protected] 24/36
25
ファジィ制御の概念
ファジィ推論[無限値論理]
1.もし,車間距離が小さく,走行速度が大きいならば, ブレーキを強く.
2.もし,車間距離が大きく,走行速度が小さいならば, ブレーキを弱く.
1
0
μ
速度100Km/h0
大きい
100m0
1
0
μ
距離
小さい
μ
強く
100
1
0ブレーキ力
100m0
1
0
μ
距離
大きい
100Km/h0
1
0
μ
速度
小さい1
0
μ弱く
0 10ブレーキ力
μ
100
1
0
ブレーキ力
非ファジィ化ブレーキ力5.2
車間距離走行速度
[ブレーキ操作] 前の車にぶつからないように,ブレーキをかける.
車間距離
走行速度
時間→
10
0
ブレーキ力
・ファジィ判断 →滑らか・人間的演算・少ないルール
知的制御システム 講義資料
1993-2014 (c) [email protected] 25/36
26
水タンクの知的(ファジィ)制御rgo.m:知識fgo.m:実行(pidと比較)
@FuzzyControlWRule
ならば,バルブを,*.もし,水位誤差が*で,水位変化が*,
無し
無し
無し
正
負
大きく入れる
正
負
閉める
大きく出す
少し入れる
少し出す
大きく出すを指令
入出力関係水位
目標水位
+ ー
微分 推論結果
バルブ(入,出)
精密モデル不要
知的制御システム 講義資料
1993-2014 (c) [email protected] 26/36
27
言葉で振り子を振り上げ倒立真下に来たとき,右に加振して振り上がりそうなら右に加振する真下に来たとき,左に加振して振り上がりそうなら左に加振する
大体倒立して,右に居るなら少し左傾斜を目標に.大体倒立して,左に居るなら少し右傾斜を目標に.
大体倒立して,目標より右側なら左へ動かす.大体倒立して,目標より左側なら右へ動かす.
・計算機シミュレーションで確認対象の仮想物理モデルを,
C言語で制御器構築し制御
・そのまま,実際の振り子に移植し実行
{ugo,dgo}@ v7_05n1C_P_PDBigPendSim
倒立+外乱付加実験 振り上げ実験
知的制御システム 講義資料
1993-2014 (c) [email protected] 27/36
28
2nd pendulum
1st pendulum
cart
•従来制御では難しい(二重振り子)非線形システムを課題とし,振り上げ倒立安定化の課題を解決する
• [方法]人間は,二重振子の状況を判断し状況に応じた操作が可能 → 計算機化
"Swing Up Intelligent Control of Double Inverted Pendulum Based on Human Knowledge", Proc. of SICE Annual Conference 2004 in Sapporo, pp.1869-1873, 2004.
人間の操作知識に基づく制御
Controller
Human
or
Pendulum
Pendulum
au Fx
u
2
1 2nd
1st
x x1, 1
2, 2
,
.
.
.
xController
Human
or
Pendulum
Pendulum
au Fx
u
2
1 2nd
1st
x x1, 1
2, 2
,
.
.
.
x
知的制御システム 講義資料
1993-2014 (c) [email protected] 28/36
29
SimMechanics(The Math Works Inc.).
•慣性モーメント•質量•重心
2 22 1 2
1 2
2 211 1 1 1
2 2 2
[{ ( sin )} { ( cos )} ]2
M J JT x
m d dx l ldt dt
θ θ
θ θ
• • •
= + +
+ + +
+L 数式を用いない
etc
人間の操作知識をファジィ集合で定量化し,知的制御器(C言語)を開発
Ø数式なしで,計算機上に仮想モデルを構築Ø時間を引き延ばしての,解析と操作が可能Øジョイスティックを用い何度も操作し,操作知識を獲得
部品を結合
操作知識の獲得
仮想実験
知的制御システム 講義資料
1993-2014 (c) [email protected] 29/36
30
知的制御器(C言語)をMATLAB/Simulink+SimMechanics(仮想機構モデル)に組み込み評価
知的制御器(C言語)をMATLAB/Simulink+xPC Targetにて実機に適用
数式モデルなしで二重振り子の振り上げ安定化(実機)をツール(MATLAB/Simulink)を用いて,解決
シミュレーション→ 実機実験
実験1
実験2
モデルで確認
知的制御システム 講義資料
1993-2014 (c) [email protected] 30/36
31
熟練運転士の知識を組み込み,言葉で電車を運転
(仙台市地下鉄,東京都大江戸線,..)熟練運転士と同等のうまい運転を実現
ATOvideo
知的制御システム 講義資料
1993-2014 (c) [email protected] 31/36
32
知的制御器によるハンドル操作
多目的(壁、障害物、目標、乗り心地など)をファジィ評価し適切な操作を実行
ファジィ評価
wall
現在位置
戦術目標
予測結果
予測結果
予測結果
左に曲がる
直進
右に曲がる
近い
遠い
遠い
近い
遠い
遠い
μ1.0
壁との距離
近い
知的制御システム 講義資料
1993-2014 (c) [email protected] 32/36
34
最終目標 (駐車位置)
戦略: 車庫に寄せる
戦略目標 戦術目標
大局的(戦略)目標・車庫に寄せる・向きを変える・切り返し位置へ移動・車庫に入れる・制御を終了
局所的(戦術)目標を設定・車両特性を考慮・現在到達可能
人間の駐車運転
局所的(戦術)目標へハンドル操作
強化学習による知識獲得 RL_IC_fuzzyTarget
知的制御システム 講義資料
1993-2014 (c) [email protected] 34/36
35
知的協調制御
知的制御器 知的協調器
目標
運転知識
操作者
車(x,y,θ)
φ
知的協調制御器
ハンドル操作制御器
戦術目標生成
車の状態
障害物検知
φ
アクセル・ブレーキ
nΦ
Hτ Tτ
Cτ
自動運転部
障害物
sr
ファジィ制御指令
人間と協調運転VTR
知的制御システム 講義資料
1993-2014 (c) [email protected] 35/36
36
四輪車操作を知的に支援
支援者
操作者(被支援者)
車両
操作決定
状況
操作状況
戦略決定目標設定
操作指示
どんな操作をすればよいかどこを目標とするか
どういう指示を出せばよいか
福祉車両の駐車を支援
乗用車の駐車を支援
模擬実験
福祉車両を人間の知識で駐車運転
知的制御システム 講義資料
1993-2014 (c) [email protected] 36/36