知的制御システム 8週目 -...

SIC-1

知的制御システム8週目

安信誠二筑波大学大学院システム情報工学研究科

入出力関係

入力出力

知的制御システム講義資料

1993-2014 (c) [email protected] 1/36

[email protected]

知的制御システムと計算機の処理

制御指令u

状態X

制御目的

知的コントローラ

制御対象

制御・運転知識

制御・運転経験

知識の定式化

知的コントローラの処理

知識に基づき，学習して制御指令ｕを推論する

計算機：0.01秒毎に制御知識を元に，知的処理を実行・予め決められてはいない状況に対処・人間と協調した処理(3.2GHz: 3200万演算／0.01秒）



SIC-6-3

熟練者の知的活動熟練者の運転

• 過去の操作経験– 特性を定性的に把握

• 運転ノウハウを制御知識として蓄積– 制御目的を満足する「うまい制御」

(1)多次元的状態評価（浅い知識）

「もし、○○のシステム状態ならば、△△の制御指令をだしたら良い制御ができそうだ。」

(2)多次元的目的評価 (システムの動特性に基づく「深い知識」）

「もし、このシステム状態で、△△の制御指令を出したならば、

◇◇のように動くから、対象システム本来の制御目的□□を

満足した制御ができそうだ。」



SIC-8-4

多次元的状態評価（状態評価ファジィ制御）

ファジィ状態評価制御指令選択指令評価

「温度」「圧力」「燃料増加量」

(重心計算)

燃料変化

対象システム状態観測部

もし温度が高く、

1

0

1

0

1

0

1

0

1

0

μμ

μμ μ

圧力が高ければ、

もし温度が低く、圧力が低ければ、燃料を増す

燃料を減らす

+ー

温度

温度

圧力

圧力

1

0

μ

+ー 0

0

燃料変化

燃料変化

min計算

min計算

1

0

ー +0

1μ

システム状態

制御指令

状態評価ファジィ制御の推論過程



[email protected]

多次元的目的評価（予見ファジィ制御）

仮定

制御指令を保持

制御指令を

増加

制御指令

を減少

予見指令評価値指令選択ファジィ目的評価

目的１(x) 目的２(y)

システム状況

対象システム

1

0

1

0

1

0

目的予見値 1

0

許容

1

0

1

0

1

0

正確

X

小さい

正確大きい

同上

同上制御指令

将来状態の予測

X

X Y

C1

1

0C2

C3

C2

1

0 C1C3

1

0

大きい

Y

Y U

U

U

U

制御指令を保持

制御指令を増加

制御指令を減少

予見ファジィ制御方式の推論過程

対象モデル



ニューラルネットワーク制御

6



神経細胞のモデル

7



ニューラルネットワーク・モデル

8

ニューラルネットワークによる制御



9

システムを制御• サイバネティックス(Cybernetics)“われわれの状況に関する二つの状況があるものとして，その一方はわれ

われには制御できないもの，他の一方はわれわれに調節できるものとし

よう．そのとき制御できない変量の過去から現在にいたるまでの値に基

づいて，調節できる変量の値を適当に定め，われわれに最も都合のよ

い状況をもたらすという望みがもたれます．それを達成する方法が

Cyberneticsにほかならないのです．”

ノーバート・ウィナー著「サイバネティックス」

• 制御(control)：「ある目的に適合するように，対象となっているものに所要の操作を加えること」

対象システム＋制御器＝＞制御システム



10

システムとはシステムの言葉：Systemある目的を達成するように秩序立てること訳語：組織，系統，体系，系，制度，方法カオス（Chaos，混沌）の反対語

要素1

要素2要素n

目的

JIS(Z8121)システム「多数の構成要素が、有機的な秩序を保ち、同一の目的に向かって行動するもの」

統一

複数要素

相互関連

自動車，ロケット携帯電話，鉄道銀行，・・・



11

システムの入力と出力• システムは、入力(原因）によって出力(結果）が決まる。

実システム入力出力

モデル化

出力入力

要素

要素

要素状態変数s

システム・モデル

車

機械システム

アクセル速度

経済システム

単価売上ラーメン屋



コーザリティ(causality、因果関係、工学要素で大事なこと)

・水ホース（抵抗R）の圧力（高さ）ｈと流れ(水量)ｑ場合

・タンクへの流入水量qと水の高さ・深さhの場合

ｈｈｑRR

1R抵抗

水量ｑ噴水の高さｈ

R抵抗

ｈ

ｑ

水量ｑ

高さｈ

タンク

浴槽

バケツの高さｈ

水量ｑ

逆方向も成立

高さｈ

水量ｑ

1タンク

逆方向は解らないタイムマシン・瞬間移動

ｑ



13

コーザリティ(causality、因果関係) (2)

質量M の物体に働く力 f と位置 x の関係は、ｆ(すなわち加速度)から、速度v、位置 x が決まり、位置xを入力、指定,しても、無限の速度、加速度(力）が必要

fM v

x

α：加速度：速度

：位置

fM

α = dtα∫ v xvdt∫

車は急には止まれない！

• 制御(control)：「ある目的に適合するように，対象となっているものに所要の操作を加えること」

対象システム＋制御器＝＞制御システム

制御システムは、望みをかなえる。（奇跡を起こす）



14

部屋の温度を調節（制御）する（望みの温度にしたい）

ヒータ部屋

温度計

スイッチ目標温度熱量

外部の温度

部屋の温度

温度計の読みフィードバック

比較

（目的）

ヒータ

温度計20

ブロック線図(block diagram)フィードバック(帰還，feedback)



15

従来制御と知的制御

制御対象

偏差操作指令外乱

制御量

計測器

知的制御器目標値

数式モデル設計された制御方式

コントローラへ実装し調整対象をモデル化

望ましい応答となるように，計算機で設計従来制御

安全・正確な運転

知的制御

うまい運転制御則

人間の操作知識、経験、ノウハウ

組み込み

熟練者の操作経験

係数



16

システムの記述（１）状態変数モデル

制御対象システム内部状態x(t)

入力u(t)初期値

出力y(t)

[ ]

11 12 11 1 1

21 22 22 2 2

1 2

1

21 2

( ) ( )( ) ( )

( )

( ) ( )

( )( )

( )

( )

n

n

n n nnn n n

n

n

a a ax t x t ba a ax t x t b

u t

a a ax t x t b

x tx t

y t c c c

x t

= +

=

& L& L

M M MM M M& L

LM

( ) ( ) ( )( ) ( )t t u t

y t t= +=

x Ax BCx

&

y(t)C

A

状態変数線図

Bu(t) +

+∫

x(0)

x(t)x(t)．

ベクトル，マトリックスはスカラ値と同様に扱える

( ) ( , , )

( ) ( , )

d t f u tdt

y t g t

=

=

x x

x

：状態方程式

：出力方程式

(n n)( )(n 1), (n 1)(1 n)t

×× ×

×

Ax BC

行列

列ベクトル

行ベクトル



17

2

2

M=1, k=2, b=0.566(=2*0.2 2)( ) ( )0.566 2 ( ) ( )d y t dy t y t u t

dt dt+ + =

の時

2

2

(1)

( ) ( ) ( ) ( )

(0)(0)( (0)) :

d y t dy tM b ky t u tdt dt

yy v

+ + =

=

初期条件：初期位置

初期速度

11 1 1( ) sin( )ty t K e tα β θ−= +

減衰振動の時，未定係数法などにより

0 2 4 6 8 10-1.5

-1

-0.5

0

0.5

1

1.5

Time (sec) [f2p1.m]

y(t)

(m

ete

rs)

ωn=1.4142 ζ=0.2

質量

M

y(t)

u(t)力

粘性摩擦b

k

ばね・質量・ダンパ系

実対象のダイナミクスを，数式（微分方程式）モデルで扱える

対象を解析

m1go.mmd2p1.mdl



18

[ ]

1 1

2 2

1

2

0 1 0( )

/ / 1/

( ) 1 0

x xu t

x xk M b M M

xy t

x

= + − −

=

&&

2

1( ) ( )Y s U sM s bs k

=+ +

初期値が全て０の時( )U s )(sY

2

1M s b s k+ +

対象を数式モデル化，状態変数モデル（A,B,C），伝達関数モデル化

( )u t ( ) ( ) ( )( ) ( )t t u t

y t t= +=

x Ax BCx

& ( )y t



19

対象の初期値x(0)からの動き，u(t)=0 (自由系)の時

Aから求まる，"固有値"で決まる．( ) ( ), ( ) ( )

(0) ( ) (0)t t

x t x t y t x tx(t) e x y t e x

= =

= =A A

A CC

&解は，

1 1[( ) ]te s− −= −A I AL

1 01

, , :1 2

01( ) (0) (0)

0

n nsI s s n

v vi i iv v vn

tetx t x xe

te

t t tv e v e v e

α α

λ λ λλ

λ

λ

λ λ λ

−− = + + + =

=

−= =

=

AA

AA

A T T

LL

L

O

LL

特性方程式

の根、 , , , をのという1 2 n

の

1

n

1 + i + + n+z z z1(0) i(0) n(0)1 i n

固有値

固有ベクトル

( )1 2

1(0)

, , , ( )

1(0)(0)

(0)

n n n

zx

zn

v v v

−

= ×

≠

= =

T

T

T Z

L

M

固有値が重複しないとき

は、 ( 0)正則

自由応答は，固有値λiでモード展開できλiで減衰していく



20

数式モデルから速く減衰できる，制御器が設計できる．

全体の極を決める．（極配置）

2

( )( )( ) ( )

Zero: -15.1Pole: -7.5500 6.7080i

d

d p

Ms b kY sMs b k s k k

+ +=

+ + + +

± と決める(設計）

0 2 4 6 8 10-2

-1

0

1

2

Time (sec) [f2p6.m]y(

t) (m

ete

rs)

ωn=10.0995 ζ=0.74756

-15 -10 -5 0-8

-6

-4

-2

0

2

4

6

8Pole-Zero Map

Real Axis [f2p5.m]

Imagi

nary

Axi

s

×

×

○

常微分方程式のSimulinkによる解

x

In1 Out1

Subsystem

md1_anim

S-Function

Manual Switch

100

Kp

15

Kd

du/dt

Derivative

0

Constant1

0

Constant

m1go.mmd2p1.mdl



21

最適制御

対象のA,B,Cが決まる．

ゲインKの最適操作量u*(t)を考える

対象の動きと制御指令の評価QRを決める（設計）．

C

A

B+

+

( )x t&*( )u t

∫

(0)x( )x t ( )y t( ) ( ) ( )

( ) ( )t t u t

y t t= +=

x Ax BCx

&

0( )T Tx x u u dt

∞Φ = +∫ Q R

K+

-0

*( ) ( )u t x t= −K



22

自動的に制御器が出来る（ただし，解が求まるには，条件がある）

u*(t)を状態フィードバック制御則というゲインKは，リッカチ方程式

1

1

0

=

T T

T

T

−

−

+ − + =

− − −

PA A P PBR B P Q

A BR BH

Q A

の係数で作ったハミルトニアン行列

の固有値問題を解いて，

その解 P を用い，[ex:MATLABにて，P=lqr(A,B,Q,R)で解ける]

1 T−=K R B Pで制御すれば良い．



23

重さ，長さから対象を記述[m, l, M, ....を測定]

対象を倒立 (x=0,v=0,θ=0,ω=0)近傍で数式モデル化

倒立を保てる最適制御器を設計[Q,R を決め，Kを求める．]

計算機シミュレーションで確認対象の非線形数式モデル，対象の仮想物理モデル(SimMechanics)実際の振り子で確認

倒立振り子の最適制御

( ) ( ) ( )( ) ( ) ( )t t u t

y t t u t= += +

x Ax BCx D

&

設計値からモデルを用いて良好な実制御システムを構築可能

実機実験倒立

pgo@1Pendsim7s1

p1go@2pend_SimMecha7s1



24

人間の言葉をファジィ理論で定量化（計算機が度合いを持った言葉を扱える）

従来集合

暑い

１

００１０２０３０４０

寒い快適

室温℃

ファジィ集合

1.0

0.0０１０２０３０４０

寒い快適暑い

室温℃

２６℃

２６.１℃

快適

暑いラベル化

２６℃

快適 0.9

暑い 0.7

ラベル＋度合

ファジィ理論提唱者のザディ教授と＠2005年北京



25

ファジィ制御の概念

ファジィ推論［無限値論理］

１．もし，車間距離が小さく，走行速度が大きいならば，ブレーキを強く．

2．もし，車間距離が大きく，走行速度が小さいならば，ブレーキを弱く．

1

0

μ

速度100Km/h0

大きい

100m0

1

0

μ

距離

小さい

μ

強く

100

1

0ブレーキ力

100m0

1

0

μ

距離

大きい

100Km/h0

1

0

μ

速度

小さい1

0

μ弱く

0 10ブレーキ力

μ

100

1

0

ブレーキ力

非ファジィ化ブレーキ力5.2

車間距離走行速度

［ブレーキ操作］前の車にぶつからないように，ブレーキをかける．

車間距離

走行速度

時間→

10

0

ブレーキ力

・ファジィ判断 →滑らか・人間的演算・少ないルール



26

水タンクの知的（ファジィ）制御rgo.m：知識fgo.m：実行(pidと比較）

@FuzzyControlWRule

ならば，バルブを，*．もし，水位誤差が*で，水位変化が*，

無し

無し

無し

正

負

大きく入れる

正

負

閉める

大きく出す

少し入れる

少し出す

大きく出すを指令

入出力関係水位

目標水位

＋ー

微分推論結果

バルブ（入，出）

精密モデル不要



27

言葉で振り子を振り上げ倒立真下に来たとき，右に加振して振り上がりそうなら右に加振する真下に来たとき，左に加振して振り上がりそうなら左に加振する

大体倒立して，右に居るなら少し左傾斜を目標に．大体倒立して，左に居るなら少し右傾斜を目標に．

大体倒立して，目標より右側なら左へ動かす．大体倒立して，目標より左側なら右へ動かす．

・計算機シミュレーションで確認対象の仮想物理モデルを，

C言語で制御器構築し制御

・そのまま，実際の振り子に移植し実行

{ugo,dgo}@ v7_05n1C_P_PDBigPendSim

倒立+外乱付加実験振り上げ実験



28

2nd pendulum

1st pendulum

cart

•従来制御では難しい（二重振り子）非線形システムを課題とし，振り上げ倒立安定化の課題を解決する

• [方法]人間は，二重振子の状況を判断し状況に応じた操作が可能 → 計算機化

"Swing Up Intelligent Control of Double Inverted Pendulum Based on Human Knowledge", Proc. of SICE Annual Conference 2004 in Sapporo, pp.1869-1873, 2004.

人間の操作知識に基づく制御

Controller

Human

or

Pendulum

Pendulum

au Fx

u

2

1 2nd

1st

x x1, 1

2, 2

,

.

.

.

xController

Human

or

Pendulum

Pendulum

au Fx

u

2

1 2nd

1st

x x1, 1

2, 2

,

.

.

.

x



29

SimMechanics(The Math Works Inc.).

•慣性モーメント•質量•重心

2 22 1 2

1 2

2 211 1 1 1

2 2 2

[{ ( sin )} { ( cos )} ]2

M J JT x

m d dx l ldt dt

θ θ

θ θ

• • •

= + +

+ + +

+L 数式を用いない

etc

人間の操作知識をファジィ集合で定量化し，知的制御器（Ｃ言語）を開発

Ø数式なしで，計算機上に仮想モデルを構築Ø時間を引き延ばしての，解析と操作が可能Øジョイスティックを用い何度も操作し，操作知識を獲得

部品を結合

操作知識の獲得

仮想実験



30

知的制御器（C言語）をMATLAB/Simulink+SimMechanics(仮想機構モデル)に組み込み評価

知的制御器（C言語）をMATLAB/Simulink+xPC Targetにて実機に適用

数式モデルなしで二重振り子の振り上げ安定化（実機）をツール（MATLAB/Simulink）を用いて，解決

シミュレーション→ 実機実験

実験1

実験2

モデルで確認



31

熟練運転士の知識を組み込み，言葉で電車を運転

（仙台市地下鉄，東京都大江戸線，．．）熟練運転士と同等のうまい運転を実現

ATOvideo



32

知的制御器によるハンドル操作

多目的（壁、障害物、目標、乗り心地など）をファジィ評価し適切な操作を実行

ファジィ評価

wall

現在位置

戦術目標

予測結果

予測結果

予測結果

左に曲がる

直進

右に曲がる

近い

遠い

遠い

近い

遠い

遠い

μ1.0

壁との距離

近い



33

車両を人間の知識で運転

自動運転VTR



34

最終目標 (駐車位置)

戦略: 車庫に寄せる

戦略目標戦術目標

大局的（戦略）目標・車庫に寄せる・向きを変える・切り返し位置へ移動・車庫に入れる・制御を終了

局所的（戦術）目標を設定・車両特性を考慮・現在到達可能

人間の駐車運転

局所的（戦術）目標へハンドル操作

強化学習による知識獲得 RL_IC_fuzzyTarget



35

知的協調制御

知的制御器知的協調器

目標

運転知識

操作者

車(x,y,θ)

φ

知的協調制御器

ハンドル操作制御器

戦術目標生成

車の状態

障害物検知

φ

アクセル・ブレーキ

nΦ

Hτ Tτ

Cτ

自動運転部

障害物

sr

ファジィ制御指令

人間と協調運転VTR



36

四輪車操作を知的に支援

支援者

操作者（被支援者）

車両

操作決定

状況

操作状況

戦略決定目標設定

操作指示

どんな操作をすればよいかどこを目標とするか

どういう指示を出せばよいか

福祉車両の駐車を支援

乗用車の駐車を支援

模擬実験

福祉車両を人間の知識で駐車運転



知的制御システム 8週目 -...

Documents