跳べ、ロボット！！¨計の鍵：pch システム，damping assignment,...

跳べ、ロボット！！

–衝突を含む機械システムの制御原理を求めて –

石川将人

京都大学大学院情報学系研究科システム科学専攻

ハイブリッドシンポジウム – p.1/34

背景: 跳躍ロボットの研究の経緯

2000–2002 (東工大)…軌道生成指向

最適制御によるハイジャンプアクロバットロボット（重心軌道生成＋逆動力学）

TiTech/COE Super-mechano systems：ロボフェスタ神奈川 2001

2002–2004 (東工大・東大)…状態フィードバック指向

エネルギー保存制御によるホッピング

Special thanks to: 『原研ジャンプチーム』・井村順一先生ハイブリッドシンポジウム – p.2/34

アウトライン

0. 背景

1. 最適制御によるハイジャンプ

2. エネルギー保存制御によるホッピング

3. 跳躍の本質とは？可制御性の解析

制御目的の設定

離散ダイナミクスのモデリング

制御方法


0. モチベーションその１ (モデルの特質)

当初の動機づけ—『可変拘束システム』

u

環境＝トランポリンとの協調

ucontrol

×no control

非接触接触

環境との力学的拘束条件が変化するシステムハイブリッドシステムの一例として

またその変化を積極的に利用するアクロバティックな運動を実現するロボットとして(歩行・走行・跳躍・着地・大車輪・etc...)


0. 跳躍ロボットのモデル

kdu

`

m1

ke de

m0

q1

q0

0

qe

natural length=

me

static equilibrium

ξ =

q0

q1

qe

v0

v1

ve

トランポリンの平衡点を座標原点とする

力入力 uは伸長する方向を正にとるハイブリッドシンポジウム – p.5/34

0. 跳躍ロボットのモデル

運動方程式より

Σ : ξ = M−1(Aξ + Bww + Buu + Bb)

連続ダイナミクス—アフィンな状態方程式Bb: バイアス項，Buu: 制御入力項，Bww: 拘束力項

離散ダイナミクス— wを決定するプロセス

連続ダイナミクス

離散ダイナミクス

(モード選択)

ξ w

u

Bw

Buξ = · · · ...

w > 0 or w = 0?

wの振舞いをどう記述するかがハイブリッドシステムとしてのモデリングの要点

wはインパルスかもしれない


0. モチベーションその２ (制御方式の特質)

跳躍ロボット (可変拘束系)をハイブリッド系の例として捉えることは確かに興味深いが、それはモデリングの段階の話

いくつか有効な制御方法を導いたが、泥縄式の感は否めない (反省)

⇓

表題の『跳べ！』とはどういうことか？→制御目的の設定

どのような制御方式が本当に必要なのだろう？


アウトライン

0. 背景






制御方法


1. [制御目的の設定]

『跳べ！』

⇒ロボットをできるだけ高い位置にもっていこう

⇒上部質量 q1をある時刻において最大化せよ(重心でもよい)

［最適ハイジャンプ制御問題］終端時刻 tf および初期状態 ξ(0)が与えられたとき，評価関数 q1(tf )を最大化する制御入力

u∗(t) : [0, tf ] → [umin, umax]

を求めよ． •


1. [モデリング]

離散ダイナミクスをどう記述するか？

OBJECT B

OBJECT A

OBJECT A

OBJECT B

w

w

z

補助変数 z を物体間の距離とすると、wも zも常に非負であり，また常にどちらか一方は 0すなわち

z = Cξ

z ≥ 0, w ≥ 0, zw = 0

接触モード z = 0, w ≥ 0

非接触モード z > 0, w = 0



相補性システム表現 [van der Schaft. ’95～]

Σ : ξ = M−1(Aξ + Bww + Buu + Bb)

subject to

z = Cξ

z ≥ 0, w ≥ 0, zw = 0

相補性変数は常にこの条件を満たすように決定される．

この決定問題は線形相補性問題 (LCP)に帰着される

一意解の存在条件 (well-posedness)をチェックできる

wの解としてインパルスも許容できる :cf. 有理相補性問題 (RCP)


1. [制御方法]

全体の構成は修正微分動的計画法アルゴリズムに基づく [Y.Sakawa and Y.Shindo ’80]

相補性システムを順時間に解くLCPに基づく解析スキームに従う

随伴システムを逆時間に解く各モード切り替え時刻においてハイブリッド最大原理を満足するように随伴変数をリセット[Sussmann - Piccoli’00]

Initialization

Forwardcomputation

Backwardcomputation

評価値が減少したか？

解が収束したか？

End


1. [結果: シミュレーション]

最大原理により、解はおおむねBang-bang型になるハイブリッドシンポジウム – p.13/34

1. [結果]

※ [斎藤ほか, 2001～]


1. [まとめ]

制御目的の設定：到達高さの最大化問題

離散ダイナミクスのモデル化：相補性システム

設計の鍵： LCP・ハイブリッド最大原理・微分動的計画法

wと zをベクトルにすることで、多点接触の問題も統一的に扱える

u

ub-lb

但し書き

到達点を高くすること 6=跳躍するということ

跳躍能力を有することが前提


アウトライン

0. 背景






制御方法



『跳べ！』

⇒力学的エネルギーを大きくすれば跳ぶのでは？

⇒エネルギーをだいたい一定値に保てば継続的にホッピングするのでは？

［ホッピング制御問題］H(ξ)を力学的エネルギーの総和、Hdを目標値、偏差を H(ξ) := H(ξ) − Hdとして、

H(ξ(t)) → 0

とせよ。



設計モデルにおいて、厳密さと引き換えに大幅な簡略化を行った。

1. トランポリンの質量は me = 0

2. トランポリンの運動は下部質量に対して完全に従属。

q0 > 0 ⇒ qe = 0 (非接触モード : s = 0)

q0 ≤ 0 ⇒ qe = q0 (接触モード : s = 1)

すなわち、変数のジャンプは起こらないと仮定し、離散ダイナミクスを省略

フィードバック機構のもつロバスト性に期待をかけた


2. [定式化]

エネルギーの振る舞いに注目⇒

Port-Controlled Hamiltonianシステム

ξ = [J (ξ) −R(ξ)]∂H

∂ξ(ξ) + G(ξ)u

歪対称行列（構造行列）

対称行列 (散逸行列)

制御入力 (Port) ：ここにフィードバック u(ξ)を施して…


2. [定式化]

エネルギーの振る舞いに注目⇒

閉ループHamiltonianシステム

ξ = [Js(ξ) −Rs(ξ)]∂H

∂ξ(ξ)

歪対称行列（構造行列）

対称行列 (散逸行列)

制御入力 (Port) ：ここにフィードバック u(ξ)を施して…


2. [制御方法: Damping Assignment][Rodoriguez et al. ’00]

Jsの歪対称性より、H(ξ)の挙動は

˙H = −

[

∂H

∂ξ(ξ)

]T

Rs(ξ)∂H

∂ξ(ξ)

⇒ Rs を選ぶことによって望ましい特性を指定できる。

Rs = kP QH(ξ)+sdeP , P,Q ≥ 0

に対しては、

次のような制御則を与えればよい。

u(ξ) = d(v1 − v0)(1 − kP H(ξ))

設計パラメータは kP > 0。(しかし sdeが邪魔！)ハイブリッドシンポジウム – p.20/34

2. [結果]

sdeがなければ…

-0.1

0

0.1

0.2

0 2 4 6 8 10 12 148

10

12

14

He

igh

t [m

]

Ha

milt

on

ian

[N

m]

Time [sec]

x2

x3

dH

x1

H


2. [制御方法: 離散サーボ機構の導入]

Hd+= −γ(H(tk) − Hd)

x3

x2

x1

ttk

tk+1

Energy dissipates

Energy dissipates

Hd+= −γ(H(tk+1) − Hd)

u(ξ) = (v1 − v0)

d − kP H(ξ) + kI

∑

i≥1,ti≤t

H(ξ(ti))

I型サーボ系の要領でエネルギー損失を補填ハイブリッドシンポジウム – p.22/34

2. [結果]

0

2

4

6

8

10

12

14

16

0 5 10 15 20 25 30

Ham

ilton

ian

[Nm

]

Time [sec]

error: H2(ξ(ti))

H

Hd


2. [結果]


2. まとめ

制御目的の設定：エネルギーを目標値Hdにせよ

離散ダイナミクスのモデル化：簡易衝突モデル

設計の鍵： PCHシステム，Damping Assignment,離散サーボ機構

衝突モデルを改良 (me > 0を許容)、インパクトを軽減する方法も提案 [平林ほか SCI’04]

但し書き

エネルギーを高める =周期運動の生成 6=跳躍

跳躍能力を有することが前提


アウトライン

0. 背景






制御方法



『跳べ！』

⇒「垂直方向へ移動できること」が本質ではないか？

移動ロボットとは…自らの形状を動かし、それによって外部環境との力学的干渉の変化を推進力として取り出すもの

［制御問題］ある初期状態から同じ形状で高さだけが違う状態に到達させること



[微小時間局所可制御性 (STLC)］任意の T > 0に対し初期状態 ξ∗ から有界な入力u(t), t ∈ [0, T ]によって可到達な状態の集合が ξ∗を含む開集合であること



トランポリンは省略 (床からの跳躍)

ξ =[

q0 q1 v0 v1

]T

ロボットのバネ・ダンパなし k = d = 0

ξ = f0(ξ) + f1u (-1)

f0(ξ) =

vc

v1

1

m0

w − g

−g

, f1 =

0

01

m0

1

m1


3. [モデリング]可微分関数による近似

拘束力 wを、状態 ξの関数として表してみる。拘束力が働くのは、

q0 = 0で v0 ≤ 0のとき

に限られる。そこで

w(ξ) :=Ke−αq0

1 + eβv0

, K, α, β > 0

α → ∞, β → ∞では{

w(ξ) = K if q0 = 0, v0 ≤ 0

w(ξ) = 0 if q0 > 0, or v0 > 0

-1-0.5

00.5

1q0

-1

-0.5

0

0.5

1

v0

0

1

2

3

4

5


3. [可制御性の解析]

初期状態として ξ∗ = [q∗0, q∗

1, 0, 0]T をとる

f0(ξ∗) 6= 0,すなわち平衡点ではないことに注意

[STLCの十分条件 Godhavn et al.’99, Aeyels’84)］f0は有界とし、入力 uは十分に大きく取れるとする。このとき、ベクトル場

f1, [f0, f1], [[f0, f1], f1], · · ·

が ξ∗において接空間を張るならば STLCである。

[f0, f1] :=∂f1

∂ξf0 −

∂f0

∂ξf1

( ハイブリッドシンポジウム – p.31/34


Lie bracketを計算すると

L0 = f1 L1 = [L0, f0]

L2 = [L1, f0] L3 = [L2, f0]

によって可制御 distributionが張られる。C := [L0,L1,L2,L3](ξ

∗)とおくと

detC =−K2

128e4αq∗0m1

2

(

K2β4+

4eαq∗0(

Kβ2(

3α − gβ2)

+ eαq∗0(

8α2 − 6gαβ2 + g2β4)

))



det C 6= 0であれば STLC．

重力項の存在は本質的でない。α→大

det C =−K2

(

K2(βe−αq∗0 )4 + 12e−3αq∗0α + 32e−2αq∗0α2)

128m12

K = 0 ⇒ detC = 0

αが増大すると、q∗0

> 0の点における detCが急速に低下する。⇒拘束力が利用できなくなる

α, β → ∞における βe−αq∗0 および αe−αq∗0 の挙動がポイント


おわりに

最適ハイジャンプ制御・エネルギー制御によるホッピングを実現した

問題提起

その制御目的は正しかったのだろうか？→『跳べる』という能力の解析・可微分ベクトル場による近似と局所可制御性

移動ロボットの一般論の中に位置づけたい

極限の取り扱い (α, β → ∞): 連続⇔不連続の架け橋


おわりに

最適ハイジャンプ制御・エネルギー制御によるホッピングを実現した

問題提起

その制御目的は正しかったのだろうか？→『跳べる』という能力の解析・可微分ベクトル場による近似と局所可制御性

移動ロボットの一般論の中に位置づけたい

極限の取り扱い (α, β → ∞): 連続⇔不連続の架け橋

ハイブリッドシステムよりむしろ非線形制御論?


跳べ、ロボット！！¨計の鍵：pch システム，damping assignment,...

Documents