bayesian efficient multiple kernel learning

17
Bayesian Efficient Multiple Kernel Learning [ICML 2012] Mehmet Gรถnen (Edinburgh, Scotland, UK) ๆ–Ž่—ค ๆทณๅ“‰ ้–“้•ใ„็ญ‰ใ‚ใ‚Šใพใ—ใŸใ‚‰ใ”้€ฃ็ตกใใ ใ•ใ„ junyaใ€ใ‚ใฃใจใ€‘fugaga.info ่ซ–ๆ–‡็ดนไป‹ 2013/03/25

Upload: junya-saito

Post on 30-Jun-2015

376 views

Category:

Technology


2 download

DESCRIPTION

่ซ–ๆ–‡็ดนไป‹

TRANSCRIPT

Page 1: Bayesian Efficient Multiple Kernel Learning

Bayesian Efficient

Multiple Kernel Learning [ICML 2012]

Mehmet Gรถnen

(Edinburgh, Scotland, UK)

ๆ–Ž่—ค ๆทณๅ“‰

้–“้•ใ„็ญ‰ใ‚ใ‚Šใพใ—ใŸใ‚‰ใ”้€ฃ็ตกใใ ใ•ใ„

junyaใ€ใ‚ใฃใจใ€‘fugaga.info

่ซ–ๆ–‡็ดนไป‹

2013/03/25

Page 2: Bayesian Efficient Multiple Kernel Learning

็›ฎๆฌก

โ€ข ๆฆ‚่ฆ

โ€ข ๅ•้กŒ่จญๅฎš

โ€ข Multiple Kernel Learning

โ€ข ๆๆกˆๆ‰‹ๆณ•

โ€“ๆง‹ๆˆ

โ€“ๅญฆ็ฟ’ใ‚ขใƒซใ‚ดใƒชใ‚บใƒ 

โ€“ๆŽจๅฎšใ‚ขใƒซใ‚ดใƒชใ‚บใƒ 

โ€ข ๅฎŸ้จ“

โ€ข ใพใจใ‚ 1/16

Page 3: Bayesian Efficient Multiple Kernel Learning

ๆฆ‚่ฆ

ๆๆกˆๆ‰‹ๆณ•๏ผš Bayesian Efficient Multiple Kernel Learning๏ผˆBEMKL๏ผ‰

็‰น้•ท๏ผš โ€ข ้ซ˜้€Ÿ๏ผˆใ‚ซใƒผใƒใƒซใ‚’ๆ•ฐ็™พๅ€‹ไฝฟใฃใฆใ‚‚๏ผ‘ๅˆ†ใ‹ใ‹ใ‚‰ใชใ„๏ผ๏ผ‰ โ€ปๅพ“ๆฅๆ‰‹ๆณ•ใจใฎๆฏ”่ผƒๅฎŸ้จ“ใชใ—

โ€ข ้ซ˜็ฒพๅบฆ โ€ปๅพ“ๆฅๆ‰‹ๆณ•ใจใฎๆฏ”่ผƒๅฎŸ้จ“ใ‚ใ‚Š

็‰นๅพด๏ผš โ€ข ไธญ้–“ใƒ‡ใƒผใ‚ฟ็”Ÿๆˆ

โ€ข ๅค‰ๅˆ†่ฟ‘ไผผ

ใƒ†ใƒผใƒž๏ผšMultiple Kernel Learning

็‰นๅพด๏ผ‘ ็‰นๅพด๏ผ’ ็‰นๅพด๏ผ“ ใƒฉใƒ™ใƒซ๐‘ฆ

0.53 ่‰ฏใ„ๅคฉๆฐ— 1

0.2 ๆกœใŒใใ‚Œใ„ -1

่ค‡ๆ•ฐใฎใ‚ซใƒผใƒใƒซใ‚’็ต„ใฟๅˆใ‚ใ›ใŸ๏ผˆๅˆ†้กž๏ผ‰ๅญฆ็ฟ’

ๅˆฉ็‚น๏ผ‘๏ผ‰็•ฐใชใ‚‹็จฎ้กžใฎ็‰นๅพดใ‚’ใ‚‚ใคใƒ‡ใƒผใ‚ฟใ‚’ๅญฆ็ฟ’ใงใใ‚‹

ใ„ใ‚ใ„ใ‚ใช่ถ…ใƒ‘ใƒฉใƒกใƒผใ‚ฟใฎใ‚ซใƒผใƒใƒซใ‚’็ต„ใฟๅˆใ‚ใ›ใ‚‹ exp โˆ’๐‘ฅ1โˆ’๐‘ฅ2

2

12, exp โˆ’

๐‘ฅ1โˆ’๐‘ฅ22

0.52, exp โˆ’

๐‘ฅ1โˆ’๐‘ฅ22

0.252,ใƒปใƒปใƒป

ๅˆฉ็‚น๏ผ’๏ผ‰่ถ…ใƒ‘ใƒฉใƒกใƒผใ‚ฟใฎ่ชฟๆ•ดใชใ—ใงใƒ‡ใƒผใ‚ฟใ‚’ๅญฆ็ฟ’ใงใใ‚‹

็‰นๅพดใซๅˆใฃใŸใ‚ซใƒผใƒใƒซใ‚’็ต„ใฟๅˆใ‚ใ›ใ‚‹

2/16

Page 4: Bayesian Efficient Multiple Kernel Learning

ๅ•้กŒ่จญๅฎš

โ€ข ๏ผ’ๅ€คๅˆ†้กž

โ€“ๅ…ฅๅŠ›

โ€ข ่จ“็ทดใƒ‡ใƒผใ‚ฟ

โ€“ ็‰นๅพดใƒ™ใ‚ฏใƒˆใƒซ๐’™ = ๐‘ฅ๐‘– ๐‘–=1๐‘

โ€“ ใƒฉใƒ™ใƒซ ๐’š = ๐‘ฆ๐‘– โˆˆ โˆ’1,+1 ๐‘–=1๐‘

โ€ข ใƒ†ใ‚นใƒˆใƒ‡ใƒผใ‚ฟ

โ€“ ็‰นๅพดใƒ™ใ‚ฏใƒˆใƒซ๐‘ฅโˆ—

โ€“ๅ‡บๅŠ›

โ€ข ใƒ†ใ‚นใƒˆใƒ‡ใƒผใ‚ฟ

โ€“ ็‰นๅพดใƒ™ใ‚ฏใƒˆใƒซ๐‘ฅโˆ—ใฎใƒฉใƒ™ใƒซใฎ็ขบ็Ž‡ๅˆ†ๅธƒ๐‘ ๐‘ฆโˆ— = +1|๐‘ฅโˆ—

3/16

Page 5: Bayesian Efficient Multiple Kernel Learning

Multiple Kernel Learning

โ€ข ่ค‡ๆ•ฐใฎใ‚ซใƒผใƒใƒซใ‚’็ต„ใฟๅˆใ‚ใ›ใŸๅญฆ็ฟ’

๐‘“ ๐‘ฅโˆ— = ๐‘Ž๐‘š๐‘˜๐‘š ๐‘ฅ๐‘›, ๐‘ฅโˆ—

๐‘ƒ

๐‘š=1

๐‘

๐‘›=1

+ ๐‘

ไพ‹๏ผ‰

๐‘ ๐‘ฆโˆ— = +1|๐‘ฅโˆ— = sigmoid๐‘“ ๐‘ฅโˆ— โˆ’ ๐œˆ

๐œŽ

Pๅ€‹ใฎใ‚ซใƒผใƒใƒซ ๐‘˜๐‘š โˆˆ ๐‘‹ ร— ๐‘‹ โ†’ โ„ ๐‘š=1๐‘ƒ ใ‚’ไฝฟใฃใฆใ€

ใจใƒขใƒ‡ใƒซๅŒ–ใ—ใฆใ€๐’‚ = ๐‘Ž1, โ€ฆ , ๐‘Ž๐‘š, โ€ฆ , ๐‘Ž๐‘ƒโŠค, ๐‘ ใ‚’ๅญฆ็ฟ’

4/16

Page 6: Bayesian Efficient Multiple Kernel Learning

ๆๆกˆๆ‰‹ๆณ•

โ€ข Bayesian Efficient Multiple Kernel Learning

๏ผˆBEMKL๏ผ‰

โ€ข ็‰นๅพด

โ€“ไบ‹ๅ‰ๅˆ†ๅธƒใ‚’ไฝฟ็”จใ—ใŸๅฎŒๅ…จใชใƒ™ใ‚คใ‚บใƒขใƒ‡ใƒซ

โ€“ไธญ้–“ใƒ‡ใƒผใ‚ฟใ‚’็”Ÿๆˆ

โ€“ๅค‰ๅˆ†่ฟ‘ไผผใง๏ผˆMCMCใ‚ˆใ‚Šใ‚‚๏ผ‰้ซ˜้€Ÿ

5/16

Page 7: Bayesian Efficient Multiple Kernel Learning

๐‘ฒ๐‘š

ๆง‹ๆˆ๏ผˆใ‚ฐใƒฉใƒ•ใ‚ฃใ‚ซใƒซใƒขใƒ‡ใƒซ๏ผ‰

๐‘ฆ

๐‘ƒ

๐›พ ๐‘

๐’‡ ๐‘ฎ

๐’‚ ๐€ ๐’† ๐Ž

๐‘ฎ =

๐‘”11 โ€ฆ ๐‘”1

๐‘š

โ‹ฎ โ‹ฑ โ‹ฎโ€ฆ ๐‘”1

๐‘ƒ

โ‹ฑ โ‹ฎ๐‘”๐‘–1 โ€ฆ ๐‘”๐‘–

๐‘š

โ‹ฎ โ‹ฑ โ‹ฎ๐‘”๐‘1 โ€ฆ ๐‘”๐‘

๐‘š

โ€ฆ ๐‘”๐‘–๐‘ƒ

โ‹ฑ โ‹ฎโ€ฆ ๐‘”๐‘

๐‘ƒ

๐‘ฒ๐‘š =

๐‘˜๐‘š ๐‘ฅ1, ๐‘ฅ1 โ€ฆ ๐‘˜๐‘š ๐‘ฅ1, ๐‘ฅ๐‘–โ‹ฎ โ‹ฑ โ‹ฎ

โ€ฆ ๐‘˜๐‘š ๐‘ฅ1, ๐‘ฅ๐‘โ‹ฑ โ‹ฎ

๐‘˜๐‘š ๐‘ฅ๐‘– , ๐‘ฅ1 โ€ฆ ๐‘˜๐‘š ๐‘ฅ๐‘– , ๐‘ฅ๐‘–โ‹ฎ โ‹ฑ โ‹ฎ

๐‘˜๐‘š ๐‘ฅ๐‘ , ๐‘ฅ1 โ€ฆ ๐‘˜๐‘š ๐‘ฅ๐‘ , ๐‘ฅ๐‘–

โ€ฆ ๐‘˜๐‘š ๐‘ฅ๐‘–, ๐‘ฅ๐‘โ‹ฑ โ‹ฎโ€ฆ ๐‘˜๐‘š ๐‘ฅ๐‘ , ๐‘ฅ๐‘

๐‘”๐‘–๐‘š|๐‘Ž, ๐‘˜๐‘š,๐‘–~๐’ฉ ๐‘”๐‘–

๐‘š; ๐‘ŽโŠค๐‘˜๐‘š,๐‘– , 1

๐œ†๐‘–~๐’ข ๐œ†๐‘–; ๐›ผ๐œ†, ๐›ฝ๐œ† ๐‘Ž๐‘–|๐œ†๐‘– ~๐’ฉ ๐‘Ž๐‘–; 0, ๐œ†๐‘–โˆ’1

๐œ”๐‘š~๐’ข ๐œ”๐‘š; ๐›ผ๐œ” , ๐›ฝ๐œ” ๐‘’๐‘š|๐œ”๐‘š ~๐’ฉ ๐‘’๐‘š; 0, ๐œ”๐‘šโˆ’1

๐‘|๐›พ ~๐’ฉ ๐‘; 0, ๐›พโˆ’1 ๐›พ~๐’ข ๐›พ ; ๐›ผ๐›พ , ๐›ฝ๐›พ

๐‘“๐‘–|๐‘, ๐‘’, ๐‘”๐‘–~๐’ฉ ๐‘“๐‘–; ๐‘’โŠค๐‘”๐‘– + ๐‘, 1

๐‘ฆ๐‘–|๐‘“๐‘–~๐›ฟ ๐‘“๐‘–๐‘ฆ๐‘– > ๐œˆ ไธญ้–“ใƒ‡ใƒผใ‚ฟ ใƒฉใƒ™ใƒซ

ใ‚ซใƒผใƒใƒซใฎ้‡ใฟ ไธญ้–“ใƒ‡ใƒผใ‚ฟใฎ้‡ใฟ

ใƒใ‚คใ‚ขใ‚น

ใ‚ซใƒผใƒใƒซ๏ผˆใฎ็ฉบ้–“ๅ†…ใงใฎ

่จ“็ทดใƒ‡ใƒผใ‚ฟใฎ็›ธไบ’่ท้›ข๏ผ‰

โ€ป ๐’ฉ๏ผšๆญฃ่ฆๅˆ†ๅธƒใ€๐’ข๏ผšใ‚ฌใƒณใƒžๅˆ†ๅธƒใ€๐›ฟ๏ผšใ‚ฏใƒญใƒใƒƒใ‚ซใƒผใฎใƒ‡ใƒซใ‚ฟ้–ขๆ•ฐ

ไบˆๆธฌๅ€ค

6/16

Page 8: Bayesian Efficient Multiple Kernel Learning

ๅญฆ็ฟ’ใ‚ขใƒซใ‚ดใƒชใ‚บใƒ ๏ผˆๆบ–ๅ‚™๏ผ›ๅค‰ๅˆ†่ฟ‘ไผผใฎใ‚ญใƒข๏ผ‰

ใ€ๅฎš็†ใ€‘ไปปๆ„ใฎ็ขบ็Ž‡ๅค‰ๆ•ฐ๐šฏ, ๐šตใŠใ‚ˆใณ็ขบ็Ž‡ๅฏ†ๅบฆ้–ขๆ•ฐ๐‘ž ๐šฏ, ๐šต ใซๅฏพใ—ใฆใ€ๆฌกๅผใŒๆˆใ‚Š็ซ‹ใคใ€‚

log ๐‘ ๐’š| ๐Š๐‘š ๐‘š=1๐‘ƒ = log ๐‘ ๐ฒ, ๐šฏ, ๐šต| ๐Š๐‘š ๐‘š=1

๐‘ƒ d๐šฏd๐šต

= log ๐‘ž ๐šฏ, ๐šต๐‘ ๐ฒ, ๐šฏ, ๐šต| ๐Š๐‘š ๐‘š=1

๐‘ƒ

๐‘ž ๐šฏ, ๐šตd๐šฏd๐šต

โ‰ฅ ๐‘ž ๐šฏ, ๐šต log๐‘ ๐ฒ, ๐šฏ, ๐šต| ๐Š๐‘š ๐‘š=1

๐‘ƒ

๐‘ž ๐šฏ, ๐šตd๐šฏd๐šต

= E๐‘ž ๐šฏ,๐šต log๐‘ ๐ฒ, ๐šฏ, ๐šต| ๐Š๐‘š ๐‘š=1

๐‘ƒ

๐‘ž ๐šฏ, ๐šต

= E๐‘ž ๐šฏ,๐šต log ๐‘ ๐ฒ, ๐šฏ, ๐šต| ๐Š๐‘š ๐‘š=1๐‘ƒ โˆ’ E๐‘ž ๐šฏ,๐šต log ๐‘ž ๐šฏ, ๐šต

ใ€่จผๆ˜Žใ€‘

log ๐‘ ๐’š| ๐Š๐‘š ๐‘š=1๐‘ƒ โ‰ฅ E๐‘ž ๐šฏ,๐šต log ๐‘ ๐ฒ, ๐šฏ, ๐šต| ๐Š๐‘š ๐‘š=1

๐‘ƒ โˆ’ E๐‘ž ๐šฏ,๐šต log ๐‘ž ๐šฏ, ๐šต

-logใฏไธŠใซๅ‡ธใช้–ขๆ•ฐใชใฎใงJensenโ€˜s inequalityใ‚ˆใ‚Š

๐‘ ๐šฏ, ๐šต| ๐Š๐‘š ๐‘š=1๐‘ƒ , ๐ฒ = ๐‘ž ๐šฏ, ๐šต

็ญ‰ๅทๆˆ็ซ‹ๆ™‚ใ€ๆฌกๅผใŒๆˆใ‚Š็ซ‹ใคใ€‚

PRMLใฎใจใกใ‚‡ใฃใจ้•ใ†่จผๆ˜Ž

7/16

Page 9: Bayesian Efficient Multiple Kernel Learning

ๅญฆ็ฟ’ใ‚ขใƒซใ‚ดใƒชใ‚บใƒ ๏ผˆๆบ–ๅ‚™๏ผ›ๅค‰ๅˆ†่ฟ‘ไผผใฎใ‚ญใƒข๏ผ‰

๐‘ ๐ฒ,๐šฏ,๐šต| ๐Š๐‘š ๐‘š=1๐‘ƒ

๐‘ž ๐šฏ,๐šต= 1ใฎใจใ็ญ‰ๅทๆˆ็ซ‹

๐‘ ๐ฒ, ๐šฏ, ๐šต| ๐Š๐‘š ๐‘š=1๐‘ƒ

๐‘ž ๐šฏ, ๐šต= 1

๐‘ ๐ฒ, ๐šฏ, ๐šต| ๐Š๐‘š ๐‘š=1๐‘ƒ = ๐‘ž ๐šฏ, ๐šต

๐‘ ๐ฒ, ๐šฏ, ๐šต, ๐Š๐‘š ๐‘š=1๐‘ƒ

๐‘ ๐Š๐‘š ๐‘š=1๐‘ƒ = ๐‘ž ๐šฏ, ๐šต

๐‘ ๐šฏ, ๐šต| ๐Š๐‘š ๐‘š=1๐‘ƒ , ๐ฒ ๐‘ ๐Š๐‘š ๐‘š=1

๐‘ƒ , ๐ฒ

๐‘ ๐Š๐‘š ๐‘š=1๐‘ƒ = ๐‘ž ๐šฏ, ๐šต

๐‘ ๐šฏ, ๐šต| ๐Š๐‘š ๐‘š=1๐‘ƒ , ๐ฒ ๐‘ ๐’š| ๐Š๐‘š ๐‘š=1

๐‘ƒ = ๐‘ž ๐šฏ, ๐šต

๐‘ ๐šฏ, ๐šต| ๐Š๐‘š ๐‘š=1๐‘ƒ , ๐ฒ = ๐‘ž ๐šฏ, ๐šต

๐‘ ๐’š| ๐Š๐‘š ๐‘š=1๐‘ƒ = 1

โ†’

โ†’

โ†’

โ†’

โ†’

8/16

Page 10: Bayesian Efficient Multiple Kernel Learning

ๅญฆ็ฟ’ใ‚ขใƒซใ‚ดใƒชใ‚บใƒ ๏ผˆๆบ–ๅ‚™๏ผ›ๅค‰ๅˆ†่ฟ‘ไผผใฎใ‚ญใƒข๏ผ‰

ใ€ๅฎš็†ใ€‘ไปปๆ„ใฎ็ขบ็Ž‡ๅค‰ๆ•ฐ๐šฏ, ๐šตใŠใ‚ˆใณ็ขบ็Ž‡ๅฏ†ๅบฆ้–ขๆ•ฐ๐‘ž ๐šฏ, ๐šต ใซๅฏพใ—ใฆใ€ๆฌกๅผใŒๆˆใ‚Š็ซ‹ใคใ€‚

log ๐‘ ๐’š| ๐Š๐‘š ๐‘š=1๐‘ƒ โ‰ฅ E๐‘ž ๐šฏ,๐šต log ๐‘ ๐ฒ, ๐šฏ, ๐šต| ๐Š๐‘š ๐‘š=1

๐‘ƒ โˆ’ E๐‘ž ๐šฏ,๐šต log ๐‘ž ๐šฏ, ๐šต

๐‘ ๐šฏ, ๐šต| ๐Š๐‘š ๐‘š=1๐‘ƒ , ๐ฒ = ๐‘ž ๐šฏ, ๐šต

็ญ‰ๅทๆˆ็ซ‹ๆ™‚ใ€ๆฌกๅผใŒๆˆใ‚Š็ซ‹ใคใ€‚

๐‘ž ๐šฏ, ๐šต ใ‚’็ฐกๅ˜ใชๆ‰ฑใ„ใ‚„ใ™ใ„้–ขๆ•ฐ๏ผˆใงใ€ใ‹ใคใ€ใใ‚Œใฃใฝใ„้–ขๆ•ฐ๏ผ‰ใซๅฎš็พฉใ—ใฆใ€

๐šฏ, ๐šตใ‚’ใ†ใพใ่ชฟๆ•ดใ—ใฆใ€ๅ‘จ่พบๅฐคๅบฆใฎไธ‹้™ใŒๆœ€ๅคงใซใชใ‚‹ใ‚ˆใ†ใซใ™ใ‚Œใฐใ€

็ฐกๅ˜ใชๆ‰ฑใ„ใ‚„ใ™ใ„้–ขๆ•ฐ๐‘ž ๐šฏ, ๐šต ใง

๐‘ ๐šฏ, ๐šต| ๐Š๐‘š ๐‘š=1๐‘ƒ , ๐ฒ

ใ‚’่ฟ‘ไผผใงใใ‚‹ใ€‚

ไฝ•ใŒ่จ€ใˆใ‚‹๏ผŸ๏ผš

๐šฏ = ๐‘Ž, ๐‘, ๐‘’, ๐‘“, ๐‘ฎ , ๐šต = ๐›พ, ๐€, ๐œ” ใจใ™ใ‚‹ใจใใ€

๐‘ ๐šฏ, ๐šต| ๐Š๐‘š ๐‘š=1๐‘ƒ , ๐ฒ ใฏใ€ๆœฌๆฅใ€่ค‡้›‘ใช้–ขๆ•ฐ๏ผˆใ‚‚ใฏใ‚„ใ€ไฝ•ใ‚‚ใงใใชใ„ใƒฌใƒ™ใƒซ๏ผ‰ใ€‚

ๅ‘จ่พบๅฐคๅบฆ ๅ‘จ่พบๅฐคๅบฆใฎไธ‹้™

ๅค‰ๅˆ†่ฟ‘ไผผใฎ้‡่ฆใงๅŸบๆœฌ็š„ใช่€ƒใˆๆ–น๏ผ 9/16

Page 11: Bayesian Efficient Multiple Kernel Learning

ๅญฆ็ฟ’ใ‚ขใƒซใ‚ดใƒชใ‚บใƒ ๏ผˆๆบ–ๅ‚™๏ผ‰

ๆฌกใฎใ‚ˆใ†ใซ๐‘ž ๐šฏ, ๐šต ใ‚’ๅฎš็พฉใ™ใ‚‹ใ€‚

โ€ป ๐’ฏ๐’ฉ ๐‘ฅ; ๐œ‡, ฮฃ, ๐œŒ ๏ผšๅˆ‡ๆ–ญๆญฃ่ฆๅˆ†ๅธƒใ€‚

๐’ฏ๐’ฉ ๐‘ฅ; ๐œ‡, ฮฃ, ๐œŒ = ๐’ฉ ๐‘ฅ; ๐œ‡, ฮฃ if ๐œŒ is True0 otherwise

ใ–ใฃใใ‚Šๅฎš็พฉใ—ใฆใ„ใ‚‹ใ ใ‘ใ€‚

ๅ‘จ่พบๅฐคๅบฆใฎไธ‹้™ใ‚’ๆœ€ๅคงๅŒ–ใ™ใ‚‹๐‘ž ๐šฏ, ๐šต ใซ

ใ™ใ‚‹ใŸใ‚ใ€ๆฌกใ‚นใƒฉใ‚คใƒ‰ใฎๅฎš็†ใ‚’ไฝฟ็”จใ€‚

10/16

Page 12: Bayesian Efficient Multiple Kernel Learning

ๅญฆ็ฟ’ใ‚ขใƒซใ‚ดใƒชใ‚บใƒ ๏ผˆๆบ–ๅ‚™๏ผ›ๅค‰ๅˆ†่ฟ‘ไผผใฎใ‚ญใƒข๏ผ‰

ใ€ๅฎš็†ใ€‘ๅ‰ใ‚นใƒฉใ‚คใƒ‰ใฎ๐‘ž ๐šฏ, ๐šต ใฎๅฎš็พฉใฎไธ‹ใ€ๅ‘จ่พบๅฐคๅบฆใ‚’ๆœ€ๅคงๅŒ–ใ™ใ‚‹ใจใใ€

๐‰ โˆˆ ๐€ , ๐’‚ , ๐‘ฎ , ๐›พ , ๐Ž , ๐‘, ๐’† , ๐’‡ ใซๅฏพใ—ใฆใ€ๆฌกๅผใŒๆˆใ‚Š็ซ‹ใคใ€‚

๐‘ž ๐‰ โˆ exp E๐‘ž ๐šฏ,๐šต โˆ–๐‰ log ๐‘ ๐ฒ, ๐šฏ, ๐šต| ๐Š๐‘š ๐‘š=1๐‘ƒ

ใ€่จผๆ˜Žใ€‘ ๅ‰่จผๆ˜Žใ‚ˆใ‚Šใ€๐‘ ๐ฒ,๐šฏ,๐šต| ๐Š๐‘š ๐‘š=1

๐‘ƒ

๐‘ž ๐šฏ,๐šต= 1ใŒๆˆใ‚Š็ซ‹ใฃใฆใ„ใ‚‹ใฎใงใ€

๐‘ž ๐šฏ, ๐šต = ๐‘ ๐ฒ, ๐šฏ, ๐šต| ๐Š๐‘š ๐‘š=1๐‘ƒ

log ๐‘ž ๐šฏ, ๐šต = log๐‘ ๐ฒ, ๐šฏ, ๐šต| ๐Š๐‘š ๐‘š=1๐‘ƒ

E๐‘ž ๐šฏ,๐šต โˆ–๐‰ log ๐‘ž ๐šฏ, ๐šต = E๐‘ž ๐šฏ,๐šต โˆ–๐‰ log ๐‘ ๐ฒ, ๐šฏ, ๐šต| ๐Š๐‘š ๐‘š=1๐‘ƒ

E๐‘ž ๐šฏ,๐šต โˆ–๐‰ log ๐‘ž ๐‰ ๐‘ž ๐šฏ, ๐šต โˆ– ๐‰ = E๐‘ž ๐šฏ,๐šต โˆ–๐‰ log ๐‘ ๐ฒ, ๐šฏ, ๐šต| ๐Š๐‘š ๐‘š=1๐‘ƒ

E๐‘ž ๐šฏ,๐šต โˆ–๐‰ log ๐‘ž ๐‰ + E๐‘ž ๐šฏ,๐šต โˆ–๐‰ log ๐‘ž ๐šฏ, ๐šต โˆ– ๐‰ = E๐‘ž ๐šฏ,๐šต โˆ–๐‰ log ๐‘ ๐ฒ, ๐šฏ, ๐šต| ๐Š๐‘š ๐‘š=1๐‘ƒ

log ๐‘ž ๐‰ + const = E๐‘ž ๐šฏ,๐šต โˆ–๐‰ log ๐‘ ๐ฒ, ๐šฏ, ๐šต| ๐Š๐‘š ๐‘š=1๐‘ƒ

๐‘ž ๐‰ = exp E๐‘ž ๐šฏ,๐šต โˆ–๐‰ log ๐‘ ๐ฒ, ๐šฏ, ๐šต| ๐Š๐‘š ๐‘š=1๐‘ƒ exp โˆ’const

๐‘ž ๐‰ โˆ exp E๐‘ž ๐šฏ,๐šต โˆ–๐‰ log ๐‘ ๐ฒ, ๐šฏ, ๐šต| ๐Š๐‘š ๐‘š=1๐‘ƒ

โ†’

โ†’

โ†’

โ†’

โ†’

โ†’

โ†’

11/16

Page 13: Bayesian Efficient Multiple Kernel Learning

ๅญฆ็ฟ’ใ‚ขใƒซใ‚ดใƒชใ‚บใƒ 

๏ผ‘๏ผŽ้ฉๅฝ“ใชๅˆๆœŸๅ€คใฎๅ…ƒใงไปฅไธ‹ใ‚’่จˆ็ฎ—

๏ผ’๏ผŽๅ‘จ่พบๅฐคๅบฆใฎไธ‹้™๏ผšE๐‘ž ๐šฏ,๐šต log ๐‘ ๐ฒ, ๐šฏ, ๐šต| ๐Š๐‘š ๐‘š=1๐‘ƒ โˆ’ E๐‘ž ๐šฏ,๐šต log ๐‘ž ๐šฏ, ๐šต

ใŒๅŽๆŸใ—ใฆใ„ใ‚‹ใ‹็ขบ่ชใ—ใ€ๅŽๆŸใ—ใฆใ„ใชใ‘ใ‚Œใฐ๏ผ‘๏ผŽใธๆˆปใ‚‹

โ€ป

๐‘ž ๐‰ โˆ exp E๐‘ž ๐šฏ,๐šต โˆ–๐‰ log ๐‘ ๐ฒ, ๐šฏ, ๐šต| ๐Š๐‘š ๐‘š=1๐‘ƒ

ใ‚’ไฝฟใ†ใจๆฑ‚ใ‚ใ‚‰ใ‚Œใ‚‹

12/16

Page 14: Bayesian Efficient Multiple Kernel Learning

ๆŽจๅฎšใ‚ขใƒซใ‚ดใƒชใ‚บใƒ 

โ€ป ฮฆ๏ผšๆจ™ๆบ–ๆญฃ่ฆๅˆ†ๅธƒใฎ็ดฏ็ฉๅˆ†ๅธƒ้–ขๆ•ฐ

ๆ–ฐใŸใช็‰นๅพดใƒ™ใ‚ฏใƒˆใƒซ๐‘ฅโˆ—ใฎใƒฉใƒ™ใƒซ๐‘ฆโˆ—ใฎใจใ‚‹็ขบ็Ž‡ใฏๆฌกๅผใ‚ˆใ‚Šๆฑ‚ใ‚ใ‚‰ใ‚Œใ‚‹

๐‘˜๐‘š,โˆ— = ๐‘˜๐‘š ๐‘ฅ1, ๐‘ฅโˆ— , โ€ฆ , ๐‘˜๐‘š ๐‘ฅ๐‘, ๐‘ฅโˆ—โŠค

13/16

Page 15: Bayesian Efficient Multiple Kernel Learning

ๅฎŸ้จ“๏ผˆ๏ผ‘๏ผ‰

ใƒปๅฎŸ้จ“ใƒ‡ใƒผใ‚ฟ๏ผšUCI repository pima

ใƒป่จ“็ทดใƒ‡ใƒผใ‚ฟๆ•ฐ๏ผšN=537 ๏ผˆใƒ†ใ‚นใƒˆใƒ‡ใƒผใ‚ฟๆ•ฐ๏ผš230็จ‹ๅบฆ๏ผ‰ ใƒปใ‚ซใƒผใƒใƒซๆ•ฐ๏ผšP=117

ใƒป9ๅ€‹ใฎ็‰นๅพดใใ‚Œใžใ‚Œใซๅฏพใ—ใฆไปฅไธ‹ใฎใ‚ซใƒผใƒใƒซใ‚’็”จๆ„

ใƒปใ‚ฌใ‚ฆใ‚นใ‚ซใƒผใƒใƒซ๏ผš10ๅ€‹

ใƒปๅคš้ …ๅผใ‚ซใƒผใƒใƒซ๏ผš3ๅ€‹

ใƒปPC๏ผš3.0GHzCPU 4GBใƒกใƒขใƒช

14/16

Page 16: Bayesian Efficient Multiple Kernel Learning

ๅฎŸ้จ“๏ผˆ๏ผ’๏ผ‰

ใƒปๅฎŸ้จ“ใƒ‡ใƒผใ‚ฟ๏ผš Protein Fold Recognition

ใƒป่จ“็ทดใƒ‡ใƒผใ‚ฟๆ•ฐ๏ผšN=311 ๏ผˆใƒ†ใ‚นใƒˆใƒ‡ใƒผใ‚ฟๆ•ฐ๏ผš383๏ผ‰ ใƒปใ‚ซใƒผใƒใƒซๆ•ฐ๏ผšP=12

15/16

Page 17: Bayesian Efficient Multiple Kernel Learning

ใพใจใ‚

โ€ข Multiple Kernel Learning๏ผš โ€“ ่ค‡ๆ•ฐใฎใ‚ซใƒผใƒใƒซใ‚’็ต„ใฟๅˆใ‚ใ›ใ‚‹ๅญฆ็ฟ’ๆ‰‹ๆณ•

โ€ข ๆๆกˆๆ‰‹ๆณ•BEMKL๏ผš โ€“ ้ซ˜้€Ÿใƒป้ซ˜็ฒพๅบฆ

โ€“ ๆ•ฐ็™พๅ€‹ใฎใ‚ซใƒผใƒใƒซใ‚’ไฝฟใฃใฆใ‚‚๏ผ‘ๅˆ†ไปฅไธ‹ใงๅญฆ็ฟ’

16/16