2012 09 06_sot_m_osm
TRANSCRIPT
OpenStreetMapのデータとコミュニティ活動について
Tomomichi Hayakawa (@Tom_G3X) OpenStreetMap Foundation Japan
Center for Green Computing, Nagoya Institute of Technology
Yuma Imi, Takayuki Ito Department of Computer Science, Nagoya Institute of Technology
OpenStreetMap
自己紹介
• OpenStreetMap Tokai • OpenStreetMap Foundation Japan • 名古屋工業大学グリーンコンピューティング研究所 • Malaika System – CEO
• FLOSSな活動 – OpenStreetMap東海
• - http://groups.google.co.jp/group/OSM-Tokai
– XOOPS Cube Project 〜 XOOPS Cube 東海 – FLOSS桜山 〜 DS-Tokai
• 名古屋のメタ・コミュニティ
• Twitter @Tom_G3X • うえこみ春日井小牧
– 地域情報サイト運営- http://www.kasugai-komaki.jp/
• その前は・・・株式会社ザクロ – 取締役 とか・・・・
早川 知道(はやかわ ともみち)Tomomichi Hayakawa
今回使用したデータについて
日本のコミュニティ活動の調査 – 日本の履歴データ
• 全球データより日本を抽出 (planet.openstreetmap.org) • 2007.11.7 ~ 2012.04.30の期間 • PostGISで拡張したPostgreSQLへ (データベースで約500GB 程度) • 加えて、藤澤さんのデータも
– http://wiki.openstreetmap.org/wiki/User:Techstrom/JapanData
日本と他地域との比較調査 – 各地域のデータ(77地域)
• 世界のデータ(Node, Way, Relation, User) – http://odbl.de/ より取得
• 2012.4.30 現在
日本のデータについて調べてみました
日本のOpenStreetMap 履歴データ
OpenStreetMap の日本のデータ
OpenStreetMap Japan の歴史 (2007.11 – 2012.7)
0
10,000,000
20,000,000
30,000,000
40,000,000
50,000,000
60,000,000
70,000,000
80,000,000
90,000,000
2008年1月 2008年7月 2009年1月 2009年7月 2010年1月 2010年7月 2011年1月 2011年7月 2012年1月 2012年7月
Object relation
way
node
2008.3 - 国土数値情報(鉄道) インポート開始
2010.4 ‒ 国土数値情報(森林) インポート
2010.4 ‒ 2011.10 国土数値情報(河川) インポート
2008.4 ‒ 国土数値情報(行政区域) インポート
2008.3 ‒ 2010.4 国土数値情報(空港) インポート
2009.11 ‒ 2010.2 国土数値情報(海岸線) インポート 2010.12 ‒
Bing衛星写真 提供開始
2010.3.31 国土計画局オルソ空中写真提供終了
2011. 9.23-10.3 coastline 入れ替え作業 Yahoo/Alpsデータ
2011.4 ‒ 2011.9 国土数値情報(公共施設) インポート
2012.4.1 ODbLライセンス切り替え 2010.12.24 OpenStreetMap Foudation Japan 設立
2011.3.6 Yahoo/Alpsデータの提供発表
2011.3 国土数値情報(発電所) インポート
2011.4.1 Yahoo/Alps道路データ インポート開始
3.11
9 14 12 30 62 73 80
94 109 121
155 171 206 218
237
312 346
374 413
472 499
542 544 558 567 578 584 592 606 645 671
698 743 766
802 825 854
1,179 1,238 1,272 1,298
1,338 1,364 1,391
1,440 1,468
1,514 1,543 1,590
1,842
1,965 1,994
2,162
user
OpenStreetMap の日本のデータ
Source Tag (All ObjectsèNode, Way, Relation)
リソースの割合を調査、sourceタグの数を集計してみたが・・・・、
Nodeにタグがあったりで、正確な比率が出せなかった orz
PGS, 37,660 , 0.05% NRPB of MLIT Japan(オルソ), 80,873 ,
0.10%
MLIT(国土数値情報/森林など),
292,056 , 0.35%
KSJ2(国土数値情報), 25,007,061 , 30.36%
Bing, 494,767 , 0.60%
Yahoo/Alps, 3,970,862 , 4.82%
Sourceタグなし, 52,482,876 , 63.72%
PGS
NRPB of MLIT Japan(オルソ)
MLIT(国土数値情報/森林など)
KSJ2(国土数値情報)
Bing
Yahoo/Alps
Sourceタグなし
2012.04.30 現在
OpenStreetMap の日本のデータ
Highway = * (道路タグの値) (2007.11 – 2012.4)
0
500,000
1,000,000
1,500,000
2,000,000
2,500,000
3,000,000
3,500,000
4,000,000
4,500,000
2008年1月 2008年7月 2009年1月 2009年7月 2010年1月 2010年7月 2011年1月 2011年7月 2012年1月
steps cycleway road living_street track path footway pedestrian service residential unclassified tertiary secondary primary trunk motorway
3.11
2011.4.1 Yahoo/Alps道路データ インポート開始
Tag別 (Highway以外のタグ) (2007.11 – 2012.4)
0
100,000
200,000
300,000
400,000
500,000
600,000
700,000
800,000
2008年1月 2008年7月 2009年1月 2009年7月 2010年1月 2010年7月 2011年1月 2011年7月 2012年1月
landuse=
natural=
power=
leisure=
shop=
waterway=
railway=
3.11
2008.3 - 国土数値情報(鉄道) インポート開始
2010.4 ‒ 国土数値情報(森林) インポート
2010.4 ‒ 2011.10 国土数値情報(河川) インポート
2011. 9.23-10.3 coastline 入れ替え作業 Yahoo/Alpsデータ
2011.3 国土数値情報(発電所) インポート
2009.11 ‒ 2010.2 国土数値情報(海岸線) インポート
Shop=* Leisure=* (2007.11 – 2012.4)
淡々と増えている
0
2,000
4,000
6,000
8,000
10,000
12,000
14,000
16,000
2008年1月 2008年7月 2009年1月 2009年7月 2010年1月 2010年7月 2011年1月 2011年7月 2012年1月
shop=
leisure=
3.11
Tagの数 (Wayの数と比較) (2007.11 – 2012.7)
0
1,000,000
2,000,000
3,000,000
4,000,000
5,000,000
6,000,000
7,000,000
8,000,000
9,000,000
2008年1月 2008年7月 2009年1月 2009年7月 2010年1月 2010年7月 2011年1月 2011年7月 2012年1月 2012年7月
way
通常のタグ
※但し、 以下のタグは除外している Source =* , Node =* Created_by =* Yh:* =* KSJ2:* = *
2010.4 ‒ 2011.10 国土数値情報(河川) インポート
2011.4.1 Yahoo/Alps道路データ インポート開始
実は、当初、環境が整ってなくて、 Gripで集計してた事は、内緒です。
気が付いたら、
iMac3台を2週間くらい回してた orz
今は、ちゃんとDBに入ってます。
日本と他地域のデータを比較し、興味深い結果が出ましたので
紹介します。
OpenStretMapの品質
オブジェクトの数の指標
• OSM Merit – http://odbl.de にて定義
– Node,Way,Relationの複数の要素を一元化した指標
OSM Merit = Node + 5*Way + 20*Relation
• OSM Merit 密度 – 1000km2 あたりのOSM Merit
– 他地域との比較に利用 OSM Merit密度 = (OSM Merit * 1000) / 面積 (km2)
• マッパー1人当たりのOSM Merit – マッパー1人当たりのOSM Merit(オブジェクト数) – 他地域との比較に利用
マッパー1人当たりのOSM Merit = OSM Merit / マッパー数
OSM Merit (オブジェクトの数の指標)
データ分析
OSM Merit 密度 (上位20地域)
11,289,000
1,990,387
646,354
540,552
527,690
506,001
490,827
441,267
437,450
421,356
361,974
306,936
280,999
258,064
253,014
248,482
233,776
160,385
122,655
118,683
124,471
0 200,000 400,000 600,000 800,000 1,000,000 1,200,000 1,400,000 1,600,000 1,800,000 2,000,000
monaco
netherlands
france
czech_republic
luxembourg
belgium
germany
gaza
slovakia
switzerland
austria
denmark
japan
europe
great_britain
italy
canary_islands
bahrain
israel_and_palestine
slovenia
japan 20110309
OSM Merit / 1000km2
Region
OSM Merit密度 = 1000km2あたりのOSM Merit(データ数) ・日本は13番目 ・まだ日本のコミュニティは小さいのだが、 OSM先進地域に迫るOSM Merit(データ数)
・日本は、ヨーロッパ平均と同程度 ・3.11直前から、約一年でデータ数が約2倍に ・日本でOSMが普及過程にあった事 ・3.11にクライシスマッピングが行われた ・4/1よりYahoo!/Alpsデータのインポートが始まった
OSM Merit密度 (単位面積当たりのオブジェクト数) 77地域(2012.04.30現在) と 2011.3.9の日本のデータ
データ分析
マッパー1人あたりの人口 (OSM Merit上位20地域)
339
3,311
4,684
2,842
786
2,947
1,732
13,355
4,094
1,596
1,873
2,365
64,814
4,003
4,653
6,253
2,348
11,631
12,402
2,274
149,133
0 20000 40000 60000 80000 100000 120000 140000 160000
monaco
netherlands
france
czech_republic
luxembourg
belgium
germany
gaza
slovakia
switzerland
austria
denmark
japan
europe
great_britain
italy
canary_islands
bahrain
israel_and_palestine
slovenia
japan 20110309
Population / Mapper
Region
= 人口/マッパー数 ・日本は飛びぬけて多い ・OSM先進国と比べて、 飛びぬけてOSM普及率が低い! ・3.11直前は、さらにその倍以上低かった!
日本は普及率が低い!(マッパー人口比) 77地域(2012.04.30現在) と 2011.3.9の日本のデータ
データ分析
マッパー1人あたりの面積 (OSM Merit上位20地域)
マッパー1人あたりのカバー面積が広すぎる! 22
8,196
41,129
21,969
4,047
8,631
7,565
3,243
36,703
8,643
19,122
18,479
192,282
34,624
18,180
32,437
8,475
7,900
29,126
23,011 442,430
0 50000 100000 150000 200000 250000 300000 350000 400000 450000
monaco
netherlands
france
czech_republic
luxembourg
belgium
germany
gaza
slovakia
switzerland
austria
denmark
japan
europe
great_britain
italy
canary_islands
bahrain
israel_and_palestine
slovenia
japan 20110309
Area (1000km2)/Mapper
Region
= 面積(km2)/マッパー数 これも、日本は飛びぬけて広い OSM先進国と比べて、 マッパーあたりのカバー面積が飛びぬけて広い! 3.11直前は、さらに倍以上広かった!
• データの密度は、ヨーロッパ並み
だけど
• マッパー人口比、ヨーロッパの10倍以上
• マッパー面積比、ヨーロッパの5倍以上
èマッパー少なすぎ
それで
• マッパー1人当たりのデータ量は・・・・・・・
つまり、日本は、・・・・・
データ分析
マッパー1人あたりのOSM Merit (OSM Merit上位20地域)
251
16,312
26,584
11,875
2,136
4,367
3,713
1,431
16,056
3,642
6,922
5,672
54,031
8,935
4,600
8,060
1,981
1,267
3,572
2,731
55,070
0 10,000 20,000 30,000 40,000 50,000 60,000
monaco
netherlands
france
czech_republic
luxembourg
belgium
germany
gaza
slovakia
switzerland
austria
denmark
japan
europe
great_britain
italy
canary_islands
bahrain
israel_and_palestine
slovenia
japan 20110309
OSM Merit / Mapper
Region
マッパー1人あたりのOSM Merit = OSM Merit/マッパー数 ・日本は、マッパー1人あたりのOMS Meritが極めて多い。 ・少数のマッパーで多くのデータを維持管理している状況 ・ボランタリーなプロジェクトでは将来の持続に不安があるかも
いい意味でも、悪い意味でも、日本の特徴
1人あたりのデータ数が極端に多い!EUの6倍! 77地域(2012.04.30現在) と 2011.3.9の日本のデータ
OpenStretMapの品質
汎用情報データベースのデータ数の指標
– OSMの仕様上、多様な情報を入力する場合それぞれWayを分断する必要がある。
Node-Way比 = Node/Way
– Node-Way比が高い • Wayのデータ数(情報量)が少ない
– Node-Way比が低い • Wayのデータ数(情報量)が多い
– 但し、あくまで簡易な指標 – 試験的にやってみた
Node-Way比 (Wayのデータ数(情報量)の指標)
データ分析
Node-Way x OSM Merit by Region & Japan
Node-Way比と OSM Merit密度(オブジェクト) 77地域(2012.04.30現在) と 2007.11〜2012.3の日本の履歴データ
0.0
5.0
10.0
15.0
20.0
25.0
30.0
35.0
40.0
45.0
0 100,000 200,000 300,000 400,000 500,000 600,000 700,000
Node/Way
OSM Merit密度 (オブジェクト)
Gaza Bahrain
Luxembourg
France Germany Belgium
Monaco Netherlands
3.11
2011.4.1 Yahoo/Alps道路データ インポート開始
2009 ‒ 2010 国土数値情報 インポート
・Node-Way比が高い時期 ・国土数値情報インポートの時期と一致する
・Node-Way比の急激な下降 ・Yahoo/Alps道路データのインポート開始時期と一致
・Yahoo/Alps道路データはNode-Way比が低いデータ 情報量が多いデータといえる
・他地域に比べ、まだ高い ・不要なデータ、重複データ、冗長なデータなどが多いかも
・シンプルなマッピングも大事かも
まとめ
調査して分かった事
• 日本のデータ数は、約1年間で2倍以上増加 – OSM先進地域に近づきつつある
• 日本は、マッパー1人当りの編集量が極めて多い – 持続可能なコミュニティとして不安がある
• 日本のデータ品質は、OSM先進地域のレベルに至っていない
• Yahoo/Alps道路データは、比較的情報量が多いデータ
• 持続可能なコミュニティの為には、 – 更なる普及活動が必要
• データ品質向上の為に、 – 重複・冗長・不要データなどの整理
背景
研究の目的
• OpenStreetMapèボランタリーなコミュニティ活動
– 社会への貢献を果たしている
• 「コミュニティ活動」と「成果物の品質」
– è相関関係にある
• OpenStreetMapの品質が向上すれば
– 更に多様な社会への貢献が可能に
• 「コミュニティ活動」と「成果物の品質」の研究成果
– OSMコミュニティへフィードバック
OpenStretMap の品質- Information Quarity of OpenStreetMap -
OpenStretMap DB
OpenStreetMap の品質
OpenStretMapの2つの可能性
• 汎用情報データベース的な側面 – Tag ( key : Value)
– 地物の様々な情報(タグ情報)
地理情報DB と 汎用情報DB の側面がある
Objects (Node, Way, Relation)
+ Tag
• 地理情報データベース的な側面 – 緯度、経度 (Latitude , Longitude)
– 位置、外観、形状
OpenStretMapの品質
OSMの品質(精度&データ数)
地理情報 (Object) 汎用情報 (Tag)
精度
位置精度 (形状精度) (緯度・経度・高度)
タグ精度 (正確な情報である事)
繋がり精度 (交差・接続)
時間精度 (最新の情報である事)
データ数 オブジェクトの数 (より多くのオブジェクト)
タグの数 (より多くのタグ情報)
データ分析
Node-Way x OSM Merit by Region
Node-Way比(情報量)と OSM Merit密度(データ数) 77地域(2012.04.30現在) と 2011.3.9の日本のデータ
0.0
5.0
10.0
15.0
20.0
25.0
30.0
35.0
40.0
45.0
0 100,000 200,000 300,000 400,000 500,000 600,000 700,000
Node/Way
OSM Merit密度 (データの数)
Japan
Gaza Bahrain
Luxembourg
France Germany Belgium
Japan 2011.3.9
Monaco Netherlands
データ分析
Node-Way x OSM Merit (Japan 2007.11.7 – 2012.4.30)
日本の履歴データ (2007.11.7-2012.4.30)
0.00
5.00
10.00
15.00
20.00
25.00
30.00
35.00
40.00
45.00
50.00
0 50000 100000 150000 200000 250000 300000
Node
/W
ay
OSM Merit密度 (データの数)
Node/Way
まとめ
今後の課題
• 品質の指標の明確化
– 品質指標を多様化し、多角的な調査
• ユーザーの活動と品質の関係
– より狭い地域での比較/調査
• コミュニティ活動とインセンティブについて