freee株式会社 - crash.academyˆ†:会社設立用の書類を最短 5分で作成...
TRANSCRIPT
横路 隆 CTO / 共同創業者
2
● Ruby City 松江育ち。慶應義塾大学院理工学研究科修了、専攻はコンピュータサイエンス(ネットワーク)。
● 学生時代よりe-learningや動産担保融資支援など、ビジネス向けのシステム開発に携わる。
● 2010年、大学院修了後はソニーにてデジタルカメラの製品開発に従事。
● 2012年、freee株式会社を共同創業。
freee株式会社
4
2017年「働きがいのある会社」
ランキング3位
2015年度 グッドデザイン賞
「未来づくりデザイン賞」
会社名 :freee 株式会社
設 立 :2012年7月
資本金 : 96億618万円 (資本準備金等含む)
代表者 :佐々木 大輔
従業員 :300名(2017年1月現在)
主要株主:IVP、DCM、リクルートHD
ビジネスのはじまりから成長をすべてサポートする freee
5
簡単:知識がなくても1クリックで給与計算
勤怠:勤怠管理も簡単に
オンライン:給与明細はオンラインで配布
会計連動:会計ソフトと完全データ連携
政府連携:行政手続きもオンラインで完結
マイナンバー:マイナンバー管理も完全対応
5分:会社設立用の書類を最短5分で作成
モバイル:スマホ完全対応で、どこでも会社設立
ワンストップ:実印発注や銀行口座作成もできる
自動:銀行やカードの口座と連携し、人工知能で会計帳簿を作成
簡単:簿記の用語を使わない画面設計で簡単に使える
最適化:請求書発行や経費精算などの業務も最適化
実績:クラウド会計ソフトシェア No.1 で安心の実績
サポート:チャットによる迅速なサポートを提供
決算:決算や個人事業主の申告まで自動で簡単に
✩ はじめる ↻ 運営する ↗ 育てる
会社設立 freee(2015年6月リリース )
クラウド会計ソフト freee(2013年3月リリース )
クラウド給与計算ソフト freee(2014年5月リリース )
シェアNo.1 シェアNo.1
開業 freee(2016年10月リリース )
データを活用したバックオフィス業務の効率化
6
決済サービス
費用費用費用売上 費用負債費用費用資産
費用費用現金費用費用費用
金融機関 クレジット POS,家計簿等
自動仕訳* *クラウド会計ソフトの自動仕訳に関する人工知能技術について、特許権(特許第5936284号)を取得済
テクノロジーを活用し「記帳」「経理作業」を効率化
自動仕訳の技術はクラウド会計で唯一特許を取得
クラウドバックオフィス市場No.1 の圧倒的データ量
7
サービス開始4年で
70万事業所突破市場調査からも
シェアNo.1
* デジタルインファクト調べ
開始4年で、70万事業所が利用するサービスに成長
No.1のシェアも獲得
ユーザーベースとテクノロジーを活用し
中小企業のビジネスプラットフォームへと進化
8
取引効率化
機会創出経営効率化
決済
受発注 ネッティング
ビジネスマッチング在庫管理
ファクタリング
経営統計データ
請求
入金管理
fSBPは、freeeを使用するユーザー同士がクラウド上で繋がるプラットフォーム。
業務の効率化だけでなく、SMBにとって実益のあるプラットフォームを目指す。
freee Smart Business Platform(fSBP)
人事データを一元化する、人事労務 freee も始動
10
給与計算
勤怠管理
労務
手続き
従業員
管理
マイナン
バー
● 2017年夏頃リリース予定
● 先行予約受付開始中
2017年夏頃にリリース予定の人事労務 freeeは、クラウド上で人事労務の
業務を完結させ、人事労務を大きく効率化させるプロダクト
強化 強化
New
アルゴリズム開発ではなく、プロダクト応用について話します
12
話すこと
話さないこと
● freeeはデータでどんな課題を解くのか?
● どうやって機械学習をプロダクトに入れるか
● 機械学習を含む開発プロセスの要点
● 機械学習をやる人がいない問題
● データ分析や機械学習の具体的な方法論
● ツールの使い方・作り方
● 正しくデータを扱うお作法
● アルゴリズム開発の方法
freeeはデータを活用してどんな課題を解くのか?
13
経営の意思決定サポート
バックオフィス業務の効率化
ビジネスデータ識別基盤
● 分類・突き合わせ作業などの効率化・正確化
● 例:自動仕訳・自動帳簿チェック
● 予測・マッチングなどによる経営への示唆
● 例:資金繰りシミュレーション・経営シグナル
● 紙データを解釈するための画像処理
● ヒト・モノ・カネを一意に識別するための
自然言語処理
基礎
応用
機械学習をプロダクトに導入するためのフロー
14
データで解決したい課題は明確か?
ルールベースでやってみたか?
ルールの複雑度は運用可能なレベルか
十分な精度が得られているか
十分なデータがあるか?
機械学習を検討する
課題を明確にする
ルールベースを
試してみる
もう少しルールベースで
がんばる
データを集める少ないデータなら
手動で収集でもOK
機械学習よりも早く
プロダクト価値を
検証可能
すでに十分な精度が
出ているとしたら
機械学習は不要
YES
YES
YES
YES
NO
NO
NO
NO
課題解決のいちオプションとしての機械学習
15
● プロダクト価値を高めるツールとしての機械学習
○ 機械学習の本番運用はコストが高い。シンプルなルールベースで
解決できるなら、使わない覚悟も必要
● 予測モデルの予測が外れることを想定したサービスづくり
○ freeeでは自動化を目指しすぎず、人の意思決定支援という視点で本質
的な利便性を考えたUI/UXで補完することを目指す
機械学習を含む開発プロセスの全体像
16
課題設定
データ収集
特徴量設計
モデリング
評価
本番環境実装
モニタリング
解釈
ドメイン知識が重要
技術スキルが重要
機械学習ツールを使いこなすプロセス(機械学習入門で学ぶのはおおよそココ)
サービスづくりの知見と
ドメイン知識が活きるプロセス
スケーラブル・メンテナブルなソフトウェアづくりの知見が
活きるプロセス
機械学習を含む開発プロセスの難しいところその1:初期仮説検証の見積もりが難しい
17
課題設定
データ収集
特徴量設計
モデリング
評価
本番環境実
装
モニタリング
解釈
● 初期仮説検証は、ソフトウェア開発より研究開発に近いプロセス
○ 期待通り予測モデルの精度が出るかどうか、実際に試さないとわからない
○ 予測モデルの精度が出て初めて、本番環境実装の計画が立てられる
プロダクトの提供価値として
どんな評価指標の値を期待するか?
評価指標を満たすまでどれくらい
投資するか?を握ることが重要
機械学習を含む開発プロセスの難しいところその2:データ解釈 ⇒ 課題設定のイテレーションが難しい
18
● ビジネス価値に沿った、継続的なデータ解釈と課題設定ができているか
○ 適切なメトリクスを見ているか?
○ 許容できるリスク・避けるべきリスクを区別できているか?
○ ROIも曖昧なことが多く、つくりっぱなしでメンテナンスされなくなりがち
課題設定
データ収集
特徴量設計
モデリング
評価
本番環境実
装
モニタリング
解釈
許容できる(または目指したい)
評価指標を読み解けるだけの
最低限のデータリテラシーと、
イテレーションの検討自体が重要
データドリブンなプロダクトの運用に不可欠なモニタリング
19
「何かあったな」に気付いて
アクションをとれるように
しておくことが重要
図:とある指標の推移
● 基本的にデータは生もの
○ 何らかの変更でデータの素性が変わり、予測モデルがうまく仕事をしなく
なってしまうことを想定しておかないといけない
○ 改善・イテレーションのためでなくても、安定してサービス提供を継続す
るために、モニタリングは必須
小さくはじめる機械学習プロダクトづくり
20
● 機械学習をつかったプロダクトづくりを始めるために必要なこと
○ データドリブンに解決すべき課題を見つけること
○ 基本的なデータリテラシーとツールの使い方を学ぶこと
○ これまでの開発プロセスとの違いを意識すること
freeeではソフトウェアエンジニア有志が
機械学習勉強会を毎週開催
まとめ
22
● プロダクト開発において、機械学習は課題解決のいちオプションで
あると心得て、ルールベースからのスモールスタートも躊躇わないこと
● 機械学習をプロダクトに導入する際には、ある程度の投資が必要である
ことを覚悟した上で、ゴールを明確にし強い意思を持って取り組むこと
● 機械学習ツールの活用ノウハウは揃ってきているが、エンジニアリングノウハ
ウはまだまだ世に出回ってないので、自ら開拓者となり共有していくつもりで
取り組むこと
自己紹介
薄井 研二茨城県出身1990/06生
略歴● 首都大学東京 修士卒(化学専攻)● 半導体メーカーに新卒で入社● 転職して金融工学的なことをやる● 2017/01よりfreeeへ参加
趣味● アカペラ(ボイパ)● ビール
4 / 34
現在の主なプロジェクト
自動帳簿チェック機能
帳簿のミスを発見し修正を提案してくれる機能
タグ付けライブラリ
自然言語からビジネス情報を抽出しタグ付けする
請求書と入金のマッチング(今回は触れません)
大学との共同研究
作業期間 四半期
作業人数 薄井(実装はCTO横路と共同)
7 / 34
タグ付けライブラリ概要
自然言語からビジネス的に
有意な文字列を抜き出してタグ付けする・今回は明細データを対象
ex: フリコミ*フリーカブシキガイシャ 4月給料
取引先: freee株式会社
アクション 振込
品名 給料
10 / 34
事例:自動帳簿チェックでは?
15 / 34
目的:freeeからモレ・ダブり・ミスを撲滅したい
課題と現状が全然分かっていなかった
● 数は?
● 種類は?
● 時期の変化は?
● どんな人から?
● そもそもどうやって調べるの?
マネジメントの難しさ
研究開発はwebプロダクト開発と違って
時間の見積もりが難しい
● 時間のかかるタスクが多い
○ 分析、ヒアリング
● いつ答えにたどり着くか不明瞭
○ 仮説思考
19 / 34
シャープな課題設計には
時間がかかることを理解する
事例:自動帳簿チェック
モレ・ダブり・ミスの調査に
● 前Qで1.5ヶ月くらい
● 今Qも1.5ヶ月くらい
めっちゃ時間を使っているので
他の開発とスピード感が違って焦る
でも必要なことなので
強い意志を持って調査する
レポートはこまめにだす
20 / 34
モデリング
常にシンプルな手段を使うことが大切
スタートが難しいときはルールベースでも良いから
スモールスタートではじめの一歩を踏み出す
ルールベース
線形回帰, ロジスティック回帰
SVM, ナイーブベイズ
Deep Learning
23 / 34
complex
simple
事例:タグ付けライブラリ
銀行・クレジットカードの明細は
一般の自然言語処理の対象とは異なる特徴を持つex: フリコミ*フリーカブシキガイシャ 4月給料
● 名詞しかない
● カタカナ
● 独自の略称
自然言語処理の技術が使いにくいので
まずはルールベースで対応してみる
24 / 34
まとめ
33 / 34
シャープな課題設計
AIプロダクトの価値を決めるポイント
時間をキチンとかける
リリースしよう
顧客からのフィードバックは大事
四の五の言わずにリリースまで持っていく
スモールスタートする勇気
難しいことしようとして爆死しない
場合によってはルールベースから始めてみる