Tomorrow Will Be A Better Day

Published

- 25 min read

[読書録]データで話す組織

img of [読書録]データで話す組織

読んだ本

データで話す組織(2023/11/11発売, 302ページ)

感想サマリ

DX関連の書籍の中でも、データ分析組織を作り上げていくなかで、必要なフェーズと組織のケイパビリティ(能力)が書かれている本。

本書の読書ターゲットは、冒頭にDX担当部長、企業経営者や現場と書かれているが、全体的には数式も技術要素の専門用語が少なめに書かれているので、身近にデータ組織に関する相談ができる人がいない地方などのDX担当者にもオススメできそうな気がした。

本書における組織の前提および目指す組織像というのも、

  1. アナログな業務フローを中心とした、旧来のビジネススタイル。紙が中心でFAXも現役
  2. アナログ業務のデジタル化が完了し、データに基づく議論ができる組織
  3. 集計・可視化を中心としたデータに基づく議論・ビジネス提案ができる組織
  4. データサイエンスを中心としたデータに基づく議論ができ、AIモデルの実運用ができる組織

といったフェーズごとの到達目標が整理されて、それぞれの章で解説されているのでそれぞれの組織が持つケイパビリティを理解しやすい構成になっている。

ちなみに、本書のいくつかにワークマンの事例が出てくるので、ワークマンは 商品を変えずに売り方を変えただけで なぜ2倍売れたのか(Amazon)も読んでみると、本書に書かれていたケイパビリティや成果などを実感できてよいかもしれない。

個人的には、データ組織の立ち上げ時、データサイエンティスト協会の資料はかなり経営会議の資料に盛り込んだのだけど、著者のような専門家の方がデータサイエンティスト協会の資料をベースに解説されている内容はすごく参考になった。

データサイエンティスト協会が出している2023年のプレスリリースでも、2014年のプレスリリース時の内容を前提で話されているので、下記図を頭に置いておくと、各フェーズでどのような人材が必要になるのか、どのようなスキルが必要になるのかをイメージしやすそうに感じた。

データサイエンティストスキルセット データサイエンティストスキルセット データサイエンティストスキルセット 画像引用:2023年度版「データサイエンティスト スキルチェックリストver.5」および「データサイエンス領域タスクリスト ver.4」を発表

また、組織内でデータ分析組織を立ち上げると、立ち上げっぱなしではなく、その後の人材の評価・育成まで考える必要が出てくるので、本書ではそのような人材の観点でも触れられているのが印象的だった。

本書の関連リンク

内容メモ

はじめに

競合他社への優位性を確立するために組織が持つ能力を ケイパビリティ(capability) と呼ぶことがあります

  • 4つのケイパビリティと3つのフェーズ
    • ケイパビリティ
      1. 課題発見力:ビジネス課題を発見し、どのような手段で解くべきかを検討できる能力
      2. 人材力:解くべき課題に対し、デジタル、データ分析、データサイエンスを用いたアプローチで解決できる能力
      3. データ力:自社、顧客、競合などビジネスの意思決定に必要なデータが分析に活用できる状態で整備されている能力
      4. 施策実行力:部署・部門の壁を超えて、現場から経営まで会社一眼となってデータに基づく施策を実行できる能力
    • フェーズ
      フェーズミッション求められるスキルの例
      デジタル化IT技術を用いて社内の業務の効率化に寄与し、デジタルデータの蓄積を支援する課題発見力、プログラミング力、社内調整力、ベンダー調整力、クラウドやBIツールの知識
      データ分析蓄積されたデジタルデータを前処理によって分析可能な状態にし、ビジネス課題のヒアリング、データの集計・可視化を中心にビジネスの改善に役立てる課題発見力、データ集計力、データ可視化力、ビジネス仮説の構築力、施策への提案力
      AI・データサイエンスデータサイエンスの技術を用いてより高度なデータ分析やAIモデルの構築を行い、データの価値をさらに引き出す課題発見力、データサイエンス力、機械学習モデルの実装力、データの背景に関する深い理解、より高度なビジネス提案力

DXを「ケイパビリティの獲得」という観点で考えると、5年、10年、15年という中長期の時間で考える必要がある

データで話す組織とは、「 必要なタイミングで必要なデータをもとに分析・議論・意思決定ができる組織

  • データで話す組織のメリット
    1. データを準備する時間が短縮できる
    2. データという資源を着実にビジネスに活用できるようになる
    3. 部門の壁を超えて、新しい意見・アイディアを取り入れやすくなる

「自社のDXプロジェクトがうまくいかない理由はなぜか?」という悩みを抱えているのでしたら、この4つのケイパビリティを思い出し「どの部分がボトルネックになっているのか」を検討してみてください

すべてのフェーズに必要な人材として、全体をとりまとめるDXプロジェクトの責任者が挙げられます

第1章 データで話す組織づくり
  • 組織心理学のエドガー H. シャインにおける、3段階の文化レベル
    1. レベル1: 文物
    2. レベル2: 価値観
    3. レベル3: 仮定(基本的前提)

ワークマンの事例でも、2012年からデータ活用に着手し、Excelを使ったデータ活用が浸透するまで5~10年の年月がかかっている

  • VRIO分析

    • Value: 価値があるか?
    • Rarity: 希少性があるか?
    • Imitability: 模倣困難であるか?
    • Organization: 組織として取り組む体制があるか?
  • 「データで話す組織」を目指す2つのアプローチ

    • トップダウン型アプローチ
      • 経営者が方針を決め、指示を出し、プロジェクトをすすめていくアプローチ
        • ワークマン,九州のホームセンター「グッディ」など
    • ボトムアップ型アプローチ
      • 特定部門主導で活動を行い、小さな成功体験を積み上げて徐々に全社展開を行っていくアプローチ
    • トップダウン型で進める場合においても、スモールスタートで始めること

データを価値に転換する実践としておすすめしたいのは部門の定例ミーティングなどの時間に、KPIやKGIのようなデータを確認できるダッシュボードを作り、それを全員で見る時間を設けること

第2章 現状把握とデジタル化

組織の状況:アナログな業務フローを中心とした、旧来のビジネススタイル。紙が中心でFAXも現役

目指す組織像:アナログ業務のデジタル化が完了し、データに基づく議論ができる組織

本章の内容は早くても3~5年をかけて積み上げていくことになります

現状や課題を十分に把握せずにStep3のデジタル化だけを進めてしまうと、「何のためのデジタル化なのか」「どこまでデジタル化をすすめるべきなのか」ということがみえなくなり、「デジタル化することが目的」となりがちですので、注意が必要

  • 各節におけるメモ
    • 社内業務の把握
      • 企業には大きく分けて、「事業」「業務」「作業」という3つの階層が存在する
      • 組織図を確認し、業務一覧表を作成し、業務フローを作成する
    • 意思決定プロセスの把握
      • 「会議体」と「承認フロー」の2つの観点から組織における意思決定システムの把握を行っていく
    • 事業課題の把握
      • 本章では問題とは「理想(あるべき姿)」と「現状」のギャップという考え方を採用し、課題とは問題解決の具体的な取り組みと定義します

    • アクションのための情報収集
      • 既存事例の情報を収集する方法(p.48 表2.7 )
        調査方法メリット
        インターネット記事最新の動向や既存事例が把握できる
        書籍/雑誌インターネットには出てこない具体的な情報が手に入る
        セミナーセミナーによって内容は異なるが、インターネット記事よりも具体的なプロセスを把握できる。また、講演者とコンタクトをとることで、インタビューするチャンスもある
        ハンズオン特定のサービスについて実際のデータを使いながら導入までを指導してくれる
        インタビュー実際に課題解決を行ったプロセスを把握することができ、インターネット記事ではわからないような泥臭い内容も含めて理解できる
      • 情報収集後は、自社のどの課題に適用できるかをまとめる
        • どの部署が主導・連携して(Who)、何のデータ(What)をどのような方法(How)でどれぐらいの期間(When)で、どこに(Where)可視化システムを構築したのか、など
    • 情報システム部門の把握
      • 役割だけでなく、取引先も把握しておく
      • システムの内製化に力を入れている企業であっても、すべて自社内で簡潔させることは困難

    • ステークホルダーの把握
      • ネガティブな反応には、全社的な活動で対応する必要があり、経営層の関与なく成功することはできません

    • 外部人材の活用
      • 知識があまりにも不足している場合は、外部人材に対する目利きができずミスマッチが発生する可能性があります

      • 外部人材の専門性を確認するための代表的な質問例
        • XX分野において、有名な事例を教えてください
        • XX分野において、大行的な課題は何か教えてください
        • XX分野のトッププレーヤーを教えてください
        • YYの施策を行おうと思った場合にかかる費用感や期間を大まかに教えてください
    • 情報セキュリティの把握
      • セキュリティのアクセス制御の基本的な考え方は、ブラックリスト方式とホワイトリスト方式
    • 社内システムの把握
      • 社内システムの内容を適切に捉えておかないと以下のような問題が生じる可能性がある
        • どこにシステムの改善点があるのか見えない
        • 効率が悪く、効率が低いデジタル投資を行ってしまう
        • 分析に使用するデータが、適切なシステムから発生したものなのかわからない
      • システム一覧と合わせて、システム間の関連がわかるようなシステムマップを作成する
    • データの把握
      • どのようなデータを保有しているか把握を行わないまま、デジタル化やデータ分析プロジェクトを始めてしまうと、以下のような問題が発生する可能性がある
        • 利用可能なデータに気づかず、分析の精度が落ちる
        • 必要なデータが後から発見され、追加の作業や修正が増加する
        • プロジェクトの立ち上がりに時間を要する
        • ステークホルダーとのコミュニケーションが困難となり、プロジェクトの進行に支障をきたす
第3章 データ分析チームの組成

目指す組織像:集計・可視化を中心としたデータに基づく議論・ビジネス提案ができる組織

  • 「データ分析」のメリット
    • 事実に基づく客観的な観点から意思決定ができる
    • 隠れた傾向やパターンを発見し、未来の動向予測や問題の早期発見ができる
    • 適切なリソース配備による業務の効率化や最適化ができる
    • 顧客ニーズや市場の動向を把握し、新規商品開発やサービス改善ができる
  • スモールスタートのメリット
    • 失敗や誤った方向性に進むリスクを最小限に抑える
    • 余分なコストをかけず、効率的なリソース配分ができる
    • 早期に成果を得られる
    • 意思決定やプロジェクトの改善が早い
    • 新しい技術やツールを試しやすい
    • 小規模プロジェクトで得た知識(技術や計画)を大規模プロジェクトに活用できる
  • 分析テーマの選定
    • テーマ選定で意識する観点
      • 目標と背景の理解
      • データの把握(存在するデータの状況と質や量)
      • 成功の定義
    • データ分析の効果を最大化するための、テーマ選定のポイント
      • 組織でのニーズの考慮
      • インパクトの大きさ
      • スキルや人員リソース
      • 自身の本来の業務に近い、もしくは同じジャンルのテーマ
  • ビジネスフレームワークの活用
    • ロジックツリー、3C分析、SWOT分析、カスタマージャーニーマップ/ファネル分析
  • 組織のタイミングごとの人員(p.105 図3.8)
    状況必要職種
    分析スタート時データエンジニアorウェブエンジニア
    データを理解して分析ができるメンバー
    BIツールを使用するときデータエンジニア
    データアナリスト
    アナリティクスエンジニア
    プロジェクトマネージャー
    データ活用できない部署、さらなるデータ活用推進データエンジニア
    データアナリスト
    アナリティクスエンジニア
    プロジェクトマネージャー
    データストラテジスト
    • データエンジニア
      • データ分析基盤やビッグデータwの扱いに詳しいエンジニア
    • データアナリスト
      • データ分析結果をビジネスに紐づける役割を担う
    • アナリティクスエンジニア
      • データエンジニアとデータアナリストの中間に位置するようなスキルを持ち、BIツールの活用に特化したエンジニア
    • プロジェクトマネージャー
      • プロジェクトの予算・進行・人員・課題管理などの役割を担う
    • データストラテジスト
      • 組織内でのデータ活用戦略の策定や実行などの役割を担っていることが多い
  • 筆者が経験することが多い、兼任担当者から専任担当者へ移行するプロセス
    1. データ分析業務の成果を確認
    2. データ分析業務の専任化を社内に周知
    3. 既存業務の引き継ぎや整理
    4. データ分析業務の整理(専任者の業務を検討)
    5. データ分析業務の目標設定や評価設定
    6. データ分析業務をメイン業務に変更
    7. データ分析業務の専任化を社内に周知
  • 専任化のメリット
    1. 決済を得るコツを学習することでプロジェクトの進捗がよくなる
    2. 経験が蓄積されることで、より専門的な分析ができるようになる
    3. 生産性が上がることで、ビジネス貢献のサイクルが増える
  • 分析したいデータのメモ
    1. 分析開始日付
    2. 分析完了日
    3. 分析テーマ名
    4. 分析内容(目的など)
    5. 使用データ概要
    6. 使用テーブル名とカラム名
    7. 分析結果
    8. 備考
  • 施策の効果を考えるうえで、5W1Hというフレームワークで考えると定量化で押さえておくべき観点が抜け落ちにくくなります

  • データ分析チームを待ち受ける問題(コラム)- 事業計画通り進まない - 他部署と連携できない - 他部署を説得できない - メンバーが定着しない
第4章 AI・データサイエンスの応用

目指す組織像:データサイエンスを中心としたデータに基づく議論ができ、AIモデルの実運用ができる組織

  • 統計・AIモデルでできること
    • 教師ありモデル
      • カテゴリに仕分ける分類モデル
      • 数値を予測する回帰分析
    • 教師なしモデル
      • 似たようなデータをまとめるクラスタリング
  • データ分析の標準プロセス
    • CRISP-DM
      • ビジネス理解
      • データ理解
      • データ準備
      • モデリング
      • 評価
      • 展開
  • 課題設定の進め方
    • ビジネス上で未来の状態がわかると嬉しいシーンを考える
    • そのシーンが誰によって嬉しいのかを考える
    • 未来の状態に基づいて実施可能な対策・施策などの具体的なアクションを考える
  • データサイエンティストに求められるスキル
    • ビジネス力
    • データエンジニアリング力
    • データサイエンス力
  • データサイエンティスト育成に関する観点
    • 必要なスキルの特定
    • 育成目標と方針の策定
    • トレーニングプログラムの作成
    • 実践的なプロジェクトの提供
      • R&D部門の取り組みとしては、論文を読み込み、自社のデータに適用した結果を発表してもらうのもよいでしょう

    • メンタリングとアドバイス
  • データサイエンティストを評価する観点
    • 技術的スキル
    • ビジネススキル
    • 成果
    • 教育や成長
    • プロフェッショナリズム
      • 個人情報保護法は3年ごとに改定される

  • 評価観点も定期的に改善する
    • 長く固定的な評価体系を使い続けることは論外ですが、短い期間での評価体系の変更も同様にアンチパターン

  • 線形回帰モデルの例
    • アイスクリームの販売個数予測
      • 過去の販売実績、気温といった過去のデータから、特徴量の重みを調整する(=モデルの学習)
  • 特徴量設計のポイントは、予測のもととなるデータが予測対象にどのような影響を与えるのかをイメージすること
  • 需要予測のようにユーザーの動きに関する予測をする場合は、カスタマージャーニーマップと呼ばれる方法を用いてユーザーの行動を時系列に並べて、その各ポイントでの行動をデータで表すことができるかを考えるのも有効かもしれません

  • モデルを評価するときに気をつける点

    設計・AIモデルを作成したら期待する精度が出ているか確認してからビジネスの現場で利用する。ビジネス上の課題に合った評価指標を選んで精度評価をする必要がある

  • 2種類のモデル評価指標
    • オフライン評価
      • すでに蓄積されたデータを用いて評価する
      • 差をそのまま足し上げると、差が正の場合と負の場合で打ち消しあってしまいます。そこで、差のままではなく、差を二乗したRMSE(平均平方二乗誤差)やMAE(平均絶対誤差)などの指標がよく使われます

    • オンライン評価
      • 実際のビジネスで得られたデータを使用して評価する
      • オンライン評価の2つの指標
        • オフライン評価で利用した指標をそのまま使って評価
        • ビジネス上のKPIが改善したかを評価する方法
  • ドリフト
    • データの分布が変わること
    • 例)新型コロナウイルスが流行する前後での人々の購買パターン
  • モデル運用の3つのポイント
    1. 入力データの変化
    2. モデルの性能劣化の検知(ドリフト検知)
    3. モデルの再学習
  • データ活用を行う際の組織構造(コラム)
    • 中央集権型組織
      • 特定のミッションを持った組織を1つ組成し、推進をまかせる
        メリットデメリット
        意思決定が人族に行えるデータに関する業務の依存度の高さによる遅延
        統一性や一貫性を保てる独自性の欠如
        セキュリティ組織のスケーラビリティへの影響
    • 分散化組織
      • さまざまなそしきの中に必要なスキルや能力を持った人員を意識的に配置する
        メリットデメリット
        参加と創造性の促進情報の断片化と整合性の欠如
        柔軟性と適応性セキュリティ
        制約の削減