Shoeisha Technology Media

IT人材ラボ

注目の特集・連載

データサイエンティストに必要な知識・技術とレベルに応じたスキルイメージ

  • LINEで送る
  • このエントリーをはてなブックマークに追加
2018/12/25 06:00

 前回は、データサイエンティストに関する人材像や役割、解決・高度化したいテーマなどを解説しました。今回はそれを踏まえ、データサイエンティストに必要な知識・技術を整理するとともに、データサイエンティスト各レベルのスキルイメージを説明します。実際には多岐にわたりますが、本稿では目標として分かりやすく使いやすいように、最小限にまとめてみました。

前回はこちらから。

データサイエンティストに必要な知識・技術

 人材像やチーム像が固まったら、実際に育成していくための知識・スキルマップをデザインしていく必要があります。

 身につけるべき知識・技術の具体的かつ仔細な内容は、データサイエンティスト自身に選択させるべきことではありますが、大枠を企業として持つことができなければ、育成計画そのものを作ることもできません。

 前回述べた、人材像・チーム像を固めるための考え方を理解していただければ想像しやすいかと思いますが、レベルや役割、テーマの組み合わせにより多種多様な「データサイエンティスト像」が成立するため、すべてを網羅する知識・スキルマップを記述することは現実的ではありません。

 そこで、「これからデータサイエンティストやデータサイエンスチームの育成を始めようとしている企業の多くにとって必要と思われる技術領域」という前提を置いて、データサイエンティストに必要な知識・技術を以下に紹介します。レベルは前回紹介した、データサイエンティスト協会の定義に基づきます。

Assistant Data Scientist:「見習いレベル」相当
ビジネス力
  • ロジカルシンキング
サイエンス力
  • クロス集計
  • 二軸の可視化
  • 仮説検定
エンジニアリング力
  • 構造化データ処理(SQLなど)
  • データクレンジング
  • データ加工(正規化・標準化)
Associate Data Scientist:「独り立ちレベル」相当
ビジネス力
  • 自社のKPIおよびKGIとの関係性理解
  • 自身のミッションとKPIとの関係性理解
  • 仮説の立案と分析プロセス設計
サイエンス力
  • 統計手法によるモデルの構築(重回帰、ロジスティック回帰)
  • クラスター分析(階層型/非階層型クラスタリング)
  • アソシエーション分析
  • 機械学習ライブラリを活用したモデルの構築(SVM、決定木、ニューラルネットワーク、LDA、word2vec)
エンジニアリング力
  • 非構造化データ処理
  • データベース構築
  • ビッグデータプログラミング
Full Data Scientist:「棟梁レベル」相当
ビジネス力
  • 自社企業のKGIに関する理解とデータで解決できる問題設定
  • プロジェクト管理
  • 事業への実装力
サイエンス力
  • 機械学習、統計モデリングの知識体系
  • 論文等による最新理論の理解と独自の実装
エンジニアリング力
  • データベースアーキテクチャ
  • クラウドシステムアーキテクチャ

 断腸の思いでかなり厳選しました。セルフマネジメントスキルなど、データサイエンティストか否かに関係なく社会人として必須となるものは省略しています。

 ここのスキルについて一つひとつ説明することは紙面の都合上困難ですので、次ページでざっくりと、各人材レベルのスキルイメージを説明します。

※この続きは、会員の方のみお読みいただけます(登録無料)。



  • LINEで送る
  • このエントリーをはてなブックマークに追加

著者プロフィール

  • 森谷 和弘(モリヤ カズヒロ)

    データ解析設計事務所 代表。大手SIer、金融工学のパッケージソフトウェア会社を経て現職。フリーランスのデータサイエンティスト兼データアーキテクトとして、データベース構築のコンサルティング、統計モデルの構築、機械学習アルゴリズムの開発、分析チームの教育・組成など「データ利活用の高度化」をキーワードに活動中。休日は渓流フライフィッシングで大自然と戯れる。

バックナンバー

連載:これからはじめるデータサイエンティスト育成
All contents copyright © 2017-2019 Shoeisha Co., Ltd. All rights reserved. ver.1.0