データサイエンティストはなくなる?噂の内容や求められることについて
AIやビッグデータ分析などが話題になることが増え、これらの開発や業務の中核を成す、データサイエンティストへの関心が高まっています。しかしながら、注目されている職業であるにも関わらず、データサイエンティストはなくなるのでは、といった情報も見受けられます。
この記事では、データサイエンティストがおこなっているデータ分析業務についての説明をしたあとに、なぜなくなると噂をされているのか、データサイエンティストを取りまく環境がどうなっているのかについて紹介しています。
-
Contents
データサイエンティストの主な仕事
データサイエンティストとは、データを収集・分析・解析し、企業のビジネスや研究などに役立つ情報を見つけ出し、課題解決や意思決定の補助あるいはそれらをおこなう職業です。この項では、データサイエンティストがおこなうデータ分析について細かくお伝えします。
-
データの収集
データの収集の前に、データ分析の目的や企業の課題、データ分析をすることでどのような効果があるのかの仮説を立て、目的を明確にする必要があります。企業はビジネスや日々の業務で大量のデータを保有しているため、目的を明確にしないと必要なデータを選定することができないからです。
そのような過程を経て、企業のデータベースやファイルサーバーなどはもちろん、WebAPIやスクレイピングという技術を利用してデータ収集をおこなう場合もあります。WebAPIとは、例えばAmazonや楽天などの最安値情報(データ)を別のWebサイトなどで利用することです。(AのプログラムをBのプログラムでも利用できるようにすることなど)WebAPIを利用してデータを収集分析し、価格動向などを調べることができます。
スクレイピングとは、Webサイトなどから情報を抽出することをいいます。スクレイピングをすることで、設定した情報を毎日受け取ることもでき、市場や顧客情報などのデータ分析をすることが可能になります。また、データサイエンティストはWeb APIやスクレイピングなどのシステムを開発することもあります。
-
データの整理・調整
データを収集して、すぐに分析に使えるわけではありません。なぜなら、整理や調整をしていないデータは、同じ意味なのに区分が違っていたり、全角と半角で表記がバラけていたり、破損していたり、必要なものが不足していたりするからです。それらを統一させ、データ分析に利用できる状態にすることを『データクレンジング』や『データクリーニング』といいます。
データ分析のもとになるデータの質が悪いと有意義な分析ができなくなってしまうため、この工程もとても大切なものになります。また、機械学習モデルを作成する場合も整理・調整したデータが利用され、データの質が悪いと作成するモデルの質まで悪くなるため注意しなくてはなりません。
-
データの分析・解析
分析と解析は判別のつきにくい単語ですが、デジタル大辞泉では以下のように説明されています。
・分析……複雑な事柄を一つ一つの要素や成分に分け、その構成などを明らかにすること。
- ・解析……事物の構成要素を細かく理論的に調べることによって、その本質を明らかにすること。
データに対してこれらを当てはめると、分析は『データがどのように構成されているかを明らかにする』こと、解析は『データがなぜそのようになっているのかを明らかにする』ことであるといえるでしょう。
データサイエンティストの業務では、データ分析の結果をクライアントに伝えるだけのこともありますし、データを解析し、課題解決案を提言することもあります。そのため、数学や統計学、機械学習などのデータに関する知識だけでなく、クライアント企業の特徴や業態などに合わせたデータを解析し、適切な助言をするビジネス力も必要です。
-
データサイエンティストが無くなると噂される理由
データサイエンティストは需要が増してきているという情報もありながら、ブラウザ検索で【データサイエンティスト】と検索をした際に、サジェストキーワードで【なくなる】が出てくることがあります。なぜそのようになってしまうのでしょうか? ここでは、データサイエンティストがなくなると噂されてしまう理由について説明します。
-
進化するAI技術
シンギュラリティ(技術的特異点)という言葉を聞いたことがある方もいらっしゃると思います。シンギュラリティとは、コンピューター(AI|人工知能)が人間の知能を超える臨界点という意味の言葉です。
シンギュラリティは2045年に起こるという説が最も有力とされているようですが、そのような予測ができるほどに、AIの技術は進歩してきています。そのため、データ分析についてもAIがおこなうようになる=データサイエンティストの業務がなくなる、という考えが生まれていると推測されます。
-
職業の細分化
- エンジニア職種は細分化されてきた歴史がある
IT業界の技術は年々進化しており、システムや求められるものが複雑化するにつれて、特定の業務をおこなう専門職が生まれてきた経緯があります。かくいうデータサイエンティストも、2008年頃にデータアナリティクス業務をおこなっていた人たちが自らをデータサイエンティストと名乗り始め、一般に浸透していった職種です。
また、iPhoneから始まったスマートフォンの普及により、UI/UXが重要なものとして認知され、専門職であるUI/UXエンジニアが誕生しています。これらのような歴史から鑑みると、データサイエンティスト業務もより細分化され、データサイエンティストという括りが消滅するのでは?という見方もあるようです。
- データサイエンスに関する職種はすでに細分化されている
データサイエンティストがおこなっている業務を個別に見ていくと、データの整理・調整は『データエンジニア』、機械学習モデルの構築は『機械学習エンジニア』、データ分析・解析は『データアナリスト』と、すでに専門職といえる職種が存在しています。
しかし、データサイエンティスト協会によってデータサイエンティストの定義は公表されていながらも、データエンジニアやデータアナリスト業務を指してデータサイエンティストとして認知されている場合もあり、雇用する企業と労働者側でスキルのミスマッチが発生するケースがあります。そのような理由から、企業側も今後はより厳密に、求めているスキルを指定するのでは?と予想することもできるでしょう。そのため、すでに個別の職種があるデータサイエンティストの業務は、最終的により専門性の高い職種として独立していくのでないか、といった見方が多くなっています。
※参考:2021年度スキル定義委員会活動報告 2021年度版スキルチェック&タスクリスト公開
-
スキルが低い人材の淘汰
ビッグデータやディープラーニングといったデータサイエンスに関する言葉が一般化され、データ分析の有用性も広く認知されてきています。そのため、データサイエンティストの需要が高くなっている状態は続いていますが、幅広い業務に対応できる、高レベルなデータサイエンティストは少ないというデータがデータサイエンティスト協会の資料で発表されています。(※1)
その状況を裏付けるかのように、同資料ではデータサイエンティストの育成に力を入れている企業や組織の増加、データ分析の学習をしている人やスキルアップに取り組んでいる人も増加傾向にあると報告されています。そのような理由から、高レベルなデータサイエンティストが増加し、スキルが低い人材は淘汰されるのでは、という考え方もあるようです。
(※1)下記にある関連記事の目次【5.2統計学・機械学習の知識】にて、データサイエンティスト協会の資料をもとに高レベルなデータサイエンティストが少ないという情報をまとめています。ぜひともご確認ください。
※関連記事:データサイエンティストの平均年収と必要なスキルとは?
-
データサイエンティスト育成の動き
内閣府が策定した『AI戦略2019』という将来指針では、『数理・データサイエンス・AI』をデジタル社会の『読み・書き・そろばん』とし、すべての国民にその基礎力を育むと記載され、これらはデータサイエンティストに関わる内容と密接に関わっています。また、実際にこの目標は『AI戦略2022』で『「数理・データサイエンス・AI教育プログラム認定制度(リテラシー レベル)」の開始(2021.8までに78件認定)』と記載があり、国がプログラムの認定制度を進め、人材育成に力を入れていることがわかります。
さらに、2017年に日本で初めてデータサイエンス学部を設立した滋賀大学を皮切りに、国立大学や私立大学でデータサイエンス学部が増加してきています。また、総務省統計局は、無料でデータサイエンスが学べる講座を開講しています。これらのように、データサイエンティスト育成の機運は高まってきており、上述してきたような噂はあるものの、データサイエンティストがすぐになくなるとは考えにくいといえるでしょう。
※参考:AI戦略 2019 【概要】
-
データサイエンティストに必要なスキル
データサイエンティスト協会ではスキルチェックリストにおいて、データサイエンティストに必要なスキルを『ビジネス力』、『データサイエンス力』、『データエンジニアリング力』の分野に分けて定義付けをしています。こちらに関しては下記の関連記事にて詳しく説明をしておりますので、ぜひともご確認ください。
※関連記事:データサイエンティストとは?業務内容や必要なスキルセットを解説
-
分析やモデル開発以外に行っている業務
データサイエンティストはデータ分析や機械学習モデルの開発以外にも、関連業務として会議の取りまとめやコンサルティング業務をおこなっています。また、データ分析業務では、プロジェクトとしてチームで担当することが多くなっているため、データサイエンティストとデータエンジニア間の調整などをおこなう場合もあります。
-
データサイエンティストを取りまく環境
データサイエンティストの需要、AIとの関係、活躍しやすい体制について説明をします。
-
データサイエンティストの需要は増加中
一般社団法人 データサイエンティスト協会 調査・研究委員会は、2022年3月に『データサイエンティストの採用に関するアンケート』を公開しました。こちらの資料では、1年でデータサイエンティストを増やした企業が41%、データサイエンティストを目標通り確保できなかった企業が62% 、データサイエンティストがいる企業の30%はデータ分析業務の一部を外部委託しているという結果が発表されました。
これらのような理由から、データサイエンティストの需要超過が数年は続くと考えられます。また、下記関連記事の【2.年収UPは見込める?データサイエンティストを募集している業種】の項目で、需要増加についてより詳細に説明をしています。よろしければご確認ください。
※関連記事:データサイエンティストの平均年収と必要なスキルとは?
-
AIの活用はこれからの課題
データサイエンティストの業務で多くの時間を費やすものはデータクレンジング作業になっており、この工程を自動化するAIの開発はできていない状況です。そのため、データの整理・調整をおこなっていない『生データ』をデータ分析に適した形に整え、そのまま分析をするAIはまだ存在していません。これらの理由から、AIを利用したデータ管理は進化しているものの、データサイエンティストに取って代わるような状況にはまだいたっていません。
-
データサイエンティストが活躍しやすい体制とは
データサイエンティストが有益な情報を見出しても、その情報を活用しなければデータ分析の価値がなくなってしまいます。経営者やビジネスマンが培ってきた勘や経験だけでなく、データに基づいて意思決定をする方法のことを『データドリブン』といい、近年ではデータトリブンに対する理解や取り組みも重要な課題のひとつになっています。
データサイエンティスト協会 調査・研究委員会が2021年4月に公開した資料によると、経営層や他部署のデータ分析・解析に関する理解は上昇しているものの、依然として理解されないことに対する不満を持っているデータサイエンティストがいるようです。
※参考:データサイエンティストのリアル
データ分析・解析に理解がないという状況は、データサイエンティスト側にも問題がある可能性はあります。しかしながら、データという客観的な証拠に基づいて行動することができないと、多様化・複雑化する顧客ニーズや顧客行動に対応することができなくなる可能性もあります。そのため、経営者や上司、関連部署などにおけるデータ分析に対する理解、データが重要であるということを周知し、データサイエンティストが活躍しやすい体制づくりも必要です。
-
データサイエンティストとして生き残るために
データサイエンティスト協会の発足、大学のデータサイエンス学部の創設、政府主導の無料講座など、データサイエンティストの人材育成は充実してきています。しかし、それゆえにデータサイエンティストを目指す方が増え、競争が激しくなっていく可能性も無視できません。
そのため、データサイエンティストとしてのスキルアップを図るために、日々の研鑽を積むことが重要になります。特にエンジニア業界では、日進月歩で技術が発展していくため、新しい情報をキャッチアップし、自身でアウトプットをすることが大切です。
株式会社レッジが運営する『Da-nce』というデータサイエンス専門メディアでは、データサイエンティストに対してのインタビュー記事が掲載されています。その記事から、第一線で働いているデータサイエンティストが、データサイエンスの論文や書籍で勉強を続けている様子を窺い知ることができますので、ぜひとも参考にしてみてください。また、実際のデータサイエンティスト業務についてもイメージしやすい内容となっていますので、その点についてもご一読をおすすめします。
※参考:22社、52人のデータサイエンティストに聞いてみた!「どんなお仕事してますか?」(『Da-nce』は2022年6月16日に更新休止とされていますが、2022年10月現在では閲覧可能です。)
-
まとめ
AI開発が進むことによって、データサイエンティストがなくなるという可能性を完全に否定することはできません。しかし、現在の状況から鑑みるに、すぐにそのような状況になるとは考えづらく、今後も数年は需要超過が続くだろうと予測することができます。
また、データサイエンティストの育成が充実してきていることから、競争が激しくなることも考えられます。そのようになった際に対応できるよう、自己研鑽を続けていき、データサイエンティストとして求められる人材になるよう努めて行きましょう。