データサイエンティスト"だけ"かき集めた日本企業の末路
AI がピークを迎えて幻滅期に入るらしい、っていうガートナーの記事がそこらで話題になってるけど、じゃあなぜそうなったのか、そしてその先にどうなるのかってのを考えた。
すでに同じテーマの記事を俺なんかより賢い人たちが色々考えて書いてるのになんでわざわざ自分なんかが考える必要があるのかっていうと、一応自分の仕事やキャリアにも影響する話だから。
あとは、データサイエンティストとデータエンジニア(大規模データを扱うシステムを構築したり運用したりするエンジニア)の立場では当然意味合いが変わってくるはずで、データエンジニアを自称してる自分にとってどういう意味があるかってのは別で考えなきゃいけない。
金が関わってくる話だから。金が関わる話はかなり真剣なんで、俺。
例のごとく占いコーナーだと思って読み捨ててくださいませ。
ここ1年ぐらい世に多数出回った「AIのPoC案件」の実態
フリーランスをやっていると、登録してるエージェント等から色んな案件情報が流れてきたりする。
ここ1年ぐらいはAI(機械学習、データ分析)の案件が多く出回ってたわけだけど、その中でも「AIのPoC案件(試しにどんなもんかやってみよう!的な案件)」がかなり目についた。
後出しで書くのもあれだけど、その類の案件情報を眺めていれば、ガートナーが発表した通り企業がそう遠く無い先にAIとやらに幻滅することになるだろうことは普通に予想できた。
まあ幻滅の仕方にもバリエーションがあるわけだけど、大半は思いつきレベルのお遊び企画で、コンセプトも方針もあやふやな状態で走り出したはいいものの、自分たちじゃ何もできないからコンサルやSIベンダに丸投げ。
で、コンサルやSIベンダにいいように吹かされて、PoCという名の大人のおもちゃに大金を課金させられ、半年もするとグズグズになって「あれ?俺たち何やってたんだっけ? ここドコ?」って目が覚めて離散するハメに。
成果らしい成果は残らず、金だけが消えていきました、ってオチ。
これが、フリーのエンジニアという商流の末端にいる僕のところにここ1年ぐらいたくさん流れ付いてきた「AIのPoC案件」の実態と、結末なんだろうと思って、絶対に関わらないようにしてきた。
PoCというワードが付いて、フリーのエンジニアのとこに流れ付いて来る時点でほぼ地雷確定だから。
まあ自分の狭い観測範囲に基づく想像と、他の人がネット上で書いてる内容等からの推測で書いてるから実際のとこは知らないけど、たぶん大方当たってるんじゃないのかな。
それでもAIの仕事が増えているのはなぜか
よく分からないPoC案件に興じてた企業の多くが大した成果も挙げられずAIに幻滅したであろう一方、例えば以下のようなケースもある。
元々データの利活用がある程度業務プロセスに組み込まれていて、その中でAIによるさらなるデータ活用推進のための効果検証をしようと試みてたり、あるいは明確な課題があってそれは明らかにAIで解くべき課題なんだけど、そもそもデータが無かったりデータを入れる箱が整備されてなかったりとかで頓挫するケース。
これも最近話題になってたね。
AI、データ不足6割 「動かない頭脳」続出の恐れ :日本経済新聞
つまり、お遊びでやってましたってパターンと、実際に必要だからやりたい or やろうとしたんだけどそもそもAIやるための環境や準備が全然できてなかったわってパターン。
このケースの場合、当然次に来る話としては「じゃあデータちゃんと整備しないと」って展開でしょう。
そもそも俺たちに必要なのはデータサイエンティストだったのか?と。
というわけで、データ基盤や分析基盤を整備するための仕事は今着々と増えているし、今後も当面増えていく。確実に。
その証拠に、ITベンダ最大手のNTTデータと野村総研が数ヶ月前からデータエンジニア募集し出してきてるしね。
まあ募集するのは言いんだけどさ、頼むから下請けに丸投げとかすんなよ。。
データ基盤作るのに上流と下流で分業するとか絶対失敗するから。
データサイエンティスト”だけ”かき集めた企業の末路
ということでようやくタイトルにつながるわけだけど、「AIやろうとしてデータサイエンティスト集めたけどデータなかったし環境もなかった!」って話も、これはこれですごくマヌケなわけですよ。
1年くらい前から日本の大企業がデータサイエンティストを大量に採用、育成するみたいなニュースが定期的に話題になってたりしてたわけだけど、一方でデータ基盤作ったりデータの統合を推進するPMやらは全然募集してる気配ないわけ。
データサイエンティスト”だけ”かき集めてどうすんの?って結構前から意味不明に思ってたんだよね。(実際にかき集められたかどうかは知らんけど)
優秀なレーシングドライバー大量に採用したけど肝心の車が無い。あるのは50ccの原付1台あるだけ。
車を作るエンジニアがいない。
ってかドライバーにレーシングカー作らせちゃえばよくね?
みたいなノリだったから。
前にも書いたけど、「データサイエンティスト募集!!」って求人の歓迎要件にしれっと「Hadoop等のデータ基盤構築の経験」とか書いてあるパターン、かなり見かけたからね。
随分と舐められたもんだよな。
ってかデータサイエンティストにも失礼だしな。
そんな舐め腐った日本企業共はこれ読めや、と言いたい。
IT業界で平均年収の高い職種はソフトウェアエンジニアリングマネージャ、データウェアハウスアーキテクト、ソフトウェア開発マネージャなど。米Glassdoor - Publickey
Glassdoorの求人情報においてもっとも平均年収の高い職種は「Software Engineering Manager」で平均が16万3500ドル(1ドル110円換算で1798万5000円)、次が「Data Warehouse Architect」で15万4800ドル(1702万8000円)、そして「Software Development Managerの年収15万3300ドル(1686万3000円)が続きます。
君らがデータサイエンティストを採用すれば勝手に付属してくると思ってた”おまけ”は、この記事の中の区分で言う「データウェアハウスアーキテクト」だよね?
いいか、なんでこんな高給なのかというとだな、アメリカだからとか、需給バランスの問題とかが当然でかいわけだけど、それに加えて、そもそもが難易度高くて、広範なスキルが求められて、やりたいやつも出来るやつも少ねー仕事だからだよ!! クソが。
前に書いたやつ。
データエンジニアに要求されるスキル一覧 - データエンジニアの日記
ちなみに上記に書いたのはあくまで技術的な要素のみで、実際はそれに加えてかなりのプロジェクトマネジメント能力が求められる。
なぜなら、関わる人や連携するシステムやらユーザーやら利害関係者がたくさんいて、すごく複雑な条件下でお客さんやエンドユーザーの要件を取りまとめて、方針や優先順位を決めて、妥協点を探って、時には説得して、システムに落とし込んでいかないといけないから。
何かのサブタスクとして片手間でこなせるような軽い仕事じゃねんだよボケ。
おい、聞いてるか?お前のことだN◯C。
とか言って実際に求人のURL貼り付けて引用してやろうと思ったけど、面倒臭いことになったら嫌だから止めといた。
色んな人がすでに言ってるかもしれないけど、個人的な現場感覚から言っても今現場で一番必要なのは、まさに上で挙げたデータウェアハウスアーキテクトとか、データアーキテクト、データ統合推進マネージャーとか、そういうデータ利活用のための施策を立案したり指揮できる人間だと思うんだよね。
機械学習ゴリゴリに実装して最適化するような技術屋じゃなくて、機械学習を多少理解してるエンジニアリングマネージャー的な立場の人間。
その中でも特に今は基盤を整備していかないといけないフェーズだから、データエンジニアリングマネージャーが引く手あまた。
日本の大企業はそういう人間を高い金払って直接採用すべき。
というわけで、データエンジニアのPR記事でした。
以上。