エンドユーザー(企業の利用部門)が自分でデータ分析をするためのBIツールである「セルフサービスBI」で、機械学習の活用が始まっている。エンドユーザーは専門家であるデータアナリストに比べると、システムや分析に詳しくない。これを補うように、機械学習が専門家の知識やノウハウを肩代わりするのが、セルフサービスBIの新しい流れだ。米タブロー、米クリックテックといった代表的な企業が動き始めた。

 「セルフサービスBIの活用には、大きく二つの課題がある」。タブロー・ジャパンの並木正之テクノロジーエバンジェリスト シニアセールスコンサルタントはこう打ち明ける。一つめはデータを分析に使える状態にする「データの準備」に手間が掛かること。二つめは、どういう分析を実施してどう見せるのが効果的なのか、その判断にノウハウが必要なことだ。

 これらの課題を解決するのが、セルフサービスBIに搭載される機械学習を活用した新機能だ。データの準備でも分析でも、関連するデータを“発見”する必要がある。現在では、データアナリストが専門知識とノウハウに基づいてそれを行っている。機械学習を搭載したBIツールが専門知識を補うような働きをすれば、エンドユーザーによるセルフサービスBIの利用のハードルはさらに低くなる。

タブローが最新版に機械学習を搭載

 米タブロー・ソフトウエアは2017年6月1日に発売したセルフサービスBIの最新版「Tableau 10.3」に、「表と結合のレコメンデーション」という機能を搭載した。この機能では、データの準備を機械学習技術が支援する。

 データ分析では、製品の引き合い状況や顧客の問い合わせ件数を時系列や地域別に調べたりする。しかし、「データウエアハウスに格納されている表から、分析に使えるデータを準備するのに一苦労する」(並木テクノロジーエバンジェリスト)。

 例えば、商談データの表と製品マスターの表を結合しないと、製品の引き合い状況を分析できるデータにならない。ところが、データウエアハウスに何百もの表が格納されていたり、結合のキーとなる列名が表ごとに異なっていたりする。

 表と結合のレコメンデーション機能を使うと、よく分析に利用されている表をBIツールが自動的に推奨する。ある表を指定すると、今度は結合を推奨する表を提示する。内部結合、左外部結合、右外部結合、完全外部結合といった結合の方法や、結合に利用するキーも自動的に発見して推奨する。

データウエアハウス内でよく使われている表を推奨(左側)
データウエアハウス内でよく使われている表を推奨(左側)
(出所:タブロー・ジャパン)
[画像のクリックで拡大表示]
表を選択すると結合を推奨する表を表示(左側)
表を選択すると結合を推奨する表を表示(左側)
(出所:タブロー・ジャパン)
[画像のクリックで拡大表示]
結合方法とキーを自動的に推奨する
結合方法とキーを自動的に推奨する
(出所:タブロー・ジャパン)
[画像のクリックで拡大表示]
三つ以上の表の結合を推奨する場合もある
三つ以上の表の結合を推奨する場合もある
(出所:タブロー・ジャパン)
[画像のクリックで拡大表示]

 この推奨は、社内のデータアナリストが過去の分析で利用した表と結合に基づく。つまり、データアナリストのデータ準備のノウハウをほかの利用者に「推奨」という形で提供する。