新製品「dataExpress」リリース記念 開発者インタビュー プロダクト開発部 齋藤さん・市原さん | | DataVehicle

コラム

新製品「dataExpress」リリース記念 開発者インタビュー プロダクト開発部 齋藤さん・市原さん

株式会社データビークルが11月にリリースした新製品「dataExpress」。
その開発者である株式会社データビークルのプロダクト開発部 齋藤さんと市原さんに、開発までのストーリーや従来のデータプレパレーションツールやデータマートとの違い、さらに今後の追加予定までお伺いしました。

分析前の問題をデータの安定供給で解決する

なぜ「dataExpress」を開発することになったのか、きっかけを教えてください。

市原:現在は新製品「dataExpress」の企画と開発を専任でしていますが、元々私と齋藤さんは、分析コンサルタントでした。
データビークルの分析コンサルタントは、データのアセスメントから分析の設計、実行、その後の分析レポーティングを実際に行うなど、お客さんと伴走していく役割です。
常にお客さんの分析の最前線で仕事させて頂き、これからデータを使っていきたい方、すでにデータを使っている方など、色んなお客さんと相対してきたのですが、そのほとんどの現場で分析用データの供給体制が整っていませんでした。

少し具体的な話をすると、社内に散らばったデータをDWHなどに集約するところはSIer企業などに依頼してある程度進んでいたとしても、そのあと実際分析にかけるための最後のデータ加工には良い仕組みが存在していないことがありました。そのほかにも、最終的に分析を行う担当者が各々DWHなどに集約されたデータをなんとか自分たちでExcelのVLOOKUPを用いて繋げたり、現場部門とシステム部門で衝突しながらもシステム部門に出してもらったり、システム部門でも加工するには手に余るという感じだとシステム部門経由でSIerに外注したり…なんとかあの手この手で各々頑張っている、という供給体制でした。
このような状況だと、時間やお金が非常にかかる上にクオリティが安定しない、さらに分析プロジェクトを始める時にはデータの準備だけで1か月かかってしまうなんてことはざらにあるんです。
それだとタイムリーな分析のタイミングを完全に逃してしまいます。例えば3カ月のプロジェクトで1か月もデータ準備に使ってしまうと、肝心の分析や洞察、それをもとにした施策立案に満足な時間を使えないままタイムオーバーになってしまう。
分析コンサルタントの立場ですが、分析以前にこの状況はかなり根深い問題という印象でした。
我々が分析のためのデータを安定供給するような仕組みを整えることがこの問題の解決になるんじゃないかと、私も齋藤さんも考えていたことがきっかけですね。

齋藤さんはいかがでしょうか?

齋藤:私は元々、分析コンサルタントの他にもdataDiverの分析部分に関するエンジンを作るなど、エンジニアの部分も担当していたのですが、dataDiverは裏で“業務用データを分析用データに変換する”という、実はすごい機能があります。
ここはdataDiverを開発する際に苦労して作ったポイントだったのですが、ユーザーから見るとデータが変換される過程はブラックボックスになっているし、あくまでもデータ分析ツールですので、ユーザーが自分の仮説に従って自由に変数を入れたり出来ず、以前よりもったいないと感じていました。
そこで先ほど市原さんからあったようなお客さんの課題をコンサルタントとして感じた時に、dataDiverの隠れたこのすごい機能を使って、もっと柔軟に簡単にユーザーが活用できるツールがあるといいのではと考え、それがdataExpressの開発に繋がりました。

現場が自分で望み通りの形に仕上げて完成させる

他社の製品、従来の製品との違いについて教えてください。

齋藤:既存製品との一番の違いは、「データ加工の工程と完成形のデータセットを最初に示す」ことです。
私もこれまでユーザーとして既存製品を使ってきましたが、結局プログラムをかける人じゃないとどういうことが出来るのかわからないことが多いんです。

例えばレゴブロックで何かを作る時に、最初から作りたいものの完成形をイメージ出来る人は、どんなブロックやパーツが必要なのか、どういう手順で作ればいいかを分かった上で作り始めることが出来ますよね。
でもあまり知らない人からすると、完成形に至るまでの工程がわからないから、どんなブロックが必要になるかもわからない。なのに、ただ色んな形のブロックがありますよ、便利なパーツもありますよ、という部分を提示だけされても困るようなイメージです。

同じように、既存製品だと完成形がイメージ出来るのは知見のある人だけなので、知見のある人にしか使えない、データを使いたい現場の皆さんからすると最終的にどういうデータセットを作ればいいかがわからないので目標からの逆算ができない、というのが既存製品の一番の課題でした。

▲データをアップロードするだけで基本的な加工を自動で実行

齋藤:dataExpressは最初にデータを自動生成することで、完成形をイメージさせます。
そこからさらに自動生成されたデータを手動でカスタマイズできるのですが、生成されたデータに、こんな列も欲しいなど思ったデータだけを少し追加するというハードルの低い作業なので、現場の皆さんが自分で完成形をイメージしながら最終的な望み通りの形に仕上げていくことができるのです。
どのようなデータセットが出来上がるのかを最初に示すことでデータ加工の時間短縮ができるので、ユーザーが自分の仮説を立てるところや分析自体に集中できるようになっています。

この自動実行は従来製品にはないポイントになりますが、同時に最も苦労したポイントでもありますね。
お客さんのデータセットにはいろんなタイプがあるので、従来の他社製品では個別に集約変換をすることはできても、この手順に従えばどんなデータセットも出来ますよというのはないんです。お客さんのデータセットを自動生成する為にはいくつかのパターンに落す必要があり、その落とし込みには苦労しました。

データ加工ツールに革命を起こしたと言われたい

市原:この“自動生成”と“手動カスタマイズ”の部分で、実はもうひとつ他のツールと違うポイントとして、dataExpressには啓蒙的な側面があると思っています。
dataExpressの初期コンセプトとして、「リテラシーの低い人でも扱える、分析用データを自動生成して必要なタイミングで供給してくれるツール」がありました。
自分や齋藤さんのようなデータサイエンティスト達は分析用のデータを作るにあたって、分析の目的が決まればこういう加工をすればよいという、分析データ加工の“型”があることを知っています。
一方で多くのお客様は、そもそもどういうデータを準備すればいいかわからない状況にあります。
そこでデータサイエンティストにデータ加工の“型”があるのなら、その“型”通りに動くシステムを作れば、データ加工の自動化が可能になり、データサイエンティストではないビジネス分野でデータを活用しようとしているマーケティングや経営企画などの方々に扱ってもらいやすいツールが出来るのではないかというアイデアが着想としてありました。

▲柔軟な加工もノーコードで実現

市原:そこでdataExpressを作るにあたって僕らデータサイエンティストの“型”を体系化し、それをUIに落とし込むことで、自動化と柔軟性のバランスを実現しました。
そしてこの“型”はデータサイエンティストが分析用データを加工する際のアプローチを磨き上げて体系化したものなので、お客様はそれが落とし込まれているdataExpressを操作して慣れていく過程で、プロのデータサイエンティストの加工に対するアプローチみたいなものが自然に身につくはずです。リリース前(2023年10月時点)なのでまだあくまでも期待になってしまうのですが、それによりリテラシーの向上したdataExpressユーザーたちが、今後現場や会社全体のデータ活用を推し進めていくムーブメントみたいなものをうみ出せるようなツールに仕上がっています。

特に力を入れたところや苦労したところはありますか?

齋藤:UXを重視したツールの選定ですね。
実は分析用データセット加工ツール自体は30年前からあります。
だけどそれは現状ほんの一部の人しか使えない。なぜなのかを考えた時に、UXの観点でユーザーがストレスなく使える、専門家ではない現場の人が使えるということが大事だと考えました。
例えば速度を重視しduckDBを使用したり、AWSの機能を利用してサーバーレスで提供したりと、あえて今から新たなデータセット加工ツールを出すからには、機能はもちろんですがUXやUIの面でバックエンドのツールにも力を入れました。

市原:同じく製品のUXですが、齋藤さんはバックエンド側から見た時の整合性なのに対して、僕はユーザーストーリー側から見た時の整合性ですね。
今回想定した顧客像やユーザー像に整合するコンセプトやUI、UXをゼロから作るというところに一番時間と労力を割いてきたし、時には激しい議論も展開しながら、作って壊してを繰り返してきました。
苦労したところでもありますが、反面かなり良いものが出来ました。データ加工ツールに革命を起こしたと後々言われたいと思うくらい、UXは自信のあるものになっています。

先ほどの齋藤さんの話でもありましたが、マーケットにはすでにデータプレパレーションツールという分析用データの加工ツールは存在していますし、私たちが企画し始めた時にももちろんすでに存在していました。
ですがそれらは、私たちの得た「多くの顧客が目当ての分析を行うためにどのようなデータを準備すれば良いかがそもそもわからない状況にある」というインサイトを考慮すると、「必要とするデータに向かってひとつひとつ加工を重ねる」という操作自体がそもそも難しい方たちにとっては存在していてもいないのと一緒で、ソリューションになり得ないと考えました。
なので我々が作ったツールは極端な話、何かに向かって作業を重ねるというのが一切不要ですというところがポイントになります。

単なる時短やコスト削減ではなく、本来の目的に当たり前にリソースをかけられるように

▲スケジュール機能によりいつでも最新の分析やレポートにアクセス可能、データ準備ではなく分析結果の洞察や施策立案に時間を割ける

dataExpressの導入によって実際のお客様にはどのようなメリットを感じていただけますか?

市原:メリットとしては直接的なところで言うと、最初にもお話ししました分析用データの準備に付き物だった時間やお金、コミュニケーションの大きなコストと、データの品質問題の解決です。
ただそれを通じて私たちが実現したいものは、「単に時短になることやコスト削減できるということではなく、それにより本来の目的である分析、結果の洞察や施策立案をやりたいと思ったその瞬間に、タイムリーに、かつそこにしっかりと時間をかけるためのリソースの確保が当たり前にできるようになること」。これが本当に提供したいものです。

齋藤:もうひとつのメリットとして、SIerの視点があります。
最初にデータ準備をSIer企業に外注しているという課題をお話しましたが、SIerに外注すること自体は決して悪ではないです。
むしろdataExpressはその依頼されている側であるSIerにこそ使ってもらいたい製品です。
SIerの方でも分析用データに対するリテラシーが必要であったり、都度SQLを書いたりするコストはそれなりにかかってきます。
SIerが自分たちの提供するソリューションの中でdataExpressを使用することによって、より短い時間で、より速くタイムリーにデータを提供できるようになります。
私自身もコンサルタントとしてデータ整形のお手伝いをしていますが、どうしても生じてしまうようなパターン化しているミスが減りますし、これまで1日かかっていたデータセット加工が1時間で出来るようになります。かなり大きな差ですよね。
これにより競争力も上がり、もちろん収益向上にも繋がります。

今後予定しているアップデートなどはありますか?

齋藤:追加機能の目玉は集計機能(サマリ機能)を予定しています。
例えばリピート率や購買金額をアウトカムと関連する要因として、なにが重要なのかを一覧で出すことが出来ます。
BIだけではなかなか出すことが出来ない分析に特化したクロス集計を出すことが出来るので、最終的にはdataExpressだけでも完結するような機能の追加を予定しています。

最後にこれから利用いただくユーザー様に向けて一言お願いします。

市原:dataExpressは現場のデータを活用したいという思いと、一方でそのためのデータがうまく準備できないという苦悩…そのギャップを埋めるために作りました。
現場の人たちにとって本当の意味で使いやすいものになっているので、分析用データの準備に困っているお客様はまず一度使ってみてもらえると嬉しいです。

齋藤:データからインサイトを導くだけでなく、様々な専門性を活かしたツールを作っていきたいと思います。

最後までお読みいただきありがとうございました。

dataExpressにご興味がございましたら以下のお問い合わせ、もしくは担当営業までお気軽にお問い合わせください。
お問い合わせ:https://www.dtvcl.com/contact/
メール:mail@dtvcl.com
製品ページ:https://www.dtvcl.com/product/dataexpress/

データ分析や活用、DX推進に関するお悩み、弊社製品の機能についてご興味のある方は、お気軽にお問い合わせください。