藤原:
CatDataにPyTorchで作ったモデルと同じデータセットを入れて、ニューラルネットワークを使ってモデルを作成してみたら、ほぼ同じ結果になりました。「おお!」と思いつつ、CatDataには他にどんなモデルがあるんだろう?と、種類を確認してみたところ、RandomForestやXGBoostなどがあり、おや?と非常に興味をひかれたんです。
決定木系とかやったことないけどどうなんだろうなぁと思いながら、試しにそのモデルにポコンとデータを入れてみたら、なんと95%以上の結果がでて、これはすごい!とびっくり。同時に、自分の視野が狭く、一点だけ見てあきらめていたということにも気づいたんですよ。最適なモデルはどれなのかを考える時に、CatDataなら気軽に複数のモデル比較ができるぞ!これは非常にいい!と感動したんです。
もちろん、更に深くやりたい人はPythonを使って細かくパラメータ調整をしていけば良いと思うんですが、まずはどのモデルを使えばいいか?をスクリーニングするツールとして、CatDataはとても使いやすいな、と感じます。
HNL:
そうですね。おっしゃる通り、ツールに手助けしてもらうことで、データを入れ替えつつ、手法を検討するのがとても楽になると思います。
藤原:
ユーザインタフェースがあれだけシンプルだと使いやすいですよね。とりあえず、やってみようか!というところが気軽にできるのは「入口」に向いているな、と。すぐになにか結果が見えると、人ってやる気が出るじゃないですか。
CatDataでの体験は、35年ほど前に私が初めてLotus1-2-3(1980〜90年代の代表的な表計算ソフト)に出会った時の感覚にすごく似ています。
私が会社に入った45年前はパソコンがまだない時代で、そのころは解析にFORTRANなどを使っていましたが、重回帰分析をするのは億劫で・・・。ところが、パソコンとLotus1-2-3の登場により、データ分析が気楽にできるようになりました。
そして今や、我々は、「Excelをつかえばだれでも気楽にデータ分析ができる」という感覚と同じように、「CatDataを使えばだれでも気楽にAIがつかえる」という世界への入口に立っているのでは?と感じています。そこからさらにどうAIを使いこなすはそれぞれですが、まずその機会を提供するということは、とても大きな意義があると思っています。
HNL:
バックグラウンドの違う、さまざまな人達が、だれでも気軽にデータ解析を試すことができる世の中になってほしいと、僕たちは願っています。
藤原:
以前、瀬々さんから伺った、「ギターをポロロンと弾いてみるような気持ちでAIに触れてみてもいいんじゃないか?」という例えが印象に残っています。いい例えですよね。データサイエンスをちょっとかじってみようかな?という感じで入れるのがCatDataだなと思いました。
HNL:
CatDataは、簡単にデータを見ることができるように、画面のデザインや操作方法を工夫しています。すぐヒストグラムを描けるようになっていたり、散布図で可視化する際は、どのデータをプロットした点なのか、カーソルを合わせればすぐにわかるように表示しています。
まず「やってみる」。そこから「やれそうなこと」が見えてくる。
HNL:
CatDataを開発する中で、僕たちはインタフェースをどう作ろうか、とても悩みました。ただでさえ複雑な機械学習の手順をシンプルに表現し、どこをおさえればみんなにデータの本質が伝わりやすくなるんだろう?と考えました。今、世の中にノーコードツールとして出ている機械学習系ツールは、どう見ても玄人向けです。値段も高い。それだけお金を出せるなら、プログラマーを雇えば良いのでは?と思うことも多々あります。
最近は、Pythonのライブラリもだいぶ充実してきました。多少プログラミングができる人であれば機械学習を行える世の中になったとは思います。しかし、機械学習をあまり知らなかったり、プログラミングを行うことができない人が使うものとしては、使いこなすまでにはだいぶ長い道のりがあるなと感じていました。そういった人たちが使ってみたいと思うツールにしたいという気持ちが強かったです。
実際に藤原さんにCatDataを使っていただいたお話を伺い、最小限の手数で機械学習ができる流れを実現できたようだ、と安心しました。
藤原:
データ解析の結果を簡単に比較できるってすごく大事です。
AIのモデルって色々あるじゃないですか。簡単なインターフェースで、クリックするだけでさまざまなモデルについて比較できたときは感動モノでした。中小企業のIT部門の人で、データサイエンスには興味があるけど、プログラミングはちょっと・・・なんて人に対して、CatDataを教えてあげたら喜んで使うんじゃないかな。
実際、比較的若い人は柔軟に新しいものに反応してくれることが多い気がしています。先日もあるクライアントでCatDataの話をしたら、自分でCatDataを試した後、XGBoostなどについて勉強して、次に会った時には「XGBoostやってみました!」と声をかけてくれたりすることもありました。嬉しいですよ、その時は。やはり、まず気楽に一歩踏み出せることが重要だなと感じています。
HNL:
IT部門にいらっしゃる方でもインストールなどにつまづくことはあると思います。頻繁にライブラリなどのアップデートがあるので、ちょっとした隙間時間に試してみたくても、インストールで詰まってしまい嫌になってしまうことは、僕たちでも多々あります。片手間にパパッとデータを入れて結果を出せるところがCatDataの良いところだと思っています。
藤原:
できたモデルを、実業務へ実装する段階に到達したら、会社の中で引き続き勉強して作っていくこともできると思いますが、ヒューマノームのメンバーがサポートに行って社員と一緒にやるとか、モデリングするリソースがなければヒューマノームのみなさんが請け負って進めていただける、とかそのようなことは可能ですか?
HNL:
もちろんです!皆様のフェーズに合わせて柔軟に対応いたします。いつでもお気軽にご相談ください。
「データサイエンスに興味がある中小企業」といっても、その特徴を一言でまとめることはできなくて、本当に千差万別です。社長さんがやる気があって声をかけていただき、現場の方々がどんなデータを出せばよいのかがわからない状態からスタートすることもあります。そこで当社は、何をしたいのかを考えていただく場をつくるために、CatDataの利用を提案させていただいています。
要は、とりあえずExcelにデータを入れてみて、何をしたいのかを考えてみる、という話とやっていることは同じです。データを触る機会を通じて「こういうことができそうだ」という感覚を掴んでいただくような、教育のところからお手伝いさせていただくこともありますね。
データドリブンな経営を絶対に諦めちゃいけない
藤原:
取得したデータは、必ずしもすぐに使えるとは限らないですよね。しかも使えるようになるまで、結構手間がかかる。以前、前処理をしたら半日以上かかりました。そのデータには欠損値や異常値がたくさん含まれていたので、そのまま機械学習にかけてしまうと、それらに引きづられていい精度が出ない。
データサイエンスは「データの料理」だと思っています。
データは「食材」。食材だけでは食べられないのと同じように、数字の羅列だけ見ていても何も語れない。これを下ごしらえのように、前処理したり判断できるように加工する必要があります。これが「料理」です。また、料理には和食や中華などがあるように、データサイエンスでも回帰分析や主成分分析、機械学習など様々な分野があり、目的に応じてそれぞれの習熟が必要となります。
最後の仕上げ部分も重要です。
上司に結果を持って行ってもわかってくれないと意味がない。これは料理と一緒で、全然美味しくなさそうな料理をだしても誰も食べてくれないのと同様に、「主成分分析やりました!」など、どんな手法を使ったのかだけを伝えたところで評価はされません。経営者に対して、その分析結果の戦略的な価値をわかりやすくきちんと伝える力がとても大事だと思っています。
また、食材と同様に、データにも賞味期限がある。アウトプットをタイムリーで出せるかがデータサイエンティストとしての使命だと考えています。
これらのデータの料理、つまりデータサイエンスに関しては、Excelが登場して以降どんどん身近になり、今やAIなどの高度な分野でもテクノロジーがユーザーに近づいてきてくれていると感じてます。だから中小企業の経営者の方々は、データドリブンな経営を絶対に諦めちゃダメですよ。諦めずにトライし続けることが重要です。自分は、そこの橋渡し的なお手伝いをしたいと考えています。
ヒューマノームのような、AIのハードルを下げていく技術は、料理の世界でいえばオートクッカーのような「調理のハードルを下げる技術」と同じだと思っています。CatDataのようなサービスが充実すれば、中小企業はもっと気軽にデータサイエンスと向き合うことができるはずです。
HNL:
「データサイエンスは料理」ってまさにそのとおりですね。通り一遍ではなく、その時の状況とか、お客様の雰囲気をふくめてきっちり仕上げていかないといけないという難しさはありますが、とてもやりがいのある仕事だな、と感じています。
藤原:
実際に業務をわかっている人間が基礎的なデータサイエンスやAIを勉強することで、実務への適用を加速させられると思っています。そこに、データサイエンスのディープな分野がわかる尖った人がアドバイスを担当し共に作業に取り組む、というのがDX推進の一つの理想像でしょうか。
HNL:
素材を作る人と料理する人がうまく分かれているような感じですね。
藤原:
最後になりますが、50年以上前アポロ11号に積んでいたコンピュータAGC(Apollo Guidance Computer)とiPhone11の性能の違いがどれくらいあるかご存じですか?
記憶容量差と演算スピード差を掛け合わせると、私の試算では1000億倍以上です。でも見方を変えると、昔のコンピュータはその程度の計算能力しかなかったのに、月まで人を送り込みました。高度な技術や、高性能な計算機だけが成功するポイントではありません。プロジェクトマネジメント力も非常に重要なポイントだと思ってます。
会社を変えるには、DXだけじゃなくチームワーク、人と人との繋がりといったアナログな面での変革、AX(アナログトランスフォーメーション)が何よりも大切だと思っています。AXとDX、つまり人と人とのつながりとデジタル技術は掛け算で、どちらがゼロでも答えはゼロになると考えています。チームの連携やマネジメントの重要性は昔も今も変わらないんじゃないでしょうか。
HNL:
デジタルだけで終わらないようにしていきたいですね。我々も人とのつながりを大切に、データサイエンス技術の普及に取り組んでいきます。
藤原:
みなさん頑張ってください。応援しています。