ユーザーインタビュー|DSマインド代表・藤原 真一様
このページでは、Humanome CatData(以下「CatData」)を実際にお使いいただいているユーザーの皆様へのインタビューをご紹介します。使ってみてどのように感じたか? など、率直な意見やご感想についてお伺いしています。
ご利用をお考えのお客様の参考になりますと幸いです。
藤原 真一様
DSマインド 代表
1978年 東京大学法学部を卒業後、新日本製鐵(現:日本製鉄)へ入社。1987年 John F. Kennedy School of Government, Harvard University, Master of Public Policy 修了。2013年より新日本製鐵常務執行役員、2015年より新日鐵住金エンジニアリング代表取締役社長、2020年より日鉄エンジニアリング相談役。2022年に相談役を退任後、DX(特にデータサイエンスベースの意思決定強化・推進を希望する事業体)支援を目的とする「DSマインド」を開業。
インタビュー
時代によって変わりゆく「評価されるスキル」
ヒューマノーム研究所(以下「HNL」):
本日はインタビューのお時間を頂戴し、ありがとうございます!
今日は、これまでの藤原さんとデータ解析のかかわりや、CatDataを使われたご感想、今後さらに本格化していくAI・DX時代に向けたお考えなどを、ざっくばらんにお聞かせいただけたらと思います。
藤原さんは元々プログラミングをしていたんですか?
藤原真一様(以下「藤原」):
学生のころに、FORTRANをちょっとだけさわったことがあります。法学部だったので、教養科目として習いました。会社に入ってからは、COBOL系の言語にも触れました。
社会人に必要とされるスキルってどんどん変わってますよね。
数字を扱う業務でいえば、昔は紙に書いてある数字をそろばんや電卓で計算して、検算して・・・という世界で、暗算や電卓早打ちの特技を持っている人が羨ましかったですが、パソコンの登場により、世界が一変しました。これまでになかった表計算ソフトなどの新しいテクノロジーの登場により、これを使いこなすスキルの時代に突入したのだな、と感じました。
それから40年ほどが経ち、これからはAIを使いこなす力が問われていくのだろうと考えています。
HNL:
藤原さんは、データサイエンス技術がこれからのビジネスに大きく影響する、という先進的な目線をお持ちで、積極的に新しい技術を取り入れていらっしゃる印象があります。以前、藤原さんが(日鉄エンジニアリング株式会社で)社長をされている時に、社内にデータサイエンスの部門を作られてましたよね?
藤原:
ヘッドは外部から招き、内部人材5人くらいでデータサイエンス室をスタートさせました。最初の仕事は「社内で何かお悩みありますか?」の御用聞きです。結果、想像よりもはるかに多くの取組テーマが上がってきました。
例えば、何箇所ものゴミ溶融発電プラント設備の稼働データが、何年分もサーバに残っていることが判明しました。現場の人には「訳のわからないデータ」だったのですが、データサイエンティストから見るとまさに「宝の山」だった、といったケースです。
御用聞きメンバーがそのデータをチェックしたところ、類似設備ではパラメータが同じような挙動を示した場合には似たようなトラブルが発生していることがわかりました。これによって、このパラメータのある変動パターンが故障の予兆ではないか?というところまで見えてきました。
これまで活用されていなかったデータから得られる情報がたくさんある!という確信を得た私達は、複数箇所のプラントの操業や設備データを1箇所で見られる集中監視センター、いわゆるIoTプラットフォームを構築し、複数プラントの操業管理、設備管理等を飛躍的に効率化することができ、加えて予知・予防保全にも取り組めるようになりました。しかも、このシステムは、データサイエンスチームが一体となって基本オープンソースで構築しています。
当時、世の中にはIoTプラットフォームを売りにしている企業はありましたが、それを活用すると年間数千万円のコストがかかります。ちょっとした知恵でここまでできるのであれば、みんなでデータサイエンスを勉強して、こういったオープンソースのプログラム言語を勉強することで、課題に日々触れている現場の社員自らが課題解決に取り組めるし、大幅なコストダウンにもつながる、と確信しました。
そこで、社内にデータサイエンススキルをもつ現場人材を育成する学習コースを開設しました。Excelレベルのデータ分析ができるような人材を増やすためのジェネラルコースと、Pythonを用いてデータ解析ができる人材の育成に向けたアドバンスドコースを設置しました。アドバンスドコースは最後に演習があり、自分達で分析したいデータを持ちよって実際に解析を行う、というものです。
参加者を見ていて興味深かったのが、Pythonを使えるようになると、並行してそのスキルを使って新たにできることに気づいていく点でした。多変量解析系の機械学習を学んだエンジニアが、「今度は作業現場で撮影している画像から不安全行動などの画像認識AIモデルを作ってみたい!」というように、新たなアイデアを出してきたりするんですね。そういった学習と実務のサイクルが回り始めると、自律的に現場にデータを活かす環境が定着していくように感じています。
また、データサイエンスやAIは、勉強すればするほど日進月歩の技術である、と思わずにはいられません。
HNL:
この日進月歩の状態がどこまで続くのかは正直わかりません。ひととおりの主要な技術は出そろったような気はしますが、まだまだ現場で使えるAI、というところまでは落とし込まれていないように思います。誰にでも使いやすいAIを提供できる環境づくりに、引き続き取り組んでいくことが大切だと考えています。
藤原:
それはとても心強いですね。実際、僕自身はAIを現場業務に適用したことはないんですが、実装件数が増えれば増えるほど、おそらく色々な課題が出てくるのではないか、と思っています。
HNL:
今のAIを活かせているのは、例えばウェブ系の業者さんとか、データが取れているところだけ、という状況で、そこから一歩外れるとほぼ使えないという感じにみえています。「みんなが使えるようになる状態が実現する世界」ができあがるまでには、おそらく今までと全然違う勝負があるんだろう、と考えています。
藤原:
私は、前職を昨年6月末で退職したあと、8月から個人事業主として、DXやデジタル化を進めたいと思っているものの、どうやって進めたらいいのか?についてお悩みになっている会社様のお手伝いをしています。
例えば、ベテランの職人さんが持つ「経験値と勘」を今後にどう伝えていくかといった重要な課題があります。私は、この職人さんの価値をリスペクトしており、この「経験値と勘」を科学的に検証し、次世代がそれを活かすための橋渡しをする技術がデータサイエンスだと考えています。将来、ベテランの職人さんがいなくなっても、その会社が事業を継続していくために、社内に「経験値と勘」の根拠をデジタル技術で残しておくような取り組みをしたいと思っています。
しかし、全てを最初からシステム化するのは困難です。まずは、手で取ったデータを確認するところからスタートするような形でも良いと思います。
HNL:
データをとるのも大変ですもんね。
藤原:
取得できたデータは、いきなりAIモデル化するのではなく、その一歩手前の段階で、中身をしっかり見ること。いわゆる「見える化」を行うところから始まると思います。
HNL:
おっしゃる通り、僕らも「データをみる」ということはすごく重要だと思っています。いきなり解析にかける前に、一度データを見ることでわかることがたくさんあります。
藤原:
データを集めて、可視化することで、例えばベテランの「品質」に関する合否判断基準を検討したいのであれば、不合格と合格の判断に関連しそうなデータを確認し、それを可視化していくことで、関係者がそれを見ながら多角的な議論が始まります。その次にデータ分析ツールを活用しながら「何がその判断基準に寄与しているか?」というあたりへ深堀りしていく、といった段取りなのかな?と感じています。
HNL:
中小企業の現状を実際に見られていて、AI人材のリソースに関してはどう感じますか?
藤原:
結構きついんですよ。足りてないと感じることが多いですね。ただ、今、GAFAなどを辞めている人たちは高給な方が多いので、中堅・中小企業ではとても雇える金額ではありません。データサイエンスへの入り口をコスト面からも下げる工夫があるとありがたいと思います。
データ解析の入り口としてのノーコードツール
HNL:
藤原さんがCatDataをお使いいただいたきっかけをお聞かせいただけますか?
藤原:
2020年に社長退任後、会社のデータサイエンスのアドバンストコースでPythonを勉強したほか、いろいろなオンライン講座やWeb上のソースコードをみながら自習しました。結果的には画像解析やニューラルネットワークあたりまでは、プログラムを書いて実行するレベルになりました。
その後、あるプロジェクトの実務で使う機械学習モデル構築にもトライしました。悪戦苦闘しながら会社の若手メンバーにアドバイスをもらいつつ、PyTorchでモデルをつくるところまではできました。ニューラルネットワークを使って、精度85%くらいまでは到達したのかな。
さらに精度をあげるには、学習時のパラメータを調整しなければいけないんだろうな、ということはなんとなく分かっていましたが、まあとりあえずはこの辺でいいかなと妥協して、いったんここまでの精度で諦めていました。
その後、しばらくして巡り会ったのがCatDataです。
藤原:
CatDataにPyTorchで作ったモデルと同じデータセットを入れて、ニューラルネットワークを使ってモデルを作成してみたら、ほぼ同じ結果になりました。「おお!」と思いつつ、CatDataには他にどんなモデルがあるんだろう?と、種類を確認してみたところ、RandomForestやXGBoostなどがあり、おや?と非常に興味をひかれたんです。
決定木系とかやったことないけどどうなんだろうなぁと思いながら、試しにそのモデルにポコンとデータを入れてみたら、なんと95%以上の結果がでて、これはすごい!とびっくり。同時に、自分の視野が狭く、一点だけ見てあきらめていたということにも気づいたんですよ。最適なモデルはどれなのかを考える時に、CatDataなら気軽に複数のモデル比較ができるぞ!これは非常にいい!と感動したんです。
もちろん、更に深くやりたい人はPythonを使って細かくパラメータ調整をしていけば良いと思うんですが、まずはどのモデルを使えばいいか?をスクリーニングするツールとして、CatDataはとても使いやすいな、と感じます。
HNL:
そうですね。おっしゃる通り、ツールに手助けしてもらうことで、データを入れ替えつつ、手法を検討するのがとても楽になると思います。
藤原:
ユーザインタフェースがあれだけシンプルだと使いやすいですよね。とりあえず、やってみようか!というところが気軽にできるのは「入口」に向いているな、と。すぐになにか結果が見えると、人ってやる気が出るじゃないですか。
CatDataでの体験は、35年ほど前に私が初めてLotus1-2-3(1980〜90年代の代表的な表計算ソフト)に出会った時の感覚にすごく似ています。
私が会社に入った45年前はパソコンがまだない時代で、そのころは解析にFORTRANなどを使っていましたが、重回帰分析をするのは億劫で・・・。ところが、パソコンとLotus1-2-3の登場により、データ分析が気楽にできるようになりました。
そして今や、我々は、「Excelをつかえばだれでも気楽にデータ分析ができる」という感覚と同じように、「CatDataを使えばだれでも気楽にAIがつかえる」という世界への入口に立っているのでは?と感じています。そこからさらにどうAIを使いこなすはそれぞれですが、まずその機会を提供するということは、とても大きな意義があると思っています。
HNL:
バックグラウンドの違う、さまざまな人達が、だれでも気軽にデータ解析を試すことができる世の中になってほしいと、僕たちは願っています。
藤原:
以前、瀬々さんから伺った、「ギターをポロロンと弾いてみるような気持ちでAIに触れてみてもいいんじゃないか?」という例えが印象に残っています。いい例えですよね。データサイエンスをちょっとかじってみようかな?という感じで入れるのがCatDataだなと思いました。
HNL:
CatDataは、簡単にデータを見ることができるように、画面のデザインや操作方法を工夫しています。すぐヒストグラムを描けるようになっていたり、散布図で可視化する際は、どのデータをプロットした点なのか、カーソルを合わせればすぐにわかるように表示しています。
まず「やってみる」。そこから「やれそうなこと」が見えてくる。
HNL:
CatDataを開発する中で、僕たちはインタフェースをどう作ろうか、とても悩みました。ただでさえ複雑な機械学習の手順をシンプルに表現し、どこをおさえればみんなにデータの本質が伝わりやすくなるんだろう?と考えました。今、世の中にノーコードツールとして出ている機械学習系ツールは、どう見ても玄人向けです。値段も高い。それだけお金を出せるなら、プログラマーを雇えば良いのでは?と思うことも多々あります。
最近は、Pythonのライブラリもだいぶ充実してきました。多少プログラミングができる人であれば機械学習を行える世の中になったとは思います。しかし、機械学習をあまり知らなかったり、プログラミングを行うことができない人が使うものとしては、使いこなすまでにはだいぶ長い道のりがあるなと感じていました。そういった人たちが使ってみたいと思うツールにしたいという気持ちが強かったです。
実際に藤原さんにCatDataを使っていただいたお話を伺い、最小限の手数で機械学習ができる流れを実現できたようだ、と安心しました。
藤原:
データ解析の結果を簡単に比較できるってすごく大事です。
AIのモデルって色々あるじゃないですか。簡単なインターフェースで、クリックするだけでさまざまなモデルについて比較できたときは感動モノでした。中小企業のIT部門の人で、データサイエンスには興味があるけど、プログラミングはちょっと・・・なんて人に対して、CatDataを教えてあげたら喜んで使うんじゃないかな。
実際、比較的若い人は柔軟に新しいものに反応してくれることが多い気がしています。先日もあるクライアントでCatDataの話をしたら、自分でCatDataを試した後、XGBoostなどについて勉強して、次に会った時には「XGBoostやってみました!」と声をかけてくれたりすることもありました。嬉しいですよ、その時は。やはり、まず気楽に一歩踏み出せることが重要だなと感じています。
HNL:
IT部門にいらっしゃる方でもインストールなどにつまづくことはあると思います。頻繁にライブラリなどのアップデートがあるので、ちょっとした隙間時間に試してみたくても、インストールで詰まってしまい嫌になってしまうことは、僕たちでも多々あります。片手間にパパッとデータを入れて結果を出せるところがCatDataの良いところだと思っています。
藤原:
できたモデルを、実業務へ実装する段階に到達したら、会社の中で引き続き勉強して作っていくこともできると思いますが、ヒューマノームのメンバーがサポートに行って社員と一緒にやるとか、モデリングするリソースがなければヒューマノームのみなさんが請け負って進めていただける、とかそのようなことは可能ですか?
HNL:
もちろんです!皆様のフェーズに合わせて柔軟に対応いたします。いつでもお気軽にご相談ください。
「データサイエンスに興味がある中小企業」といっても、その特徴を一言でまとめることはできなくて、本当に千差万別です。社長さんがやる気があって声をかけていただき、現場の方々がどんなデータを出せばよいのかがわからない状態からスタートすることもあります。そこで当社は、何をしたいのかを考えていただく場をつくるために、CatDataの利用を提案させていただいています。
要は、とりあえずExcelにデータを入れてみて、何をしたいのかを考えてみる、という話とやっていることは同じです。データを触る機会を通じて「こういうことができそうだ」という感覚を掴んでいただくような、教育のところからお手伝いさせていただくこともありますね。
データドリブンな経営を絶対に諦めちゃいけない
藤原:
取得したデータは、必ずしもすぐに使えるとは限らないですよね。しかも使えるようになるまで、結構手間がかかる。以前、前処理をしたら半日以上かかりました。そのデータには欠損値や異常値がたくさん含まれていたので、そのまま機械学習にかけてしまうと、それらに引きづられていい精度が出ない。
データサイエンスは「データの料理」だと思っています。
データは「食材」。食材だけでは食べられないのと同じように、数字の羅列だけ見ていても何も語れない。これを下ごしらえのように、前処理したり判断できるように加工する必要があります。これが「料理」です。また、料理には和食や中華などがあるように、データサイエンスでも回帰分析や主成分分析、機械学習など様々な分野があり、目的に応じてそれぞれの習熟が必要となります。
最後の仕上げ部分も重要です。
上司に結果を持って行ってもわかってくれないと意味がない。これは料理と一緒で、全然美味しくなさそうな料理をだしても誰も食べてくれないのと同様に、「主成分分析やりました!」など、どんな手法を使ったのかだけを伝えたところで評価はされません。経営者に対して、その分析結果の戦略的な価値をわかりやすくきちんと伝える力がとても大事だと思っています。
また、食材と同様に、データにも賞味期限がある。アウトプットをタイムリーで出せるかがデータサイエンティストとしての使命だと考えています。
これらのデータの料理、つまりデータサイエンスに関しては、Excelが登場して以降どんどん身近になり、今やAIなどの高度な分野でもテクノロジーがユーザーに近づいてきてくれていると感じてます。だから中小企業の経営者の方々は、データドリブンな経営を絶対に諦めちゃダメですよ。諦めずにトライし続けることが重要です。自分は、そこの橋渡し的なお手伝いをしたいと考えています。
ヒューマノームのような、AIのハードルを下げていく技術は、料理の世界でいえばオートクッカーのような「調理のハードルを下げる技術」と同じだと思っています。CatDataのようなサービスが充実すれば、中小企業はもっと気軽にデータサイエンスと向き合うことができるはずです。
HNL:
「データサイエンスは料理」ってまさにそのとおりですね。通り一遍ではなく、その時の状況とか、お客様の雰囲気をふくめてきっちり仕上げていかないといけないという難しさはありますが、とてもやりがいのある仕事だな、と感じています。
藤原:
実際に業務をわかっている人間が基礎的なデータサイエンスやAIを勉強することで、実務への適用を加速させられると思っています。そこに、データサイエンスのディープな分野がわかる尖った人がアドバイスを担当し共に作業に取り組む、というのがDX推進の一つの理想像でしょうか。
HNL:
素材を作る人と料理する人がうまく分かれているような感じですね。
藤原:
最後になりますが、50年以上前アポロ11号に積んでいたコンピュータAGC(Apollo Guidance Computer)とiPhone11の性能の違いがどれくらいあるかご存じですか?
記憶容量差と演算スピード差を掛け合わせると、私の試算では1000億倍以上です。でも見方を変えると、昔のコンピュータはその程度の計算能力しかなかったのに、月まで人を送り込みました。高度な技術や、高性能な計算機だけが成功するポイントではありません。プロジェクトマネジメント力も非常に重要なポイントだと思ってます。
会社を変えるには、DXだけじゃなくチームワーク、人と人との繋がりといったアナログな面での変革、AX(アナログトランスフォーメーション)が何よりも大切だと思っています。AXとDX、つまり人と人とのつながりとデジタル技術は掛け算で、どちらがゼロでも答えはゼロになると考えています。チームの連携やマネジメントの重要性は昔も今も変わらないんじゃないでしょうか。
HNL:
デジタルだけで終わらないようにしていきたいですね。我々も人とのつながりを大切に、データサイエンス技術の普及に取り組んでいきます。
藤原:
みなさん頑張ってください。応援しています。