ユーザーインタビュー|三田国際学園高等学校・角野 陽奈美様
このページでは、Humanome CatData(以下「CatData」)を実際にお使いいただいているユーザーの皆様へのインタビューをご紹介します。使ってみてどのように感じたか? など、率直な意見やご感想についてお伺いしています。
ご利用をお考えのお客様の参考になりますと幸いです。
お話しいただいた方
角野 陽奈美様
三田国際学園高等学校 メディカルサイエンステクノロジーコース3年
高校入学後、培養肉の研究、合成生物学に関するチーム研究と並行して、アミノ酸の変異と疾患との関連性をテーマとする解析に取り組む。この研究により、高校2年時にサイエンスキャッスル関東大会2023では最優秀賞を、JSEC2023(高校生・高専生科学技術チャレンジ)では日本ガイシ賞を受賞。JSEC2023での受賞を受けて、ロサンゼルスで開催された国際学生科学技術フェア(ISEF2024)に日本代表として出場した。その後、このISEFでの功績を称えられ、文部科学大臣特別賞を受賞している。
インタビュー
アミノ酸変異と疾患の関連をCatDataで解析する
ヒューマノーム研究所(以下「HNL」):
今日は当社までお越しいただきありがとうございます!まずは自己紹介をお願いします。
角野陽奈美様(以下「角野」):
三田国際学園高校3年の角野陽奈美です。自分の研究でCatDataを使わせていただいています。
HNL:
ご利用ありがとうございます!具体的にはCatDataを使ってどのようなことをされているのですか?
角野:
アミノ酸の変異と疾患との関連を解析するために、オープンソースで公開されているビッグデータを活用したAI開発を行うために使っています。
まずUniProt(タンパク質のアミノ酸配列およびその機能情報を提供している大規模データベース)やClinVarなどの各種疾患に関するデータベースから、タンパク質の性質やアミノ酸の性質変化、疾患の特徴など、さまざまなパラメータを収集します。これらのデータをCatDataに入力して、対象とするアミノ酸の変化が特定の疾患になりやすい体質をもたらすかどうかを判定する機械学習モデルを作成しています。
CatDataを使い始めたのは、この研究の成果が見え始めてからでした。それまではデータを解析して、その傾向を発表していました。AIを研究に取り入れることで、見いだした傾向を用いてアミノ酸変化がもたらす影響を予測するという、さらに踏み込んだフェーズに入ることができました。その手助けをしてくれたのがCatDataです。
HNL:
今回、研究の一環として機械学習モデルを作られたと伺いましたが、研究のどの部分で生かされたのか?という点をお聞かせいただけますか?
角野:
通常、遺伝子検査では、遺伝子変異と疾病の組み合わせが登録されているデータベースに遺伝子変異の情報を照会することで体質を判定しています。データベースに登録されていない変異は考慮することができません。
両者の関連性を予測する機械学習モデルがあれば、データベースにはまだ登録されていない遺伝子変異から疾病が予測できるかもしれない、と考えました。このモデルから「その人がどういう疾患を発症しうるか?」という情報が得られれば、将来的には、例えばガンの予防医療などに貢献できる可能性があります。
HNL:
プログラミングではなくCatDataでAI開発を行った理由はありますか?
角野:
通常のプログラミングよりも視覚的に分かりやすく構築できるところです。 例えば、パラメーター調整ひとつにしても、専門知識を必要とするので初心者には厳しいじゃないですか。正直、私もそのあたりをまだわかってはいないのですが、そういった難しいところを乗り越えやすいシステムにしてくれている点がよかったです。
個人的には研究で使うツールとしてすごく優秀だと感じました。
先生:
彼女は高校1年生の頭ぐらいから、この研究を進めていたのですが、当初はPythonを使って計算していました。とはいえ、Pythonに関しては本当に初学者で、当時はコードを書くこと自体がとても大変そうでした。「機械学習モデルをつくる」という工程についてはツールを使うことで研究を進めていけばいいんじゃない?と提案したことがCatDataを使い始めたきっかけです。
HNL:
企業においても「データ分析したい」というニーズがあった場合、普通はプログラミングやデータサイエンスについて勉強するところから入ります。ただ、プログラミングが苦手な人だと、勉強自体がハードルになって先に進まないっていうことが起こりがちなんですよね。ツールのコンセプトに、データサイエンスの入口でCatDataを使ってもらうことで、機械学習に対するハードルを下げたい、という思いがあるので、 そういった使い方をしていただけたことがすごくうれしいです。
角野:
CatDataでのAI構築に慣れたあとで、自分でプログラムを書いてデータクレンジングとか、ノイズ除去とか、パラメーター入れるとか、いろいろやってみたりはしましたが、以前の自分がそれをできたかって言われるとおそらくできなかったと思います。
高校生のバイオインフォマティクスな研究活動の話
HNL:
今回の研究成果でISEF(世界約70の国と地域から1500人以上の学生が参加する世界最大の科学コンテスト)という学会に日本代表として出られた、というお話を伺いました。現地の様子はいかがでしたか?
角野:
日本にもすごい研究をしている高校生はたくさんいらっしゃって、刺激を受けることが多いんですが、やっぱり世界レベルの高校生はものすごくレベルが高いなと感じました。
私と同じバイオインフォマティクス部門の人でも、かなりコアな研究をしていたり、自分が想像もしなかったようなことをしている人がいて、とても楽しかったです。
HNL:
そんな中で、自分の研究を発表するのは結構ハードルが高かったと思うんですがどうでしたか?緊張されたのではないでしょうか。英語での発表も大変でしょうし。
角野:
実はそれほど練習をせずに参加しました。振り返って、もう少し収穫のあるISEFにできたんじゃないのか?という若干の後悔はあります。でも、いろいろな方が審査に来てくださったりして、本当にわくわくしました!ロサンゼルスで開催されたのですが、英語は研究分野の用語であれば論文で馴染みがある言葉なのでなんとかなりました。
去年は、iGEM(合成生物学の国際コンテスト)の高校生部門にチームの一員としてエントリーしたんですが、その世界大会もすごく面白かったです。
私たちのチームには20人くらいの高校生が参加していて、低コストで安定的な抗うつ成分の新しい生産方法に関する研究を進めていました。高校1年の終わりから2年の秋くらいまで、このプロジェクトに関わっていました。iGEMはただの研究発表の場ではなく、社会的な繋がりを重視する大会なので、私たちのチームも解析をする人、実験をする人、というようにそれぞれ分担をして研究を進めていました。
私は、こどもたちを集めた実験教室や、実験データの画像処理を担当していたのですが、当時はもう1つ、全く別の研究もしていたのでかなりいそがしかったです。
HNL:
バックグラウンドの違う、さまざまな人達が、だれでも気軽にデータ解析を試すことができる世の中になってほしいと、僕たちは願っています。
先生:
1番多い時は研究が3本走っていました。今回のISEFの研究と、iGEMの研究と、GSC(東京大学の研究活動プログラム)かな。
角野:
はい、そうです。細胞を代用して肉を作る「培養肉」という技術があって、それをずっと研究したかったのですが、学校で実施するには研究設備的に難しい、という問題があり、外部で研究できる機会になる東大GSCにエントリーしました。高校1年生のうちは座学をやって、高校2年生の頭から1年間くらい実験していました。
全然意図はしていなかったんですけど、憧れの研究室に入れさせてもらえたんですよ。めっちゃ楽しかったです!
HNL:
お話を伺っていると「研究楽しい!」という想いがとても伝わってきます。研究を心から楽しめるようになったきっかけみたいなものってありますか?三田国際の環境が影響しているんでしょうか。
角野:
最初は東大GSCの研究がなかなかうまく行かないフラストレーションをバネにしていました(笑)
理由は明確ではないんですが、途中からすごい面白くなって来た時に、先生がいろいろと相談に乗ってくれたので、さらに夢中になれたのかもしれません。こう考えると、環境の影響が大きそうです。何を聞いても答えてくださるので。
先生:
こういう研究に取り組んでいる生徒がいるので、教師も常に最新情報のキャッチアップが必要という意識はあります。AlphaFold(タンパク質の構造を予測するAIプログラム)など、自分の専門分野で話題に挙がった話に関しては、関連する研究をしている生徒がいなくても論文には目を通しますが、今はある程度論文や周辺技術の解説ができる必要がある、と考えています。生成AIみたいな、自分が使える技術であればすぐ試したりもします。
HNL:
先生と生徒さんのよい相乗効果を感じました。生徒さんも質問にすぐ答えてもらえるような環境だから頑張れるし、先生も生徒さんが頑張ることが励みになってるんですね。信頼関係が構築されていてとても素敵だな、と感じました。
こういうことをやりたい!という目標へアプローチするのに、 予測が簡単にできることでよい結果が得られるのであれば、機械学習部分は省力化してもいいと思っています。そういう時にこそCatDataを使って、どんどん結果につなげてほしい、と考えているので、それが叶ってとてもうれしいです。
それだけいろいろできちゃうと、普通にPythonも書けちゃうのでは?と、つい思ってしまうのですが、CatDataを使う前と使ったあとの変化とかあったりしますか?
先生:
自分でコードを書けるとしても、CatDataがなかったら、こんなに予測サイクルを回してはいないかもしれないです。プログラムの実装を自分が手伝ったとしても、毎回予測結果のグラフをかくか?というと微妙ですね。
角野:
いま、研究の引き継ぎを後輩(高校1年生)にしているところなんですが、スプレッドシートに記録されたデータをCatDataを使って動かす、という流れで共有を進めています。CatDataがあれば予測結果をすぐ見られるのもいいです。かなりゴリゴリ使っている自負はあります。
HNL:
先ほども話してたんですけど、バイオインフォマティクス分野は大学進学後も続けるんですか?それとも別の分野の研究に取り組みたいというような希望はありますか?
角野:
いやぁ、それは悩みどころです(笑)。3つくらい興味のある分野があって、そのうちの1つがバイオインフォマティクスです。大掛かりな実験も必要ありませんし、周囲の環境に左右されずに取り組める、という点では実現可能性という意味でも、自分の興味という意味でも、一番続けられそうではあります。
今の研究分野には大変興味があるので、これからも生物だったりビックデータを扱うようなことをしていきたいなとは思っています。生物物理学だったり合成生物学とか。
HNL:
では最後に、後輩のみなさんへひとことお願いします!
角野:
とりあえず手をつけてみる、ということが難しいプログラミングを要する分野で、とりあえず手をつけることができる、を叶えてくれる、とてもよいツールだと思います。 1回使ってみてから学ぶことが多いので、とりあえず一度使ってみてください!