国立がん研究センターで、データサイエンス人材講義を実施しました
当社は、昨年の9月から11月にかけて、国立がん研究センター東病院内講義「2024年度データサイエンス人材開発セミナー」のコンテンツ作成と授業を担当しました。前回に引き続き、受講者の皆様が授業で学んだ知識を取り入れたAI開発コンテストも今年1月に開催し、こちらも無事に終了しました。
講義内容
このセミナーは、プログラミング初心者かつ機械学習/深層学習(AI)について学びたい医療関係者を対象として実施しました。講義は国立がんセンター東病院内で行いましたが、Zoomでのオンライン配信や、アーカイブ配信も実施しました。
実施期間は3ヶ月、土曜開催というスケジュールにもかかわらず、毎回の参加者アンケートの回答者数は平均100名を超えました。この場をお借りして、運営にご協力いただいた国立がん研究センター東病院のみなさまと参加者のみなさまに感謝申し上げます。
各回では以下のような授業を実施しました。データサイエンスの概要を掴むまでは、当社のノーコードAI開発ツール「Humanome CatData(以下「CatData))」を利用することで、解析時に何に留意すべきか?などを体感する内容にしぼり、後半から実際のプログラミングに移行する、という形で授業を進めました。
- 第1回:8月24日 CatDataによる表データの前処理と可視化
- 第2回:9月21日 機械学習の基礎とCatDataによる予測するAIモデル作成
- 第3回:10月19日 Pythonによるプログラミングの基礎と可視化
- 第4回:11月9日 Pythonによる機械学習(教師あり)
- 第5回:11月30日 Pythonによる機械学習(教師なし)
CatDataを利用した前半戦では、プログラミングをはじめる前に全体の流れを掴んでいただくため、マウス操作のみで解析するというハンズオンを実施しました。表データの可視化や欠損値の対処方法、AI モデルを作成する、といった座学だけでは理解しづらい部分も、実際に手を動かすことで理解が深まったという声を多数いただきました。AI モデル作成の奥深さを感じていただけたとともに、次のプログラミングによる開発への学習意欲を高めることができたかと思います。
第3回からの後半戦では、 Python の基礎、scikit-learn を用いた教師あり学習の実装、PyCaret を用いた複数アルゴリズムの結果比較、PCA を用いた次元削減、k-means 法を用いたクラスタリング、t-SNE を用いた次元削減などを行いました。次元削減やクラスタリングは、データ分析において非常に重要な手法です。今回の授業でも優先して取り上げました。また、分析対象のデータとしてBreast Cancer Wisconsin (Diagnostic) Data Set(乳がん診断データセット)を利用することで、現場での利用を踏まえたスキルを習得できる構成としました。

各回とも、参加者の皆様に積極的に手を動かしていただく形式としたことで、自分事としてデータサイエンスを捉えるお手伝いができたのではないかと考えております。特に、今回は生成 AI (Google Geminiを利用) を利用したコーディングという試みを新たに取り入れました。
プログラミングを学ぶ際、初心者の多くが直面する課題として「エラーの解決が難しい」「何を学べばいいのかわからない」「学習のモチベーションが続かない」といった問題があります。
初心者が最もつまずきやすいのは、コードを書いた際に発生するエラーやバグの修正です。生成AIにエラーメッセージを入力するだけで、すぐにその意味や修正方法を解説してくれます。また、質問する側のレベル感に合わせ、コードのサンプルやその解説が提供されるため、メンターと対話しているような感覚で学習を進めることもできます。このように、勉強に生成AIを取り入れることで、学習者の心理的ハードルが下がり、受講者がこのセミナーを通じて「やってみたかったこと」の実現可能性が高まるのではないか?と考えました。
実際に、学習段階に合わせたプログラミングのサポート体制が強化されたことについては、参加者の方々からも好評の声をいただくことができ、私達も大変うれしく思いました。
参加者の皆様からいただいた感想
- AIを使用した解析に関してとても興味が湧き、今後活かしていこうと思える内容でした。
- スライドに記載された演習内容は、自分でも手を動かして再度実施することができました。
- 講師の先生のお話が聞きやすかった。Catdataは簡単に一元的に可視化できることは驚いた。
- 昨年から参加させていただいておりますが、とても良い勉強会だと思います。初学者向けの内容なので、世代を越えて幅広く講義していただくことで、AIに興味を持つ人が増えるのではないでしょうか。
- 複雑な内容を、とてもコンパクトにまとめていてわかりやすかったです。機械学習後の変数の重要度についてもよくわかりました。
- 5回の講義が、系統的に準備されていて、学習に好適でした。ありがとうございます。

最終成果発表会

このセミナーでは、これまでの学習内容を振り返り、実際に手を動かして「AIを開発してみる」ことで、医療AIの実際を知るイベントとして、最終成果発表会を行いました。当日は、受講生の皆様による大変素晴らしい発表が多数あり、盛況のうちに幕を閉じました。
医療データの解析、創薬への応用、臨床試験データの可視化、効果予測モデルの構築など、テーマは多岐にわたり、AI・機械学習技術を駆使した高度な研究成果が披露されました。受講生の皆様は、セミナーを通して得た知識や技術を存分に発揮され、それぞれの課題に対して熱心に取り組まれていたことが発表から伝わりました。
中には、臨床データが集まっているからこそ実現した発表などもあり、今後の研究への期待を感じさせました。発表内容だけでなく、発表者のユーモアあふれるトークや、聴衆を惹きつけるプレゼンテーションスキルも素晴らしく、会場は終始和やかな雰囲気に包まれていました。
今回の発表会を通して、受講生の皆様がセミナーで得た知識や経験を活かし、それぞれの分野で活躍されることを確信しております。
当社では、今後も本カリキュラムのようなAI技術に関する教育活動、普及に向けた取り組みを積極的に進めてまいります。
セミナー・講義の実施に関するご質問等につきましては、お気軽にお問い合わせ下さい。