CatDataマニュアル:AIモデル(機械学習モデル)の作成

予測モデルの作成

データを与えられたとき、そのデータの属するクラス(グループ)を予測するモデルを作成します。
本マニュアルでは、あやめ(iris)の がくの⻑さ/がくの幅/花びらの⻑さ/花びらの幅 が与えられたとき、そのあやめの種類(ここでは、0、1、2とします)を予測するAIを作成します。

下記の流れでAIの作成およびその利用を行います。

  1. あやめの種類を予測するAIの作成
  2. どの種類かわからないあやめに対し、作成したAIを用いて種類を予測

予測モデルの作成の流れ

予測モデルの作成の流れ

モデル作成の詳細

  • 可視化同様、iris_train.xlsx をアップロードします
  • テーブルのタスク選択で、「学習」を選択します。(右図)
  • 前処理の方法は可視化と同じです
    あやめのデータを用いる場合、前処理は不要です
テーブルの利用目的の選択

一度可視化して、アップロードしたデータに間違いが無いかを確認してください

hoge

「モデルの新規作成」ボタンをクリックし、新しいモデルの作成を行います

  • 様々な設定項目がありますが(*)、今回は最も重要な以下の項目だけ指定しましょう
    • 予測する値:予測したい列を指定します。ここでは”種類”を指定します
    • 手法:構築する機械学習モデルを選択します。ここではRandomForestを指定しましょう
  • 「開始」ボタンをクリックして学習を開始します

(*)様々な設定項目から高品質なモデルを作成できる設定を自動で作成するには「自動的にパラメータを調整する」をオンにしてください。
この機能はProへのアップグレードが必要です。

モデルの新規作成

モデルの学習と評価

  • 学習が開始すると、学習したモデル一覧に新たな行が加わります
  • 学習が終了すると、ステータスが実行中から完了に変化し、「評価結果」ボタンが押せるようになります。
    同時に評価スコアも表示されます。

hoge

評価結果をクリックすると、学習したモデルの評価結果の詳細が現れます。予測値の型や、利用した学習手法によって、表示される内容は異なります。

  • 予測値の型
    • カテゴリの場合、混同行列およびROCカーブ (カテゴリが2個の場合のみ)が表示されます。あやめの種類は「種類」というカテゴリのため、こちらに相当します。
    • 数値のときは、実測値と予測値を比較する散布図が表示されます。
  • 学習手法
    • Random Forest: 予測に寄与した変数と重み
    • SVM: 追加で表示される図なし
    • LASSO: 予測に寄与した変数と重み(回帰のみ)
    • Neural Network: 学習曲線

予測モデルの適用

予測モデルの適用の流れ

予測モデルの適用の流れ

モデル適用の詳細

Proプランの方は、テーブル数の上限が50個のため、この項目はスキップしてください
Basicプランの方は、可視化用のテーブルを削除してください
  • Basicプランの場合、テーブルの上限が2個です。
  • 現時点でテーブル数の上限に達しているため、予測用のテーブルを新規に作成することができません。
    本マニュアルの最初に作成した、可視化用のテーブルを下記の手順で削除してください。

テーブルの削除


あやめの種類を予測したいデータをアップロード

  • iris_test.xlsxをアップロードしてください
    • 今まで使っていた「iris_training.xlsx」ではないので注意!
    • 今までのデータとは独立した新規のデータです
    • このデータで、がくの⻑さや花弁の幅の情報から、あやめの種類を予測してみます
  • アップロード手順は学習タスクと同様です
  • テーブルのタスク選択で、「予測」を選択してください
予測を選択

予測タスクでは、前処理の行程はありません。AIを学習したときと同じ前処理が自動で適用されます。


予測モデルの適用方法

適用したいモデルを学習したテーブルを選択し、「予測」画面まで進みます。

画面がモデル一覧に変わります。適用したいモデルを選択し、「予測の開始」ボタンをクリックします。

予測モデルの適用方法

予測を開始すると、予測結果に新たな行が加わります。

予測が終了すると、状態が実行中から終了に変化します

予測の開始〜終了

予測結果の確認方法

予測結果が左の列に現れ、ハイライトされます。

可視化のタスクと同様に「可視化」ボタンをクリックする事で、予測結果とデータの関連をプロットして調べることができます。

予測結果の確認方法

正解がわかっているデータを用いて予測精度評価を行う

今回のテストデータには、正解の種類が存在しています。正解が分かっている場合には、この正解を用いてモデルの予測精度評価が可能です。

「予測結果と比較したい列を選択」を選択して予測を実施することで、予測精度を計算できます。

正解データを用いたモデルの予測精度評価

予測モデルの適用方法

答えがわからないデータに対する予測の実行方法と手順は同じです。

予測モデルの適用方法

予測結果の確認方法

「予測結果」をクリックすることで、予測結果を確認できます。

予測結果の確認方法

「予測結果と比較したい列を選択」の機能を利用した場合、「評価」をクリックすると、予測結果と正解値を比較できます

予測結果と正解値を比較する

評価結果の利用例

  • AIが0:Iris-setosaと予測したあやめ10個体は、全て0:Iris-setosaであり、予測結果が正しい(図の赤色破線の四角)
  • 2:Iris-virginicaのあやめ3個体は、AIは1:Iris-versicolorに誤分類(黄色破線の四角)
  • 多少の誤分類はあるが、AIはほぼ全てのあやめを正しい種類に予測。構築したAIの精度が良いことが確認できる。

評価結果の利用例


\商品ページはこちら/