“出る順”で覚える文系のためのAI必須用語
文系ビジネスパーソンがAIを習得する際に必要な3ステップは上の図であり、その中でもまずはAIの基礎用語を抑えることが基本中の基本となる。私がAIプロジェクトに関わっていく中で、頻出する用語を個人的見解ではあるが“出る順”として紹介していく。用語解説にあたっては図を用いてできるだけわかりやすく表現するように努めていく。なお、今回は機械学習の特定のアルゴリズム名などは除く。
この記事で紹介するAI必須用語
・PoC
・説明変数と目的変数
・学習と予測
・教師あり学習/教師なし学習
・分類と回帰
・過学習
・前処理
・正解率と再現率と精度
PoC
AI活用の検討段階から頻出するのがこの用語。PoCとはProof of Conceptの略で、概念実証実験のことだ。この用語はシステム開発などでも使われていたが、AIプロジェクトが多く立ち上がるようになってからさらに多くの現場で多用されるようになった。
AIは、アイデアプラン(コンセプト)がすばらしく説得力のあるものであっても、データ量や質が現実的には担保できない場合や、AIの手法・アルゴリズムとの相性によって精度が上がらずに実用に耐えないといったことが起こり得る。AIに関するアイデアプランを実稼働させるまでの本格的な意思決定、投資判断をする前に、判断材料を得るための事前実験がPoCなのである。
説明変数と目的変数
説明変数と目的変数という言葉は、実際にAIプロジェクトが動き出したら一日に何十回と口にする用語かもしれない。目的変数は、AIを通じた予測対象となる値である。たとえば前回紹介したAI予測モデルにおける「将来出世する/出世しない」といったAIにより予測したい内容だ。
一方で説明変数は、目的変数をAIで予測するための特徴要因。「将来出世する/出世しない」かをあてるための、「挨拶する、明るい、悪口を言わない、勉強家 、営業得意」といったような予測するための特徴的な要因のことを説明変数と呼ぶ。
学習と予測
AIの構築・利用工程は大きく二つに分かれる。それが学習と予測だ。学習とは、AIに法則性を教えることであり、AIモデルづくりとも言い換えることができる。具体的には学習用のデータをAIに提供し、学習済みモデルを作ることである。予測とは、学習によってできたAIモデルを使って、未知のデータから予測を返すことを言う。学習させたAIモデルを利用することだ。
AIの学習にもいくつかの種類がある。中でも主要な教師あり学習と教師なし学習について、次のページで紹介しよう。