様々なシーンでの転用が進む「機械学習」
機械学習とは、データからコンピューターが自動で学習し、データの背景にあるルールやパターンを発見する学習方法です。
昨今は機械学習の理論・技術が発展するとともに、様々なサービスやマーケティング活動への転用も増えています。機械学習を活用すれば、従来では考えられなかった商品・サービスの開発や、マーケティング活動が可能です。
今回は、機械学習の基本情報やマーケティングシーンにおける活用例について解説しますので、ぜひお役立てください。
機械学習とは?
機械学習とは、「Machine Learning」とも呼ばれるデータ分析の方法の一つです。コンピューターがデータから得られる情報を自動で学習し、その背景にあるパターンやルールを可視化する仕組みとなっています。
機械学習で得られた分析結果は、アルゴリズムやモデル次第では、属性ごとの分類や結果予測といったタスクを処理することも可能です。
機械学習はAI(人工知能)を実現させるための技術で、米国の科学者ジョン・マッカーシーによって1956年にAIの定義が唱えられてから70年近く経った現在でも、加速度的な技術の発展が続いています。
機械学習は後述するディープラーニング技術の登場に加え、分析可能なデータの量が増加したり、コンピューターそのものの処理能力が向上したりしたことで、より精度の高いデータ分析が可能になりました。
近年は、統計学では難しかった「新たな法則の発見」や「高い精度の結果予測を叶えるモデル構築」も可能になり、企業のサービス開発やマーケティング活動への貢献度が高まっています。
機械学習の3つの種類
機械学習は学習方法や目的ごとに種類分けされており、以下の3種類が存在します。
- 教師あり学習
- 教師なし学習
- 強化学習
いずれの学習手法も「変化要因」に対して、将来起こり得ることを正確に予測し正しく分析したうえで、その分析結果から、成果を最大化するための示唆を得ることを目的としています。
機械学習により、顧客の行動や市場動向に関する将来予測の精度を高めれば、需要に応じた商品やサービスを開発したり、自社の売上をさらに拡大するためのマーケティング戦略を策定したりできます。次項より、それぞれ個別に解説します。
教師あり学習
教師あり学習はコンピューターに、各事象の「正しい答え」について学習させる手法です。入力内容に対する正しい出力結果をデータとして学ばせることで、過去のデータから、将来起こりそうな事象も予測できます。
具体的に教師あり学習では、分類や認識を行う「識別」、事象の結果を予測する「回帰」などを行うことが可能です。
「識別」は、学習した正解のデータを基にして、出力するデータを「正解」「不正解」に振り分けたり、分類したうえで認識したりすることが可能です。たとえば、不正利用の疑いがあるクレジットカード決済、写真を「人」「動物」「風景」といったカテゴリごとに分類して、自動的にグループ分けするといったこともできます。
対して、「回帰」では過去に蓄積されたデータを「数値」として学習することで、将来の結果予測に役立てます。たとえば、月または年ごとの売上情報などの連続するデータを学習し続けることで、今後の売上や需要を予測することも可能です。
「機械学習の約70%は教師あり学習である」ともいわれ、機械学習の基本となるラーニングの手法として用いられています。
教師なし学習
「教師なし学習」は、教師あり学習とは逆に「正しい答えがないデータ」を学習させる方法です。そのため、教師なし学習ではコンピューターに実装されたアルゴリズムが自力で与えられたデータの意味をつきとめなければなりません。
教師なし学習が行われる目的は「データを分析して、そこに何らかのパターンや特徴を見つけ出すこと」です。正解を持たない大量のデータを学習させ、データ間の類似性などを推測できるようになれば、「よく似た属性を持つ顧客のセグメント(分類)」「商品のレコメンド」などが可能になります。
つまり教師なし学習は、コンピューターが判断を下せるようにするための学習方法とも定義できるでしょう。これにより、ECサイト上での購買履歴に応じたおすすすめ商品の訴求といった複雑な処理も自動で行えます。
教師なし学習では「クラスタリング」と呼ばれる手法が使われるのが一般的です。クラスタリングは、与えられたデータをカテゴリ別に分類したうえで、グループ別に振り分ける機能となっています。
強化学習
データを与える必要がある教師あり・なし学習とは異なり、「データがない状態」でコンピューター自身が出力した結果にスコアをつけ、試行錯誤して精度を高めていく学習方法が「強化学習」です。
強化学習を行うアルゴリズムは「スコア(=報酬)をいかに最大化するか」という判断軸を基にして学習を行っていきます。「自身が出力した結果を最大化する方法は何か」を判断し続ける強化学習は、ロボット工学やゲーミング、ナビゲーションの分野で活用されています。
たとえば、ロボット工学においてロボットが歩行距離を伸ばすための最適な歩き方を見つけ出すために活用されているように、結果を予測する教師あり・なしの学習方法とは根本的に活用方法が異なります。
機械学習とディープラーニングの違い
機械学習と混同されがちな学習手法として、「ディープラーニング(深層学習)」が挙げられます。実は、ディープラーニングは機械学習の手法の一つで、人の神経回路を模倣したモデルによる情報処理を行う「ニューラルネットワーク」を幾重にも重ねた「ディープニューラルネットワーク(DNN:Deep Neural Network)」を用いた学習方法です。
ディープラーニングでは、アルゴリズムによる学習データが持つ特徴や傾向、パターンなどの抽出に加え、人の知能だからこそ実現できるような深い洞察や問題解決などもできます。
機械学習とディープラーニングとの違いについて整理すると、以下のとおりです。
- 機械学習……与えられた学習データから何らかのパターンや判断基準を学び取り、将来予測や自主的な判断を行う
- ディープラーニング……機械学習の手法であるニューラルネットワークをDNNに拡張し、さらに精度の高い分析やデータ活用を可能にする
以上のとおり、機械学習とディープラーニングは明確に異なる概念というわけではありません。「AIを実現するための技術」として機械学習があり、その一種としてディープラーニングがあります。
ディープラーニングは比較的新しい技術であり、実践的な活用例は多くはありませんが、代表的な活用例としては自動運転技術が挙げられます。また、画像内のモノや音声内の単語を識別する技術の精度向上にもディープラーニングの活用が有用です。
マーケティングや事業活動における機械学習の活用例
では、マーケティングや事業活動において機械学習はどのように活用されているのでしょうか。代表的な活用例は、以下のとおりです。
- レコメンド(おすすめ)
- 需要予測
- 画像認識・処理
- 自然言語処理
それぞれについて、詳細を解説していきます。
レコメンド(おすすめ)
ECサイトなどで機械学習を活用したレコメンド機能を実装し、購入履歴にもとづいたおすすめ商品を訴求すれば、アップセル(ユーザーにさらに上位の商材を購買してもらうこと)やクロスセル(ユーザーに関連商材も一緒に購入してもらうこと)によるさらなる売上拡大を図れます。
機械学習を活用したレコメンド機能なら「反応率の高いコンテンツの提案」や「より購買確度の高い商品の訴求」といった、顧客ごとにパーソナライズされたアプローチの自動化も実現可能です。
需要予測
先述のとおり、機械学習を活用すれば、過去の販売実績などの膨大なデータから、将来起こり得ることを推計する需要予測も可能です。たとえば、ECサイト事業などでは数十万点に及ぶ在庫を管理しなければならないケースも多々ありますが、機械学習を活用すればこういった在庫管理業務を効率化できるでしょう。
需要予測に寄って効果改善できる業務は、在庫管理だけではありません。自社が抱える在庫点数と需要予測の結果を組み合わせれば、商品やサービスの需要に応じて売価を変動させる価格戦略「ダイナミック・プライシング(Dynamic Pricing)」の実現も可能です。
画像認識・処理
画像認識とは、画像ごとのパターンを学習して「画像のなかに写っているもの」を分類する技術です。元々、機械学習でも可能な処理でしたが、前述のディープラーニングの進歩を受けてさらに精度がアップしました。
対する画像処理は、コンピューターを使用した「画像の変形」「色調調整」「合成」「文字情報などの抽出」といった機能全般を指しています。画像処理の技術は、異常検知や外観検査などに用いられており「レントゲン結果からの早期の病気発見」「自動運転時の追突防止」などが可能になりました。
自然言語処理
自然言語処理とは、人が発する言語(自然言語)をコンピューターで処理し、その内容を抽出する技術です。
処理できるのは発話した音声言語だけでなく、文章や論文まで含まれます。文章が持つ意味を様々な方法で解析するこの技術は、機械翻訳や対話システムなどに活用されています。
そのほかにも、最新の自然言語処理技術である「BERT(Bidirectional Encoder Representations from Transformers)」をGoogleが2019年に検索エンジンとして採用するなど、自然言語処理はビジネスシーンでも活用されています。
機械学習を自社事業に活かすための考え方
本記事で紹介したとおり、機械学習を活用したソリューションを活用することで、事業やマーケティング戦略の幅が大きく広がります。
しかし、機械学習を効果的に活用するうえでは、闇雲にデータ分析を実施していても成果にはつながりません。自社にとって意義のある予測・分析結果を得るためには、その前提となる「高品質な学習データ」が不可欠です。つまり、質の高いデータさえそろっていれば、大量のデータは必要ないともいえるでしょう。
企業組織が機械学習を活用する際には、「データの選別→データクレンジング」のプロセスが重要です。
機械学習を実施する場合、「どのデータを学習させるか」というデータの選別を行ってうえで、厳選したデータを使った学習を円滑に行うためのクレンジングが求められます。学習データのなかに誤ったものがあったり、自社の目的からは外れたデータが含まれていたりすると、アルゴリズム正確な学習ができなくなります。
膨大なデータのなかには、重複や矛盾を抱えた欠陥のあるデータも混在しているため、選定段階からのクレンジングが不可欠なのです。ただし、データ選別やクレンジングを行うためには、機械学習に関する知見を持った人材が必要になります。
データアナリストは貴重な人材ではありますが、自社でも人材確保や人脈形成に努め、状況に応じて外部専門家の力も借りながら機械学習を活用しましょう。
まとめ
機械学習を行えば、学習データから得られる分析結果を基にして、精度の高い将来予測や属性ごとのセグメントなどができます。また機械学習を活用することで、レコメンドや需要予測など、企業の事業・マーケティング活動を加速させることも可能です。
機械学習は先進的な分野ではありますが、だからこそ、自社で活用すれば競争優位性の確立につながるといえます。目的に応じて有効なデータを選別し、機械学習の種類を使い分けながら活用して成果につなげていきましょう。