【シリーズ】機械学習をベースにDXの仕事を考えてみよう~コンセプト編

はじめに

AI技術が日々進化している現代、特に機械学習とディープラーニングは多くの産業で活用されています。
このシリーズでは、過去に集められたデータから、未来を予測し、次のビジネスに役立てる未来予測を行うモデル作成を行う流れを、AIやプログラミングに詳しくない方でも理解できるように、進めてみます。

過去のデータから未来を予測する場合、その予測が時間軸に意味のある時系列データを扱うケースと、データの順序は問題ではない場合の回帰問題と捉えるケースがあります。
このシリーズでは、データ順序にも何らかの意味があるものと考える、時系列データの予測にフォーカスします。

コンセプト

AI民主化と街のDX屋さん

ChatGPTのようなAI技術が身近になり、Pythonを使って簡単にデータ解析や機械学習ができる時代が到来しています。このシリーズでは、Google Colaboratoryなどの環境を活用し、少しのプログラミング経験がある方でも「これが作れるんだ!」と感じられるような内容を提供してみようと思います。

シリーズの流れ

0.準備を少々

  • 基本統計量(平均、分散など)モデル作成のための背景知識
  • Google Coraboratoryを使ったモデル開発
  • Pythonによるデータ処理

1.目標を決めよう

  • 予測したい内容は何ですか
  • どれくらいの期間を予測しますか
  • どのようなデータを用いるのか
  • データはどれくらい存在するのか

2.過去のデータを集めましょう

  • Pythonを使いデータをグラフ化して傾向を確認
  • 統計手法を使いベースラインモデルの作成(予測モデルの精度比較の基準となる)

3.目的の予測値と相関の強い情報を整理

  • 相関の強い値を見つける手法を紹介

4.実際のデータを学習データと検証データに分ける

  • データの分割方法とその理由を解説

5.モデルの作成

  • 複数のモデルを作成し、予測精度を比較
  • 最も有効なモデルの選定方法を紹介
  • モデルの特徴などの説明

6.実際のデータでモデルを試して検証

  • モデルが実際にどれくらいの精度で動作するのかを検証

まとめ

このシリーズを通じて、機械学習を用いたDX(デジタルトランスフォーメーション)の一例を紹介します。
AIや機械学習についての基礎から応用までを網羅する予定です。

どうぞお楽しみに!