【シリーズ】機械学習をベースにDXの仕事を考えてみよう~コンセプト編
はじめに
AI技術が日々進化している現代、特に機械学習とディープラーニングは多くの産業で活用されています。
このシリーズでは、過去に集められたデータから、未来を予測し、次のビジネスに役立てる未来予測を行うモデル作成を行う流れを、AIやプログラミングに詳しくない方でも理解できるように、進めてみます。
過去のデータから未来を予測する場合、その予測が時間軸に意味のある時系列データを扱うケースと、データの順序は問題ではない場合の回帰問題と捉えるケースがあります。
このシリーズでは、データ順序にも何らかの意味があるものと考える、時系列データの予測にフォーカスします。
コンセプト
AI民主化と街のDX屋さん
ChatGPTのようなAI技術が身近になり、Pythonを使って簡単にデータ解析や機械学習ができる時代が到来しています。このシリーズでは、Google Colaboratoryなどの環境を活用し、少しのプログラミング経験がある方でも「これが作れるんだ!」と感じられるような内容を提供してみようと思います。
シリーズの流れ
0.準備を少々
- 基本統計量(平均、分散など)モデル作成のための背景知識
- Google Coraboratoryを使ったモデル開発
- Pythonによるデータ処理
1.目標を決めよう
- 予測したい内容は何ですか
- どれくらいの期間を予測しますか
- どのようなデータを用いるのか
- データはどれくらい存在するのか
2.過去のデータを集めましょう
- Pythonを使いデータをグラフ化して傾向を確認
- 統計手法を使いベースラインモデルの作成(予測モデルの精度比較の基準となる)
3.目的の予測値と相関の強い情報を整理
- 相関の強い値を見つける手法を紹介
4.実際のデータを学習データと検証データに分ける
- データの分割方法とその理由を解説
5.モデルの作成
- 複数のモデルを作成し、予測精度を比較
- 最も有効なモデルの選定方法を紹介
- モデルの特徴などの説明
6.実際のデータでモデルを試して検証
- モデルが実際にどれくらいの精度で動作するのかを検証
まとめ
このシリーズを通じて、機械学習を用いたDX(デジタルトランスフォーメーション)の一例を紹介します。
AIや機械学習についての基礎から応用までを網羅する予定です。
どうぞお楽しみに!