【BDSP】Python資産の有効活用 - Natic | Application Modernization Platform – 日商エレクトロニクス

【BDSP】Python資産の有効活用

こんにちは、BDSP(Business Data Science Platform)でプリセールス、データエンジニアを担当する加藤です。先日講演した“RapidMiner Conference 2021”でPythonの活用について取り上げたところ、多くの反響をいただきました。皆さんが日ごろPython資産の活用について真剣に考え、悩みを持たれていると感じました。そこで今回は改めて、Python資産のビジネス活用について掘り下げてみたいと思います。

Python資産のビジネス活用はわずか10%?

一説によると、データサイエンティストが作成したPythonモデルのうち、ビジネスで継続運用されている率は10%に満たないと言われています。

先日のConferenceでも、弊社独自にPythonモデルの運用状況についてアンケート調査を行いましたが、有効回答の中でPythonモデルを継続運用できていると答えた方は一人もいませんでした。Pythonと言えばAI開発のデファクトと言われ、シンプルで可読性が高いなど多くのメリットが聞かれますが、なぜ運用につながっていないのでしょうか。アンケート結果からも、いくつか共通の課題が浮かび上がってきました。

モデル運用の敷居が高い

モデル運用を考えた際、予測精度の監視、メンテナンスなど、専門的にその分野に関わっていないユーザーにとって敷居の高い対応が求められます。具体的には次のような課題が顕在化していると考えています。

◆運用の仕組みを構築するノウハウがない

AI機械学習の特性上、再学習を繰り返さなければ予測精度が劣化し、実務に耐えられなくなります。
そのためモデル作成後の精度監視や再学習を含めた運用サイクルを仕組み化する必要があり、実現には経験やノウハウが必要となります。

◆運用コストとリソースの壁

モデルの実行結果確認、精度劣化の監視など、本番運用後に発生する作業を人手で行うことは多くの負荷がかかります。日々モデルが増えていくことを考えれば、手動で継続的に管理・運用し続けるのは困難です。

モデル開発・運用のサイクルを円滑に行うMLOps

これらの課題を解決するのが、RapidMinerに代表されるMLOpsプラットフォームです。

◆専門知識なしで、モデルの運用管理サイクルを効率的に推進する仕組みを構築可能

・コード、データの管理
・モデル作成、検証
・デプロイ
・モニタリング

これらAI機械学習の開発・運用プロセスを効率的に進めることができます。
またPythonコードの取り込み機能を使うことで、これまで運用にいかせなかったPythonモデルを簡単にデプロイし、継続運用が可能です。

◆RapidMiner プラットフォームのスケジュール実行機能

モデルの自動実行及び継続的なモデルの精度監視が可能です。
モデル実行時にエラーが発生したり、予測精度が劣化した場合、アラートメールを送付することもできます。運用面で人が監視に張り付く必要はなくなり、新しいモデル作成に注力することができます。

事例紹介

・Pythonモデルの取り組みからデプロイ
・継続的なモデルの実行と精度監視

上記の有用性をイメージいただくため、RapidMinerプラットフォームを用いたPythonモデルの開発、運用プロセスの具体例をご紹介します。

テーマ:センサーデータの異常検知

【概要】
・装置に取り付けられたセンサーのデータを使って、異常を検知する
・Pythonで作成したモデルをRapidMinerへ取り込み、デプロイし、継続運用するプロセスをご紹介

【手順】
① Pythonで作成した異常検知モデルをRapidMinerへ取り込み
② モデルのデプロイ
③ モデルの継続実行
④ モデル実行結果の可視化、モデル精度の監視

①Pythonモデルの取り込み
・Pythonで作成したモデルを、RapidMiner標準のI/Fを用いて簡単に取り込みが可能

②Pythonモデルのデプロイ
・ローカル環境からリモート環境のリポジトリが参照可能
・作成したモデルをリモート環境のリポジトリへ保存するだけで、簡単にデプロイが可能

③モデルの継続実行
・モデル、プロセスのスケジュール実行が可能、ビジネスの状況に合わせて、定期的に実行できる
 この機能によって、モデル自動実行、継続的なモデルの精度監視が可能

④ モデル実行結果の可視化、モデル精度の監視
・モデルの実行結果を可視化(図①)。異常データ検出時にアラート通知が可能
・モデル精度の監視が可能(図②)。予測モデルを運用していく中で、モデル構築時の精度より
 低下した場合、自動的にアラート通知を行うことが可能

<センサーデータの異常検知ダッシュボード(例)>

まとめ:RapidMiner導入効果

RapidMinerは、「ノンプログラミング」でデータ加工(前処理)からデータ可視化、モデル作成、評価、運用までワンストップで行えるプラットフォームです。
専門知識がなくても、モデルの運用管理サイクルを効率的に推進する仕組みを構築できます。
またPythonコードを取り込むことで、ビジネスに活用できていなったPythonモデルを簡単にデプロイし、継続運用につなげることができます。

おわりに

本記事では要点を絞ってご紹介させていただきましたが、以下内容を動画コンテンツでご紹介していますので、ぜひご覧ください。

・ビジネス課題を解決する「MLOps」とは何か
・RapidMinerプラットフォームの全体像
・Pythonモデルの取り込み、デプロイまでの流れ詳細
・不正検知のテーマで課題となる”正常データに比べて異常データが非常に少ない”不均衡状態に対して、
どのようなアプローチで取り組んでいけばよいのかAutoEncoderという手法を使い、具体例を紹介

RapidMiner Conference 2021で行ったセミナーのアーカイブ動画を掲載しており、
実際のデモの様子もご覧いただけます。
RapidMiner Conference アーカイブ動画はこちら

加藤 隼一 Junichi Kato
AIデータ分析事業のソリューション開発・プリセールス担当

   

2006年 日商エレクトロニクス入社。
Xcute、SQLServerを利用した不動産開発業者向け販売管理システム導入を皮切りに、java、SQLServer、Oracleを活用した企業の業務システム開発/保守/改善プロジェクトに複数従事。その後、RapidMinerを活用したAI民主化事業の推進・導入コンサルティングに参画。現在に至る。
趣味は、ラーメン食べ歩き、TVゲーム