本セッションでは、Sansan株式会社の名刺のデータ化領域におけるMLOpsの仕組みとマルチクラウド戦略について発表します。
現在Sansanでは、人手を必要とする紙の名刺のデータ化をAIにより完全自動化することを目指しています。
名刺のデータ化は精度の要求水準が高く継続的な評価や精度の維持改善のための学習が必要であると同時に、決められた時間内に処理を完了しなければならないという要件があります。
名刺のデータ化の完全自動化を実現する上での鍵は2つです。
1つめはMLOpsの仕組みです。
本番のトラフィックを流しながらもモデルの精度検証を安全かつ容易に行う仕組みを構築することで、モデルの継続的評価・改善を可能にし、PDCAの高速化を実現します。
2つめはマルチクラウド戦略です。
平常時に行うモデルの学習・推論はもちろんのこと、障害時には平常時の10倍の処理能力を実現するだけのGPUが突発的に必要になるため、急激なリソース需要の変動に対応しなければなりません。
そこで、マルチクラウド戦略を採用することでリソース調達の安定性を確保し障害時の復旧をシステムだけで完結するアーキテクチャを実現しました。
大手通信会社にてKubernetesを用いた機械学習プラットフォームの開発を経験。
現在はSansan株式会社の研究開発部にてDevOps/MLOpsエンジニアとして名刺のデータ化領域のシステム開発や運用に従事。