「このIoTデバイス、リクエスト処理に1秒もかかってる。」
ところが、アプリケーションコードの実行時間は100msだけ。では残りの900msの間、デバイス内部では何が起きていたのでしょうか。
パナソニックでは日々、IoTシステムに接続するデバイスのテストを行っています。しかし実際のデバイスは、設置環境・ハードウェア・ネットワーク等に起因する再現性のないノイズの影響を受けています。
従来の分散トレースではアプリケーション間の関係は可視化できても、デバイス内部の状態は把握できませんでした。またデバイス内部をデバッグしても、クラウドとの関係性を調べることは至難の業でした。
本取り組みでは、eBPFで取得した状態遷移、システムコール、割り込みなどのカーネルイベントをクラウド・デバイスのE2Eで相関させてクラウド上のコレクターに収集し、統合されたUIのもとでタイムラインに可視化することで高速な障害分析を実現しています。
本セッションでは、eBPFを使ったE2Eの可観測性手法の紹介と、IoTデバイス特有のリソース制約下でオーバーヘッドを最小限に抑えるための実践的アプローチについてお話します。
Panasonic Corporation / Electric Works Company
Chief Engineer
SI企業にて金融系システムを担当後、パナソニック株式会社に入社。IoT領域のシステム開発・運用までを手がけ、Kubernetesをはじめとするクラウドネイティブ技術の導入と活用を実践してきた。(新規事業を含む)
現在はIoTシステムの可観測性向上に興味を持ち、取り組んでいる。