AI向けのクラウドネイティブなストレージシステムの裏側

大規模な機械学習基盤を支える自社ストレージシステムの裏側について解説します。1500枚規模のアクセラレータを支える10PB規模のクラウドネイティブなストレージとして、少人数でApache Ozoneを運用してきました。 事業の成長に合わせて変わり続ける要件、増え続けるデータ量、世代ごとにますます高速化するアクセラレータ、故障するハードウェア、こういった問題に対してどのようにこの2年間対処してきたかを振り返ります

Kota Uenishi

登壇者プロフィール

Kota Uenishi

株式会社Preferred Networks

エンジニア

kuenishi

kuenishi


さまざまな分散データベースや分散ストレージの開発を経験。2017年より現職。分散機械学習フレームワークChainerMNの開発を経て社内の研究開発用ストレージ担当。将来の夢はオレが考えた最強のストレージを作って超安定運用すること