AI向けのクラウドネイティブなストレージシステムの裏側

Track D 2023/12/12 13:20-14:00

中級者   Storage / Database    

大規模な機械学習基盤を支える自社ストレージシステムの裏側について解説します。1500枚規模のアクセラレータを支える10PB規模のクラウドネイティブなストレージとして、少人数でApache Ozoneを運用してきました。
事業の成長に合わせて変わり続ける要件、増え続けるデータ量、世代ごとにますます高速化するアクセラレータ、故障するハードウェア、こういった問題に対してどのようにこの2年間対処してきたかを振り返ります

Kota Uenishi
株式会社Preferred Networks
エンジニア

さまざまな分散データベースや分散ストレージの開発を経験。2017年より現職。分散機械学習フレームワークChainerMNの開発を経て社内の研究開発用ストレージ担当。将来の夢はオレが考えた最強のストレージを作って超安定運用すること