LLMを「速く」「安く」動かすには | CloudNative Days Winter 2024

LLMを「速く」「安く」動かすには Tweet

Track A 2024/11/29 10:00-10:20

初級者 Keynote アーカイブ視聴可

初心者にもわかりやすく、ChatGPTをはじめとした近年話題のLLM(Large Language Model)の中身について解説します。また、LLMを大規模に学習するだけではなく、LLMを動かして利用すること（推論）が重要になりつつあることを踏まえ、LLMの推論システムのサービングが難しい理由と、それに対応するための小規模化や量子化などの最近のモデルデータサイズを減らす工夫についてもお話しします。

Shintarou Okada

株式会社 Preferred Networks

エンジニア

Preferred NetworksでLLMの学習・評価基盤とLLMサービス「PLaMo」
https://plamo.preferredai.jp/ の開発に携わっています。C++が好きです。

発表資料

他にも様々なセッションが目白押し！

AI で加速するクラウドネイティブな開発体験

Track A 2024/11/28 11:00-11:20

開発の効率化が求められる中、クラウド上での開発体験向上がトレンドになっています。コ

120万口座を支える証券システムのクラウド運用内製化とクラウドネイティブへの挑戦

Track A 2024/11/28 11:40-12:00

PayPay証券は、証券会社としては後発ですが、現在120万を超える口座を抱えてい

成熟度別 Platform Engineering アーキテクチャ道場！

Track B 2024/11/28 13:20-14:00

Platform Engineeringは、現代のソフトウェア開発において注目を集

Amazon ECSとCloud Runの相互理解で広げるクラウドネイティブの景色

Track C 2024/11/28 13:20-14:00

本セッションでは、AWSとGoogle Cloudにおけるネットワークやアーキテク