前回のAIアートの新時代の続編です(第2巻です)。引き続き画像生成やその周りの話を2024年の技術で書いていきます。今回は、画像生成はより深く、Stable Diffusionの抱える「スタイルの問題」について解説します。また、2023年~2024年に急速に進化した動画生成の流れも俯瞰し、OpenAIの動画生成モデル「Soraについても背景技術をキャッチアップできるようにしています。

本書では、拡散モデルにはじまる画像生成モデルの進化の系譜からはじまり、画像生成の課題となるスタイル統一を切り口としてLoRAやIP Adapterといった技術を紹介します。また、生成画像の定量評価についてのアプローチもいくつか紹介します。3次元復元の基本として、nerfstudioから始めるNeRFについても取り扱い、スマホで撮影したデータとの連携を模索します。最終章の動画生成では、OpenAIのSoraをはじめとするTransformerベースの動画生成技術の進化をコードベースで体感していきます。本書を手に取り、AIアートの進化について触れてみてください。

1. 画像生成モデルの進化の歴史:Stable Diffusion以降 / 2. LoRAを効率的に訓練する技術 / 3. 生成画像のスタイルを統一する技術 / 4. 画像生成の定量評価 / 5. nerfstudioで始める3次元復元の基本 / 6. 動画生成の進化と新潮流