๐ฅ MotionFollower: GPU ๋ฉ๋ชจ๋ฆฌ 80% ์ ์ฝํ๋ฉด์ ๋น๋์ค ๋ชจ์ ์๋ฒฝ ํธ์งํ๋ ํ์ ๊ธฐ์
TL;DR: MotionFollower๋ ๋น๋์ค์์ ๋ชจ์ ๋ง ์ ๋ฐํ๊ฒ ํธ์งํ๋ AI ๊ธฐ์ ๋ก, ๊ธฐ์กด ๋ชจ๋ธ ๋๋น GPU ๋ฉ๋ชจ๋ฆฌ๋ฅผ 80% ์ ์ฝํ๋ฉด์๋ ๋ ๋์ ํ์ง์ ๊ตฌํํฉ๋๋ค. ๋ณต์กํ ๋ฐฐ๊ฒฝ๊ณผ ์นด๋ฉ๋ผ ์์ง์์ด ์๋ ์์์์๋ ์์ ์ ์ธ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์ฌ์ค๋๋ค.
๋น๋์ค ๋ชจ์ ํธ์ง์ ๊ฒ์ ์ฒด์ธ์ : MotionFollower
์์์์ ์ธ๋ฌผ์ ์์ง์๋ง ๋ฐ๊พธ๊ณ ์ถ๋ค๋ฉด? ๋ฐฐ๊ฒฝ๊ณผ ์คํ์ผ์ ๊ทธ๋๋ก ์ ์งํ๋ฉด์ ๋ชจ์ ๋ง ์ ๊ตํ๊ฒ ์์ ํ ์ ์๋ ๊ธฐ์ ์ด ๋ง์นจ๋ด ๋ฑ์ฅํ์ต๋๋ค. ๊ทธ๊ฒ๋ ๊ธฐ์กด๋ณด๋ค ํจ์ฌ ์ ์ ์ปดํจํ ์์์ผ๋ก ๋ง์ด์ฃ .
MotionFollower๋ ์ต์ ํ์ฐ ๋ชจ๋ธ(Diffusion Model) ๊ธฐ์ ์ ํ์ฉํด ๋น๋์ค ๋ชจ์ ํธ์ง์ ํ๊ณ๋ฅผ ๋ฐ์ด๋์ ํ์ ์ ์ธ ๋ชจ๋ธ์ ๋๋ค. ํนํ ์ฃผ๋ชฉํ ์ ์ GPU ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋์ 80%๋ ์ ๊ฐํ๋ฉด์๋ ๋ ๋์ ํ์ง์ ๊ฒฐ๊ณผ๋ฌผ์ ๋ง๋ค์ด๋ธ๋ค๋ ๊ฒ์ ๋๋ค.
์ ์ด ๊ธฐ์ ์ด ์ค์ํ๊ฐ์?
AI ๋น๋์ค ํธ์ง์ ํ์ค์ ๋ฌธ์
์ง๊ธ๊น์ง์ AI ๋น๋์ค ํธ์ง ๊ธฐ์ ์ ์ฃผ๋ก ์คํ์ผ ๋ณ๊ฒฝ, ๋ฐฐ๊ฒฝ ๊ต์ฒด, ์ธ๋ฌผ ์ธํ ๋ณ๊ฒฝ์๋ง ์ง์คํ์ต๋๋ค. ๊ทธ๋ฌ๋ ์ค์ ์์ ์ ์ ํ์ฅ์์๋ ์ธ๋ฌผ์ ๋ชจ์ ๋ง ์ ํํ๊ฒ ํธ์งํ๋ ๋์ฆ๊ฐ ์๋นํฉ๋๋ค.
ํ์ฌ๊น์ง ๊ฐ์ฅ ๋ฐ์ด๋ ๋ชจ์ ํธ์ง ๋ชจ๋ธ์ธ MotionEditor๋ ๋ค์๊ณผ ๊ฐ์ ๋ฌธ์ ์ ์ ๊ฐ๊ณ ์์์ต๋๋ค:
- ๐ด 42.6GB์ ์์ฒญ๋ GPU ๋ฉ๋ชจ๋ฆฌ ์๊ตฌ๋ (RTX 4090๋ ๋ฒ๊ฑฐ์ํจ)
- ๐ด ์นด๋ฉ๋ผ๊ฐ ํฌ๊ฒ ์์ง์ด๋ ์์์์ ์ฌ๊ฐํ ํ์ง ์ ํ
- ๐ด ๋ณต์กํ ๋ฐฐ๊ฒฝ์ด ์๋ ์์์์ ์ผ๊ด์ฑ ์ ์ง ์คํจ
์ด๋ฌํ ๋ฌธ์ ๋ค๋ก ์ธํด ์ค๋ฌด์์ ํ์ฉํ๊ธฐ ์ด๋ ค์ ๋ AI ๋ชจ์ ํธ์ง ๊ธฐ์ , MotionFollower๋ ์ด ๋ชจ๋ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ์ต๋๋ค.
MotionFollower์ ํ์ ์ ์ ๊ทผ๋ฒ
1. ์ด๊ฒฝ๋ ์ปจํธ๋กค๋ฌ๋ก ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋ ๊ฒฉ๊ฐ
๊ธฐ์กด MotionEditor๋ ๋ฌด๊ฑฐ์ด ControlNet๊ณผ ์ดํ ์ ๋ฉ์ปค๋์ฆ(Attention Mechanism)์ ์์กดํ์ต๋๋ค. ๋ฐ๋ฉด MotionFollower๋ ๋ ๊ฐ์ ๊ฒฝ๋ํ๋ ์ปจํธ๋กค๋ฌ๋ฅผ ๋์ ํ์ต๋๋ค:
- ํฌ์ฆ ์ปจํธ๋กค๋ฌ(Pose Controller): ๋ชฉํ ์์์ ํฌ์ฆ ์ ๋ณด๋ง ์ถ์ถํ์ฌ ๋ชจ์ ํธ์ง ๋ด๋น
- ๋ ํผ๋ฐ์ค ์ปจํธ๋กค๋ฌ(Reference Controller): ์๋ณธ ์์์ ์ธํ๊ณผ ๋ฐฐ๊ฒฝ ์ ๋ณด ๋ณด์กด
์ด ๋ ์ปจํธ๋กค๋ฌ๋ CNN ๊ธฐ๋ฐ ์ปจ๋ณผ๋ฃจ์ ์ฐ์ฐ๋ง ์ฌ์ฉํ์ฌ ์ฐ์ฐ๋์ ๋ํญ ์ค์ด๋ฉด์๋ ํ์ง์ ๋๊ฒ ์ ์งํฉ๋๋ค. ํนํ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ๋ง์ด ์๋ชจํ๋ ์ดํ ์ ์ฐ์ฐ์ ์ ๊ฑฐํ ๊ฒ์ด ํต์ฌ์ ๋๋ค.
2. ์ค์ฝ์ด ๊ฐ์ด๋์ค๋ก ์ผ๊ด์ฑ ์ ์ง
MotionFollower๋ ์ค์ฝ์ด ํจ์(Score Function) ๊ธฐ๋ฐ์ ๊ฐ์ด๋์ค ์์คํ ์ ์ ์ฉํ์ต๋๋ค. ์ด๋:
- ๐ ์๋ณธ ์์์ ๋ฐฐ๊ฒฝ๊ณผ ์นด๋ฉ๋ผ ์์ง์ ์๋ฒฝ ๋ณด์กด
- ๐ ํ๊ฒ ๋ชจ์ ๋ง ์ ํํ๊ฒ ์ ์ฉ
- ๐ ํ๋ ์ ๊ฐ ์์ฐ์ค๋ฌ์ด ์ฐ๊ฒฐ์ฑ ์ ์ง
๊ธฐ์กด ๋ชจ๋ธ๋ค์ ์ดํ ์ ์ฃผ์ (Attention Injection) ๋ฐฉ์์ ์ข ์ข ๋ ธ์ด์ฆ์ ๊น๋นก์(Shadow Flickering) ๋ฌธ์ ๋ฅผ ์ ๋ฐํ์ง๋ง, ์ค์ฝ์ด ๊ฐ์ด๋์ค๋ ์ด๋ฌํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ์ต๋๋ค.
3. ์ด์ค ๋ธ๋์น ๊ตฌ์กฐ๋ก ์์ ์ฑ ํ๋ณด
MotionFollower๋ ๋ ๊ฐ์ ๋ณ๋ ฌ ํ๋ก์ธ์ค๋ฅผ ์ด์ํฉ๋๋ค:
- ๋ณต์ ๋ธ๋์น(Reconstruction Branch): ์๋ณธ ์์์ ์ค์ ์ ๋ณด ์ ์ง
- ํธ์ง ๋ธ๋์น(Editing Branch): ํ๊ฒ ๋ชจ์ ์ ์ฉ
- ์ค์ฝ์ด ์ ๊ทํ(Score Regularization): ๋ ๊ฒฐ๊ณผ๋ฅผ ์ต์ ์ผ๋ก ์ตํฉ
์ด ๊ตฌ์กฐ๋ ๊ณต๊ฐ์ (๋ฐฐ๊ฒฝ, ์ธ๋ฌผ ์ธํ) ๋ฐ ์๊ฐ์ (ํ๋ ์ ๊ฐ ์ฐ๊ฒฐ์ฑ) ์ผ๊ด์ฑ์ ๋ชจ๋ ์ ์งํ๋ฉด์ ๋ชจ์ ๋ง ์ ๊ตํ๊ฒ ๋ณ๊ฒฝํ ์ ์๊ฒ ํฉ๋๋ค.
๋๋ผ์ด ์ฑ๋ฅ ํฅ์: ์์น๋ก ์ฆ๋ช ๋ ์ฐ์์ฑ
MotionFollower๋ ๊ธฐ์กด ๋ชจ๋ธ๋ณด๋ค ์๋์ ์ผ๋ก ์ฐ์ํ ์ฑ๋ฅ์ ๋ณด์ฌ์ค๋๋ค:
๋ชจ๋ธ | PSNR โ | SSIM โ | LPIPS โ | FID โ | GPU ๋ฉ๋ชจ๋ฆฌ โ |
---|---|---|---|---|---|
MotionEditor | 17.34 | 0.68 | 0.34 | 31.98 | 42.6GB |
MotionFollower | 20.85 | 0.75 | 0.22 | 26.30 | 9.8GB |
์ด ๊ฒฐ๊ณผ๊ฐ ์๋ฏธํ๋ ๋ฐ:
- โ ํ์ง 20% ํฅ์: PSNR๊ณผ SSIM ์์น ๋ชจ๋ ํฌ๊ฒ ๊ฐ์
- โ ์์ฐ์ค๋ฌ์ 35% ํฅ์: LPIPS์ FID ์์น ๊ฐ์
- โ GPU ๋ฉ๋ชจ๋ฆฌ 80% ์ ๊ฐ: 9.8GB๋ก ์ผ๋ฐ ๊ฒ์ด๋ฐ GPU์์๋ ๊ตฌ๋ ๊ฐ๋ฅ
์ค์ ์ ์ฉ ์ฌ๋ก: ์ด๋ค ์ํฉ์์ ๊ฐ์ ์ ๋ณด์ด๋?
MotionFollower๋ ํนํ ๋ค์๊ณผ ๊ฐ์ ๊น๋ค๋ก์ด ์ํฉ์์ ํ์ํ ์ฑ๋ฅ์ ๋ฐํํฉ๋๋ค:
1. ๋ณต์กํ ๋ฐฐ๊ฒฝ์ด ์๋ ์์
๊ธฐ์กด ๋ชจ๋ธ์ ๋ณต์กํ ๋ฐฐ๊ฒฝ์ด ์๋ ์์์์ ๋ฐฐ๊ฒฝ ์ ๋ณด๋ฅผ ์ ์งํ์ง ๋ชปํ๊ณ ์๊ณก์ ์ผ์ผ์ผฐ์ต๋๋ค. MotionFollower๋ ๋ ํผ๋ฐ์ค ์ปจํธ๋กค๋ฌ๋ฅผ ํตํด ๋ฐฐ๊ฒฝ ์ ๋ณด๋ฅผ ์๋ฒฝํ๊ฒ ์ ์งํฉ๋๋ค.
2. ๊ธ๊ฒฉํ ์นด๋ฉ๋ผ ์์ง์์ด ์๋ ์์
์นด๋ฉ๋ผ๊ฐ ๋น ๋ฅด๊ฒ ์์ง์ด๋ ์์์์ MotionEditor๋ ์ฌ๊ฐํ ๋ธ๋ฌ(Blur)์ ์๊ณก ํ์์ ๋ณด์์ง๋ง, MotionFollower๋ ์ค์ฝ์ด ๊ฐ์ด๋์ค ๋๋ถ์ ์นด๋ฉ๋ผ ์์ง์์ ์์ฐ์ค๋ฝ๊ฒ ์ ์งํฉ๋๋ค.
3. ์ ๊ตํ ๋ชจ์ ์กฐ์ ์ด ํ์ํ ์์
๋์ค ์์์ด๋ ์คํฌ์ธ ์์๊ณผ ๊ฐ์ด ์ฌ์ธํ ๋ชจ์ ์กฐ์ ์ด ํ์ํ ๊ฒฝ์ฐ, MotionFollower๋ ์ธ๋ฌผ์ ์์ธ์ ์์ง์์ ์ ํํ๊ฒ ๋ณ๊ฒฝํ๋ฉด์๋ ์ธํ๊ณผ ๋ฐฐ๊ฒฝ์ ์๋ฒฝํ๊ฒ ๋ณด์กดํฉ๋๋ค.
๋ฏธ๋ ๋ฐ์ ๋ฐฉํฅ๊ณผ ํ์ฌ ํ๊ณ
MotionFollower๋ ํ์ ์ ์ธ ๊ธฐ์ ์ด์ง๋ง, ์๋ฒฝํ์ง๋ ์์ต๋๋ค:
ํ์ฌ ํ๊ณ
- ๐ ๋งค์ฐ ์์ ๋ฌผ์ฒด(์ํ ๋ฑ)์ ์ผ๊ด์ฑ ์ ์ง: ๊ฒฝ์ฐ์ ๋ฐ๋ผ ์์ ๋ฌผ์ฒด๊ฐ ํธ์ง ๊ณผ์ ์์ ์๊ณก๋ ์ ์์
- ๐ ์ด์ฅ์๊ฐ ์์(10๋ถ ์ด์): 600ํ๋ ์์ ๋์ด๊ฐ๋ ์์์์๋ ์๊ฐ์ด ์ง๋ ์๋ก ํ์ง ์ ํ ๊ฐ๋ฅ์ฑ
ํฅํ ๊ฐ์ ๋ฐฉํฅ
์ฐ๊ตฌํ์ ์ด๋ฌํ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ธฐ ์ํด ๋ค์๊ณผ ๊ฐ์ ๋ฐฉํฅ์ผ๋ก ์ฐ๊ตฌ๋ฅผ ์งํ ์ค์ ๋๋ค:
- ๐ฌ ๊ณ ํด์๋ ๊ฐ์ฒด ์ ์ง๋ฅผ ์ํ ์ธํ์ธํ (Inpainting) ๊ธฐ๋ฒ ๊ฐ๋ฐ
- ๐ฌ ์ฅ์๊ฐ ์์ ์ฒ๋ฆฌ๋ฅผ ์ํ ์๊ฐ ์ถ ์ ๊ทํ(Temporal Regularization) ๊ฐํ
- ๐ฌ ์ค์๊ฐ ํธ์ง์ ์ํ ์ถ๊ฐ ์ต์ ํ ์ฐ๊ตฌ
์ค์ ์ฌ์ฉํด๋ณด๊ธฐ
MotionFollower๋ฅผ ์ง์ ์ฌ์ฉํด๋ณด๊ณ ์ถ๋ค๋ฉด ๋ค์ ๋งํฌ๋ฅผ ์ฐธ์กฐํ์ธ์:
- ๐ GitHub ์ฝ๋: https://github.com/Francis-Rings/MotionFollower
- ๐ ํ๋ก์ ํธ ํ์ด์ง: https://francis-rings.github.io/MotionFollower/
- ๐ ์ฐ๊ตฌ ๋ ผ๋ฌธ: https://arxiv.org/abs/2405.20325
๊ฒฐ๋ก : ๋น๋์ค ํธ์ง์ ์๋ก์ด ์งํ
MotionFollower๋ ์ ์ ์ปดํจํ ์์์ผ๋ก ๋ ๋์ ํ์ง์ ๋ชจ์ ํธ์ง์ ๊ฐ๋ฅํ๊ฒ ํจ์ผ๋ก์จ AI ๋น๋์ค ํธ์ง ๋ถ์ผ์ ์๋ก์ด ์งํ์ ์ด์์ต๋๋ค. ์ด ๊ธฐ์ ์ ๋ค์๊ณผ ๊ฐ์ ๋ถ์ผ์์ ํฐ ๋ณํ๋ฅผ ๊ฐ์ ธ์ฌ ๊ฒ์ผ๋ก ์์๋ฉ๋๋ค:
- ๐ฌ ์ํ ๋ฐ ๋ฐฉ์ก ์ ์: ๋ฐฐ์ฐ์ ์์ง์์ ํ๋ณด์ ํ๊ฑฐ๋ ์คํดํธ ์ฅ๋ฉด ํธ์ง
- ๐บ ์ฝํ ์ธ ํฌ๋ฆฌ์์ดํฐ: ์ถค์ด๋ ์ด๋ ์์์์ ๋ ๋์ ํผํฌ๋จผ์ค ๊ตฌํ
- ๐ฎ ๊ฒ์ ๊ฐ๋ฐ: ์บ๋ฆญํฐ ์ ๋๋ฉ์ด์ ์ ์ ๋ฐ ํธ์ง ํจ์จํ
- ๐ฑ ๋ชจ๋ฐ์ผ ์ฑ: ์ผ๋ฐ ์ฌ์ฉ์๋ ์ ๊ทผ ๊ฐ๋ฅํ ๊ณ ํ์ง ๋ชจ์ ํธ์ง ์๋ฃจ์
์ด ํ์ ์ ์ธ ๊ธฐ์ ์ด ์์ผ๋ก ์ด๋ป๊ฒ ๋ฐ์ ํ๊ณ ํ์ฉ๋ ์ง ๊ธฐ๋๊ฐ ๋ฉ๋๋ค.
์ฌ๋ฌ๋ถ์ MotionFollower๋ฅผ ์ด๋ค ์ฉ๋๋ก ํ์ฉํ๊ณ ์ถ์ผ์ ๊ฐ์?
๋๊ธ๋ก ์ฌ๋ฌ๋ถ์ ์๊ฐ์ ๊ณต์ ํด์ฃผ์ธ์! ๐