오픈AI의 텍스트-비디오 생성 서비스 소라(Sora)의 기술적인 측면을 살펴보자. 소라 공식 웹페이지에 있는 기술 관련 섹션에 나와 있는 내용을 중심으로 소개한다.
소라는 정적 노이즈처럼 보이는 동영상으로 시작하여 여러 단계에 걸쳐 노이즈를 제거하여 점차적으로 변환하는 확산 모델(diffusion model)로 동영상을 생성한다.
소라는 전체 동영상을 한 번에 생성하거나 생성된 동영상을 확장하여 더 길게 만들 수 있다. 모델에 한 번에 여러 프레임을 예측할 수 있는 기능을 제공함으로써 대상이 잠깐 사라져도 동일하게 유지되도록 하는 까다로운 문제를 해결했다.
"트렌드와칭 텔레그램 참여하기 (최신 소식, 자료 공유)"press@trendw.kr