구글의 새 AI 비디오 모델이 공식 발표도 되기 전에 AI 커뮤니티 전체를 달궜어요. Gemini Omni — 구글이 이름조차 공식 확인하지 않은 이 모델이 유출 데모만으로 X와 Reddit을 뒤집어놨어요. 채팅 한 줄로 영상 속 객체를 바꾸고, 수학 공식이 빼곡한 칠판 장면을 만들어내는 데모 영상이 수만 회 공유됐고, Google I/O 2026(5월 19~20일) 기조연설에서 정식 공개가 예상되고 있어요. 미리 알아두면 경쟁사보다 한발 앞설 수 있는 Gemini Omni, 지금 정리해드릴게요.
Gemini Omni란? 공식 발표 전 유출된 구글의 차세대 AI 비디오 모델
Gemini Omni는 구글이 개발 중인 AI 비디오 생성·편집 모델이에요. 2026년 5월 현재 구글이 공식적으로 발표하지 않은 모델이에요. 유출 경로는 Gemini 앱 내부 UI 문자열이었어요. Gemini 앱의 비디오 생성 탭에 "Start with an idea or try a template. Powered by Omni"라는 문자열이 일시적으로 노출됐고, 테스팅 커뮤니티 TestingCatalog가 이를 포착하면서 알려지기 시작했어요.
내부 모델 ID는 bard_eac_video_generation_omni로 확인됐어요. 현재 Gemini 비디오 생성을 담당하는 Veo 3.1과는 별개의 모델임을 시사해요. 구글이 Veo를 리브랜딩한 게 아니라, Gemini 생태계 내에 새로운 비디오 스택을 추가하는 것으로 분석되고 있어요.
유출은 어떻게 시작됐나: 3단계로 퍼진 신호들
Gemini Omni의 유출은 한꺼번에 일어난 게 아니라, 3단계에 걸쳐 점진적으로 알려졌어요.
1단계: UI 문자열 발견 (2026년 5월 초)
TestingCatalog 사용자가 Gemini 앱의 비디오 생성 탭에서 "Powered by Omni"라는 문자열을 처음 발견했어요. 이 문자열은 현재 Veo 기반 비디오 도구 코드명 "Toucan" 옆에 배치돼 있었어요. 구글이 새 모델을 스테이징 환경에서 A/B 테스트하는 표준 패턴이라는 분석이 나왔어요.
2단계: 모바일 앱 내부 정보 유출 (2026년 5월 중순)
Reddit 사용자가 Gemini 모바일 앱에서 추가 문구를 발견했어요. "Meet our new video model. Remix your videos, edit directly in chat, try a template, and more." 다른 유저들이 직접 테스트에 나섰고, 내부 모델 ID인 bard_eac_video_generation_omni와 10초 생성 제한이 확인됐어요.
3단계: 데모 영상 확산 (2026년 5월 13일 이후)
실제 생성된 영상 2개가 커뮤니티에 공유되며 AI 미디어 전반으로 퍼졌어요. 교수가 칠판에 수학 공식을 적는 장면과 레스토랑에서 스파게티를 먹는 장면이었어요. 특히 칠판 영상에서 수학 공식이 정확하게 렌더링된 점이 화제가 됐어요. 그때부터 Gemini Omni는 전문 AI 미디어와 일반 테크 커뮤니티 모두에서 활발하게 논의되기 시작했어요.
Gemini Omni 핵심 기능 6가지: 채팅 편집부터 비디오 리믹스까지
유출된 정보와 초기 테스터 리포트를 종합하면, Gemini Omni는 6가지 핵심 기능을 갖추고 있어요.
① 채팅 기반 비디오 편집
Gemini Omni의 가장 큰 차별점이에요. 타임라인을 드래그하거나 전문 편집 소프트웨어를 열 필요 없이, 채팅창에 "워터마크 지워줘"나 "배경을 해질녘으로 바꿔줘"처럼 입력하면 AI가 직접 편집을 수행해요. 여러 번 대화를 주고받으며 수정할 수 있는 다중 턴 편집을 지원해요. LLM 스택을 활용해 영상 편집의 맥락을 기억하고 반복적으로 개선하는 구조예요.
② 객체·장면 수준 편집
영상 전체를 다시 생성하지 않고, 특정 객체나 장면 요소만 교체할 수 있어요. "빨간 차를 파란 차로 바꿔줘", "테이블 위 음료를 커피로 바꿔줘" 같은 자연어 지시가 가능해요. 이는 현재 Seedance 2.0이나 Wan 2.7에서는 지원되지 않는 기능이에요. 재생성 없이 수정할 수 있어서 크레딧 소비도 최소화할 수 있어요.
③ 비디오 리믹싱
기존 영상 클립을 입력으로 받아 스타일이나 분위기를 유지하면서 새로운 방향으로 변형하는 기능이에요. 여러 영상 소스를 블렌딩해서 새로운 콘텐츠를 만들 수도 있어요. 브랜드 아이덴티티를 유지하면서 다양한 버전을 빠르게 만들어야 하는 마케터에게 특히 유용한 기능이에요.
④ 텍스트·수식 렌더링
AI 비디오 생성의 오랜 숙제였던 '텍스트 정확도'에서 눈에 띄는 성능을 보여줬어요. 칠판에 적히는 수학 공식이 정확하게 렌더링됐고, 손글씨 스타일의 텍스트도 자연스럽게 처리됐어요. 교육 콘텐츠, 제품 설명 영상, 인포그래픽 형식의 클립 제작에 특히 유용할 것으로 보여요.
⑤ 멀티모달 네이티브 입력
텍스트, 이미지, 영상을 혼합 입력으로 받을 수 있어요. 참고 이미지를 넣으면서 "이 분위기로 10초짜리 영상 만들어줘"처럼 지시할 수 있어요. Gemini의 멀티모달 강점을 비디오 생성에 그대로 가져온 구조예요. AI 프롬프트를 어떻게 쓰느냐에 따라 결과물의 방향이 크게 달라질 거예요.
⑥ 템플릿 기반 빠른 시작
유출된 UI 문구에는 "try a template"이라는 표현이 포함됐어요. 처음 시작하는 사용자를 위한 템플릿 라이브러리가 준비돼 있을 것으로 예상돼요. 마케팅팀이 빠르게 표준화된 영상 형식을 찍어낼 때 유용한 기능이에요. 채용, 제품 소개, 이벤트 안내 등 반복적으로 만드는 영상 형식에 활용할 수 있어요.
실제 유출 데모 분석: 잘하는 것 vs 아직 부족한 것
공개된 두 가지 데모 영상을 구체적으로 분석해봤어요.
데모 1: 교수의 칠판 수학 증명
교수가 칠판에 수학 공식을 작성하는 장면이에요. 이 데모에서 커뮤니티가 주목한 포인트는 다음과 같아요.
수학 공식이 시각적으로 올바르게 렌더링됨 ("놀랍도록 잘"이라는 평가)
손과 팔의 움직임이 자연스러움
분필이 칠판에 닿는 접촉 물리 처리가 우수함
전반적인 화질에는 여전히 AI 흔적이 있음
데모 2: 레스토랑 스파게티 장면
식당에서 스파게티를 먹는 장면이에요.
"꽤 현실적"이라는 평가를 받음
파스타 도구의 접촉과 유체 움직임 처리가 자연스러움
전체 화질 수준은 Seedance 2.0과 Wan 2.7에는 못 미친다는 분석이 지배적
핵심 결론: 강점은 '첫 클립'이 아니라 '편집 워크플로우'
업계 분석가들은 Gemini Omni의 진정한 강점이 원시 영상 품질이 아니라 채팅 기반 편집 루프에 있다는 데 동의해요. 영상을 한 번 만들고 끝나는 게 아니라, 생성하고 수정하고 다시 편집하는 반복 워크플로우가 가능한 게 진짜 가치예요. 창작 현장에서의 실제 제작 방식과 가장 가까운 AI 비디오 모델이라는 평가가 나오는 이유예요.
Gemini Omni vs Veo 3.1 vs Sora 2: 무엇이 다를까
항목 | Gemini Omni | Veo 3.1 | Sora 2 |
|---|---|---|---|
현재 상태 | 유출 (미발표) | 공식 출시 | 공식 출시 |
채팅 기반 편집 | ✅ 핵심 기능 | ❌ 미지원 | ❌ 미지원 |
객체 교체 | ✅ 지원 | ⚠️ 제한적 | ❌ 미지원 |
텍스트 렌더링 | ✅ 우수 | ⚠️ 보통 | ⚠️ 보통 |
원시 영상 품질 | ⚠️ 평균 이상 | ✅ 우수 | ✅ 우수 |
네이티브 오디오 | ⚠️ 예상 | ✅ 지원 | ❌ 미지원 |
클립 길이 | 10초 (확인) | 8~16초 | 최대 20초 |
비디오 리믹싱 | ✅ 지원 | ❌ 미지원 | ❌ 미지원 |
API 문서화 | ❌ 미공개 | ✅ 완료 | ✅ 완료 |
정리하면, 원시 영상 품질만 보면 Veo 3.1과 Sora 2가 아직 앞서요. 하지만 편집 워크플로우, 채팅 기반 수정, 텍스트 렌더링에서 Gemini Omni가 확실한 차별화를 노리고 있어요. 완전히 다른 포지션을 선택한 모델이에요. AI 생성 도구를 비교할 때처럼, 어떤 기능이 자신의 워크플로우에 맞는지를 먼저 파악하는 게 중요해요.
비용은 얼마? 10초 클립당 요금 구조 추정
아직 공식 요금 정책은 없어요. 하지만 초기 테스터 리포트를 바탕으로 추정할 수 있는 내용이 있어요.
항목 | 내용 |
|---|---|
클립당 Pro 할당량 소비 | 약 43% (10초 클립 1개) |
일 2개 생성 시 | 일일 할당량 약 86% 소모 |
예상 종량제 단가 | 클립당 $0.30~$0.50 추정 |
Veo 3.1 대비 | 비슷한 수준 (경쟁력 있음) |
Seedance 2.0 Fast 대비 | 더 비쌈 |
Flash 티어 전망 | 출시 후 저가 티어 추가 기대 |
구글이 AI Studio를 통한 종량제 방식도 함께 출시할 가능성이 높아요. 특히 개발자나 기업 사용자를 위한 Flash 티어가 추가되면, 대규모 영상 제작 비용이 크게 낮아질 수 있어요. 초기에는 Gemini AI Pro 구독 내에서 제한된 할당량으로 시작하고, 이후 종량제로 확장되는 구조가 될 것으로 예상돼요.
크리에이터·마케터가 지금 해야 할 것
Gemini Omni가 공식 출시되기 전, 지금 미리 준비할 수 있는 것들이 있어요.
1. 평가 기준을 업데이트하세요
지금까지 AI 비디오 모델을 평가할 때 "첫 번째 클립 품질"이 기준이었어요. Gemini Omni가 가져오는 변화는 편집 속도와 반복 수정 능력을 함께 봐야 한다는 거예요. 앞으로 AI 비디오 도구를 선택할 때, 생성 품질뿐 아니라 채팅 기반 수정이 가능한지도 평가 항목에 넣으세요.
2. 반복형 워크플로우를 설계하세요
Gemini Omni는 "한 번에 완벽한 영상"이 아니라 "대화로 점진적으로 완성되는 영상"을 지향해요. 앞으로의 AI 비디오 제작 프로세스는 '생성 → 검토 → 채팅 수정 → 재검토'의 반복이 될 거예요. 이미 이런 방식에 익숙해지는 게 좋아요.
3. 텍스트 포함 영상 기회를 노리세요
AI 비디오에서 텍스트가 정확하게 렌더링되지 않는 문제는 오랫동안 발목을 잡아왔어요. Gemini Omni가 이 문제를 크게 개선했다면, 교육 영상, 제품 설명 영상, 데이터 시각화 영상에서 AI 비디오를 활용할 수 있는 범위가 훨씬 넓어져요. 이런 콘텐츠를 만드는 팀이라면 Gemini Omni 공식 출시를 더 적극적으로 주목해야 해요.
4. 지금은 검증된 모델로 역량을 쌓으세요
Gemini Omni가 출시되기 전까지, 이미 검증된 AI 비디오 모델로 제작 역량을 쌓는 것이 현명해요. Veo 3.1, Seedance 2.0 같은 현재 출시된 모델들로 프롬프트 작성법과 편집 워크플로우를 익혀두면, Gemini Omni 출시 이후에도 훨씬 빠르게 활용할 수 있어요. 어떤 AI 비디오 모델이든 좋은 프롬프트가 좋은 결과를 만들어요.
지금 AI 비디오를 바로 만들어보고 싶다면
Gemini Omni 공식 출시를 기다리는 동안에도 AI 비디오 제작은 지금 당장 시작할 수 있어요. Veo 3.1, Seedance 2.0, Wan 2.7 등 현재 검증된 모델들이 이미 캐럿에서 대화 한 줄로 사용 가능해요.
이미지 한 장에서 제품 광고 영상을 만들거나, 브랜드 레퍼런스를 참고해 일관된 캐릭터 영상을 만드는 작업 모두 지금 바로 가능해요. LGU+가 AI로 광고 소재 비용을 95% 절감하고, 아가방앤컴퍼니가 모델과 스튜디오 없이 제품 영상을 확보한 것처럼, 기업들이 이미 AI 비디오를 실전에 활용하고 있어요.
아래 버튼을 클릭해 AI 비디오 활용의 기초부터 기업 사례까지 담은 무료 가이드북을 받아보세요.
자주 묻는 질문
Gemini Omni는 언제 출시되나요?
구글이 공식 발표한 출시일은 없어요. Google I/O 2026(2026년 5월 19~20일) 기조연설에서 공개될 것으로 업계는 예상하고 있어요. 공식 발표 후에도 단계적 롤아웃이 진행될 수 있어요.
Gemini Omni는 Veo를 대체하나요?
아니에요. 유출된 정보에 따르면 Gemini Omni는 Veo 3.1을 대체하는 게 아니라 Gemini 생태계 내에 나란히 위치하는 별도 모델로 보여요. Veo는 고품질 단일 영상 생성에, Omni는 채팅 기반 편집과 반복 워크플로우에 강점이 있을 것으로 분석돼요.
Gemini Omni는 무료로 사용할 수 있나요?
아직 공식 요금 정책은 없어요. 초기 테스터 리포트에 따르면 Gemini AI Pro 구독 내 할당량에서 상당한 크레딧을 소비해요. 출시 후에는 Pro 구독 포함 후 종량제 방식으로도 운영될 것으로 예상돼요.
Gemini Omni의 최대 영상 길이는 얼마인가요?
초기 테스터가 경험한 제한은 10초예요. Veo 3.1의 8~16초와 비슷한 수준이에요. 정식 출시 시 확장 여부는 아직 확인되지 않았어요.
Gemini Omni와 Seedance 2.0 중 어떤 게 더 좋은가요?
용도에 따라 달라요. 원시 영상 품질과 포토리얼리즘이 중요하다면 Seedance 2.0이 우위예요. 반면 채팅으로 영상을 수정하거나 텍스트가 포함된 영상이 필요하다면 Gemini Omni가 더 적합할 것으로 보여요. 두 모델이 서로 다른 워크플로우를 위한 도구로 나란히 사용될 가능성이 높아요.