Skip to main content
인물 이미지(또는 캐릭터)에 오디오를 결합하여, 인물의 입 모양이 해당 음성에 맞춰 자연스럽게 움직이는 ‘말하는 영상’을 만드는 기능입니다.

사용 방법 1: 이미지 + 텍스트

캐럿 AI가 텍스트를 음성으로 자동 변환하고, 립싱크까지 한 번에 완료합니다.
1

이미지 업로드

인물/캐릭터 이미지를 업로드(또는 생성)하세요.
2

텍스트 요청

채팅창에 텍스트로 요청하세요.
    이 이미지에 '안녕하세요'라고 말하게 해줘
    이 사진이 이 스크립트를 읽게 해줘: (스크립트 내용)
캐럿 AI가 자동으로 음성을 생성(TTS)하고, 이미지에 립싱크를 적용한 영상을 만듭니다.

사용 방법 2: 이미지 + 오디오 파일

이미 녹음된 음성 파일(MP3, WAV 등)이 있는 경우 사용합니다.
1

이미지 업로드

인물/캐릭터 이미지를 업로드(또는 생성)하세요.
2

음성 파일 업로드

사용할 음성 파일을 업로드합니다.
3

립싱크 요청

채팅창에 요청하세요.
    이 이미지에 방금 올린 오디오로 립싱크해줘
비용 절약 팁립싱크 기능은 사용량(크레딧) 소모가 많은 기능입니다. 비용을 아끼고 싶다면, 먼저 “말하는 입 모양의 영상(소리 없음)“을 생성한 뒤, 영상에 오디오 추가 기능을 통해 별도로 나레이션 음성을 추가하는 방법을 활용할 수 있습니다.