안녕하세요, 캐럿팀입니다. 오늘은 미드저니가 드디어 V8을 꺼내 들었고, 오픈AI는 AI 모델 가격을 또 확 낮췄어요. 알찬 5꼭지 준비했으니 끝까지 함께해 주세요.
🔥 미드저니 V8 알파, 5배 빠르고 2K 네이티브까지
ⓒ 미드저니
미드저니가 어제 V8 알파를 공개했어요. 가장 체감이 큰 변화는 속도예요. V7 대비 약 5배 빠르게 이미지가 생성되니까, 프롬프트 넣고 기다리는 시간이 확 줄었어요.
해상도도 올라갔어요. --hd 모드를 붙이면 2K(2048x2048) 네이티브로 렌더링돼요. V7이 1024x1024였으니까 가로세로 2배씩 커진 셈이고요. 텍스트 렌더링도 눈에 띄게 좋아져서, 따옴표 안에 텍스트를 넣으면 읽을 수 있는 수준으로 나와요.
V7에서 쓰던 개인화 프로필, 무드보드, 스타일 레퍼런스(sref)도 그대로 호환돼요. --chaos, --weird 같은 파라미터도 지원하고요. 아직 릴랙스 모드는 안 되지만, 알파 테스트 기간 중에 추가될 수 있다고 해요. 캐럿에서도 미드저니 V8를 곧 써보실 수 있어요.
V8 알파가 나오자마자 X에서 비교전이 시작됐어요. 분위기를 정리하면, 미드저니는 색감과 분위기 연출에서 여전히 최강이고, 리얼리즘과 텍스트 렌더링은 나노바나나 쪽이 앞서고 있다는 평가가 많아요.
정확한 비교는 V8이 안정화된 뒤에 나올 가능성이 높아요. 해상도만 놓고 보면 나노바나나가 4K(4096x4096)까지 지원하는 반면, V8은 2K가 최대이고요.
캐럿에서는 미드저니와 나노바나나 2 여러 이미지 모델을 한 곳에서 쓸 수 있어서, 같은 프롬프트로 직접 비교해보기 좋아요.
2️⃣ GPT-5.4 미니 & 나노, 사진 7만 6천 장 분석에 52달러
ⓒ 오픈AI
오픈AI가 어제 GPT-5.4 미니와 나노를 동시에 공개했어요. 미니는 GPT-5 미니보다 2배 이상 빠르면서 코딩과 추론 성능이 올라갔고, 나노는 가장 가볍고 저렴한 모델이에요.
얼마나 저렴하냐면, 개발자 Simon Willison이 계산한 결과 GPT-5.4 나노로 사진 7만 6천 장을 전부 분석해도 52달러(약 7만 원)면 된다고 해요. 입력 토큰 100만 개당 0.2달러, 출력 토큰 100만 개당 1.25달러 수준이거든요. ChatGPT 무료 사용자도 미니 모델을 쓸 수 있게 됐어요.
비용이 이 정도로 내려오면 이미지 분석 같은 작업을 개인도 부담 없이 돌릴 수 있어요. 콘텐츠 대량 생산하는 분이라면 주목할 만한 흐름이에요. 캐럿팀도 더 저렴하게 AI를 이용할 수 있도록 계속해서 노력하고 있어요.
3️⃣ 프롬프트 하나로 SVG 벡터 아이콘이 뚝딱
캐럿에서 나노바나나 2로 생성
AI로 프롬프트 하나만 넣으면 SVG 벡터 코드가 바로 나오는 시대가 됐어요. 구글 AI 스튜디오에서 관련 데모가 좋아요 1,800개를 넘기면서 화제가 됐거든요. 제미나이 모델이 XML 기반의 SVG 코드를 직접 출력하는 방식이라, 일러스트레이터 없이도 깔끔한 벡터 아이콘을 만들 수 있거든요.
디자이너나 개발자라면 앱 아이콘, UI 요소 같은 걸 빠르게 프로토타이핑하는 데 바로 써볼 수 있어요. viewBox 크기나 색상을 프롬프트에 명시하면 더 정확한 결과가 나온다고 해요.
캐럿에서도 SVG 코드 생성이 가능해요. 채팅으로 '별 모양 SVG 만들어줘'라고 하면 바로 코드가 나오거든요. 일러스트레이터 없이도 벡터 아이콘을 만들 수 있는 시대가 된 거예요.
🧪 오늘의 프롬프트 팁
JSON 프롬프트 하나로 클링 퀄리티가 달라진다는데
ⓒ @CharaspowerAI (X)
X에서 활동하는 AI 영상 크리에이터 @CharaspowerAI가 공유한 JSON 구조 프롬프트가 화제예요. 일반 텍스트 프롬프트와 JSON 구조 프롬프트의 결과가 확연히 다르거든요.
핵심은 shot, subject, environment, style을 JSON 키로 나눠서 각각 구체적으로 지정하는 거예요. 카메라 움직임, 렌즈 타입, 조명까지 세분화하면 클링이 훨씬 정교한 영상을 만들어줘요.
아래 프롬프트를 캐럿에서 클링 3.0에 그대로 복사해서 써보세요.
{
"shot": {
"composition": "wide cinematic shot with camera flying through jungle toward temple",
"lens": "epic adventure wide lens",
"camera_movement": "fast forward flight, branch dodge, sudden tilt up to reveal temple"
},
"subject": {
"description": "한국인 탐험가가 정글 속 고대 사원을 향해 달리고 있다",
"action": "running through dense vegetation, pushing branches aside"
},
"environment": {
"setting": "dense tropical jungle with ancient stone temple",
"lighting": "golden hour rays breaking through canopy",
"atmosphere": "misty, humid, adventurous"
},
"style": "cinematic blockbuster, adventure film aesthetic"
}
위 프롬프트를 캐럿에서 클링 3.0으로 직접 만든 영상이에요 ↓
캐럿에서 클링 3.0으로 생성
JSON 구조로 프롬프트를 쓰면 카메라/피사체/환경/스타일이 분리돼서 클링이 각각을 더 정확하게 반영해요. 일반 텍스트보다 결과 일관성이 확 올라가거든요.
오늘 준비한 AI 소식은 여기까지예요. 프롬프트 팁은 한번 따라해 보세요, 생각보다 결과가 재밌을 거예요 😊